Китайские исследователи разработали новую структуру, которая поможет разработчикам обучать модели машинного обучения, которые, как они надеются, могут привести к созданию «настоящих ученых-ИИ», способных совершенствовать эксперименты и решать научные проблемы.
Согласно статье, опубликованной в рецензируемом журнале Cell Press Nexus в пятницу, модели глубокого обучения «совершили революцию в области научных исследований» благодаря своей способности выявлять взаимосвязи из больших объемов данных.
Одним из недавних примеров является Sora, модель преобразования текста в видео от американской компании OpenAI, которая, по словам разработчиков, может понимать, как «вещи существуют в реальном мире».
Его широко хвалили за продвинутое, реалистичное изображение вещей и приветствовали как огромный шаг вперед в области генеративного искусственного интеллекта, но компания признала, что ей все еще трудно моделировать некоторые аспекты реального мира и она не может «точно моделировать физику многих базовых процессов».
Но он не обучен понимать физические законы, такие как гравитация.
«Без фундаментального понимания мира модель, по сути, является анимацией, а не симуляцией», — сказал Чэнь Юньтянь, автор исследования и профессор Восточного технологического института (EIT).
Разрыв Китая в области искусственного интеллекта с США увеличивается: «мы все очень обеспокоены»
Согласно статье, модели глубокого обучения обычно обучаются с использованием данных, а не предварительных знаний, которые могут включать в себя такие вещи, как законы физики или математическую логику.
Но ученые из Пекинского университета и EIT написали, что при обучении моделей предварительные знания могут использоваться вместе с данными, чтобы сделать их более точными, создавая модели «информированного машинного обучения», способные включать эти знания в свои выходные данные.
Команда написала, что решить, какие предварительные знания, которые могут включать в себя такие вещи, как функциональные связи, уравнения и логика, включить в модель для «предварительного обучения», было непросто, а включение нескольких правил также могло привести к разрушению модели.
«Когда современные модели машинного обучения сталкиваются с большим объемом знаний и правил, а это часто бывает, они, как правило, не работают или даже терпят неудачу», — сказал Чен.
Чтобы решить эту проблему, исследователи создали систему для оценки ценности правил и определения того, какие комбинации приводят к наиболее прогнозирующим моделям.
«Внедрение человеческих знаний в модели ИИ потенциально может повысить их эффективность и способность делать выводы, но вопрос в том, как сбалансировать влияние данных и знаний», — сказал Сюй Хао, первый автор и исследователь Пекинского университета, в журнале Cell. Заявление для прессы.
«Нашу структуру можно использовать для оценки различных знаний и правил, чтобы повысить прогностические возможности моделей глубокого обучения».
Согласно документу, платформа вычисляет «важность правила», глядя на то, как конкретное правило, комбинация или правила влияют на точность прогнозирования модели.
Обучение моделей ИИ таким правилам – например, законам физики – могло бы сделать их «более отражающими реальный мир, что сделало бы их более полезными в науке и технике», — сказал в своем заявлении Чен из EIT.
Исследователи протестировали свою систему, используя ее для оптимизации модели для решения многомерных уравнений, а еще одну модель использовали для прогнозирования результатов химического эксперимента.
Чен сказал, что в краткосрочной перспективе эта структура будет наиболее полезной в научных моделях, «где согласованность между моделью и физическими правилами имеет решающее значение для предотвращения потенциально катастрофических последствий».
От искусственного интеллекта до электромобилей: как развивается соперничество Китая и США в ключевых областях высоких технологий?
Команда надеется развивать свою структуру дальше, чтобы позволить ИИ определять свои собственные знания и правила непосредственно на основе данных без вмешательства человека.
«Мы хотим сделать это замкнутым циклом, превратив модель в настоящего ученого в области искусственного интеллекта», — сказал Чен в своем заявлении.
Команда разрабатывает плагин с открытым исходным кодом для разработчиков ИИ, который может позволить им добиться этого.
Однако команда уже выявила как минимум одну проблему.
В ходе исследования команда обнаружила, что когда в модель добавляется больше данных, общие правила становятся более значимыми, чем конкретные местные правила, но это не помогает в таких областях, как биология и химия, потому что там «часто отсутствуют легкодоступные общие правила, подобные определяющие уравнения».
bbabo.Net