Екипът от учени в коментар към статията на DeepMind посочи, че аргументите, дадени в полза на постигането на целта, поставена от DeepMind, не са толкова надеждни, колкото изглеждат, и изискват допълнителни изследвания. Това съобщиха от пресслужбата на Skoltech. Екипът включва специалисти от Skoltech, Института по органична химия. Н.Д. Зелински, Висше училище по икономика и Национален университет Кюнгпук (Южна Корея). В статия, публикувана в Science през декември 2021 г., екипът на DeepMind се опита да създаде метод на функционалната теория на плътността (DFT), който работи правилно за голямо разнообразие от молекулярни системи, включително такива с нецяло число електрони.
„Съвременната химия и науката за материалите постепенно преминават от експериментални проби и грешки към изследване на „дигитални близнаци“. Вместо да се провеждат десетки или дори стотици експерименти с надеждата да се намери нов ефективен катализатор или материал, се създава цифров близнак (математически модел) за този клас катализатори/материали, който се изучава задълбочено „в компютър“ и се базира на върху намерените теоретични модели, няколко целеви експеримента. Този подход позволява спестяване на килограми скъпи химически реактиви и тонове токсични органични разтворители“, каза ръководителят на групата по теоретична химия на Института по органична химия. Н.Д. Зелински RAS, доцент от Химическия факултет на Националния изследователски университет Висше училище по икономика Михаил Медведев.
DFT е най-широко използваният подход за изграждане на цифрови близнаци в химията и науката за материалите, което прави възможно сравнително правилно да се опише взаимодействието на голям брой електрони един с друг. Това е необходимо за изграждане на цифрови близнаци на сложни химически системи. Основата на DFT е обменно-корелационният функционал, чиято точна форма все още не е установена, поради което сега се използват различни приблизителни изрази, от които вече има повече от 400.
„Всяка година броят на приблизителните изрази за обменно-корелационния функционал нараства, предлагат се все по-точни изрази. DeepMind, известни с разработването на програмата за невронни мрежи AlphaGo, която победи един от най-силните играчи в света в играта Go, решиха да приложат постиженията си в невронните мрежи, за да създадат функционалността на невронната мрежа на Теорията за функционалната плътност. Тяхната работа далеч не беше първата, но определено е една от най-амбициозните“, казва Петр Жиляев, старши научен сътрудник в Центъра за технология на материалите на Сколтех.
DeepMind създадоха нова DFT функционалност - DM21. Трябва да работи правилно със системи, съдържащи нецяло число електрони. Правилната работа на функционала върху тях трябва да му помогне при описанието на конвенционалните химически системи. За да научи тяхната функционалност да работи правилно на такива системи, екипът на DeepMind ги добави към обучителната база данни DM21. За да тестват асимилацията на информацията, авторите тестваха функционалността на тестовия набор BBB, състоящ се от двойки атоми на различни разстояния един от друг, като два водородни атома с един електрон за двама. DM21 показа отлична точност на набора BBB, превъзхождайки стандартните функции, както и функционалността DM21m, обучена от DeepMind на същия набор от данни, с изключение на системи с нецелочислен брой електрони.
Авторите се опитаха да заобиколят едно от ключовите ограничения на традиционните функционали - невъзможността да се опишат правилно системи с нецяло число електрони. DeepMind добави нова нелокална съставка към функционалността, която никога не е била използвана досега - пространствено отделена локална обменна енергия. В бъдеще това може да помогне за изграждането на функционали с по-добро разделение между енергиите на обмен и корелация. Екипът на проекта също така въведе допълнителна регуляризация, свързана със самосъгласуваната полева процедура. Техният допълнителен член във функцията на грешката на модела е приблизително равен на израза за промяната на енергията след стъпката на процедурата за вариационна минимизация, като се започне от орбиталите на традиционния функционал. Това регулиране прави обучението по-стабилно.
„При машинното обучение е много важно да не се използват данните, на които е обучено, за да се тества невронната мрежа. Въпреки това, в работата си екипът на DeepMind направи подобна грешка: най-сложните димери от набора BBB са много близки до системи с нецяло число електрони от набора за обучение“, казва Александър Рябов, инженер-изследовател в Skoltech Център за технология на материалите.„Ако невронните мрежи не могат да разберат как да излязат с правилните отговори, те се опитват да ги запомнят. Така че не е толкова трудно да се „обучи“ невронна мрежа, колкото е да се покаже, че тя действително разбира физическите закони, лежащи в основата на въпроса, на който отговаря. Така че тестването на невронна мрежа върху данните, върху които е обучена, е като да дадете на студент на изпит същата задача, която е била решена преди 5 минути на дъската: ще разберем дали има добра памет, но е малко вероятно да знаем ако разбира, той е обект“, казва Михаил Медведев.
Този недостатък не е бил очевиден, казват учените. Системите в комплекта BBB се състоят от два атома, докато DM21 е обучен на едноатомни системи с нецяло число електрони. Затова беше много трудно да се предвиди какво се е случило. Учените осъзнаха, че на разстоянията между атомите в набора от тестове BBB, където обичайните функционали започват да изпитват проблеми, атомите практически не взаимодействат помежду си и всеки атом поотделно се превръща всъщност в самия „атом с не- цяло число електрони” на които образованието.
Въпреки отбелязания недостатък, DeepMind изгради доста точен функционал, базиран на невронни мрежи, който работи добре при различни химически проблеми, докато работата му за системи с нецяло число електрони изисква допълнителна проверка. В допълнение, екипът на проекта е свършил сериозна работа за разработване на универсален подход за създаване на DFT функционали, базирани на невронни мрежи: тяхната идея за включване на физически ограничения в невронна мрежа с помощта на тренировъчен набор, според учените, ще бъде широко използвана в изграждане на функционални невронни мрежи от следващите поколения.
Изследването също така прие Московския институт по физика и технологии и Московския държавен университет на името на M.V. Ломоносов.
bbabo.Net