AlphaGo больше не сыграет с человеком. Она проиграла AlphaZero

Технологии искусственного интеллекта сделали еще один шаг вперед. Это что-то невероятное

После турнира в игру го между человеком и искусственным интеллектом, в которой победил компьютер, компания DeepMind объявила, что больше не будет устраивать подобные соревнования. Логика разработчиков была такой: смысл игры не в том, чтобы победить человека, а в том, чтобы убедиться, что искусственный интеллект может принимать «человеческие» решения. И эта задача была выполнена, но работы над искусственным интеллектом продолжились.

Вскоре после победы машины в DeepMind был создан новый алгоритм обучения искусственного интеллекта. Он называется AlphaZero. TheVerge пишет, что программу разрабатывали не для игры —  целью были алгоритмы общего назначения, которые, например, могут решать проблемы научного характера: разработка новых препаратов, моделирование последствий изменений климата и т.д.

Эффективность новой версии программы поражает: если AlphaGo еще нуждался в помощи человека, чтобы получить необходимый опыт, то AlphaZero все делает самостоятельно. В ту же игру го она училась играть, проводя партии с самой собой. Все началось со случайных ходов, но каждый раз, добиваясь успеха на доске, алгоритм фиксировал удачную комбинацию. После трех дней таких игр AlphaZero была готова, чтобы сразиться с той самой программой, которая оказалась сильнее человека. Результат этого матча — 100:0 в пользу AlphaZero.

По словам ведущего программиста AlphaZero Дэвида Сильвера, искусственный интеллект доказал, что «способен создавать знания с чистого листа, что и позволяет сделать его намного более мощным инструментом в сравнении с прежними версиями». По сути, Zero сам заново открыл принципы игры в го, начав с простейших ходов и достигнув профессионального уровня. В процессе самостоятельных тренировок алгоритм отработал все уже известные модели игры, а затем нашел новые стратегии, которые и применил в турнире с предыдущей версией AlphaGo. По словам Сильвера, это означает, что для получения новых передовых алгоритмов весь прежний опыт и накопленные данные больше не имеют значения.

Есть у программы AlphaZero и еще одно важное преимущество перед предшественницей: она оказалась намного более экономной в части энергозатрат. На ранних этапах для работы «искусственного интеллекта» требовалось 48 процессоров, теперь же речь идет всего о четырех. К тому же, и сами процессоры стали эффективнее – летом Google представила второе поколение так называемых ТПУ. Эти специализированные платы с установленными на них чипами выполняют 180 триллионов операций в секунду.

Этот процессор, разработанный в Google для систем искусственного интеллекта, выполняет 180 триллионов операций в секунду
Этот процессор, разработанный в Google для систем искусственного интеллекта, выполняет 180 триллионов операций в секунду
Модуль с 64 процессорами для систем искусственного интеллекта беспечивает до 11,5 квадриллионов операций в секунду
Модуль с 64 процессорами для систем искусственного интеллекта беспечивает до 11,5 квадриллионов операций в секунду. В подобных стойках «живут» AlphaGo и AlphaZero

По словам специалистов, опрошенных TheVerge, новое достижение DeepMind – безусловный успех. Прямое обучение избавляет от необходимости использования человека для совершенствования «мышления» машины, хотя и лишает возможности контролировать происходящее. Какие еще алгоритмы способен создать искусственный интеллект, смогут ли и люди правильно и вовремя оценить эти наработки – это вопрос, который все чаще задают скептики, называющие технологии машинного обучения главной опасностью для существования человечества. Один из них – Илон Маск, который уже давно призывает правительства стран действовать превентивно, заранее ограничив области применения систем искусственного интеллекта. Иначе, считает Маск, миру грозит Третья мировая война.

А пока программисты, работавшие над AlphaZero переходят в новые проекты DeepMind. Научив компьютер играть в самую сложную для человека игру, теперь они могут применить эти же технологии в других областях. В помощь им – отсутствие заранее заложенной в программный код Zero конкретной специализации, так что в компании считают, что перепрограммировать ее будет не очень сложно. И тогда искусственный интеллект возьмется за фундаментальные научные исследования: лекарства, генетика, физика частиц и так далее.

Демис Хассабис, DeepMind
Демис Хассабис, DeepMind

Один из соучредителей DeepMind Демис Хассабис мечтает подарить человечеству сверхпроводник, который сможет работать при комнатной температуре (пока свойство сверхпроводимости удалось выявить только при экстремально низких температурах вблизи абсолютного нуля). Если такое вещество существует, то оно решит проблему потери энергии при передаче от электростанции конечным потребителям, что даст огромную экономию и поможет сохранить природу планеты. Для начала он планирует предоставить алгоритму ключевую информацию о существующих материалах, частицах и их свойствах. Возможно, ученые что-то пропустили в своих исследованиях, ведь это так по-человечески. 

Соцсети
Сайт сделан в Бреле 2017