615

Выучился сам. Алгоритм AlphaGo Zero может обыграть человека во что угодно

Что такое AlphaGo? 

Люди среднего и старшего поколений хорошо помнят исторический матч 1997 г. между Гарри Каспаровым и компьютерной программой Deep Blue, созданной корпорацией IBM. Тогда машина победила действующего чемпиона мира по шахматам, и это стало символической точкой отсчёта новой эпохи, в которой компьютеры уже готовы превзойти людей по интеллектуальным навыкам.

Следующим испытанием, в котором человеку предстояло помериться силами с машиной, была го — древняя китайская игра, которая, несмотря на кажущуюся простоту правил, намного сложнее шахмат. Специалисты по искусственному интеллекту предсказывали, что программа, способная обыграть ведущих игроков мира в го, будет создана не ранее 2020-2025 гг. Однако такой алгоритм, названный AlphaGo, появился в 2015 г., а год спустя он одолел трёхкратного чемпиона Европы Фань Хуэя в пяти партиях со счётом 5:0. В марте 2016 г. программа выиграла со счетом 4:1 у ещё более "продвинутого" профессионального игрока — Ли Седоля. Наконец, в 2017 г. AlphaGo трижды одержал победу над сильнейшим в мире игроком в го Кэ Цзе

После этого разработчики нейросети заявили, что официальных матчей в го больше не будет, и анонсировали появление новой, более мощной программы. 

В чём отличие новой версии?

Её назвали AlphaGo Zero. Слово "zero" означает нулевое вмешательство человека. Если предыдущие версии программы обучались игре по предоставленным им тысячам партий, сыгранным ранее людьми, то теперь искусственный интеллект постигал игру самостоятельно, с нуля. И не одну игру, а сразу три — го, сёги и шахматы. Единственное, что разработчики изначально в него заложили, — это правила, условия побед и поражений.

Получив задачу, алгоритм взялся играть против самого себя, выстраивая партии абсолютно случайным образом. Система обучения строилась на анализе ходов. Нейросеть, имитирующая работу нейронов в головном мозге, запоминала те ходы, которые приближали её к победе, и отбраковывала те, что вели к проигрышу.

Обучение продолжалось несколько циклов. В каждом из них производительность программы росла, что привело к появлению более точных нейросетей и всё более сильных версий искусственного интеллекта. Алгоритм совершенствовал сам себя без участия человека, и результат не заставил долго ждать: AlphaGo Zero, зная лишь правила игры в го, смог победить своего предшественника AlphaGo (в свою очередь одолевшего всех сильнейших игроков-людей) со счётом 100:0. То есть выиграл сто партий подряд! По наблюдениям разработчиков, программа начала использовать для победы стратегии, которые ранее были неизвестны профессиональным игрокам в го.

По мнению Мюррея Кэмпбелла, который в своё время участвовал в создании программы Deep Blue, победившей Каспарова, теперь искусственный интеллект способен в кратчайшие сроки без посторонней помощи обучиться любой игре и одержать в ней верх над человеком. К примеру, следующим шагом могут стать компьютерные игры Starcraft и Dota 2. 

Какая от этого практическая польза?

Для разработчиков искусственного интеллекта его участие в играх не является основной задачей. Оно воспринимается ими лишь как этап тестирования алгоритма. В будущем компания DeepMind, которая и создала систему AlphaGo, намерена использовать её в различных прикладных целях. Это поиск лекарств от тяжёлых болезней, изучение взаимодействий белков в теле человека, сокращение потребления электроэнергии, разработка новых материалов или, к примеру, какого-нибудь супераккумулятора.

«Возможно, не за горами появление сверхпроводника, работающего при комнатной температуре, — говорил глава DeepMind Демис Хассабис, представляя научной общественности AlphaGo Zero. — Я мечтал об этом, когда ещё был ребенком и читал книги по физике».

Кстати, машинное обучение, подобное тому, через которое прошла программа AlphaGo, уже применяется в медицине. С его помощью учёные, например, диагностируют болезнь Альцгеймера задолго до появления её симптомов.

Надо ли бояться искусственного интеллекта?

Споры о том, друг он нам или враг, идут с 1920-х годов, когда эта тема стала популярной в научной фантастике. Понятно, что писателям, а позже и киносценаристам и режиссёрам, хотелось сгустить краски, пощекотать нервы обывателю. Но учёные к подобной угрозе (что искусственный интеллект выйдет из-под контроля и захватит власть над людьми) относятся скептически. 

«Если разумно его использовать, он всегда останется нам другом, никакой угрозы в нём нет, — уверен руководитель лаборатории интеллектуальных робототехнических систем Университета Иннополис Александр Климчик. — Ведь искусственный интеллект — это всего лишь свойство машины принимать решения самостоятельно, без участия человека. Если внимательно писать программное обеспечение, тщательно всё проверять, создать несколько уровней защиты, то опасаться нечего». 

С другой стороны, считает Климчик, не стоит безоговорочно доверять алгоритмам, какими бы «умными» они ни были. Это вопросы контроля над ядерными реакторами и тем более ядерным оружием. Цена ошибки здесь слишком высока. Уж точно выше, чем от проигранной партии в го.

Оставить комментарий (0)

Также вам может быть интересно