Демис Хассабис об AlphaGo и искусственном интеллекте

Выдержка из интервью газеты The Guardian с создателем искусственного интеллекта AlphaGo главой DeepMind Демисом Хассабисом. Вундеркинд, второй в списке шахматистов-юниоров до 14 лет, пятикратный чемпион Mind Sport Olympiad, член Королевского общества искусств, доктор в области когнитивной неврологии. Создатель интернета Тим Бернерс-Ли считает Хассабиса одним из умнейших людей на планете, а коллеги по работе называют сверхчеловеком.

Хассабис считает, что в долгосрочной перспективе технология, которую он развивает даст больше, чем просто создание роботов с эмоциями или умных телефонов.

Хассабис: «Это больше, чем Google. Больше Facebook, Microsoft, Apple и другие гигантские корпорации, которые разрабатывают AI, тратя миллиарды в гонке технологических вооружений. Это все, что мы могли бы себе представить, и многое, что пока не можем».

AlphaGo — это прообраз искусственного общего интеллекта (AGI), с акцентом на «общий». В своем видении будущего Хассабис видит тандем суперумных машин с экспертами-людьми в работе над решением разных проблем.

Хассабис: «Рак, изменение климата, энергетика, геномика, макроэкономика, финансовые системы, физика. Многие из систем, которые мы хотели бы освоить, становятся слишком сложными. Информационная перегрузка в них такова, что даже для самых умных людей очень трудно справиться с этими проблемами в течение своей жизни. Как пройти через эту лавину данных, чтобы найти правильные идеи? Один из способов мышления AGI это процесс, который будет автоматически конвертировать неструктурированные данные в полезные знания. То, что мы создаем – это алгоритм мета-решения любой проблемы».

Deep Blue компании IBM сможет победить Гарри Каспарова в шахматы, но будет бороться против трехлетки в крестики-нолики, потому что это шахматный суперкомпьютер. Хассабис черпает вдохновение в возможностях человеческого мозга и пытается построить первый «метод универсального обучения машины»: единый набор гибких адаптивных алгоритмов, подобно тем, что используют биологические организмы, осваивая любую задачу с нуля и оперируя только необработанными данными.

Демис Хассабис на пресс-конференции матча между AlphaGo и корейским мастером Ли Седолем в Сеуле

Демис Хассабис на пресс-конференции матча между AlphaGo и корейским мастером Ли Седолем в Сеуле

Неразрешимой проблемой программирования Го до создания AlphaGo было написание функции оценки, то есть набора правил, которые говорят вам, в чью пользу сейчас позиция и каков выигрыш игрока. В Го для проведения такой оценки часто требуется интуиция. Мастер может объяснить тот или иной шаг в игре словами: «Я увидел, что это лучшее решение».

Хассабис: «Го является финишной точкой: это вершина среди игр с точки зрения интеллектуальной глубины. Го интересно и красиво, и это захватывающий вызов для нас. Мы не просто освоили игру. Мы сделали это с помощью удивительно интересных алгоритмов. Игра Го — это, скорее, искусство, чем наука, и AlphaGo играет в очень человеческом стиле, потому что она обучалась как человек, а затем становилась сильнее и сильнее, тренируясь так же, как учились бы вы или я. AlphaGo на порядок лучше, чем кто-либо мог себе представить. Но наиболее важным аспектом для нас является то, что это не просто экспертная система со встроенными правилами. Она научила себя игре с помощью универсальных методов машинного обучения. В конечном счете, мы хотим применить эти методы для решения важных реальных проблем, таких как моделирование климата или  для комплексного анализа болезней, не так ли? Так что очень интересно представить себе, что же эта сеть в состоянии делать в будущем…»

«Нам действительно повезло»,- говорит Хассабис, сравнивая свою компанию с программой Apollo и Манхэттенским проектом по захватывающему масштабу амбиций и качеству умов, которых он собирает со все возрастающей скоростью.

Хассабис: «Мы можем получать лучших ученых из любой страны ежегодно. У нас окажется человек, который выиграл олимпиаду по физике в Польше, или человек, который получил степень доктора философии или ставший первым по математике во Франции. У нас больше идей, чем исследователей, но в то же время к нам стремятся попасть действительно выдающиеся люди. Таким образом, мы находимся в очень выгодном положении. Единственным ограничением является то, сколько людей мы можем принять, не вредя культуре компании «.

В AlphaGo наряду с современными методами поиска Монте-Карло использован более глубокий уровень обучения с подкреплением, который обучает долгосрочному планированию. Далее планируется подключить в сеть функцию памяти, и так далее — до тех пор пока не будет пройден каждый шаг эволюции интеллекта. 

Хассабис: «У нас есть дорожная карта, сколько нужно пройти таких шагов. Объединение различных областей интеллекта является ключевым, потому что мы заинтересованы в алгоритмах, которые позволят AI использовать знания, полученные в одной области для других областей».

Корреспондент: Отдыхает ли когда-нибудь AlphaGo?

Хассабис:  Неа. Никакого покоя! Мы даже не выключали ее на Рождество.

Корреспондент:  Неужели совсем не нужен перерыв в обучении?

Хассабис: Может быть, ей это нравится? (улыбается).

Существует ли опасность для человечества? «Ну, я надеюсь, что нет», — невозмутимо отвечает Хассабис. По его мнению, общественность паникует перед AGI. Хассабис не верит в сценарий антиутопии, где сверхумные машины беспощадно уничтожают своих человеческих создателей.

3-хкратный чемпион Европы по игре Го Фан Хуэй оценивает позицию во время матча с AlphaGo

Трекратный чемпион Европы по игре Го Фан Хуэй оценивает позицию во время матча с AlphaGo

Хассабис: «Мы не создадим ничего подобного интеллекту человеческого уровня в ближайшие десятилетия. Мы находимся на первой ступени лестницы и пока играем в игры. Да, есть риски, о которых мы должны думать уже сейчас». 

Компания DeepMind не контролируется правительством, как было в проектах Appolo или в Манхэттенском проекте. Она планирует опубликовать свой код в открытый доступ. Также условием сделки с Google был запрет на использование своей технологии для военных или разведывательных целей. 

Хассабис: «Поскольку эти системы становятся все более изощренными, мы должны думать о том, как и что они оптимизируют. Сама технология нейтральна, но это обучающиеся системы, так что неизбежно они будут нести отпечаток системы ценностей и культуры своего дизайнера. Поэтому мы должны очень тщательно подумать о ценностях».

Как быть со сверхразумом?

Хассабис: «Мы должны убедиться, что цели указаны правильно, и что там нет ничего неоднозначного и что они стабильны в течение долгого времени. Но во всех наших системах цель верхнего уровня по-прежнему будет определяться их дизайнером. Сверхразум может придумать собственные пути, чтобы добраться до этой цели, но сам он не ставит цели. Это интересные и сложные задачи. Как и любая новая мощная технология, эта должна быть использована ответственно с этической точки зрения. Именно поэтому мы активно призываем к дискуссии и исследованию этого вопроса сейчас, чтобы когда придет время мы были хорошо подготовлены».

перевод и редакция Михаила Емельянова.

Метки: , , , , , ,

Comments are closed.

© Русская Школа Го и Стратегии, 2016. Все права защищены