Как эволюционирует развитие искусственного интеллекта

Рустам Агамалиев, «От «Энигмы» до ChatGPT. Эволюция искусственного интеллекта и российские бизнес-кейсы». – М.: «МИФ», 2024.

В этой книге вы найдете различные способы использования ChatGPT в российской практике: от языкового перевода, написания, редактирования и резюмирования текстов до анализа данных и генерации идей. Благодаря автоматизации рутинных рабочих процессов вы наконец сможете сосредоточиться на том, что действительно важно и интересно, а ваша профессиональная эффективность повысится.

Земля – это творец. Художник, который при помощи ограниченного набора аминокислот, длительного периода времени, бесчисленных попыток создал интеллект. А сможем ли мы при наличии закрытой системы, длительного времени и бесконечного числа попыток повторить этот трюк? Воспроизвести последовательность, удивительное стечение обстоятельств, при которых человек поймет, что такое творчество, сможет его запрограммировать в сложный набор из нолей и единиц. Есть мнение, что тогда, по идее, машина обзаведется разумом. А с разумом придет и цель.

Творчество – не более чем поиск знания методом проб и ошибок. Долгий, мучительный, но в итоге результативный. ДНК – это творческий «перебор» комбинаций природой. И на наш взгляд, искусственному интеллекту, чтобы стать мыслящим, не хватает последнего элемента в наборе нолей и единиц – творческой переменной. А какая она и как это может получиться, мы попробуем разобраться на примере древнейшей игры на Земле – го.

Медитативная, завораживающая, гипнотизирующая. Именно так ее описывают регулярно играющие люди. А те, кто играет достаточно долго, говорят, что за доской можно почувствовать пульс вселенной, понять, как появилась жизнь и что такое «творить».

Игроки, выставляя поочередно камни на пересечение линий доски, на поле 19 на 19, создают течение камней, вырисовывают уникальные схемы и мыслят на пределе своих возможностей. Го – одна из тех игр, которые сложно понять; однако, если вам это удастся, вы вдобавок осознаете, что такое понимание.

Проблема, которая встает перед игроком за доской, – разобраться в том, что происходит, какой результат и какая цель у каждого поставленного на поле камня. Новичок, впервые держащий в руках черный или белый камень, теряется на пустой доске, но со временем начинает видеть игру и осознавать свою роль в ней. Неудивительно, что такая простая игра стала самой долгоиграющей на Земле: по некоторым данным, ей не одно тысячелетие.

Сложность ее кроется в простоте, как бы парадоксально это ни звучало. Профессионал обладает чувством игры. Часто, спросив его, почему он сделал именно такой ход, в ответ можно услышать: потому что чувствовал его важность. Человеческая интуиция – ключ к победе. И это искры творчества, высеченные из знаний человека, которые он аккумулировал всю жизнь. Знание и понимание – строительные блоки творчества и интуиции, а го – священный Грааль инженеров, работающих на ИИ.

Как запрограммировать интуицию и понимание? Что для этого требуется? Как оказалось, одна простая игра с бесконечным множеством комбинаций. Есть мнение, что конфигураций камней на доске для го больше, чем атомов во вселенной. Так что комбинаторный перебор становится бесполезным занятием, и любой компьютер, построенный на принципе пересчета, окажется слабее девятилетнего хорошо играющего человека.

Простые и очевидные правила создают ситуации, в которых каждое действие игрока многозначное, сложное, неявное, трудно предугадываемое. Все это приводит к крайне неоднозначному набору вариантов действий. Мало знать правила игры, творчески подходить к выбору поведения и стратегии, обладать серьезными аналитическими способностями. Важнее интуитивные, имеющие смысл в конкретной ситуации действия.

На наш взгляд, это и можно назвать творчеством, умением принимать неожиданные, уместные и результативные решения в условиях высокой неопределенности. Каждый может принять решение при наличии достаточных фактов, а вот действовать в условиях неопределенности, при этом достигать результата способен только творческий человек. А жизнь, по большому счету, невообразимо сложная игра на принятие решений, в которую можно сыграть только один раз, вслепую и не особо понимая правил.

Чтобы понять сложность го по сравнению с другими настольными играми, попробуем рассмотреть ее глубину и ширину в сравнении с шахматами. Тогда мы поймем, почему пересчет комбинаций помог Deep Blue одержать победу над Каспаровым, а в случае с го потерпел неудачу. Для победы над человеком в го компьютеру не хватало некоторых свойств человеческого мышления, а именно умения оценивать множественные аспекты среды и принимать решения, не только анализируя сложившуюся ситуацию, но и полагаясь на «чувства».

Глубина и ширина игры объясняют, почему метод пересчета для победы над человеком не подходит. Взгляните на доски.

Ширина игры на поле шахмат – это примерно 35 возможных стартовых позиций, а у го при размере доски 19 на 19 количество возможных конфигураций на старте – около 250. При этом глубина игры – количество ходов, сделанных попеременно, – в шахматах около 80. В среднем шахматная партия заканчивается на 70-м ходу, а партия в го – на 150-м.

Предположим, мы хотим спрогнозировать конфигурацию досок на четыре хода вперед. Учитывая, что средняя ширина игры в шахматы составляет 35, нам необходимо проделать простую математическую операцию: 35 × 35 × 35 × 35 = 1 500 625 различных положений фигур на доске. А теперь возьмем доску для го и проделаем точно такую же операцию: 250 × 250 × 250 × 250 = 3 906 250 000 возможных вариантов расположения камней. Компьютеру проанализировать такое не под силу. Нужен другой подход.

Естественно, это слишком упрощенная математика, однако стоит помнить, что наша цель – познакомить с игрой го и показать ее сложность. Но было бы ошибкой предположить, что шахматы проще. Отнюдь: игра в шахматы не менее сложная, но значительно меньшая по глубине и ширине.

Го – сложная система взаимодействий камней на доске, с непонятными свойствами, которые проявляются исключительно в процессе игры и проникают во все ее аспекты. Она требует от игрока умения принимать решения в условиях, когда невозможно предугадать результат, и вынуждает полагаться на чувства и действовать в соответствии с изменяющейся средой.

Обманчивая простота делает го невообразимо сложной и многогранной. Как научить компьютер играть, если перебор комбинаций не подходит? Научить думать и «чувствовать», принимать решения в зависимости от состояния доски. Иными словами, необходимо научить компьютер мыслить.

Что значит чему-то научиться

В 1948 году Дональд Хебб описал предположения о методе, которым мозг человека тренирует и обучает себя. Тогда это было настоящей революцией, настолько, что гипотеза Хебба превратилась в «обучение Хебба», один из фундаментальных алгоритмов машинного обучения.

Гипотеза Хебба заключается в том, что нейроны головного мозга при взаимодействии возбуждаются друг о друга. Эффективность и длительность возбуждения усиливаются со временем, а связь между двумя нейронами укрепляется, возникают новые шаблоны и модели поведения.

Чтобы обучить AlphaGo, ученым необходимо создать алгоритм, который повторяет работу мозга. Для победы программа должна повторить не только образ мышления живого человека, но еще и интуитивные действия при изменяющихся условиях, коду из ноля и единицы необходимо «ожить». Да, в контролируемой и «узкой» среде доски для игры в го с полем 19 на 19, но все же. Научить выбирать самостоятельно оптимальное действие ради воздействия на среду обитания.

Deep Blue, чтобы научиться перебирать комбинации, потребовалась группа экспертов, а AlphaGo использовала кардинально иной подход. Она научилась играть в го, как это сделал бы человек: методом проб и ошибок. Разработчики загрузили в программу сотню тысяч любительских партий и позволили программе играть против самой себя. Так она училась, училась и училась. До тех пор, пока однажды не победила чемпиона Европы – Фань Хуэя, который на момент матча обладал вторым даном в рейтинге игры.

<…>

AlphaGo научилась играть с человеком на нечеловеческом уровне. Программа принимает решение о каждом следующем ходе, после того как «ощутила» среду, и после многократных попыток понимает, какое действие кажется лучшим. Для программы доска, черные или белые камни, определенное их положение – не отдельные элементы системы. Они расцениваются как целостный механизм, проблемное пространство, в котором ей придется следовать цели, победить, влияя на среду с большим числом неизвестных и высоким уровнем неопределенности. Соответственно, ее задача – изменять своими действиями среду, придавая ей форму, которая увеличит шансы на победу.

Цифровая интуиция

Если спросить игрока после удачной партии о сделанном ходе, часто в ответ можно услышать: «Не знаю, мне показалось это верным» или «Я так чувствовал». Когда наблюдаешь за AlphaGo, складывается впечатление, что компьютер приобрел интуитивное понимание сложных аспектов игры. Машина на «подсознательно-процессорном» уровне фундаментально переосмыслила, что такое преимущество, какой должна быть сфера влияния после каждого сделанного хода, переоценила потенциал выставляемых камней и научилась действовать достаточно агрессивно на тактической фазе, когда оппоненты ведут борьбу за одну клетку игрового поля. Остается только проверить способности программы в игре с профессионалом.

Первой серьезной «жертвой» AlphaGo стал чемпион Европы, обладатель второго дана Фань Хуэй. Однако его уровень, каким бы хорошим игроком он ни был, не сравнится с профессионалами, воспитывающимися в Китае, Южной Корее и Японии. Чтобы действительно проверить предел возможностей AlphaGO, команда Deep Mind предложила матч из пяти игр многократному чемпиону мира Ли Седолю. На момент состязания с компьютером Ли был непобедимым игроком. Победа AlphaGo над ним означала очередную веху в развитии компьютерных технологий и серьезный шаг к созданию полноценного искусственного интеллекта.

Такие технологии не только определят будущее развитие ИИ и компьютера, но и дадут надежду, что мы сможем когда-нибудь дотянуться до скрытого от человека знания. Мы не будем в деталях пересказывать все пять матчей, в четырех из которых программа одержала победу; любой желающий может найти в интернете документальный фильм «AlphaGo – The Movie», где подробно показано, что такое го и как проходили матчи. Вместо этого мы сконцентрируемся на двух ходах, 37-м и 78-м; один сделала машина, другой – человек. Оба они фантастически сложные и дают небольшое представление о том, чему машина может научить человека.

Мы сделаем смелое предположение, что именно ход 37 во второй игре и ход 78 в четвертой предопределили будущее развитие технологии ИИ, а также проникновение ее во все сферы деятельности человека: от медицины до работы с текстом. Ход 37 ошеломил лучших игроков по всему миру. То был странный ход, который можно легко счесть ошибочным. Ли же так не думал, ему потребовалось почти пятнадцать минут на ответ.

«Вчера я был удивлен, – говорил Ли Седоль на конференции после поражения. – Но сегодня я лишился дара речи. Если взглянуть на то, как играла машина, это было чистое поражение по моей части. С самого начала не было ни одного момента, когда преимущество в игре было на моей стороне».

Го – это игра за территорию. Так думает человек; у машины на этот счет совсем иное, если можно так сказать, мнение. AlphaGo не расценивает доску, камни, определенные позиции как отдельные элементы, а видит их как единое последовательное действие, которое необходимо для победы. Программе все равно, каков счет, главное – победа. Именно это привнесло в игру, в которой несколько тысяч лет были успешными исключительно люди, новую перспективу. Стиль компьютера совмещает в себе гибкость, открытость, но при этом в нем отсутствуют бытовавшие ранее убеждения и мнения авторитетных игроков о том, какой ход лучше, а какой хуже. Ни один опытный игрок не будет действовать на второй линии, например. Однако в одной из тренировочных игр AlphaGo посчитала, что это будет разумнее, чем стандартный подход, и в итоге создала более выгодную для себя позицию на доске.

Действия машины на доске часто контринтуитивные, но сильные. Многие профессионалы даже не рассматривали бы большинство из них, а AlphaGo удается благодаря им создавать запутанную взаимосвязь различных групп. Связь получается настолько сложной, что ее практически невозможно сломать. Это удалось только однажды: на 78-м ходу в четвертой игре. То была последняя игра программы, в которой победу одержал человек – Ли Седоль.

Ли удалось сделать игру настолько сложной, что компьютер «растерялся» и был в полной уверенности, будто преимущество на его стороне. Программа не смогла верно оценить последствия хода 78, что привело к дальнейшим ошибкам и в итоге позволило человеку одержать победу. Один из миллиона игроков способен на такое. Ли Седолю удалось сделать невозможное, единственно верное действие, вероятность совершения которого – 1 из 10 000. Он создал положение, при котором холодный разум машины не смог корректно оценить ситуацию и провести соответствующую оценку. Репортеры окрестили это «ходом Бога».

Ли Седоль на конференции после выигранной партии:

«Я слышал крики радости в момент, когда стало ясно, что AlphaGo проиграла. Мне кажется, понятно почему. Люди чувствуют себя беспомощными и находятся в страхе перед машиной. Создается впечатление, что человек слаб и хрупок, а эта победа означает, что мы по-прежнему еще «можем». Не исключено, что со временем победа над ИИ станет непосильной задачей, но победа в этой одной игре оказалась достаточной. Одного раза достаточно».

Жизнь – это не игра

Какой бы удивительной ни была AlphaGo, ее создал человек по некоему образу и подобию себя. Однако это всего лишь игра – с правилами, логикой, строгостью. Холодная логика, идеальная игра, однако жизнь нелогична и запутанна. Ее правила не выражены в строгих законах, потому-то так сложно принимать решения: здесь победа или поражение не столь очевидны. Если коротко, то машина существует в среде строгой логики, а жизнь – сфера нечеткой логики. А не всегда предшествует Б, а В не всегда оказывается следствием Б. Там, где у машины из А следует Б, у человека Б может следовать из А, а может и нет.

Принятие решений в игре относительно просто описать и алгоритмизировать, а в жизни они принимаются в условиях недостатка информации, без четкого представления о последствиях. Свойства среды не поддаются влиянию, а изменяются еще до того, как решение принято. Человек действует инстинктивно, почти без обдумывания, в соответствии с тем, как представляет себе будущее. Чем критичнее ситуация, тем быстрее принимаются решения.

Логика машины хотя и строгая, но, как показала доска 19 на 19 и набор черно-белых камней, не всегда понятная. Наверное, так случилось потому, что машина «чувствует» и «думает» иначе, чем человек. Это может научить нас новаторству, поможет преодолеть рамки прошлых убеждений, снимет некоторые ограничения. Человек вместе с машиной найдут множество интересных решений, которые могут сработать, а могут и не сработать. Создание ИИ – неизбежный этап развития человеческой цивилизации, при котором машина нас не заменит, а органично дополнит; не захватит контроль над миром, а расширит горизонт возможного и в итоге трансформирует общество. Компьютер изменил наши способы работы с информацией: ее хранения, переработки, потребления. Нейронные сети помогают делать то, что компьютер умеет гораздо быстрее и эффективнее, а благодаря человеческой фантазии пределы компьютерных вычислений становятся почти безграничными. Для этого нужна щепотка творчества.

Человеку не хватает воображения

Мы, люди, не можем сформулировать, какая технология в будущем станет востребованной. Генри Форду говорили, что нужна лошадь чуть быстрее. Стив Джобс считал, будто ни один клиент не знает, что ему требуется. Любая технология, от ткацкого станка до ИИ, проста, тривиальна и востребована только после того, как она появилась и прошла путь от первых пользователей до массового потребителя.

Действия человека управляются не им самим, а маленькими, случайными изменениями в среде. Это небольшие колебания, которые могут вызывать лавинообразные сдвиги в шаблонах поведения, способах применения привычных нам вещей. А иногда, в редких случаях, появляется что-то, изменяющее все вокруг: паровой двигатель, телефон, автомобиль, первый компьютер, компьютерная мышь, смартфон и многие другие инновации, сформировавшие мир.

Фото в анонсе: rustamagamaliev.ru

Также читайте:

Чему машина может научить человека

Что значит чему-то научиться

Цифровая интуиция

Жизнь – это не игра

Человеку не хватает воображения