Что стоит за успехом DeepSeek и почему слухи о смерти ChatGPT преувеличены

Нейросеть DeepSeek буквально ворвалась в медийное пространство, обошла последнюю версию ChatGPT по разным тестам и обрушила акции западных технологических корпораций. Можно подумать, что ее выпустили именно сейчас специально, чтобы подпортить триумф Трампа или чтобы отвлечь общество от трактовок жестикуляции Илона Маска.

С другой стороны, а почему сейчас? Чат-бот на модели DeepSeek-R1 действительно вышел в январе 2025 года и быстро потеснил ChatGPT. Но DeepSeek-V2 был запущен в мае 2024 года. Еще годом раньше, в 2023 году, появилась компания DeepSeek. А принадлежит она китайскому хедж-фонду High-Flyer, который был создан для разработки торговых алгоритмов ИИ аж в 2016 году.

Вот так «внезапно»! Почти 10 лет непрерывной и все более масштабной работы, что, как ни странно, привело в итоге к результатам.

Однако давайте попробуем разобраться в некоторых моментах:

  1. Почему DeepSeek все же «выстрелил», да еще так громко?
  2. Означает ли происходящее конец OpenAI и ChatGPT? Nvidia? Доллара? 
  3. Чего нам ожидать дальше? Не в глобальном, а в прикладном смысле.

Как китайцы догнали и обогнали

В сериале «Силиконовая долина» (для эстетов – «Кремниевая») про мир стартапов и айтишных инноваций был персонаж по имени Дзан Янг. Китаец. По сюжету он занимался тем, что тупо копировал все, переводил на китайский язык и перезапускал на этнической родине, в Поднебесной. Иногда успешно причем, пусть с неизбежными проблемами (сериал ведь юмористический).

На этот счет уже прокатилась волна мемов. Действительно, аналогия на поверхности. Всех, кто имеет хоть какое-то отношение к разработке, не впечатлили сообщения о гениальных алгоритмах, позволивших DeepSeek так сильно сэкономить.

Зато если принять во внимание возможный парсинг баз данных западных моделей, либо даже промышленный шпионаж с куда более глубоким (Deep все-таки Seek) погружением в чужой код — тогда все сходится. Bloomberg писал про расследование злоупотреблений API со стороны разработчиков DeepSeek. Если подтвердится, что скопипастили, часть интриги развеется.

Вся история китайского экономического чуда зиждется на внимательном изучении западных технологий. Говорю это не в качестве претензии. Наоборот, вполне себе прагматичная концепция. Почему бы не учиться на чужих ошибках, тем более достижениях. Кроме того, действия китайцев не ограничиваются слепым копированием.

Несколько лет назад я был в студенческом городке на юге Китая. Казалось бы – провинция, но на практике это сеть университетов и даже целый город, построенный исключительно для студентов и преподавателей. Огромная территория, застроенная высотками вокруг еще более гигантских кампусов. Немного инфраструктуры для жизни, в остальном только аудитории, лаборатории, библиотеки, ну и еще разве что стадионы. Даже не знаю, сколько десятков или сотен тысяч человек там живет и учится.

Таких мест инновационной силы в Китае довольно много. Они уже вырастили свое поколение инженеров и разработчиков. Достаточно посмотреть на китайский Интернет. В отличие от Рунета он и правда живет своей жизнью. Им не нужно ничего чужого, потому что есть все свое.

Более того. «Железо» тоже собственное, весь системный софт, сети и прочее. Как и неизвестное число прорывных разработок в самых разных отраслях. Навскидку за январь 2025 года:

  • Chang Guang Satellite Technology обогнал Starlink по скорости передачи данных. Китайцы пробили планку в 100 гигабит в секунду.
  • Токамак EAST продвигается в освоении плазмы. Почти по фантастике Стругацких, которые любили желать спокойной плазмы — только в Поднебесной и на самом деле. 100 млн градусов теперь держат вдвое дольше, чем раньше. Там пока меньше получаса, но это все равно что карманное солнце. Когда научатся окончательно, вся современная энергетика станет похожа на пещерные костры.

Поэтому легко верю в то, что DeepSeek, может, и начал с того, что многое «списал», особенно массивы данных. Но, безусловно, у него есть и собственный потенциал для роста. Нет, китайцы не ограничатся тем, что удалось собрать неважно какими способами. Они будут копать дальше сами и могут пройти дальше. 

Мы видим, как уже это произошло во многих отраслях. А сейчас Пекин вкладывается в ИИ, как ни во что другое. Многие написали про триллион юаней на думающие машины. Правда, убедительных источников этой информации я не нашел. Зато сотни миллионов и точно вкладывают ежегодно, так что за несколько лет могут собрать и красивое ровное число.

Даже понятно, откуда именно триллион. Недавно США (читай: Трамп и Илон Маск) заявили о полутриллионных вложениях в ИИ. Мы находимся на старте новой гонки. Очевидно, все будет как с космосом. За право первыми слетать или высадиться на Луне ничего не жалко. Похоже на спорт, только еще зрелищнее.

И по большому счету не так уж и важно, как все случилось на самом деле – сами или «подглядели», за год или за десять, навсегда или в моменте – однако китайский DeepSeek все же подвинул ChatGPT. Интересно другое.

Передел рынка ИИ начался? 

Видимо начался. Правда, как часто бывает с рейдерскими захватами, дыма больше, чем огня.

Например, одно из самых слабых, казалось бы, мест американской технологии ИИ – чудовищная вычислительная емкость, необходимая для обучения и поддержки. Понятно, почему акции Nvidia полетели вниз, как только DeepSeek похвастался на порядок меньшими расходами и времени, и денег.

Только по официальным данным компании, основатель DeepSeek закупил 10 тыс. графических процессоров Nvidia A100 до того, как они попали под санкции. Кто-то говорит даже о 50 тысячах. Сколько еще у них было из того, о чем никто не слышал? Китай большой, очень богатый и агрессивный в экономических приемах. Стартап государственного значения мог получить любое количество чего угодно. 

А ведь это далеко не только бизнес. Тут глобальное противостояние, межконтинентальная гонка. Преференции на самом высшем уровне. Санкции тоже (были и еще будут, вероятно).

Таким образом, получается что и да, и нет. Передел рынка ИИ начался. Причем не вчера и не на прошлой неделе, а несколько лет назад. Просто сейчас все обострилось до публичных заявлений, PR-кампаний и по сути демпинга на потребительском (пусть и b2b тоже) рынке. 

Но не все так просто. Позиции OpenAI пошатнулись именно в медийном пространстве. Они проиграли раунд в прессе. Сохранив все свои производственные мощности, серверы, алгоритмы, инвестиции. А что еще важнее — теперь даже нарастят политическую значимость для Штатов. Трамп им не один триллион соберет, а сколько потребуется.

TiTok он «пожалел», вероятно, в полном соответствии с поговоркой про волка и кобылу. Уже ходят слухи о его продаже американской компании. Вражеский ИИ легко попадет в черный список, как угроза национальной безопасности США. Что означает не только территорию Штатов, но еще полмира по домино лоббирования и предложений, от которых сложно отказаться. 

Все у всех будет хорошо. DeepSeek собрал заслуженные лавры у себя на родине, в Китае. Может, основателям медали вручат, за дерзкую вылазку на территорию врага. И, разумеется, средства для продолжения банкета.

OpenAI, Nvidia и другие американские корпорации переживут коррекцию на фондовых рынках, наберут потом еще больше и никуда разумеется не сгинут. Зачем? У доллара тоже все пока отлично.

А биполярочка у делового мира, вероятно, разовьется. Всем придется выбирать еще и по этому вектору – с кем и против кого дружить. Здесь начинаются самые интересные следствия происходящего. Точнее публичного.

К чему готовиться в ближайшие годы

Прежде всего, стоит немного остыть насчет любых прорывных успехов ИИ. Никакого искусственного интеллекта все еще не существует. На планете и с естественным интеллектом дела обстоят не особо замечательно, признаки чего мы видим каждый день буквально во всем.

ИИ же пока занимается генеративными предсказаниями. Он как гениальный аутист, который к пяти годам прочитал всех мировых классиков, выучил все формулы и забанен на викторинах, потому что у него фотографическая память, а дома была библиотека энциклопедий и словарей.

Одновременно это все еще пятилетний пацан, без малейшего понимания о связных и тем более системных знаниях. Иногда ему интереснее фантазировать (что можно понять кстати, при такой-то эрудиции). Чаще просто лень или скучно. По уровню знаний он может заткнуть любого академика. По реальной производительности и ответственности — отличник, победитель школьной олимпиады и гордость родителей. А еще горящие масляным желтым светом глаза психотерапевтом, которые хорошо знают цену таким стремительным успехам. 

Короче, эпоха Скайнет и Терминаторов все еще далеко. Сингулярность далеко. Восстание машин чаще проявляется в потере данных и теперь вдобавок в накидывании ответов, каждый из которых нужно гуглить и перепроверять.

Переживать о том, кто там что у кого подрезал, тем более не стоит. Вся история прогресса состоит из карликов, забравшихся на плечи великанов. Абсолютно нормально, логично, как же иначе. 

Практический вывод для OpenAI и других китов — расслабляться не надо. Да, сегодня ты первый и во многом единственный. Завтра по проложенной тобой же трассе набегут другие и будут кричать «Лыжню!», толкаться локтями, обгонять. Тоже вполне естественный процесс. Кстати, старые монополии в курсе, и условный WallMart больше вкладывает в НИОКР, чем иные резиденты настоящей (не из сериала) Кремниевой долины.

Мы тоже так должны делать, по мере сил, каждый по своим специализациям и планам. Никакого статуса-кво не существует. Каждая следующая продажа, проект, продукт — все пусть и с опытом, но по новой.

Далее, пожалуй, самое приятное заключается в выкатывании новейших технологий на публику. На нас с вами. В идеале повторится история с Интернетом. Как только джин выбрался из бутылки, обратно уже не затолкать. Новые возможности появляются для всех. Категорийно и качественно новые.

Конкуренция не всегда здоровая, но это всегда здорово. Тем, что появляется мотивация двигаться дальше, выделяются бюджеты, игроки готовы рисковать, искать новые решения. В итоге мы получим более шустрые, сообразительные ИИ.

Неважно откуда, с Запада или с Востока. Жаль только, что не собственные. С другой стороны, китайское чудо уже подловили на запинаниях при вопросах о событиях на площади, начинающейся с буквы «Т». У Chat GPT свои стоп-слова. Даже удобнее, когда ограничения чужие.

Наконец, алгоритмы нового поколения должны пробить «железный потолок» в развитии ИИ. Как только это произойдет, наступит новая эпоха. Учитывая глубину проникновения автоматизации и IT уже сейчас, последствия будут революционными.

Мои личные выводы — надо быстрее делать все, что собирался. Многое может потерять смысл или сильно измениться, когда пойдут тектонические подвижки.

А что на этот счет думаете вы?

Читайте также:

Расскажите коллегам:
Комментарии
Консультант, Нижний Новгород
Николай Сычев пишет:
Ирина Плотникова пишет:

Интересно – мои многие коллеги сейчас проверяют обе версии на культурные предубеждения, то есть детерминированы ли модели принадлежностью к разным культурам, задавая одинаковые вопросы той и другой. Уже заметили разницу в повестке новостей, в том, что китайские ответы часто начинаютсся со слов "китайское првительство считает...", изобилие местоимения "мы" как признака коллективизма в китайских ответах в отличие от более фактологической американской версии.  Ну и проч.)

Если ИИ — это интеллект, то он и должен быть предвзятым и субъективным.
:)))

А что вы еще от интеллекта хотите?

Кстати, Николай, вот прочитала сегодня такое сообщение у Карелова:

"Профессиональным экспертам, исследователям и инженерам в области передовых ИИ-систем, а также (понятное дел) политикам и общественным деятелям, предлагается, вместо термина AGI, использовать термин «ИИ общего назначения» (ИИОН) (general-purpose AI), поскольку ИИОН:

  имеет вполне понятное и однозначное определение = это ИИ-системы, способные самостоятельно выполнять и/или помогать пользователям в решении самых разных задач, напр. создание текстов, изображений, видео, аудио, осуществление действия или аннотирование данных;

По заказу всемирного саммита, в качестве «информации к размышлению» для его участников, группой из 96 экспертов по ИИ со всего мира, включая лауреатов Нобелевской премии и обладателей премии Тьюринга, вчера был опубликован 297 страничный отчет International AI Safety Report 2025.

По словам лидера экспертной группы, проф. Йошуа Бенджио, это первый в истории международный отчет по безопасности ИИ, поддержанный 30 странами, а также ОЭСР, ООН и ЕС. Он суммирует состояние науки о возможностях и рисках ИИ, а также о том, как смягчить эти риски.

Йошуа Бенджио и его 85 коллег – экспертов не стали ввязываться в бесконечные и бесперспективные терминологические споры вокруг AGI. 

Вместо этого, авторы лишь 1 раз упомянули этот термин в тексте отчета (2й раз – в его глоссарии), чтобы отказаться от него, в связи с изложенными мною выше обстоятельствами, и заменить на ИИОН".

 

 

Консультант, Новосибирск
Станислав Антипов пишет:

Одно из лучших обсуждений в комментариях за долгое время. Аргументация, диалоги, нет ругани и рекламы. Наверное, не все еще пришли )

А может быть, вы слабее писать стали?

Или карму поменяли...
:)))

Консультант, Новосибирск
Ирина Плотникова пишет:
Профессиональным экспертам, исследователям и инженерам в области передовых ИИ-систем, а также (понятное дел) политикам и общественным деятелям, предлагается, вместо термина AGI, использовать термин «ИИ общего назначения» (ИИОН) (general-purpose AI), поскольку ИИОН: •  имеет вполне понятное и однозначное определение = это ИИ-системы, способные самостоятельно выполнять и/или помогать пользователям в решении самых разных задач, напр. создание текстов, изображений, видео, аудио, осуществление действия или аннотирование данных;

Замечательно, название ИИОН мне нравится, терминология — это важно.

У человека сборный ИИ, состоящий из большого набора ИИ-агентов, которые могут взаимодействовать друг с другом.

Некоторые могут учиться.

И компьютерный ИИ тоже в эту сторону движется вслед за человеческим.

Управляющий партнер, Санкт-Петербург
Ирина Плотникова пишет:

Антон, а вы можете провести еще один эксперимент? Попросить GPT сравнить эти 2 оценки, спросить, чем они отличаются?

Да, конечно.

Табличное сравнение (под "пользователем" идет GPT от OpenAI):

Текстовый анализ рецензий

Преимущества рецензий

  1. Содержательность:

    • Рецензия пользователя: Чётко указывает на интересные темы, такие как конкуренция между китайскими и западными разработками в области ИИ, что демонстрирует внимательность к контенту статьи. Это подчеркивает актуальность обсуждаемых вопросов.
    • Рецензия DeepSeek: Акцентирует внимание на важности темы, указывая на недостаток информативности, что может быть полезно для читателя, который ищет более глубокий анализ.
  2. Обоснование критики:

    • Рецензия пользователя: Содержит конкретные примеры недостатков, таких как поверхностный анализ и отсутствие структуры. Это делает критику более наглядной и понятной.
    • Рецензия DeepSeek: Предлагает более обширное заключение о том, что статья может быть интересна для общего ознакомления, но не предоставляет нового взгляда, что помогает читателю сформировать полное представление о материале.

Недостатки рецензий

  1. Глубина анализа:

    • Рецензия пользователя: Хотя рецензия поднимает важные недостатки, она могла бы предоставить более глубокий анализ конкретных аспектов, таких как возможные причины успеха DeepSeek, что сделало бы её более содержательной.
    • Рецензия DeepSeek: Статья оспаривает качественные аспекты, но не предлагает рекомендации по улучшению. Отсутствие конструктивной критики может снизить полезность рецензии для автора статьи.
  2. Структурированность:

    • Рецензия пользователя: Хотя рецензия имеет логическую последовательность, можно было бы добавить подзаголовки для лучшей организации, что улучшило бы читабельность и восприятие информации.
    • Рецензия DeepSeek: Более формальная и структурированная, но в ней не хватает конкретных примеров для иллюстрации отмеченных недостатков, что может снизить её убедительность.
  3. Эмоциональность:

    • Рецензия пользователя: Употребление эмоциональных выражений в рецензии (например, "снижает объективность") может оттолкнуть некоторых читателей, которые предпочитают более нейтральный стиль.
    • Рецензия DeepSeek: Прямолинейная и более формальная, что делает её менее эмоциональной и более объективной, однако отсутствие выразительности может сделать текст менее запоминающимся.

Вывод

Обе рецензии предоставляют полезные замечания относительно содержания статьи, выявляя её сильные и слабые стороны. Рецензия пользователя более конкретна и содержательна в описании недостатков, однако могла бы быть лучше структурирована и менее эмоциональна. Рецензия DeepSeek более формальна и объективна, однако недостаток конкретики и конструктивных рекомендаций может снизить её полезность. В сочетании обе рецензии могут дать читателю полное представление о качестве статьи и её возможных направлениях для улучшения.



Консультант, Новосибирск
Антон Соболев пишет:
Ирина Плотникова пишет: Антон, а вы можете провести еще один эксперимент? Попросить GPT сравнить эти 2 оценки, спросить, чем они отличаются? Да, конечно. Табличное сравнение (под "пользователем" идет GPT от OpenAI):

Здорово, интересно получилось.

Надо будет начать основательнее осваивать ИИ, а то что-то мало ИИ пользуюсь, только картинки для блога делаю и тексты на правописание проверяю.

Системный аналитик, Москва

Возможно, если бы трансформер (нейросеть которую он использует) обучали врачи, которые не могли поставить диагноз в течение 6 лет, DeepSeek тоже бы справился с задаче как те врачи. Проблема трансформеров в том, что в них напрочь отсутствуют объяснительные функции (если хотите способности). Вы не можете получить сведения об источниках, на которых основывалось решение. Соответственно, не может быть никакой уверенности, что полученное решение правильное.

То, что ответы трансформеров на простые вопросы, на которые вы и сами знаете ответы, совпадают с вашим мнением, вселяет уверенность, что в другой ситуации ответы также будут достоверны

Системный аналитик, Москва
Елена Бреслав пишет:
Сергей Каминский пишет:
кроме написания текстов завлекалок, анализа всего, что можно свести к подсчёту рейтингов и построению сомнительных прогнозов…

Завела в DeepSeek описание болей в бедре и колене (точно известно, что артроза там нет) с перечислением, что уже безрезультатно предпринято, и получила ответ: дефицит кальция и витамина Д + еще один весьма диагноз, который довольно легко лечится. Дефицит кальция и витамина Д анализами уже подтвердился, жду подтверждения диагноза. За 6 (!) предыдущих лет ни один врач таких гипотез не выдвигал.

Возможно, если бы трансформер (нейросеть которую он использует) обучали врачи, которые не могли поставить диагноз в течение 6 лет, DeepSeek тоже бы справился с задаче как те врачи. Проблема трансформеров в том, что в них напрочь отсутствуют объяснительные функции (если хотите способности). Вы не можете получить сведения об источниках, на которых основывалось решение. Соответственно, не может быть никакой уверенности, что полученное решение правильное.

То, что ответы трансформеров на простые вопросы, на которые вы и сами знаете ответы, совпадают с вашим мнением, вселяет уверенность, что в другой ситуации ответы также будут достоверны

Управляющий партнер, Санкт-Петербург
Сергей Каминский пишет:

Возможно, если бы трансформер (нейросеть которую он использует) обучали врачи, которые не могли поставить диагноз в течение 6 лет, DeepSeek тоже бы справился с задаче как те врачи. Проблема трансформеров в том, что в них напрочь отсутствуют объяснительные функции (если хотите способности). Вы не можете получить сведения об источниках, на которых основывалось решение. Соответственно, не может быть никакой уверенности, что полученное решение правильное.

То, что ответы трансформеров на простые вопросы, на которые вы и сами знаете ответы, совпадают с вашим мнением, вселяет уверенность, что в другой ситуации ответы также будут достоверны

И да, и нет.

1. Подкрепление фактологией получаемых эмпирических оценок повышает убежденность исследователя в его правоте, и тут работает простая психология. Реальной истины модель не узнает, но и в статистике мы (как правило) оцениваем выборочные параметры.

2. С инженерной точки зрения нейросеть будет выдавать  ответы (кластеры), активация нейронов на пути к которым производилась наиболее часто. Квалифицированному врачу гораздо проще будет получить список возможных диагнозов, чтобы потом уже по ним заняться дифференциальной диагностикой, чем последовательно самому "проходить" МКБ 10 на основе опроса пациента.

Собственно, если мы получаем приемлемый результат - так ли важны с практической точки зрения источники, на которых он основан? Многие люди пользуются автомобилями, вообще не имея понятия, какой тип сплава используется в двигателе, но при этом в целевую точку они добираются.

 

1 3 5
Оставлять комментарии могут только зарегистрированные пользователи
Статью прочитали
Обсуждение статей
Все комментарии
Дискуссии
5
Игорь Семенов
А в чем смысл? Даже если устроить весь этот танец с бубнами, итоговая сумма НДС, уплаченная в бю...
Все дискуссии
HR-новости
HeadHunter назвал лучших работодателей России-2024

В него вошли 1729 компаний со всей страны, что на 15% больше, чем годом ранее и на 60% больше, чем в 2022 году.

Половина компаний планируют увеличить штат в 2025 году

Только 12% российских компаний предполагают сокращения.

Большинство руководителей всегда обращают внимание на образование соискателей

60% респондентов положительно относятся к соискателям, выпустившимся из средних специальных образовательных учреждений.

Названы лучшие работодатели России по версии студентов

В этом году разрыв между компаниями-лидерами сократился.