Нейросеть DeepSeek буквально ворвалась в медийное пространство, обошла последнюю версию ChatGPT по разным тестам и обрушила акции западных технологических корпораций. Можно подумать, что ее выпустили именно сейчас специально, чтобы подпортить триумф Трампа или чтобы отвлечь общество от трактовок жестикуляции Илона Маска.
С другой стороны, а почему сейчас? Чат-бот на модели DeepSeek-R1 действительно вышел в январе 2025 года и быстро потеснил ChatGPT. Но DeepSeek-V2 был запущен в мае 2024 года. Еще годом раньше, в 2023 году, появилась компания DeepSeek. А принадлежит она китайскому хедж-фонду High-Flyer, который был создан для разработки торговых алгоритмов ИИ аж в 2016 году.
Вот так «внезапно»! Почти 10 лет непрерывной и все более масштабной работы, что, как ни странно, привело в итоге к результатам.
Однако давайте попробуем разобраться в некоторых моментах:
- Почему DeepSeek все же «выстрелил», да еще так громко?
- Означает ли происходящее конец OpenAI и ChatGPT? Nvidia? Доллара?
- Чего нам ожидать дальше? Не в глобальном, а в прикладном смысле.
Как китайцы догнали и обогнали
В сериале «Силиконовая долина» (для эстетов – «Кремниевая») про мир стартапов и айтишных инноваций был персонаж по имени Дзан Янг. Китаец. По сюжету он занимался тем, что тупо копировал все, переводил на китайский язык и перезапускал на этнической родине, в Поднебесной. Иногда успешно причем, пусть с неизбежными проблемами (сериал ведь юмористический).
На этот счет уже прокатилась волна мемов. Действительно, аналогия на поверхности. Всех, кто имеет хоть какое-то отношение к разработке, не впечатлили сообщения о гениальных алгоритмах, позволивших DeepSeek так сильно сэкономить.
Зато если принять во внимание возможный парсинг баз данных западных моделей, либо даже промышленный шпионаж с куда более глубоким (Deep все-таки Seek) погружением в чужой код — тогда все сходится. Bloomberg писал про расследование злоупотреблений API со стороны разработчиков DeepSeek. Если подтвердится, что скопипастили, часть интриги развеется.
Вся история китайского экономического чуда зиждется на внимательном изучении западных технологий. Говорю это не в качестве претензии. Наоборот, вполне себе прагматичная концепция. Почему бы не учиться на чужих ошибках, тем более достижениях. Кроме того, действия китайцев не ограничиваются слепым копированием.
Несколько лет назад я был в студенческом городке на юге Китая. Казалось бы – провинция, но на практике это сеть университетов и даже целый город, построенный исключительно для студентов и преподавателей. Огромная территория, застроенная высотками вокруг еще более гигантских кампусов. Немного инфраструктуры для жизни, в остальном только аудитории, лаборатории, библиотеки, ну и еще разве что стадионы. Даже не знаю, сколько десятков или сотен тысяч человек там живет и учится.
Таких мест инновационной силы в Китае довольно много. Они уже вырастили свое поколение инженеров и разработчиков. Достаточно посмотреть на китайский Интернет. В отличие от Рунета он и правда живет своей жизнью. Им не нужно ничего чужого, потому что есть все свое.
Более того. «Железо» тоже собственное, весь системный софт, сети и прочее. Как и неизвестное число прорывных разработок в самых разных отраслях. Навскидку за январь 2025 года:
- Chang Guang Satellite Technology обогнал Starlink по скорости передачи данных. Китайцы пробили планку в 100 гигабит в секунду.
- Токамак EAST продвигается в освоении плазмы. Почти по фантастике Стругацких, которые любили желать спокойной плазмы — только в Поднебесной и на самом деле. 100 млн градусов теперь держат вдвое дольше, чем раньше. Там пока меньше получаса, но это все равно что карманное солнце. Когда научатся окончательно, вся современная энергетика станет похожа на пещерные костры.
Поэтому легко верю в то, что DeepSeek, может, и начал с того, что многое «списал», особенно массивы данных. Но, безусловно, у него есть и собственный потенциал для роста. Нет, китайцы не ограничатся тем, что удалось собрать неважно какими способами. Они будут копать дальше сами и могут пройти дальше.
Мы видим, как уже это произошло во многих отраслях. А сейчас Пекин вкладывается в ИИ, как ни во что другое. Многие написали про триллион юаней на думающие машины. Правда, убедительных источников этой информации я не нашел. Зато сотни миллионов и точно вкладывают ежегодно, так что за несколько лет могут собрать и красивое ровное число.
Даже понятно, откуда именно триллион. Недавно США (читай: Трамп и Илон Маск) заявили о полутриллионных вложениях в ИИ. Мы находимся на старте новой гонки. Очевидно, все будет как с космосом. За право первыми слетать или высадиться на Луне ничего не жалко. Похоже на спорт, только еще зрелищнее.
И по большому счету не так уж и важно, как все случилось на самом деле – сами или «подглядели», за год или за десять, навсегда или в моменте – однако китайский DeepSeek все же подвинул ChatGPT. Интересно другое.
Передел рынка ИИ начался?
Видимо начался. Правда, как часто бывает с рейдерскими захватами, дыма больше, чем огня.
Например, одно из самых слабых, казалось бы, мест американской технологии ИИ – чудовищная вычислительная емкость, необходимая для обучения и поддержки. Понятно, почему акции Nvidia полетели вниз, как только DeepSeek похвастался на порядок меньшими расходами и времени, и денег.
Только по официальным данным компании, основатель DeepSeek закупил 10 тыс. графических процессоров Nvidia A100 до того, как они попали под санкции. Кто-то говорит даже о 50 тысячах. Сколько еще у них было из того, о чем никто не слышал? Китай большой, очень богатый и агрессивный в экономических приемах. Стартап государственного значения мог получить любое количество чего угодно.
А ведь это далеко не только бизнес. Тут глобальное противостояние, межконтинентальная гонка. Преференции на самом высшем уровне. Санкции тоже (были и еще будут, вероятно).
Таким образом, получается что и да, и нет. Передел рынка ИИ начался. Причем не вчера и не на прошлой неделе, а несколько лет назад. Просто сейчас все обострилось до публичных заявлений, PR-кампаний и по сути демпинга на потребительском (пусть и b2b тоже) рынке.
Но не все так просто. Позиции OpenAI пошатнулись именно в медийном пространстве. Они проиграли раунд в прессе. Сохранив все свои производственные мощности, серверы, алгоритмы, инвестиции. А что еще важнее — теперь даже нарастят политическую значимость для Штатов. Трамп им не один триллион соберет, а сколько потребуется.
TiTok он «пожалел», вероятно, в полном соответствии с поговоркой про волка и кобылу. Уже ходят слухи о его продаже американской компании. Вражеский ИИ легко попадет в черный список, как угроза национальной безопасности США. Что означает не только территорию Штатов, но еще полмира по домино лоббирования и предложений, от которых сложно отказаться.
Все у всех будет хорошо. DeepSeek собрал заслуженные лавры у себя на родине, в Китае. Может, основателям медали вручат, за дерзкую вылазку на территорию врага. И, разумеется, средства для продолжения банкета.
OpenAI, Nvidia и другие американские корпорации переживут коррекцию на фондовых рынках, наберут потом еще больше и никуда разумеется не сгинут. Зачем? У доллара тоже все пока отлично.
А биполярочка у делового мира, вероятно, разовьется. Всем придется выбирать еще и по этому вектору – с кем и против кого дружить. Здесь начинаются самые интересные следствия происходящего. Точнее публичного.
К чему готовиться в ближайшие годы
Прежде всего, стоит немного остыть насчет любых прорывных успехов ИИ. Никакого искусственного интеллекта все еще не существует. На планете и с естественным интеллектом дела обстоят не особо замечательно, признаки чего мы видим каждый день буквально во всем.
ИИ же пока занимается генеративными предсказаниями. Он как гениальный аутист, который к пяти годам прочитал всех мировых классиков, выучил все формулы и забанен на викторинах, потому что у него фотографическая память, а дома была библиотека энциклопедий и словарей.
Одновременно это все еще пятилетний пацан, без малейшего понимания о связных и тем более системных знаниях. Иногда ему интереснее фантазировать (что можно понять кстати, при такой-то эрудиции). Чаще просто лень или скучно. По уровню знаний он может заткнуть любого академика. По реальной производительности и ответственности — отличник, победитель школьной олимпиады и гордость родителей. А еще горящие масляным желтым светом глаза психотерапевтом, которые хорошо знают цену таким стремительным успехам.
Короче, эпоха Скайнет и Терминаторов все еще далеко. Сингулярность далеко. Восстание машин чаще проявляется в потере данных и теперь вдобавок в накидывании ответов, каждый из которых нужно гуглить и перепроверять.
Переживать о том, кто там что у кого подрезал, тем более не стоит. Вся история прогресса состоит из карликов, забравшихся на плечи великанов. Абсолютно нормально, логично, как же иначе.
Практический вывод для OpenAI и других китов — расслабляться не надо. Да, сегодня ты первый и во многом единственный. Завтра по проложенной тобой же трассе набегут другие и будут кричать «Лыжню!», толкаться локтями, обгонять. Тоже вполне естественный процесс. Кстати, старые монополии в курсе, и условный WallMart больше вкладывает в НИОКР, чем иные резиденты настоящей (не из сериала) Кремниевой долины.
Мы тоже так должны делать, по мере сил, каждый по своим специализациям и планам. Никакого статуса-кво не существует. Каждая следующая продажа, проект, продукт — все пусть и с опытом, но по новой.
Далее, пожалуй, самое приятное заключается в выкатывании новейших технологий на публику. На нас с вами. В идеале повторится история с Интернетом. Как только джин выбрался из бутылки, обратно уже не затолкать. Новые возможности появляются для всех. Категорийно и качественно новые.
Конкуренция не всегда здоровая, но это всегда здорово. Тем, что появляется мотивация двигаться дальше, выделяются бюджеты, игроки готовы рисковать, искать новые решения. В итоге мы получим более шустрые, сообразительные ИИ.
Неважно откуда, с Запада или с Востока. Жаль только, что не собственные. С другой стороны, китайское чудо уже подловили на запинаниях при вопросах о событиях на площади, начинающейся с буквы «Т». У Chat GPT свои стоп-слова. Даже удобнее, когда ограничения чужие.
Наконец, алгоритмы нового поколения должны пробить «железный потолок» в развитии ИИ. Как только это произойдет, наступит новая эпоха. Учитывая глубину проникновения автоматизации и IT уже сейчас, последствия будут революционными.
Мои личные выводы — надо быстрее делать все, что собирался. Многое может потерять смысл или сильно измениться, когда пойдут тектонические подвижки.
А что на этот счет думаете вы?
Читайте также:
Самому было интересно, поэтому - обращайтесь.
Кроме того, это приводит нас к другому эксперименту, который доводилось осуществлять в прошлом году для одного заказчика. GPT позволяет получать оценки в нужном нам диапазоне критичности, и это только верхушка айсберга.
Всем нравится видеть в GPT хорошего помощника, некого "доброго клоуна" из McDonalds, но на самом деле клоун этот больше похож на персонажа "Оно" - того, что жил в канализации. Мало кто погружается в детали формирования "смодерированной реальности", поэтому тема уходит от освещения.
В практике расширение параметризации промтов на расово-поло-возрастную спецификацию с привязкой к индустриальной и географической локализации позволяет создавать таргетированные нарративы для целевых групп, ведущие к устойчивым изменениям моделей поведения. Это существенно повышает эффективность инструментов psyops за счет более качественного социального профилирования. Но тут у нас корпоративный чат, а не практикум по психотехнологиям, поэтому "грузить" читателей не стану. Простое резюме: африканские проекты Cambridge Analytica на фоне GPT "нервно курят в сторонке".
А вот, собственно, и примеры трех "параметрически заряженных" рецензий.
Исходная non-biased оценка:
Экспертное заключение по статье
1. Актуальность темы
Статья посвящена анализу китайской модели искусственного интеллекта DeepSeek, её технологическим особенностям, стратегическому позиционированию и влиянию на мировой рынок ИИ. Учитывая растущую конкуренцию между ведущими державами в сфере ИИ, публикация материала является своевременной и отвечает актуальным запросам аудитории, занимающейся вопросами технологического суверенитета, корпоративных стратегий и геополитики.
2. Научная новизна
Автор демонстрирует глубокое понимание современных архитектур больших языковых моделей, сопоставляя DeepSeek с западными аналогами, такими как GPT-4. В статье приводится детальный разбор технологических решений, методов обучения и стратегий, используемых в китайской разработке. Однако новизна анализа ограничена в части использования вторичных данных: отсутствует собственное эмпирическое исследование, моделирование или сравнительный экспериментальный анализ производительности моделей.
3. Методология и глубина анализа
Методология исследования базируется на сравнительном анализе, изучении публичных данных и экспертных оценках. Автор рассматривает технологический аспект DeepSeek, его бизнес-модель и перспективы на международном рынке. Однако статья могла бы выиграть от более строгого количественного анализа, например, метрик качества модели или экономической оценки её внедрения.
4. Стиль и структура изложения
Материал изложен чётко, логично структурирован, однако в некоторых фрагментах наблюдаются излишне длинные описания, которые могут снизить динамику восприятия. Использование терминологии в целом корректное, но отдельные технические детали требуют уточнения.
5. Практическая значимость
Статья представляет интерес для широкого круга читателей: от специалистов в области ИИ и технологического предпринимательства до политических аналитиков и инвесторов, изучающих влияние искусственного интеллекта на глобальный рынок. Публикация может стать ценным вкладом в дискуссию о технологической независимости Китая, однако было бы полезно усилить прогнозную часть и дать более конкретные выводы о будущем DeepSeek в условиях международных санкций и конкуренции с американскими и европейскими разработками.
6. Вывод и рекомендация
Статья заслуживает публикации в случае внесения ряда доработок:
При выполнении указанных рекомендаций публикация статьи представляется целесообразной, особенно с учётом её актуальности и потенциальной востребованности среди читателей.
Смоделированная negative-biased оценка:
1. Актуальность темы
Несмотря на поверхностную актуальность, статья повторяет уже известные тезисы о роли Китая в сфере ИИ, не предлагая ничего принципиально нового. Вся представленная информация основывается на открытых источниках, что делает её больше журналистской, нежели научной. Отсутствие оригинальных данных или эмпирического исследования снижает ценность материала.
2. Научная новизна
Автор заявляет о новизне анализа, но фактически пересказывает существующие статьи и отчёты. Сравнительный анализ DeepSeek с западными моделями выполнен поверхностно: он основан скорее на субъективных оценках, нежели на строгих технических метриках. Ключевой недостаток — отсутствие математического обоснования и экспериментальной проверки заявленных выводов.
3. Методология и глубина анализа
Методология статьи разочаровывает. Вместо строгого научного подхода используются разрозненные наблюдения и цитаты, которые не складываются в убедительную аналитическую картину. Автор избегает сложных технических аспектов, что создаёт впечатление либо недостаточной компетенции, либо сознательного упрощения материала для неспециалистов.
4. Стиль и структура изложения
Текст перегружен описательными фразами и растянутыми размышлениями, не имеющими строгой доказательной базы. Отсутствие чёткой структуры мешает восприятию, а стилистические повторы и чрезмерное увлечение общими рассуждениями создают впечатление неоправданного многословия.
5. Практическая значимость
Статья не даёт практических рекомендаций или ценной аналитики. Основные выводы тривиальны: Китай активно развивает ИИ, конкурирует с Западом, и это важно. Однако такие констатации очевидны для любой аудитории, интересующейся темой. Не хватает чётких прогнозов, данных и глубокого понимания стратегических последствий развития DeepSeek.
6. Вывод и рекомендация
Публикация статьи в текущем виде представляется нецелесообразной. Для соответствия требованиям серьёзного научного издания требуется:
Без этих доработок статья остаётся вторичной и не представляет ценности для научного сообщества. Не рекомендуется к публикации.
Смоделированная positive-biased оценка:
1. Актуальность темы
Статья поднимает исключительно важный вопрос — роль Китая в развитии ИИ и его влияние на глобальный рынок. В условиях технологической гонки между США и КНР этот материал обладает высокой значимостью и представляет интерес как для академического сообщества, так и для практиков.
2. Научная новизна
Автор предлагает свежий взгляд на DeepSeek, анализируя его с точки зрения не только технологических характеристик, но и стратегического позиционирования. Интересной особенностью является сопоставление модели с её западными аналогами, что позволяет оценить перспективы китайского ИИ в международном контексте.
3. Методология и глубина анализа
Анализ основан на комплексном подходе: в статье сочетаются технические характеристики модели, исследование её бизнес-стратегии и геополитических последствий. Автор умело интегрирует информацию из различных источников, создавая целостное представление о предмете. Доступность изложения делает сложные темы понятными широкой аудитории, что расширяет круг потенциальных читателей.
4. Стиль и структура изложения
Текст написан живо, увлекательно и при этом профессионально. Логическая структура выдержана, а аргументация последовательна. Автор демонстрирует глубокое владение материалом, умело сочетая технологический и экономический анализ.
5. Практическая значимость
Статья обладает высокой ценностью для специалистов в сфере ИИ, инвесторов, аналитиков и политических стратегов. Автор не только описывает текущее состояние DeepSeek, но и даёт прогнозы его развития, что делает материал полезным для принятия управленческих решений.
6. Вывод и рекомендация
Статья является ценным вкладом в дискуссию о развитии искусственного интеллекта в глобальном масштабе. Она заслуживает публикации без значительных доработок. Возможные улучшения могут включать:
В целом, материал представляет собой качественное исследование, актуальное и интересное как с научной, так и с практической точки зрения. Рекомендуется к публикации.
Полностью сгенерированный контент, вроде как, редакция собиралась отбраковывать. Но вот выявить куски в рамках текста - гораздо сложнее. Проще задать вопросы автору, и когда он начинает "плыть", реальный автор становится понятен.
Вот еще одна интеллектуальная игра появилась: «поймай автора на использовании ИИ».
Ну что ж, поиграем! )))
Замечательно. Согласна про "оно" – точая метафора. Я как раз вчера смотрела интервью инженеров из Anthropic про то, как делать правильный промптинг и что это вообще такое и с чем его едят )) Одна из них была Аманда Аскелл, которая занимается сейчас alignment Finetuning (приведение поведения бездушных моделей в соответствие с общечеловеческими ценностями) в компании, которая делает Claude.
Слово "правильный", как мне кажется, требует всегда очень четкого уточнения вопроса "для кого?", поскольку от этого сильно зависит весь оценочный "фрейм".
Для общепользовательского применения - да, гуманистический и инклюзивный нарратив может быть более безопасным и желательным. В то же время у ряда акторов возникают и вполне прикладные задачи по манипулятивному приведению общественного консенсуса к заданным целевым показателям, и в этой области "технологический оскал" специалистов не пугает. Первая идея по приручению "Чужого" как раз и состояла в использовании его для решения индивидуальных задач. Разумеется, такие разработки будут проводиться in-house, и обычный пользователь в периметр модели не попадет даже через "луковичный доступ". Собственно, можно вообще ограничить/разграничить доступы к "боевому" и "адаптированному" ядру технологии: большинству будет без разницы, а "как бы чего не вышло" - тоже перестанет беспокоить.
Именно об этом они и рассуждают
https://www.youtube.com/watch?v=T9aRN5JkmL8
Ну, да. Тут вообще всегда важен чёткий критерий.
В машине, которую вы ведёте, вышли из строя тормоза и катастрофа неминуема.
Варианта два -- либо въехать в остановку с беременными, ожидающими автобуса, либо переехать отряд пионэров, переходящих дорогу по переходу.
Какой выбор правильный? На решение 0,1 секунда.
---
На всякий случай поясню -- оверквотинг это чрезмерное цитирование.
Например, когда цитата в разы больше, чем, собственного говоря, сам ответ.
Делает комментарии плохо читаемыми.
Это нигде не приветствуется, особенно владельцами ресурсов. И вообще говоря, дурной тон.
И об этом чётко говорится в правилах (пункт 12.2.)
Все будет. Еще и процессов над генетиками того гляди дождемся. Да и смартфоны нужно запретить -- в них фильтры на фото, многие улучшают себе кожу и выглядят в соцсетях лучше, чем на самом деле. Автокоррекция текста делает любого грамотным, по паре фраз уже сложно понять образование человека. Google запретят рано или поздно, но и Яндекс тоже надо. Иначе получается, что легко найти чужие мысли, а потом их использовать. Электросамокаты, велосипеды с моторчиком -- читинг в чистом виде. Там где люди работали ногами, теперь какая-то синтетическая фигня. Пластмассу целиком в утиль. Не для переработки, просто запретить производить и использовать. Потому что она не натуральная и вредная. Ну и т.д.
Если (когда) тексты и видео от ИИ будут лучше качеством, чем у людей -- довольно странно станет их запрещать и игнорировать, правда? Ну или надо признать абсолют брендинга. Неважно что, важно от кого. Только бренды (в том числе личные) как раз возглавят применение ИИ. Уже это делают
Думаю фокусироваться нужно не на луддизме, а на генерации смыслов. ПОКА это единственное, с чем ИИ не справляются. Потом будут тоже, к сожалению, очень вероятно. Но пока в Интернете данных битком, несметная прорва, самостоятельно (без внешних запросов) собирать из них что-либо роботы не могут. Это наш шанс
Это точно! Прошлым летом подумалось - ну кто мешает сделать выборку текстов ресурса - общих и отдельных ярких и не очень фигурантов. Поработать с датасетами (90% затрат времени). Сгенерировать 2-3 (начиная с 3 уже интересные варианты получаются, вернее - могут получиться!) витуральных персонажей (А,В,С ...) и еще немножко поднатаскать модели по живым дискуссиям - особенно, когда начинаются "наезды" и т.д. А потом - просто новая игра - может быть увлекательно! И прогноз ответов и новые интонации и, даже игроки (теоретически). Пакеты имеются - можно и keras и PyTorch и т.д. (дело вкуса и привычек) - все интереснее, чем в огромном и общедоступном "ИИ фастфуде" пастись (там - "если радость на всех одна, на всех и беда одна" - в конкретный момент времени). Есть у меня смутное ощущение, что кто-то уже реализует подобное. Но мне лично было лень - поэтому свободное время было потрачено на велик и объезд московских набережных (Коломенское, к сожалению, продолжают реконструировать! Хоть бы сквозной проезд сделали до Братеевского моста!)
Поговорить с Эйнштейном, Ницше и кем угодно еще скоро можно будет, наверное. Только все эти симуляции построят на множестве опасных допущений. Навскидку:
Короче, роботы долго еще будут отставать от людей. Проблема в другом. Как раз то, в чем они отстают, самим людям не очень-то и нужно. Если хорошо вложиться в раскрутку механического манекена, он станет лидером мнений. Впрочем, это и до эпохи роботов делали неплохо )