Заметьте, как много технологических новостей в последнее время начинаются со слов «ИИ научился». Если так пойдет и дальше, скоро событием будет «ИИ до сих пор чему-то не научился».
Однако мы пока что находимся по эту сторону сингулярности. Одна из вех по пути к полной и безоговорочной автоматизации сейчас заключается в переводе видео. Речь о сервисе HeyGen, который не просто «на лету» переводит слова героя на различные языки, сохраняя тембр голоса, но и модифицирует мимику.
Практически в один клик можно получить ролик, полностью готовый к показам в других странах. Отпадает надобность не только в переводчиках, но и в специалистах по озвучке, кастингу и утверждению «местных голосов», юристах для оформления этих официальных локализаций. Ну и заодно весь постпродакшен может выдохнуть по поводу монтажа, сведения звуковых дорожек, камуфлирования не совсем удачных эпизодов с рассинхроном речи и движения губ.
В отличие от дипфейков здесь изначально легальная история. Не нужно опасаться подделок, просто все станет понятнее. Наконец-то Интернет станет по настоящему глобальным? Все смогут обращаться ко всем сразу, и пусть справедливые рейтинги покажут сильнейших!
Пожалуй, тут есть несколько нюансов. Рассмотрим два основных ракурса — бизнесовый и блогерский.
Что если каждый бизнес станет полиглотом
Конечно, есть большое количество компаний и отраслей, которым экспорт и даже соседние регионы не очень интересны. Никакие чудеса с переводами не превратят местечковый шиномонтаж или чебуречную в ТНК с представительствами в Токио, Дубае и Нью-Йорке.
Тем не менее желающих расширить продажи и географию присутствия довольно много. Языковой барьер служит серьезным ограничением. Точнее, служил.
Международная переписка и так давно уже идет при активном участии Google.Translate, Deepl, других онлайн-сервисов. Глобализм шагает по планете, используя окошки автопереводчиков.
Только раньше было относительно легко обслуживать оформление уже заключенных сделок. Реклама, PR, переговоры, продажи — все требует принципиально иного уровня погружения в местные реалии.
И здесь начинаются (а вернее продолжаются) проблемы. Вроде поребриков и парадных в Питере, «обуток» на Алтае, «завертона» в Хабаровске. Теоретически, нейросети могут постепенно изучить все эти словечки, сленг, оговорки, окание и прочее.
Однако для бесшовной локализации мало словарей. Помните, как мучились герои фильма «Трудности перевода» с Биллом Мюрреем? В других местах все чужое, не только язык. Для качественного погружения необходимо гораздо больше слов учитывать:
- Национальный контекст.
- Местные табу, особенно негласные ограничения и запреты.
- Шутки юмора с учетом понятных отсылок, аллюзий.
Другими словами, сойти за своего еще долго не получится. Что, безусловно, не помешает брендам панибратски похлопывать по плечу целые народы, пытаясь с помощью ИИ выглядеть органично.
И, вероятно, еще сильнее станет централизация управления рекламными компаниями в крупных сетевых корпорациях. Они и раньше пытались до сантиметра контролировать все телодвижения в регионах по своим штабс-квартирным нормативам. После появления автоматического перевода видео почти не останется поводов слушать сиволапых местных менеджеров. Им все подготовят и поставят, снабдив цитатой из анекдота про космонавта: «Покорми собак и ничего не трогай».
Таким образом, вместо приближения к далеким городам и селам в реальности может произойти наоборот еще большее дистанцирование. Что уже давно видно по ТВ-вещанию.
И все же с учетом неизбежных перегибов автопереводы видео сильно упростят коммуникации с целевой аудиторией на разных, в перспективе любых рынках. Прежде всего снизится стоимость MVP, пробных продуктов и проектов. К уже существующим инструментам для построения онлайн-компаний «на коленке» добавится способ рекламировать ее где угодно — и тоже почти даром.
Впрочем, не нужно путать автоматизацию с демпингом.
Цена вопроса
Сейчас на сайте HeyGen представлено 4 тарифных плана, в диапазоне от бесплатного ролика до «давайте обсудим» для крупных брендов.
Пока идет первоначальный набор известности, «вирусный» бум интереса и ничего еще не отработано. Рано делать какие-либо выводы, тем более насчет стоимости сервиса. Скорее всего, его владельцы еще сами не знают, сколько и с кого просить денег.
Но уже сейчас есть несколько любопытных маркеров, которые дают повод обсудить вероятные тренды. Например:
- Бесплатна всего 1 минута пробного ролика. Критично мало, чтобы разобраться в том, как технология работает или нет. Кроме того, у нее пока много ограничений, о чем поговорим чуть позже. В любом случае, дверка едва приоткрыта.
- Чем больше объем роликов, тем они… дороже. При оплате за год на тарифе «Бизнес» минута обработки стоит $2,4. А на тарифе попроще под названием «Криэйтор» (привет Пелевину) — минута всего $1,6. Как так? Выходит, оптовые сделки обойдутся клиентам дороже!
Пока идет рекламная раскрутка сервиса, ему невыгодны заказы. Наоборот, владельцы хотели бы ограничиться «пробниками», они не готовы к широкомасштабной деятельности.
Конечно, по сравнению с нормальными бюджетами на переозвучку видео все это копейки. Однако судя по всему, ничего полностью бесплатного тут не ожидается.
Значит, тотальной массовости не будет?
Блогеры мирового масштаба
Широкие массы скучающей публики получат доступные приложения для генерации и обмена видеомемами. До полноценных аватаров в киношном понимании не дотягивает, но оно особо и не нужно. Идея метаверс как раз в том, чтобы каждый сидел в небольшом пузыре, отыгрывал массовку и тешил себя иллюзорными возможностями.
Сервис с видеополиглотами прекрасно впишется в такую картину виртуального мира. Ведь, по сути, это кратное повышение ставок… без каких-либо вообще изменений.
У нас и так уже есть доступ всех ко всем. При некоторой настойчивости можно было и 10 или 20 лет назад «масштабироваться на планету». Только почти ни у кого не получилось. Кроме звезд мирового масштаба, которые могут не подозревать о своей известности в какой-то глухомани. Все они прекрасно обошлись без автопереводов.
Остальным не светит, к сожалению. Потому что расширение инструментария никак не решает вопросы:
- со смыслами,
- попаданием в «боли» и интересы аудитории,
- медийной мощностью,
- способностью генерировать контент, будто машина, равномерно и всегда, да еще с узнаваемым фирменным качеством.
Инфлюенсеры конечно попытаются использовать ИИ для вещания на разных языках. Но существенной разницы с уже доступными сервисами это наверное не составит.
Зато можно ожидать еще большего «размытия копирайта», как это уже произошло с текстами, мемами. Потом с легкой семипалой руки нейронок дошло до графики и дизайна. Теперь в очереди на убой озвучка и видеомонтаж.
Генерировать контент становится слишком просто, его становится все больше. Следить за сотнями и тысячами авторов ни у кого нет ни желания, ни времени. Подавляющее большинство роликов в лучшем случае просто посмотрят. Как обычно, в лентах и практически анонимно. Все идеи многократно копируются, переснимаются. Часто тупо перезаливают чужой контент со своего аккаунта. Потом еще много раз репостят.
В этом беспощадном месиве выживут только селебрити. Вот у них все будет еще лучше. Монополизация трафика и известности усилится.
Свет мой зеркальце, скажи
Помните, как легко Mr. Beast вышел на новую для себя площадку – Threads? Он набрал миллион подписчиков, обогнав даже основателя. Потому что уже раскрученный медийный маховик превосходно масштабируется.
Кстати, у таких ребят как Mr. Beast и раньше не было проблем с языками. На YouTube все переведено, в том числе на русский. Ему даже нейросети не нужны.
Зато возможно они пригодятся коллегам по цеху, то есть другим нейросетям. Есть ведь еще одно направление медийной автоматизации — виртуальные селебрити. Их уже достаточно много. Ведущие новостей и шоу, модели. Пара примеров:
- Синь Сяомэн, ведущая цифровых новостей в Китае.
- Мила София, по легенде 19-летняя девушка из Хельсинки.
И кстати у еще толком не оперившегося сервиса HeyGen в числе заявленного функционала тоже есть аватары. Правда, это визуализация для бедных, с рок-звездой не перепутаешь. Но, возможно, доработают, а, главное, созданием виртуальных образов занимаются другие кудесники.
Все тренды массового ИИ ведут примерно в одну и ту же точку. Будет происходить монополизация, тем более жесткая, что владение ноу-хау сосредоточится у нескольких крупных корпораций. Все остальные получат сначала бесплатный, потом платный доступ. Или ограничение в доступе и блокировки, по необходимости.
У ботаников от АйТи появится еще один рычаг для управления миром. Картинки виртуальные, влияние самое что ни на есть реальное.
Резюме
Сейчас технология переводов в один клик только зарождается. Она еще несовершенна. Требует одного персонажа в кадре, взгляд в камеру, речь строго на одном языке англицизмами не побалуешься. Нужно следить даже за тем, чтобы рядом не оказалось портрета или статуи, а то они могут «заговорить».
Нашумевшие шедевры вроде испанской версии «Людк, а Людк» из кинофильма «Любовь и голуби» пока создаются вручную. Для ИИ в такой короткометражке слишком много отвлекающих факторов.
Разумеется, технологию отладят. В самом ближайшем будущем можно будет забыть про субтитры и наслаждаться идеальной синхронизацией озвучки чего угодно на любом языке мира. Таким образом будет забит еще один гвоздь в без того старый гроб эсперанто (универсального языка для всех стран мира).
Крупный бизнес и селебрити начнут вещать на всех ключевых языках планеты, причем обходиться им это будет недорого.
Простые пользователи смогут развлекаться еще одним способом. Как обычно, даже один клик окажется недостижимо напряжным для большинства, и поток переводных роликов будет производиться не очень большим числом активных энтузиастов.
Мелкие предприниматели будут клепать MVP на языках желаемых спонсоров, и спамить их концептами своих гениальных проектов. Все это барахло пойдет прямиком в электронные корзины, ну разве что роботы проиндексируют. Клянчить деньги нужно лично.
А на наших экранах появится еще больше видеоконтента. Но мы этого не заметим, потому что в сутках всего 24 часа и приходится отвлекаться на семью, работу, сон.
«Скрипач не нужен», нужны КЦ и гравицапа. Спички делать научились, а вот действительно прорывных инноваций пока мало. Разве что для шоу-бизнеса. Значит, сон разума продолжится, с логичными последствиями.
Читайте также:
"Chat" в "ChatGPT" указывает, что эта технология про письменный текст. Так что нет, модель, которая работает с видео - не новый ChatGPT. Ну или в кавычки его возьмите, если это слово стало очередным "Ксероксом".
"Скрипач не нужен" - вот эта нейросеть скоро умрет ИМХО. При мощности современных процессоров и видеокарт уже ничто не мещает поместить ее аналог как опцию в любой пакет для видеомонтажа как платный так и опенсорс. Все - точка, так что вкладываться в эту бизнес-идею уже не имеет смысла. Завтра все будет на ПК любого блогера.
На уровне Люськ, а, Люськ - норм, чо)))) Хотя и тут голоса перевраны ) Пора диссертации писать - Мы начали с резиновых женщин, к чему мы придем к 2050.