“Болтун хуже вора”

Почему на самом деле отключили Балабобу?

В марте этого года Яндекс отключил генератор текстов Балабоба, аргументировав это тем, что на данный момент нет возможности корректно выстраивать работу сервиса. Не получив более никаких расшифровок, пользователи интерпретировали ответ так – “Вероятно, из-за того что сервера компании находятся на территории “недружественных стран”, сервис временно испытывает технические трудности”.

Однако в июне Яндекс презентует в открытом доступе глобальную языковую модель* из 100 млрд параметров – YaLM 100B, на основе которой и существовал Балабоба, как и более 20 других проектов Яндекса. Генератор текстов по факту являлся демо-версией возможностей нейросетей YaLM, хотя и успел полюбиться за время своего существования креаторам и контент-мейкерам – дружелюбный сервис подкидывал свежие идеи на брейнстормах русскоязычных рекламных агентств, причем делал это с юмором. Так, может быть, просто время демонстрации закончилось – всем, кому было необходимо, компания наглядно показала свой потенциал в разработке сложных нейросетей, получила достаточный охват, и Балабоба стал ненужен? Если так, то я определенно буду скучать по этому веселому и трудолюбивому роботу.

И всё же есть еще одна догадка, которую сложно игнорировать, её наглядно иллюстрирует пример языковой модели GPT-3 от OpenAI Илона Маска, которая уже обрела славу “генератора фейков”, “лучшего лжеца в интернете” и “самого опасного ИИ”. Дело в том, что возможности языковой модели применялись компанией для ведения проектов в социальных сетях**, зачастую просто развлекательных, но наивность и доверчивость пользователя сложно недооценить – посты с пометкой “fake” многими воспринимались за чистую монету.

Согласитесь, в определенное время и в определенном укладе случайно сгенерированные твиты на тему политики, религии или расизма могут быть совсем некстати. А Балабола, кстати, тоже успел “пошалить”, генерируя для СМИ заявления от лица реальных влиятельных лиц. Так для РБК он выдал предсказания от якобы Павла Дурова о падении рынка криптовалют, Нассима Талеба о мировом финансовом кризисе, а Илона Маска о конце света. Пока все предыдущие “предсказания” сбываются, что же должен подумать доверчивый обыватель о последнем? “Так давайте помолимся?”***

Впрочем, если мы всерьез рассматриваем гипотезу о том, что Балаболу просто снова “попросили помолчать”****, тем более странным кажется выкат YaLM 100B в открытый доступ. На что способны дезинформаторы, вооруженные нейросетями, способными подделывать стилистические особенности конкретных авторов, убедительно и правдоподобно обосновывать ложные утверждения, и что из этого получится, если совместить это с системой дипфейк? Возможно ли, что разработчики сложили с себя таким образом юридическую ответственность и посчитали, что этого достаточно?

Генеральный директор Яндекс Технологий Петр Попов объяснил открытие лицензии YaLM возможностью дальнейшего развития генеративных нейросетей за счет ее доступности для всего сообщества разработчиков, а не только тесного круга IT-гигантов. Остается надеяться, что это безусловно знаменательное событие для российской IT-среды послужит на благо прогресса, и разработчики позаботились о том, чтобы минимизировать негативные перспективы использования своих нейросетей.

Сноски:

*YaLM (Yet another Language Model) 100B является языковой GPT-подобной моделью. Это значит, что в её основе, как и у остальных GPT (Generative Pre-trained Transformer), лежит трансформер – архитектура глубоких нейронных сетей, представленная в 2017 году Google Brain. Трансформеры не требуют обработки последовательностей по порядку, что делает их эффективнее своих предшественников в обучении и генерации текста. В 2020 также Sber Devices представил свою вариацию генеративной нейросети на основе GPT-3.

** Ощутимый резонанс в этом контексте произвел фейковую сенсацию: “Россия объявила войну Соединенным Штатам после того, как Дональд Трамп случайно выпустил ракету в воздух. Россия заявила, что “определила траекторию ракеты и примет необходимые меры для обеспечения безопасности населения России и стратегических ядерных сил страны”. Белый дом заявил, что “крайне обеспокоен нарушением Россией” договора о запрете баллистических ракет средней дальности.У США и России непростые отношения с 2014 года, когда Москва аннексировала украинский Крым и поддержала сепаратистов на востоке Украины”.

*** Фейковое предсказание Илона Маска на “РБК Тренды” заканчивалось именно так: “Да. Конец близок. Давайте помолимся”.

**** Ранее сервис уже приостанавливал свою работу, только в то время был известен под названием “Зелибоба” – в честь персонажа передачи “Улица Сезам”. Спустя время сервис вернулся уже под именем “Балабоба”, и оно ему определенно идет.

Автор – Мария Храмова, “M” из “M&G”