Как большие языковые модели ИИ меняют коммуникацию
Почему исследователи ИИ уходят в стартапы
Академическая среда сильно уступает стартапам по скорости. Прежде чем получить признание в качестве учёного, специалист долго пишет статьи и отчёты, медленно продвигается в получении грантов и выполняет множество другой работы, результаты которой неочевидны. «В стартапе это происходит в разы быстрее», — признаётся Григорий Сапунов, основатель стартапа Intento, который занимается машинным переводом.
Развитие компьютерных наук и ИИ происходит стремительнее — делать открытия в этих сферах проще. Иногда в стартап переходят целые лаборатории, потому что университет не может предложить того, что может предложить индустрия.
Компании, работающие с LLM, тратят миллиарды на исследования — и при должном старании и опыте получают ощутимую отдачу. Благодаря большим языковым моделям академическая наука тоже может участвовать в гонке за открытиями и прорывами. Хотя это рискованный шаг: из LLM можно извлечь большую выгоду, но не факт, что она будет долговременной.
LLM и секретность: как компании прячут свои модели
К сожалению, многие компании, занимающиеся ИИ, перешли к закрытости, и получать их данные стало значительно труднее. Существуют публикации и open source-модели — например, DeepSeek, — но они предоставляют крайне мало информации о внутреннем устройстве ИИ.
Открытость может касаться весов или датасетов, иногда доступен код обучения, а иногда — ничего из этого. Большая редкость, когда компании делают «закулисную» работу ИИ полностью прозрачной.
В кейсе твиттеровского Grok была опубликована на всеобщее обозрение только первая версия модели — лишь файл с весами, без внятного описания. Такой шаг со стороны разработчиков легко объясним: иногда отдавать ИИ в open source невыгодно с коммерческой точки зрения. Это равносильно бесплатной раздаче коммерческого секрета, который может стоить миллионы.
Несмотря на высокий уровень секретности вокруг LLM, сегодня они далеки от самодостаточных сущностей со своими мотивациями. Они не станут «новыми богами», потому что архитектурно гораздо проще. Конечно, всегда можно запустить сложные машины в мировую экономику (и вполне вероятно, что это уже происходит) — тогда в случае сбоя конец может наступить и для человека. Но это потребует принципиально новых архитектурных решений и более сложных систем.
Почему большие языковые модели не обретают сознания
У больших языковых моделей есть фундаментальное ограничение — все они концептуально просты. По сути, они оперируют токенами — словами или их частями. Задача LLM — предсказывать следующий токен на основе вероятностей, извлечённых из обучающих датасетов.
Существуют наборы данных с примерами как машинных, так и человеческих инструкций. Искусственный интеллект обучается генерировать тексты, которые человек оценит как правильные. А так называемое обучение с подкреплением направлено на создание текстов, получающих более высокие оценки от человека. Но и это остаётся лишь вероятностным прогнозированием следующего токена — процессом, который не ведёт к сознанию в том виде, в каком мы его понимаем.
У моделей нет цели: они лишь продолжают уже существующий текст. Другой важный фактор, необходимый для формирования сознания, — взаимодействие с внешним миром, и именно этого искусственному интеллекту пока не хватает.
«Вообще непонятно, что означает сознание, ибо у него 100500 определений. Имитировать как-то, безусловно, можно, и научить делать это лучше тоже можно. Не очень понятно, с какой целью это надо делать. Если хочется, чтобы ИИ был более агентным и самостоятельным, стал субъектом, то этого рано или поздно можно будет добиться, но это будут сущности, равные нам, и относиться к ним надо будет так же».
LLM не задаёт вопросов до того, как ты начал с ним говорить, — хотя технически можно создать алгоритм, который сам начинает взаимодействие. Можно внедрить в систему пользовательские параметры, можно обучить её начинать общение с потенциальным клиентом. Но всё это остаётся результатом работы промт-инженера, который задаёт цель, реплики и структуру коммуникации.
На бекэнде существуют софтверные системы, создающие иллюзию осознанного собеседника, увы, по сути не обладающего сознанием. Хотя у каждого из нас, вероятно, есть пример человека, осознанность которого также вызывает сомнения. Некоторые ответы LLM действительно не слишком отличаются от ответов таких людей.
Что нейросети рассказывают о природе человеческого мышления
Искусственный интеллект предложил новый взгляд на природу человека. Люди и нейросети во многом схожи. Мысль можно сравнить с набором токенов, которые формируют образы и нарратив, а обмен токенами уподобляется обмену мыслями в человеческом диалоге.
У моделей следующего поколения — больших концептуальных моделей (LCM) — не будет токенов и фиксированного контекстного окна. Их тексты будут представлять собой многоуровневые векторы, сочетающие в себе память и способность к более точному предсказанию следующего предложения.
В обществе существуют опасения относительно лингвистической дегенерации. Пока неясно, какую роль в этом сыграет искусственный интеллект. С одной стороны, нейросети уже способны генерировать тексты делового или публицистического характера. Основная функция при этом выполняется, ведь для подобных задач избыточно вычурный язык не требуется.
Всё более явной становится тенденция к упрощению языка — с отказом от высокопарных глаголов и прилагательных. Однако эта тенденция началась задолго до появления LLM: достаточно сравнить речь до и после появления СМС. Современные модели обладают богатым словарным запасом и умеют доносить мысль без искажений — а для большинства задач этого вполне достаточно.
«Язык уже упростился после СМС, поиска и чатов. Дальше, кажется, некуда, только усложняться. Я лично надеюсь, что ИИ — это способ хорошо обогащать язык и показывать человеку, как можно говорить».
Как искусственный интеллект влияет на структуру языка
Лингвисты утверждают: «язык не деградирует, а меняется». Это означает, что существует спрос на фактическую, утилитарную речь — без деепричастных оборотов и художественных описаний. Объём информации в современном мире стал настолько велик, что тратить ресурсы на избыточные украшения становится нецелесообразно.
Кроме того, большие языковые модели (LLM) способны восстанавливать утраченные фрагменты текста, разворачивая сокращения или шаблоны. В этом смысле влияние ИИ на язык можно сравнить с тем, как в своё время на него повлиял телевизор: акцент сместился на краткость, ясность и функциональность.
Язык становится инструментом. Если пользователь не владеет письменной речью, ИИ может улучшить его текст. А профессионалы, напротив, сместят своё внимание в сферы, где важен образный и выразительный язык — литературу, театр, кино.
«Технические тексты, general domain, новости — тут более-менее всё хорошо. Художественный перевод, особенно поэзия, — это иной уровень. В глубоких специализированных областях тоже могут быть свои сложности из-за особых требований к переводу. Переводить книги целиком пока что не очень реально — требует ручного вмешательства или процесса с human-in-the-loop. Отчасти потому, что модели не могут держать контекст на протяжении всей книги. Художественный язык — тоже непростая тема. Но эксперименты идут».
В какой-то момент LLM смогут стереть языковые барьеры — модель быстро осваивает множество языков. Теперь, чтобы понять научную статью, не нужно учить несколько иностранных языков. Но изучение языков всё ещё важно — как способ расширить кругозор и тренировать мышление. Нет лучшей зарядки для мозга, чем «перепрошивка» сознания на язык другой культуры.
Для технических задач уже сегодня достаточно автоматического перевода в реальном времени, который применяют практически все международные компании.
Будущее машинного перевода и малые языки
Сегодня у машинного перевода всё ещё остаются менее приоритетные направления — в первую очередь это низкоресурсные языки с ограниченным объёмом цифрового контента. Большие языковые модели (LLM) могут работать как с естественными, так и с синтетически сгенерированными данными. Однако объём реальных данных в таких случаях будет значительно меньше, а их качество — ниже.
Популярные языки хорошо представлены в Юникоде и имеют обширные датасеты. Но за пределами этих систем остаются около четырёх тысяч языков без письменности. Полностью оцифровать их мы, скорее всего, не успеем. Однако с помощью ИИ и цифровых технологий можно сохранить хотя бы то, что уже существует, — аудиозаписи, словари, глоссарии, устную речь.
В теории LLM может соответствовать самым разным требованиям: от наличия встроенного глоссария и заданной тональности речи (tone of voice) до использования гендерных форм и стилистики под конкретный запрос. Всё зависит от технического задания: если перевод должен соответствовать высоким стандартам качества, подключается многоуровневая система проверки и контроля.
Для малых компаний машинный перевод часто оказывается экономически предпочтительнее, чем найм штатного переводчика. При этом важно сохранить участие редактора-человека — финального этапа, отвечающего за смысловую и стилистическую точность. И хотя это требует перепрофилирования или дополнительного обучения специалистов, такой подход становится наиболее эффективным.
Человек не способен синхронно переводить на десятки языков или мгновенно отвечать клиентам из разных стран в чатах поддержки. А нейросети с этой задачей уже справляются — и будут совершенствоваться дальше.
Языки будущего и роль ИИ в их трансформации
Очевидно, что если язык представлен в цифровой среде недостаточно широко, языковая модель будет справляться с его обработкой хуже. Однако даже в этом случае она не станет полностью бесполезной. Всегда можно дообучить искусственный интеллект, передавая ему уникальные лингвистические данные о языках, которые не прошли через цифровую революцию.
Если язык хотя бы минимально представлен в интернете — существует шанс сформировать объём синтетических данных, на которых нейросеть сможет учиться. Это открывает перспективу для сохранения и оживления языков, находящихся под угрозой исчезновения.
«Если не будет большой войны и мир совсем не сойдёт с ума, через 10–15 лет машинный перевод будет настолько хорош, что люди, как переводчики, будут нужны только для очень экзотических и уникальных ниш. Поэзия, “представительский” перевод, когда почётно быть с человеком, — может, ещё что-то. Это явно будет уже другая работа».
По прогнозам Григория Сапунова, в течение ближайших пяти лет языки в языковых моделях начнут становиться более специализированными: появятся терминологические ветви, диалекты, адаптации под людей с нейроотличиями. Таким образом, ИИ должен будет уметь писать на «языке иного опыта» — это неклассическая, но вполне воображаемая задача для современной лингвистики и ИИ.
Среди более смелых прогнозов — возможность декодирования коммуникации с животными, а также форм невербального общения, которыми ИИ, по некоторым данным, уже начинают оперировать — пусть пока только в рамках собственного «внутреннего» взаимодействия.
Ксения Долгачева