БИЗНЕС-ТРЕНДЫ

Как сохранить лидерство в эпоху ChatGPT

Как выбрать наилучший подход в работе с генеративными моделями, рассказывают специалисты Банка Уралсиб — директор по инновациям Дмитрий Гришин и администратор ИТ‑проектов Вадим Егоров.
Фото: SHUTTERSTOCK/FOTODOM
  • Дмитрий Гришин
  • Вадим Егоров
Цифровые валюты и появление токена
В разных странах по-разному воспринимают идею цифровых валют. К началу 2023 года ситуация складывалась следующим образом: Китай активно тестировал цифровой юань, Европа отмалчивалась конференциями и докладами, а в США цифровой доллар скорее оставался предметом политических спекуляций, от формального одобрения демократами до полного отрицания Трампом «тотального контроля правительства над деньгами граждан».

Тем временем, пока в финансовом мире активно дискутировали о цифровых валютах центральных банков (CBDC), чуть более года назад мы пропустили появление настоящей цифровой валюты — токенов генеративного искусственного интеллекта. В этой статье мы постараемся разобраться в том, как прорыв в области развития больших языковых моделей (LLM) повлияет на банковскую отрасль и почему его роль в финтехе не стоит недооценивать по сравнению с другими технологиями, такими как цифровые финансовые активы, блокчейн и даже интернет.
Что такое генеративные модели ИИ (LLM) и почему с ними важно работать уже сейчас
Феномен ChatGPT 3.5, сдающего экзамен на врача или помогающего писать десятки научных статей в месяц, не мог взяться из ниоткуда: он стал лишь одной из технологических сенсаций, менее заметных для широкой публики, но очень показательных в мире технологий и, как ни странно, видеоигр.

Прошло немногим менее 20 лет с того дня, когда так называемый искусственный интеллект научился обыгрывать человека в шахматы. Тогда могло казаться, то победа Deep Blue от IBM свидетельствовала о будущем превосходстве компьютера над человеком. Но в итоге правда осталась за скептиками, указавшими на тот факт, что машина победила человека исключительно за счет скорости вычислений, не совершив никаких трудновоспроизводимых действий. Иными словами, весь технологический успех сводился к простому перебору: перед каждым следующим ходом компьютер за секунды мог рассчитать выгоду от более чем 330 млн исходов партии, выбрав наилучший, тогда как чемпион мира по шахматам — только от нескольких десятков. Сегодня это знаковое событие кажется всего-­навсего очередной вехой в истории шахмат, репутация которых как способа измерить интеллектуальный уровень человека не могла не пошатнуться.

Цифровизация сделала программное обеспечение орудием в руках почти каждого работника умственного труда. Это орудие, будь то репозиторий с кодом или простое офисное приложение, помогает автоматизировать рутинную работу, состоящую из повторяющихся действий. Человеку была отведена более значимая роль — творческое и критическое мышление. Появление нейронных сетей поменяло правила игры. Сначала в прямом, а потом и в переносном смысле.

Так, способность принимать решение в условиях несовершенства информации, действовать в режиме реального времени, придерживаясь стратегии, - все эти качества профессионального геймера вдруг оказались подвластны моделям ИТ‑корпораций во второй половине предыдущего десятилетия. Эти игры, в отличие от шахмат, предполагают бесчисленное множество сценариев, перебор которых априори невозможен. От игроков здесь, кроме знаний, требуются если не рефлексы и интуиция, то постоянная импровизация.
пока в финансовом мире активно дискутировали о цифровых валютах центральных банков (CBDC), чуть более года назад мы пропустили появление настоящей цифровой валюты — токенов генеративного искусственного интеллекта
В 2016 году программа AlphaGo стартапа DeepMind, выкупленного Google, победила действовавшего чемпиона игры PockemonGo. Двумя годами позже бот от OpenAI одолел пятерых профессиональных геймеров в Dota 2 — одной из сложнейших многопользовательских онлайн-игр. Прогресс нейросетевых моделей, в особенности касающийся направления NLP (обработки естественного языка), не заставил себя ждать. В 2019 году выходит ChatGPT‑2, способный искусно имитировать человеческие тексты. Спустя три года новое поколение больших языковых моделей позволяет создавать качественный контент, едва ли отличимый от сделанного человеком.

Главным открытием ChatGPT стала даже не столько сама модель, сколько ее общедоступность — появилось понятие бытового искусственного интеллекта. Студенты и работники самых разных отраслей внезапно получили новый инструмент, а яркие примеры успешного, или наоборот, нецелевого использования генеративного искусственного интеллекта стали достояниями прессы. Однако современные исследования подтверждают одно: уже сегодня генеративные модели качественно меняют нашу жизнь. Так ChatGPT‑4 оказывается на 80% более убедителен на дебатах, побеждает экспертов и профессиональных креаторов в создании контента (исследование MIT), а также помогает в создании микромолекулярных лекарств.
Фото: SHUTTERSTOCK/FOTODOM
Основные понятия: от традиционного ИИ к большим языковым моделям
Общемировая слава ChatGPT заставляет банковский бизнес задуматься, в какой мере уместно следовать за гигантами вроде Goldman Sachs, Morgan Stanley или Bloomberg — главными авторами инфоповодов о работе генеративных моделей в финансах. Даже спустя полтора года после триумфа OpenAI разные методы автоматизации бизнес-­процессов с помощью сложных моделей остаются в виде собирательного образа некоего «искусственного интеллекта», или абстрактной «нейронки». Вместе с тем это понятие вбирает в себя совершенно разные методы компьютерной обработки данных, от больших языковых моделей до метода наименьших квадратов — рабочей лошадки каждого бизнес-­аналитика.

На наш взгляд, путь к практическим способам применения решений на базе генеративного искусственного интеллекта начинается с разбора основных понятий. Мы предлагаем рассмотреть следующий набор основных терминов, «вытекающих» из искусственного интеллекта.

Искусственный интеллект — область компьютерных наук, создающая программы и системы, имитирующие человеческую когнитивную деятельность.

Машинное обучение — подход к выявлению сложных зависимостей и паттернов в данных с помощью математических моделей, часто нацеленных на задачи кластеризации и классификации.

Нейронные сети — модели машинного обучения, построенные на принципах нейронных связей головного мозга, способные к обучению на данных и анализу сложных паттернов.

Генеративный ИИ — нейронная сеть, способная создавать уникальный контент и данные на основе больших объемов информации для обучения.

Большие языковые модели (LLM) — вид генеративных моделей, обученных на огромных объемах текстовых данных для генерации «человеческого» текста. Обучение LLM — это извлечение закономерностей из больших объемов данных и формирование правил, по которым можно комбинировать эти закономерности для порождения нового контента.

Также в работе с генеративными моделями можно выделить несколько ключевых понятий, способных сделать ChatGPT и его аналоги эффективным инструментом в ваших руках уже сейчас, без дополнительной разработки.

Промпт (prompt) — инструкция-запрос для работы GenAI. Включает в себя сам запрос, его окружение, а также требования к выходному результату.

Контекст — содержит ваш промпт + данные, на основе которых надо дать ответ. Это приводит модель от общего к конкретному и увеличивает ее полезность.

Эмбеддинг (embedding) — процесс перевода текста в вектор, представленный в виде массива чисел. Помогает кратко улучшить работу с естественным языком.

Галлюцинация AI — создание квазиреалистичного, ошибочного результата. Например, лишние пальцы, выдуманные факты и т. п., результат близкого значения векторов.

Токен — единица учета работы сети генеративного интеллекта. Расходуется на преобразование промпта, контекста, внутреннюю работу и формирование результата.
дальнейший прогресс LLM в самых разных видах деятельности работников умственного труда в среднесрочной перспективе позволит GAMAM забрать себе новые сегменты бизнеса: индустрия развлечений, право и бухгалтерия, обучение и менеджмент и т. п.
Выбор лучшей LLM зависит от конкретных запросов бизнеса
Лидерство в развитии генеративных моделей — нового ресурса экономики цифрового мира — на данный момент принадлежит всего нескольким ИТ‑корпорациям, сокращенным до аббревиатуры GAMAM: Google, Amazon, Meta, Apple, Microsoft.

Совокупная численность GAMAM составляет всего около 2,3 млн человек. Это менее 5% от общей численности персонала мировой ИТ‑индустрии (по разным оценкам, их остается около 55 млн специалистов).

Эти 2+ млн создают компании капитализацией 12+ трлн долл. Это более 20% от общей капитализации американского фондового рынка. Еще в 2010 году это были скромные 5% и менее 1 трлн общей капитализации.

Разумно предположить, что дальнейший прогресс LLM в самых разных видах деятельности работников умственного труда в среднесрочной перспективе позволит GAMAM забрать себе новые сегменты бизнеса: индустрия развлечений (кино, музыка, сериалы, блогеры и т. п.), право и бухгалтерия, обучение и менеджмент и т. п.

Доступ к таким моделям, особенно когда дело касается решения конкретной бизнес-задачи, может оказаться ограниченным. Главным ограничением выступают инфраструктурные мощности, которыми обладает компания-разработчик LLM. Кроме того, разные модели способны обработать лимитированный объем контекста, измеряемого в токенах. Сами токены служат как инструментом измерения скорости отклика при одновременном количестве потоков/запросов (например, эффективность отклика LLM часто измеряется количеством токенов в секунду), так и способом тарификации. К примеру, монетизация компаний­разработчиков может строиться как на генерации нового контента, так и на векторизации загруженных пользователем данных.

Отдельной сложностью выступает определение «курса» самого токена, зависящего от модели. Так, в случае с одной моделью токен может «весить» 4 знака, а с другой — 6, что значимо может затруднить сравнительный анализ и в целом прогнозирование стоимости закупаемого сервиса. Своего рода «печатным станком» в таком случае обладает даже не сам разработчик, а владелец инфраструктуры, за доступ к которой де-факто платит пользователь.

Стратегическим ответом на проприетарные модели типа ChatGPT‑4 стали модели с открытым исходным кодом. Появление доступных для дообучения и кастомизации больших и малых языковых моделей позволило создавать сервисы, решающие конкретные проблемы бизнеса, будь то категоризация клиентских обращений или создание креативов для маркетинговых акций. Однако есть основания полагать, что в обозримой перспективе безусловное лидерство останется за проприетарными моделями. Новые модели появляются регулярно, а список лидеров с 2023 года обновился практически полностью. Если раньше открытая модель Vicuna13b входила в топ‑5 и по совокупным метрикам качества набирала под 90% относительно ChatGPT‑4, то в 2024 году она вылетела из топ‑10 моделей, по оценкам пользователей портала Hugging Face. На сегодняшний день корпоративные LLM остаются лидерами рейтинга, а появление моделей open-source можно назвать попыткой улучшить уже доступные устаревшие проприетарные модели.

Вместе с тем потребности бизнеса требуют прагматичного подхода в работе с любой технологией, и генеративный ИИ не исключение. В связи с этим совершенно необязательным кажется погоня за лучшей моделью с точки зрения общепризнанных метрик. ChatGPT‑4io может занимать лидирующие позиции, однако доступ к нему ограничен и часто рискован ввиду отсутствия технической возможности предотвратить утечки сенситивной информации в случае интеграции с ним корпоративных информационных систем. Банковский бизнес во многом построен вокруг такой сенситивной информации, и качественное преобразование бизнес-­процессов может быть возможно только при полноценном развертывании генеративных моделей в контуре банка.

В Уралсибе мы регулярно фиксируем растущие потребности в генеративных моделях. Так, показали высокий спрос решения в сфере анализа клиентского опыта, управления персоналом и консультирования сотрудников и клиентов. Отдельного изучения заслуживают такие направления, как анализ договоров и в целом внутренней документации банка, помощь программистам в работе с кодом (аннотирование, корректировка скрипта). Уже около 20% нашей воронки инновационных решений, поиск которых осуществляется в интересах внутренних заказчиков, содержат генеративные языковые модели в основе ИТ‑сервиса. Более того, при попытке оценить экономический эффект от масштабирования такого решения, мы зачастую приходим к выводу о необходимости его интеграции в контур банка.

Фото: SHUTTERSTOCK/FOTODOM
Что нас ждет в ближайшем будущем
Все больше оснований полагать, что в ближайшее время генеративные модели поменяют текущий формат работы типичного «белого воротничка», причем изменения затронут как обычного клерка-делопроизводителя, так и значимо более высококвалифицированного работника, будь то разработчик или инженер. Сервисы типа copilot позволят коренным образом изменить формат работы с информацией, появятся новые программные продукты, производительность и автономность которых перекроет весь функционал базовых офисных приложений. В таком случае лидеры экономики цифрового мира снова сохранят лидерство.

Так же, как когда-то соцсети и поисковики перераспределили маржу в свою пользу, генеративный интеллект изменит бизнес-модели большинства компаний, перехватив начало клиентского пути.
Автоматизация, которую обещают сервисы на базе генеративного ИИ, может в конечном итоге привести к тому, что такие цифровые продукты с GPT трансформируют привычную для современных компаний связку человек-софт, когда офисная работа требовала наличия у работника базовых навыков, будь то обобщение больших объемов информации, распределение ролей и постановка задач.
В Уралсибе регулярно фиксируют потребности в генеративных моделях. высокий спрос показали решения в сфере анализа клиентского опыта, управления персоналом, консультирования сотрудников и клиентов
Сегодня экстенсивный рост или увеличение производительности часто решается с помощью найма дополнительной рабочей силы. Вероятно, появление на рынке SAAS‑решений на базе генеративных моделей, которые примут на себя часть работы, позволит руководителям бизнеса сэкономить значительные объемы ресурсов. В текущей ситуации контроль за LLM и необходимой для него инфраструктурой (особенно в случае с облачными решениями) может оказаться дешевле, чем сохранение текущего количества рабочих мест. Особую роль в таком случае приобретают токены. Деньги всегда выступали платой за количество усилий человека по созданию ценности. В нашем случае токен выступает платежным средством за доступ к лучшему генеративному ИИ.

Однако мы находимся в начале пути. Драматический рост производительности генеративных моделей подобен созданию атомного реактора, позволяющего контролировать процесс расщепления атома. Путь от атомного реактора к атомному ледоколу и АЭС по всему миру потребовал огромного количества интенсивных усилий со стороны государства и бизнеса. Взяв за основу эту метафору, можем предположить, что LLM — новые модели этого реактора. Однако превращение реактора в полноценную АЭС в обозримой перспективе потребует серьезных инженерных работ по созданию инфраструктуры. В настоящий момент нет сомнений, что в случае с генеративным ИИ эта работа ляжет на плечи крупнейших ИТ‑корпораций.


Читайте также