БИЗНЕС-ТРЕНДЫ

Для чего нужны LLM

Дмитрий Гришин, директор по инновациям Банка Уралсиб, рассказал для Forbes о тенденциях в революционном процессе развития генеративного ИИ, который мы наблюдаем уже сейчас.
Фото: SHUTTERSTOCK/FOTODOM
Лозунг «Данные — новая нефть» уже устарел. Ключевой цифровой ресурс этого десятилетия — токены LLM.

LLM — это большая языковая модель. Вы знаете о ее существовании, если слышали о генеративном искусственном интеллекте, ChatGPT или GigaChat. Токены — единица измерения работы LLM. Если говорить просто, это расход бензина на 100 км пути, который будет зависеть от веса, вида транспорта, характера дороги, манеры вождения. Так и токены зависят от вида LLM, сложности поставленной задачи, заданного промпта. Будучи во всех смыслах неправильной, это единственная наглядная аналогия.

LLM — это модели, обученные на огромных объемах текстовых данных для генерации «человеческого» текста. Можно представить LLM как автора, который может создавать осмысленные тексты на разные темы, отвечать на вопросы, переводить и даже программировать, основываясь на своих обширных языковых знаниях. Обучение LLM — это извлечение закономерностей из больших объемов данных и формирование правил, по которым можно комбинировать эти закономерности для порождения нового контента. Например, LaMDA от Google обучалась более чем на 1,56 трлн словах из веб-страниц, книг, диалогов и других источников. Даже для мощного компьютера обработать такие массивы текста — огромный вычислительный вызов, поэтому текущая капитализация основного производителя чипов для этих вычислений — компании NVIDIA Corporation составляет 2,23 трлн долл., при том что впервые отметку 1 трлн долл. компания преодолела год назад, в мае 2023-го.
Рост производительности труда разработчика в десятки раз после внедрения генеративных моделей даст GAMAM абсолютное превосходство над производственными системами компаний, которые останутся в «старом» технологическом укладе
В точке бифуркации
На арене GAMAM (Google, Apple, META (ex-­Facebook, признана экстремистской организацией в России), Amazon, Microsoft) time-to-market беспрецедентно короткий.

В конкуренцию за генеративный интеллект включились мировые лидеры технологий. Последний раз такую ожесточенную конкуренцию мы наблюдали, когда появились мобильные телефоны. Кто-то может указать на бурлящий котел криптовалют и ICO, но в той схватке не было настоящих титанов, а те, что пытались, быстро сошли с дистанции: CORDA от R3, Libra от META (признана экстремистской организацией в России) была отменена, TON от Павла Дурова.

Сейчас участники забега за звание лучшей модели «наше все из мира ИТ»:
  • Google (Gemeni);
  • Amazon (основной инвестор Antropic);
  • META (признана экстремистской организацией в России) (Llama);
  • Apple (персональный GenAI в каждом смартфоне);
  • Microsoft (OpenAI);
  • Илон Маск (Grok);
  • NVIDIA (чипы для всех);
  • в России — «Яндекс» и «Сбер», в Китае — ByteDance.

Поражает темп, взятый участниками гонок: ежемесячно выходят новые продукты, и бенчмарки показывают, что ни один из них не имеет постоянного и явного преимущества перед другими. Поистине мы находимся в точке бифуркации, где миллиардные бюджеты мегакорпораций сошлись в схватке за лидерство. Подобное напряжение интеллектуальных сил мы помним по освоению энергии атома и космоса. Наследием этих завоеваний мы пользуемся по сей день. Чтобы понять причины этой борьбы, важно осознать, что для цифрового мира, в котором сейчас живет бизнес, GenAI‑based будет иметь столь же мощное преобразующее воздействие, как двигатель внутреннего сгорания на промышленность.
Изображение сгенерировано с помощью нейросети Midjourney
Аналог плуга и лопаты
Долгое время базисом создания стоимости было сельское хозяйство. Излишки пищи обменивались на золото или эквивалент. Энергетический базис такого уклада — мускульная сила человека и одомашненных им животных. В эпоху промышленного производства базис — двигатель внутреннего сгорания. Сейчас никто не будет оспаривать, что в материальном мире производить товары, перемещать грузы с помощью машины эффективнее, чем ручным трудом человека.

Производительность в сельском хозяйстве выросла в 400 раз. В период плугового земледелия до начала XX века один человек с лошадью и плугом мог обработать около 2−3 га пахотной земли за сезон с урожайностью 1−1,5 т/га. Сейчас один механизатор на тракторе и посевном комплексе может обработать 400−600 га за сезон с урожайностью 3−5 т/га.

Производство в цифровом мире в настоящий момент целиком и полностью зависит от разума человека. Офисные программы и фреймворки служат нам аналогами лопат и плугов. Производительность одного програм­миста, дизайнера ограничена выносливостью его мозга, поэтому Microsoft, Google и Apple имеют штат от 160 тыс. до 220 тыс. сотрудников каждая, что сопоставимо с промышленными гигантами: General Motors, Mercedes-­Benz Group и Ford — 160−170 тыс., Samsung Electronics — 235 тыс., Sony — 108 тыс. сотрудников.

Однако совокупная численность GAMAM — всего 2,26 млн человек, что составляет менее 5% от общей численности персонала мировой ИТ‑индустрии с 55 млн специалистов (по данным исследовательской компании IDC, 2023 год). Вот только эти 2+ млн создают капитализации на 8,7 трлн долл., что составляет баснословные 19% от общей капитализации американского фондового рынка, а еще в 2010 году это были скромные 5%, или менее 1 трлн долл. общей капитализации.

Рост производительности труда разработчика в десятки раз после внедрения генеративных моделей даст GAMAM абсолютное превосходство над производственными системами компаний, которые останутся в «старом» технологическом укладе. GAMAM смогут забрать себе новые сегменты бизнеса: индустрия развлечений (кино, музыка, сериалы, блогеры), право и бухгалтерия, обучение и менеджмент.

Чтобы не оказаться на обочине прогресса, компаниям уже сейчас надо проводить эксперименты по внедрению open source-решений в свои производственные процессы.

При подготовке данной статьи

неоценимую помощь в поиске данных

оказал Claude 3.0 от компании Anthropic


Читайте также