Фонд Росконгресс: большие языковые модели ИИ превращаются из штучных технологических продуктов в стандартизированные инструменты


3 мар 2025

roscongress.org

Большие языковые модели ИИ под влиянием целого ряда факторов переходят из категории уникальных технологических продуктов в разряд стандартизированных инструментов. Об этом говорится в аналитическом обзоре «Большие языковые модели генеративного ИИ: от штучных изделий к стандартизированному товару», подготовленном экспертами Фонда Росконгресс.

Во многом этому способствовало противостояние США и Китая в области искусственного интеллекта. Санкции на поставку самых мощных чипов в КНР простимулировали инновации, вынуждая разработчиков ИИ оптимизировать архитектуру моделей. Китай реализует долгосрочную стратегию развития искусственного интеллекта, основанную на поэтапном подходе с четкими целевыми показателями. Итогом китайской модели развития стало формирование сектора ИИ, который включает в себя около 4500 компаний. В отличие от американской модели, где ключевую роль играют частные венчурные фонды, китайские технологические компании получают основные средства через систему государственных институтов развития и крупных банков с госучастием. Китайская модель также характеризуется активным участием региональных властей, которые создают специальные зоны развития технологий и предоставляют значительные налоговые льготы. 

Эффективность такого подхода подтверждается статистическими данными: при меньшем количестве компаний в секторе искусственного интеллекта – 15% от мирового показателя против 34% у США – китайские разработчики создали сопоставимое количество языковых моделей – 36% против 44% у США. В совокупности на компании из этих двух стран приходится 80% таких моделей. Это свидетельствует о более высокой результативности государственно ориентированной модели финансирования в контексте развития критически важных технологий.

Китайцы представили модели DeepSeek V3 и DeepSeek R1, которые по своим характеристикам составляют конкуренцию продуктам OpenAI. Появление DeepSeek V3 на архитектуре MoE задало новый уровень цен для компаний, которые предоставляют доступ к LLM – системе из миллиардов вычислительных блоков, или «нейронов», обученной на огромных массивах текстовых данных. Использование самых современных моделей от OpenAI обходится на порядок или два дороже, чем аналогичных по качеству моделей от DeepSeek. Кроме того, китайская компания опубликовала свои модели в свободном доступе под лицензией MIT, которая разрешает их бесплатное использование и модификацию в любых целях, включая коммерческие. Производные модели на основе разработок от китайской компании можно лицензировать на любых условиях.

Таким образом, бизнес-модель OpenAI и других провайдеров ИИ ставится под угрозу. Дополнительным фактором, задающим тренд на удешевление пользования LLM, является выпуск так называемых дистиллированных моделей, которые используют меньшее число параметров, сохраняя при этом большую часть полезных свойств.

Развитие архитектуры больших языковых моделей и методов дистилляции знаний существенно снижает барьеры входа в сферу генеративного ИИ, способствуя переходу от рынка, на котором доминирует крайне малое число компаний, к более конкурентной среде.


Инновации и наука


Старая версия сайта (Архив)