LLM — три буквы, которые встречаются в каждой статье про ИИ. Расшифровываем и объясняем без технического жаргона.
LLM = Large Language Model = Большая языковая модель
Это нейросеть, обученная на огромном количестве текста — буквально на значительной части всего, что человечество написало в интернете. «Большая» — потому что содержит миллиарды параметров (числовых коэффициентов). GPT-4 — предположительно более триллиона.
Как работает LLM?
Очень упрощённо: модель предсказывает следующее слово (токен) в последовательности. Делает это так хорошо, что в процессе формирует внутренние представления о мире, языке и логике. Именно поэтому она может отвечать на вопросы, писать код и рассуждать.
Примеры LLM
- GPT-4o, GPT-5 (OpenAI)
- Claude 3.7 Sonnet (Anthropic)
- Gemini Ultra (Google)
- Llama 3 (Meta, открытая)
- DeepSeek V3 (открытая)
- GigaChat (Сбер)
- YandexGPT (Яндекс)
Чем LLM отличается от поисковика?
Поисковик находит существующие страницы. LLM генерирует новый текст — синтезирует ответ из своих знаний. Поэтому она может ошибаться и выдумывать факты (галлюцинировать).
Добавить комментарий