🧠
Архитектура Transformer: как устроены современные LLM — для специалистов
Технический разбор архитектуры трансформера для специалистов: Self-Attention, Multi-Head Attention, RoPE, Scaling Laws и Mixture of Experts. С формулами…
Технические статьи для специалистов в области ИИ
Технический разбор архитектуры трансформера для специалистов: Self-Attention, Multi-Head Attention, RoPE, Scaling Laws и Mixture of Experts. С формулами…
RLHF, SFT, Constitutional AI, DPO — технический разбор того, как обучают ChatGPT и Claude быть полезными и безопасными.…
AI Alignment — как сделать ИИ безопасным по мере роста мощности. Specification problem, Goodhart's Law, scalable oversight и…
Мультимодальные нейросети: архитектуры early и late fusion, сравнение GPT-4o, Gemini Ultra и Claude по поддерживаемым модальностям и применения…