В конце 2024 года китайская компания DeepSeek выпустила модель, которая за несколько дней стала главной темой в технологическом мире. Что произошло?
Почему DeepSeek — это сенсация?
DeepSeek V3 и R1 показали результаты, сопоставимые с GPT-4 и Claude Sonnet — при затратах на обучение около $6 млн против сотен миллионов у конкурентов. Акции Nvidia упали на 17% в один день после анонса. Это поставило под сомнение тезис о том, что только огромные бюджеты дают прорывные результаты.
Что умеет DeepSeek?
- Глубокое рассуждение (модель R1 — специально для этого)
- Математика и программирование на уровне топ-моделей
- Бесплатный доступ через deepseek.com
- Открытые веса — можно запустить локально
Ограничения
DeepSeek цензурирует политически чувствительные темы (Тяньаньмэнь, Тайвань, Синьцзян). Для технических задач это не важно, для новостного или политического контента — существенно.
Как использовать?
Зайдите на chat.deepseek.com — полностью бесплатно, регистрация по email. Работает без VPN из России.
Добавить комментарий