Модель создана хедж-фондом High-Flyer, который в 2024 выпустил серию моделей DeepSeek как побочный продукт (история модели).
- Wired — работает бесплатно, но с постоянными галлюцинациями. По функционалу заметно слабее ChatGPT. Хайп про превосходство над топовыми моделями — маркетинг.
- Nvidia называет модель «отличным достижением», но подчеркивает, что для работы требуется много GPU и быстрые сети. Экономически это выгодно самой Nvidia.
- Сэм Альтман хвалит модель как «впечатляющую и недорогую». Её главный плюс — дешевизна инференса.
DeepSeek — крутая модель для опенсорса и важный шаг для демократизации AI, но до топовых решений ей вероятно еще далеко. Модель имеет потенциал, чтобы стать инструментом для начинающих команд и исследователей, но её будущее зависит от способности быстро адаптироваться и развиваться.
Дискуссия