
DeepSeek стал вирусным.
\nКитайская лаборатория искусственного интеллекта DeepSeek в этой неделе ворвалась в массовое сознание после того, как ее приложение-чатбот взлетело на вершину рейтингов Apple App Store. Модели искусственного интеллекта DeepSeek, обученные с использованием эффективных вычислительных методов, заставили аналитиков Уолл-стрит и технологов задать вопрос: может ли США сохранить свое превосходство в гонке искусственного интеллекта, и будет ли спрос на чипы для искусственного интеллекта устойчивым.
\nТорговые корни DeepSeek
\nDeepSeek поддерживается High-Flyer Capital Management, китайским квантовым хедж-фондом, который использует искусственный интеллект для принятия решений о торговле.
\nЭнтузиаст искусственного интеллекта Лян Вэнфэнг сосновал High-Flyer в 2015 году. Вэнфэнг, который, как сообщается, начал экспериментировать с торговлей ещё будучи студентом в Университете Чжэцзян, запустил High-Flyer Capital Management как хедж-фонд в 2019 году, ориентированный на разработку и внедрение алгоритмов искусственного интеллекта.
\nВ 2023 году High-Flyer запустила DeepSeek как лабораторию, посвященную исследованию средств искусственного интеллекта отдельно от своего финансового бизнеса. С High-Flyer в числе своих инвесторов лаборатория выделилась в свою собственную компанию, также названную DeepSeek.
\nС первого дня DeepSeek строила свои собственные кластеры данных для обучения моделей. Но, как и другие китайские компании по искусственному интеллекту, DeepSeek пострадала от запретов США на экспорт оборудования. Для обучения одной из своих более поздних моделей компания была вынуждена использовать чипы Nvidia H800, менее мощную версию чипа H100, доступную для американских компаний.
\nМощные модели DeepSeek
\nDeepSeek представила свой первый набор моделей - DeepSeek Coder, DeepSeek LLM и DeepSeek Chat - в ноябре 2023 года. Но только в прошлую весну, когда стартап выпустил свою новейшую линейку моделей DeepSeek-V2, индустрия искусственного интеллекта начала обращать на него внимание.
\nDeepSeek-V2, универсальная система анализа текста и изображений, продемонстрировала хорошие результаты в различных бенчмарках искуственного интеллекта и была гораздо дешевле по сравнению с аналогичными моделями на тот момент. Это заставило домашних конкурентов DeepSeek, включая ByteDance и Alibaba, снизить цены на использование некоторых из своих моделей и предоставить другие абсолютно бесплатно.
\nРазрушительный подход
\nЕсли у DeepSeek есть бизнес-модель, то не совсем понятно, какая именно. Компания ценит свои продукты и услуги гораздо ниже рыночной стоимости и предоставляет их бесплатно.
\nСогласно данным DeepSeek, разрыв в эффективности позволил ей обеспечить экстремальную конкурентоспособность по цене. Однако некоторые эксперты подвергают сомнению предоставленные компанией цифры.
\nКак бы то ни было, разработчики полюбили модели DeepSeek, которые не являются открытым исходным текстом, как это обычно понимается, но доступны по лицензиям, позволяющим коммерческое использование. Согласно Клему Делангу, генеральному директору Hugging Face, одной из платформ, на которой размещены модели DeepSeek, разработчики на Hugging Face создали более 500 "производных" моделей R1, которые набрали в совокупности 2,5 миллиона загрузок.
\nSan Francisco не стрижется AI-ориентированный информационный бюллетень! Подпишитесь здесь, чтобы получать его каждую среду в свой почтовый ящик.