深度求索
外观
杭州深度求索人工智能基础技术研究有限公司 | |
![]() | |
私人公司 | |
简称
|
深度求索/DeepSeek |
成立辰光
|
2023年5月 |
总部地点
|
![]() |
重要人物
|
梁文锋 |
信息技术 | |
deepseek.com |
深度求索,全称杭州深度求索人工智能基础技术研究有限公司,英文简称DeepSeek,是中国人工智能公司、大型语言模型公司,创始人搭仔CEO是梁文锋,2023年7月份由中国对冲基金幻方量化创立。
历史
[编辑]DeepSeek是2023年7月份成立个,由中国对冲基金幻方量化创立,创始人、CEO侪是梁文锋,总部来勒中國浙江省杭州市,研究方向是AI大模型个研究开发[1]。
2024年5月份,DeepSeek发布开源[2]旗下MoE大模型DeepSeek-V2。伊个模型架构帮经济性邪气出彩,DeepSeek-V2个API定价是每百万tokens输入1块、输出2块,价钿是GPT-4 Turbo个百分之一[1][3]。
2024年12月份,DeepSeek发布开源[4]DeepSeek-V3。DeepSeek表示,箇只大模型个训练祇来勒2,048块英伟达H800型GPU(针对中国市场个低配版GPU)集群上运行55天就完成哉,训练只花仔557.6万美元[5]。DeepSeek-V3个评测成绩超过Qwen2.5-72B(阿里自研大模型)和Llama 3.1-405B(Meta自研大模型)等开源模型,好直接帮GPT-4o、Claude 3.5-Sonnet(Anthropic自研大模型)等闭源模型相抗衡[1]。
2025年1月20号, DeepSeek发布开源[6]DeepSeek-R1模型,来勒数学、代码、自然语言推理等任务丄,性能已经超越OpenAI o1正式版哉[1]。
参考文献
[编辑]- ↑ 1.0 1.1 1.2 1.3 量化巨头幻方创始人梁文锋参加总理座谈会并发言,他还创办了“AI界拼多多” (zh). 新浪财经 (2025-01-22). 原始文档勒2025-01-22存档. 访问日脚2025-01-22.
- ↑ DeepSeek (2024-05-06). DeepSeek-V2: A Strong, Economical, 和 Efficient Mixture-of-Experts Language Model. github. 原始文档勒2024-05-06存档.
- ↑ 大模型价格又砍一刀 这次“屠夫”竟是量化私募? (zh). 财联社 (2024-05-10). 原始文档勒2024-12-27存档. 访问日脚2025-01-22.
- ↑ DeepSeek. DeepSeek-V3. github. 原始文档勒2024-12-26存档.
- ↑ DeepSeek (2024-12-26). DeepSeek-V3 Technical Report (en). github. 原始文档勒2024-12-26存档. 访问日脚2025-01-24.
- ↑ DeepSeek-R1 (en). github (2025-01-20). 原始文档勒2025-01-20存档. 访问日脚2025-01-24.