跳转到内容

深度求索

出自维基百科,自由个百科全书
杭州深度求索人工智能基础技术研究有限公司
{{{company_image}}}
私人公司
市场资料
{{{market_information}}}
简称
深度求索/DeepSeek
成立辰光
2023年5月
总部地点
中国 中华人民共和国浙江省杭州市
邮政编码
{{{zip_code}}}
服务范围
{{{area_served}}}
电话号码
{{{telephone_no}}}
重要人物
梁文锋英语Liang Wenfeng
口号
{{{company_slogan}}}
信息技术
{{{products}}}
{{{services}}}
资金额度
{{{capital}}}
{{{revenue}}}
{{{operating_income}}}
净利润
{{{net_income}}}
市值
市盈率
{{{P/E ratio}}}
每股盈利
{{{earnings_per_share}}}
每股资产净值
{{{Net_asset_value}}}
结算期
{{{accounting_period}}}
所有者
{{{owner}}}
主要股东
{{{major_shareholder}}}
主要部门
{{{divisions}}}
{{{sister}}}
deepseek.com

深度求索,全称杭州深度求索人工智能基础技术研究有限公司,英文简称DeepSeek,是中国人工智能公司、大型语言模型公司,创始人搭仔CEO梁文锋,2023年7月份由中国对冲基金幻方量化创立。

历史

[编辑]

DeepSeek是2023年7月份成立个,由中国对冲基金幻方量化创立,创始人、CEO侪是梁文锋,总部来勒中國浙江省杭州市,研究方向是AI大模型个研究开发[1]

2024年5月份,DeepSeek发布开源[2]旗下MoE大模型DeepSeek-V2。伊个模型架构帮经济性邪气出彩,DeepSeek-V2个API定价是每百万tokens输入1块、输出2块,价钿是GPT-4 Turbo个百分之一[1][3]

2024年12月份,DeepSeek发布开源[4]DeepSeek-V3。DeepSeek表示,箇只大模型个训练祇来勒2,048块英伟达H800型GPU(针对中国市场个低配版GPU)集群上运行55天就完成哉,训练只花仔557.6万美元[5]。DeepSeek-V3个评测成绩超过Qwen2.5-72B阿里自研大模型)和Llama 3.1-405BMeta自研大模型)等开源模型,好直接帮GPT-4oClaude 3.5-SonnetAnthropic自研大模型)等闭源模型相抗衡[1]

2025年1月20号, DeepSeek发布开源[6]DeepSeek-R1模型,来勒数学、代码、自然语言推理等任务丄,性能已经超越OpenAI o1正式版哉[1]

参考文献

[编辑]
  1. 1.0 1.1 1.2 1.3 量化巨头幻方创始人梁文锋参加总理座谈会并发言,他还创办了“AI界拼多多” (zh). 新浪财经 (2025-01-22). 原始文档勒2025-01-22存档. 访问日脚2025-01-22.
  2. DeepSeek (2024-05-06). DeepSeek-V2: A Strong, Economical, 和 Efficient Mixture-of-Experts Language Model. github. 原始文档勒2024-05-06存档.
  3. 大模型价格又砍一刀 这次“屠夫”竟是量化私募? (zh). 财联社 (2024-05-10). 原始文档勒2024-12-27存档. 访问日脚2025-01-22.
  4. DeepSeek. DeepSeek-V3. github. 原始文档勒2024-12-26存档.
  5. DeepSeek (2024-12-26). DeepSeek-V3 Technical Report (en). github. 原始文档勒2024-12-26存档. 访问日脚2025-01-24.
  6. DeepSeek-R1 (en). github (2025-01-20). 原始文档勒2025-01-20存档. 访问日脚2025-01-24.

外部链接

[编辑]