DeepSeek近期在全球科技领域受到广泛关注。1月20日,DeepSeek正式发布开源R1推理模型,其性能与国际顶尖闭源模型OpenAIo1相当,但成本更低。该模型的推出打破了“大模型必然伴随高昂算力成本”的传统认知,为AI技术的普惠化奠定了基础。据经济日报报道,DeepSeek的技术突破不仅降低了AI大模型的硬件门槛和能源消耗,还为AI技术在更多领域的应用提供了可能。

DeepSeek简介
DeepSeek由国内量化私募巨头幻方量化创立,总部位于杭州。幻方量化拥有丰富的技术积累和强大的算力资源,是除大厂外唯一一家储备万张A100芯片的公司,为DeepSeek的技术研发提供了坚实基础。DeepSeek专注于开发先进大语言模型(LLM)及相关技术,通过自研训练框架、自建智算集群以及万卡算力等资源优势,大幅降低了大模型的算力需求和成本。其核心团队成员来自清华大学、北京大学、浙江大学等国内顶尖高校。此外,DeepSeek实施开源策略,全系列模型完全开源且免费商用。截至当前,DeepSeek已相继发布多个版本的模型,包括DeepSeek-LLM、DeepSeek-Coder、DeepSeek-Math、DeepSeek-VL等。其中,DeepSeek-V3开源基础模型的性能与GPT-4o和ClaudeSonnet3.5等顶尖模型相近,但训练成本极低。该模型在2048块英伟达H800GPU集群上完成训练,仅花费约557.6万美元,不到其他顶尖模型训练成本的十分之一。1月20日发布的DeepSeek-R1模型在后训练阶段大规模应用了强化学习技术,即便在极少标注数据的情况下,也能显著提升模型的推理能力。DeepSeek-R1的API服务定价为每百万输入tokens 1元(缓存命中)/4元(缓存未命中),每百万输出tokens 16元。1月24日,DeepSeek-R1在专业大模型排名Arena上的基准测试升至全类别大模型第三,其中在风格控制类模型(StyleCtrl)分类中与OpenAIo1并列第一。其竞技场得分达到1357分,略超OpenAIo1的1352分。1月25日,AMD宣布将新的DeepSeek-V3模型集成到InstinctMI300XGPU上,旨在与SGLang一起实现最佳性能。有海外用户认为,DeepSeek以极低成本(600万美元)和少量芯片(2000块)实现了与OpenAI等巨头相媲美的性能,挑战了“唯有科技巨头才能研发尖端AI”的行业共识。

DeepSeek产业链分析
DeepSeek产业链涵盖上游算力基础设施、中游模型研发与训练、下游商业应用及技术合作服务等环节。其中,算力、算法、应用等是产业链的核心环节。
上游算力基础设施
算力基础设施和硬件是AI模型研发与训练的核心基础,对模型的性能表现、运行效率以及成本支出具有重要影响。DeepSeek创始人、幻方量化创始人梁文锋曾指出,高端算力的使用权是DeepSeek面临的主要制约因素之一。尽管DeepSeek在成本控制方面取得了显著进展,但当前AI大模型的训练成本仍然较高,训练高效模型仍依赖于大规模计算资源。如果追求更高模型精度,训练阶段的算力消耗未必会减少,因此上游算力需求依然强劲。同时,下游应用的爆发式增长也将进一步推动算力基础设施的建设和发展。从供应链安全性和性价比角度出发,国产算力基础设施的占比有望持续提升,包括服务器、算力芯片、交换机、光模块等多个关键环节。在上游算力环节,浪潮信息为DeepSeek北京亦庄智算中心提供AI服务器集群,配备英伟达H800GPU及自研AIStation管理平台;中科曙光承建DeepSeek杭州训练中心液冷系统,单机柜功率密度达35kW,PUE小于1.15;润泽科技廊坊数据中心为DeepSeek提供3000+机柜资源,采用间接蒸发冷却技术,运营成本低于同行15%;并行科技为DeepSeek提供多种并行计算技术;寒武纪和景嘉微等国产AI芯片制造商也将受益于DeepSeek技术推动的算力需求增长。此外,DeepSeek的AI模型已适配华为昇腾芯片,在适配过程中,DeepSeek解决了芯片不支持某些代码的问题,通过改算法绕开限制并优化了性能。每日互动作为幻方量化的二股东,牵头的浙江大数据计算中心为DeepSeek提供算力支持,并提供海量用户行为语料数据用于模型训练和优化,双方在算法和数据智能领域有深度合作;昆仑万维与新加坡南洋理工大学联合开发的Q算法显著提升了DeepSeek模型的推理能力,例如在数学领域,Q算法帮助DeepSeek-Math-7b模型在MATH数据集上的准确率提升至55.4%,超越谷歌Gemini Ultra。

中游:模型研发和数据训练
中游模型研发与训练是AI产业链的核心环节,直接影响到AI模型的最终性能和效果。DeepSeek模型由杭州深度求索人工智能基础技术研究有限公司独立研发训练。模型研发离不开高质量的数据训练,AI数据集是大模型训练和测试的基础,数据标注是数据集最核心的环节,贯穿大模型全生命周期。当前AI大模型和智能体持续涌现,高质量和专业化的数据标注成为刚需。部分厂商与幻方量化(DeepSeek的母公司)在金融语料库方面存在合作,数据资源可能被用于DeepSeek模型的训练和优化,为DeepSeek提供专业的金融领域数据支持。拓尔思政务大数据市占率第一,拥有4000+行业知识库,可快速生成领域微调数据,并与DeepSeek联合开发金融舆情大模型。此外,海天瑞声AI训练数据市占率国内第一;法本信息的FarAI人工智能平台包含自动化数据标注工具;博彦科技为大模型公司提供多种数据类型和标注任务;中科软数据标注平台在医疗领域有相关应用;易华录已拥有24个数据湖进入运营期,将申报建设国家级数据标注基地;汉王科技获得发明专利授权“医疗领域标注数据的获取方法、装置、电子设备”;数据堂、云测数据、龙猫数据、星尘数据等也是数据标注专业型服务商。在分布式训练框架方面,东方国信CirroData数据库支持大规模分布式训练数据管理,已用于电信运营商AI平台;星环科技SophonLLM工具链提供国产化微调解决方案,适配昇腾和海光硬件。在模型压缩和部署方面,格灵深瞳INT4量化工具可将175B模型压缩至8GB显存需求,满足边缘部署刚需;当虹科技视频压缩技术转用于模型参数传输优化,降低分布式训练通信成本。

下游:AI应用、技术合作与服务
商业化应用和技术合作服务是AI产业链的价值实现环节,关系到AI产品的市场接受度和盈利能力。DeepSeek模型在教育、医疗、金融等多个领域广泛应用。科大讯飞在教育领域接入DeepSeek-Math模型,联合推出AI数学辅导应用“星火助学”,推动AI技术在教育领域的应用落地;金山办公WPS智能写作功能集成DeepSeek-WriterAPI,公文生成效率提升3倍,错误率下降90%,为DeepSeek提供商业化应用场景。此外,浙江东方通过旗下杭州东方嘉富基金参投DeepSeek天使轮,持股路径为浙江东方→东方嘉富(持股40%)→DeepSeek;华金资本珠海国资旗下投资平台通过华金领越基金间接参与DeepSeekPre-A轮融资,布局AI大模型赛道。据IDC最新报告,基础模型市场将进入整合期,到2029年,企业使用的80%基础模型最多由8家供应商提供。在全球AI军备竞赛加速的背景下,国内如DeepSeek、月之暗面等人才密度高且具备较强算法和压缩AI算力成本技术能力的厂商有望引领国内AI领域的新一轮变革。
小迪说AI
发评论,每天都得现金奖励!超多礼品等你来拿
登录 后,在评论区留言并审核通过后,即可获得现金奖励,奖励规则可见: 查看奖励规则