跳转到内容

DeepSeek-R1

维基百科,自由的百科全书
DeepSeek R1
開發者深度求索
首次发布2025年1月20日,​9個月前​(2025-01-20
当前版本
  • 1.0.0(2025年4月9日;穩定版本)[1]
編輯維基數據鏈接
源代码库 編輯維基數據鏈接
前任DeepSeek-R1-Lite
繼任DeepSeek-V3.1
类型
许可协议MIT
网站www.deepseek.com

DeepSeek-R1深度求索(DeepSeek)于2025年1月20日发布的人工智能大型语言模型,专门适用于数学、编码和逻辑等任务,性能对标OpenAI o1[2]

訓練

[编辑]

DeepSeek-R1-Lite是Deepseek R1的預覽版,于2024年11月20日发布。[3]后于2025年1月20日正式发布发布DeepSeek R1[4]

DeepSeek-R1与DeepSeek-R1-Zero[5]基于DeepSeek-V3-Base,与其共享了相同的架构。而DeepSeek-R1-Distill系列模型则由其他预训练的开放权重模型(包括LLaMAQwen)初始化,然后基于R1生成的合成数据进行微调。[6]

DeepSeek-R1-Zero的训练模板
A conversation between User and Assistant. The User asks a question and the Assistant solves it. The Assistant first thinks about the reasoning process in the mind and then provides the User with the answer. The reasoning process and answer are enclosed within <think>...</think> and <answer>...</answer> tags, respectively, that is, <think> reasoning process here </think><answer> answer here </answer>. User: prompt[註 1]. Assistant:

DeepSeek-R1-Zero仅使用GRPO强化学习进行训练,未使用SFT。与之前的版本不同,它没有使用基于模型的奖励。所有奖励函数均基于规则。主主要分为两种类型(其他类型未具体说明):准确率奖励和格式奖励。准确率奖励用于检查方框内的答案是否正确(针对数学问题)或代码是否通过测试(针对编程问题)。格式奖励用于检查模型是否将其思维轨迹置于<think>...</think>标签内。[6]

DeepSeek-R1的论文中没有公布其训练成本等细节。[8]

不过此前的论文中,深度求索透露其训练使用的是英伟达因为美国出口管制而针对中国市场特供的低配版GPU H800,训练成本为557.6万美元,远低于类似西方公司的闭源模型。[2][9][10]

外界预估R1的训练成本DeepSeek-V3略高,或在600万美元上下。[11]

特點

[编辑]

DeepSeek稱該模型用了強化學習訓練,並為用户展現了 o1 没有公开的完整思考过程。

Deepseek R1 Lite在回答問題前會花更多時間思考,因此準確度會增強。Deepseek的測試結果表明,在數學競賽上的得分與測驗所允許思考的長度緊密相關,而模型思維鍊長度增加展現了更高的效率。[3]

DeepSeek-R1關鍵特點就是便宜,與OpenAI o1的價格相差極大。DeepSeek-R1上线时提供的API服务定价为每百万输入tokens 1元人民幣(缓存命中)/4元(缓存未命中),每百万输出tokens 16元,输出API价格仅仅只有OpenAI o1的3%。[12]

測試成績

[编辑]

Deepseek-R1-Lite在數學、代碼和複雜邏輯推理上,獲得媲美 o1-preview 的推理效果。

美国数学邀请赛中,DeepSeek 稱,該模型在美國邀請數學考試和 MATH 等既定基準上的表現超過了 OpenAI o1 Preview的水平,在國際數學奧林匹克正確率達到83%,

它還在Codeforces編程競賽中優於89%的參賽者,但在GPQA Diamond,LiveCodeBench和自然語言解謎中較為遜色。[13]

應用情況

[编辑]

DeepSeek-R1使用MIT协议开源,意味着任何人都可以自由使用该模型,包括商业用途。

用户可以在DeepSeek官方网站和App使用官方提供的服务。

公共服务

[编辑]

中國

[编辑]

2025年2月起,中国多地政府部门相继将DeepSeek接入政务服务系统,用于公文写作、政策解读等方面[14]

2025年2月8日,广东省深圳市龙岗区政务服务和数据管理局就已经在政务外网部署了DeepSeek-R1模型。

2025年2月16日,深圳市正式为全市各区及各部门提供DeepSeek模型应用服务[15];其中,福田区基于DeepSeek开发了首批70名AI“数智员工”[16][17][18]

2025年2月17日,佛山市“江义村智慧乡村平台”于正式接入DeepSeek[19]

2025年2月18日,北京市丰台区在政务云本地部署DeepSeek大模型[14]

香港

[编辑]

香港生成式人工智能研發中心在DeepSeek的基礎上,開發HKGAI V1人工智能大語言開源基礎模型[20]

HKGAI V1支援粵語、普通話及英語,將DeepSeek本地化、使用香港本地數據[21],全參數微調,並持續訓練。

HKGAI V1涵蓋「港話通」、「港文通」、「港會通」、「港法通」、「港環通」等系統[22][23],當中的「港文通」為生成式人工智能文書輔助應用程式,在超過70個香港政府部門開始試用[24][25]

創新科技及工業局局長孫東表示,期望「港話通」手機版應用程序在2025年内推出[26],並以此提供更有個性化的服務[27]

2025年5月8日,廉政公署向公衆展出「深博士」(英語:Dr. Deep),廉署在DeepSeek的基礎上開發的人工智能模型[28],可提供廉署資訊及防貪建議[29],未來有機會在廉署的分區辦事處、網上或手機使用[30]

其他

[编辑]

瀋陽飛機設計研究所在研發新戰機的過程中,引入了DeepSeek[31]

多家汽車製造商,包括BMW[32]東風汽車比亞迪廣汽零跑[33]本田[34]日產[35],宣佈與DeepSeek合作,將其AI系統和中國版汽車結合。

2025年緬甸地震的救援行動中,中國國家緊急語言服務團與北京語言大學團隊基於DeepSeek的大模型,研發中緬英互譯系統,支援中國國際救援隊進行救災工作[36][37][38],並在未來開源與其他地區使用。

外界反应

[编辑]

1月27日,DeepSeek超越ChatGPT,登顶苹果App Store美国区免费APP下载排行榜。[39]

DeepSeek-R1爆火,引发全球投资者大量抛售人工智能相关股票。1月27日,英伟达美股股价下跌近17%,单日市值蒸发5890亿美元,为美国股市历史上最大。[40][41]

DeepSeek-R1发布后不久,Meta首席执行官马克·扎克伯格就宣布,Meta计划在2025年投入超600亿美元,加大对人工智能的投入。[11]据媒体1月27日报道,Meta成立了四个研究小组,专门研究DeepSeek的模型。[42]其中两个小组研究其开发者如何降低训练和运行DeepSeek的成本,第三个小组研究训练模型可能使用了哪些数据,第四个小组研究基于DeepSeek模型属性重构其LLaMA模型的新技术。[43]

OpenAI表示,其有证据表明DeepSeek使用OpenAI的专有模型来训练自己的开源模型,这违反了OpenAI的服务条款。[44]在R1的Nature论文释出的同行评议文件中,DeepSeek-R1的研究人员称,R1 并没有使用OpenAI专有模型生成的样本但同时承认与大多数的生成模型一样,在训练过程中不可避免地使用了互联网上的由其他AI生成样本[45]

现状与替代方案

[编辑]

由于用户量激增,DeepSeek R1曾面临服务器频繁繁忙问题,主要归因可能有多种,包括算力需求、带宽限制及网络攻击。用户可通过本地部署(如Ollama工具)、调用API或使用第三方平台。

参见

[编辑]

注释

[编辑]
  1. ^ prompt在训练过程中会被具体的推理问题所替换。

参考资料

[编辑]
  1. ^ Release 1.0.0. 2025年4月9日 [2025年6月27日]. 
  2. ^ 2.0 2.1 DeepSeek横空出世,美中AI竞争会迎来根本性改变吗?. 美国之音. 2025-01-28 [2025-01-28]. (原始内容存档于2025-01-28) (中文). 
  3. ^ 3.0 3.1 DeepSeek推理模型预览版上线,解密o1推理过程 | DeepSeek API Docs. api-docs.deepseek.com. [2025-01-29]. (原始内容存档于2025-01-26) (中文(中国大陆)). 
  4. ^ DeepSeek-R1 发布,性能对标 OpenAI o1 正式版. DeepSeek API Docs. 2025-08-21 [2025-09-19] (中文). 
  5. ^ Release DeepSeek-R1 · deepseek-ai/DeepSeek-R1@23807ce. GitHub. [21 January 2025]. (原始内容存档于21 January 2025) (英语). 
  6. ^ 6.0 6.1 DeepSeek-AI; Guo, Daya; Yang, Dejian; Zhang, Haowei; Song, Junxiao; Zhang, Ruoyu; Xu, Runxin; Zhu, Qihao; Ma, Shirong, DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning, 22 January 2025, arXiv:2501.12948可免费查阅 
  7. ^ Guo, Daya; Yang, Dejian; Zhang, Haowei; Song, Junxiao; Wang, Peiyi. DeepSeek-R1 incentivizes reasoning in LLMs through reinforcement learning. Nature (Springer Science and Business Media LLC). 2025-09-17, 645 (8081): 633–638. ISSN 0028-0836. doi:10.1038/s41586-025-09422-z可免费查阅. 
  8. ^ DeepSeek-R1/DeepSeek_R1.pdf at main · deepseek-ai/DeepSeek-R1 (PDF). [2025-02-01]. (原始内容存档 (PDF)于2025-01-29). 
  9. ^ DeepSeek-V3/DeepSeek_V3.pdf at main · deepseek-ai/DeepSeek-V3 (PDF). [2025-02-01]. (原始内容存档 (PDF)于2025-02-01). 
  10. ^ 孙铭蔚. 量化巨头幻方创始人梁文锋参加总理座谈会并发言,他还创办了“AI界拼多多”. 澎湃新闻. 2025-01-22 [2025-01-28]. (原始内容存档于2025-01-26) (中文(中国大陆)). 
  11. ^ 11.0 11.1 吴遇利. DeepSeek“恐惧感”支配硅谷!Meta被曝组建4个小组专门研究. 澎湃新闻. 2025-01-27 [2025-01-29]. (原始内容存档于2025-01-30) (中文(中国大陆)). 
  12. ^ 郑远方. “价格屠夫”DeepSeek的理想主义:开源、降本与AI普惠. 财联社. 2025-01-28 [2025-01-28] (中文(中国大陆)). 
  13. ^ Franzen, Carl. DeepSeek’s first reasoning model R1-Lite-Preview turns heads, beating OpenAI o1 performance. VentureBeat. 2024-11-20 [2025-01-29]. (原始内容存档于2024-11-22) (美国英语). 
  14. ^ 14.0 14.1 多地政务系统接入DeepSeek意味着什么?. 新华网. [2025-02-20]. (原始内容存档于2025-02-18). 
  15. ^ 广州、深圳政务系统接入DeepSeek. 新浪新闻. [2025-02-20]. (原始内容存档于2025-02-25). 
  16. ^ 深圳70名“AI公务员”上岗,公文处理、招商引资等场景均有覆盖. 澎湃新闻. 
  17. ^ 首批“AI公务员”上岗!人类“饭碗”不保?. 新浪财经. [2025-02-20]. (原始内容存档于2025-02-21). 
  18. ^ Oscar. 深圳福田引入 70 個 AI 公務員 基於 DeepSeek R1、錯誤率5% 內. 香港 unwire.hk 玩生活.樂科技. 2025-02-17 [2025-05-15]. (原始内容存档于2025-03-20) (中文(香港)). 
  19. ^ 中国新闻网. 佛山“江义村智慧乡村平台”接入DeepSeek. 腾讯网. [2025-02-20]. (原始内容存档于2025-02-22). 
  20. ^ 科大率先試用首個港產AI大模型HKGAI V1 推動教育創新 | The Hong Kong University of Science and Technology. hkust.edu.hk. [2025-05-15]. (原始内容存档于2025-05-16). 
  21. ^ (有片)香港首個AI模型HKGAI V1誕生 實現DeepSeek系統本地化. 香港文匯網. [2025-05-15]. (原始内容存档于2025-03-23) (zh-Hans-HK). 
  22. ^ DeepSeek本地化 香港首個AI大模型HKGAI V1 誕生 冀年內開放使用 | 智慧生活 | 中國科技. 當代中國. [2025-05-15]. 
  23. ^ 香港生成式人工智能研發中心 於香港國際創科展2025展示多項人工智能科研新成果 | The Hong Kong University of Science and Technology. hkust.edu.hk. [2025-05-15]. 
  24. ^ 創新科技及工業局局長出席香港生成式人工智能研發中心HKGAI V1大模型全球首發發布會致辭全文(只有中文)(附圖). www.info.gov.hk. [2025-05-15]. (原始内容存档于2025-03-18). 
  25. ^ 立法會七題:香港研發的大語言模型. www.info.gov.hk. [2025-05-15]. (原始内容存档于2025-05-16). 
  26. ^ 文維廣. 孫東:手機版「港話通」盡快推出 財赤下更有針對性投資創科. 香港01. 2025-03-10 [2025-05-15] (中文(香港)). 
  27. ^ 「港話通」:助力智慧城市建設與社會進步 文:劉建誠. 堅料網. 2019-05-28 [2025-05-15] (中文(香港)). 
  28. ^ 香港特別行政區廉政公署 - 新聞公佈 - 廉署展覽廳全新亮相 沉浸體驗肅貪經典 智能展現倡廉新知. www.icac.org.hk. [2025-05-15]. (原始内容存档于2025-07-23) (中文(香港)). 
  29. ^ 廉署展覽廳今開放 DeepSeek互動講故事 反貪AI「深博士」登場 葛柏數簿任睇. 大公文匯網. [2025-05-15] (zh-Hans-HK). 
  30. ^ 任葆穎. 廉署胡英明專訪|基於DeepSeek設AI系統 可供市民問有否貪污問題. 香港01. 2025-03-28 [2025-05-15]. (原始内容存档于2025-03-29) (中文(香港)). 
  31. ^ Lawton. 中國引入 DeepSeek 開發新戰機 AI 協助決策系統革新. 香港 unwire.hk 玩生活.樂科技. 2025-05-06 [2025-05-15]. (原始内容存档于2025-06-13) (中文(香港)). 
  32. ^ Lawton. BMW 在中國車款接入 DeepSeek 推動車輛智能化升級. 香港 unwire.hk 玩生活.樂科技. 2025-04-24 [2025-05-15]. (原始内容存档于2025-05-15) (中文(香港)). 
  33. ^ Oscar. DeepSeek 席捲中國汽車市場 東風、比亞迪、上汽紛紛加入 AI. 香港 unwire.hk 玩生活.樂科技. 2025-03-24 [2025-05-15]. (原始内容存档于2025-04-22) (中文(香港)). 
  34. ^ Lawton. Honda 中國車款接入 DeepSeek 並與 Momenta、寧德時代等中國廠商合作. 香港 unwire.hk 玩生活.樂科技. 2025-04-24 [2025-05-15]. (原始内容存档于2025-07-22) (中文(香港)). 
  35. ^ arthur. 日產 N7 搭載 DeepSeek AI 技術 反攻中國市場. 香港 unwire.hk 玩生活.樂科技. 2025-02-13 [2025-05-15]. (原始内容存档于2025-03-20) (中文(香港)). 
  36. ^ Oscar. DeepSeek 應用緬甸地震救災 7 小時開發中英緬互譯系統. 香港 unwire.hk 玩生活.樂科技. 2025-04-02 [2025-05-15]. (原始内容存档于2025-04-23) (中文(香港)). 
  37. ^ DeepSeek、衛星+AI、半機械昆蟲 人工智能助力緬甸地震救災. 香港文匯網. [2025-05-15]. (原始内容存档于2025-07-25) (zh-Hans-HK). 
  38. ^ 緬甸地震︱DeepSeek協助救災 7小時開發中緬英互譯系統. 星島頭條. 2025-04-02 [2025-05-15]. (原始内容存档于2025-04-04) (中文(香港)). 
  39. ^ 李潇潇, 胡含嫣. DeepSeek超越ChatGPT,登顶苹果美国区免费APP下载排行榜. 澎湃新闻. 2025-01-27 [2025-01-29]. (原始内容存档于2025-01-27). 
  40. ^ 日本放送協会. ナスダック大幅下落 中国企業ディープシーク 生成AI開発受け. NHKニュース. 2025-01-28 [2025-01-28]. (原始内容存档于2025-01-30) (日语). 
  41. ^ 何浩. 英伟达市值蒸发近6000亿美元,规模创美股史上最大,市值跌至全球第三. 华尔街见闻. 2025-01-28 [2025-01-28]. (原始内容存档于2025-01-28) (中文(中国大陆)). 
  42. ^ Meta Scrambles After Chinese AI Equals Its Own, Upending Silicon Valley. The Information. 2024-01-27 [2025-01-29]. (原始内容存档于2025-01-30) (英语). 
  43. ^ DeepSeek震撼硅谷 Meta组建四个研究小组专门破解. 财联社. 2025-01-27 [2025-01-29]. 
  44. ^ OpenAI称有证据表明DeepSeek利用其模型训练竞争对手. RFI - 法国国际广播电台. 2025-01-29 [2025-01-29] (中文(简体)). 
  45. ^ Gibney, Elizabeth. Secrets of DeepSeek AI model revealed in landmark paper. Nature. 2025-09-17 [2025-09-18]. ISSN 1476-4687. doi:10.1038/d41586-025-03015-6 (英语). 

外部链接

[编辑]

官方网页

[编辑]

媒体专题

[编辑]