2024年12月15日，上海國家會展中心，青少年選手參加全球青少年人工智能競賽全球總決賽。

張明偉攝（人民圖片）

2024年12月27日，在廣東省深圳市筆架山公園里，小朋友和家長一起使用智能互動屏鍛煉身體。

新華社記者梁旭攝

2024年12月10日，在江蘇省蘇州市國際博覽中心，觀眾在2024全球人工智能產品應用博覽會上體驗手寫翻譯系統(tǒng)。

張從余攝（人民圖片）

2024年9月19日，在浙江省杭州市，參觀者在2024杭州云棲大會上參觀了解相關的AI技術。

龍巍攝（人民圖片）

今年年初，在世界經(jīng)濟論壇2025年年會開幕當天，一款由中國初創(chuàng)企業(yè)——杭州深度求索人工智能基礎技術研究有限公司（以下簡稱“DeepSeek”）發(fā)布的開源模型DeepSeek—R1驚艷了世界。

這一模型在技術上實現(xiàn)了重要突破——用純深度學習的方法讓AI（人工智能）自發(fā)涌現(xiàn)出推理能力。高性價比是該模型的優(yōu)勢。據(jù)該公司介紹，DeepSeek—R1在后訓練階段大規(guī)模使用了強化學習技術，在僅有極少標注數(shù)據(jù)的情況下，極大提升了模型推理能力，用較低的成本達到了接近于美國開放人工智能研究中心（OpenAI）開發(fā)的GPT—o1模型的性能。

不鳴則已，一鳴驚人。DeepSeek的成功，破解了全球人工智能產業(yè)長期以來對“堆算力”的路徑依賴，引發(fā)了人工智能領域的“一場地震”。業(yè)界人士認為，DeepSeek模型是“一座里程碑”，有望激發(fā)一波創(chuàng)新浪潮，推動全球AI繼續(xù)進步。

近年來，以DeepSeek為代表中國國產大模型正在加快發(fā)展步伐。隨著產業(yè)鏈條的完善、使用場景的豐富、市場空間的打開和人才儲備的拓展，中國國產大模型正在形成從技術到應用，再從應用反哺技術創(chuàng)新的完整閉環(huán)。以算力為基，算法為翼，如今，中國國產大模型正通過提質增效的方式錨定AI普惠“新坐標”。

創(chuàng)新：

“小力創(chuàng)造奇跡”

作為一家專注通用人工智能（AGI）的中國科技公司，DeepSeek主攻大模型研發(fā)與應用。DeepSeek—R1是其開源的推理模型，擅長處理復雜任務且可免費商用。

DeepSeek—R1模型能做什么呢？

它可以直接面向用戶或者支持開發(fā)者，提供智能對話、文本生成、語義理解、計算推理、代碼生成補全等應用場景。DeepSeek—R1支持聯(lián)網(wǎng)搜索與深度思考模式，同時支持文件上傳，能夠掃描讀取各類文件及圖片中的文字內容。

如果用一句話總結DeepSeek—R1的技術特點，那便是“小力創(chuàng)造奇跡”。

DeepSeek模型既具備基礎模型的廣泛適應性，又以推理模型的精準性重塑行業(yè)標準。DeepSeek的API（軟件系統(tǒng)間交互的標準化接口，允許開發(fā)者調用其他系統(tǒng)功能而無需理解內部實現(xiàn)細節(jié)）價格遠低于海外頭部大模型，其低成本策略推動了AI技術從“奢侈品”向“日用品”轉型。

2024年12月底，DeepSeek發(fā)布V3模型，其性能與海外頭部大模型相近，但訓練成本極低，整個訓練在2048塊英偉達H800 GPU（圖形處理器）集群上完成，訓練成本550多萬美元。相比之下，訓練GPT—4o等模型，至少要使用上萬塊性能更為優(yōu)越的H100 GPU，訓練成本達到約1億美元。DeepSeek這個土生土長的中國大模型用自己的成功證明：AI大模型的比拼或許并不只靠規(guī)模，更重要的是看實際效果。有句話形象地概括出DeepSeek的優(yōu)勢：“不是GPT用不起，而是DeepSeek更有性價比。”

更為引人關注的是，DeepSeek在架構效率上的提升幅度。通過算法創(chuàng)新，如GRPO（一種專為優(yōu)化大型語言模型設計的強化學習算法）優(yōu)化策略，DeepSeek打破了大模型訓練的“算力依賴”。相比海外頭部大模型，DeepSeek采用混合專家模型，可將任務拆分給多個專用子模塊處理，資源利用率更高，大幅降低了大模型訓練所需的算力要求。

與海外大模型相比，DeepSeek訓練數(shù)據(jù)以漢語為主，對復雜的漢語詞匯和語境處理更為精準，使其文字輸出更為流暢自然，符合漢語環(huán)境。同時，它的邏輯推導過程透明，并支持針對特定場景的深度優(yōu)化。

不同于先發(fā)者的閉源式“護城堡壘”，DeepSeek贏得贊譽的還有它的開源路線。DeepSeek將代碼、模型權重和訓練日志全部公開，降低了中小企業(yè)部署AI的門檻，這一舉動不僅需要格局，更需要勇氣與實力。

“在顛覆性技術面前，閉源形成的護城河是短暫的。即使OpenAI閉源，也無法阻止被別人趕超。”DeepSeek創(chuàng)始人梁文鋒這樣解釋選擇開源的原因，“開源、發(fā)論文，其實并不會失去什么。對于技術人員來說，被follow（追隨模仿）是很有成就感的事。”

英國《金融時報》的對此評論稱，開源模型DeepSeek—R1對全球用戶產生極大吸引力，有利于推動人工智能技術的開發(fā)和應用。文章說，對于大多數(shù)商業(yè)用戶來說，擁有一款足夠可靠并且好用的模型比擁有絕對領先的模型更重要。“并不是每個司機都需要一輛法拉利。像R1這樣模型的推理能力進步，可能會為與客戶互動或處理工作任務的‘智能體’帶來突破性變化”“如果能以更低的成本擁有這些模型，企業(yè)的盈利能力將提升”。美國云軟件企業(yè)賽富時公司的人工智能可持續(xù)發(fā)展主管鮑里斯·加馬扎伊奇科夫認為，DeepSeek推動了人工智能降低能耗的步伐。“它是開源的，其用戶不必預先訓練一個類似大小的模型，而是可以從已有模型開始（研發(fā)），這樣可以節(jié)省大量能源。對全世界來說，這是一件非常好的事情，我希望看到更多像這樣的開源創(chuàng)新。”

開源生態(tài)里，每一行代碼都是創(chuàng)新的火種；協(xié)同創(chuàng)新中，每一個企業(yè)都是生態(tài)的支點。近日，全球知名開源平臺抱抱臉公司等多個團隊已宣布復現(xiàn)了DeepSeek—R1的訓練過程。

通過底層架構創(chuàng)新降低AGI成本，同時以開源策略構建生態(tài)護城河，DeepSeek提供了中小型機構突破算力限制的可行路徑。

“DeepSeek出圈，很好地證明了我們的競爭優(yōu)勢：通過有限資源的極致高效利用，實現(xiàn)以少勝多。中國與美國在AI領域的差距正在縮小。”面壁智能首席科學家劉知遠說。

使命：

“探索未知之境”

一直以來，驅動DeepSeek的目標并非利潤而是使命。正如其公司之名深度求索，“探索未至之境”既是這幫中國本土年輕科技工作者的愿景，也是他們雄心。

“中國也要逐步成為貢獻者。”梁文鋒說，“我們已經(jīng)習慣摩爾定律從天而降，躺在家里18個月就會出來更好的硬件和軟件，Scaling Law（規(guī)模定律）也在被如此對待。但其實，這是西方主導的技術社區(qū)一代代孜孜不倦創(chuàng)造出來的，只因為之前我們沒有參與這個過程，以至于忽視了它的存在。很多國產芯片發(fā)展不起來，也是因為缺乏配套的技術社區(qū)，只有第二手消息，中國必然需要有人站到技術的前沿。”

“我們創(chuàng)新缺少的不是資本，而是信心，以及組織高密度人才的能力。”梁文鋒說。

從技術到愿景，DeepSeek堅定選擇的始終是一條難且正確的路。這也是為什么，即便別國在人工智能領域已坐享先發(fā)優(yōu)勢，后發(fā)者依然有機會憑借技術創(chuàng)新、成本優(yōu)化打破大模型競爭的傳統(tǒng)邏輯，打破人工智能行業(yè)競爭格局，打破“他國更擅長從0到1的原始創(chuàng)新，而中國更擅長從1到10的應用創(chuàng)新”的成見，重塑競爭優(yōu)勢的奧秘。

隨著AI浪潮的襲來，中國科技工作者一直在追夢。“追”不僅僅是“跟”，目的在“超”。不僅是DeepSeek的科研團隊，還有更多的科技工作者推動原始創(chuàng)新和顛覆性創(chuàng)新，腳踏實地潛心研究關鍵核心技術，以科技創(chuàng)新鍛造新質生產力。

1月15日，科大訊飛發(fā)布了當前全國產算力平臺上唯一的深度推理大模型——訊飛星火X1。該模型中文數(shù)學能力國內第一，并率先應用于教育、醫(yī)療等剛需場景。發(fā)布會上，科大訊飛研究院的研究員們依次展示了訊飛星火X1解答高考題以及高中奧賽題的表現(xiàn)。訊飛星火X1不僅準確給出了這些題目的答案，還對解題思路和步驟進行了詳細拆解。與通用大模型相比，其解題過程更接近人類的“慢思考”方式。

“一直以來，訊飛星火堅持走全國產化路線。”科大訊飛相關負責人對記者說，“盡管在全國產算力平臺上訓練深度推理模型遭遇了諸多挑戰(zhàn)，但科大訊飛攜手華為，成功攻克了訓練推理強交互、高吞吐推理優(yōu)化以及國產算子優(yōu)化等一系列難題。”

其他中國公司在其大模型性能方面也取得巨大進步。2024年底，阿里巴巴和騰訊投資的創(chuàng)業(yè)公司月之暗面表示，自己開發(fā)了一個專門研究數(shù)學的模型，性能接近海外頭部大模型。月之暗面創(chuàng)始人楊植麟說：“公司專注于強化學習，也就是模仿人類的試錯過程。這種方法或許能夠在提升模型性能的同時不需要那么多的算力。”

2024年12月，字節(jié)跳動的豆包系列多款大模型選擇在上海首發(fā)，涉及視覺理解、3D生成等領域。“豆包視覺理解模型能精準識別視覺內容，且具備出色的理解和推理能力，可根據(jù)圖像信息進行復雜的邏輯計算，完成分析圖表、處理代碼、解答學科問題等任務。”火山引擎總裁譚待說。首次亮相的還有豆包3D生成模型。如同一套支持AIGC（人工智能生成內容）創(chuàng)作的物理世界仿真模擬器，該模型與云服務平臺火山引擎的數(shù)字孿生平臺結合使用，可以完成智能訓練、數(shù)據(jù)合成和數(shù)字資產制作。

近年來，中國AI技術人才的創(chuàng)業(yè)信心也在不斷提高。國家互聯(lián)網(wǎng)信息辦公室近期發(fā)布的信息顯示，截至2024年12月31日，共有302款生成式人工智能服務在國家網(wǎng)信辦完成備案，其中2024年新增238款備案。

根據(jù)《2024年度人才遷徙報告》，AI相關崗位需求在2024年激增，算法工程師、大模型算法等職位位列熱招榜前20。技術崗位平均月薪前十名中，大模型相關崗位占據(jù)半數(shù)。

“熱愛、扎實的基礎能力，是我們招人的標準。”梁文鋒說，自己在招聘時會挑選并培養(yǎng)幾乎沒什么工作經(jīng)驗的中國頂尖大學應屆畢業(yè)生，“創(chuàng)新需要信心，而年輕人往往更有信心。”

應用：

“全家齊玩AI”

近日，廣東省深圳市龍崗區(qū)在區(qū)政務外網(wǎng)成功部署上線了DeepSeek—R1全尺寸模型（含6710億參數(shù)），并于2月11日在龍崗區(qū)“龍i企”企業(yè)服務小程序正式上線DeepSeek AI助手功能，為企業(yè)提供更加智能、便捷的政務辦理、在線咨詢、政策解讀等高效智能政務服務。

據(jù)悉，“龍i企”接入DeepSeek AI助手功能后，依托海量的政府政策資訊以及政務辦理信息，運用先進的自然語言處理和機器學習技術，為企業(yè)用戶打造了全方位、智能化的服務體系。企業(yè)用戶只需登錄“龍i企”小程序端，在首頁點擊“龍i企AI助手”，即可便捷體驗各類貼心的企業(yè)服務。

“AI+”政務服務，是人工智能賦能千行百業(yè)的一個縮影。對大模型而言，訓練成本每降1個百分點，產業(yè)應用便能擁有更多可能。

今年以來，大眾的AI參與感、討論度、情緒值一齊攀升，“全家老少一起玩AI”成為潮流。百度方言語音搜索的日均調用量中，河南、四川等地下沉用戶占比越發(fā)凸顯，文旅智能體在縣域旅游的使用率也在上升。而就在去年此時，引發(fā)AI熱潮的還是尚未出圈的Sora（海外文生視頻模型），只在從業(yè)者小圈子里引發(fā)了熱議。

截至2024年11月，百度文心大模型的日均調用量超15億次，較2023年增長約30倍。截至2024年12月，豆包通用模型日均tokens（將文本分割為一個個有意義的片段）使用量超4萬億，較7個月前首發(fā)時增長33倍。截至2025年1月，百度文庫AI功能月活用戶突破9000萬，同比增長230%。2025年2月，DeepSeek登頂全球140個國家及地區(qū)的應用市場，DeepSeek的日活躍用戶數(shù)突破3000萬大關……一根根陡峭的增長曲線中，我們可以看見大模型的“真需求”。

DeepSeek的持續(xù)破圈，“點燃”了中國AI產業(yè)鏈。云服務廠商、互聯(lián)網(wǎng)平臺企業(yè)紛紛接入，AI應用等產業(yè)鏈企業(yè)競相使用。

不少產業(yè)鏈中上游企業(yè)爭相“搶灘”DeepSeek。此前，騰訊云、阿里云、百度智能云、火山引擎等國內云計算企業(yè)已宣布對DeepSeek的支持。十余家國產AI芯片企業(yè)也相繼宣布，適配或上架DeepSeek模型服務。

與此同時，包括汽車、金融、智能硬件等不少產業(yè)鏈下游企業(yè)，也持續(xù)展開對DeepSeek系列模型的應用探索。隨著需求與場景的不斷滿足，更多搭載輕量化AI模型的創(chuàng)新型智能硬件密集涌現(xiàn)。

其中，PC外設硬件的接軌速度較快，如部分“AI鼠標”“AI鍵盤”，可一鍵拉起其提供的AI問答頁面，其中包含基于DeepSeek-R1的深度思考選項。AI PC、AI手機同樣是這次DeepSeek浪潮的受益者，如聯(lián)想、華為等品牌，已在其AI智能體中接入了DeepSeek，提供“開箱即用”的AI功能。

眼下，DeepSeek掀起的熱潮還在持續(xù)，“朋友圈”加速擴容，進一步激活人工智能產業(yè)鏈上下游。目前，中國移動、中國聯(lián)通、中國電信等三大運營商均宣布接入DeepSeek模型。與此同時，北京寶蘭德軟件股份有限公司等公司宣布接入文心一言大模型、上海風語筑文化科技股份有限公司等公司宣布接入豆包大模型。

“面向未來，人工智能有三大主戰(zhàn)場：人工智能科學化、計算系統(tǒng)智能化、應用領域廣譜化。一個影響深遠的智能時代，正在向我們走來。”劉知遠說。

j8又粗又硬又大又爽又长国产,色久网站,国产免费自拍视频,无码国产一区流畅有码av,Comwww在线播放,美女网站黄页免费,国产免费观看a∧wwwww.

以算力為基，算法為翼，中國國產大模型以提質增效——

錨定AI普惠“新坐標”

j8又粗又硬又大又爽又长国产,色久网站,国产免费自拍视频,无码国产一区流畅有码av,Comwww在线播放,美女网站黄页免费,国产免费观看a∧wwwww.

以算力為基，算法為翼，中國國產大模型以提質增效——

錨定AI普惠“新坐標”

以算力為基，算法為翼，中國國產大模型以提質增效——