【高新產(chǎn)業(yè)鏈觀察】DeepSeek模型創(chuàng)新技術(shù)路線,推動我國人工智能產(chǎn)業(yè)跨越式發(fā)展
本次DeepSeek在模型層面的突破,折射出我國AI產(chǎn)業(yè)從“技術(shù)跟跑”到“技術(shù)并跑”的跨越式發(fā)展,正深刻改變中國人工智能產(chǎn)業(yè)的發(fā)展格局。
新華財經(jīng)北京2月13日電(分析師刁倩)2025年春節(jié)前夕,DeepSeek作為中國本土科創(chuàng)企業(yè)的代表,推出開源通用人工智能模型DeepSeek-V3和R1系列。該模型一經(jīng)推出,其創(chuàng)新技術(shù)路線所帶來的低成本、高性能引全球關(guān)注。本次DeepSeek在模型層面的突破,折射出我國AI產(chǎn)業(yè)從“技術(shù)跟跑”到“技術(shù)并跑”的跨越式發(fā)展,正深刻改變中國人工智能產(chǎn)業(yè)的發(fā)展格局。
一、DeepSeek春節(jié)推出R1模型,技術(shù)優(yōu)化與低成本優(yōu)勢引全球矚目
國產(chǎn)開源大模型DeepSeek于春節(jié)前夕推出R1模型。2025年1月20日,幻方量化旗下AI公司深度求索(DeepSeek)正式發(fā)布DeepSeek-R1模型。在數(shù)學(xué)、代碼、自然語言推理等任務(wù)上,該模型性能比肩OpenAI o1正式版。DeepSeek表示,R1在后訓(xùn)練階段大規(guī)模使用了強化學(xué)習(xí)技術(shù),在僅有極少標(biāo)注數(shù)據(jù)的情況下,極大提升了模型推理能力。有分析指出,DeepSeek在推理能力上與OpenAI的GPT-4相媲美,在解決數(shù)學(xué)難題、分析復(fù)雜的法律條文等方面展現(xiàn)出強大的實力。據(jù)北京日報,2月8日QuestMobile數(shù)據(jù)顯示,DeepSeek在1月28日的日活躍用戶數(shù)首次超越豆包,隨后在2月1日突破3000萬大關(guān),成為史上最快達成這一里程碑的應(yīng)用。
傳統(tǒng)觀點認為,AI性能提升依賴參數(shù)和算力的增加,而DeepSeek通過算法優(yōu)化證明,高效架構(gòu)與訓(xùn)練策略同樣能實現(xiàn)高性能,其技術(shù)優(yōu)化引全球矚目。浙江財經(jīng)大學(xué)人工智能研究院院長張文宇指出,DeepSeek的破局之道在于“四兩撥千斤”,其研發(fā)團隊通過把數(shù)據(jù)進行總結(jié)和分類,經(jīng)過選擇性投喂與處理之后,輸送給大模型,提高了訓(xùn)練效率。
IBM院士(IBM Fellow) Kush Varshney對此表示,“真正令人印象深刻的是DeepSeek模型的推理能力。推理模型本質(zhì)上是自我驗證或檢查,代表了一種‘元認知’或‘關(guān)于思考的思考’。 我們正開始將智慧融入到這些模型中,這是巨大的進步?!?/p>
在算力方面,張文宇表示,面對美國芯片禁令,其研發(fā)團隊對低配版GPU集群(甚至多源異構(gòu)算力)進行智能管理,對CPU、GPU甚至邊緣計算設(shè)備進行協(xié)同調(diào)度,打破了“大力才能出奇跡”的算力魔咒。
算力的優(yōu)化也帶來了DeepSeek的低成本優(yōu)勢。據(jù)DeepSeek技術(shù)報告,DeepSeek-V3的訓(xùn)練成本僅為557.6萬美元,訓(xùn)練使用的是算力受限的英偉達H800 GPU集群(使用2048塊H800 GPU)。該成本遠低于OpenAI的GPT-4(1-2億美元)和谷歌的Gemini(2億美元)。同時,DeepSeek不僅將R1訓(xùn)練技術(shù)全部公開,還蒸餾了6個小模型開源給社區(qū),允許用戶借此訓(xùn)練其他模型。API價格方面,每百萬輸入tokens 1元(緩存命中)/4元(緩存未命中),每百萬輸出tokens 16元,較o1正式版低27-55倍。這種成本控制能力不僅為中國企業(yè)提供了戰(zhàn)略優(yōu)勢,還可能迫使國際巨頭調(diào)整技術(shù)路徑和定價策略。
二、我國人工智能產(chǎn)業(yè)快速發(fā)展,DeepSeek在核心技術(shù)層嶄露頭角
近年來,我國加大對人工智能產(chǎn)業(yè)的頂層設(shè)計以及政策支持。2022年8月,科技部發(fā)布《關(guān)于支持建設(shè)新一代人工智能示范應(yīng)用場景的通知》,旨在充分發(fā)揮人工智能賦能經(jīng)濟社會發(fā)展的作用,支持一批基礎(chǔ)較好的人工智能應(yīng)用場景。2022年12月,中共中央、國務(wù)院印發(fā)《擴大內(nèi)需戰(zhàn)略規(guī)劃綱要(2022-2035年)》,明確要求“推動人工智能、先進通信、集成電路、新型顯示、先進計算等技術(shù)創(chuàng)新和應(yīng)用”,為人工智能產(chǎn)業(yè)的發(fā)展提供長期規(guī)劃指導(dǎo)。2024年1月,工信部等七部門發(fā)布的《關(guān)于推動未來產(chǎn)業(yè)創(chuàng)新發(fā)展的實施意見》,明確利用人工智能等技術(shù)精準(zhǔn)識別和培育高潛能未來產(chǎn)業(yè),支撐推進新型工業(yè)化。同時,安全監(jiān)管與創(chuàng)新發(fā)展并重。2023年5月,國家網(wǎng)信辦、國家發(fā)展改革委等七部門發(fā)布《生成式人工智能服務(wù)管理暫行辦法》,對生成式人工智能服務(wù)實施包容審慎和分類分級監(jiān)管,規(guī)范行業(yè)發(fā)展秩序。
從產(chǎn)業(yè)鏈情況來看,人工智能產(chǎn)業(yè)包含了基礎(chǔ)層、技術(shù)層和應(yīng)用層,其中最核心是技術(shù)層。人工智能產(chǎn)業(yè)的技術(shù)層涵蓋了算法、模型、數(shù)據(jù)處理等一系列核心技術(shù),比如機器學(xué)習(xí)、深度學(xué)習(xí)和自然語言處理等,是推動人工智能發(fā)展的關(guān)鍵。相比之下,基礎(chǔ)層雖然為人工智能提供底層支撐,包括計算資源、數(shù)據(jù)資源和基礎(chǔ)軟硬件等,但并不直接構(gòu)成人工智能的核心?。而應(yīng)用層則是人工智能技術(shù)的最終體現(xiàn),將人工智能技術(shù)應(yīng)用于各個領(lǐng)域,如智能制造、智能家居、智慧醫(yī)療等,更多地是依賴于技術(shù)層提供的核心技術(shù)支持。因此,技術(shù)層作為人工智能產(chǎn)業(yè)鏈的核心,對于推動整個人工智能產(chǎn)業(yè)的發(fā)展具有至關(guān)重要的作用。
我國人工智能的發(fā)展更側(cè)重于應(yīng)用層技術(shù),“人工智能+”與千行百業(yè)深度融合,成為經(jīng)濟轉(zhuǎn)型升級的新支點。據(jù)工信部數(shù)據(jù)顯示,2024年底,我國人工智能核心產(chǎn)業(yè)規(guī)模接近6000億元,這表明我國在AI應(yīng)用層已經(jīng)實現(xiàn)全面領(lǐng)跑。目前,我國人工智能技術(shù)已在安防監(jiān)控、智能家居及教育培訓(xùn)等領(lǐng)域落地生根,圖像識別、語音識別、自動駕駛等專利數(shù)量和商業(yè)化落地能力也非常突出。但在基礎(chǔ)層和技術(shù)核心層,比如芯片架構(gòu)和核心算法仍依賴進口,國產(chǎn)AI芯片雖進步顯著,但整體技術(shù)水平與國外差距較大。
本次DeepSeek在模型層面的突破,是我國本土科創(chuàng)企業(yè)在人工智能產(chǎn)業(yè)核心領(lǐng)域的嶄露頭角。浙江財經(jīng)大學(xué)信息技術(shù)與人工智能學(xué)院院長張帥表示,與OpenAI、智譜、百度等打造“全能大模型”的方式不同,DeepSeek的突破在于重新定義技術(shù)路線,并進行了基于群智協(xié)同的系統(tǒng)級工程優(yōu)化,主要包括混合專家模型、負載均衡、多頭潛在注意力機制、大小模型協(xié)同、強化學(xué)習(xí)推理,以及諸如FP8混合精度和負載均衡、通信優(yōu)化、內(nèi)存優(yōu)化、計算優(yōu)化等工程優(yōu)化方法。
三、上下游產(chǎn)業(yè)鏈加速適配,DeepSeek推動我國AI產(chǎn)業(yè)跨越式發(fā)展
DeepSeek讓AI迎來了“破圈”時刻,上下游產(chǎn)業(yè)鏈企業(yè)迅速行動起來。首先是云廠商,自2月1日起,華為云、阿里云、百度智能云、字節(jié)火山引擎、騰訊云等國內(nèi)主要云廠商紛紛宣布上線DeepSeek模型,面向開發(fā)者和企業(yè)客戶提供模型部署服務(wù),降低了企業(yè)AI應(yīng)用門檻。緊隨其后的是各大國產(chǎn)芯片廠商。目前已有十?dāng)?shù)家國產(chǎn)芯片宣布完成了對DeepSeek模型的適配和上線,包括沐曦、天數(shù)智芯、摩爾線程、壁仞科技等。由于DeepSeek打破了對高算力的約束限制,國產(chǎn)芯片的利用率將會得到極大的提升,對于芯片產(chǎn)業(yè)都是重大利好。
隨著中上游的積極部署,下游的AI應(yīng)用層也開始行動起來。智能硬件、汽車、金融等各行各業(yè)都在積極接入DeepSeek模型,希望借助其能力來升級自身服務(wù)。在金融領(lǐng)域,國泰君安、國金證券、中泰證券、興業(yè)證券、國元證券、華福證券等多家券商陸續(xù)官宣,已完成DeepSeek-R1模型的本地化部署。在醫(yī)療領(lǐng)域,恒瑞醫(yī)藥、醫(yī)渡科技等多家醫(yī)療公司宣布“牽手”DeepSeek,推動AI醫(yī)療加速落地。在制造領(lǐng)域,海爾集團已完成DeepSeek大語言模型和多模態(tài)模型的集成,并提供企業(yè)私有化部署解決方案,加速企業(yè)數(shù)字化轉(zhuǎn)型。在通訊領(lǐng)域,中國移動、中國電信、中國聯(lián)通三家基礎(chǔ)電信企業(yè)均全面接入DeepSeek開源大模型,實現(xiàn)在多場景、多產(chǎn)品中的應(yīng)用。
張文宇指出,DeepSeek的成果標(biāo)志著我國AI大模型首次與國際頂尖水平并駕齊驅(qū),更折射出我國AI產(chǎn)業(yè)從“技術(shù)跟跑”到“技術(shù)并跑”的跨越式發(fā)展。但他也指出,雖然我國在AI應(yīng)用層處于國際領(lǐng)跑,在AI技術(shù)層處于國際并跑,但在AI基礎(chǔ)層仍處于國際跟跑。無論是OpenAI還是DeepSeek,它們都基于美國谷歌公司在2017年提出的Transformer架構(gòu),因此皆不屬于“從0到1”的顛覆性基礎(chǔ)理論創(chuàng)新,均屬于“從1到100”的大規(guī)模工程整合創(chuàng)新。
張文宇表示,DeepSeek的創(chuàng)新是包含了一種從架構(gòu)設(shè)計到工程優(yōu)化的全流程、系統(tǒng)級技術(shù)突破與創(chuàng)新。DeepSeek的啟示在于:中國AI的崛起,本質(zhì)上是一場大規(guī)模系統(tǒng)級工程創(chuàng)新的勝利。它證明在既有技術(shù)框架下,通過工程優(yōu)化與路徑創(chuàng)新,完全可能實現(xiàn)局部超越。但真正的“領(lǐng)跑”,仍需攻克基礎(chǔ)層的“卡脖子”難題——從Transformer到下一代AI架構(gòu),從數(shù)據(jù)標(biāo)注標(biāo)準(zhǔn)到算力芯片自主,每一個“從0到1”的突破都將重塑全球AI的競爭格局。
目前,中國在AI應(yīng)用層和市場規(guī)模上已形成獨特優(yōu)勢,尤其在行業(yè)賦能和商業(yè)化效率上領(lǐng)先;但國外在基礎(chǔ)技術(shù)、全球產(chǎn)業(yè)鏈控制力和高端人才方面仍占主導(dǎo)。未來競爭焦點將集中在基礎(chǔ)技術(shù)突破(如量子計算與AI芯片)、國際標(biāo)準(zhǔn)制定權(quán)及數(shù)據(jù)治理規(guī)則上。這需要中國科技人才在基礎(chǔ)研究、特別是“從0到1”的基礎(chǔ)創(chuàng)新上付出更多的定力、花費更大的功夫。
DeepSeek模型創(chuàng)新技術(shù)路線,推動我國人工智能產(chǎn)業(yè)跨越式發(fā)展.pdf
?
編輯:杜少軍
?
聲明:新華財經(jīng)為新華社承建的國家金融信息平臺。任何情況下,本平臺所發(fā)布的信息均不構(gòu)成投資建議。如有問題,請聯(lián)系客服:400-6123115