官方网站-首页官方网站-首页

首页
产品中心
解决方案
设计资源
新闻中心
关于我们
| EN
搜索
新闻中心DeepSeek撬开ASIC时代大门?

DeepSeek撬开ASIC时代大门?

来源:电路 发布时间:2025-02-25 10:15:41

近日,DeepSeek研究团队再放(fàng)大(dà)招(zhāo),公(gōng)开(kāi)NSA算(suàn)法(fǎ)。同(tóng)日(rì),马(mǎ)斯(sī)克(kè)发(fā)布(bù)Grok 3模(mó)型(xíng),试(shì)与(yǔ)DeepSeek和(hé)Open AI来(lái)比(bǐ)高(gāo)。此(cǐ)外(wài),Open AI首(shǒu)款(kuǎn)AI ASIC芯(xīn)片(piàn)即(jí)将(jiāng)完(wán)成(chéng),有(yǒu)望(wàng)明(míng)年(nián)量(liàng)产(chǎn).....

DeepSeep之(zhī)风(fēng)正(zhèng)盛(shèng),将(jiāng)全球(qiú)科(kē)技(jì)产(chǎn)业的重心从训练推向AI时代下半程的推理阶段。随着算力需求节节高升,ASIC芯片在这股气势汹涌的浪潮之下,得以有更多机会在定制化场景中大显身手。值此之际,属于ASIC定制化芯片的时代之幕是否由此拉开?

打破AI芯片的旧范式

2025年开年以来,一场由DeepSeek引发的“科技风暴”迅速席卷全球:英伟达称DeepSeek-R1是最先进的大语言模型;亚马逊和微软宣布接入DeepSeek-R1模型;DeepSeek-R1、V3、Coder等系列模型陆续上线国家超算互联网平台;微信宣布接入DeepSeek,上线AI搜索功能......

在各类“DeepSeek”消息满天飞的背后,一方面反映出全球科技企业在这一开源AI模型到来后的焦虑或兴奋,但另一更为深层的原因是:DeepSeek的出现打破了一直以来模型对于硬件算力预设的包袱,或将塑造AI产业发展的全新生态。

芯(xīn)片(piàn)作(zuò)为(wèi)支(zhī)撑(chēng)人(rén)工(gōng)智(zhì)能(néng)发(fā)展的算力底座,与大模型的训练效率和推理速度直接相关,其中自去年下半年迅速崛起的ASIC尤为值得关注。

ASIC芯片是指专为特定应用而设计(jì)的(de)集成(chéng)电(diàn)路。由(yóu)于(yú)ASIC芯(xīn)片(piàn)针(zhēn)对(duì)特(tè)定(dìng)算(suàn)法和应用进行优化设计,它在特定任务上的计算能力强大,通常具有较高的能效比。在AI领域,AI ASIC芯片也叫AI算力专用芯片,是作为人工智能产业链的上游产品之一,为整个人工智能的大模型训练和推理提供算力支撑,主要面向深度学习、神经网络训练/推理等AI任务而定制。DeepSeek 的问世,提供了“极致压缩+高效强化训练+AI推理算力大幅简化”的低成本新模式,推动ASIC时代加(jiā)速(sù)到(dào)来(lái)。

图为中昊芯英高性能TPU芯片“刹那”

“DeepSeek 将软硬件协同优化推向了极致的路径,本质上打破了AI芯片领域‘生态霸权决定市场格局’的旧范式,开启了‘算法定义硬件’的新竞争维度。”中昊芯英解决方案架构师顾立程向《中国电子报》记者表示。

具体而言,DeepSeek对ASIC芯片的影响体现在以下三方面。

一是在技术路线重构方面,产生了架构定义权的转移。过去开发者(zhě)因(yīn)CUDA工(gōng)具(jù)链(liàn)完备性被迫绑定NVIDIA硬件,但DeepSeek绕过了CUDA的优化策略,证明直接操作PTX指令的收益已超越工具链便利性成本,DeepSeek的成功实践验证了算法主导的硬件设计范式(shì),为(wèi)TPU等(děng)ASIC芯(xīn)片(piàn)突(tū)破(pò)生(shēng)态(tài)桎(zhì)梏(gù)提供了方法论。

二是为生态破局提供契机,从"适配生态"到"定义生态"。CUDA生态的依赖降低后,ASIC芯片将能通(tōng)过(guò)提(tí)供(gōng)定(dìng)制(zhì)化(huà)工(gōng)具(jù)链(liàn)、优(yōu)化(huà)编(biān)译(yì)器(qì)等(děng)方(fāng)式(shì),吸(xī)引(yǐn)到(dào)更(gèng)多(duō)开(kāi)发(fā)者(zhě),尤(yóu)其(qí)是(shì)已(yǐ)有(yǒu)意(yì)愿(yuàn)做(zuò)底(dǐ)层(céng)优(yōu)化(huà)的(de)客(kè)户(hù)。此外,AI芯片在架构设计上更能灵活适应新的本土趋势和需求,比如支持动态稀疏计算或(huò)混(hùn)合(hé)精(jīng)度(dù)。

三(sān)是(shì)ASIC芯(xīn)片(piàn)商(shāng)业(yè)价(jià)值(zhí)的(de)跃(yuè)升(shēng),从(cóng)"替(tì)代(dài)品(pǐn)"到(dào)"最(zuì)优(yōu)解(jiě)"。当(dāng)硬(yìng)件(jiàn)性(xìng)能(néng)差(chà)异(yì)足(zú)够(gòu)大(dà)时(shí),细(xì)分(fēn)领(lǐng)域客(kè)户(hù)将(jiāng)更(gèng)愿(yuàn)意(yì)为(wèi)ASIC芯(xīn)片(piàn)的(de)定(dìng)制(zhì)优(yōu)化(huà)方(fāng)案(àn)买(mǎi)单(dān)。尤(yóu)其(qí)是,DeepSeek式技术路线能与国产ASIC芯片协同,通过本土模型与算力厂商间更紧密的合作、更极致的适配优化,为客户提供最具性价比的(de)算(suàn)力(lì)。

算(suàn)力(lì)的(de)风(fēng)吹(chuī)向(xiàng)推(tuī)理(lǐ)

AI计(jì)算(suàn)分(fēn)为(wèi)训(xun)练(liàn)和(hé)推(tuī)理(lǐ)两(liǎng)种(zhǒng)。在(zài)AI大(dà)模(mó)型(xíng)的(de)下(xià)半场,算力需求的重心正在逐步从训练转向推理。在温哥华NeurIPS大会上,OpenAI联合创始人兼前首席科学家Ilya Sutskever曾作出“AI预训练时代将终结”的判断。而DeepSeek的到来,也预(yù)示(shì)着(zhe)这(zhè)一(yī)过(guò)程(chéng)的(de)临(lín)近(jìn)。

就(jiù)在(zài)2月(yuè)18日(rì),DeepSeek研(yán)究(jiū)团(tuán)队(duì)在(zài)海(hǎi)外(wài)社(shè)交(jiāo)平(píng)台(tái)X上(shàng)发(fā)布(bù)了(le)一(yī)篇(piān)关于(yú)NSA(原(yuán)生(shēng)稀(xī)疏(shū)注(zhù)意(yì)力(lì))的(de)技(jì)术(shù)论(lùn)文。一(yī)经(jīng)发(fā)布(bù),迅(xùn)速(sù)引(yǐn)发(fā)广(guǎng)泛(fàn)关注。据悉,新注意力机制NSA专为长文本训练与推理设计,能利用动态分层稀疏策略等方法,通过针对现代硬件的优化设计,显著优化传统AI模型在训练和推理过程中的表现,特别是提升长上下文的推理能力,在保证性能的同时提升了推理速度,并有效降低了预训练成本。

对于ASIC而言,机会蕴藏在从业者阵营的扩张。在ASIC芯片的分支中,TPU和LPU这两类芯片都有望在DeepSeek的浪潮下受益(yì)。

LPU与GPU(来源:Groq官网)

早在今年1月就有消息传出,美国推理芯片公司Groq已经在自己的LPU芯片上实机运行DeepSeek,效率比最新的H100快上一个量级,达到每秒24000token。值得关注的是,Groq曾于2024 年12月在沙特阿拉伯达曼构建了中东地区最大的推理集群,该集群包括了19000个Groq LPU。


而在TPU方面,据产业链相关人士透露,谷歌TPU芯片去年的生产量已经达到280万到300万片之间,成为全球第三大数据中心芯片设计厂商。

随着AI大模型进入“下半场”,逻辑推理成为新的焦点。这一阶段对算力的需求虽然不如训练阶段那么高,但对能效和成本的要求更为严格。ASIC芯片由于其高度优化的设计和针对特定任务的高效性,在AI推理领域具有显著优势。“AI专用芯片(piàn)推(tuī)理(lǐ)服(fú)务(wu)器(qì)的(de)占(zhàn)比(bǐ)将(jiāng)逐(zhú)步(bù)提(tí)升(shēng),这(zhè)将(jiāng)使(shǐ)得(de)AI专(zhuān)用(yòng)芯(xīn)片(piàn)在(zài)推(tuī)理(lǐ)市(shì)场(chǎng)上(shàng)占(zhàn)据(jù)重(zhòng)要(yào)地(de)位(wèi)。”顾(gù)立(lì)程(chéng)表(biǎo)示(shì)。

GPU地(de)位(wèi)被(bèi)撼(hàn)动(dòng)?

DeepSeek的(de)出(chū)圈(quān),最(zuì)先(xiān)带(dài)来(lái)的(de)影(yǐng)响(xiǎng)是(shì)令(lìng)长(zhǎng)期(qī)占(zhàn)据(jù)算(suàn)力(lì)主力(lì)军(jūn)地(de)位(wèi)的(de)GPU陷(xiàn)入(rù)焦(jiāo)虑(lǜ),尤(yóu)其(qí)是(shì)全球(qiú)最(zuì)大(dà)数(shù)据(jù)中(zhōng)心(xīn)GPU供(gōng)应(yīng)商(shāng)英(yīng)伟(wěi)达(dá)的(de)股(gǔ)价(jià)和(hé)市(shì)值(zhí)曾(céng)一(yī)度(dù)下(xià)挫(cuò)。相(xiāng)比(bǐ)之(zhī)下(xià),被(bèi)视(shì)为(wèi)挑(tiāo)战(zhàn)GPU“挑(tiāo)战(zhàn)者(zhě)”的(de)ASIC芯(xīn)片(piàn)则(zé)迎(yíng)来(lái)了(le)更(gèng)上(shàng)一(yī)层(céng)楼(lóu)的(de)时(shí)机(jī)。那(nà)么(me),这(zhè)是(shì)否(fǒu)预(yù)示(shì)着(zhe)未(wèi)来(lái)AI芯(xīn)片(piàn)的(de)版(bǎn)图(tú)将(jiāng)出(chū)现(xiàn)剧(jù)烈(liè)的(de)反(fǎn)转(zhuǎn)?


就(jiù)在(zài)DeepSeek让(ràng)行(xíng)业(yè)对(duì)AI算(suàn)力(lì)需(xū)求(qiú)的(de)视(shì)线(xiàn)中(zhōng)心(xīn)从(cóng)训(xun)练(liàn)转(zhuǎn)向(xiàng)推(tuī)理(lǐ)之(zhī)际(jì),一(yī)个(gè)被(bèi)称(chēng)为(wèi)“杰(jié)文斯(sī)悖(bèi)论(lùn)”的(de)经(jīng)济(jì)学(xué)理(lǐ)论(lùn)被(bèi)业(yè)界(jiè)重(zhòng)新(xīn)提(tí)及(jí)。1865年(nián),经(jīng)济(jì)学(xué)家(jiā)杰(jié)文斯(sī)提(tí)出(chū):当(dāng)技(jì)术(shù)进(jìn)步(bù)提(tí)高(gāo)了(le)效(xiào)率(lǜ),资(zī)源(yuán)消(xiāo)耗(hào)不(bù)仅(jǐn)没(méi)有(yǒu)减(jiǎn)少(shǎo),反(fǎn)而(ér)激(jī)增(zēng)。例(lì)如(rú),瓦(wǎ)特(tè)改(gǎi)良(liáng)的(de)蒸(zhēng)汽(qì)机(jī)让(ràng)煤(méi)炭(tàn)燃(rán)烧(shāo)更(gèng)加(jiā)高(gāo)效(xiào),但(dàn)结(jié)果(guǒ)却(què)是(shì)煤(méi)炭(tàn)需(xū)求(qiú)飙(biāo)升(shēng)。

上(shàng)述(shù)理(lǐ)论(lùn)与(yǔ)当(dāng)下(xià)GPU芯(xīn)片(piàn)遇(yù)到(dào)的(de)情(qíng)况(kuàng)类(lèi)似(shì)。面(miàn)对(duì)“DeepSeek危(wēi)机(jī)”的(de)英(yīng)伟(wěi)达(dá)股(gǔ)价(jià)曾(céng)一(yī)度(dù)大(dà)跌(diē)17%,但(dàn)截(jié)止(zhǐ)2月(yuè)19日(rì)已(yǐ)恢(huī)复(fù)到(dào)此(cǐ)前(qián)高(gāo)位(wèi)水(shuǐ)平(píng),从(cóng)侧(cè)面(miàn)反(fǎn)映(yìng)了(le)AI行(xíng)业(yè)对(duì)GPU芯(xīn)片(piàn)需(xū)求(qiú)的(de)认(rèn)知(zhī)变(biàn)化(huà)。AI推(tuī)理(lǐ)芯(xīn)片(piàn)初(chū)创(chuàng)企(qǐ)业(yè)Groq公(gōng)司(sī)CEO乔(qiáo)纳(nà)森(sēn)·罗(luō)斯(sī)在(zài)近(jìn)日(rì)的(de)访(fǎng)谈(tán)对(duì)此(cǐ)事(shì)发(fā)表(biǎo)了(le)看(kàn)法(fǎ),他(tā)认(rèn)为(wèi)英(yīng)伟(wěi)达(dá)的(de)股(gǔ)票(piào)不(bù)应(yīng)该(gāi)为(wèi)此(cǐ)下(xià)跌(diē)。这(zhè)与(yǔ)市(shì)场(chǎng)的(de)价(jià)值(zhí)衡(héng)量(liàng)无(wú)关,而(ér)只(zhǐ)是市场中一种人气的较量。“实际上,我认为英伟达会卖掉他们生产的每一块用于训练的GPU。你会看到相同数量的 GPU仍然会被售出,但对训练的需求会增加。因为对推(tuī)理(lǐ)的(de)需(xū)求(qiú)越(yuè)多,需要的训练芯片就越多,反之亦然。”

一般来说,被广泛采用的英伟达GPU芯片更多被用来进行AI大模型训练,而到了推理阶段,一些厂商开始着力开发自己的AI推理芯片,其中多为ASIC定制化芯片。不同的是,在DeepSeep助力下,以前行业更关注决定下限的训练阶段,如今或将更多注意力放到决定上限的推理阶段。有业内人士指出,GPU与ASIC之间并非简单的替代关系。

不过,虽然作为开源推理模型的DeepSeek令推理需求受到更多关注,但ASIC芯片的崛起将在训练和推理两个角度都会对算力芯片的竞争格局带来深远变化‌。

从训练角度(dù)来(lái)看(kàn),过(guò)去(qù)传(chuán)统GPU凭借其强大的并行计算能力,在AI训练阶段占据了主导地位。然而,AI专用芯片针对特定场景设计,在拥有配套的软硬件全栈生态下,AI专用芯片算力集群的算力利用效率更高,功耗更低。随着软件生态的逐步成熟,AI专用芯片有望更广泛地应用于AI训练,与传统GPU形成竞争态势‌。另外,随着AI专用芯片使用的规模扩大,也会让AI专用芯片的单芯片成本逐渐降低,为智算中心建设带来切切实实的采购成本降低,并提升了应用端的能力‌。

“AI专用芯(xīn)片(piàn)的(de)崛(jué)起(qǐ)将使得算力芯片的竞争格局更加(jiā)多元化和复杂化。”在顾立程看来,在训练和推理两个领域,AI专用芯片都将与GPU展开激烈竞争,挑战其霸主地位(wèi)。同时,AI专用芯片的应用前(qián)景(jǐng)也(yě)极(jí)为广阔,有望在数据中心、云计算、人工智能等多个领域发挥重要作用‌。