官方网站-首页两年前,ChatGPT点燃了全球生成式AI技术研发热潮,端侧AI应运而生。近两个月以来,DeepSeek以开源之姿,再次在全球人工智能领域掀起一股AI新潮。在AI大潮的诸多“弄潮儿”中,端侧AI率先冲刺,助推AI应用进一步落地。
就在端侧AI发展黄金期到来之际,作为硬件基础的芯片,通过算力优化和场景适配成为其中的核心驱动力;与此同时,率先布局的相关企业将有望吃到端侧AI爆发的第一波红利。

苹果M3 Ultra机型可为大语言模型导入庞大数据集
端侧AI奏响“集结号”
近期,端侧AI在多领域落地的动作不断。消费电子领域,联想于2月25日发布其AI PC新品YOGA 2025系列,本地部署DeepSeek-7B,成为全球首家在终端设备上部署此规模大模型的厂商。3月5日,苹果时隔两年重磅更新的Mac Studio配备了全新M3 Ultra和M4 Max芯片两个版本,苹果宣称 M3 Ultra 版本 Mac Studio 支持本地部署 6000亿参数的AI大模型运行。此外,近日华为的AI PC也传出新消息,预计其自研商(shāng)用(yòng)AI笔(bǐ)记(jì)本(běn)将(jiāng)在(zài)四(sì)月(yuè)发(fā)布(bù),除(chú)了(le)搭(dā)载(zài)全面(miàn)集成(chéng)的(de)DeepSeek大(dà)模(mó)型(xíng),其(qí)芯(xīn)片(piàn)及(jí)零(líng)部(bù)件(jiàn)或(huò)将(jiāng)实(shí)现(xiàn)全自(zì)研(yán)。
汽(qì)车(chē)领(lǐng)域,小(xiǎo)米(mǐ)SU7 Ultra于(yú)2月(yuè)27日(rì)上(shàng)市(shì),雷(léi)军(jūn)通(tōng)过(guò)微(wēi)博(bó)宣(xuān)布(bù)Xiaomi HAD端(duān)到(dào)端(duān)全场(chǎng)景(jǐng)智(zhì)驾(jià)开(kāi)启(qǐ)全量推送,小米SU7 Ultra出厂即搭载该智驾系统。吉利在3月3日的AI智能科技发布会上宣布完成全域AI智能化布局,其中阶跃星辰提供通用大模型技术,与吉利联合开源多模态交互框架,实现文本、语音、图像数据的融合理解。此外,吉利自研的超级智算中心2.0,算力(lì)资(zī)源(yuán)超(chāo)越(yuè)万(wàn)卡(kǎ),综(zōng)合(hé)算(suàn)力(lì)达(dá)到(dào)23.5EFLOPS。
事(shì)实(shí)上(shàng),除(chú)了(le)上(shàng)述(shù)高(gāo)热(rè)度(dù)的(de)领(lǐng)域,端(duān)侧(cè)AI还(hái)在(zài)涉(shè)及(jí)面(miàn)更(gèng)加(jiā)广(guǎng)阔(kuò)的(de)IoT等(děng)领(lǐng)域加速落地。例如,今年2月,深思考人工智能在全球开发者大会上正式发布鸿蒙系统TinyDongni& deepseek超小端侧多模态大模型及硬件模组,并联合国产模组厂商推出两大解决方案,一方面为车载、机器人等场景提供实时AI处理能力,另一方面赋能工业检测、AI摄像头等高精度场景。深思考创始人& CEO杨志明表示,超小端侧多模态大模型及硬件模组的发布,不仅是技术的突破,更是端侧AI普惠化的里程碑。未来将持续优化多模态交互能力,推动AI在医疗、工业、消费等领域的深度应用。
“得益于算力与模型优化,端侧人工智能的进步速度将呈现指数级跃升。”联想集团董事长兼CEO 杨元庆认为,两者进步的叠加效应有望在未来12个月实现3倍的整体性能提升。

联想三折叠AI PC概念机
高质量AI模型是普及关键
大模型纷纷部署于端侧之际,科技企业高调发力端侧AI,相关产品和应用纷纷上市。这背后的动作并不算新鲜,但根本动力却与以往大不相同。那么,端侧AI落地,时机是否已经成熟?
在AI百模大战的时代,焦点在云数据中心的集中式训练,但AI释放价值的关键更多在于推理。
“AI推理将从云端下沉到我们身边,无处不在。”Arm物联网事业部业务拓展副总裁马健告诉记者解释道,如果我们生活在连接带宽无限大、延时无限低(dī)、成(chéng)本(běn)接(jiē)近(jìn)零(líng)的(de)世(shì)界(jiè),那(nà)么(me)AI部(bù)署(shǔ)在(zài)集中(zhōng)式(shì)数(shù)据(jù)中(zhōng)心(xīn)是(shì)最(zuì)有(yǒu)效(xiào)的(de)。但(dàn)是(shì)这(zhè)个(gè)假(jiǎ)设(shè)并(bìng)不(bù)成(chéng)立(lì),来(lái)自(zì)海(hǎi)量(liàng)传(chuán)感(gǎn)器(qì)、摄(shè)像(xiàng)头(tóu)的(de)视(shì)觉(jué)、声(shēng)音(yīn)等(děng)数(shù)据(jù)都(dōu)回(huí)传(chuán)到(dào)云(yún)端(duān)是(shì)不(bù)现(xiàn)实(shí)的(de),尤(yóu)其(qí)是(shì)在(zài)对(duì)延(yán)时、隐私以及可靠性有严格要求的场景,边缘AI势在必行。
以DeepSeek为代表的开源模型,加速了AI从云走向端的进程,其带来的影响之一就是支持边缘设备,使得高性能AI应用能够在边缘设备上顺利运行。达摩院首席科学家、知合计算CEO孟建熠指出,大模型在云端的话,实施成本比较高,只有有限的企业可能在部分领域应用,而一旦到了(le)端(duān)侧(cè),就(jiù)有(yǒu)大(dà)量(liàng)的(de)应(yīng)用(yòng)都(dōu)会(huì)发(fā)展(zhǎn)起(qǐ)来(lái)。
从(cóng)目(mù)前(qián)的(de)一(yī)些(xiē)趋(qū)势(shì)来(lái)看(kàn),终(zhōng)端(duān)AI模(mó)型(xíng)的(de)质(zhì)量(liàng)、性(xìng)能(néng)和(hé)效(xiào)率(lǜ)正(zhèng)在(zài)显(xiǎn)著(zhe)提(tí)高(gāo)。为(wèi)此(cǐ),高(gāo)通(tōng)高(gāo)级(jí)副(fù)总(zǒng)裁(cái)兼(jiān)技(jì)术(shù)规(guī)划(huà)和(hé)边(biān)缘(yuán)解(jiě)决(jué)方(fāng)案(àn)业(yè)务(wu)总(zǒng)经(jīng)理(lǐ)马(mǎ)德(dé)嘉(jiā)(Durga Malladi)以(yǐ)及(jí)市(shì)场(chǎng)资(zī)深(shēn)经(jīng)理(lǐ)Jerry Chang在(zài)其(qí)博(bó)文中(zhōng)从(cóng)以(yǐ)下(xià)四(sì)方(fāng)面(miàn)进(jìn)行(xíng)了(le)总(zǒng)结(jié)。
首(shǒu)先(xiān),当(dāng)前(qián)先(xiān)进(jìn)的(de)AI小(xiǎo)模(mó)型(xíng)已具有卓越性能。模型蒸馏和新颖的AI网络架构等新技术能够在不影响质量的情况下简化开发流程,让新模型的表现超越一年前推出的仅能在云端运行的更大模型。其次,模型参数规模正在快速缩小。先进的量化和剪枝技术使开发者能够在不对准确性产生实质影响的情况下,缩小模型参数规模。第三,开发者能够在边缘侧打造更丰富的应用。高质量AI模型快速激增,意味着文本摘要、编程助手和实时翻译等特性在智能手机等终端上的普及,让AI能够支持跨边缘侧规模化部署的商用应用。第四,AI正在成为新的UI。个性化多模态AI智能体将简化交互,高效地跨越各种应用完成任务。

搭载瑞芯微SOC芯片的桌面机器人可作为智能家居的主控中心
芯片是新周期核心驱动力
虽然DeepSeek等大模型通过技术革新降低了端侧AI的门槛,但不足以构成端侧AI起飞的充分条件。作为硬件基础的芯片,通过算力优化和场景适配成为端侧AI落地的核心驱(qū)动(dòng)力(lì)。
对(duì)于(yú)硬(yìng)件(jiàn)玩(wán)家(jiā)来(lái)说(shuō),端(duān)侧(cè)形(xíng)态(tài)各(gè)异(yì)的(de)设(shè)备(bèi)与(yǔ)丰(fēng)富(fù)应(yīng)用(yòng),蕴(yùn)藏(cáng)着(zhe)巨(jù)大(dà)的(de)市(shì)场(chǎng)空(kōng)间(jiān)。为(wèi)此(cǐ),相(xiāng)关芯(xīn)片(piàn)企业争相在端侧AI领域布局。
大模型、智能体在边缘侧的落地需要具备更高性能和能效的边缘计算平台。2月底,Arm发布新一代边缘AI计算平台Armv9,可运行超10亿参数的端侧AI模型。此外,Arm近日与阿里巴巴合作,通过 KleidiAI 与通义千问模型的集成,加速端侧多模态AI体验。多年前高通就已经为此做了准备。高通早在十五年前就开始在终端侧开展针对AI的研究,其AI引擎已迭代到第十代;去年3月推出AI HUB,帮助不同开发者优化模型,使其部署在不同平台上。
对于芯片企业而言,通过硬件创新推动端侧AI市场向上攀升的同时,也让自身吃到更多红利。以我国AIoT芯片领域的代表性企业瑞芯微为例,其在端侧AI方面可提供从0.2TOPs到6TOPs的不同算力水平的AIoT芯片。据悉,当前已有多个领域的客户基于瑞芯微主控芯片研发在端侧支持AI大模型的新硬件,如教育平板、AI 玩具、桌面机器人、算力终端、会议主机等产品。根据瑞芯微公布的2024年业绩预告,预计其2024年营收31亿元到31.5亿元,同比增长45.23%到47.57%;预计实现净利润5.5亿到6.3亿元,同比增长307.75%到367.06%。业绩增长背后,是AI技术快速发展、应用场景不断拓展对AIoT业务的带动。
业内人士向记者表示,端侧AI芯片的核心需求包括低功耗、高能效比和灵活适配多样化场景。伴随端侧AI发展黄金期的到来,芯片行业在推动AI应用普及的同时,将拥有更多成长机会。