編者按:

深圳的創(chuàng)新密碼,藏在最微觀的科創(chuàng)脈絡(luò)之中。從實(shí)驗(yàn)室的技術(shù)突破,到產(chǎn)線的規(guī);涞;從政策試點(diǎn)到場景應(yīng)用——每一次科技躍遷,都在激蕩起產(chǎn)業(yè)的時(shí)代浪潮。央廣網(wǎng)深圳頻道特別策劃推出《科創(chuàng)“圳”時(shí)代》,通過深度拆解鮮活樣本,解碼“科技+產(chǎn)業(yè)”的深圳路徑,見證深圳科技的每一次“振翅”,感知城市最強(qiáng)勁的創(chuàng)新脈搏。

央廣網(wǎng)深圳5月19日消息(記者 孔明 見習(xí)記者 鐘金秀 實(shí)習(xí)記者 梁秀美)2026全球人工智能終端展暨第七屆深圳國際人工智能展覽會(huì)(以下簡稱“人工智能終端展”)在深圳剛剛落下帷幕,喧囂散去,空氣中沉淀下來的,卻是一種前所未有的務(wù)實(shí)與焦慮。它徹底告別了前兩年“只賺吆喝不賺錢”的技術(shù)狂歡,猛然向全行業(yè)推開了一扇“算總賬”的大門。一個(gè)殘酷的現(xiàn)實(shí)擺在面前:智能體在臺(tái)前運(yùn)行得越是歡暢,幕后Token的消耗量就越是一個(gè)令人窒息的天文數(shù)字。

高昂的GPU顯存、被卡脖子的先進(jìn)晶圓,以及那道難以跨越的“內(nèi)存墻”,宛如三道緊緊扣死的枷鎖,共同構(gòu)成了本屆展會(huì)上,全行業(yè)都在負(fù)重尋找解法的“高價(jià)Token”成本死結(jié)。如何踏平這道高聳的存力高墻,真正讓居高不下的Token成本“退燒”?

面對這個(gè)行業(yè)痛點(diǎn),深圳再次展現(xiàn)出獨(dú)特的創(chuàng)新速度與供應(yīng)鏈韌性。在“人工智能終端展”上,一家來自深圳福田的國家級專精特新“小巨人”企業(yè)——銓興科技,用一種以柔克剛、虛實(shí)結(jié)合、借力打力的“深圳式創(chuàng)新”方案,開啟了一場關(guān)乎技術(shù)平權(quán)與商業(yè)落地的“深南突圍”。

銓興科技的展臺(tái)(央廣網(wǎng)發(fā) 主辦方供圖)

拐點(diǎn)已至:高價(jià)Token背后的“存儲(chǔ)窒息”

當(dāng)AI浪潮洶涌而來之際,銓興科技并非赤手空拳,他們手里握著存儲(chǔ)芯片從設(shè)計(jì)到制造全產(chǎn)業(yè)鏈的“通關(guān)密碼”。大模型引爆的算力狂潮,讓無數(shù)資本與企業(yè)如過江之鯽般涌入算力中心。在這場圍獵算力紅利的基建狂潮中,既做內(nèi)存又做閃存的銓興科技,瞬間被推到了風(fēng)口的最前線:數(shù)據(jù)中心擴(kuò)容帶來的服務(wù)器級內(nèi)存與大容量企業(yè)級SSD需求呈井噴態(tài)勢,直接化作源源不斷的訂單,推著銓興的云端業(yè)務(wù)迎來了幾何級數(shù)的狂飆,結(jié)結(jié)實(shí)實(shí)地啃下了AI時(shí)代的第一波紅利。然而,隨著這場軍備競賽走向白熱化,天價(jià)的算力賬單很快讓很多企業(yè)感到陣痛,開始高呼吃不消。

“AI絕對是未來的超級風(fēng)口,而且AI跟存儲(chǔ)天然綁定,接下來的大卡點(diǎn)一定在存儲(chǔ)上!比蜷W存控制芯片巨頭群聯(lián)電子董事長潘建成的這番斷言,讓銓興科技總經(jīng)理郭威成在有些“懵懵懂懂”的狀態(tài)下,一腳跨進(jìn)了未知的深水區(qū)。

“其實(shí)你會(huì)發(fā)現(xiàn),大量算力實(shí)際上是在浪費(fèi)的!币?yàn)榇鎯?chǔ)帶寬和算力架構(gòu)的嚴(yán)重失衡,數(shù)據(jù)在計(jì)算核心與存儲(chǔ)單元之間的傳輸速度根本跟不上步調(diào),導(dǎo)致芯片空有澎湃的算力,卻因“內(nèi)存墻”的阻隔拿不到數(shù)據(jù),被迫陷入了痛苦的饑餓與空轉(zhuǎn)之中。

既然如此,能不能反向操作?用團(tuán)隊(duì)深耕存儲(chǔ)30年的深厚底蘊(yùn),把算力硬生生從云端拉回本地,把高昂的云端Token成本給砸下來?

借力打力:用“日常電力”對沖“Token賬單”

“Token的產(chǎn)出基本上來自云端。但我們發(fā)現(xiàn)并非所有問題都需要云端來解決!痹诟吆啊叭f物皆上云”的時(shí)代,人們習(xí)慣了哪怕問一個(gè)極其簡單的問題,也要?jiǎng)佑孟暮A繀?shù)的云端超級大模型,這無疑是“大炮打蚊子”,在白白浪費(fèi)大量算力資源的同時(shí),也讓企業(yè)支付了高昂的算力成本。

為了打破這個(gè)僵局,銓興科技用一套“混合模型協(xié)同”的思路,重塑了產(chǎn)業(yè)的分工邏輯:把簡單的問題留給本地端的小模型來消化,只有遇到復(fù)雜問題時(shí)再移交給云端。在這個(gè)精妙的架構(gòu)里,云端大模型退到幕后,成了一個(gè)高階的“導(dǎo)師”,而在前線沖鋒陷陣的則是輕量化的本地小模型,回答不了再逐層往后走。

最讓人松一口氣的是,這個(gè)方案完全不需要獨(dú)立的GPU顯卡,直接借力英特爾、海光的集成顯卡就能流暢運(yùn)行,350億參數(shù)的模型已經(jīng)可以直接部署在用戶的本地設(shè)備中。這意味著,在不需要額外花錢購買云端Token的情況下,企業(yè)僅憑日常的設(shè)備電力,就能實(shí)現(xiàn)AI智能體的流暢交互。

用觸手可及的“日常電費(fèi)”代替高昂的“Token費(fèi)”,從底層拉起了一道保障企業(yè)數(shù)據(jù)私密性的安全防線,一站式解決了端側(cè)應(yīng)用場景中最大、最難解決的“最后一公里”痛點(diǎn)。企業(yè)花大價(jià)錢租用的算力,也真正用在了刀刃上,實(shí)現(xiàn)了算力生態(tài)的“效率減負(fù)”!霸七叾藚f(xié)同,將會(huì)降低存儲(chǔ)需求,同時(shí)讓Token費(fèi)用大幅下滑,節(jié)省50%到70%,最終推動(dòng)AI普惠!

銓興科技的存儲(chǔ)產(chǎn)品(央廣網(wǎng)發(fā) 主辦方供圖)

以輕克重:把重資產(chǎn)調(diào)成“輕量模式”

在傳統(tǒng)的AI架構(gòu)里,運(yùn)行大模型像是一場豪賭:企業(yè)動(dòng)輒采購百萬級的獨(dú)立GPU算力設(shè)備,以及極為稀缺且價(jià)格高昂的高帶寬顯存,沉重的固定資產(chǎn)投入讓無數(shù)嘗試部署企業(yè)級AI的玩家望而卻步。

在本次人工智能終端展上,銓興科技發(fā)布了“新一代AI超顯存融合解決方案”,試圖以顯存擴(kuò)容技術(shù)打破“僵局”。該方案搭載高性能企業(yè)級AISSD,結(jié)合自主研發(fā)的算法平臺(tái)與智能體軟件,通過系統(tǒng)級軟硬件協(xié)同設(shè)計(jì),硬生生為GPU擴(kuò)展出了一個(gè)高效的外部顯存池。在不依賴昂貴高帶寬顯存的情況下,它用相對廉價(jià)的固態(tài)硬盤與傳統(tǒng)內(nèi)存搭建起混合架構(gòu),再用軟硬一體化打通了“任督二脈”:高頻訪問數(shù)據(jù)交由最快速、最高效的通道全力處理;低頻訪問數(shù)據(jù)則分流卸載到存儲(chǔ)體系中,允許其速度稍慢,從而換取了極高的經(jīng)濟(jì)性。

這種“軟硬結(jié)合”的精準(zhǔn)分流,上演了一場絕妙的降維打擊:直接將AI硬件從“百萬級”的重資產(chǎn),降維成了“小盒子”或普通筆記本就能輕松承載的輕資產(chǎn)。它不需要昂貴的GPU,卻能顯著提升本地大模型推理的吞吐能力,降低單位Token的生成成本,為大規(guī)模AI智能體部署及邊緣側(cè)智能應(yīng)用開辟出了一條兼顧性能與經(jīng)濟(jì)性的硬核技術(shù)路徑。

灣區(qū)韌性:AI+的跨界蝶變

放眼大灣區(qū),還有無數(shù)個(gè)在“紅!崩锞潘酪簧、歷經(jīng)周期洗禮的企業(yè)。他們深諳從設(shè)計(jì)到制造的每一個(gè)密碼,當(dāng)AI生產(chǎn)力風(fēng)暴席卷而來時(shí),這股習(xí)慣于在務(wù)實(shí)中創(chuàng)新的力量,也迎來了屬于自己的高光時(shí)刻:他們不信眼花繚亂的概念,只信積淀數(shù)十年的智造底蘊(yùn),那是將所有傳統(tǒng)產(chǎn)業(yè)用AI“再做一遍”的絕對底氣。

說到底,AI普惠從來不是一場單純的技術(shù)炫技,而是一場關(guān)于成本的“極限生存賽”。在這場隱形的較量中,像銓興科技這樣的一批深圳專精特新企業(yè),正像一顆顆破土扎根的鋼釘,死死卡在產(chǎn)業(yè)鏈最吃勁的關(guān)隘上。我們有理由相信,當(dāng)重重關(guān)隘被逐一撞破,中國AI產(chǎn)業(yè)將真正飛入千行百業(yè)、飛進(jìn)千家萬戶。

編輯:郭媛
更多精彩資訊請?jiān)趹?yīng)用市場下載“央廣網(wǎng)”客戶端。歡迎提供新聞線索,24小時(shí)報(bào)料熱線400-800-0088;消費(fèi)者也可通過央廣網(wǎng)“啄木鳥消費(fèi)者投訴平臺(tái)”線上投訴。版權(quán)聲明:本文章版權(quán)歸屬央廣網(wǎng)所有,未經(jīng)授權(quán)不得轉(zhuǎn)載。轉(zhuǎn)載請聯(lián)系:cnrbanquan@cnr.cn,不尊重原創(chuàng)的行為我們將追究責(zé)任。
長按二維碼
關(guān)注精彩內(nèi)容