2025 年 11 月 13 日,中國上海訊 - 國內領先的芯片IP設計與服務提供商安謀科技(中國)有限公司(以下簡稱“安謀科技Arm China”)今日宣布,在上海舉辦“周易”X3 NPU IP新品發布會。
作為安謀科技Arm China“All in AI”產品戰略下誕生的首款重磅產品,以及“AI Arm CHINA”戰略發展方向的關鍵實踐,“周易”X3 NPU IP基于專為大模型而生的最新DSP+DSA架構,致力于打造端側AI計算效率新標桿,在性能、功能與易用性等方面全面躍升,面向基礎設施、智能汽車、移動終端、智能物聯網四大領域,為加速卡、智能座艙、ADAS(高級駕駛輔助系統)、具身智能、AI PC、AI手機、智能網關、智能IPC(網絡攝像機)等設備帶來前所未有的AI計算體驗。

△安謀科技CEO陳鋒
安謀科技CEO陳鋒表示:“在人工智能時代,安謀科技將會“All in AI”,持續發力自研NPU IP,與CPU、GPU IP一起構建完整的產品組合,實現安謀科技‘為客戶創造核心價值,做中國智能計算生態領航者’的愿景。”

△安謀科技Arm China產品研發副總裁劉浩
安謀科技Arm China產品研發副總裁劉浩表示:“在‘All in AI’產品戰略的指引下,我們將持續加大投入,以前瞻性視野整合頂尖研發資源,秉持開放合作理念,為生態伙伴提供業界領先的從硬件、軟件到服務的端到端解決方案,全力賦能伙伴的產品創新和商業化落地。”

周易”X3 NPU IP新品發布會現場
性能躍遷
前瞻五年布局,讓端側大模型“跑得穩、答得順”
在半導體IP領域,“面向未來5年的產品方向進行前瞻布局”已成為行業共識——涵蓋IP研發、芯片及終端產品研發量產。安謀科技Arm China深諳這一規律,前瞻性地在“周易”X3中采用兼顧CNN與Transformer的通用架構設計,支持全算力類型并增強浮點運算FLOPS,助力實現從定點到浮點計算的關鍵轉變,并滿足大模型計算需求,為未來5年Gen AI、Agentic AI與Physical AI的端側落地奠定技術基石。
隨著AI大模型技術的飛速發展,智能手機、AI PC和智能汽車等端側設備正迎來AI能力的爆發性需求。從多模態語音助手到實時圖像生成,從智能座艙交互到輔助駕駛決策,端側設備需要承載越來越復雜的AI計算任務。然而,端側AI部署面臨算力受限、能效要求高、帶寬瓶頸、開發門檻高等多重挑戰——如何在有限的功耗和算力資源下實現大模型的高效運行,成為行業亟需突破的關鍵難題。
“周易”X3基于專為大模型而生的最新DSP+DSA架構(DSP兼顧了通用計算與專業加速的向量計算能力、DSA架構則擁有更大算力和支持更多精度的矩陣計算),從計算效率、帶寬、精度適配、任務處理四大維度實現升級,精準解決端側AI大模型運行難題,打造端側AI計算效率的新標桿。

其單Cluster最高支持4個Core,擁有8~80 FP8 TFLOPS算力且可靈活配置,單Core帶寬高達256GB/s。相較于“周易”X2產品,“周易”X3的CNN模型性能提升30%~50%,多核算力線性度達到70%~80%。
在同算力規格下,AIGC大模型能力較上一代產品實現10倍增長,這得益于16倍的FP16 TFLOPS、4倍的計算核心帶寬、超過10倍的Softmax和LayerNorm性能提升共同驅動。

借助這些優化,端側大模型推理將更高效:在Llama2 7B大模型實測中,“周易”X3 NPU IP在Prefill階段算力利用率高達72%,并在安謀科技Arm China自研的解壓硬件WDC的加持下,實現Decode階段有效帶寬利用率超100%,遠超行業平均水平,滿足大模型解碼階段的高吞吐需求。

周易”X3 NPU IP新品亮點
此外,“周易”X3在架構層面實現了多項創新,集成以下關鍵特性:
●集成自研解壓硬件WDC:使大模型Weight軟件無損壓縮后通過硬件解壓能獲得額外15%~20%等效帶寬提升。


安謀科技Arm China產品總監鮑敏祺
安謀科技Arm China產品總監鮑敏祺指出:“‘周易’X3遵循‘軟硬協同、全周期服務與成就客戶’的產品準則,提供從硬件、軟件到售后服務的全鏈路支持,以前瞻性設計、專業團隊交付與深度服務投入,全面助力客戶產品成功與商業化落地。”
軟硬協同
從“好用”到“用好 ”,Compass“金牌輔助”提升開發效率
“周易”X3 NPU IP不僅提供高性能硬件,還配套完善易用的“周易”Compass AI軟件平臺,通過“軟硬一體”的協同設計,讓開發者從“好用”到“用好”,顯著提升開發部署效率。
Compass AI軟件平臺通過覆蓋開發全流程的工具鏈、極致的易用性優化與開放的生態布局,破解端側AI開發“適配難、周期長、門檻高”的痛點。作為核心工具,平臺中的NN Compiler(神經網絡編譯器)集成Parser(模型解析)、Optimizer(優化器)、GBuilder(生成器)及AIPULLM(大模型運行工具),可實現主流模型的高效轉化、自動化優化與部署配置生成,并具備以下核心能力:
安謀科技Arm China積極構建開放生態,Compass AI軟件平臺中的Parser、Optimizer、Linux Driver、TVM及內部IR格式等核心組件已相繼開源,并擁有豐富的調試工具,可滿足開發者白盒部署需求,且支持更易用的DSL算子編程語言。在此基礎上,平臺賦予開發者更深度的定制能力:客戶不僅可以使用平臺中的Compiler、Debugger或DSL語言開發出自己的自定義算子,也可通過Parser、Optimizer等工具打造出屬于自己的模型編譯器,從而實現差異化設計與開發效率提升。

周易”NPU Compass AI軟件平臺
不僅如此,安謀科技Arm China技術團隊還圍繞“周易”X3 NPU IP和Compass AI軟件平臺的軟硬件協同進行精心設計和反復論證,目標是提升客戶最終落地方案的效率和能效。例如,在“周易”X3 NPU IP的AIFF模塊軟硬件設計中,硬件端充分結合軟件使用場景,通過增大總線帶寬、增加DMA(直接內存訪問)的outstanding(未處理的指令或數據請求)等方式提升數據搬運、數據并行效率,軟件端則針對硬件特性設計專屬使用模式,如對模型進行合理切分以充分發揮多核并行優勢。

安謀科技Arm China NPU產品線負責人兼首席架構師舒浩博士
安謀科技Arm China NPU產品線負責人兼首席架構師舒浩博士認為:“‘周易’X3的產品優勢,源于通用、靈活、高效且軟硬協同的系統架構設計,這一設計使其兼具廣泛的行業適用性與靈活的邊端側AI應用場景匹配能力。”
多場景落地
從無形IP到AI萬象,端側智能觸手可及
新一代“周易”X3 NPU IP將端側智能的邊界拓展至更廣闊的應用場景,面向基礎設施、智能汽車、移動終端、智能物聯網四大領域,精準匹配當前爆發的端側AI需求,可廣泛應用于加速卡、智能座艙、ADAS、具身智能、AI PC、AI手機、智能網關、智能IPC等AI設備:

周易”NPU IP系列家族現場demo展示區
此次發布會現場系統展示了“周易”NPU產品家族的技術演進與落地成果,生動詮釋其如何將無形的算力轉化為觸手可及的智能體驗。
從“周易”Z1的基礎感知到“周易”X3的復雜認知,這一技術演進路徑清晰地表明,端側AI正在從單一的功能實現,邁向融合多種模型、適應動態場景的“全民普及”新階段。“周易”X3 NPU IP的設計充分預判端側AI的“場景深化”趨勢:以極致算力表現破解“多模型融合”的算力需求,以全算力類型并增強浮點運算FLOPS適配“精度動態演變”的場景差異,借助軟硬協同的生態打造端側算力底座。
對于NPU架構的未來演進,舒浩博士也指出,隨著計算架構的持續演進,NPU架構的四大演進方向:
●更高效的通用計算能力:靈活量化算法、多樣化網絡結構、高效部署優化技術;
●更強的計算擴展能力:單核Scale-up/Down能力、多核Scale-out能力、多Die、多chip協同能力;
●支持更多的數據格式:比如FP4、1.58bit、OCP-MX;
●更高效的軟件使用界面:需要有更加友好的編程模型;高效DSL語言;軟件接口層次化、完備。

總結來說,“周易”X3 NPU IP的發布,標志著安謀科技Arm China“All in AI”產品戰略的正式開啟。安謀科技Arm China以“AI Arm CHINA”為戰略發展方向,積極響應“AI+”行動計劃,持續深耕技術領域創新,同時攜手伙伴共建開放生態,加快構建國內“AI+”產業升級的智能計算基石,為千行百業智能化轉型提供更強IP“核芯”動力。


















手機圖頁網



