邊緣AI正當時，Imagination押注GPU的“AI進化” - asiasworldcity.hk

「香港飛龍」標誌

本文内容：

導語在人工智能推理日益走向邊緣計算的浪潮中，Imagination推出全新E系列（E-Series）GPU IP，以革命性的“AI+圖形”深度融合架構，回應邊緣側對低功耗、高靈活性與強算力的多重需求。通過架構創新、算力擴展、功耗優化以及軟件生態配套，E系列試圖重新定義“邊緣AI計算”的邊界，並提供一條兼顧靈活性與高效性的技術路徑。邊緣AI進入加速期，GPU迎來轉型窗口當前邊緣側AI推理正以前所未有的速度增長。從市場應用端來看，自動駕駛、智能手機、工廠設備、甚至消費級機器人，都在逐步脫離雲端，開始在本地完成圖像識別、路徑規劃、語音交互等智能化任務。Imagination中國區技術總監艾克指出，邊緣AI需求的爆發源於多重因素：一是隱私敏感數據（如健康數據或企業數據）無法上雲；二是實時性要求（如輔助駕駛的瞬時響應）；三是邊緣設備的資源限制（如功耗和算力）。據統計，Hugging Face上AI模型下載量從2023年的70萬激增至2025年的700萬，反映了邊緣側模型部署的幾何級增長。同時，AI算法從卷積神經網絡（CNN）到Transformer，再到圖生視頻等複雜多模態模型的快速迭代，對硬件的靈活性和並行計算能力提出了更高要求。圖源：Imagination（下同）傳統處理器架構在應對邊緣AI時各有優劣：CPU靈活，但處理並行任務喫力；NPU強大，卻在應對新模型、新算子時捉襟見肘；GPU，特別是可編程的通用GPU，恰好介於兩者之間。但傳統GPU並非爲AI推理而生，其架構仍有諸多優化空間。在當前AI工作負載逐年變化的情況下，AI硬件系統仍需要一定程度的靈活性和通用加速能力，以確保設備的未來適用性。而Imagination的E系列GPU IP正是在這個夾縫中開闢了一條新路。E系列：GPU設計的範式轉變架構革新：圖形與AI的深度融合E系列GPU是Imagination產品線的一次重大飛躍，其最大的亮點，在於其對“AI+圖形”融合的系統性重構。據Imagination中國區技術總監艾克的介紹，Imagination多年來在圖形處理上積累的大量技術，例如分塊延遲渲染技術（TBDR）、壓縮緩衝等技術，天然具備低功耗、高利用率的特點。當這些架構被用來服務AI推理時，展現出強大的性能密度優勢。E-Series 將AI加速能力“原生”嵌入GPU體系，讓GPU從圖形引擎演進爲通用AI處理核心。衆所周知，Imagination的PowerVR GPU架構以能效著稱，已在功耗受限設備中應用近二十年。然而，在硬件功耗與面積控制方面，E系列在相同工藝節點下比前一代D系列實現了35%的平均能效提升。其背後關鍵就在於，E-Series引入的全新爆發式處理器（Burst Processors）技術，得益於指令調度路徑壓縮、本地寄存器（每個計算單元配備近 0.5MB 寄存空間）的複用機制、矩陣乘法運算單元的集成優化等架構升級。與傳統NPU相比，E系列無需回退至CPU處理“未知算子”，極大提升了系統穩定性和靈活性。與NPU相比，E 系列的優勢不僅體現在可編程性與靈活性上，還在於其面向未來模型演進的架構適應能力。當前市面上的AI解決方案多采用GPU與NPU物理隔離的架構，在數據交互、功耗效率和系統成本方面均存在短板。而E系列則實現了AI計算單元與GPU圖形管線的深度集成：AI算力核心與GPU USC（統一渲染集羣）共享寄存器、緩存與調度機制，打破了以往“各自爲政”的瓶頸，推動圖形與AI的真正協同。這種設計不僅提高了資源利用率，更帶來了數據路徑的顯著壓縮，有效降低了推理延遲，尤其適合圖形增強類AI場景：如圖像超分辨率、場景理解、光照遮蔽計算、景深識別等。它還兼容Vulkan、OpenCL等主流計算接口，編程生態友好，具備廣泛的開發者支持基礎。“很多 NPU 在設計時只能適配當前主流模型（如CNN），一旦未來模型發生變化（例如 Transformer 或多模態網絡），現有NPU將無力支持，而 GPU 的編程靈活性則確保了其長期適應性。”這一點對於生命週期長達十年以上的車規級芯片尤其重要。Imagination發言人指出。算力飛躍：從輕量級到多模態的全場景覆蓋在算力層面，E系列Neural Cores（神經核）支持2TOPS至200TOPS的AI算力覆蓋，支持從輕量級終端到複雜多模態系統的全場景部署。4核1.6GHz配置下，圖形填充能力可達400Gpixels/s，FP32浮點運算能力13TFLOPS，而INT8推理性能更是達到驚人的200TOPS。這種單位面積下的算力密度比前代提升了3.6倍，遠超傳統GPU架構的性能曲線。同時，E系列也支持包括FP32、BF16、FP8、MXFP4等多種AI主流格式，結合Imagination優化的計算庫與圖優化編譯器，開發者可通過TVM等框架便捷地完成PyTorch、TensorFlow等主流模型的部署與適配。靈活擴展與多任務並行在任務調度層面，E系列支持多達16個虛擬機實例的運行隔離，且可通過我們的硬件虛擬化實現AI、圖形、UI等多任務的異步並行處理。其在Cockpit域、娛樂域、駕駛輔助域等多種車載場景中已展現出良好的適配能力。例如，在智能座艙中，E系列可同時承擔儀表渲染與人機交互AI任務；在駕駛域內則實現對駕駛員狀態的AI監控及語音交互響應。此外，E系列支持從單核0.25T FP32輕量部署至多核200T強算力橫向擴展，具備覆蓋移動設備、工業終端、AI PC乃至邊緣數據中心的彈性能力，爲SoC廠商提供從單芯片集成到異構協同的多元路徑選擇。生態完備，打通從模型到芯片的部署閉環軟硬件協同是邊緣AI落地的關鍵一環。Imagination爲E系列配套構建了完整的軟件棧支持：包括數學計算庫、FFT、Kernel優化、TVM適配、Graph Compiler、TensorRT Lite推理鏈，以及多操作系統、編譯器工具與調試套件。開發者不僅能完成離線模型部署，還能實現輕量級應用的在線部署及推理推送，從而支持包括自動駕駛、移動設備、工業終端等在內的多種邊緣場景的動態智能需求。值得一提的是，Imagination在RISC-V生態中也扮演着關鍵角色。憑藉其卓越的圖形與AI能力，已與多家RISC-V平臺客戶進行集成驗證，並將持續推動開源硬件與高效算力在邊緣智能中的協同演進。從實際落地來看，Imagination已爲E系列規劃了多箇子系列產品，分別面向功能安全需求的汽車域控（EXS）、消費電子（EXT）、以及AI PC等高性能領域（EXD）。我們可與客戶協作開發配置方案，以適應從輕量級設備到複雜多模態系統的廣泛需求。在Imagination看來，在AI模型迭代迅速、多模態計算需求上升的趨勢下，GPU以其靈活可編程的特性，展現出相較NPU更優的可拓展性與生命週期優勢，尤其適用於未來十年仍需持續升級的車載平臺。首款E-Series GPU IP將於2025年秋季正式上市，目前已完成授權。汽車、消費電子、桌面及移動版本亦在同步開發中。隨着正式發佈日期臨近，該系列產品有望在中國市場掀起一輪邊緣算力升級的新熱潮。Imagination 公司中國區董事長兼亞太總裁白農強調，中國是Imagination全球最重要的戰略市場之一，公司將持續加大本地化投入，深化與本土生態的合作。E系列GPU IP是Imagination技術積澱的里程碑，不僅在性能、功耗和芯片面積上實現突破，更通過架構創新，從傳統圖形渲染邁向通用AI計算。面對邊緣AI應用的爆發式增長，尤其在輕量大模型（如DeepSeek）快速發展的背景下，E系列以圖形渲染與AI推理的統一計算平臺，爲客戶提供更高靈活性與競爭力。AI的未來，在雲，更在邊。Imagination E系列代表着GPU與AI融合的一次範式躍遷，不僅在性能與功耗之間找到了新的平衡，更通過深度集成與軟硬件協同，爲邊緣智能提供了一種更具擴展性、靈活性與經濟性的技術解法。半導體精品公衆號推薦專注半導體領域更多原創內容關注全球半導體產業動向與趨勢*免責聲明：本文由作者原創。文章內容系作者個人觀點，半導體行業觀察轉載僅爲了傳達一種不同的觀點，不代表半導體行業觀察對該觀點贊同或支持，如果有任何異議，歡迎聯繫半導體行業觀察。今天是《半導體行業觀察》爲您分享的第4028期內容，歡迎關注。『半導體第一垂直媒體』實時專業原創深度公衆號ID：icbank喜歡我們的內容就點“在看”分享給小夥伴哦

(本文内容不代表本站观点。)
---------------------------------