IBM 推出首款為 AI 時代全面設計的主機z17,推理能力提升50%
在 AI 重塑企業(yè) IT 架構(gòu)的今天,對于大型企業(yè)來說,要充分釋放 AI 潛能,必須有能夠承載大規(guī)模、高安全、實時性 AI 應用的基礎設施作為支撐。4 月 8 日,IBM 交出了自己的答卷——全新推出的 IBM z17 主機系統(tǒng),一款被 IBM 明確定義為“首款為人工智能時代全面設計”的主機。

IBM z17 的核心部件是新一代的 IBM Telum II 處理器。該處理器包含八個主頻為 5.5GHz 的核心,配備 360MB 片上緩存,并集成了第二代 AI 加速器。這一設計允許在處理器芯片上直接執(zhí)行 AI 推理任務。IBM 提供的數(shù)據(jù)顯示,相比前代產(chǎn)品 z16,z17 的 AI 推理處理能力提升了 50%,單日可處理超過 4,500 億次推理操作,響應時間可低至 1 毫秒。這種片上 AI 處理能力適用于需要實時分析的場景,例如金融交易欺詐檢測,可以在數(shù)據(jù)產(chǎn)生時即時進行處理,有助于提高效率和安全性,減少數(shù)據(jù)遷移的需求。IBM Z 產(chǎn)品管理與設計副總裁 Tina Tarquinio 透露,z17 的研發(fā)歷時五年,遠早于當前生成式 AI 的熱潮。但早期與超過 100 家客戶的深入交流已明確了將 AI 更緊密集成到核心系統(tǒng)的需求。同時,她也強調(diào)了能效的提升,指出 z17 在實現(xiàn)顯著 AI 性能提升的同時,能耗控制也優(yōu)于業(yè)界其他方案。

為了支持更復雜的 AI 模型,IBM 還為 z17 設計了 IBM Spyre AI 加速卡。這是一款基于 PCIe 接口的專用加速器,預計于 2025 年第四季度開始供貨。根據(jù) IBM 在 2024 年 Hot Chips 會議上披露的信息,每塊 Spyre 卡 集成多達 32 個處理核心。z17 系統(tǒng)在發(fā)布時可配置最多 48 塊 Spyre 加速卡,IBM 計劃在未來 12 個月內(nèi)將支持數(shù)量提升至 96 塊。
Spyre 加速器的引入,使得 z17 能夠直接在主機平臺上運行此前通常需要在外部 GPU 集群處理的大規(guī)模 AI 工作負載,如企業(yè)內(nèi)部的 AI 助手或代碼輔助生成工具,從而降低了對外部資源的依賴以及數(shù)據(jù)傳輸相關的延遲和安全考量。
硬件的性能需要通過軟件來實現(xiàn)。IBM 同時預告了其旗艦操作系統(tǒng) z/OS 的下一個版本 3.2,計劃于 2025 年第三季度發(fā)布。根據(jù)計劃,z/OS 3.2 將為 z17 的硬件 AI 加速功能提供支持,并引入運營 AI(Operational AI)能力以提升系統(tǒng)管理的自動化和智能化水平。此外,該版本還將增加對 NoSQL 數(shù)據(jù)庫等現(xiàn)代數(shù)據(jù)存儲格式和混合云數(shù)據(jù)處理模式的支持,旨在讓 AI 應用能夠訪問和利用更廣泛的企業(yè)數(shù)據(jù)源。
為提升開發(fā)和運維體驗,z17 集成了 IBM watsonx AI 平臺的相關工具。例如,watsonx Code Assistant for Z 用于輔助 COBOL 等傳統(tǒng)語言應用的現(xiàn)代化開發(fā)與維護。watsonx Assistant for Z 提供智能交互接口。IBM 還發(fā)布了新的 IBM Z Operations Unite 解決方案(預計 2025 年 5 月可用),該方案使用 OpenTelemetry 標準從主機環(huán)境中收集性能指標和日志,利用 AI 進行分析,旨在縮短異常檢測、問題定位和解決的時間。
此外,安全性一直是大型主機設計的重點之一。z17 在繼承平臺固有安全特性的基礎上,增加了新的安全功能——IBM Vault,整合了此前收購的 HashiCorp 的技術,用于在大型主機和混合云環(huán)境中提供統(tǒng)一的密鑰、證書和敏感憑據(jù)管理。IBM 還計劃利用 Telum II 處理器的能力,推出新的 AI 驅(qū)動的數(shù)據(jù)安全功能,用于自動發(fā)現(xiàn)和分類平臺上的敏感數(shù)據(jù)。同時,其更新的威脅檢測解決方案 IBM Threat Detection for z/OS 也利用 AI 技術來識別潛在的安全威脅和異常行為。
盡管常被視為“傳統(tǒng)”技術,大型主機在全球核心業(yè)務領域依然扮演著不可或缺的角色。據(jù) RocketSoftware 統(tǒng)計,超過 70% 的財富 500 強企業(yè)仍在使用大型主機處理其最關鍵的工作負載,尤其是在金融、保險、醫(yī)療和公共服務等對穩(wěn)定性、吞吐量和安全性要求極高的行業(yè)。2024 年,大型主機市場規(guī)模仍達數(shù)十億美元。
在云成本攀升、數(shù)據(jù)隱私法規(guī)趨嚴、企業(yè)亟需利用 AI 挖掘核心數(shù)據(jù)價值的今天,大型主機的價值正被重新評估。IBM z17 的推出,也是 IBM 對其戰(zhàn)略定位的闡述:提供一個高度整合、安全可靠、針對特定行業(yè)需求的本地 AI 基礎設施解決方案。這與 NVIDIA 主導的 GPU 市場和 AWS、Azure、Google Cloud 等云服務商的路徑形成差異化。



