IBMのPower向け「Spyre」AIアクセラレーターについてもう少し洞察を深める
現時点ではっきりしていることがあるとすれば、それは、Nvidia社が生成AI革命の中でこれ以上金持ちになる必要はないということです。そして、同社のファウンドリー パートナーであるTSMC(Taiwan Semiconductor Manufacturing Co.)社についても同じことが言えます。しかし、それら2社以外の企業は、IBMおよび特にIBMのPower Systemsビジネス部門も含めて、千年に一度のこの機会に生成AIの波に乗ってお金を稼ぐべく、死物狂いで何かを行う必要があります。
ご承知の通り、私たちが主張してきたのは、RPGおよびCOBOLアプリケーション コードのドキュメント化、更新、モダナイズ、またはより新しい言語およびモジュラー プログラミング手法への移植に役立てることができるコード アシスタントは、IBM i のショップにとっては生成AI向けのキラー アプリケーションとなり、IBMにとっては、Power Systemsの収入ストリームを倍増させるとともに、おそらくは利益を増大させられるチャンスをもたらすということでした。そして、IBMが1年半以上取り組んできた、RPGおよびJavaに精通した自社製のトランスフォーマー モデルが登場したことで分かったのは、IBMはソフトウェア収入を得ることができるということでした。また、Power10およびPower11プロセッサーでの行列演算ユニットの追加や、より大型の「Spyre」行列演算カードの開発によって分かったのは、IBMはハードウェア収入を得ることもできるということでした。大量のGPUアクセラレーターの代金としてNvidia社にあれだけのお金を渡しているばかりではいられないのです。それらは、とにかく入手しづらくて高価です。おまけに、Power Systemsプラットフォーム、すなわち、IBM i、AIX、およびLinuxとはあまり統合されていません。
Spyre行列演算アクセラレーターは、IBM Researchによって汎用のAI機械学習プロセッサーを強化するべく行われた取り組みから派生したものです。次いで、Power10およびPower11チップで使用されたのとは異なる行列演算アクセラレーターをz16およびz17メインフレーム プロセッサーに追加するために、IBMポキプシー ラボによって取り上げられました(このことの賢明さについては、将来、じっくり考えてみることができます)。このAIアクセラレーション ユニットは、分離された上で大量に複製されて1つのチップに統合され、Spyreとして知られるPCI-Express拡張カードに搭載されたということです。それは、それぞれのPower10およびPower11コア上のベクトル ユニットおよび行列ユニットを補完する特別な行列演算ユニットであると考えるとよいでしょう。
先週の記事でお伝えしたように、IBMは、モデル構築を手掛けるAnthropic社との間で、「Project Bob」コード アシスタントにおける中心的モデルとしてAnthropic社のClaude Sonnet 4.5モデルを使用するための パートナーシップ契約を結びました 。Anthropic社のモデルは、コードを理解および生成するのに最適と広く認められており、同社はあらゆる種類の言語の専門知識を備えています。しかし、特にRPGに限って言えば、IBMがそれらをトレーニングするために費やしてきたすべての労力を考えると、IBMのGraniteモデルがおそらく一番と言えそうです。
ここで肝心なのは、Project Bob(モデルを組みわせてベースにしているため、一部はライセンスが必要)では、IBMの利益は必然的に小さくなるものの、Project Bob IDEおよびコード アシスタントの魅力は、より広まり、より深まるかもしれないということです。その場合、IBM i におけるRPG向けや、メインフレームにおけるCOBOLからJavaへの変換といった個別のWatsonxコード アシスタント機能で生み出されるよりも、より早く、より多くの収入が生み出されます。そうした当初のWatsonxのプランは常に制約が多過ぎたため、IBMの幹部は、ダメージが及ぶ前にこれに気付いていました。そうは言っても、将来の約束ではなく、今すぐに、コード アシスタントに実際に収入を生み出させていた方が良かったのかもしれません。これが、先週の、IBMのTechExchange 2025開発者カンファレンスで分かったことです。しかし、コード アシスタントを稼働するためにRed Hat LinuxおよびOpenShiftスタックを開発し、それらをIBM自社製のSpyreアクセラレーターやPowerおよびzプロセッサーと統合するには時間が掛かります。
10月7日付けの 発表レター「AD25-1422」で、IBMは、10月28日より、Spyreアクセラレーターがz17メインフレームおよびそれらのLinuxONEバリアント上で利用可能となることを発表しました。この発表レターでは、性能データや価格設定に関してあまり多くを述べていませんが、IBMは、Spyreカードは、RHELサブスクリプションにより、エンタープライズ サポート付きで、PCI-Expressエンクロージャーと8枚のカードのバンドルで販売されると述べています。 発表レター「AD25-1365」では、12月12日より、Spyreバンドルおよびシャーシが、RHEL 9.6以降を稼働しているPower11サーバー(Power10またはPower9ではなく)で利用可能となるとIBMは述べています。
Powerマシンでは、Spyreハードウェアには、Spyre Enablement Stack for Powerが付属し、これには、PyTorchバックエンド、Power11チップからSpyreカードへ処理をオフロードするようにセット アップされたコンパイル済みAIモデル、全体を機能させるための各種ランタイム、デバイス ドライバー、およびカード ファームウェアが含まれています。IBMは、推論向けにRHEL.AI Inference Serverを作成していまが、これには、Power Systemsアイアン上で稼働するリレーショナル データベースなどのデータ ソースからの検索拡張生成(RAG)など、Spyreアクセラレーター向けのありとあらゆる最適化機能が組み込まれています。来年の第1四半期に、IBMは、SpyreアクセラレーターでのAI処理向けに最適化され、RHEL.AIと連携して動作するOpenShift.AI Kubernetesスタックのバリアントを提供する予定です。
IBMから教わったことを最後に1つだけ。Spyreアクセラレーターは、RHELでSpyreアクセラレーターを稼働している区画のライブ区画モビリティ(LPM)マイグレーションを可能にする機能を備えています。Power Systemsマシンに接続されたNvidiaまたはAMD GPUで稼働しているAI推論またはトレーニング ワークロードのLPMを行うことはできません。
Spyreアクセラレーターの構成についての詳細の一部は、 発表レター「AD25-1386」で発表されました。SpyreデバイスはPCI-Express 4.0カードであり、フィーチャー#ENZ0拡張ドロワーに、8枚のアダプターを収容することができます。拡張ドロワーに8枚装着した場合、1.6 TB/秒の帯域幅で、最大1 TBのメモリーを搭載可能です。これは、Nvidia社の「Blackwell」 B100、B200、B300 GPU、またはAMD社の「Antares+」 MI325XまたはMI355X GPUと単体ベースで比較しても、大量のメモリーまたは帯域幅ではありません。しかし、Power Systemsアプリケーションで想定される推論ワークロードがかなり軽量であり、IBM Spyreカードの価格がNvidiaおよびAMD GPUに比べてかなり安価だとすれば、そのことはそれほど重要ではありません。
少し計算してみましょう。たとえば、B200は、8 TB/秒の帯域幅の192 GBのHBM3Eメモリーを搭載し、1枚の価格は35,000ドル~50,000ドルです(取引の性質次第で異なる)。計算しやすくするために、仮に40,000ドルとしましょう。メモリー帯域幅のみをベースにして計算してみることとします。推論は非常にメモリー バウンドなワークロードです。では、メモリー帯域幅のみをベースにして計算してみると、8枚のSpyreカードの帯域幅は、1枚のNvidia B200カードの帯域幅の1/5であるので、それら8枚のカードの価格は、約8,000ドル(1枚当たり1,000ドル)ということになりそうです。IBMが、カードの価格はそれくらい安く抑えておいて、その分、拡張シャーシの価格を高くするということも、考えられなくはないでしょう。しかし、IBMがカードの価格をそれほど安く設定するとも思われません。おそらく、カード1枚当たり、2,000ドルか3,000ドルといったところではないでしょうか。そして、ここで評価するべき価値は、Spyreが、Spyreスタックを稼働しているRHEL区画を通じてIBM i およびAIXと完全に統合されることだと言えるでしょう。Nvidia AI Enterpriseスタックを学ぶ必要も、そのソフトウェアを使用するために1 GPU当たり4,500ドルを支払う必要もないのです。
IBMがPower Systems顧客による投資を期待しているのであれば、こうしたAIハードウェアおよびソフトウェアすべての価格設定に関する情報をそろそろ提供し始めても良いのではないかと思います。また、以下のような図表だけでなく、AI拡張された実環境のアプリケーションでの実際のパフォーマンス ベンチマークも見てみたいものです。
これは、あまり参考にはなりません。しかし、Power向けSpyreスタックのエンタープライズ ユース ケースのスクリーン ショットは興味深いものがあります(下図)。
また、Power向けSpyreスタックと統合されているデジタル アシスタントのスクリーン ショットも同様です(下図)。
Spyre for PowerのRedbookは、どこにあるのでしょうか。
