IBM、管理されたアナリティクス、AI向けの新プラットフォーム「watsonx」を発表｜e-bellnet.com（IBM i （AS/400）ユーザーのための関連技術情報サイト）

IBM i 資料集

IBMｉ海外記事2023.07.26

IBM、管理されたアナリティクス、AI向けの新プラットフォーム「watsonx」を発表

Alex Woodie 著

先週、開催された年次カンファレンス「Think」で、IBMは、安全でガバナンスを備えた環境で、ビッグデータのクランチングや、AIおよび機械学習アプリケーションの開発を行うための新たなプラットフォーム、「watsonx」を発表しました。

業界アナリストの話を聞くまでもなく、今年は、AI（人工知能）に大いに注目が集まる年になりそうです。昨年末にChatGPTが一般公開されたおかげで、AIの専門家や業界アナリストのみならず、一般の人々も、真に迫った形で人間の真似をすることができる大規模言語モデル（LLM）の膨大な可能性に気付くようになりました。

ChatGPTのようなLLMは、典型的な意味での「インテリジェント」ではありませんが、たとえば、シェークスピア風のソネットを書いたり、高校の学期末レポートを書いたり、さらには構文的に正しいRPGコードを生成したりするなど、かなり驚くようなことを行うことができます。

今や企業は、LLMや、その兄弟分とも言うべき画像生成AI（ OpenAIのDALL-E 2や Stable Diffusionなど）をうまく活用しようと、それらに殺到している状況です。IBMも、このような目まぐるしく変化する世界に足掛かりを築こうと模索している企業の1つに他なりません。

IBMがAIへ進出するのは、watsonxが初めてというわけではありません。さらに言えば、IBMがその名前を使用するのも、初めてではありません（ IBM Watson Analyticsを憶えている方はいらっしゃるでしょうか）。しかし、この新たなwatsonxオファリングは、AI（ChatGPTのような生成AIなど）に寄せられる新たな関心を盛り上げようとするIBMの試みを表すものです。

watsonxは、watsonx.aiと呼ばれる開発スタジオ、watsonx.dataと呼ばれるデータレイクハウス、およびwatsonx.governanceと呼ばれる（ご推察の通り）ガバナンスツールキットの、3つのコンポーネントから構成されています。最初の2つのwatsonxコンポーネントは7月に利用可能となる予定であり、残りの1つは10月に利用可能となる予定です。

watsonx.aiは、開発者が、従来の機械学習モデル（ロジスティック回帰やK-Meansクラスタリングを思い浮かべてください）や、新たな生成AI機能をトレーニング、検証、調整、デプロイする場を提供します。このスタジオは、「堅牢なフィルタリングおよびクレンジングプロセス、監査可能なデータリネージュに裏付けられた、大規模な企業データのキュレーションセット」をすでに学習済みである「基盤モデル」のコレクションを提供するとIBMは述べています。

ユーザーは、LLMにアクセスできるだけでなく、ソースコード、時系列データ、表形式データ、地理空間データ、およびITイベントデータでのトレーニングに適切なモデルにもアクセスできるとIBMは述べます。

watsonx.aiスタジオでは、3つのモデルのグループが提供されます。fm.codeモデルには、コードを書くときに「コパイロット（副操縦士）」アシスタント機能を必要とする開発者にとって有用なコード生成モデルが含まれます。fm.NLPコレクションには、ユーザーが調整できる特定のドメインのためのLLMが含まれます。最後に、fm.geospatialモデルは、気候データでトレーニングされ、自然災害に備える支援をします。

また、IBMは、チャットボットや対話型AIアプリケーションの構築に適した生成モデルを作成している Hugging Face社によって開発された、何千ものオープンソースモデルを提供する予定です。また、基盤モデルとしてWatson Code Assistant、Watson Assistant、Watson Orchestrate、およびAIOps Insightsをwastonx.aiに組み込むことも予定しているとIBMは述べています。

watsonx.dataはレイクハウスとして機能します。レイクハウスは、Db2、 Oracle、 Teradata のような信頼性の高いリレーショナルデータベーステクノロジーに基づいて構築された、管理されたデータウェアハウスの要素と、HDFSまたはオブジェクトストレージシステム（Amazon S3やCleversafeなど）をベースにした、拡張性はあるものの扱いづらいデータレイクを融合する比較的新しいデータアーキテクチャーです（Cleversafeは、IBMが数年前に買収し、今日のIBM Cloudストレージの基盤となっているS3互換のオブジェクトストレージシステムです）。

watsonx.dataは、オンプレミスおよびクラウドの両方で利用可能になり、ユーザーは、そこに保管されているデータを、自分で選んだ分析エンジンに処理させることができるようになります。たとえば、IBMの広く知られたDb2およびNetezzaエンジンをはじめ、 Presto や Apache Sparkのような広く使用されているオープンソースのオプションもあります。先日、IBMは、 Ahana社（Prestoをベースにしたクラウドサービスを開発したシリコンバレーのスタートアップ企業）を買収しましたが、おそらく近いうちにここで功を奏することになりそうです。

watsonx.dataレイクハウスでは、Apache Hadoopデータレイクの時代から用いられている、Parquet、Avro、およびORCなど、多数のファイルフォーマットがサポートされます。IBMの側での大きな展開と言えそうなのは、 Apache Icebergもサポートするようになることです。Apache Icebergは、データの信頼性を確保するために必要とされたものの、以前のHadoop時代のフォーマットになかった一貫性とトランザクション性を付加した、比較的新しいテーブルフォーマットです。

最後は、信頼できるAIワークフローをユーザーが構築するのを支援するように設計されたAIガバナンスツールキットである、watsonx.governanceです。このツールキットは、顧客が、AIモデルの構築に関連するリスクを軽減しながら、ガバナンスを運用するのを支援するとIBMは述べています。このガバナンスツールキットは、透明性があり説明可能な成果をもたらしながら、「顧客のプライバシーを保護し、モデルのバイアスやドリフト（精度の低下）を能動的に検出し、組織が倫理基準を持たす」ための仕組みを提供します。

「基盤モデルの開発により、ビジネスのためのAIは、これまで以上に強力になります」と、IBM会長兼CEOのArvind Krishna氏はプレスリリースで述べています。「私たちは、お客様が単に利用するだけではなく、AIを活用できるようになるために、企業のニーズに合わせてIBM watsonxを提供します。IBM watsonxを利用することで、お客様はデータを管理しながら、ビジネス全体にわたって自社向けのAI機能を迅速に学習・展開することができます。」

現時点ではIBM i特有の接続性の要件があるようには思われません。しかし、開発者およびデータエンジニアを絶えず悩ましている従来のデータ統合およびETLの頭痛の種を除いては、Db2 for iから、この新たなIBMレイクハウスへデータを移動する上でハードルはほぼなさそうです。AIの持つパワーがビジネスにどのような影響を及ぼし得るのか、気になり始めているIBM iのショップにとっては、watsonxは、7月に利用可能になったらチェックしてみる価値があるオファリングであるかもしれません。

watsonxの詳細については、 www.ibm.com/jp-ja/watsonxを参照してください。