Skip to content

AIAgentを作ってみよう!

このLabでは、基本的なAIAgentの作り方を学びます。

Agentの作成

  1. 左上のメニューからビルドを選択し、エージェント・ビルダーを選択します。
    alt text

  2. 右にあるエージェントの作成ボタンをクリックします。
    alt text

  3. 最初から作成を選択します。
    alt text

  4. このハンズオンではIBMに関する質問に回答するエージェントを作成するため、NameをYourInitials-IBMInfoと設定します。
    alt text

  5. このエージェントの役割をDescriptionに記載します。watsonx Orchestrateは記載した内容をもとにどのエージェントを呼び出すかを判断するため、適切な記載が求められます。
    このハンズオンでは、DescriptionにIBMの会社情報に関する質問に回答するエージェントですと設定し、作成をクリックします。
    alt text

  6. Agentが作成されました。先ほど入力した名前と説明が自動的に入っています。
    ※エラーが発生する場合は、エージェントの名前が重複している可能性があります。イニシャルを変更するなどして再度試してみてください。
    alt text

基本的な動きの確認

  1. 右側にプレビューチャットが表示されています。ここで簡単に作成したエージェントを試すことができます。
    alt text

  2. まずはWhat is IBM?と入力します。
    alt text

  3. IBMに関する回答が返ってくることが確認できました。こちらは選択されたLLMが回答を作成しています。
    alt text

  4. 続いて、What is the stock price of IBM?と入力します。日付などをきかれた場合には、必要に応じて回答してください。
    alt text

  5. その結果、最新の株価情報を得ることができないことが確認できます。
    alt text

生成AIは案出し、要約などは得意ですが、新しい情報の取得は難しいことが確認できました。

動作の定義

  1. プレビューチャットにIBMについて教えてくださいと入力します。
    alt text

  2. その結果、ユーザーの質問は理解しているようですが、英語で回答が返ってきました。
    alt text

  3. ユーザーが使いやすいよう利用ユーザーに合わせた動きを行うために、動作に応答の定義を行います。このハンズオンでは、日本人を対象としたAgentの作成のために、回答は必ず日本語で行ってくださいと入力します。
    alt text

  4. Previewチャットをリフレッシュしてください。
    alt text

  5. 再度、IBMについて教えてくださいと入力します。
    alt text

  6. 次は日本語で返ってくることが確認できました。
    alt text

このように、ユーザビリティを上げるために、動作を適切に定義することが必須です。

知識の使用

watsonx Orchestrateは組み込みのRAG (Retrieval Augmented Generation) 機能を提供し、エージェントごとにドキュメントをアップロードすることで、その内容をもとに回答を生成することが可能です。
1. このハンズオンでは年次報告書を読み込ませて、それに基づいた質問に対応するエージェントを作成します。
ナレッジを選択のボタンをクリックします。
alt text

  1. ナレッジソースの選択画面が出るので、ファイルのアップロードをクリックし、次へボタンをクリックします。
    alt text

  2. 今回のハンズオンでは、こちらのファイルを使用します。 ダウンロードして保存して使用してください。ボックスにドラッグするか、または青字のテキストをクリックしてファイル・アップロード・ウィンドウを開いて、ファイルをアップロードし、次へをクリックします。
    alt text

  3. エージェントが適切なタイミングで知識を使用するために、読み込むファイルがどのようなものであるかを定義する必要があります。 今回は、説明にこれは2024年のIBMの年次報告書です。財務情報とIBMのコア事業戦略を含んでいますと入力し保存ボタンをクリックしてください。
    alt text

  4. レポートが取り込まれるまでには少し時間がかかります。完了すると、ファイルがナレッジソースのリストに表示されます。
    alt text

  5. プレビューチャットでIBMの2024 年のフリー・キャッシュ・フローはいくらですかと入力します。
    alt text

  6. watsonx Orchestrateが先ほど読み込んだファイルの内容をもとに、適切な回答を行っていることが確認できます。
    alt text

ドキュメントをアップロードすることで、エージェントに対して簡単にRAGを構成できることが確認できました。

エージェントのデプロイ

誰でもこのエージェントを使うことができるように、エージェント作成後はデプロイをする必要があります。
1. 右上のDeployボタンをクリックします。
alt text

  1. 特に何も入力せず、右下のデプロイをクリックします。
    alt text

  2. これでデプロイが完了しました。
    左上のメニューからチャットを選択すると、チャット画面に移動します。デプロイされていることが確認できました。
    alt text

フィードバックの実施

ユーザーからのフィードバックを元に、回答を改善することも重要です。watsonx Orchestrateではユーザーのフィードバックを受け付ける機能を提供します。どの様なフィードバックが可能かを見てみましょう。

  1. 再度IBM の 2024 年のフリー・キャッシュ・フローはいくらですかと入力し、回答に対して👍をクリックします。
    alt text

  2. 回答が簡潔であったため、Conciseを選択し、Submitをクリックします。
    alt text

  3. 一方で、再度IBMの今日の株価を教えてくださいと入力すると、求めていた回答が返ってきませんでした。
    alt text

  4. そのため、👎をクリックし、Incompleteを選択し、Submitをクリックします。
    alt text

  5. ビルダーと管理者はこのフィードバック結果を、APIで確認し、回答の改善に役立てることが可能です。APIの使用方法などは、今回のハンズオンでは省略します。

お疲れ様でした!

このLab1では、watsonx OrchestrateのGUIを使って、簡単にAgentを作成しました。利用ユーザーや業務内容に合わせてカスタマイズを行うことで、ユーザービリティを上げることが可能です。

オプション:モデルの変更

  1. デフォルトでLLMが選択されています。現在のバージョンでは、llama-3-2-90b-vision-instructが選択されています。
    alt text

  2. wxOがサポートしているモデルに切り替えることが可能になります。このハンズオンでは、llama-3-405b-instructに切り替えます。
    現在サポートしているLLMはこちらです。
    alt text

ユースケースに合わせたLLMを選択することで、適切な回答、処理を行うエージェントを作成することができます。

オプション:エージェントに知識を加える(ppt)

Knowledgeは、PDF以外にもPowerPointなどのファイルも使用可能です。

  1. こちらのリンクを右クリックしてファイルに保存してください。このファイルはBWLの価格について説明した資料です。

  2. P4,5にそれぞれ汎用版とUS版のBWLの価格が記載されていることを確認します。
    alt text
    alt text

  3. チャット画面で、Blueworks Liveの価格について教えてくださいのように入力してください。AIから何度か回答までに質問が繰り返されますが、正しい回答は得られないはずです。 alt text

  4. 先ほど実施した手順と同じようにPPTファイルをアップロードし、適切な説明を追加してください。

  5. ファイルの処理が完了したら、再びチャット画面で「Blueworks Liveの価格について教えてください。」と入力します。ファイルをアップロードする前の結果とは異なり、プランごとの価格が一覧として表示されることがわかります。
    alt text