Amazon Bedrockの新機能「Bedrock Data Automation (BDA)」を試してみた

はじめに

株式会社トラスト、AWSソリューションアーキテクト兼AI・MLエンジニアの高宮です。

今回は、re:Invent 2024の Dr.Swamiによるkeynoteで発表されたデータオートメーションを試してみました。発表についての詳細はこちらの記事をご覧ください。

この記事で扱う内容は以下の通りです。

目次

1.Bedrock Data Automation (BDA)とは?

2.ユースケース

3.実験

1.Bedrock Data Automation (BDA)とは?

Bedrock Data Automation (BDA) は、書類や画像、動画、音声といったさまざまな種類のデータを分かりやすい形に変えることができるクラウドサービスです。BDA は生成AIの技術を使って、複雑なデータを自動で整理し、必要な情報を取り出せるようにします。これにより、アプリの開発や作業の効率化がスムーズに進むようサポートしてくれます。

2.ユースケース

大きく3つのタスクを実行可能です。

  • ドキュメント処理:BDA を使うと、インテリジェントなドキュメント処理(IDP)の作業を大規模に自動化できます。分類、情報抽出、データの整理(正規化)、内容の確認(検証)といった複雑な作業を自分で管理する必要はありません。これにより、整理されていないドキュメントを業務に役立つ構造化データに変換できます。また、BDA の出力をカスタマイズして、今使っているシステムやワークフローに簡単に統合することが可能です。
  • メディア分析:BDA は、整理されていない動画から価値ある情報を引き出します。シーンごとの要約を作成したり、不適切または危険な内容を検出したり、動画内の文字を読み取ったり、広告やブランドに基づいて分類したりすることができます。これらのデータを活用することで、効率的な動画検索を実現したり、文脈に合った広告の配置を最適化したり、ブランドの安全性やルール遵守を確保したりできます。
  • 生成AIアシスタント:BDA は質問応答型のアプリケーションをさらに賢くします。RAG(検索拡張生成)技術を活用するAIアシスタントに対し、ドキュメントや画像、動画、音声から抽出したリッチなデータを提供することで、より正確で詳しい回答を生み出せるようサポートします。

3.実験

こちらの機能はオレゴンリージョンのみでプレビューのため、リージョンをオレゴンに切り替える必要があります。

デモを見るを押下します。

ドキュメント分析

あとは用意されているドキュメントを選択し、結果を生成ボタンを押下します。

S3バケット作成の確認をします。確認を押下します。

数秒で結果が表示されました。

デフォルトではマークダウンで出力されています。

Configurationには出力形式が複数表示されています。

Plain textを再度出力してみます。

プロジェクトを作成する必要があるようです。

プロジェクト名を入力しプロジェクトを作成

正しく出力されています!

以下の設定を変更してみます。

Generative Fieldsにチェックを入れました。

この画像についての要約を自動で実行してくれています!

設定の詳細についてもう少し見てみます。

ページレベルは複数のドキュメントが渡された場合にページ毎に結果を出力するものです。

でもページには複数ページないので、ダミーの契約書を渡してみます。

以下のようなダミーの契約書PDF3枚を渡します。

結果として3ページ出力されましたが、日本語が認識されていません!

プレビューということもあり、英語のみの対応なのかもしれません。

公式ドキュメント:https://docs.aws.amazon.com/bedrock/latest/userguide/bda-output-documents.html

画像分析

ドキュメントの設定とは設定できる値が変わりました。

出力結果

かなり詳細な回答をしてくれています。

設定値としては、テキスト検知以外にも不適切な物体を検知する値もあります。

公式ドキュメント: https://docs.aws.amazon.com/bedrock/latest/userguide/bda-ouput-image.html

動画分析

サンプルのre:Invent Keynoteを選択します。

動画自体を確認できないので、何分の動画に対して推論を行なっているかは不明です。

設定値は以下になります。

まずは動画の要約をしてくれています。

次にシーン毎に要約をしてくれています。これは凄い!

最後に動画からテキストを抽出してくれています。

参照: https://docs.aws.amazon.com/bedrock/latest/userguide/bda-ouput-video.html

オーディオ

最後に音に対して推論をしてみます。

こちらは3分57秒の音声データのようです。

まずは文字起こしをします。

かなり長い音声データですが、数秒で出力されました。

次に以下の設定をして出力してみます。

要約とチャプターごとの要約を追加したため、2分ほど出力までに時間がかかりました。

まずは全体の要約

次にチャプター毎の要約

これも凄い!

参照: https://docs.aws.amazon.com/bedrock/latest/userguide/audio-processing.html

以上、「Amazon Bedrockの新機能「Bedrock Data Automation (BDA)」を試してみた」でした!