Amazon Bedrockの新機能「Bedrock Data Automation (BDA)」を試してみた
はじめに
株式会社トラスト、AWSソリューションアーキテクト兼AI・MLエンジニアの高宮です。
今回は、re:Invent 2024の Dr.Swamiによるkeynoteで発表されたデータオートメーションを試してみました。発表についての詳細はこちらの記事をご覧ください。
この記事で扱う内容は以下の通りです。
目次
1.Bedrock Data Automation (BDA)とは?
2.ユースケース
3.実験
1.Bedrock Data Automation (BDA)とは?
Bedrock Data Automation (BDA) は、書類や画像、動画、音声といったさまざまな種類のデータを分かりやすい形に変えることができるクラウドサービスです。BDA は生成AIの技術を使って、複雑なデータを自動で整理し、必要な情報を取り出せるようにします。これにより、アプリの開発や作業の効率化がスムーズに進むようサポートしてくれます。
2.ユースケース
大きく3つのタスクを実行可能です。
- ドキュメント処理:BDA を使うと、インテリジェントなドキュメント処理(IDP)の作業を大規模に自動化できます。分類、情報抽出、データの整理(正規化)、内容の確認(検証)といった複雑な作業を自分で管理する必要はありません。これにより、整理されていないドキュメントを業務に役立つ構造化データに変換できます。また、BDA の出力をカスタマイズして、今使っているシステムやワークフローに簡単に統合することが可能です。
- メディア分析:BDA は、整理されていない動画から価値ある情報を引き出します。シーンごとの要約を作成したり、不適切または危険な内容を検出したり、動画内の文字を読み取ったり、広告やブランドに基づいて分類したりすることができます。これらのデータを活用することで、効率的な動画検索を実現したり、文脈に合った広告の配置を最適化したり、ブランドの安全性やルール遵守を確保したりできます。
- 生成AIアシスタント:BDA は質問応答型のアプリケーションをさらに賢くします。RAG(検索拡張生成)技術を活用するAIアシスタントに対し、ドキュメントや画像、動画、音声から抽出したリッチなデータを提供することで、より正確で詳しい回答を生み出せるようサポートします。
3.実験
こちらの機能はオレゴンリージョンのみでプレビューのため、リージョンをオレゴンに切り替える必要があります。
デモを見るを押下します。
ドキュメント分析
あとは用意されているドキュメントを選択し、結果を生成ボタンを押下します。
S3バケット作成の確認をします。確認を押下します。
数秒で結果が表示されました。
デフォルトではマークダウンで出力されています。
Configurationには出力形式が複数表示されています。
Plain textを再度出力してみます。
プロジェクトを作成する必要があるようです。
プロジェクト名を入力しプロジェクトを作成
正しく出力されています!
以下の設定を変更してみます。
Generative Fieldsにチェックを入れました。
この画像についての要約を自動で実行してくれています!
設定の詳細についてもう少し見てみます。
ページレベルは複数のドキュメントが渡された場合にページ毎に結果を出力するものです。
でもページには複数ページないので、ダミーの契約書を渡してみます。
以下のようなダミーの契約書PDF3枚を渡します。
結果として3ページ出力されましたが、日本語が認識されていません!
プレビューということもあり、英語のみの対応なのかもしれません。
公式ドキュメント:https://docs.aws.amazon.com/bedrock/latest/userguide/bda-output-documents.html
画像分析
ドキュメントの設定とは設定できる値が変わりました。
出力結果
かなり詳細な回答をしてくれています。
設定値としては、テキスト検知以外にも不適切な物体を検知する値もあります。
公式ドキュメント: https://docs.aws.amazon.com/bedrock/latest/userguide/bda-ouput-image.html
動画分析
サンプルのre:Invent Keynoteを選択します。
動画自体を確認できないので、何分の動画に対して推論を行なっているかは不明です。
設定値は以下になります。
まずは動画の要約をしてくれています。
次にシーン毎に要約をしてくれています。これは凄い!
最後に動画からテキストを抽出してくれています。
参照: https://docs.aws.amazon.com/bedrock/latest/userguide/bda-ouput-video.html
オーディオ
最後に音に対して推論をしてみます。
こちらは3分57秒の音声データのようです。
まずは文字起こしをします。
かなり長い音声データですが、数秒で出力されました。
次に以下の設定をして出力してみます。
要約とチャプターごとの要約を追加したため、2分ほど出力までに時間がかかりました。
まずは全体の要約
次にチャプター毎の要約
これも凄い!
参照: https://docs.aws.amazon.com/bedrock/latest/userguide/audio-processing.html
以上、「Amazon Bedrockの新機能「Bedrock Data Automation (BDA)」を試してみた」でした!