
Amazon Novaのワークショップで実力を体感! | AWS re:Invent 2024参加レポート
2024年12月最初の週にAWS最大のグローバルイベントにして世界最大規模のクラウドカンファレンス AWS re:Invent 2024 が開催されました。本ブログでは、AWS re:Invent 2024で参加した『Explore the Power of Amazon Nova Multimodal FMs』での各サービスの設定体験をレポートします。なお、詳細なコードや技術解説は省略しますので、ご了承ください。
そもそもAWSとは何かを詳しく知りたいという方は、こちらの「AWSとは?AWS認定講師が解説」をご覧ください。
目次[非表示]
Amazon Novaとは
Amazon Novaは、Amazonが提供する最先端のファウンデーションモデル(FM、基盤モデル)群であり、テキスト、画像、ビデオの理解および生成を可能にするAIモデルです。
カテゴリ | モデル名 | 特徴 | 用途 |
---|---|---|---|
生成モデル | Nova Micro | 低遅延・低コストのテキスト入力専用モデル | チャットボット、検索補助、文章要約。ファインチューニングなどで使われる |
Nova Lite | テキスト・画像・ビデオのマルチモーダル対応 | ユーザーインタラクション、シンプルなビジュアル理解 | |
Nova Pro | 高精度なマルチモーダル対応 | 高度なテキスト・画像・ビデオ分析 | |
クリエイティブコンテンツ生成モデル | Nova Canvas | 画像生成(テキスト・画像入力) | 広告、デザイン、イラスト生成 |
Nova Reel | ビデオ生成(テキスト・画像入力) | ショート動画作成、プロモーション動画 | |
今後追加予定 | スピーチ・トゥ・スピーチモデル | 音声から音声への変換 | AIアシスタント、翻訳 |
マルチモーダル・トゥ・マルチモーダルモデル | 複数のデータ形式を相互変換 | 高度なAIコンテンツ生成 |
発表時から実際に触ってみたい!とワクワクしていました。
Amazon Nova については、弊社のAWS認定インストラクターの久保玉井もブログでまとめています。詳細はこちらをご確認ください。
最新!Amazon Nova ワークショップ体験と利用方法を紹介 | AWS re:Invent 2024参加レポート
Explore the power of Amazon Nova multimodal FMs
re:Inventで発表された Amazon Nova を実装するワークショップに参加しました。前日に発表されたばかりのモデルを扱うワークショップだったため、大人気でした 。 25 分前から実施会場に並びはじめ、なんと最後の1人で入場することができました。
余談ですが、アプリでは Coming soon となっているセッションでも予約をすると先んじてセッション内容を確認することができます。最新のサービスのセッションは人気ですので早めに予約をされることをおすすめします。
ワークショップの内容
In this workshop, explore Amazon Nova multimodal understanding models in depth. Discover how you can enable innovative applications across various domains. Learn how Amazon Nova models integrate with key Amazon Bedrock features such as customization (distillation), CRIS (conditional on availability), guardrails, evaluations, agents, and knowledge bases. Gain hands-on experience using the AWS Management Console and Amazon Bedrock Converse API for text, image, and video understanding tasks. Finally, explore a use case of a personalized shopping assistant that combines multimodal inputs, MM-RAG, and agents. You must bring your laptop to participate.
翻訳
このワークショップでは、Amazon Novaのマルチモーダル理解モデルを深く掘り下げます。様々なドメインにまたがる革新的なアプリケーションを実現する方法を発見してください。Amazon Novaモデルが、カスタマイズ(蒸留)、CRIS(可用性条件)、ガードレール、評価、エージェント、ナレッジベースなどのAmazon Bedrockの主要な機能とどのように統合されているかを学びます。AWSマネジメントコンソールとAmazon Bedrock Converse APIを使って、テキスト、画像、動画の理解タスクを実際に体験します。最後に、マルチモーダル入力、MM-RAG、エージェントを組み合わせたパーソナライズされたショッピングアシスタントのユースケースを探ります。参加にはノートパソコンが必要です。
Amazon NovaをPython SDK を使用しテキスト・画像・動画の処理やエージェント、RAGなどといった生成AI の機能を一通り試すことのできるワークショップでした。
Amazon Nova の実装
はじめにNova を実装するための環境構築を行い、関数の作成を行いました。
他のモデルを使用する際と大きな違いはなく、パラメータ等も設定しています。
次に実行です。Amazon Novaについて聞いてみました。モデルは一番軽量な Nova micro を使用しています。
出力結果に関して、要点を抑えた自然な文章が出力されています。また、出力にかかる時間を計測したところ以下のような結果がでました。
CPU自体は約74.8ミリ秒で処理をしていることがわかります。全体の実行時間は3.45秒でした。
全体の実行時間はネットワークなどの関係もあるため評価がしにくいですが、処理時間がものすごく早い印象を受けました。
実装に関しては、すでに用意された.ipynbファイルがあるため、説明文を翻訳しながら実行するだけで済みました。
Amazon Novaを使用した、Amazon Bedrockエージェントを構築
エージェントの実装では以下の手順でAgents for Amazon Bedrock と AWS Lambda を組み合わせてアプリケーションを構築し、台帳として Amazon DynamoDB を使用することにより、ホテル予約チャットボットを構築する実装を行いました。
-
エージェントの作成
エージェントをゼロから作成する方法と、必要なパラメーター・設定について学びます。 -
知識ベースとの連携
作成したエージェントに知識ベースを統合する手法を確認します。これにより、エージェントは豊富な情報ソースから回答を導き出すことが可能になります。 -
エージェントの呼び出し
実際にエージェントへ問い合わせを行い、生成された応答(ストリーミング対応の場合も含む)を取得する方法を学びます。
RAG では事前に用意されたホテルの情報を参照するようなシステムを構築しています。
はじめの入力ではホテルのデータを参照するようなプロンプトを入力しています。(*プロンプトのみ後から日本語翻訳を行っています)
出力を見てみると、RAGで構築した情報が参照され、適切な応答が生成されていました。次に予約のリクエストを行い、Lambdaが起動し、DynamoDB へデータの書き込みがされるかを確認します。
予約時の出力として予約番号が発行されました。
DynamoDBを確認すると予約番号に紐づく形で予約名が書き込まれています。
このように、実際に触れる機会を得たことで、非常に理解が深まりました。
AWSではAWS Workshopsとしてさまざまなハンズオン手順が公開されています。今回参加をしたWorkshop の内容は現時点(※記事執筆日2025年1月)では公開されていませんがNova Reel など最新技術のワークショップが記載されています。
AWSの各サービスも同様に、実際に設定・操作することで理解が深まり、イメージしやすくなります。ぜひチャレンジしてみてください。
実務レベルのハンズオン!現場で活かせるAWSスキルを習得
AWSの関連イベントでは、AWS re:Inventをはじめ、たくさんのワークショップやデモ等を体験することができます。
それらの体験は体験として終わらせずに、この機会に現場(仕事)で活かしてみませんか?現場で活かすには、実務スキルの習得が必要です。
実務スキルを効果的に習得するには、ハンズオンを体験しながらスキルアップを目指すAWS Skill BuilderやAWS研修(認定トレーニング)がおすすめです。実務経験を積んだAWS認定講師が手厚くフォローいたします。
現場で活かせるAWSスキルの習得には、ぜひトレノケートのAWS研修をご検討ください。
▼トレノケートのAWS研修をもっと知りたい方はこちらから
AWS研修(AWS認定トレーニング)|AWS資格取得や基礎習得ならIT研修のトレノケート
