catch-img

Amazon Novaのワークショップで実力を体感! | AWS re:Invent 2024参加レポート

こんにちは! AWS認定インストラクターの小池です。

2024年12月最初の週にAWS最大のグローバルイベントにして世界最大規模のクラウドカンファレンス AWS re:Invent 2024 が開催されました。本ブログでは、AWS re:Invent 2024で参加した『Explore the Power of Amazon Nova Multimodal FMs』での各サービスの設定体験をレポートします。なお、詳細なコードや技術解説は省略しますので、ご了承ください。

そもそもAWSとは何かを詳しく知りたいという方は、こちらの「AWSとは?AWS認定講師が解説」をご覧ください。

目次[非表示]

    1. Amazon Nova とは
    2. Explore the power of Amazon Nova multimodal FMs Workshop
      1. ワークショップの内容
      2. Amazon Nova の実装
      3. Amazon Novaを使用した、Amazon Bedrockエージェントを構築
    3. 実務レベルのハンズオン!現場で活かせるAWSスキルを習得

 

Amazon Novaとは

Amazon Novaは、Amazonが提供する最先端のファウンデーションモデル(FM、基盤モデル)群であり、テキスト、画像、ビデオの理解および生成を可能にするAIモデルです。

Amazon-Nova

re:Inventの2日目に発表され、Nova Micro、Lite、Pro、Premierの各種モデル群に加え、画像・動画生成用のCanvasやReelといったモデルが紹介されました。 特徴やざっくりとした用途は以下の通りです。
カテゴリ モデル名 特徴 用途
生成モデル Nova Micro 低遅延・低コストのテキスト入力専用モデル チャットボット、検索補助、文章要約。ファインチューニングなどで使われる
Nova Lite テキスト・画像・ビデオのマルチモーダル対応 ユーザーインタラクション、シンプルなビジュアル理解
Nova Pro 高精度なマルチモーダル対応 高度なテキスト・画像・ビデオ分析
クリエイティブコンテンツ生成モデル Nova Canvas 画像生成(テキスト・画像入力) 広告、デザイン、イラスト生成
Nova Reel ビデオ生成(テキスト・画像入力) ショート動画作成、プロモーション動画
今後追加予定 スピーチ・トゥ・スピーチモデル 音声から音声への変換 AIアシスタント、翻訳
マルチモーダル・トゥ・マルチモーダルモデル 複数のデータ形式を相互変換 高度なAIコンテンツ生成
 

発表時から実際に触ってみたい!とワクワクしていました。

Amazon Nova については、弊社のAWS認定インストラクターの久保玉井もブログでまとめています。詳細はこちらをご確認ください。

最新!Amazon Nova ワークショップ体験と利用方法を紹介 | AWS re:Invent 2024参加レポート

Explore the power of Amazon Nova multimodal FMs

re:Inventで発表された Amazon Nova を実装するワークショップに参加しました。前日に発表されたばかりのモデルを扱うワークショップだったため、大人気でした 25 分前から実施会場に並びはじめ、なんと最後の1人で入場することができました。

余談ですが、アプリでは Coming soon となっているセッションでも予約をすると先んじてセッション内容を確認することができます。最新のサービスのセッションは人気ですので早めに予約をされることをおすすめします。

Image (2)

ワークショップの内容

In this workshop, explore Amazon Nova multimodal understanding models in depth. Discover how you can enable innovative applications across various domains. Learn how Amazon Nova models integrate with key Amazon Bedrock features such as customization (distillation), CRIS (conditional on availability), guardrails, evaluations, agents, and knowledge bases. Gain hands-on experience using the AWS Management Console and Amazon Bedrock Converse API for text, image, and video understanding tasks. Finally, explore a use case of a personalized shopping assistant that combines multimodal inputs, MM-RAG, and agents. You must bring your laptop to participate.

翻訳
このワークショップでは、Amazon Novaのマルチモーダル理解モデルを深く掘り下げます。様々なドメインにまたがる革新的なアプリケーションを実現する方法を発見してください。Amazon Novaモデルが、カスタマイズ(蒸留)、CRIS(可用性条件)、ガードレール、評価、エージェント、ナレッジベースなどのAmazon Bedrockの主要な機能とどのように統合されているかを学びます。AWSマネジメントコンソールとAmazon Bedrock Converse APIを使って、テキスト、画像、動画の理解タスクを実際に体験します。最後に、マルチモーダル入力、MM-RAG、エージェントを組み合わせたパーソナライズされたショッピングアシスタントのユースケースを探ります。参加にはノートパソコンが必要です。

Amazon NovaをPython SDK を使用しテキスト・画像・動画の処理やエージェント、RAGなどといった生成AI の機能を一通り試すことのできるワークショップでした。

Amazon Nova の実装

はじめにNova を実装するための環境構築を行い、関数の作成を行いました。

Cursor_と_01_Getting_S...__10__-_JupyterLab

他のモデルを使用する際と大きな違いはなく、パラメータ等も設定しています。

次に実行です。Amazon Novaについて聞いてみました。モデルは一番軽量な Nova micro を使用しています。

Cursor_と_01_Getting_S...__10__-_JupyterLab-2

出力結果に関して、要点を抑えた自然な文章が出力されています。また、出力にかかる時間を計測したところ以下のような結果がでました。

01_Getting_S...__10__-_JupyterLab

CPU自体は約74.8ミリ秒で処理をしていることがわかります。全体の実行時間は3.45秒でした。

全体の実行時間はネットワークなどの関係もあるため評価がしにくいですが、処理時間がものすごく早い印象を受けました。

実装に関しては、すでに用意された.ipynbファイルがあるため、説明文を翻訳しながら実行するだけで済みました。
             

Amazon Novaを使用した、Amazon Bedrockエージェントを構築

エージェントの実装では以下の手順でAgents for Amazon Bedrock と AWS Lambda を組み合わせてアプリケーションを構築し、台帳として Amazon DynamoDB を使用することにより、ホテル予約チャットボットを構築する実装を行いました。

  1. エージェントの作成
    エージェントをゼロから作成する方法と、必要なパラメーター・設定について学びます。
  2. 知識ベースとの連携
    作成したエージェントに知識ベースを統合する手法を確認します。これにより、エージェントは豊富な情報ソースから回答を導き出すことが可能になります。
  3. エージェントの呼び出し
    実際にエージェントへ問い合わせを行い、生成された応答(ストリーミング対応の場合も含む)を取得する方法を学びます。

RAG では事前に用意されたホテルの情報を参照するようなシステムを構築しています。

はじめの入力ではホテルのデータを参照するようなプロンプトを入力しています。(*プロンプトのみ後から日本語翻訳を行っています)

Cursor_と_4_3_invoke_a...__10__-_JupyterLab

 

出力を見てみると、RAGで構築した情報が参照され、適切な応答が生成されていました。次に予約のリクエストを行い、Lambdaが起動し、DynamoDB へデータの書き込みがされるかを確認します。

4_3_invoke_a...__10__-_JupyterLab

予約時の出力として予約番号が発行されました。

DynamoDBを確認すると予約番号に紐づく形で予約名が書き込まれています。

このように、実際に触れる機会を得たことで、非常に理解が深まりました。

 

AWSではAWS Workshopsとしてさまざまなハンズオン手順が公開されています。今回参加をしたWorkshop の内容は現時点(※記事執筆日2025年1月)では公開されていませんがNova Reel など最新技術のワークショップが記載されています。

AWSの各サービスも同様に、実際に設定・操作することで理解が深まり、イメージしやすくなります。ぜひチャレンジしてみてください。

 

実務レベルのハンズオン!現場で活かせるAWSスキルを習得

AWSの関連イベントでは、AWS re:Inventをはじめ、たくさんのワークショップやデモ等を体験することができます。

それらの体験は体験として終わらせずに、この機会に現場(仕事)で活かしてみませんか?現場で活かすには、実務スキルの習得が必要です。

実務スキルを効果的に習得するには、ハンズオンを体験しながらスキルアップを目指すAWS Skill BuilderAWS研修(認定トレーニング)がおすすめです。実務経験を積んだAWS認定講師が手厚くフォローいたします。

 

現場で活かせるAWSスキルの習得には、ぜひトレノケートのAWS研修をご検討ください。

▼トレノケートのAWS研修をもっと知りたい方はこちらから
AWS研修(AWS認定トレーニング)|AWS資格取得や基礎習得ならIT研修のトレノケート

小池 歩(こいけ あゆむ)

AWS、Microsoft 認定トレーナー。AI に関する講座の登壇・開発を担当。 趣味はサッカー観戦とラーメン。

無料ダウンロード

オススメコンテンツ

オススメ記事

AWS プロジェクトマネジメント PMP 人材育成 ITスキル クラウド 田中淳子 AWS認定トレーニング Microsoft ビジネススキル PMBOKⓇ IT資格 山下光洋 AMA コミュニケーション Azure 人材開発用語集 PMBOK®ガイド入門 スキルアップ 人材育成応援ラジオ 新入社員 横山哲也 DX re:Invent AI(人工知能) セキュリティ PMP試験問題に挑戦 イベント・セミナー Cisco PMBOKⓇガイド 第6版 キャリア 試験体験記 PMBOK®ガイド第6版の変更点 人材開発 生成AI CCIE CCNA 研修 AI人材 IT人材 ヒューマンスキル DX人材育成 テレワーク ネットワーク リモートワーク 人材トレンド GCP PMP(R)試験問題 第6版対応 PMP合格体験記 Windows Server reinvent2024 リーダーシップ AWS_Q&A Active Directory ITエンジニア IT資格解説 Voicy書き起こし アセスメント デジタルビジネス 人気コースランキング 大喜利 部下の育成 PMの心得 reinvent2023 グローバル人材 プログラミング リスキリング 新入社員研修といえば AWS_DiscoveryDay IoT OJT reinvent2022 1on1 CCNP Security Windows PowerShell クリエイティビティ コーチング 試験Tips 認定資格 AWSトレーニングイベント Google Cloud ITインフラ PMP試験対策一問一答 Voicyまとめ ダイバーシティ プロジェクト プロトタイプビルダー 新入社員研修 無料セミナー 試験対策問題 GCP無料セミナー Google Cloud Platform G検定 Linux Power Platform oVice voicy アワード クリティカルシンキング