catch-img

最新!Amazon Nova ワークショップ体験と利用方法を紹介 | AWS re:Invent 2024参加レポート

こんにちは!好きなラーメンは二郎系!
AWS認定講師の久保玉井です。

先日、AWS最大のグローバルイベントにして世界最大のクラウドカンファレンス re:Invent2024 が開催されました。

既にGameDay参加の記事をご紹介しましたが、今回はAWSが発表した生成AIの新しい基盤モデル「Amazon Nova」のワークショップに、re:Invent2024 で参加してきましたのでその体験レポートです。

もし、Amazon Nova に興味がある方はぜひご覧ください!

目次[非表示]

  1. はじめに
  2. Amazon Novaとは?
    1. サービスの特徴
  3. ワークショップ内容
    1. ワークショップ環境のセットアップ
    2. ワークショップ内容
  4. 生成結果
    1. テキストから画像
    2. 画像から画像
    3. 画像から動画
  5. ワークショップで得た気づき
    1. メリット
    2. 今後の展望
  6. まとめ
  7. トレノケートの生成AIトレーニング
    1. 基礎コース
    2. おすすめコース

 

 

はじめに

まずはじめに、Amazon Nova の話をする前に生成AIの基盤モデルについてご説明する必要があります。

ChatGPTやGeminiなどは認知度も高くご存知の方も多いでしょう。

世の中には様々な生成AIがありますが、それは大量のデータで事前学習された大規模なAIの土台の上で動いています。そのAIの土台の事を基盤モデルといいます。

事前に沢山学習しているので頭が良いんですね!

学ぶ人工知能のイラスト

 

その基盤モデルにはたくさんの種類があり、代表的なものを以下に列挙してみました。

モデル名 開発企業 主な特徴
Google Gemini Google Google Cloudサービスとの連携が強み
Anthropic Claude Anthropic 安全性と倫理的AIを重視したモデル
IBM Granite IBM ビジネス向けに最適化
OpenAI GPT-4 OpenAI マルチモーダル対応、高度な言語理解能力
AWS Amazon Titan AWS AWSサービスとの統合が特徴
Cohere Command Cohere 言語理解と生成に特化
Stable Diffusion Stability AI 画像生成に特化、軽量な実行環境で動作可能
BERT Google 双方向の文脈理解が可能
DALL-E 3 OpenAI 高品質な画像生成が特徴

非常に多くの種類があり群雄割拠な状態ですね。

Amazon Novaが2024年12月3日に発表されました

そんな群雄割拠な状況で、re:Invent2024にてAmazon Novaが発表されました。

PXL_20241203_174927924.MP

眼の前で発表される様子をみて、「まじか!」ってなりました。

 

 

Amazon Novaとは?

Amazonでも基盤モデルは既にTitanなどが発表されていましたが、今回はまったく別名でAmazon Novaとして複数のモデルが発表されました。

一部では「うさぎ?」っていう声も聞こえましたw

サービスの特徴

AWSの更新情報でもAmazon Novaが取り上げられていましたが、今回は簡単にご紹介します。

Announcing Amazon Nova foundation models available today in Amazon Bedrock

Amazon Novaですが基盤モデルとしては1つではなく、いくつかの種類に分かれます。

PXL_20241206_183214199

名称 特徴
Amazon Nova Micro テキストのみを処理。低コストかつ低レイテンシで応答

Amazon Nova Lite

画像、ビデオ、テキスト入力に対応のマルチモーダルモデル、非常に低コスト。
Amazon Nova Pro 幅広いタスクに対応する精度、速度、コストの最適な組み合わせを備えた、高性能なマルチモーダル モデル
Amazon Nova Premier

Novaシリーズのマルチモーダルモデルの中で最も複雑な推論タスクに対応

(今後発表予定)

Amazon Nocv Canvas テキストから画像の生成が可能なモデル
Amazon Nova Reel テキストから動画の生成が可能なモデル

このCanvasとReelの発表を見て「お!触ってみたい」とすぐ思いました。

画像生成するCanvas

Reelはまずは6秒のみということで昔懐かしの6秒動画サービスのVineを思い出します。

PXL_20241203_175628680.MP

 

 

ワークショップ内容

そんなAmazon Novaですが、re:Invent2024の最終日にはワークショップがありましたので参加しました。

ちなみにたまたま弊社の髙山さんと小池さんも申し込みされていたので、記念撮影しました!

PXL_20241206_182721129

※左から、髙山、私(久保玉井)、小池

ちなみに上記画像を後ほど動画編集機能で利用します!

 

ワークショップでは事前に準備した環境に受講者がログインし、Jupyter Notebookのコードを実行する形態でした。

PXL_20241206_163023026.MP

コードを実行すると、Amazon Novaが画像を色々と生成してくれます。

PXL_20241206_183611229

 

ワークショップ環境のセットアップ

せっかくですので、この記事を呼んでいる方も実習できるようにワークショップ内容についてご説明します。

今回のワークショップの内容は実はGithubにてコードが公開されています。

https://github.com/aws-samples/amazon-bedrock-workshop/tree/main/04_Image_and_Multimodal

ということはAWSアカウントがあれば、SageMaker Studioを使ってワークショップを実施できます。

SageMaker AIでドメインを作成して

その後出来上がったドメイン環境のStudioを開きます。

Studioに入ったらJupyterLabを選択し

あたらしいJupyterLab spaceを作成し、

名前をつけて Create spaceを押します。

その後、どのスペックで動作させるか?の選択になるので、今回はml.m5.largeを選んでRun Spaceします。

ちなみに消し忘れて課金されたら嫌なので後で私は絶対に削除します!(力強い)

準備が整ったら、Open JupyterLabを押します。

JupyterLabが開いたらターミナルを開きます。

ワークショップで用いるコードをGithubからクローンしましょう!

git clone https://github.com/aws-samples/amazon-bedrock-workshop.git

 

すると左側のフォルダ一覧に対象のフォルダが生成されます。

 

フォルダ階層としては04_Image_and_Multimodalの中に、NovaCanvasとNovaReelフォルダがあります。

 

拡張子がipynbのファイルがありますので、それがワークショップで用いるファイルとなります。そのファイルを開くとワークショップ内容が確認できます。

 

あとはファイルの指示どおりに実行していけば、ワークショップが進みます!

 

ワークショップ内容

どちらもNovaのモデルを用いるので事前にAmazon Bedrockにてモデルアクセスをリクエストしておく必要があります。

画像

JupyterNotebookの内容としては以下の順番に進んでいきます。

NavaCanvas

ファイル名 内容
00-NovaCanvas-prerequisites.ipynb 必要なpytyonモジュールの準備
01-text-to-image.ipynb テキストから画像の生成
02-image-inpainting.ipynb 一部画像の差し替えやマスク処理
03-image-outpainting.ipynb 背景画像の追加処理
04-background-removal.ipynb 背景画像の削除処理
05-image-variation.ipynb 画像を元にして新たにバリエーション画像の生成
06-image-conditioning.ipynb 画像を元にして色調整して生成
07-color-conditioning.ipynb カラーバリエーションを元にして様々なパターン柄の画像生成

 

NavaReel

ファイル名 内容
00-NovaReel-prerequisites.ipynb 必要なpytyonモジュールの準備
01-text-to-video.ipynb テキストから動画の生成
02-image-to-video.ipynb 画像から動画の生成

なおNovaReelのワークショップをする際には、SageMakerでポリシー追加が必要になります。

トラブルシューティング慣れてないと結構大変かもしれません。汗

生成結果

さて実際にワークショップを実施して出力された結果です。

テキストから画像

今回は以下のテキストを指定して画像を生成してみました。

A men's collared white t-shirt, with a dog image in the center; the whole shirt is visible

ソースコードは掲載しませんが結果は以下の通り

画像から画像

次は画像から画像の生成です。

今回はもとのウェデイング画像からバリエーション生成するサンプルが素敵でした!

画像から動画

最後に動画の生成です。

1280 x 720サイズの画像をもとにして動画を生成です。

 

サンプル画像だけじゃ面白くないので、先に撮影した記念写真を動画で遊んでみました。

static camera: The hair of all three men turns orange.

なんだこれはwwwww


指示内容が適当なので動画も変ですね!

 

 

ワークショップで得た気づき

では実際にワークショップをやってみての気づきです。

 

メリット

新しい基盤モデルということでAWSが準備したAmazon Nova、今後どんどん進化していくと思われます。

事実、別のセッションでは機能が拡張されると案内もされていました。

PXL_20241206_171835042

デザイン業界やプロダクト開発をする際に、画像編集するお仕事をされている方の場合には、Amazon Nova Canvasを用いると、複数の画像を色々とパターン変えて自動生成することが可能なので楽になるでしょうね。

更にAWSの他のサービスと連携することによって、簡単にシステムを構築できるのではないかと思いました。

S3バケットの静的コンテンツ+API Gatewayなアプリケーションをもとに、画像や動画の生成とかもすぐにできそうです!

今後の展望

動画生成のモデルに関しては、Bedrock内では利用できる基盤がほとんど無いので、今回のAmazon Nova Reelは重要な要素だと思います。

ここからは私の予想ですが、おそらく他の基盤モデルも同様に動画生成モデルを沢山出してくるんじゃないかと見込んでいます。

事実、ChatGPTの課金ユーザー向けに動画生成AIの「Sora」も2024年12月9日にリリースされましたしね!

 

まとめ

以上がAmazon Novaワークショップの内容でした。

ワークショップJupyterLab Notebookを順番よく実行していけば楽しく進めることができます。ただし気を付けて欲しいのが、SageMaker環境など不要な場合はちゃんと削除されてください。

ハンズオンやワークショップなど、手を動かして学習する場合には最後のお片付けまでお忘れなく!

 

 

トレノケートの生成AIトレーニング

弊社トレノケートでも、生成AI関係のトレーニングをご準備しております。
興味のあるかたは是非ご受講ください!

基礎コース

生成AIをビジネスに活用する場合、AIの基礎知識、AIの具体的な活用を企画・立案できる力、そしてアイデアを実行に移す開発・運用力が必要です。それらの知識を習得するために各種AI研修をラインアップとしてご準備しております。

AI人材育成トレーニング

 

おすすめコース

上記の基礎コースから更にAWSに特化して、Amazon Bedrockやプロンプトエンジニアリングの手法を学ぶコースがございます。

AWSで大規模言語モデルを利用した生成 AIアプリケーション開発に関する基礎を扱います。

Developing Generative AI Applications on AWS

 

本ブログでご紹介したAWS研修(認定トレーニング)は他にも多数のラインアップがございます。
詳細はこちらよりご確認ください。

また、そもそもAWSって何?詳しく知りたいという方は、こちらの「AWSとは?AWS認定講師が解説」をご覧ください。

久保玉井 純

トレノケート株式会社 日本最南端社員
AWS & OCI 認定インストラクター
2024/2023 Japan AWS All Certifications Engineer
好きなラーメンは二郎系です。 https://maijun.net/

久保玉井純が書いたブログ記事一覧

無料ダウンロード

オススメコンテンツ

オススメ記事

AWS プロジェクトマネジメント PMP 人材育成 田中淳子 Microsoft ITスキル ビジネススキル PMBOKⓇ IT資格 クラウド 山下光洋 人材育成応援ラジオ AMA コミュニケーション AWS認定トレーニング Azure 人材開発用語集 PMBOK®ガイド入門 新入社員 横山哲也 DX re:Invent セキュリティ AI(人工知能) PMP試験問題に挑戦 イベント・セミナー スキルアップ Cisco PMBOKⓇガイド 第6版 試験体験記 キャリア PMBOK®ガイド第6版の変更点 人材開発 CCIE CCNA 生成AI 研修 AI人材 IT人材 DX人材育成 テレワーク ネットワーク リモートワーク 人材トレンド GCP PMP(R)試験問題 第6版対応 PMP合格体験記 Windows Server voicy リーダーシップ AWS_Q&A Active Directory IT資格解説 アセスメント デジタルビジネス ヒューマンスキル 人気コースランキング 大喜利 部下の育成 PMの心得 reinvent2023 グローバル人材 プログラミング リスキリング 新入社員研修といえば ITエンジニア IoT OJT reinvent2022 1on1 AWS_DiscoveryDay CCNP Security Windows PowerShell クリエイティビティ コーチング 試験Tips AWSトレーニングイベント Google Cloud ITインフラ PMP試験対策一問一答 Voicyまとめ ダイバーシティ プロジェクト プロトタイプビルダー 新入社員研修 試験対策問題 GCP無料セミナー Google Cloud Platform G検定 Linux Power Platform oVice アワード クリティカルシンキング サンプル問題 ステークホルダー ディープラーニング リーダー