先日、AWS最大のグローバルイベントにして世界最大のクラウドカンファレンス re:Invent2024 が開催されました。
既にGameDay参加の記事をご紹介しましたが、今回はAWSが発表した生成AIの新しい基盤モデル「Amazon Nova」のワークショップに、re:Invent2024 で参加してきましたのでその体験レポートです。
もし、Amazon Nova に興味がある方はぜひご覧ください!
目次[非表示]
まずはじめに、Amazon Nova の話をする前に生成AIの基盤モデルについてご説明する必要があります。
ChatGPTやGeminiなどは認知度も高くご存知の方も多いでしょう。
世の中には様々な生成AIがありますが、それは大量のデータで事前学習された大規模なAIの土台の上で動いています。そのAIの土台の事を基盤モデルといいます。
事前に沢山学習しているので頭が良いんですね!
その基盤モデルにはたくさんの種類があり、代表的なものを以下に列挙してみました。
非常に多くの種類があり群雄割拠な状態ですね。
そんな群雄割拠な状況で、re:Invent2024にてAmazon Novaが発表されました。
眼の前で発表される様子をみて、「まじか!」ってなりました。
Amazonでも基盤モデルは既にTitanなどが発表されていましたが、今回はまったく別名でAmazon Novaとして複数のモデルが発表されました。
一部では「うさぎ?」っていう声も聞こえましたw
AWSの更新情報でもAmazon Novaが取り上げられていましたが、今回は簡単にご紹介します。
Announcing Amazon Nova foundation models available today in Amazon Bedrock
Amazon Novaですが基盤モデルとしては1つではなく、いくつかの種類に分かれます。
名称 | 特徴 |
Amazon Nova Micro | テキストのみを処理。低コストかつ低レイテンシで応答 |
Amazon Nova Lite |
画像、ビデオ、テキスト入力に対応のマルチモーダルモデル、非常に低コスト。 |
Amazon Nova Pro | 幅広いタスクに対応する精度、速度、コストの最適な組み合わせを備えた、高性能なマルチモーダル モデル |
Amazon Nova Premier |
Novaシリーズのマルチモーダルモデルの中で最も複雑な推論タスクに対応 (今後発表予定) |
Amazon Nocv Canvas | テキストから画像の生成が可能なモデル |
Amazon Nova Reel | テキストから動画の生成が可能なモデル |
このCanvasとReelの発表を見て「お!触ってみたい」とすぐ思いました。
Reelはまずは6秒のみということで昔懐かしの6秒動画サービスのVineを思い出します。
そんなAmazon Novaですが、re:Invent2024の最終日にはワークショップがありましたので参加しました。
ちなみにたまたま弊社の髙山さんと小池さんも申し込みされていたので、記念撮影しました!
※左から、髙山、私(久保玉井)、小池
ちなみに上記画像を後ほど動画編集機能で利用します!
ワークショップでは事前に準備した環境に受講者がログインし、Jupyter Notebookのコードを実行する形態でした。
コードを実行すると、Amazon Novaが画像を色々と生成してくれます。
せっかくですので、この記事を呼んでいる方も実習できるようにワークショップ内容についてご説明します。
今回のワークショップの内容は実はGithubにてコードが公開されています。
https://github.com/aws-samples/amazon-bedrock-workshop/tree/main/04_Image_and_Multimodal
ということはAWSアカウントがあれば、SageMaker Studioを使ってワークショップを実施できます。
SageMaker AIでドメインを作成して
その後出来上がったドメイン環境のStudioを開きます。
Studioに入ったらJupyterLabを選択し
あたらしいJupyterLab spaceを作成し、
名前をつけて Create spaceを押します。
その後、どのスペックで動作させるか?の選択になるので、今回はml.m5.largeを選んでRun Spaceします。
ちなみに消し忘れて課金されたら嫌なので後で私は絶対に削除します!(力強い)
準備が整ったら、Open JupyterLabを押します。
JupyterLabが開いたらターミナルを開きます。
ワークショップで用いるコードをGithubからクローンしましょう!
git clone https://github.com/aws-samples/amazon-bedrock-workshop.git
すると左側のフォルダ一覧に対象のフォルダが生成されます。
フォルダ階層としては04_Image_and_Multimodalの中に、NovaCanvasとNovaReelフォルダがあります。
拡張子がipynbのファイルがありますので、それがワークショップで用いるファイルとなります。そのファイルを開くとワークショップ内容が確認できます。
あとはファイルの指示どおりに実行していけば、ワークショップが進みます!
どちらもNovaのモデルを用いるので事前にAmazon Bedrockにてモデルアクセスをリクエストしておく必要があります。
JupyterNotebookの内容としては以下の順番に進んでいきます。
NavaCanvas
ファイル名 | 内容 |
00-NovaCanvas-prerequisites.ipynb | 必要なpytyonモジュールの準備 |
01-text-to-image.ipynb | テキストから画像の生成 |
02-image-inpainting.ipynb | 一部画像の差し替えやマスク処理 |
03-image-outpainting.ipynb | 背景画像の追加処理 |
04-background-removal.ipynb | 背景画像の削除処理 |
05-image-variation.ipynb | 画像を元にして新たにバリエーション画像の生成 |
06-image-conditioning.ipynb | 画像を元にして色調整して生成 |
07-color-conditioning.ipynb | カラーバリエーションを元にして様々なパターン柄の画像生成 |
NavaReel
ファイル名 | 内容 |
00-NovaReel-prerequisites.ipynb | 必要なpytyonモジュールの準備 |
01-text-to-video.ipynb | テキストから動画の生成 |
02-image-to-video.ipynb | 画像から動画の生成 |
なおNovaReelのワークショップをする際には、SageMakerでポリシー追加が必要になります。
トラブルシューティング慣れてないと結構大変かもしれません。汗
さて実際にワークショップを実施して出力された結果です。
今回は以下のテキストを指定して画像を生成してみました。
A men's collared white t-shirt, with a dog image in the center; the whole shirt is visible
ソースコードは掲載しませんが結果は以下の通り
次は画像から画像の生成です。
今回はもとのウェデイング画像からバリエーション生成するサンプルが素敵でした!
最後に動画の生成です。
1280 x 720サイズの画像をもとにして動画を生成です。
サンプル画像だけじゃ面白くないので、先に撮影した記念写真を動画で遊んでみました。
static camera: The hair of all three men turns orange.
なんだこれはwwwww
指示内容が適当なので動画も変ですね!
では実際にワークショップをやってみての気づきです。
新しい基盤モデルということでAWSが準備したAmazon Nova、今後どんどん進化していくと思われます。
事実、別のセッションでは機能が拡張されると案内もされていました。
デザイン業界やプロダクト開発をする際に、画像編集するお仕事をされている方の場合には、Amazon Nova Canvasを用いると、複数の画像を色々とパターン変えて自動生成することが可能なので楽になるでしょうね。
更にAWSの他のサービスと連携することによって、簡単にシステムを構築できるのではないかと思いました。
S3バケットの静的コンテンツ+API Gatewayなアプリケーションをもとに、画像や動画の生成とかもすぐにできそうです!
動画生成のモデルに関しては、Bedrock内では利用できる基盤がほとんど無いので、今回のAmazon Nova Reelは重要な要素だと思います。
ここからは私の予想ですが、おそらく他の基盤モデルも同様に動画生成モデルを沢山出してくるんじゃないかと見込んでいます。
事実、ChatGPTの課金ユーザー向けに動画生成AIの「Sora」も2024年12月9日にリリースされましたしね!
以上がAmazon Novaワークショップの内容でした。
ワークショップJupyterLab Notebookを順番よく実行していけば楽しく進めることができます。ただし気を付けて欲しいのが、SageMaker環境など不要な場合はちゃんと削除されてください。
ハンズオンやワークショップなど、手を動かして学習する場合には最後のお片付けまでお忘れなく!
弊社トレノケートでも、生成AI関係のトレーニングをご準備しております。
興味のあるかたは是非ご受講ください!
生成AIをビジネスに活用する場合、AIの基礎知識、AIの具体的な活用を企画・立案できる力、そしてアイデアを実行に移す開発・運用力が必要です。それらの知識を習得するために各種AI研修をラインアップとしてご準備しております。
上記の基礎コースから更にAWSに特化して、Amazon Bedrockやプロンプトエンジニアリングの手法を学ぶコースがございます。
AWSで大規模言語モデルを利用した生成 AIアプリケーション開発に関する基礎を扱います。
Developing Generative AI Applications on AWS
本ブログでご紹介したAWS研修(認定トレーニング)は他にも多数のラインアップがございます。
詳細はこちらよりご確認ください。
また、そもそもAWSって何?詳しく知りたいという方は、こちらの「AWSとは?AWS認定講師が解説」をご覧ください。