4回目¶
今回やってみること¶
↓を作ってみて、実際にアプリを触って生成AIの凄さに触れてみる。
生成 AI 体験ワークショップ
github: generative-ai-use-cases-jp
- 少額だが無料枠で収まらないのでAWSコンソールで手を動かすのは私(K)のみ。※AWSのオンラインイベント参加でもらったクレジットがあるので実質私も無料
- 構築されたWebアプリは参加者にもある程度自由に使ってもらう。
今回作成する際の特記事項¶
- 今回はWAFは使わない(IP制限しない) ※ AWS WAF による制限を有効化する
- サインアップ可能なドメインの制限を入れる(社員のみ可能に)※サインアップできるメールアドレスのドメインを制限する
- RAGチャット機能は使ってみる(Amazon Kendra作る)
- 自分だけで試したい場合は自己サインアップ(selfSignUpEnabled)は無効(false)にした方がよい ※6. [発展] サインアップの無効化
- Cloud9はワークショップのやり方そのままでやるとオーバースペックに思えるのでコスト抑制のため、CloudShell作業での作成時にparams.jsonのvolume_sizeを調整してもよいかも(12くらいに)
※ ビルド時にReactアプリのnpmビルドが走るみたいなので、CPUスペックはそれなりにあったほうがよさげ→t2.largeのまま
sed -i 's/"volume_size": 128/"volume_size": 12/' params.json
Amazon Bedrock
Amazon Bedrock での Anthropic Claude
Amazon Bedrock での Stable Diffusion XL
用語解説 RAG Retrieval-Augmented Generation
生成言語AIの進化:大規模言語モデルを理解する上で重要なトークンとは?
ワークショップアプリの主な課金要素¶
- Cloud9
- EC2 t2.largeインスンタンス(USD 0.1216) オンデマンド料金
- 128GBのEBSボリューム(gp3 0.096USD/GB 月 → $12.3 )
- AWS WAF 料金
- WebACL 月あたり (時間で案分) USD 5.00
- ルール 月あたり (時間で案分) USD 1.00
- Amazon Bedrock料金
- Anthropic → token数で課金
- Stability AI → 生成画像数で課金
- Amazon Kendra料金
- Developer Edition 810 USD月(1.125 USD/時間) ※結構な高額
- 最初の 30 日間で最大 750 時間の無料利用枠が提供
- DynamoDBのオンデマンドモード
課金等に関する留意点¶
- RAGチャット機能を有効にする場合、30日トライアルの無料枠がないと高額課金(個人利用レベルでは)が発生
- IP制限を入れた場合、WAFが作成されてそこそこの課金
- (デフォルトで作成されないが)ファイルアップロード機能と、Knowledge baseエージェント機能を有効化したらOpenSerch ServiceやNLB、ECSのFargateが作成されてそこそこ課金発生
- Cloud9環境は"generative-ai-use-cases-jp/packages/cdk/cdk.json"ファイルだけダウンロードして保管しておけば、削除しても大丈夫(環境を再作成してもcdk.jsonだけ差し替えれば元の状態に戻せる)。
ある程度のセキュリティを確保しつつ、最小限の課金で使い続けるためのポイント¶
- RAGチャット機能をOFFにする(※最重要1、ONの状態でKendoraが無料枠を超えたらヤバい。デフォルトでOFFなので社内文書検索の機能を試すために明示的にONにした場合に注意)
- 自己サインアップ(selfSignUpEnabled)を無効(false)にする(※最重要2、Cognitoから管理者で作成したユーザーだけが使えるようにする)
- Cloud9環境は削除する("cdk.json"ファイルだけダウンロードしておく)
↑を守れば、ほぼAnthropicのtoken数かStability AIの画像生成数に応じた従量課金しかない。→放置しても使わなければ0円
生成 AI チャットボットを構築したい (社内データ連携なしの場合)
コスト試算:RAG チャット機能ON(Kendra)
コスト試算:RAG チャット機能ON (Knowledge Bases for Amazon Bedrock)