GoogleのAI「Gemini(Bard)」ついに画像生成機能が登場!
ローンチが待たれていたGoogleのAI「Bard」画像生成機能がいよいよ追加されました。
画像生成にはアップデートされたImagen 2モデルを使用しており、高品質でフォトリアリスティックな画像を生成できます。
※2024年2月5日現在、プロンプトは日本語には対応していないので、英語での入力が必要です。
Geminiで画像生成を行う方法
Gemini(Bard)は、テキストベースのAIですが、画像生成機能も搭載されています。以下では、Bardで画像生成を行う方法を、初心者でも分かりやすく解説します。
※2024年2月8日にBard の名称が「Gemini 」になりました。https://japan.googleblog.com/2024/02/bard-gemini-ultra-10-gemini.html
必要なもの
- インターネット環境
- Googleアカウント
- Bardへのアクセス
手順
- Geminiにアクセス: 以下のいずれかの方法でGeminiにアクセスします。
- PC: Bardのウェブサイトにアクセス
- 生成したい画像をテキストで入力: 画面上部のテキストボックスに、生成したい画像を具体的に記述します。
- 具体的なキーワードやフレーズを組み合わせるほど、イメージに近い画像が生成されます。
- 色、構図、画風、質感などを指定することで、より詳細な画像生成が可能になります。
- オプション設定: 以下のオプションを設定できます。
- 画質: 低、中、高
- 画像サイズ: 正方形、横長、縦長
- 生成枚数: 1枚、2枚、4枚
- 「生成」ボタンをクリック: 設定が完了したら、Enterします。
- 画像生成結果を確認: 数秒後、生成された画像が表示されます。 生成された画像が気に入らない場合は、「再生成」ボタンをクリックすることで、新しい画像を生成できます。
- 画像の保存: 生成された画像を保存したい場合は、「ダウンロード」ボタンをクリックします。
画像生成の例
「夕焼けの海を背景に、サングラスをかけた猫がサーフィンをしている」
Image of a cat wearing sunglasses surfing against the background of the ocean at sunset.
「終末の都市の夜景を俯瞰した写真」
Please make a bird's eye view of the night view of the city at the end of the day.
その他
- Geminiの画像生成機能は、現在ベータ版です。今後、さらに機能が改善される予定です。
- 倫理的に問題のある画像や、著作権を侵害する画像を生成することはできません。
実際にGeminiで画像生成を行ってみる
「桜並木を歩く、着物姿の女性」を生成
- Geminiにアクセスします。
- テキストボックスに「桜並木を歩く、着物姿の女性」。
- 画質を「高」、画像サイズを「縦長」、生成枚数を「2枚」に設定します。
- 日本のアニメスタイル
プロンプトは英語なのでDeepLで以下の通り翻訳
Image Generation "A woman in a kimono walking along a row of cherry blossom trees.
Image quality "High
Image size "Vertical
Number of generated images "2
Japanese animation style
以下のような画像が生成されました。
Geminiの画像生成機能における著作権について
Geminiの画像生成機能は、AI技術を用いて画像を生成するツールです。生成された画像の著作権は、以下の原則に基づいて判断されます。
原則
- 生成された画像の著作権は、Geminiのユーザーに帰属します。
- ユーザーは、生成された画像を個人的な用途で自由に使用できます。たとえば、SNSで共有する、ブログに掲載する、プロフィール写真として使うなどが含まれます。
- 商業利用や公の場での使用については、Geminiの利用規約に従う必要があります。商業利用に関する詳細は、Geminiの利用規約を確認してください。
- 生成された画像が特定の著作権侵害や不正行為を含む場合、それらの使用は禁止されます。
Geminiを使用する際には、著作権に関する注意事項を遵守し、法的な制約を守るようにしてください。
テキストから生成された画像の商業利用は問題なさそうですが、画像を参照させた場合は元画像の著作者の許可が必要なようです。
とりあえず、商業利用の場合は慎重な判断が必要ですね。
画像の生成枚数は何枚できる?
2024年のGoogle公式のGoogle Japan Blogでは「創造性をさらに高めるために、英語版の Bard では、画像を無料で生成できるようになりました。」とありますが、制限があるという情報もあります。
画像生成AIとしては後発となるので学習のための試用期間がまだ不十分、他のサービスと優位性が出るまでは無料使用は続くと思われます。
いずれにしても現在はベータ版のため今後は流動的のようです。
その他
- 画像生成機能はベータ版であり、今後変更される可能性があります。
- 生成された画像は、商用利用や公の場で公開することはできません。
- 倫理的に問題のある画像や、著作権を侵害する画像を生成することはできません。
Bardの画像生成機能を利用する際には、枚数制限などのルールを理解し、適切な利用を心がけましょう。
まとめ
Geminiは、テキストから画像を生成するための便利なツールです。上記の手順に従って操作することで、様々なイメージを簡単に作成できます。ただし、生成された画像の使用には注意が必要であり、著作権に関する規則を守ることが重要です。ぜひ、Bardの画像生成機能を活用して、クリエイティブなプロジェクトを実現してください!
※2024年2月8日にBard の名称が「Gemini 」になりました。https://japan.googleblog.com/2024/02/bard-gemini-ultra-10-gemini.html