GoogleのAI「Gemini（Bard）」ついに画像生成機能が登場！

2024年2月5日 2024年4月10日

designexpro

ローンチが待たれていたGoogleのAI「Bard」画像生成機能がいよいよ追加されました。
画像生成にはアップデートされたImagen 2モデルを使用しており、高品質でフォトリアリスティックな画像を生成できます。

※2024年2月5日現在、プロンプトは日本語には対応していないので、英語での入力が必要です。

DeepL翻訳：AI時代の翻訳ツール

近年、生成AIの分野は目覚ましい進歩を遂げており、文章生成や翻訳などさまざまなタスクにおいて人間の能力を超える成果を上げ始めています。しかし、生成AIが真に人間の…

デザインEX

Geminiで画像生成を行う方法

Gemini（Bard）は、テキストベースのAIですが、画像生成機能も搭載されています。以下では、Bardで画像生成を行う方法を、初心者でも分かりやすく解説します。

※2024年2月8日にBard の名称が「Gemini 」になりました。https://japan.googleblog.com/2024/02/bard-gemini-ultra-10-gemini.html

必要なもの

インターネット環境
Googleアカウント
Bardへのアクセス

手順

Geminiにアクセス: 以下のいずれかの方法でGeminiにアクセスします。

PC: Bardのウェブサイトにアクセス

生成したい画像をテキストで入力: 画面上部のテキストボックスに、生成したい画像を具体的に記述します。

具体的なキーワードやフレーズを組み合わせるほど、イメージに近い画像が生成されます。
色、構図、画風、質感などを指定することで、より詳細な画像生成が可能になります。

オプション設定: 以下のオプションを設定できます。

画質: 低、中、高
画像サイズ: 正方形、横長、縦長
生成枚数: 1枚、2枚、4枚

「生成」ボタンをクリック: 設定が完了したら、Enterします。
画像生成結果を確認: 数秒後、生成された画像が表示されます。生成された画像が気に入らない場合は、「再生成」ボタンをクリックすることで、新しい画像を生成できます。
画像の保存: 生成された画像を保存したい場合は、「ダウンロード」ボタンをクリックします。

画像生成の例

「夕焼けの海を背景に、サングラスをかけた猫がサーフィンをしている」
 Image of a cat wearing sunglasses surfing against the background of the ocean at sunset.

「終末の都市の夜景を俯瞰した写真」
Please make a bird's eye view of the night view of the city at the end of the day.

その他

Geminiの画像生成機能は、現在ベータ版です。今後、さらに機能が改善される予定です。
倫理的に問題のある画像や、著作権を侵害する画像を生成することはできません。

実際にGeminiで画像生成を行ってみる

「桜並木を歩く、着物姿の女性」を生成

Geminiにアクセスします。
テキストボックスに「桜並木を歩く、着物姿の女性」。
画質を「高」、画像サイズを「縦長」、生成枚数を「2枚」に設定します。
日本のアニメスタイル

プロンプトは英語なのでDeepLで以下の通り翻訳

Image Generation "A woman in a kimono walking along a row of cherry blossom trees.
Image quality "High
Image size "Vertical
Number of generated images "2
Japanese animation style

以下のような画像が生成されました。

Geminiの画像生成機能における著作権について

Geminiの画像生成機能は、AI技術を用いて画像を生成するツールです。生成された画像の著作権は、以下の原則に基づいて判断されます。

原則

生成された画像の著作権は、Geminiのユーザーに帰属します。
ユーザーは、生成された画像を個人的な用途で自由に使用できます。たとえば、SNSで共有する、ブログに掲載する、プロフィール写真として使うなどが含まれます。
商業利用や公の場での使用については、Geminiの利用規約に従う必要があります。商業利用に関する詳細は、Geminiの利用規約を確認してください。
生成された画像が特定の著作権侵害や不正行為を含む場合、それらの使用は禁止されます。

Geminiを使用する際には、著作権に関する注意事項を遵守し、法的な制約を守るようにしてください。

テキストから生成された画像の商業利用は問題なさそうですが、画像を参照させた場合は元画像の著作者の許可が必要なようです。
とりあえず、商業利用の場合は慎重な判断が必要ですね。

画像の生成枚数は何枚できる？

2024年のGoogle公式のGoogle Japan Blogでは「創造性をさらに高めるために、英語版の Bard では、画像を無料で生成できるようになりました。」とありますが、制限があるという情報もあります。

画像生成AIとしては後発となるので学習のための試用期間がまだ不十分、他のサービスと優位性が出るまでは無料使用は続くと思われます。
いずれにしても現在はベータ版のため今後は流動的のようです。

その他

画像生成機能はベータ版であり、今後変更される可能性があります。
生成された画像は、商用利用や公の場で公開することはできません。
倫理的に問題のある画像や、著作権を侵害する画像を生成することはできません。

Bardの画像生成機能を利用する際には、枚数制限などのルールを理解し、適切な利用を心がけましょう。

まとめ

Geminiは、テキストから画像を生成するための便利なツールです。上記の手順に従って操作することで、様々なイメージを簡単に作成できます。ただし、生成された画像の使用には注意が必要であり、著作権に関する規則を守ることが重要です。ぜひ、Bardの画像生成機能を活用して、クリエイティブなプロジェクトを実現してください！

※2024年2月8日にBard の名称が「Gemini 」になりました。https://japan.googleblog.com/2024/02/bard-gemini-ultra-10-gemini.html