みなさん、こんにちは! タカハシ(@ntakahashi0505)です。
今回の対決は「画像生成AI」。
アイキャッチ画像作成をお題として、ChatGPTの「DALL-E 3」とGeminiの「Imagen 3」を試してみました。
ということで、今回は「アイキャッチ画像生成AI対決!ChatGPTの「DALL-E 3」 vs Geminiの「Imagen 3」」です。
では、行ってみましょう!
アイキャッチ画像の重要性とその作成法の変遷
ブログやnoteの記事において、アイキャッチ画像は非常に重要な役割を果たします。
アイキャッチ画像とは、記事の一番上に配置され、記事の「顔」となる画像のことです。
一覧表示やSNSでシェアされた際のサムネイル画像としても使用されるため、読者の目を引き、記事の内容を端的に伝えることが求められます。
ブログをはじめた当初、アイキャッチ画像にはフリー画像を探して使用していました。
しかし、記事の内容にぴったり合う画像を探すのは大変な作業…。
その後、Canvaのようなデザインツールが登場し、ベースとなる背景画像のテンプレートにテキストを載せるようにしました。作業はラクになったものの、どの記事もおんなじようなアイキャッチに…
そこで、最近はCanvaには「マジック生成」というAI機能を使っています。最大5つまでの単語を入力することで、その単語に関連した画像を生成してくれる機能。
生成された画像にそのまま文字を載せることもできるため、アイキャッチ画像作成ツールとして非常に便利です。
しかし、生成される画像のクオリティには課題がありました。特に人物の描写は苦手で、顔が歪んでしまったり、目が描かれていなかったり。ちょっとこわい。
そのため、何度も生成し直したり、ある程度妥協したりする必要がありました。
画像生成AI対決:DALL-E 3とImagen 3
2025年、生成AIをふんだんに使って発信活動を見直している中、「もしかしてアイキャッチ画像も別の生成AI使ったらよいのでは?」と思いつき、今回試したのがChatGPTの「DALL-E 3」とGeminiの「Imagen 3」です。
これらの画像生成AIは、ChatGPTやGeminiとの通常のやり取りの中で、「画像を生成して」と指示するだけで、その流れで画像を作成してくれます。
ただし、DALL-E 3はChatGPTの無料プランでは使用回数に制限があり、1日2回までしか使用できません。ふだん使いするなら、ChatGPT Plusなどの有料プランを使う必要がありますね。
一方、Imagen 3はGeminiの無料プランでも使用できます。
Imagen 3でアイキャッチ画像をつくってみた
僕は、Voicyの台本から記事を生成する際にGeminiを活用しています。
ですから、記事制作の流れでそのまま画像作成もしてもらえたら非常に効率的だと考え、まずImagen 3を試してみました。
しかし、残念ながらImagen 3にはいくつかの制約があることがわかりました。
まず、生成できる画像が正方形のみであることです。アイキャッチ画像としては、横長の画像、具体的には16:9の縦横比が適している場合が多いため、これは大きなデメリットでした。
また、現在のところ、記事を作成しているAIモデルGemini 2.0 Experimental AdvancedではImagen 3を呼び出すことができません。つまり、出力された記事をGemini 1.5 Proに貼り付け直して画像生成を依頼する必要があるということ…これでは、Geminiに統一のメリットが出ません。
DALL-E 3でアイキャッチ画像をつくってみた
次に、DALL-E 3を試してみました。
DALL-E 3は、16:9の画像サイズも生成できました。
僕は、Geminiで作成した記事全体をDALL-E 3に渡し、以下の条件でアイキャッチ画像の作成を依頼しました。
- 画角は16:9
- ターゲットは日本のビジネスパーソン
出てきた画像は、近未来的なピッカピカのテイストでした。
ちょっと抑えたいと思い、続けて「ポップなイラスト風でお願いします」と伝え、再生成してもらいました。
すると、アメコミっぽいイラストが生成されました。
ちょっと色合いがビビット過ぎ、かつ、要素が多すぎと感じたので、追加で以下を依頼しました。
- 「上半分の要素を50%減らしてください。」
- 「色合いを30%淡くしてください。」
最終的に生成された画像にCanvaでテキストを載せて、アイキャッチ画像を完成させました。
DALL-E 3であれば、プロンプトを工夫することで、かなり質の高い、希望どおりの画像を生成できるように思います。
人物も生成画像にはたくさん含まれていましたが、崩れることなく、完璧。クオリティも十分です。
さらに、GPTsを使えば、より効率的にアイキャッチ画像を作成できるかもしれません。しかし、今回試した通常のプロンプト依頼でも、これまで以上の効率で作業はできそうです。
まとめ
以上、「アイキャッチ画像生成AI対決!ChatGPTの「DALL-E 3」 vs Geminiの「Imagen 3」」についてお伝えしました。
今回、DALL-E 3とImagen 3を比較した結果、現時点ではDALL-E 3の方がアイキャッチ画像作成に適していることがわかりました。
特に、16:9の画像サイズを生成できる点と、段階的な修正によって理想の画像に近づけられる点が優れていると感じます。
このタスク、もう少し改善を試みたので、それについては別の機会にお伝えしますね。
引き続き、みなさんがいきいきと学び・働くためのヒントをお届けしていきます。次回をお楽しみに!
この話を耳から聴きたい方はこちらからどうぞ!