Bing Image CreatorでDALL・E3が利用開始!

AIイラスト
スポンサーリンク

概要

Bing Image Creatorとは、Microsoftが提供している無料のAIイラスト生成サービスです。

bingのサイトで、Microsoftアカウントにサインインしていれば、すぐ使うことができます。

Bing Image Creatorについてはこちらの記事で解説してますので、参考にしてください。

Bing Image Creatorでは、DALL・Eというシステムを利用してAIイラストを生成しています。2023年9月までは、DALL・EシリーズのDALL・E2が利用されていました。

ですが、

上記ページにある動画の24分付近で話されているように、利用システムがDALL・E3に変更されました。

DALL・E3とは

英語サイトですが、DALL・E3の公式サイトがあります。

DALL・EはOpenAIが作成してます。OpenAIとは、AIの研究などをしている非営利団体です。

DALL・E3の公式ページにあるように、DALL・E3は、前のバージョンのDALL・E2からかなり進化しています。

DALL・E2とDALL・E3の比較

では、DALL・E2とDALL・E3の比較を進めていきたいと思います。

同じプロンプトで描いた2つのイラストを比較します。まず、使ったプロンプトはこちらです。

portrait, whole, chibi, a girl, Kawaii, insanely detailed eyes, well-proportioned face, A breathtaking masterpiece fantasycore artwork,

DALL・E2で描いたAIイラスト
DALL・E3で描いたAIイラスト

1つ目(左)のイラストが、DALL・E2で描いたAIイラスト、2つ目(右)のイラストが、DALL・E3で描いたイラストです。ぱっと見で比較してわかるように、全く同じプロンプトにも関わらず、DALL・E3で描いたものの方がクオリティが高いです。具体的には目の描き込みが細かかったり、髪の毛のツヤが美しかったりします。

また、主観ですが、ほかにも同じプロンプトでDALL・E2とDALL・E3を使ってAIイラストを描いた結果、DALL・E2と比較したDALL・E3の特徴として以下のことが言えそうです。

  1. アニメ調の絵が上手に描けるようになった。
  2. 美少女の絵が、あまりプロンプトを工夫しなくても簡単に出るようになった。
  3. Bingにブロックされるプロンプト・イラストの割合が増えた。

まず、1つ目の特徴から解説します。

アニメ調の絵については、アメリカコミックのようなAIイラストはDALL・E2でも上手に描けていました。

しかし、DALL・E2で日本アニメ風のかわいい女の子を描こうとすると、いくらクオリティ系のプロンプト(「high quality」など)を追加しても、顔が崩れたり、リアルに寄ってしまったりしていました。(プロンプトの書き方がうまくなかった可能性もあります。)

DALL・E3では、比較イラストからわかるように、日本アニメ風のかわいい女の子が簡単なプロンプトで高確率で生成されました!いままで日本アニメ風のかわいい女の子のイラストを生成したいときは、Stable DiffusionやPixAIを利用していましたが、DALL・E3(bing Image Creator)でも、十分なクオリティのイラストが生成できそうです。

2つ目について説明します。

1つ目の説明で述べたことと似たところがありますが、リアルな人間についても、美少女全般が、より簡単なプロンプトできれいに出るようになった印象です。体の特徴(〇〇色の髪の毛にして欲しい)なども、思った通りに反映されていると思います。

そもそも、人のイラストを生成しようとしたときに顔が崩れづらくなりました。DALL・E2では、2人以上のイラストを描くと、目が少し欠けるなど、すぐ顔が崩れてしまいました。ある程度複数人数のイラストを生成しても、DALL・E3ではあまり顔が崩れません。

最後に、3つ目についてです。

例えば、いままでは「a girl」というプロンプトでAIイラストの生成をした際、10回に1回イラストがブロックされていたとします。(ほか9回は素敵なイラストが生成されます。)DALL・E3では2回に1回ブロックされる印象です。実際に生成していると、すごく高頻度でブロックされるなと感じました。

しかし、手間はかかりますが、同じプロンプトで何回も生成をトライすればいつかはブロックされない素敵なイラストが生成されます。また、ブロックされた場合は、Bing Image CreatorにてAIイラストを生成される際に必要な「ブースト」は消費されません。

ブロックされると、「安全でない画像コンテンツが検出されました」と表示され、content policyに基づいて画像内の安全でないコンテンツが検出されたと宣言されます。

content policyとはMicrosoftが定めたもので、こちらのページに書いてあります。つまり、AIとしては出力可能だが、Microsoftの判定でアウトなイラストがブロックされていると考えてます。

プロンプト自体がブロックされた場合は、

このような別の警告が表示されます。

DALL・E2よりDALL・E3のほうがクオリティが上がり、つまり出力できるイラストの範囲が広がったため、いままでは出せなかったような、Microsoftにおける「安全でないイラスト」が出力できるようになったと考えてます。

イラストのクオリティが上がった分、このようなデメリットは発生せざるを得ないと感じました。

まとめ

bing Image Creatorが使用するシステムがDALL・E2からDALL・E3に変わったので、生成されるイラストの特徴を見ていきました。

DALL・E3はDALL・E2より圧倒的にクオリティの高いイラストが生成される

ことがわかりました。

最後まで読んで頂きありがとうございます。
ご意見・ご質問は、「お問い合わせ&リクエスト」からお願いします。

コメント

タイトルとURLをコピーしました