いよいよ秋に入り涼しくなりつつ、鳥枯れの季節も終りを迎え、野鳥撮影を再開していこうと考えているぷれすらです!
以前、以下の記事にてAI(Stable Diffusion)を活用した鳥の画像生成に取り組んでみました。
こちらでは現実に存在する鳥の写真の生成を試みてみました。写真も良いですが、もっと自由な絵やイラストなども作ってみたいですよね!そこで、本記事では写真ではなく絵を描いてもらうことに取り組んでみましたので、その結果を共有します!
AIに絵を描いてもらうには?
以前の記事で試した「flying cockatiel」だったり、「Robin bathing in a puddle under a blue sky」のように、描いてほしいものを率直に表現したテキストを渡すと基本的には現実に即した写真としての画像が出力されます。Stable Diffusionに絵を描いてもらうには、ここで渡すテキストに工夫を施す必要があります!
どのような工夫が必要なのか、それは描いてほしい絵のスタイルに近い画家の名前も渡す、というものです!
例えば、ゴッホのようなスタイルの絵がほしければ「Van Gogh」と、葛飾北斎のようなスタイルの絵がほしければ「katsushika hokusai」と、それぞれ画家の名前を渡すことでその画家のスタイルに近い画像が出力されるようになります。
やってみる
それでは実際にやってみましょう!「bird illust, Van Gogh」というテキストを渡して作成された画像がこちらです。
確かにゴッホっぽいスタイルの絵が出力されました!絵として破綻しているような箇所は見られず、きちんと成立していますね!あまり美術方面に詳しいわけではないですが、一つの作品として成り立つレベルのものができていると思います。もっと高画質にすることができれば、印刷して額縁に入れて、部屋に飾りたいくらいです!
次に、「bird illust, katsushika hokusai」というテキストを渡してみます。
どうでしょうか?北斎!という感じの鳥の絵が出力されましたね!あまり日本では見られ無さそうなビジュアルの鳥さんなので、そういった背景の部分ではどうしても矛盾が生じてしまうところではありますが、好きなスタイルで描かれた鳥さんの絵が欲しい!という望みはこれで叶えられそうです!今回、単に「bird illust」と非常に抽象的なテキストを渡したため、より具体的な表現を行うことで鳥の種類を指定することもできそうですね。
但し、これらの写真はただテキストを渡してできたわけではありません。Stable Diffusionの出力する画像の品質はかなりランダムで、これらの画像はそれぞれ20枚ほど出力した中で一番良さげなものを選んでいます。例えば、以下のような望んでいない画像が生成された場合もありました。
このテキスト以外にも色々なパターンを試してみましたが、出力の当たり外れが激しい傾向にあるのはどういったテキストであっても共通してそうです。
わかったこと
Stable Diffusionに画家の名前を含むテキストを渡すことで、生成される画像のスタイルをその画家のスタイルに似せる事ができました!これで好きな画家さんに寄せたスタイルで同じく好きな鳥さんの絵を作ることができそうです!
また本筋とは外れますが、ここまでStable Diffusionを触ってみて、品質の高い画像を得るための扱い方もある程度見えてきました。「品質」という数値で表しにくい人それぞれの基準で画像を評価するのは難しいところもあります。そのため、1枚2枚出力してそのテキストが出力できる画像の品質を決めてしまうのではなく、出力画像の方向性だけ確認し、問題無さそうであれば数十枚単位で同じテキストで生成し、目視で良さげなものを選んでいくのがStable Diffusionとの良い付き合い方かと思います!
コメント