チワワ画像を生成: Dream StudioとStable Diffusionの活用

生成系AIの一つに画像を生成するStable Diffusionがあります。Stable Diffusionを利用したWebサービスの一つにDream Studioがあります。

この記事ではDream Studioを使ってチワワの画像を生成してみました。

「なぜ、チワワなのか?」

それはアールケー開発の2台目看板犬のララが「チワワ」だからです。

目次

Dream Studio

Dream Studioはプロンプトを入力して、Stable Diffusionを利用して画像を生成するWebサービスです。無料で始められます。

画像を生成するにはクレジットが必要で、アカウントを作成するとお試しに無料クレジットがもらえます。それを使って無料で画像生成を始めることができます。

この記事の執筆時点(2023年4月27日)ではこのDream StudioからStable Diffusion XLのベータ版が利用できます。アカウント作成時にもらえる無料クレジットでも使用できます。

Stable Diffusion XLは以前よりももっと複雑でリアルな画像を生成できるモデルです。

画像を生成する

Dream Studioにログインします。生成画面が表示されます。

ページの左側には生成するためのコントロール類、右側には生成された画像が表示されます。過去に生成した画像も履歴として表示されます。

Styleの選択

まず「Style」から生成する画像のタイプを選択します。「Anime(アニメ)」「Photographic(フォトグラフィック)」などを選択可能です。「Pixel Art」なども面白そうです。このスタイルの一覧ですが、スクロールして下の方を表示しょうとすると表示されないという現象が起きました。マウスオーバーすると表示されました。ブラウザによって挙動が変わるかもしれないですが、表示されなかった方はカーソルを動かしてみてください。

プロンプトの入力

画像の生成に使用するプロンプトは「Prompt」に入力します。

最初から例としてプロンプトが入力されているので、それを削除して自分のプロンプトを入力します。

ちなみにこのテキストは毎回変わる様です。

画像生成

「Dream」ボタンをクリックすると画像が生成されます。同時にクレジットが使われます。使用されるクレジットはボタンに表示されています。生成される画像枚数はデフォルトでは4枚です。「Image Count」のスライダーを使って枚数を変更できます。アスペクト比の変更可能です。

「Advanced」を開くとモデルの変更もできるようになっています。

チワワの画像を生成してみた

色々生成してみた中からいくつか紹介します。

Enhanced

「Style」から「Enhanced」を選択して、次のプロンプトを入力しました。

A long coat Chihuahua drawn realistically. It is running towards me energetically. The ground is a grassy field and the sky is a clear, beautiful blue sky, bright and nice. The color of the Chihuahua's fur is yellowish brown and white.

これに対して生成された画像は次の4枚です。

Cinematic

もっと短いプロンプトでも印象的な画像が生成できました。「Style」から「Cinematic」を選択し、次のプロンプトを入力しました。

Chihuahua watching me from a car. 

このような短いプロンプトに対しても次のようなリアルな画像が生成できました。我が家のチワワをイメージしたプロンプトというわけではないのにそっくりな感じの画像が生成されて衝撃を受けています。

サンプルのプロンプトも生成してみた

サンプルで入力されていたプロンプトも生成してみました。プロンプトは次の通りです。

Contemporary glass and steel building with sleek lines and an innovative facade, surrounded by an urban landscape, modern, high resolution

これを「Enhanced」で生成したものが次の画像です。完成度が高い絵だなというのが第一印象です。

クレジットが不足したら

右上にアカウントのアイコンが表示され、その横にはクレジットが表示されます。クレジットが足りなくなった場合は購入も可能です。この記事執筆時点では$10で1000クレジットとなっています。1000クレジットで5000枚弱の画像が生成できるようです。

著書紹介

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

この記事を書いた人

Akira Hayashi (林 晃)のアバター Akira Hayashi (林 晃) Representative(代表), Software Engineer(ソフトウェアエンジニア)

アールケー開発代表。Appleプラットフォーム向けの開発を専門としているソフトウェアエンジニア。ソフトウェアの受託開発、技術書執筆、技術指導・セミナー講師。note, Medium, LinkedIn
-
Representative of RK Kaihatsu. Software Engineer Specializing in Development for the Apple Platform. Specializing in contract software development, technical writing, and serving as a tech workshop lecturer. note, Medium, LinkedIn

目次