Google ColaboratoryでAIを使ったイラスト生成

Google ColaboratoryとStable Diffusionを使ってオリジナルのイラストを生成してみましょう。

Google Colaboratoryはjupyter環境で段階的に実行できるので、これから勉強される方や深層学習に興味がある場合の参考にして頂けるかと思います。

また、今回のAIによるイラスト自動生成を行う場合はHugging Face Hubに登録する必要がありますので、以下のサイトよりAPI利用のための登録を済ませてください。

Hugging Face Hubのホームページ

まず、Stable Diffusionをインストールします。以下のコードをコピーして貼り付け、実行してください。

しばらく時間がかかります。

!pip install git+https://github.com/rinnakk/japanese-stable-diffusionGoogle Colaboratoryur code... */

続いてHugging Face Hubにログインします。以下のコードを入力して実行。

!huggingface-cli login

画面上に https://huggingface.co/settings/tokens のようなURLが表示されるので、それをクリックしてTokenを発行します。

読み込みで発行し、Tokenをコピーして画面のTokenに貼り付け、Enterを押します。

ログインが完了したら、以下を入力してます。


import torch
from torch import autocast
from diffusers import LMSDiscreteScheduler
from japanese_stable_diffusion import JapaneseStableDiffusionPipeline
model_id = "rinna/japanese-stable-diffusion"
device = "cuda"
# Use the K-LMS scheduler here instead
scheduler = LMSDiscreteScheduler(beta_start=0.00085, beta_end=0.012, beta_schedule="scaled_linear", num_train_timesteps=1000)
pipe = JapaneseStableDiffusionPipeline.from_pretrained(model_id, scheduler=scheduler, use_auth_token=True)
pipe = pipe.to(device)
prompt = "かっこいい男"
with autocast("cuda"):
    image = pipe(prompt, guidance_scale=7.5)["sample"][0]  
    
image

日本語が明記されている部分、作成したい画像を日本語で入力し、実行を押すと写真のようなオリジナル画像が生成できます。

しかし私の疑似写真を作ろうと「かっこいい男」としたらこんなん出来ました。

もう一回実行してみると、次のような写真。

普通の男みたいだが、決してかっこよくはないね?

ちなみに「きれいな夜景」で実行してみると、次のような画像ができました。

これらで生成される画像は、実際には存在しない人、景色が生成されます。

何度同じ文言で試しても、同じ画像が生成されないので、いろいろ試してみましょう。

また、時々真っ黒な画像が生成されますが、もう一度実行してみると普通に生成できるかと思います。

面白いですね(^0^)/

コメントを残す