【中卒OK】Stable Diffusion XL×チャットgptを使ってGoogleコラボレイトリーでAI画像を作る方法

AI画像つくりたいなぁなんて考えたことありますか？

今のあなたがプログラミング経験を持っていなくても、チャットGPTを使えば、簡単に可能です。

そして、最新の生成AI「Stable Diffusion XL」。このモデルの力で、高品質な画像を手軽に生み出す方法が身近に。感じたことないこのワクワク感、私もすっかり嵌まって大ファンです(笑)

Googleコラボレイトリーとのマッチング。これが、未来への第一歩を刻みます。手に職を求める皆さん、ここで新たな扉が開かれること間違いなし！

読むだけでなく、実際に体験してその力を感じてくださいね。

既に出回っているアプリで遊ぶのではなくて、hugging faceみたいなところのデータを使えるようになれば、自分でアプリを作ったり出来る様になるよ！
チャットgptがあれば学歴なんて関係なし！

Stable Diffusion XLとは？ - AI画像生成の新時代

Stable Diffusion XLの特徴とメリット概要

Stability AIが開発したStable Diffusion XL (SDXL)は、文字通りテキストからの高品質な画像生成の最前線を走るモデルです。

その圧倒的な35億～66億のパラメータ数を誇るこのモデルは、映画やテレビといった多岐にわたる用途に対応しています。

そして、主要なプラットフォームとの統合や、活発なコミュニティサポートもその魅力の一部として挙げられます。

Stability AIは今後の機能向上や改善も約束しており、AIにおける画像生成の新しいスタンダードとしての位置づけが期待されています。

例えば、こんな画像が簡単な指示でサクッと作れてしまいます。

しかし、ここで一番注目すべきは、このような高度な技術が、簡単な手数で、しかもノンプログラマーにも手が届く時代になったことです。

かつては専門家や研究者の手にしか届かなかったAI技術が、今や私たち一般の人々の手元に。これは、技術の進化だけでなく、それを身近に感じることができる時代の到来を意味しています。

私たちが生活するこの時代は、AI技術の進化とともに、その恩恵を受けることができる素晴らしい時代と言えるでしょう。

わー、Stable Diffusion XLっていうのが作ったそのAI、すごいんだね！テキストから画像を作れるなんて、映画やアニメの世界みたい。でも、ノンプログラマーでも使えるっていうのが一番驚き！私みたいな人でも、これで何か面白いことできるかも。でもね、技術が進化するのはいいことだけど、どう使うかは人次第だよね。使う人が良い方向に使ってくれることを願ってるよ。

プログラミング未経験者でもStable Diffusion XLが使える理由

プログラム知識ゼロでも、Stable Diffusion XLを活用できる秘訣

プログラミングって専門的な知識や経験が必要だというイメージが強い。そんな中、高度な技術であるStable Diffusion XL (SDXL)が、プログラミング未経験者でも簡単に扱えると言われると、驚きますよね。

その理由が、ChatGPTです。これは、自然言語を理解し、ユーザーの要望に応じて操作をサポートするAI技術。要は、専門的なプログラムコードを書かなくても、普通の言葉でAIに指示を出すだけでSDXLを活用できるのです。

例えば、「この文章を元に画像を生成して」と言うだけで、SDXLが高品質な画像を生成してくれる。それも、一切のプログラム知識なしに。

このように、ChatGPTの存在によって、SDXLの高度な技術が身近なものとなり、私たち一般の人々でもその恩恵を受けられるようになったのです。

この進化により、AIとのコミュニケーションがこれまで以上に身近で簡単になりました。技術の難しさを感じることなく、その恩恵を享受できるのは、まさにこの時代の特権と言えるでしょう。

チャットGPTを活用するメリット

コードのサポート: チャットGPTは、ユーザーの要求に応じてコードを生成する能力を持っています。これにより、プログラミングの経験が少ないユーザーでも、必要なコードを取得することができます。
エラー対応: コードの実行中にエラーが発生した場合、そのエラー内容をチャットGPTに伝えることで、適切な解決策を提案してもらうことができます。

つまり分からない項目があったら悩まずチャットGPTに聞く！これだけで大抵の事は上手く解決できてしまいます！

チャットGPTとGoogleコラボレイトリーの連携手順

それでは実際にStable Diffusion XLを簡単に使う手順を紹介したいと思います。聞いたことが無いサイトなど出てくると思いますが、気負わず軽い気持ちで挑戦してみて下さい！

了解しました。指定されたリンクとコードを使用して、手順を再度説明いたします。

Google Colabを開く:

以下のリンクにアクセスして、Google Colabを開きます: Google Colab

新しいノートブックを作成:

画面左上の「ファイル」をクリックし、「新しいノートブック」を選択します。

ランタイムのタイプを変更してT4 GPUを選択:

画面上部のメニューバーから「ランタイム」をクリックし、「ランタイムのタイプを変更」を選択します。
「ハードウェアアクセラレータ」のドロップダウンメニューから「GPU」を選択します。
その下の「GPUタイプ」のドロップダウンメニューから「T4」を選択し、「保存」をクリックします。

指定されたコードを入力して実行:

画面中央に表示されるセルに、!pip install diffusers transformersと入力しましょう。
セルの左側にある再生ボタン（▶️）をクリックすることで、コードを実行します。

!pip install diffusers transformers

いきなり見知らぬコードを打ち込んで実行してと言われても怖いと思いますので簡単にコードの内容を解説しますね。

「!pip install diffusers transformers」というコマンドは、まるで図書館から本を借りるようなものです。ここでの「pipinstall」は図書館で本を読んで頭にインストールしてください。という意味です。そして「diffusers」と「transformers」は2冊の本の名前と考えてください。

Diffusersは、HuggingFaceという大きな出版社が作った特別な本。この本には、写真や音楽に関する知識がたくさん詰まっています。この本を借りれば、新しい写真や音楽の知識をすぐに手に入れることができます。わざわざ他の本を探して読む必要がなくなります。

Transformersは、言葉の魔法を学べる本。この本を読むと、言葉のパズルを解く力が身につきます。

つまりこのコードは、パソコンに「diffusers」と「transformers」という本を読んで、「Stable Diffusion XL」という新しい魔法（モデル）を使えるようになって！と言っているのです。

下準備完了。画像生成用のコードを入力する

はい！これで下準備は完了しました。次にするのは、生成AIにどんな絵を描いて欲しいか？を指示してあげる必要があります。

今は、パソコンがイラストを描くモデル（table Diffusion XLなど）を使えるようになった状態です。

# 必要なパッケージをインストール
!pip install accelerate>=0.14.0

from diffusers import DiffusionPipeline
import torch

# GPUメモリのキャッシュをクリア
torch.cuda.empty_cache()

# Load the DiffusionPipeline model
pipe = DiffusionPipeline.from_pretrained(
    "stabilityai/stable-diffusion-xl-base-1.0", 
    torch_dtype=torch.float16, 
    use_safetensors=True, 
    variant="fp16"
)

# CPUへのオフロードを有効にする
pipe.enable_sequential_cpu_offload()

# Set up prompt and generate image
prompt = "Generate an image of a serene landscape. Depict a beautiful sunset descending behind the mountains. Capture the gentle and warm hues of the sunset. Outline the distinctive shapes of the mountains. Convey a tranquil ambiance in the sky. Aim for a sense of peacefulness and warmth in the scene."
image = pipe(prompt=prompt).images[0]

# Save the generated image
image.save("result.png")

# Display the generated image
image

コードの解説:

!pip install accelerate>=0.14.0

この行は、コンピュータに必要なツールをインストールするためのものです。accelerateという名前のツールをインストールしています。

from diffusers import DiffusionPipeline

この行は、特定のツールキットからDiffusionPipelineという道具を取り出して使えるようにしています。この道具は、文章から画像を作るのに役立ちます。

import torch

この行は、torchという名前のツールキットを使えるようにしています。このツールキットは、コンピュータの計算を助けるためのものです。

torch.cuda.empty_cache()

この行は、コンピュータのメモリをきれいにするためのものです。メモリは、コンピュータが情報を一時的に保存する場所です。

pipe = DiffusionPipeline.from_pretrained(...)

この行は、事前に学習されたモデルをロードして、それをpipeという名前で使えるようにしています。モデルは、文章から画像を作るための指示書のようなものです。

pipe.enable_sequential_cpu_offload()

この行は、メモリの使用量を減らすための特別な方法を使うように指示しています。これにより、コンピュータがクラッシュするリスクを減少させることができます。

prompt = "Generate an image of a serene landscape..."

この行は、どのような画像を作りたいかの指示を書いています。この文章に基づいて、モデルは画像を作成します。

image = pipe(prompt=prompt).images[0]

この行は、上で書いた指示に基づいて、実際に画像を作成しています。

image.save("result.png")

この行は、作成された画像をresult.pngという名前で保存しています。

image

この行は、作成された画像を表示するためのものです。

そして、このコードを実行すると下の様な画像が出力されます。

おお！簡単に作れた！・・・でも殺風景なイラストね。もっと可愛い画像が欲しい。

チャットgptにコードの書き換えを丸投げする

ここからが、チャットGPTの出番になります。

コードのコピペ: まずは、必要なコードをそのままチャットGPTにコピペします。これがあなたの素材となります。
イラストのイメージの記入: 次に、生成してほしいイラストのイメージを言葉で記入します。例えば可愛い犬の画像なら、「お散歩中のトイプードルなど」といった具体的な指示を出します。
プロンプトの書き換えの依頼: 最後に、「画像生成用のプロンプトを書き換えて。」とお願いするだけで、簡単にオリジナルのコードに書き換わります。

注意事項: この際、英語で書いてくださいという指示と、完全なコードを書いてほしいという要望を伝えると、よりスムーズに進行します。

OpenAI Chat

人工知能による最先端のチャット体験を楽しもう