【AIグラビア、LoRA、LoCon】画像1枚からLORAを作る方法、完全解説【AI絵師、Stable Diffusion】

チココちゃん
22 Apr 202310:01

TLDRこの動画では、1枚の画像からLoRA(Low-Rank Adaptation)を作成する方法について詳しく説明しています。WEBUIを起動し、画像を入力してデノイシングとインペイント機能を用いた画像の修正を行います。その後、Googleドライブに画像をアップロードし、シビットAIでckptを選択し、WEBUIをカスタム設定して学習させます。ドリームブースをインストールし、学習プロセスを開始します。最終的に、ユーザーはLoRAを作成し、特定のスタイルや衣装で画像を生成できるようになります。

Takeaways

  • 😀 この動画では、1枚の画像からLoRA(Low-Rank Adaptation)を作成する方法について解説しています。
  • 🔧 まず、WEBUIを起動し、Googleドライブの「コラボノートブックス」フォルダに保存されているWEBUIを利用します。
  • 🚫 警告文が表示された場合は、許可をクリックして画像の保存を可能にします。
  • 🖼️ 画像の生成には「イメージトゥイメージ」タブを使用し、元画像に忠実な画像を選択します。
  • 🎨 「インペイント」機能で衣装を変えた画像を作成し、元画像との忠実度を調整します。
  • 📁 作成した画像をGoogleドライブの「インプット」フォルダにアップロードします。
  • 🔍 シビットAIでckpt(checkpoint)を選択し、目的の画像に近いものを探すために適切なckptを選ぶ必要があります。
  • 🛠️ WEBUIのカスタム設定を変更し、特定の機能を有効にします。
  • 📝 画像のキャプションを自動生成する設定を行い、画像の説明文を自動で作成します。
  • 🧩 WEBUIを再起動し、追加パッチ「ドリームブース」をインストールします。
  • 🌟 最後に「ドリームブース」タブから「クリエイト」ボタンを押してLoRAのモデルを作成し、細かい設定を行います。
  • ⏱️ 学習プロセスには約1~2時間かかりますが、画像枚数が多い場合は時間や課金プランの変更が必要かもしれません。

Q & A

  • WEBUIをインストールしていない場合はどうすればいいですか?

    -WEBUIをインストールしていない方は、この動画を中断して基礎編を参考にしてインストールしてください。

  • 画像の差分やポーズ違いはどのように作成しますか?

    -画像の差分やポーズ違いは、WEBUIの「イメージからイメージ」タブを使用して作成します。

  • デノイシングストレングスとは何ですか?

    -デノイシングストレングスは、生成される画像が元の画像にどれだけ忠実になるかを調整するパラメーターです。数字を小さくすると忠実になり、大きくすると変化したものが生成されます。

  • インペイント機能は何をしますか?

    -インペイント機能は、画像の特定の部分を修正し、例えば衣装を変えるために使用されます。

  • 画像ファイルを集める際のフォルダはどのように命名すればいいですか?

    -画像ファイルを集めるフォルダは「インプット」と命名してください。フォルダ名は本来は自由ですが、インプット以外に命名する場合は、自分で変更する必要があります。

  • WEBUIのカスタムハーギュメントを変更する必要がありますか?

    -はい、WEBUIのカスタムハーギュメントを変更して、概要欄に貼ってある長い英文をコピーして貼り付けます。

  • ドリームブースとは何ですか?

    -ドリームブースはWEBUIの機能の一つで、画像の説明文を自動的に生成する拡張機能です。

  • ロラの名前はどのように決めますか?

    -ロラの名前は、WEBUIの「クリエイト」ボタンを押した際に入力する任意の名前で構いません。

  • 学習させた情報はどのように引き出しますか?

    -学習させた情報は、インスタンストークンを編集することで引き出します。ファイル名や絶対忘れない文章、自分の名前などを使っておくことができます。

  • 学習が完了するまでにどのくらいの時間が掛かりますか?

    -学習が完了するまでに1から2時間掛かります。画像の枚数が多い場合は無料版の制限時間を超える場合があるので、画像枚数を減らすか、有料コースに移行してください。

Outlines

00:00

🖼️ Creating Variations from a Single Image

The video script provides a comprehensive guide on how to create variations of a single image using a WEBUI tool. It starts with launching the WEBUI from a Google Drive folder named 'Collaborative Notebooks' and advises viewers to install WEBUI if it's not already installed. The script instructs viewers to grant permissions if prompted to ensure images can be saved. It then details the process of creating an image similar to the original by adjusting the 'denoising strength' slider. The tutorial also covers how to modify clothing in an image using the 'Inpaint' feature, emphasizing the selection of appropriate brush sizes and denoising levels. After gathering the desired images, the script outlines the steps to organize them in a new 'Input' folder on Google Drive. The video concludes with instructions on customizing WEBUI settings for further image processing, including enabling extensions and using specific command prompts to unlock advanced features.

05:00

🛠️ Post-Processing and Advanced WEBUI Configuration

This part of the video script focuses on post-processing the collected images and configuring WEBUI for advanced image manipulation. It begins with instructions to access specific tabs within WEBUI for pre-processing images and automating the captioning process. The script then guides viewers on how to install the 'DreamBooth' extension, which is crucial for loading additional patches and enhancing WEBUI functionality. The tutorial continues with the creation of a custom model, detailing the selection of a base model and the input of various parameters such as 'concept', 'instance token', and 'class token'. These settings are tailored to the type of image the user wants to generate. The script emphasizes the importance of adjusting these settings based on the specific characteristics of the images collected. Finally, the video script mentions the time required for learning the model and suggests reducing the number of images or upgrading to a paid plan if the free version's time limit is exceeded. The tutorial ends with a reminder to subscribe and enable notifications to stay updated with future content.

Mindmap

Keywords

AIグラビア

AIグラビアとは、人工知能技術を利用して作成されたグラフィックアートや写真を指します。このビデオでは、AIグラビアの作成方法が解説されていますが、具体的には1枚の画像からLoRA(Low-Rank Adaptation)を作り出し、その画像を元に異なるポーズや衣装のモデルを作成する方法が説明されています。

LoRA

LoRAは、ディープラーニングモデルの微調整技術の一つで、モデルの特定の部分のみを更新することで全体の学習時間を短縮します。ビデオでは、LoRAを使用して画像からモデルを生成し、そのモデルを用いて異なるスタイルの画像を作成する方法が紹介されています。

LoCon

LoConは、LoRAの概念に基づくが、より高度な技術的な調整を意味する可能性があります。ビデオでは、LoConがどのようにしてAIグラビアの生成に使用されるかについての詳細は明示されていませんが、LoRAと同様に画像の変換やスタイルの変更に関連する技術と思われます。

WEBUI

WEBUIとは、Webベースのユーザーインターフェースのことで、通常はブラウザを通じてアクセスされるグラフィカルインターフェースです。ビデオでは、WEBUIを起動してAIグラビアの生成プロセスを開始する方法が説明されています。これは、ユーザーがAIモデルと対話するためのツールです。

デノイシング

デノイシングは、画像のノイズを除去するプロセスです。ビデオでは、デノイシングストレングスというパラメータが挙げられており、画像生成プロセスで使用されます。このパラメータは、生成される画像が元の画像にどれだけ忠実であるかを調節するのに使われます。

インペイント

インペイントは、画像編集において特定の部分を修正または変更するプロセスです。ビデオでは、インペイント機能を使用して衣装を変更し、モデルの異なるスタイルの画像を作成する方法が説明されています。

ckpt

ckptは、チェックポイント(checkpoint)の略で、ディープラーニングにおいてモデルの学習過程を保存するファイルフォーマットです。ビデオでは、ckptを選択することで、AIグラビアの生成に使用されるモデルの特定の状態を選択することが可能です。

ドリームブース

ドリームブースは、ビデオ内で説明されているAIグラビアの生成プロセスに使用される拡張機能の1つです。ドリームブースをインストールし、WEBUIを再起動することで、より高度な画像生成機能を利用できるようになります。

カスタムハーギュメント

カスタムハーギュメントとは、AIモデルの学習プロセスや生成プロセスをカスタマイズするために使用されるパラメータや設定のことです。ビデオでは、カスタムハーギュメントを変更して特定のAIグラビアのスタイルを生成するようにAIを設定する方法が説明されています。

学習

学習は、AIモデルがデータからパターンや知識を吸収し、それに基づいて新しいデータに対する予測や生成を行う能力を獲得するプロセスです。ビデオでは、画像から学習させたモデルを使用して、新しい画像を生成する方法が説明されています。

Highlights

画像1枚からLoRAを作る方法を完全解説。

WEBUIを起動し、Googleドライブのコラボノートブックスにアクセス。

WEBUIの警告文を許可して画像保存を可能に。

イメージとイメージで元画像に忠実な画像を生成。

デノイシングストレングスの調整で画像の忠実度を制御。

インペイント機能で衣装違いの画像を生成。

画像の選択と衣装違いの画像の生成方法を解説。

Googleドライブで新しいフォルダ「インプット」を作成して画像をアップロード。

シビットAIでckptを選択し、目的に近い画像を探す。

WEBUIのカスタムハーギュメントを変更して上級者モードを解禁。

WEBUIのプレプロセスイメージ図で画像の下処理を行う。

エクステンションズからドリームブースをインストールしてWEBUIを再起動。

ドリームブースを使用してドラ用モデルを作成。

ロラの名前を決め、モデルを選択して作成を開始。

細かい設定を決める際にデータセットやインスタンストークンを編集。

クラストークンとインスタンスプロンプトを編集して学習を開始。

学習が完了するまで待機し、学習アニメキャラの学習が次回のテーマ。