【Stable Diffusion】画像から画像を作成するimg2imgの使い方について解説

レベルマ【生成AI情報発信】
15 Jul 202307:21

TLDR「Stable Diffusion」画像から画像を作成するimg2imgの使い方について解説。このビデオでは、既存の画像から特定のポーズや特徴を継承した画像を生成する方法を説明します。アップロードした画像に基づいてサイズを調整し、プロンプトに詳細な指示を入力することで、高品質のアニメスタイルイラストを生成できます。ノイズ除去の強さを調整して、参照画像との類似度を制御し、異なるサイズの画像を生成するために「リサイズして埋める」モードを使用します。

Takeaways

  • 🖼️ 「img2img」は画像から画像を作成する方法で、特定のポーズや特徴を参照して画像を生成できます。
  • 🔄 「txt2img」とは異なり、「img2img」では既存の画像をアップロードして、それに関連する特徴やポーズを元に新しい画像を生成します。
  • 📂 「Stable Diffusion Web UI」を開始すると、デフォルトはテキストから画像生成の「txt2img」に設定されていますが、「img2img」を選択して画像から画像を生成するモードに切り替えることができます。
  • 📸 画像をアップロードすると、その画像の特性やポーズを元にアニメスタイルのイラストを生成することができます。
  • 🔢 「resize to」項目を使用して、アップロードした画像のサイズを変更することができます。自動調整を推奨し、手動入力は誤りが生じやすいため注意が必要です。
  • ↕️ 画像サイズを設定した後、プロンプトに「masterpiece, best quality, detailed eyes, blouse, girl」などのポジティブプロンプトと「lowres, worst quality」などのネガティブプロンプトを入力します。
  • 🎨 ポジティブプロンプトとネガティブプロンプトを入力して「generate」ボタンを押すと、新しい画像が生成されます。
  • 🌟 「denoising strength」の値を調整することで、参照画像の特徴を強調または弱めることができます。値が小さいほど参照画像に近い画像が生成されます。
  • 🔍 「denoising strength」を「0」に設定すると、参照画像とまったく同じ画像が生成されます。「0.5」や「1」に設定すると、オリジナルとは異なるスタイルの画像が生成されます。
  • 🔄 「scale」を「2」に設定すると、アップロードした参照画像の2倍の大きさの画像を生成することができます。
  • 🖼️ 「resize mode」で「resize and fill」を選択すると、参照画像とは異なるサイズの画像を生成することができます。

Q & A

  • 「Stable Diffusion」とは何ですか?

    -「Stable Diffusion」は画像から画像を生成する技術の一種で、特定のスタイルや特徴を持ちながら新しい画像を作成することができます。

  • 「img2img」とはどのような機能ですか?

    -「img2img」は画像から画像を生成する機能で、既存の画像のポーズや特徴を元に新しい画像を迅速に生成することができます。

  • 「txt2img」と「img2img」の違いは何ですか?

    -「txt2img」はテキストプロンプトから画像を生成する機能で、一方で「img2img」は既存の画像を参考にして画像を生成します。

  • 「img2img」機能を利用する際に画像をアップロードするにはどうすればいいですか?

    -「Stable Diffusion Web UI」を起動し、「img2img」タブをクリックして、参照したい特徴やポーズを持つ画像をアップロードします。

  • 画像サイズを変更するにはどうすればいいですか?

    -アップロードした画像のサイズに合わせるために、「resize to」アイテムを使用してサイズを自動調整するか、手動でサイズを入力することができます。

  • プロンプトにどのような単語を入力するのが良いですか?

    -プロンプトには「masterpiece, best quality, detailed eyes, blouse, girl」などの品質を高める単語を入力し、ネガティブプロンプトには「low quality, lowres」などの単語を入力します。

  • 「denoising strength」とは何ですか?

    -「denoising strength」は参照画像の特徴を強調または弱めるためのパラメータで、値を小さくすると参照画像に近い画像が生成され、値を大きくするとオリジナルから遠ざかる画像が生成されます。

  • 参照画像とは異なるサイズの画像を生成するにはどうすればいいですか?

    -「resize mode」で「resize and fill」を選択して、参照画像とは異なるサイズの画像を生成することができます。

  • 生成された画像の品質が低い場合はどうすればいいですか?

    -プロンプトに高品質を確保する単語を入力し、ネガティブプロンプトには品質を下げる単語を入力することで、生成された画像の品質を向上させることができます。

  • 「img2img」を利用するメリットは何ですか?

    -「img2img」を利用することで、参照画像のポーズや背景などの特徴を引き継ぎながら新しい画像を生成することができます。

Outlines

00:00

🖼️ Using 'img2img' for Image Generation

This paragraph introduces the 'img2img' method for generating images from existing images, which is particularly useful when the desired features such as poses and facial expressions are specified in the prompt but not well captured by the 'txt2img' method. The video demonstrates how to switch from 'txt2img' to 'img2img' in the 'stable diffusion web ui', upload a reference image, and set the image size to match the uploaded image for accuracy. It emphasizes the importance of entering a quality spell in the prompt to ensure high-quality image generation and provides an example of generating an anime-style illustration from a live-action image. The paragraph also explains the use of 'denoising strength' to control the similarity between the generated image and the reference image, with lower numbers resulting in a stronger match and higher numbers allowing for more divergence.

05:04

🔍 Adjusting Image Size and Features in 'img2img'

The second paragraph delves into adjusting the image size and features when using 'img2img'. It discusses the 'resize mode' options, including 'just resize', 'crop and resize', 'resize and fill', and 'latent upscale', each affecting the output image differently. The paragraph suggests using 'resize and fill' for generating images with a different size than the reference image. It summarizes the use of 'img2img' for generating images with similar features to the reference image and adjusting 'denoising strength' to control the influence of the reference. The paragraph concludes by mentioning 'openpose' for pose imitation and encourages viewers to explore more about AI generation at ai Gene. It ends with a call to action for viewers to subscribe to the channel for more content.

Mindmap

Keywords

Stable Diffusion

Stable Diffusionは、画像やテキストから新しい画像を生成するアルゴリズムの一種です。このビデオでは、Stable Diffusionの機能の一つであるimg2imgを使用して、既存の画像から新たな画像を生成する方法が解説されています。

img2img

img2imgは、既存の画像を参照して新しい画像を生成するStable Diffusionの機能です。ビデオでは、特定のポーズや特徴を維持しながら画像を生成するためにこの機能が使われている様子が説明されています。

txt2img

txt2imgは、テキストプロンプトから画像を生成するStable Diffusionの機能です。ビデオでは、この機能とimg2imgを比較し、特定の画像特徴を維持する必要がある場合にimg2imgが優れている点が強調されています。

denoising strength

ノイズ除去強度は、img2img機能で参照画像の特徴をどの程度維持するかを調節するパラメータです。ビデオでは、この値を調整することで参照画像と生成画像の類似度を制御する方法が説明されています。

resize to

resize toは、生成される画像のサイズを設定する機能です。ビデオでは、アップロードされた参照画像のサイズに合わせるか、手動でサイズを入力して調整する方法が紹介されています。

prompt

プロンプトは、画像生成アルゴリズムに入力されるテキストコマンドで、生成される画像のスタイルや内容を指示します。ビデオでは、プロンプトに「masterpiece, best quality, detailed eyes, blouse, girl」と入力することで、特定のスタイルや特徴を生成する方法が示されています。

negative prompt

ネガティブプロンプトは、画像生成プロセスで避けたいスタイルや特徴を指定するテキストコマンドです。ビデオでは、「easy negative, worst quality, low quality, normal quality, lowres」をネガティブプロンプトとして使用し、生成画像の品質を向上させる方法が解説されています。

scale

スケールは、生成される画像のサイズを参照画像と比較して拡大または縮小するパラメータです。ビデオでは、スケールを2に設定することで、参照画像の2倍の大きさの画像を生成する方法が紹介されています。

resize mode

リサイズモードは、生成される画像のサイズをどのように調整するかを指定する設定です。ビデオでは、「just resize」「crop and resize」「resize and fill」「latent upscale」などの異なるリサイズモードが説明されており、それぞれが画像生成にどのように影響するかが解説されています。

latent upscale

latent upscaleは、リサイズモードのひとつで、参照画像を元に画像を拡大する機能です。ビデオでは、このモードが「just resize」と同じ結果を生じ、画像を水平方向に伸ばすことが説明されています。

Highlights

画像から画像を作成する「img2img」の使い方について解説します。

「txt2img」では参照画像のポーズや特徴を完全に生成することは難しいため「img2img」が使えます。

「img2img」は参照画像のポーズや特徴を迅速に生成する方法です。

「stable diffusion web ui」を開始するとデフォルトはテキストで「txt2img」が設定されています。

「img2img」タブをクリックして画像から画像を生成するモードに切り替えます。

参照する画像をアップロードすると、その特徴を元に画像が生成されます。

アップロードした画像のサイズを「resize to」項目で変更できます。

画像サイズを自動調整するほうが手入力よりも間違いが少なくなります。

プロンプトに「masterpiece, best quality, detailed eyes, blouse, girl」などのポジティブプロンプトを入力します。

ネガティブプロンプトには「easy negative, worst quality, low quality, normal quality, lowres」を入力します。

「denoising strength」の値を調整して参照画像の特徴を強調または弱めることができます。

「denoising strength」を0に設定すると、参照画像とまったく同じ画像が生成されます。

「denoising strength」を0.5に設定すると、参照画像のポーズや服装、背景の特徴を維持したアニメスタイルのイラストが生成されます。

「scale」を2に設定すると、アップロードした参照画像の2倍の大きさの画像が生成されます。

生成された画像の目の部分がぼやけたり歪んだりする場合は、「scale」を2以上に設定すると改善されます。

「resize mode」を「resize and fill」に設定すると、参照画像とは異なるサイズの画像を生成できます。

「img2img」はポーズだけでなく、他の特徴も生成するため、ポーズだけを模倣して画像を生成したい場合は「openpose」を使用します。

AI生成に関する情報は「ai Gene」で提供しています。

映像の内容が気に入った場合はチャンネル登録をお願いします。