本日の目標:テキストから画像への変換技術の基礎をマスターする。
動画で解説されているテキストから画像への変換技術の基礎です。AIが画像を生成する際、「プロンプト」という命令文を与えます。プロンプトは明確で構造的であるほど、AIが意図通りに解釈しやすくなります。
誰が・何が主役かを明確にします。(例:ゴールデンレトリバー)
どんな雰囲気で撮られた写真かを追加します。(例:シネマティック)
アスペクト比などの設定です。(例:--ar 16:9)
箇条書きや `#, ##` を使って情報を整理すると伝わりやすくなります。
要素(チップ)を下の「魔法の釜(ドロップゾーン)」にドラッグ&ドロップして完成させましょう!
シミュレーターを動かして画像の生成工程を体験する。
動画で紹介されたプロンプトです。No Video Relianceの法則に基づき、すべて再現しました。
解説: キャラクターの三面図やベース画像(Character Reference)を入力し、「走っている」「見上げている」などの動作を追加する。
動画の 02:05 から見る1人の女性、走っている、横顔、躍動感、スポーツウェア
解説: テキストを配置する余白(ネガティブスペース)を意識した構図をプロンプトで指定する。
動画の 03:54 から見るYouTubeサムネイル用背景、右側に大きな余白、左側に驚くビジネスマン、鮮やかな青背景、高品質、4k
解説: バリエーション生成(Vary)機能を使い、元の構図を保ちつつ色合いやモチーフを微調整する。
動画の 05:03 から見る(Vary機能使用) 背景を赤色に、人物の服をスーツに変更
解説: プロンプトの特定キーワードだけを差し替えて複数一気に生成。A/Bテスト用の素材を作る。
動画の 05:54 から見るYouTubeサムネイル用背景、右側に大きな余白、左側に[笑顔/怒る/泣く]ビジネスマン
解説: 「アメコミ風」「ポップアート」「フラットデザイン」などのスタイルキーワードを強調する。
動画の 06:42 から見るポップアートスタイル、アメコミ風、集中線、カラフルな背景、セール告知用バナーの背景素材
解説: 画像内のテキストをインペイント(部分修正)機能で消去し、Canva等で後から追加できるようにする。
動画の 07:43 から見る(Inpaint機能使用) テキスト部分をなぞり、プロンプトを「何もない無地の背景」にして修正
解説: 「アイソメトリック(等角投影法)」「3Dアイコン」を指定して、図解に使えるパーツを生成する。
動画の 08:22 から見るアイソメトリック構図、3Dアイコン、光るパソコン、クリーンな白背景、インフォグラフィック素材
解説: アウトペイント機能で画像の上下左右を拡張し、アスペクト比を変えつつ自然な背景を継ぎ足す。
動画の 09:20 から見る(Zoom Out / Pan機能使用) 横長の16:9へ拡張、自然な森の風景を横に広げる
解説: 粗い手書きのラフ図などを読み込ませ(Image to Image)、高精密なイラストに仕上げる。
動画の 10:02 から見る(Image to Image) このラフスケッチに基づいた、高品質な3Dレンダリングの家、リアルな光、晴れ
解説: インペイント機能を使い、「コーヒー」を「紅茶」に変更するなど、特定箇所だけ書き換える。
動画の 10:47 から見る(部分選択) 紅茶が入ったアンティークなティーカップ、湯気
解説: 要素をカンマで区切り、重み付け(Weight)パラメーターを使って配置バランスを調整する。
動画の 11:42 から見る可愛い犬::2、かっこいい猫::1、公園の中、並んで座っている
解説: 棒人間や簡単なポーズ図をコントロールとして入れて、その通りのポーズを取らせる。
動画の 12:27 から見る(Pose Reference使用) 腕を組んで自信満々に立つスーツの男性、超リアル、8k
解説: 「スタイル参照(sref)」を用いて、特定のイラストレーター風のタッチを適用する。
動画の 13:07 から見る(sref 参照画像URL) サイバーパンク都市、雨、ネオンライト
解説: 「--ar 16:9」などのパラメーターを付与し、用途にあった正確な比率を指定する。
動画の 13:48 から見る美しい夕焼けの海、ヤシの木 --ar 16:9
解説: 緑色や白の背景(グリーンバック)を指定し、後から編集ソフトで切り抜きやすくする。
動画の 14:38 から見るシンプルな椅子、白背景、スタジオ照明、影なし --no shadow
解説: 生成された画像を「Upscale(Creative/Subtle)」ボタンで品質を保ったまま高解像度化する。
動画の 15:32 から見る(Upscaleボタン実行による高画質化)
解説: 「シネマティック」「リムライト」「ゴールデンアワー」等、光の当たり方を指定。
動画の 16:29 から見るポートレート、女性、横顔、シネマティックライティング、バックライト、リムライト、被写体ブレなし
解説: 「ボケ味(Bokeh)」「F値1.4」「マクロ撮影」などカメラのレンズ特性をプロンプトに入れる。
動画の 17:20 から見るマクロ撮影、葉にとまる水滴、背景は強くボケている(ボケ味)、F値1.4、超高解像度
解説: ChatGPTに「Midjourney用のプロンプトを10パターン英語で出力して」と指示し、コピペで量産する。
動画の 18:00 から見る(ChatGPTで生成した英語プロンプトをそのまま入力)
解説: 静止画を2枚用意し、「AからBへ変化する」AIビデオ生成ツールへの繋ぎとして活用する。
動画の 19:03 から見る画像A(昼の街)と画像B(夜の街)を生成し、外部ツールで動画化
20選のうち、どれか1日コピーして手元で控えておく。
インペイント(部分修正)やアスペクト比の変更など、生成後の「加工」に特化したテクニック集です。
解説: インペイントで髪部分を選択し、髪型を指定。例:「ショートボブ、金髪」
ショートボブのヘアスタイル、金髪、風になびく
解説: インペイントで口元や目元を選択。「笑顔」や「驚き」等の感情を追加。
大きな笑顔、白い歯、輝く目
解説: インペイントで服全体を選択。「春のカジュアルなワンピース」などに変更。
黄色い春のカジュアルなワンピース、花柄
解説: Zoom OutまたはPan機能で縦横比を変える。
(Zoom Out機能使用) 背景のカフェを広く見せる
解説: インペイントで不要なオブジェクトを選択し、プロンプトを空にする。
木製のテーブルのみ
解説: 単純に消すのではなく、「開いたスペースに観葉植物を置く」など。
小さな緑の観葉植物、白い鉢
解説: 「Character Reference (--cref)」を使用。
コーヒーを飲む、カフェのテラス --cref [画像URL] --cw 100
解説: 実在の人物の写真をcrefに入れ、似た人物の画像を生成。
スーツを着てプレゼンする、会議室 --cref [写真URL]
解説: 下書きや骨組み画像を元に生成(ControlNet等の機能)。
モダンなリビングルーム、大きな窓、観葉植物 (ベース線画あり)
解説: 線画の強さ(ウェイト)を調整し、AIの自由度を高める。
--iw 0.5 (画像への忠実度パラメーターの調整)
解説: 商品の背景を豪華にする。「高級感」「水しぶき」などを追加。
高級化粧品のボトル、黒い大理石の上、金色の水しぶき、ドラマチックな照明
解説: 布の質感や金属の反射など、マテリアルに特化した指定。
シルクの布が風に舞う、柔らかい光、パステルピンク
解説: 湯気、照り、滴るシロップを強調する。
焼きたてのハンバーガー、肉汁、湯気、超リアル
解説: Knolling(分解して整然と並べる構図)を指定。
カメラの分解図、ノウリング構図、真上からの視点、青い背景
解説: 後からCanvaでロゴや文字を合成するための無地素材作り。
無地の黒いTシャツを着た若者、真っ白な看板
解説: ブランクのスマホ画面やポスターフレームを生成。
木製テーブルの上のiPhone15 モックアップ、画面真っ白、自然光
解説: 引用符(「""」)で囲んでテキストを描画させる。
ネオンサインで "HELLO WORLD" と書かれている、路地裏
解説: 長文や複雑な日本語はCanvaで後乗せしたほうが早くて正確です。
※バウンディングボックスだけ生成してCanvaで文字を入れる手法
解説: 「スタジオライティング」「無地背景」を指定。
プロのビジネスポートレート、日本人男性30代、グレー背景、笑顔
インペイントの手順を理解する。