KM
ComfyUI 101 · บทที่ 5 · สาย Graphic

เทคนิคงานกราฟิก — กล่องเครื่องมือ ของทีมภาพ

แก้ภาพ · คุมองค์ประกอบ · ใส่สไตล์ · ขยายความละเอียด · สร้างวิดีโอ — ทุกเทคนิคต่อยอดจากโครง 6-node ในบทที่ 3 (ขอให้แม่นบท 3–4 ก่อน)

5.1

Image-to-Image — สร้างภาพจากภาพต้นแบบ

แทนที่จะเริ่มจากผ้าใบเปล่า เราเริ่มจากภาพจริงแล้วให้ AI วาดทับตาม prompt — workflow เปลี่ยนจากบทที่ 3 แค่จุดเดียว

Load Image 🖼️VAE EncodeKSampler (denoise 0.55)VAE DecodeSave Image

เปลี่ยนจากผ้าใบเปล่า → เริ่มจากภาพจริงที่ถูกบีบเป็น latent — ที่เหลือเหมือนบทที่ 3 ทุกประการ

ภาพต้นแบบผลลัพธ์ตาม denoiseต้นแบบ 45% · ใหม่ 55%
denoise =0.55

กุญแจจากบทที่ 4 กลับมาทำงานจริง: ต่ำ = เหมือนต้นฉบับ · สูง = เปลี่ยนเยอะ — โซนใช้บ่อยของ img2img คือ 0.4–0.7

ใช้ทำ: เปลี่ยนสไตล์ภาพ · ปรับโทน · sketch → ภาพจริง · ภาพถ่าย → การ์ตูน

5.2 · ใช้บ่อยที่สุด

Inpainting — แก้เฉพาะบางส่วนของภาพ

แก้เฉพาะพื้นที่ที่ระบาย mask ไว้ ส่วนที่เหลือคงเดิม — เครื่องมือทำงานจริงที่ทีมกราฟิกใช้บ่อยที่สุด: ลบ/เปลี่ยนวัตถุ เปลี่ยนพื้นหลัง แก้มือเพี้ยน

🖌️ ลากเมาส์ระบาย พื้นที่ที่อยากแก้ — เหมือนใช้ MaskEditor ของจริง

ภาพต้นฉบับสำหรับลอง inpaint
🖌️ ลองระบายตรงท้องฟ้า / แม่น้ำ ดูสิ

ใน ComfyUI จริง: คลิกขวาที่ภาพใน Load Image Open in MaskEditor → ระบายแบบเดียวกันนี้

แล้วต่อผ่าน VAE Encode (for Inpainting) — prompt = สิ่งที่อยากให้ปรากฏในพื้นที่ mask · ส่วนนอก mask คงเดิม 100%

💡 เคล็ดลับความเนียน: ขยายขอบ mask เล็กน้อยด้วย grow_mask_by และใช้ denoise ~0.7–0.9 ในพื้นที่ inpaint — ขั้นกว่า: เสริม ControlNet คุมโครงสร้างเดิม (หัวข้อถัดไป)

5.3

ControlNet — คุมองค์ประกอบ / ท่าทาง / เส้นโครง

บังคับโครงสร้างของภาพด้วยภาพอ้างอิง (ท่าทาง เส้นขอบ ความลึก) ขณะที่ prompt ยังคุมเนื้อหา/สไตล์ — ภาพชุดที่ pose เหมือนกันเป๊ะเกิดจากตัวนี้

คุมอะไร

ท่าทาง / โครงกระดูกคน

Use case

จัดท่านางแบบ, คุม pose ตัวละคร

strength =0.80
สมดุล — โครงตามอ้างอิง เนื้อหาตาม prompt

🔗 เส้นทางข้อมูล: ภาพอ้างอิง → Preprocessor (แปลงเป็นโครง) → Apply ControlNet แทรกเข้าไปใน CONDITIONING ก่อนถึง KSampler — และเสียบหลายตัวพร้อมกันได้ (เช่น Pose + Depth) โดยต่อ Apply ControlNet ซ้อนกัน

5.4

LoRA — ฉีดสไตล์ / ตัวละคร / แบรนด์

ไฟล์เสริมเล็ก ๆ ที่เสียบเพิ่มความสามารถให้โมเดลหลัก — สไตล์ประจำองค์กร มาสคอต สินค้าเฉพาะรุ่น · ปี 2026 เทรน LoRA ได้ในตัว ComfyUI แล้ว (Z-Image, Flux, SDXL, Wan)

ภาพจากโมเดลหลักสไตล์เข้ม 80%
Load CheckpointLoad LoRA #1MODEL+CLIP ที่ฉีดสไตล์แล้ว
LoRA #1 strength0.80

ปกติใช้ 0.6–1.0 · ซ้อนหลายตัวได้แต่ระวังตีกัน · LoRA ต้องตรงตระกูลโมเดล (SDXL↔SDXL, Flux↔Flux)

5.5

IPAdapter — ใช้ “ภาพ” เป็น prompt

ส่งภาพอ้างอิงแทนการพิมพ์บรรยาย — ผลลัพธ์ได้สไตล์/องค์ประกอบ/ใบหน้าคล้ายภาพนั้น (image prompt)

🎨

Style transfer

ลุค/โทนคงที่ตาม reference — คุมมู้ดทั้งแคมเปญด้วยภาพเดียว

🧑

FaceID

ถ่ายทอดใบหน้าเฉพาะคน — ใช้ Insightface ที่เราลงไว้แล้วในบทที่ 2

🔄

Multi-angle

สร้างภาพหลายมุมของตัวละคร/สินค้าเดียวกันให้หน้าตาคงเส้นคงวา

5.6

Upscaling — ขยายความละเอียดระดับใช้งานจริง

มี 2 แนวทางหลัก และมักใช้ร่วมกัน — กดสลับดูทั้งสองสาย

Load Upscale Model (4x-UltraSharp / RealESRGAN)Upscale Image (using Model)Save

ขยายด้วยโมเดล AI เฉพาะทาง — คมขึ้นโดยไม่เปลี่ยนเนื้อหา ตรงไปตรงมาและเร็ว

💡 สองแนวทางมักใช้ร่วมกัน · ภาพใหญ่มากใช้ Ultimate SD Upscale (แบ่ง tile) กัน VRAM ระเบิด · use case: เตรียมภาพพิมพ์/โฆษณา, asset ความละเอียดสูง

5.7

เลือกโมเดลให้ถูกงาน (2025–2026)

ComfyUI รองรับโมเดลใหม่ Day-0 — คำถามจริงคือ “งานนี้ควรใช้ตัวไหน”

จุดเด่น

คุณภาพสูง photorealistic ดีมาก เขียนตัวอักษรในภาพได้ดี

เหมาะกับ

งานคุณภาพสูง, ภาพคน/ฉาก

💡 งานที่มีตัวหนังสือไทย/อังกฤษในภาพ (โปสเตอร์ ป้าย) → กลุ่ม Flux/Qwen เก่ง text rendering · เปิด Templates ในแอป (หมวด Image/Video/Audio/3D/LLM) มี workflow สำเร็จให้เริ่มทุกตัว — โปรไฟล์เต็มของแต่ละโมเดลดูได้ที่ Showcase บทที่ 1

5.8

Video Generation — สร้างวิดีโอ

เทคนิคยอดนิยม Start/End Frame: กำหนดเฟรมเริ่ม+จบ แล้วให้โมเดลสร้างเฟรมระหว่างกลาง — ลองเองได้เลย

เฟรมเริ่ม

Start frame

เฟรมที่ถูกสร้างระหว่างกลางเฟรม 1 / 33 — โมเดลสร้างให้
เฟรมจบ

End frame

เรากำหนดแค่ เฟรมเริ่ม + เฟรมจบ — Wan 2.2 สร้างเฟรมระหว่างกลางให้เป็นแอนิเมชันลื่น ๆ · เหมาะกับ transition, เปลี่ยนฉาก, animate ภาพนิ่ง, กำหนด pose

⚠️ วิดีโอกิน VRAM และเวลามาก — เริ่มจากความละเอียด/ความยาวต่ำก่อน แล้วค่อยขยาย

Wan 2.1 / 2.2

T2V + I2V คุณภาพ/การควบคุมสูง — โมเดลวิดีโอยอดนิยมปี 2026

HunyuanVideo

text-to-video คุณภาพสูง

Mochi / LTX

open-source สายเร็ว — LTX เด่นเรื่อง real-time

5.9 · รวมร่าง

เทมเพลตจริง: pipeline งานสินค้า

พลังจริงของ ComfyUI คือรวมหลายเทคนิคใน workflow เดียว — ตัวอย่าง “ปรับภาพสินค้าให้พร้อมใช้” ใช้ของจากทั้งบทนี้

1. Load Image

ภาพสินค้าถ่ายเอง

จาก บท 3

2. Inpaint เปลี่ยนพื้นหลัง

mask รอบสินค้า + ControlNet (Canny) คงรูปทรง

จาก 5.2 + 5.3

3. LoRA สไตล์แบรนด์

โทนภาพประจำองค์กร strength ~0.8

จาก 5.4

4. Upscale 2×

model upscale + KSampler รอบสอง denoise 0.35

จาก 5.6

5. Save Image

พร้อมใช้ — และทำซ้ำกับสินค้า 100 ชิ้นได้

จาก → บท 6

🔁 สร้างครั้งเดียว ทำซ้ำกับสินค้า 100 ชิ้นได้ — ต่อยอดเป็น automation เต็มรูปแบบในบทที่ 6

✅ สรุปบทที่ 5

  • img2img/denoise = สร้างภาพจากภาพ · inpaint = แก้เฉพาะ mask (ใช้บ่อยสุด)
  • ControlNet คุมโครงสร้าง/ท่าทาง · LoRA ฉีดสไตล์/ตัวละคร · IPAdapter ใช้ภาพเป็น prompt
  • Upscale 2 แนวทาง (model / latent+KSampler) — ภาพใหญ่ใช้ tile กัน VRAM ระเบิด
  • • โมเดลยุคใหม่: Flux/Qwen เก่ง text · Wan 2.2 วิดีโอ — มี Templates ให้เริ่ม
  • • พลังจริงคือ รวมหลายเทคนิคใน workflow เดียวแล้วทำซ้ำได้
📚 ถัดไป: บทที่ 6 — Automation / API (รัน workflow นี้กับสินค้า 100 ชิ้นอัตโนมัติ) — เลือกได้จาก sidebar ซ้ายมือ