모델마다 방언이 있다. 우리는 다 구사한다.
포토리얼리즘의 왕.
Flux 1.1 Pro는 Black Forest Labs의 대표 모델. 브리핑에 '리얼하게 만들어'라고 쓰여 있을 때 쓰는 모델이다. 자연광, 피부 텍스처, 복잡한 다중 피사체 장면에 탁월하다.
여전히 가장 몽환적.
Midjourney v7는 누구도 진짜로 복제 못한 회화적 품질의 이미지를 만든다. 시네마틱하고, 약간 초현실적이고, 구도가 안정적이다.
진짜로 되는 캐릭터 일관성.
Nano Banana Pro는 여러 샷에 걸쳐 일관된 캐릭터가 필요한 모든 것에 쓰는 모델. Google 아키텍처, 티가 난다 - 탁월한 지시 따르기, 일정한 얼굴 특징, 안정적인 타이포그래피 렌더링.
오픈소스인데 이제 진짜 좋다.
Stable Diffusion 3.5 Large는 오픈소스 이미지 생성의 약속을 드디어 지켰다. 로컬에서 실행하고, 파인튜닝하고, 합치자. SD1.5부터 프롬프트 방언이 많이 진화했다.
보통의 모션 블러 없는 영상.
ByteDance의 Seedance 2는 우리가 테스트한 중 가장 컨트롤 가능한 영상 생성 모델. 카메라 무브먼트가 지시를 확실히 따르고, 그 AI 특유의 뿌연 느낌 없이 움직임이 자연스럽다.
Google의 시네마틱 영상 모델.
Veo 3.1은 Google DeepMind의 영상 생성 모델로 진짜 시네마틱한 영상을 만든다. 조명이 탁월하고, 인간의 움직임이 자연스럽고, 복잡한 장면 전환도 처리한다.