Cada modelo tem seu dialeto. A gente fala todos.
O rei do fotorrealismo.
Flux 1.1 Pro e o modelo principal da Black Forest Labs. E o que voce usa quando o briefing diz 'faz realista'. Excepcional para iluminacao natural, texturas de pele e cenas complexas com multiplos sujeitos.
Ainda o mais onirico.
Midjourney v7 gera imagens com uma qualidade pictorica que ninguem realmente conseguiu copiar. Cinematico, levemente surrealista, composicionalmente solido.
Consistencia de personagens que realmente funciona.
Nano Banana Pro e o modelo para tudo que envolve personagens consistentes em multiplos shots. Arquitetura Google, da pra ver - seguimento de instrucoes excepcional, tracos faciais constantes, renderizacao de tipografia solida.
Open source e finalmente bom de verdade.
Stable Diffusion 3.5 Large cumpre finalmente a promessa da geracao de imagens open source. Rode localmente, fine-tune, mescle. O dialeto do prompt evoluiu muito desde o SD1.5.
Video sem o motion blur habitual.
Seedance 2 da ByteDance e o modelo de geracao de video mais controlavel que testamos. Movimentos de camera seguem instrucoes de forma confiavel, o movimento e fluido sem aquela qualidade borrada da IA.
O modelo de video cinematico do Google.
Veo 3.1 e o modelo de geracao de video do Google DeepMind e produz imagens verdadeiramente cinematicas. A iluminacao e excepcional, o movimento humano e natural, e o modelo lida com transicoes de cena complexas.