各モデルには独自の方言がある。私たちはそのすべてを話す。
フォトリアリズムの王。
Flux 1.1 ProはBlack Forest Labsのフラッグシップモデル。ブリーフに「リアルに」と書かれている時に使うモデルだ。自然光、肌のテクスチャ、複数の被写体が絡む複雑なシーンに卓越している。
依然として最も夢幻的。
Midjourney v7は、誰もコピーできていない絵画的な品質の画像を生成する。シネマティックで、少しシュールで、構図的に安定している。
本当に機能するキャラクターの一貫性。
Nano Banana Proは複数のショットにわたって一貫したキャラクターが必要なものすべてに使うモデル。Googleアーキテクチャ、それが見える - 卓越した指示追従性、一定の顔の特徴、安定したタイポグラフィレンダリング。
オープンソースで今は本当に良い。
Stable Diffusion 3.5 Largeはオープンソース画像生成の約束をついに果たした。ローカルで実行、ファインチューン、マージ。SD1.5からプロンプトの方言が大きく変化した。
通常のモーションブラーなしの動画。
ByteDanceのSeedance 2は私たちがテストした中で最もコントロールしやすい動画生成モデル。カメラの動きは指示に確実に従い、そのAIぼやけた見た目なしで動きが滑らかだ。
Googleのシネマティック動画モデル。
Veo 3.1はGoogle DeepMindの動画生成モデルで、本当にシネマティックな映像を生み出す。照明が卓越していて、人間の動きが自然で、複雑なシーンの転換も扱える。