入力画像(左)からポーズを指定できる
アリババが9月22日、画像編集向けの生成モデル「Qwen-Image-Edit-2509」を公開した。「Qwen-Image-Edit」シリーズの最新版で、複数の画像を入力できる。人物+人物、人物+場面などの組み合わせで入力し、自然に合成可能だ。同社のチャットAI「Qwen Chat」から無料で試せる。
人物の一貫性や、商品画像の編集、テキスト編集(フォント、色、背景など)性能なども改善された。古い写真の復元・着色なども可能だ。ControlNetにネイティブ対応し、デッサン人形のようなツールを使ってポーズを指定したり、画像から深度マップを作成したりすることができる。
競合にあたるのは、グーグルの「Nano Banana(Gemini 2.5 Flash Image)」や、ByteDanceの「Seedream 4.0」だ。Qwen-Image-Editと同様、複数の画像を合成し、人物の見た目をそのままに編集できる。「1時間後の場面を描いて」など、解釈が必要な指示にも柔軟に対応できる。
Nano BananaとSeedream 4.0がAIプラットフォームやアプリ、APIでの提供が中心となる一方、Qwenはオープンモデルとして公開されており、HuggingFaceなどからモデルをダウンロードして、研究や開発を目的として使うことができる。