
【AI News 2025.03.26】画像/動画/3D
画像関連
OpenAI 4o Image Generation 精度が向上
OpenAIから4o Image Generationが全ユーザーに向けて公開されました。実際に使ってみると、文脈理解やスタイル変更の精度が大きく向上しており、日本語の生成も自然に対応してくれる印象です。GoogleのGemini 2.0 Flashと同等の汎用性がありそうです。アイデア出しや初期生成に活用し、細かな調整はFluxやStable Diffusion 3.5などと組み合わせるワークフローも有効かもしれません。
画像生成界に新星『Reve』登場!UI/UXも好感触
Reveという新たな画像生成サービスが現れました。現在は画像生成のリーダーボードで1位を獲得しています。UI/UXも洗練されており、使いやすさでも高評価。これから実際に試してみる価値がありそうです。
細かなコントロールで画像生成が可能なモデル『DreamRenderer』
バウンティボックスやマスク、プロンプトを組み合わせることで、細部までコントロールできるというDreamRenderer。Fluxをベースに開発されており、今後はComfyUIへの対応も予定されているようです。より繊細な表現や構図指定が求められるクリエイターにとって、活用の幅が広がるモデルとして注目です。
ByteDanceが手がける顔一致型画像生成モデル『InfiniteYou』
TikTokの運用で知られるByteDanceが、Fluxベースの顔の一貫性を保った画像生成モデルInfiniteYouを公開しました。よく活用しているPuLIDは、質感の課題を感じていたので、改善が期待できるようであれば、InfiniteYouを採用したいと思います。ライセンスはApache License v2という点もありがいたいですね。
『IC-Light』の論文がICLR 2025で採択
深層学習の国際会議「ICLR 2025」にて、一貫性の高い照明編集モデルIC-Lightの論文が採択されたことが発表されました。今もかなりお世話になっています。Flux対応版の公開にも期待したいところです。
動画関連
『Hunyuan Portrait』発表!リアルな動きの生成に挑む新モデルが話題に
中国の大手テック企業Tencentが手がけるHunyuanから、新モデルHunyuan Portraitが公開されました。これはLivePortraitのように、静止画からリアルな表情や動きを生成する技術です。現在はオープンソース化に向けたレビュー段階とのことで、今後の展開を楽しみに待ちたいと思います。
『Vidu』がマルチリファレンス機能を追加!一貫性ある画像生成がさらに便利に
高品質な動画生成で注目されるViduに、新たにマルチリファレンス機能が追加されました。複数の参照画像を保存・活用できることで、キャラクターやスタイルの一貫性を保った生成が可能になります。リファレンスを都度指定する手間が省け、制作効率も大幅にアップしそうですね。
1枚の画像から3Dアニメーションを生成するAlibaba『LHM』
中国の大手IT企業Alibabaが、新たなフレームワークLHMを公開しました。これは、1枚の画像からアニメーション可能な3D Gaussian Splatting(3DGS)を生成できる技術で、わずか約2秒で結果を出せる高速性も特長です。環境の詳細は非公開ですが、この手軽さとスピード感、実際に試してみたくなります。
3D関連
After Effectsでの3D生成が手軽にできる新エクステンション『3D Wizard』
After Effects向けに、ついに3D生成が可能なエクステンションが登場しました。現時点ではまだHugging FaceのWrapperですが、将来的にはローカル環境での生成対応にも期待が高まります。Element 3Dとの併用もできればかなり便利そうです。
プロンプトで3Dレイアウトを生成するモデルGoogle『LayoutVLM』
Googleが提案するLayoutVLMは、プロンプトを入力するだけで3Dアセットをレイアウトしてくれるというもの。発展していけば、さまざまところで活用できそうですね。例えば、絵コンテや設定資料をもとに空間構成を生成できたり、カメラワークの指定まで対応するなどできるようになると嬉しいですね。
Metaの新技術。1枚の画像から高品質な3Dを生成する手法が話題に
Metaが公開した1枚の画像から360度の3Dを生成できるというフレームワーク。公開されたサンプルでは破綻が少なく、非常に高品質な出力が確認できます。今後、Meta Quest向けのアプリとして展開されれば、没入感あるVR体験がより手軽に実現しそうです。クリエイティブやエンタメ分野での活用が楽しみな技術です。
『Tripo3D MCP』が登場!MCP対応で3D制作フローがさらに進化
TripoがMCPに対応したTripo3D MCPを発表しました。さらに、Blender用アドオンも提供されており、制作環境との連携が強化されています。現時点では生成速度が課題ですが、今後の改善は確実と見られ、MCPを活用した3Dシーンの制作フローに今のうちから慣れておく価値は十分にあると思います。
デジタルアーティスト。デジタルハリウッド大学で3DCGを学ぶ。大学院修了後、VFXアーティストとして約10年間、映画・アニメ・ゲームなど多彩なジャンルの作品を手がける。近年はAIに精通し、生成AI技術を取り入れたワークフローを研究し発信している。
HP: https://sites.google.com/view/takio-koizumi/link



