【AI News 2025.03.26】画像/動画/3D

2025.03.26

画像関連

OpenAI 4o Image Generation 精度が向上

GPT-4o can build upon images and text in chat context, ensuring consistency throughout. pic.twitter.com/DxgN6z2qqB
— OpenAI (@OpenAI) March 25, 2025

OpenAIから4o Image Generationが全ユーザーに向けて公開されました。実際に使ってみると、文脈理解やスタイル変更の精度が大きく向上しており、日本語の生成も自然に対応してくれる印象です。GoogleのGemini 2.0 Flashと同等の汎用性がありそうです。アイデア出しや初期生成に活用し、細かな調整はFluxやStable Diffusion 3.5などと組み合わせるワークフローも有効かもしれません。

画像生成界に新星『Reve』登場！UI/UXも好感触

Halfmoon is Reve Image — and it’s the best image model in the world 🥇
(🔊) pic.twitter.com/Zm1FzNQaFh
— Reve (@reveimage) March 24, 2025

Reveという新たな画像生成サービスが現れました。現在は画像生成のリーダーボードで1位を獲得しています。UI/UXも洗練されており、使いやすさでも高評価。これから実際に試してみる価値がありそうです。

細かなコントロールで画像生成が可能なモデル『DreamRenderer』

GitHub

GitHub - limuloo/DreamRenderer: Official implementation of DreamRenderer: Tam...

https://github.com/limuloo/DreamRenderer

Official implementation of DreamRenderer: Taming Multi-Instance Attribute Control in Large-Scale Text-to-Image Models - limuloo/DreamRenderer

バウンティボックスやマスク、プロンプトを組み合わせることで、細部までコントロールできるというDreamRenderer。Fluxをベースに開発されており、今後はComfyUIへの対応も予定されているようです。より繊細な表現や構図指定が求められるクリエイターにとって、活用の幅が広がるモデルとして注目です。

ByteDanceが手がける顔一致型画像生成モデル『InfiniteYou』

bytedance.github.io

InfiniteYou | ByteDance Intelligent Creation

https://bytedance.github.io/InfiniteYou/

InfiniteYou: Flexible Photo Recrafting While Preserving Your Identity

TikTokの運用で知られるByteDanceが、Fluxベースの顔の一貫性を保った画像生成モデルInfiniteYouを公開しました。よく活用しているPuLIDは、質感の課題を感じていたので、改善が期待できるようであれば、InfiniteYouを採用したいと思います。ライセンスはApache License v2という点もありがいたいですね。

『IC-Light』の論文がICLR 2025で採択

Our relighting work is accepted to #ICLR2025.
Paper: https://t.co/Ved4N0nQeU
Code: https://t.co/WPanjtj1Vc
Demo: https://t.co/tW8OARko1a

We impose consistent light (IC-Light) transport during training. This consistency allows for stable and scalable illumination learning, and… pic.twitter.com/PdP21mxYE0
— Anyi Rao (@raoanyi) March 23, 2025

深層学習の国際会議「ICLR 2025」にて、一貫性の高い照明編集モデルIC-Lightの論文が採択されたことが発表されました。今もかなりお世話になっています。Flux対応版の公開にも期待したいところです。

動画関連

『Hunyuan Portrait』発表！リアルな動きの生成に挑む新モデルが話題に

kkakkkka.github.io

HunyuanPortrait: Implicit Condition Control for Enhanced Portrait Animation

https://kkakkkka.github.io/HunyuanPortrait/

HunyuanPortrait: Implicit Condition Control for Enhanced Portrait Animation

中国の大手テック企業Tencentが手がけるHunyuanから、新モデルHunyuan Portraitが公開されました。これはLivePortraitのように、静止画からリアルな表情や動きを生成する技術です。現在はオープンソース化に向けたレビュー段階とのことで、今後の展開を楽しみに待ちたいと思います。

『Vidu』がマルチリファレンス機能を追加！一貫性ある画像生成がさらに便利に

🔥 New Vidu Update 🔥Multi-Reference Consistency
Now you can define a reference subject each with up to 3 images and @ mention it anytime for consistent video generation! 🎥
More stability, more references (up to 7!), and even better anime-style precision.pic.twitter.com/tKMdH7aaML
— Vidu AI (@ViduAI_official) March 21, 2025

🎉 新機能「My References」登場！ 🎉

ViduAIが「Reference to Video」を再定義！✨

ワンクリックでオリジナルキャラクターを作成、自由に演出！🎬
もっと便利に、もっと安定に、そしてもっとプロフェッショナルに！💡

この機能で、どんな動画が生まれるのか…？… pic.twitter.com/lFaYbIb6Gn
— Vidu Japan (@Vidu_JP) March 21, 2025

高品質な動画生成で注目されるViduに、新たにマルチリファレンス機能が追加されました。複数の参照画像を保存・活用できることで、キャラクターやスタイルの一貫性を保った生成が可能になります。リファレンスを都度指定する手間が省け、制作効率も大幅にアップしそうですね。

1枚の画像から3Dアニメーションを生成するAlibaba『LHM』

lingtengqiu.github.io

LHM

https://lingtengqiu.github.io/LHM/

中国の大手IT企業Alibabaが、新たなフレームワークLHMを公開しました。これは、1枚の画像からアニメーション可能な3D Gaussian Splatting（3DGS）を生成できる技術で、わずか約2秒で結果を出せる高速性も特長です。環境の詳細は非公開ですが、この手軽さとスピード感、実際に試してみたくなります。

3D関連

After Effectsでの3D生成が手軽にできる新エクステンション『3D Wizard』

Flashback Japan Inc

3D Wizard - Flashback Japan Inc

https://flashbackj.com/product/3d-wizard

AIを活用して2Dイメージから3Dモデル(glbファイル)を生成するAfter Effectsエクステンション

After Effects向けに、ついに3D生成が可能なエクステンションが登場しました。現時点ではまだHugging FaceのWrapperですが、将来的にはローカル環境での生成対応にも期待が高まります。Element 3Dとの併用もできればかなり便利そうです。

プロンプトで3Dレイアウトを生成するモデルGoogle『LayoutVLM』

ai.stanford.edu

LayoutVLM

https://ai.stanford.edu/~sunfanyun/layoutvlm/

FactorSim: Generative Simulation via Factorized Representation

Googleが提案するLayoutVLMは、プロンプトを入力するだけで3Dアセットをレイアウトしてくれるというもの。発展していけば、さまざまところで活用できそうですね。例えば、絵コンテや設定資料をもとに空間構成を生成できたり、カメラワークの指定まで対応するなどできるようになると嬉しいですね。

Metaの新技術。1枚の画像から高品質な3Dを生成する手法が話題に

katjaschwarz.github.io

A Recipe for Generating 3D Worlds From a Single Image | Katja Schwarz

https://katjaschwarz.github.io/worlds/

Academic webpage of Katja Schwarz.

Metaが公開した1枚の画像から360度の3Dを生成できるというフレームワーク。公開されたサンプルでは破綻が少なく、非常に高品質な出力が確認できます。今後、Meta Quest向けのアプリとして展開されれば、没入感あるVR体験がより手軽に実現しそうです。クリエイティブやエンタメ分野での活用が楽しみな技術です。

『Tripo3D MCP』が登場！MCP対応で3D制作フローがさらに進化

Tripo3D MCP is here, allowing Blender/Cursor/Claude to integrate directly to generate 3D models in your #vibecoding project🫡

Check out an example with the Blender addon👇
Tutorial: https://t.co/B13HDclzYY
Tripo MCP is on: https://t.co/P6puEpLBfR #blendermcp #vibecoding… pic.twitter.com/kneYFbjwCk
— Tripo (@tripoai) March 23, 2025

TripoがMCPに対応したTripo3D MCPを発表しました。さらに、Blender用アドオンも提供されており、制作環境との連携が強化されています。現時点では生成速度が課題ですが、今後の改善は確実と見られ、MCPを活用した3Dシーンの制作フローに今のうちから慣れておく価値は十分にあると思います。

▼この記事の監修

takio koizumi
デジタルアーティスト。デジタルハリウッド大学で3DCGを学ぶ。大学院修了後、VFXアーティストとして約10年間、映画・アニメ・ゲームなど多彩なジャンルの作品を手がける。近年はAIに精通し、生成AI技術を取り入れたワークフローを研究し発信している。
HP： https://sites.google.com/view/takio-koizumi/link

NEWS

【AI News 2025.03.26】画像/動画/3D

画像関連

OpenAI 4o Image Generation 精度が向上

画像生成界に新星『Reve』登場！UI/UXも好感触

細かなコントロールで画像生成が可能なモデル『DreamRenderer』

ByteDanceが手がける顔一致型画像生成モデル『InfiniteYou』

『IC-Light』の論文がICLR 2025で採択

動画関連

『Hunyuan Portrait』発表！リアルな動きの生成に挑む新モデルが話題に

『Vidu』がマルチリファレンス機能を追加！一貫性ある画像生成がさらに便利に

1枚の画像から3Dアニメーションを生成するAlibaba『LHM』

3D関連

After Effectsでの3D生成が手軽にできる新エクステンション『3D Wizard』

プロンプトで3Dレイアウトを生成するモデルGoogle『LayoutVLM』

Metaの新技術。1枚の画像から高品質な3Dを生成する手法が話題に

『Tripo3D MCP』が登場！MCP対応で3D制作フローがさらに進化

関連記事一覧

【AI News 2025.04.09】LLM/ComfyUI/AIサービス関連

【AI News 2025.05.07】おすすめ記事4選

【AI News 2025.04.16】AI活用/LLM/その他

【AI News 2025.04.02】今週のおすすめ記事4選

【AI News 2025.04.23】画像/動画/3D関連

【AI News 2025.02.26】日常に溶け込む日も近い？進化...

【AI News 2025.03.05】LLM/AIサービス/AI活用

【AI News 2025.03.19】AI活用/LLM/その他