【AI News 2025.03.19】画像/動画/3D関連

画像関連

Freepik、LoRA作成機能が追加され画像生成精度が向上

画像素材を提供するサービスFreepik。新たにオブジェクトのLoRA(Low-Rank Adaptation)制作機能が追加され、15〜25枚の画像でLoRAを作成できるようになりました。
Gemini 2.0 Flashの画像生成と修正精度がかなり高いですね。正直、これに関してはFreepikで生成する必要があるのかと思いますが、対応が速いですね。

追加学習なし!被写体の一貫性保持が可能な『Diffusion Transformer』

追加学習なしで被写体の一貫性を保ちながら、誰でも簡単に画像をパーソナライズできるというDiffusion Transformer。以前紹介したDSDと似た手法が使われていますが、どちらが優れているのでしょうか。ComfyUIでの使用が可能になれば、より多くのユーザーが試せるようになりますね。

リライティングを高速で行える画像変換モデル『LBM』

LBM(Latent Bridge Matching)は、画像を変換するための方法で、1回の操作で画像をすばやく変換できるのが特徴。加えて、オブジェクト除去、法線と奥行きの推定、オブジェクトの再照明など、様々な画像変換タスクも実現できるモデルだそう。
今後、ComfyUIに対応してくれると、さらに多くのクリエイターがこのモデルを活用できるようになり便利さが増すでしょうね。

NVIDIAの『SANA-Sprint』で驚異的な生成スピード!RTX4090で0.31秒の画像生成

NVIDIAが開発したモデルSANA-Sprint。生成のスピードが驚異的!なんと、1024×1024の画像を、RTX4090でも0.31秒で生成しているそうです。
もしSANA-SprintがControlNetやIPAdapterと対応するようになれば、さらに多くのクリエイターが試してみたいと感じるでしょうね。

動画関連

1枚の画像から3D動画を生成する『Stable Virtual Camera』。ただし商用利用は未対応

Stability.aiが新たに公開したStable Virtual Cameraは、1枚の画像から3Dカメラコントロールを使って動画を生成するAIモデルです。これによって静止画像から動きのある映像を作成できるようです。まだ研究プレビュー段階ですが、様々な場面での活用に期待したいですね。現時点では商用利用ができないのが少し残念です。

1枚の画像から自由自在にカメラ操作できる『ReCamMaster』

ReCamMasterは、1枚の画像からカメラをコントロールすることができるフレームワークです。映像の自由度が大きく向上していますね。特に、スタビライザー機能のおかげで、映像のブレを抑えた滑らかな映像を作成することができます。

3D関連

1枚の画像から3Dキャラクターを生成できる『StdGEN』

昨年紹介されたTencent AIの生成AIモデルStdGENが公開されました。このモデルの特徴は、1枚の画像からオブジェクトを個別に分けて3Dキャラクターを生成できる点です。より細かいカスタマイズや再利用が可能になりますね。
デモも公開されており、実際にどのように動作するのかを確認することができます。3Dキャラクター生成に興味がある方は、試してみては?

生成速度と精度がアップデートした『Hunyuan 3D 2.0』

Hunyuan 3D 2.0の新バージョンが登場しました。今回のアップデートでは、生成速度や精度が大幅に向上し、さらにマルチビュー生成にも対応。
HuggingFaceのデモで実際に試してみたところ、その精度の高さに驚きました。現在はまだモデルの公開がされていませんが、ComfyUIのワークフローへの組み込みを検討したいと思います。

Robloxの新しい3D生成AI『Cube 3D』がオープンソース化

ゲーム開発プラットフォームのRobloxは、新たにCube 3Dという3D生成AIモデルをオープンソースで公開しました。精度はHunyuanの方が高そうですが、プロモーション動画のようにプラットフォーム内で生成するのは楽しそうですね。

HoudiniとUE5がMCPに対応

HoudiniとUnreal Engine 5(UE5)がMCP(Model Control Protocol)に対応しました。
色々なCGソフトがMCP対応してきましたね。

自分だけのアバターが作れる!リアルタイムVTuberツール『WarpTuber』

リアルタイムでVTuberをサポートするツールWarpTuberがオープンソースで公開されました。
誰でも自分だけのバーチャルキャラクターを簡単に作成できる時代になりましたね。そろそろ自分のキャラクターも出来そうな気がしてきたので、アバター系AIも検証していきたいですね。

▼この記事の監修
takio koizumi
デジタルアーティスト。デジタルハリウッド大学で3DCGを学ぶ。大学院修了後、VFXアーティストとして約10年間、映画・アニメ・ゲームなど多彩なジャンルの作品を手がける。近年はAIに精通し、生成AI技術を取り入れたワークフローを研究し発信している。
HP: https://sites.google.com/view/takio-koizumi/link

関連記事一覧