色とりどりの傘

【AI News 2025.02.26】動画関連

動画関連

多機能でVRAM8.19GBでも動作するAlibaba『Wan 2.1』

Alibabaから新しい動画生成AI、Wan2.1がオープンソースで公開されました。特にT2V-1.3Bというバージョンが注目で、VRAMが8.19GBでもスムーズに動作するそうで凄いですね。他にも、Image to Videoはもちろん、動画編集、Video to Audioなどのタスクも対応しているそうです。AIを活用した動画制作の可能性が広がるのではないでしょうか。今後、検証を行いたいと考えています。また、FluxのBlack Forest Labも、近いうちに新しいモデルを公開するのではないかと予想しています。

『Pikaswaps』のリプレイス機能が便利!

Pikaが提供するPikaswapsは、シンプルでありながら汎用性の高いリプレイス機能が実装されています。現在、Xで紹介されていた活用例を参考に検証中です。特定の要素を交換したいときには役立ちそうです。

動画から音声を生成するLuma AI『Dream Machine』

Luma AIが新たに提供するDream Machineは、動画から音声を生成する機能を発表しました。コンテンツ制作が一層便利になりそうですね。しかし、現状ではDream Machineで生成された動画にのみ対応している点が少しもったいなく感じます。

リスタイルとスピーチ機能で差別化を図る『PixVerse V4』

先日発表されたPixVerse V4は、リスタイル機能とスピーチ機能が特に注目です。リスタイル機能は画像やビジュアルを新しいスタイルに変換するもので、スピーチ機能は動画に音声を追加することができます。他ツールとの差別化が出来ていて好印象です。

Kaiberの新しい進化。『Superstudio Pro』でノードベース操作が可能に

Kaiberが新たにSuperstudio Proを発表し、なんとノードベースでの操作が可能になりました。操作感がどのように進化したのか気になりますね。以前Floraを使っていた時に便利だったのが、たくさんの動画サービスの生成結果をワークスペース上で並べて比較できることでした。もしSuperstudio Proでも同じような機能が実装されていれば、さらに使い勝手が良くなるのですが、検証していこうと思います。

Hailuo『I2V-01-Director Model』誰でも入手可能に

以前紹介したDirector Modelが、Hailuoから正式に公開されています。テキスト+ 画像で映画のような動画が制作できる点に注目ですね。

ByteDance 『OmniHuman-1』のずば抜けた表現力

ByteDanceのOmniHuman-1が、口へのフィット感や顔認識の精度など凄い表現力で驚いています。OmniHuman-1は実際に触ってみたいと思います。

Googleの動画生成モデル『Veo 2』がFreepikで利用可能に!

Googleが開発した高品質な動画生成モデルVeo2が、素材プラットフォームFreepik上で利用できるようになりました。これにより、誰でも直感的に映像コンテンツを生成できる環境が整いつつあります。AIによる映像制作のハードルがさらに下がり、クリエイティブな表現の幅が広がる注目のアップデートです。

1本の動画からスタイルと動きを学習!注目フレームワーク『Dynamic Concepts』

Snap Researchが公開したDynamic Conceptsは、1本の動画から見た目(ルック)と動き(モーション)を学習し、新たな動画を生成できるフレームワークです。IP Adapterの動画版のようなアプローチで、少ない入力から個性ある映像を再構築できる点が非常に興味深いです。映像制作の自由度を大きく広げる可能性があり、今後の応用にも期待が集まっています。

▼この記事の監修
takio koizumi
デジタルアーティスト。デジタルハリウッド大学で3DCGを学ぶ。大学院修了後、VFXアーティストとして約10年間、映画・アニメ・ゲームなど多彩なジャンルの作品を手がける。近年はAIに精通し、生成AI技術を取り入れたワークフローを研究し発信している。
HP: https://sites.google.com/view/takio-koizumi/link

関連記事一覧