サイバーな都市のイラスト

【AI News 2025.04.16】画像/音声/動画/3D関連

画像関連

Freepikが超速対応!『Kling 2.0』と『Composition Reference』を同時サポート!

素材プラットフォームのFreepikが、画像生成モデルKling 2.0と新機能のComposition Referenceへの対応を、驚きの速さで発表しました。Kling 2.0をFreepik上でそのまま使える環境が整ったので、Freepikのクレジットを持っているユーザーは、さっそく検証や活用してみましょう。

またすごいの出してきた!万能画像生成フレームワーク、ByteDance『UNO』公開

ControlNetやOmini、IP-Adapterなどで個別に対応していた画像生成タスクを、ひとつのモデルに統合したユニバーサルフレームワークUNO。処理を1モデルで完結できるのは、手間が減り、より効率的なワークフローが実現できるので、非常にありがたいアップデートです。

『Pika』のTwists機能、ついに全ユーザーに開放!

Pikaに新機能Twistsが追加され、全ユーザーに向けて公開されました。Twistsを使うことで、他の部分はそのままに、動画内のキャラクターやオブジェクトを自由にコントロールできるようになります。映像表現の自由度が一気に高まる追加機能ですね。

音声関連

無料AI音声合成ソフト『AivisSpeech』がアップデート!ver 1.1.0-preview.3が公開

無料で使えるAI音声合成ソフトAivisSpeechが、バージョン1.1.0-preview.3へとアップデートされました。無料でありながら、自然な音声生成が可能なところが魅力。最近、AI-Systemのマニュアルを読ませたりするために検証し始めた所だったのでありがたいです。音声系のAIツールを探している方にとって非常に心強い存在です。

動画関連

『KLING 2.0』正式発表!Kling AIの進化が止まらない

Kling AIがグローバルローンチイベントにて、待望の最新モデルKLING 2.0を正式に発表しました。高精度な動画生成で注目を集めてきたKlingですが、今回のアップデートでは、動きの滑らかさや構図の一貫性がさらに強化され、表現力が一段と向上しています。やっぱりKlingは強いですね。

Google『Whisk』から Veo2で動画生成が可能に

Googleが、Whisk Animateを発表しました。Veo2を使用すると、Whiskで生成された画像を8秒間のアニメーションクリップに変換できるそうです。Google One AI Premium ユーザーが利用可能です。

Googleの動画生成モデル『Veo2』、Gemini Advancedユーザー向けに公開

Googleの最新動画生成モデルVeo2が、Gemini Advancedユーザー向けに提供開始されました。Veo2は、高精度な映像表現と自然な動きの再現力が特徴。Gemini Advancedは、Googleの上位プランで提供されるAI機能群のひとつで、最先端の映像生成をいち早く体験したい方には必見のアップデートです。

66.5万時間の学習の成果!? ByteDanceの動画生成モデル『Seaweed-7B』がスゴすぎる

ByteDanceが新たに発表した動画生成モデルSeaweed-7Bは、NVIDIA H100をなんと66.5万時間使用してゼロから学習させた超大規模モデルです。1分間の動画生成、2Kへのアップスケール、720p・24fpsのリアルタイム生成など、驚異的な性能になっています。現時点で一般公開の詳細は明かされていませんが、その実力と今後の展開には大きな注目が集まっています。

カメラモーションのミックス機能で表現力アップ『Higgsfield Mix』

Higgsfieldでカメラモーションのミックスが可能になりました。複数の視点や動きを組み合わせることで、よりダイナミックで洗練された映像演出が実現できます。Higgsfieldはカメラワークだけでなく、ビジュアルエフェクトのクオリティも高いのが魅力ですね。

AIによる直感的な動画編集ツール PonderAI『Cursor for Video Editing』

Cursorを活用した動画編集ツールが登場しました。自然言語での指示を通じて動画編集が行えるというもの。テキスト入力で編集操作ができるこの仕組みは、興味深いですね。MCPとAdobe Premiere Proの連携でも同様の操作が実現できれば、制作現場はありがたいですね。

ついに使える!Adobeの『Firefly Video Model』が誰でも試せるように

Adobeが開発する生成AI、Fireflyの動画版Firefly Video Modelがβ版で一般公開され、誰でも利用できるようになりました。現段階ではベータ版ながらも、高速な処理と表現力で注目を集めています。今後、PhotoshopやPremiereとの連携も視野に入れた発展が期待される、今後が楽しみなプロジェクトです。

表情豊かな音声同期アバター生成に対応、Alibabaが『FantasyTalking』を開発中

Alibabaが開発中のFantasyTalkingは、Talking Head系のフレームワークで、自然な口元や視線の動きが特徴です。先週発表されたTencentのACTalkerに続き、中国の大手テック企業による進展が続いていますね。FantasyTalkingは今後モデルの公開も予定されており、今後の展開に要注目です。

3D関連

これは便利!3Dモデルを自動で分割する『HoloPart』

HoloPartは、3Dモデルを自動でパーツごとに分割してくれるフレームワークです。最近、Hunyuanの3D生成ワークフローを組んだので、最後の仕上げにこのモデルを使って、パーツ分までやってみたいと思います。そのうちComfyUI対応するのを期待しています。

Tencentが『Hunyuan 3D』のWebサービスを公開!オープンソースモデルも提供

Tencentの3D生成モデルHunyuan 3Dが、オープンソースとして公開されただけでなく、誰でも使えるWebサービスとしても提供開始されました。ローカル環境での実行が難しいユーザーでも簡単に利用できるのは非常にありがたいポイントですね。

▼この記事の監修
takio koizumi
デジタルアーティスト。デジタルハリウッド大学で3DCGを学ぶ。大学院修了後、VFXアーティストとして約10年間、映画・アニメ・ゲームなど多彩なジャンルの作品を手がける。近年はAIに精通し、生成AI技術を取り入れたワークフローを研究し発信している。
HP: https://sites.google.com/view/takio-koizumi/link

関連記事一覧