
【AI News 2025.04.30】3D/音楽/音声
3D関連
Tencent『Hunyuan 3D v2.5』、メッシュ品質が大幅向上
中国大手IT企業Tencentの3D生成AI、Hunyuan 3Dのバージョン2.5のサンプルが公開されました。メッシュの滑らかさや精度が大幅に改善されていますね。現時点ではモデル自体の一般公開はされていませんが、3D生成の次なる進化として、正式リリースが待ち望まれます。
『Comfy3D』のアップデートでTripoSG統合。高精度テクスチャ生成も間近
Comfy3Dがアップデートされ、3D再構成モデルTripoSGが統合されました。次回のアップデートでは、MV-Adapterによる高精度なテクスチャ生成への対応も予定されているそうなので今から楽しみにしています。
CSM AIが対話型での3D生成に対応『Chat-to-3D』
しばらく動きが見られなかったCSM AIから、テキストチャットによる3D生成機能Chat-to-3Dが発表されました。GPT-4oによる画像生成のように、自然な対話を通じて3Dモデルを作成できる新しいアプローチです。直感的な操作で立体的なコンテンツが作れるため、3D制作のハードルが大きく下がりそうですね。
Blenderアドオン『Video Depth AI』、動画×奥行きで立体表現が進化
Blender向けのアドオンで、Video Depth AIが登場しました。これは、平面モデルに対して奥行き情報を含んだ動画をマッピングできるツールで、立体的な映像表現が可能になります。NVIDIAのグラフィックボードがあればローカル環境でも処理でき、効率よく高品質な3D演出が実現できる点も魅力です。
音楽/音声関連
プロンプトで音楽の途中でも変化が可能なSuno『v4.5 Smarter Prompts』
AI音楽生成サービスSunoがバージョン4.5へとアップデートされ、プロンプトによって曲の途中からスタイルや曲調を変化させることが可能になりました。動画分野で進化が続くカメラワーク制御と同様、音楽でもより表現豊かな生成が実現。1曲の中に複数の展開を持たせることで、ストーリー性のある楽曲制作が手軽になります。音楽生成の自由度がさらに広がりますね。
Google『NotebookLM』、ついに日本語音声にも対応
GoogleのAIドキュメント要約ツールNotebookLMで、ついに音声概要機能に日本語音声が対応しました!上記Xポストの動画、35秒くらいの箇所を試しに聞いてみてください。NotebookLMで使えるというのがかなりインパクトありますね。
早速”デス・ストランディング”のゲーム内ドキュメントを文字起こしして概要を日本語で会話してもらいましたので、ご興味がありましたら是非ご試聴ください。
バイクとレアメタル素材.mp3
デジタルアーティスト。デジタルハリウッド大学で3DCGを学ぶ。大学院修了後、VFXアーティストとして約10年間、映画・アニメ・ゲームなど多彩なジャンルの作品を手がける。近年はAIに精通し、生成AI技術を取り入れたワークフローを研究し発信している。
HP: https://sites.google.com/view/takio-koizumi/link

