私的AI研究会 > ComfyUI8

画像生成AI「ComfyUI」8(効果音編) == 編集中 ==

 「ComfyUI」を使ってローカル環境でのAI音楽生成を検証する

▲ 目 次
※ 最終更新:2026/01/11 

「ComfyUI」MMAudio による効果音生成

「MMAudio」を使って動画から効果音を作成してみる

プロジェクトで作成するワークフロー

効果音生成のための環境構築

  1. モデルをダウンロードする
    サイト:Kijai/MMAudio_safetensors on Hugging Face から次の 4つをダウンロード
    ・mmaudio_large_44k_v2_fp16.safetensors
    ・mmaudio_synchformer_fp16.safetensors
    ・mmaudio_vae_44k_fp16.safetensors
    ・apple_DFN5B-CLIP-ViT-H-14-384_fp16.safetensors

  2. 「/StabilityMatrix/Data/ComfyUI/models/mmaudio/」に配置する
    ※ 共有モデルのフォルダではなくパッケージ固有のモデルフォルダに入れる

  3. 「ComfyUI-MMAudio」カスタムノードをインストール

    ⑪「Manager」ボタンを押し「ComfyUI Manager」から「Custom Nodes Manager」を選択
    ②「 ComfyUI-MMAudio 」カスタムノード を検索。「Install」を押す
    ③ バージョン番号を選択
    ④ インストールが完了すると、ComfyUI の再起動を求められるので、下部の「Restart」ボタンを押す
    ⑤「Confirm」(確認)ボタンを押すとインストール開始する
    ⑥ インストール完了すると再度確認ウインドウが開く(別のウインドウがオープンするので閉じる)
    ⑦ 前のブラウザ画面で「Confirm」(確認)ボタンを押す
    ⑧「ComfyUI Manager」でインストール完了を確認してブラウザと「Stability Matrix」を一旦終了する

    ← インストール完了の状態

最初のステップ:添付のサンプルを動かす

  1. ワークフローのテンプレートを読み出す
    ワークフローのある場所:「ComfyUI/custom_nodes/comfyui-mmaudio/example_workflows/mmaudio_test.json」


    ⑪ カスタムノードのモデルを確認する
     ・モデルをクリックして配置した 4つのモデルが表示されれば OK
    ② 入力動画をカスタムノードにドラッグ&ドロップする
    ③「Run」を押して生成開始
    ・途中でダイアログ↓が表示された場合は閉じて再度「Run」を押す





    ④「mmaudio_test」としてワークフローを保存
     ※ ワークフロー:「_audio/」filemmaudio_test.json

  2. 生成結果(音声付き動画)

静止画から音声付き動画を作成

ここまでの検証結果

 

更新履歴

 

参考資料