私的AI研究会 > ComfyUI9c
「ComfyUI」を使ってローカル環境でのAI画像生成を検証する
| 「LTX-2の日本語サポートはかなり不安定ですが、日本語を上級レベルで話せる人で、十分な忍耐力があれば、本物の日本語音声を生成することは可能」という記事を見つけたので進化版「LTX-2.3」の日本語プロンプト入力について検証してみる |
| 指定した発話内容 |
| 『え?何?』 『彼女できないから、作ったことを LTX-2 で生成してんの?』 『めっちゃキモいんだけど!』 『ていうか、16GBだよ?』 『こいつ、ちゃんとした グラボ すら買えねえ!』 『やだ。絶対無理。』 |
| ① 5秒 生成時間:06:18.00 (378.00s) | ② 10秒 生成時間:09:35.41 (575.41s) |
| ③ 15秒 生成時間:12:38.39 (753.39s) | ④ 20秒 生成時間:18:30.48 (1110.48s) |
| Prompt ①~④ | |
| 黒髪黒い目の日本人の女の子がカメラを見て「え? NANI?」と言いました。ショックを受けた表情で。それから彼女は少し立ち止まって、好奇心旺盛な口調で「カノジョデキナイからモテのことをエルティエックスツーでせいせいしてんの?」と尋ねます。彼女は少し立ち止まり、うんざりした口調と表情で「メッチャキモイんだけど」と言った。彼女は少し間を置いてから、がっかりした表情で「てゆうかさぁ!ナニがジュウロクギガだよ」と小さな声で言いました。そして、彼女は怒りに満ち溢れ、「こいつとやったグラボすら返してねぇ!!!」と叫びます。彼女は落ち着きを取り戻し、静かな声で首を横に振り、「やだ。絶対むり。」とささやきます。彼女の唇と口は彼女の言葉と同期して動き、目は生き生きと動き回っています。彼女の感情状態は、パニック、混乱、そして嫌悪感です。 | |
| ⑤ 20秒(プロンプト変更) 生成時間:20:40.38 (1240.38s) |
| Prompt ⑤ (変更ヶ所) |
| 実写映画。黒髪黒い目の日本人の女の子がカメラを見て「え? NANI?」と言いました。ショックを受けた表情で。それから彼女は少し立ち止まって、好奇心旺盛な口調で「カノジョデキナイからモテのことをエルティエックスツーでせいせいしてんの?」と尋ねます。彼女は少し立ち止まり、うんざりした口調と表情で「メッチャキモイんだけど」と言った。彼女は少し間を置いてから、がっかりした表情で「てゆうかさぁ!ナニがジュウロクギガだよ」と小さな声で言いました。そして、彼女は怒りに満ち溢れ、「こいつとやったグラボすらカエシテねぇ!!!」と叫びます。彼女は落ち着きを取り戻し、静かな声で首を横に振り、「やだ。絶対むり。」とささやきます。彼女の唇と口は彼女の言葉と同期して動き、目は生き生きと動き回っています。彼女の感情状態は、パニック、混乱、そして嫌悪感です。 |