私的AI研究会 > ComfyUI9c
「ComfyUI」を使ってローカル環境でのAI画像生成を検証する
| 「LTX-2の日本語サポートはかなり不安定ですが、日本語を上級レベルで話せる人で、十分な忍耐力があれば、本物の日本語音声を生成することは可能」という記事を見つけたので進化版「LTX-2.3」の日本語プロンプト入力について検証してみる |
| 指定した発話内容 |
| 『え?何?』 『彼女できないから、作ったことを LTX-2 で生成してんの?』 『めっちゃキモいんだけど!』 『ていうか、16GBだよ?』 『こいつ、ちゃんとした グラボ すら買えねえ!』 『やだ。絶対無理。』 |
| Prompt |
| 黒髪黒い目の日本人の女の子がカメラを見て「え? NANI?」と言いました。ショックを受けた表情で。それから彼女は少し立ち止まって、好奇心旺盛な口調で「カノジョデキナイからツクッタことをエルティエックスツーでせいせいしてんの?」と尋ねます。彼女は少し立ち止まり、うんざりした口調と表情で「メッチャキモイんだけど」と言った。彼女は少し間を置いてから、がっかりした表情で「てゆうかさぁ!ナニがジュウロクギガだよ」と小さな声で言いました。そして、彼女は怒りに満ち溢れ、「こいつ、ちゃんとしたグラボすらかえねぇ!!!」と叫びます。彼女は落ち着きを取り戻し、静かな声で首を横に振り、「やだ。絶対むり。」とささやきます。彼女の唇と口は彼女の言葉と同期して動き、目は生き生きと動き回っています。彼女の感情状態は、パニック、混乱、そして嫌悪感です。 |
| ① 5秒 (frame rate: 25, length: 126) 生成時間:04:32.64 (272.84s) | ② 10秒 (frame rate: 25, length: 251) 生成時間:07:40.02 (460.02s) |
| ③ 15秒 (frame rate: 25, length: 376) 生成時間:12:57.58 (777.58s) | ④ 20秒 (frame rate: 25, length: 501) 生成時間:19:22.07 (1162.07s) |
| ⑤ 25秒 (frame rate: 25, length: 626) 生成時間:36:58.18 (2218.18s) |
| 20秒 (frame rate: 24, length: 121) | |
| ⑥ 生成時間:26:48.68 (1608.68s) | 冒頭にプロンプト追加 '実写映画。' 生成時間:21:23.01 (1283.01s) |