私的AI研究会 > Speech

音声認識 / 音声合成 == 編集中 ==

audio.png

 日本語の 音声認識 / 音声合成を検証する

※ 最終更新:2024/11/12 

音声認識

音声認識『SpeechRecognition』

音声サンプル作成手順

  1. YouTube から適当なサンプルをダウンロード(例:吉村大阪府知事 定例記者会見(令和6年9月4日))
    (py38_learn_test2) cd /anaconda_win/workspace_2/mylib2
    (py38_learn_test2) python ytb_down.py 'https://youtu.be/UGoYMe7qcBY'
  2. サンプルをダウンロードファイルを切り取る(4秒/3秒)
    (py38_learn_test2) ffmpeg -i '吉村大阪府知事 定例記者会見(令和6年9月4日) [UGoYMe7qcBY].webm' -ss 00:00:00 -t 00:04:00 -async 1 yoshimura.mp4
    (py38_learn_test2) ffmpeg -i '吉村大阪府知事 定例記者会見(令和6年9月4日) [UGoYMe7qcBY].webm' -ss 00:00:00 -t 00:03:00 -async 1 yoshimura.mp4
  3. 「.mp4」から音声ファイル「.wav」を作成
    (py38_learn_test2) python my_videotool.py 60 yoshimura3.mp4 yoshimura3.wav
    ▼ 実行ログ

音声認識アプリケーション

 

音声合成

音声合成『pyttsx3』

 

対処した問題点とエラー詳細

 

更新履歴

 

参考資料