音声認識系ライブラリ
使っていないが参考に残す。
https://dev.classmethod.jp/articles/reazon-speech-transcribe-meeting/
音声認識系ライブラリーの比較。
https://circleken.net/2022/03/post82/
googleとwhisperの比較。
https://harusdia.hatenablog.com/entry/2023/04/05/182652
動画からの音声変換
http://www.xucker.jpn.org/pc/ffmpeg_wav.html
次回使う音声認識
https://stackabuse.com/introduction-to-speech-recognition-with-python/
文字起こし系
https://pc.watch.impress.co.jp/docs/column/macinfo/1348868.html
ドキュメントの翻訳
https://www.itmedia.co.jp/bizid/articles/0907/14/news025.html
python文字起こしの人認識は難しそう。MLを自作する。
https://skimie.com/articles/6a3bfa82712f59cb6b5a6c1ad7
音声種類認識と各期間を示してくれるpythonのライブラリ。Macでは関連ファイルが入らないので、Windowsで行った。使った。
https://www.ai-shift.co.jp/techblog/1686
Macでsoundfileをimportするのは難しい。AppleSilliconに対応していないライブラリというのは多い。
https://teratail.com/questions/dozadc4cd6tgo1
https://blog.amedama.jp/entry/apple-silicon-python-miniforge
googleの各国言語の設定方法
https://cloud.google.com/speech-to-text/docs/languages?hl=ja
Python 正規表現
https://sigotonosozai.com/2020/10/21/resplit/