文字起こしや翻訳の関連(Python、アプリなど) 230826

音声認識系ライブラリ
使っていないが参考に残す。
https://dev.classmethod.jp/articles/reazon-speech-transcribe-meeting/


音声認識系ライブラリーの比較。
https://circleken.net/2022/03/post82/

googleとwhisperの比較。
https://harusdia.hatenablog.com/entry/2023/04/05/182652

 

動画からの音声変換
http://www.xucker.jpn.org/pc/ffmpeg_wav.html
次回使う音声認識
https://stackabuse.com/introduction-to-speech-recognition-with-python/
文字起こし系
https://pc.watch.impress.co.jp/docs/column/macinfo/1348868.html
ドキュメントの翻訳
https://www.itmedia.co.jp/bizid/articles/0907/14/news025.html

 

python文字起こしの人認識は難しそう。MLを自作する。
https://skimie.com/articles/6a3bfa82712f59cb6b5a6c1ad7

音声種類認識と各期間を示してくれるpythonのライブラリ。Macでは関連ファイルが入らないので、Windowsで行った。使った。
https://www.ai-shift.co.jp/techblog/1686

Macでsoundfileをimportするのは難しい。AppleSilliconに対応していないライブラリというのは多い。
https://teratail.com/questions/dozadc4cd6tgo1
https://blog.amedama.jp/entry/apple-silicon-python-miniforge

googleの各国言語の設定方法
https://cloud.google.com/speech-to-text/docs/languages?hl=ja

 

Python 正規表現
https://sigotonosozai.com/2020/10/21/resplit/