2019年3月5日火曜日

自動文字おこし



そういつもではないが、文字おこしをする事がある。かなり面倒な作業だ。音源が日本語ならまだしも、英語だともうお手上げ。
だが、最近音声入力の精度が非常に良くなっている事に気付いた。google docの音声入力の精度はかなりなものだ。しかし、これは基本マイクで話した言葉で入力する機能だ。文字おこしの場合、録音やビデオから音を入れなければならない。何とかならないかなっと思ったら、方法があった。パソコン内部で音声の出力と入力をつなぐ、virtual cableと言うソフトだ。(windowsの場合。Macはsound flowerと言うのがあるらしい) これを使うと、マイクやスピーカーのディバイスとして認識されるので、これを規定のデバイスにする。あとはプレヤーで音を出して、google docsのvoice typingをonにすればよい。ただし、音声出力と入力をパソコン内部でつないでいるので、スピーカーからは何も聞こえない。
試しにYoutubeを使ってやってみた。音源は英語。

画像が小さくて良くわからないが、ほぼ完璧。ほかの音源も試したが、普通の話言葉くらいのスピードなら追いつく。これは使えそうだ。




0 件のコメント:

コメントを投稿