音声入力の仕組み自体は、いままでも何回も利用してきました。
今回、違うのは、既存の録音された音声(MP3など)ファイルから文字おこしができることなのです。
(厳密にはファイルを読み取るのではなく、Mac内で再生中の音声を音声入力の音源として利用できるようになった、ということです)
ちょっとづつ録音し続けた音声ファイルを秘書(Mac)に渡せば、文字おこしをしてくれるのです。
夢のような話が実現した瞬間でした。
Chromeでないとダメ
記事を見てすぐに試してみたのですが、なぜかうまく行かず、何でだろう?と疑問に思う日々が続き。
最近になりようやくできるようになったのです。
なぜかというと
Vivaldi(Chrome互換です)という最近流行りのブラウザーを使っていたからでした。互換ブラウザーじゃだめで、あくまで生粋のGoogleChromeを使わないとダメだったのです。
自動入力には感動するのだが……
やり方は、こちらを参照いただくとして↓、
https://walkingmask.hatenablog.com/entry/2017/01/16/134819
感想をいくつか。
1,感動もの
出来たときは、感動ものでした。何もしないのに、画面に自動的に文字が入力されていきます。
スゴイ。
(汚い動画ですがニュアンスを掴んでいただければと作ってみました)。
近未来を見ているよう。
これぞまさしくAI時代の未来を予感させるものだと感じました。
2,変換性能は今一歩
しかし、
句読点、改行などは認識しませんし、変換精度もそれほど良いとは思わない。
70点くらいの出来でしょうか。
ただ、無料でここまでできればスゴイですよ。
3,時間制限はない?
特に時間制限はなさそうです。
MacやiPhoneの音声入力アプリに時間制限がある(数分で入力が止まる)ことを考えると、これは強力なアドバンテージです。リアルタイムの音声入力にも使えそうです。
ただし、Googleドキュメント画面がアクティブ状態でないと音声入力はストップしますから、先に音声を再生スタートさせてから、Googleドキュメント側で入力をスタートしなければなりません。
このへんが、ちょっと面倒です。
4,手直しが必要
先程書いたように改行や句読点は打ってくれないので、文字の塊が、ズラーッとでてくるので、入力後には手作業で形を整えていく必要があります。
それを考えると、まだまだ効率面ではイマイチという感じがします。
ファーストドラフトには使える
とはいえ
まとまった記事を書く時、
細かいテニオハは置いといて、とにかく最後まで記事という体裁に仕上げることが求められるのですが(それをファーストドラフトと言う)、
それには使えそうです。
入力した文章は使えなくてもいいのです。
「ファーストドラフトは終わったのだ」と思える事自体が精神的に前進です。
感想まとめ
「音声入力だけで一本の書籍を執筆しました……」
自慢して言われる方がおられますが、どうかな〜。
できないことはありませんが、本音をいうと、まだそれが効率的とは言い難い気がします。最初からキーボードを叩いたほうが今の僕には圧倒的に記事は早く作れます。
効率的にできるとしたら、それは、秘書がいて手直しをしてくれたり、バックアップ体制が十分な人(大学の教授とか)に限られるように思えるのですが。
とはいえ、トライしていかないと未来は開けないので、今後も行き着くところまでこの音声入力を使い倒してみたいと思います。