音声入力で文章を作成する(暫定版)

2016-12-29

これまで

昔からあまりブラインドタッチが得意でなかった(ミスタッチが多くどうしてもキーボードを見てしまう)ので、時々、思い立ったようにパソコン用の音声入力専用ソフトを買ってきて音声入力を試みていた。
しかし最初に何十分も自分の声を録音して変換精度を上げる作業をしてもも、さほど精度は良くなかったような気がするし、何よりも音声入力にたどり着くまでの過程や事後処理がとても面倒なこと、声を出して作業することが平気な環境を確保するのも大変なこと等から、すぐにやめてしまう。

ただ2、3年前にスマホで音声メモを試してみたところ、事前の録音なしでもとても正確に変換されたことがあったので、 google等の音声入力は十分なレベルに達していると考えていた。

最近、野口悠紀雄氏の「究極の文章法」に目を通し、氏が長文の作成にも音声入力を利用し、十分に実用化になっていると思われたので、だんだん年を取ってキーボードと画面を見比べながら文章を作成することはとても目の負担になり肩もこるので、是非とも音声入力を実現したいと思っている。なお野口氏の本は、抽象的な記述とあまり参考にならない具体的な記述とが混在していてマニュアルとも言えるようなものではない(http://office.noguchi.co.jp/archives/1857に本人による紹介がある。ただそこに記載されている「仕事のスタイルというものは、固定化しがちなものです。その時の最先端の技術に適合した仕事の仕組みをいったん構築すると、それで固定化してしまいます。その後に技術進歩が生じても、それを受け入れなくなるのです。少し便利になったくらいでは、スタイルを変えるのが面倒なので、そのまま続ける。その結果、最初から新しい技術を使う新しい世代に追い抜かれることになります。これを「リープフロッグ(蛙飛び)現象」といいます。」という部分は、何事にも妥当する(しかも技術だけではないだろう。)指摘として貴重である。

具体的な方法

さて音声入力と言っても、長文を作成する場合、メモを作成する場合、さらには音声検索をする場合がある。このうち、音声検索は、多くの人がすでにスマホで実行しているしと思われるし、試してみればわかるが入力は極めて正確だ。大事なのはそのノウハウを正確に身につけできるだけスマートにこれを実行することだろう。これは別に検討することにし、ここでは長文作成、メモ作成について検討する。

メモ作成

まず備忘事項や、アイディアを、いつでも、どこでも入力保存するためのメモの作成には、スマホを利用する。スマホには、Androidtoと iphoneがあるが、前者はgoogleが 、後者はapple が、それぞれ無償の、しかも極めて高性能の音声入力を提供している。ただ現時点では、googleは、句読点、改行等が音声入力ではできないようなので、そこはapple のほうが快適である。ただ、メモ程度であれば一気に入力し、あとで適宜修正すればいいので、気にすることはない(なおこれは音声入力だけの問題であって、以下の記述については全て両方のスマホで利用できる。)。
大事なのは、あるスマホで入力したメモを他のデバイスで自由に加工・利用できるようにすることである。そのためにはクラウドに保存されること、しかも安価であることを条件とすると、無償のgoogle keep がいいのではないか。 google keep で全てのメモを作成し、適宜、アーカイブ、ラベル、メモの色を使いこなせば、十分すぎるメモが作成できる(手書き、録音、写真にも対応している。)。更に種々のアプリへの送信、Google ドキュメントへのコピーもできる(Google ドキュメントで加工できる。)。毎日の備忘的なメモ(日記)も、これが良さそうだ。タイトルに日にちを数字(170101等)で入力し、ラベルを日記にすればよい。

長文作成

長文作成については、スマホで作成したメモを元に加工することもあるが、基本は最初からパソコンで作成することであろう。

まず音声入力で長文作成を実行するには、大きく分けて2つの方法がありうる。一つは昔からある専用ソフトを使うことである。ただこれについては、やはり面倒で、これからその必要性があるかどうかわからない。実は今回、検討の過程で、昔購入したことのあるGoogle の音声認識を利用する voice rep pro というアプリがバージョンアップされていたのでこれを試してみた。一方 google から提供されている google ドキュメントに音声入力をする方法はすでに十分実用化に耐えるレベルである。おそらく録音したものを反訳したい場合にはvoice rep pro がいいのかもしれないが、音声入力しながら文章を作成するについてはかえって面倒で、多分その必要性はない(句読点が入力できないとか改行ができない、誤変換等については、キーボードで修正することで十分である。 )。

従って長文作成についてはパソコンで google ドライブにある google ドキュメントを利用するのがよい。マイクは据え置き型の方が楽なようだ。
以上が、現時点での音声入力を利用した文章作成の方法である。今後この文章については適宜増補改訂していきたいと思う。