IT・AI・DX,人の心と行動,日々雑感

音声入力は十分に実用的になった

スマホ等での音声入力

私はキーボード入力をする時、どうしても画面を見てしまうし、ミスタッチも多いので、昔から音声入力にひかれていた(改めてブラインドタッチをマスターしようとしてもなかなかうまくいかない)。これまでも音声入力のソフトは色々あったが、変換精度に劣るし、いろいろと使いにくくて、実用的ではなかった。
しかし4、5年前から、AI技術が導入されてこれが実用的になったことを感じさせることが色々とあり、野口 悠紀雄さんの「話すだけで書ける究極の文章法 人工知能が助けてくれる!」を読んでもその感を強くしていたが、全ての長文の入力を「スマホ+google document」ですることには、慣れて使いこなすのに若干の学習が必要だし、面倒くさいこともあって、やはり抵抗があった。忘れていたが、その頃「音声入力で文章を作成する(暫定版)」、「Googleのシステムを利用して仕事をする」という記事を作成していた。
その後も、wordに音声入力機能が装備されたり、googleの音声変換機能を用いたソフトも開発されたが(これらは主としてパソコン)、パソコンを前にするある限定された場面でしか入力出来ないことから、時折利用はするが、全面的にという気にはならなかった

AutoMemo(オートメモ)というツール

しかし、今回、ポケトークを販売しているソースネクストから、AutoMemo(オートメモ)という新しいツール(録音した音声ファイルを自動でテキスト化できるボイスレコーダー。本体サイズ約130×41×12mm(高さ 幅 厚さ)、本体重量約86g。大きさとしては適当で十分に軽い。)が販売された。テキスト化は、録音したデータをクラウドに送り 、そこでテキスト化されたデータをスマホ(タブレット)で音声と共に利用することができる。同時にメールを設定をすれば(例えばGmail)、そこにテキストが送付されるのでパソコンで加工できる(こちらが本筋だろう。)。通信には、Wi-Fiの設定が必要である。

変換精度はgoogleと共に進化するし、使い心地は悪くない。AUTO MEMO(オートメモ)の録音を停止し(送信し)てから、スマホにデータが来るのは、瞬時というわけではないが、そんなに時間はかからない。もっとも長時間録音したものを一回で送信すればある程度時間は係るだろう(適宜、録音を停止しながら送信するのがいい。)なおGoogle を使うから、句読点は入力されない。

私は長文の文書作成がメインだから、「十分に実用的」と評価できるが、対話や会議の録音の文字起こしは、入力する音声の質、入力状態の問題があるから、どこまで実用的かは、少し情報を集めて判断いただくしかない。

機械本体の使い方の説明が不親切である

このツールを使うについての、Wi-Fiの設定とかアプリのインストール、その設定等についての説明は問題ないのだが、機械本体の使い方の説明が(多分)見当たらず、不親切である。

オートメモ


①機械本体について、最初起動させるときにどのくらいの時間右横の電源ボタンを押すのか(2、3秒)、押すとどういう状態になるのか(丸枠の外側が光って右にくるくる回り最後に外側が丸く光る(写真の状態。電源下のボタンが緑につく)→これで電源が入った。
②録音を開始するのは、真ん中を丸(うっすらと見える)を押すと外側が少し光って右に回り、真ん中の丸が光る→これで上側のマイクにしゃべればいい。
③録音を停止するには真ん中の丸を押すと丸が点滅し外側が丸く光る→これで録音が停止した。
④電源を切るには、右横の電源ボタンを少し長めに(3、4秒)押すと、丸枠の外側が光って左にくるくる回り光が消える。

ボタンの感度が良くない状況もあるので、操作がわからないままボタンを押し続けると、暴走して光ったまま反応しなくなる。私はこういう時の定番である電源ボタンを長時間(数十秒)押すことで電源が切れ、再起動することができた。ただこれに一般性があるかどうかは分からない。機械本体の操作やそれに応じた機械の状態についての説明が見当たらないのは不親切極まりない。

なお連続録音時間は、5.5時間、電源が入った状態で待機できる時間は65時間(充電は150分)との記載がある。だから録音の開始、停止はその都度やった方がいいだろうが、電源のON、OFFはさほど気にする必要はないだろう。

AUTO MEMO(オートメモ)の音声入力を何に使うのか

アイデアや長文の入力と、日記やTO DOの入力

野口 悠紀雄さんには上記の「話すだけで書ける究極の文章法」のほかに、最新作に「書くことについて」がある(詳細目次を後掲)。

これらは、スモホへの音声入力で、文書入力をほとんど全て賄うとして、その場合の「知的作業」の「生産性」を向上させる方法を論じているが、私は、アイデアや長文の入力はオートメモに特化させ(要はある程度の時間、入力のみに専心する。確かに野口さんがいうように、こうしてみると大したことを考えていないことを痛感するが、一方、考えることとは、文字言語に向き合うこととも言えるだろう。それは音声の入力後にたっぷりとやることになる。)、日記やTO DOの入力については、スマホのクラウドを利用したアプリへの文字入力でするのがよいと思う(私は日記である「Journey」を使っている)。短文は、仮想キーボードの方がやりやすいし、声が出しにくい環境でも使える。

今後の知的生産

野口さんの本は、出発点が多少違うこともあって、内容には異論もある。それは追々分析していこう。当面、私は最近使い始めた「 Paperpile 」の紹介をしようと思う。

英語はどうだろう

ところで、オートメモは多くの外国語にも対応しているというので、英語の文字起こしをしてみよう。ここでは、Great Courses Plusの「OUR NIGHT SKY」という講義の冒頭部分をオートメモで録音して実験してみた。音声は次に挿入する。本当は画像付き音声でやりたいのだが、自宅環境なので、それは後回しにしよう。

OUR NIGHT SKYの冒頭部分

Using both students and the general public to the wonders of the night sky Murphy previously taught at the Johns Hopkins University where you work closely with Nessa on it’s for ultraviolet spectroscopic Explorer mission.
Welcome to the course our night sky my motivation for creating.
This course comes from years of experience showing people the night sky truly skytours many people have told me that they would like to know more about constellations their mythology the stars in the interesting objects that they can see in the constellations in a pair of binoculars or a small telescope expresses a feeling shared by many people did not somebody teach me the constellation and make me at home in the starry Heavens which are always overhead in which I don’t have no to this day.
My goal is to introduce you to the beauty and wonder of the night sky in the give you a basic knowledge needed to feel more comfortable navigating the sky and by the end.
I hope that you will feel more at home in several respects, which will be combining throughout the course.
The first is I would like you to know the constellations and their mythology so that season after season when you see them in the skyBaby, you’re good friends.
I’d like you to be able to notice features that you can see with the naked eye right to a little bit about the relevant science and physics of cosmology and astronomy that you can see in our night sky.
Now after two lectures of introductory material on the sky and its motions, I’ll give you advice in the Third on using binoculars and telescopes in the fourth lecture will learn about the Motions of the sun and the moon in the sky.

どうだろうか。時々脱落したり、区切りがおかしかったりするが、まずまずではないだろうか。ところで外国語への対応は、アプリの端末設定の言語設定でするのだが、日本語のまま送信すると「分かんない、バカみたい」とか表示されるが、英語に設定し直すと英語へのテキスト化をし直す、ただしメールは再度は来ないようなので、テキスト化されたものをアプリから別のエディター等に貼り付ければ良い(上記もそれだ。)。この場合、時間の使用は多分ダブるのだろう(最初から英語に設定すればいいはずだが、ある環境では事後的にしか英語に設定できなかったので、そう言うことが起こると、長時間のテキスト化をする場合は、問題となる。)。ところで、オートメモをきちんと使う場合は、毎月1時間の無料コースでは、話しにならない。月30時間か、10時間毎(ただし翌月への繰り越し可能)で、約1000円の利用料を払うコースに加入することになろう。

詳細目次 書くことについて

ブログ本の森と山ある日々,人の心と行動,日々雑感,法とルール

ブロックエディターは何とかこなせそうだから 

土日から集中してブロックエディターをいじっていたので、何とか私に必要な限りで見通しを得ることができた。あとは、「サイトを作る ぼくたちの失敗」に書いた課題をこなしつつ、思索を深め表現していこう。

再出発 

さて何の思索か。最近、私は、「世界の複雑な問題群」に焦点を定め、空いた時間で「デジタル・テクノロジー(IT・AI・DS)」や「問題解決と創造」の解読に熱中しているが、「世界の複雑な問題群」の解決のために私が提言できるのは、法やルールのあり方(+若干の思い付き)だということだ。これについてある程度の見通しがないと、単なる好事家で終わってしまうだろう。

だから方法論としての数学に加え、法とルールの基礎的な問題について、若干時間を費やしていこうと思う。当然、仕事の役にも立つ。

基礎論は「AI時代の法学入門」から、歴史を遡って基礎的な考察をしてみよう。これは隗より始めよだ。それだけでは、浮世離れしそうだから、弁護士の「実務書」と言われるものを批判的に読んで見よう。まず手始めにこれまでなら絶対に目を通さなかった「起案添削教室」を読んでみようか。

ノートを取って本を読もう

というのも、私は本を読む場合、いわゆる教科書を除き、ほとんどノートを取ってこなかった。これでは思索が深まらないことを最近痛感している。また起案する際も、ぶっつけ本番で、試行錯誤で修正してきた。これも無駄が多い。

このあたりに実践的に考えるべき問題があるように思う(例えば「独学大全:読書猿」。そこでウンウン考え頭を捻る前に、まず軽いのりでノート取りから入ってみよう。若い弁護士と裁判官が書いた「起案添削教室」を、ノートを取って読もうというのはいい心がけだ。内容はどうだったかは追ってだ。

こんな曲が好きなのはどうなんだろう

ところで、私は、「ブロックエディターを使う1」から、「永遠の嘘をついてくれ」「外は白い雪の夜」「ファイト!」「ぼくったちの失敗」と、どうみても酔っ払わないと歌えないような少し恥ずかしい歌をサイトに載せてきたが、今回が最後で「M」だ。要は、Mこと私が、再出発しようというわけだ。しかしこれが一番恥ずかしいかな。

載せるなら、俳句か、和歌がいいか。

IT・AI・DX,ブログ本の森と山ある日々,問題解決と創造の知識,日々雑感

対応が必要な問題 備忘録

失意
失意

近々、このサイトにおいて対応が必要な問題を纏めておこう。要は、「僕たちの失敗」の記録だ。

Q1 サイト作りを手伝ってもらうにはどういう設定をしたらいいのか

Q2 フロントページに最新の投稿1つと、あと最近の投稿の抜粋を載せるにはどうしたらいいのか?

Q3 「続きを読む」と「改ページ」を使い分け、記事内リンク方法を確認する。

Q4 リンクエラーが膨れ上がっている。「Broken Link Checker」での修正方法を調べ、修正していこう。

Q5 見出しの修飾を工夫しよう。ダッシュボードの「Luxeritas」の「子テーマの編集」「スタイルシート」にCSSを書く。デザイン選択をコードを参考にしよう。

回答・実践の記録

さあそろそろ仕事に戻ろう 

再出発 M

これもよく歌ったなあ