IT・AI・DX,人の心と行動,日々雑感

音声入力は十分に実用的になった

スマホ等での音声入力

私はキーボード入力をする時、どうしても画面を見てしまうし、ミスタッチも多いので、昔から音声入力にひかれていた(改めてブラインドタッチをマスターしようとしてもなかなかうまくいかない)。これまでも音声入力のソフトは色々あったが、変換精度に劣るし、いろいろと使いにくくて、実用的ではなかった。
しかし4、5年前から、AI技術が導入されてこれが実用的になったことを感じさせることが色々とあり、野口 悠紀雄さんの「話すだけで書ける究極の文章法 人工知能が助けてくれる!」を読んでもその感を強くしていたが、全ての長文の入力を「スマホ+google document」ですることには、慣れて使いこなすのに若干の学習が必要だし、面倒くさいこともあって、やはり抵抗があった。忘れていたが、その頃「音声入力で文章を作成する(暫定版)」、「Googleのシステムを利用して仕事をする」という記事を作成していた。
その後も、wordに音声入力機能が装備されたり、googleの音声変換機能を用いたソフトも開発されたが(これらは主としてパソコン)、パソコンを前にするある限定された場面でしか入力出来ないことから、時折利用はするが、全面的にという気にはならなかった

AutoMemo(オートメモ)というツール

しかし、今回、ポケトークを販売しているソースネクストから、AutoMemo(オートメモ)という新しいツール(録音した音声ファイルを自動でテキスト化できるボイスレコーダー。本体サイズ約130×41×12mm(高さ 幅 厚さ)、本体重量約86g。大きさとしては適当で十分に軽い。)が販売された。テキスト化は、録音したデータをクラウドに送り 、そこでテキスト化されたデータをスマホ(タブレット)で音声と共に利用することができる。同時にメールを設定をすれば(例えばGmail)、そこにテキストが送付されるのでパソコンで加工できる(こちらが本筋だろう。)。通信には、Wi-Fiの設定が必要である。

変換精度はgoogleと共に進化するし、使い心地は悪くない。AUTO MEMO(オートメモ)の録音を停止し(送信し)てから、スマホにデータが来るのは、瞬時というわけではないが、そんなに時間はかからない。もっとも長時間録音したものを一回で送信すればある程度時間は係るだろう(適宜、録音を停止しながら送信するのがいい。)なおGoogle を使うから、句読点は入力されない。

私は長文の文書作成がメインだから、「十分に実用的」と評価できるが、対話や会議の録音の文字起こしは、入力する音声の質、入力状態の問題があるから、どこまで実用的かは、少し情報を集めて判断いただくしかない。

機械本体の使い方の説明が不親切である

このツールを使うについての、Wi-Fiの設定とかアプリのインストール、その設定等についての説明は問題ないのだが、機械本体の使い方の説明が(多分)見当たらず、不親切である。

オートメモ


①機械本体について、最初起動させるときにどのくらいの時間右横の電源ボタンを押すのか(2、3秒)、押すとどういう状態になるのか(丸枠の外側が光って右にくるくる回り最後に外側が丸く光る(写真の状態。電源下のボタンが緑につく)→これで電源が入った。
②録音を開始するのは、真ん中を丸(うっすらと見える)を押すと外側が少し光って右に回り、真ん中の丸が光る→これで上側のマイクにしゃべればいい。
③録音を停止するには真ん中の丸を押すと丸が点滅し外側が丸く光る→これで録音が停止した。
④電源を切るには、右横の電源ボタンを少し長めに(3、4秒)押すと、丸枠の外側が光って左にくるくる回り光が消える。

ボタンの感度が良くない状況もあるので、操作がわからないままボタンを押し続けると、暴走して光ったまま反応しなくなる。私はこういう時の定番である電源ボタンを長時間(数十秒)押すことで電源が切れ、再起動することができた。ただこれに一般性があるかどうかは分からない。機械本体の操作やそれに応じた機械の状態についての説明が見当たらないのは不親切極まりない。

なお連続録音時間は、5.5時間、電源が入った状態で待機できる時間は65時間(充電は150分)との記載がある。だから録音の開始、停止はその都度やった方がいいだろうが、電源のON、OFFはさほど気にする必要はないだろう。

AUTO MEMO(オートメモ)の音声入力を何に使うのか

アイデアや長文の入力と、日記やTO DOの入力

野口 悠紀雄さんには上記の「話すだけで書ける究極の文章法」のほかに、最新作に「書くことについて」がある(詳細目次を後掲)。

これらは、スモホへの音声入力で、文書入力をほとんど全て賄うとして、その場合の「知的作業」の「生産性」を向上させる方法を論じているが、私は、アイデアや長文の入力はオートメモに特化させ(要はある程度の時間、入力のみに専心する。確かに野口さんがいうように、こうしてみると大したことを考えていないことを痛感するが、一方、考えることとは、文字言語に向き合うこととも言えるだろう。それは音声の入力後にたっぷりとやることになる。)、日記やTO DOの入力については、スマホのクラウドを利用したアプリへの文字入力でするのがよいと思う(私は日記である「Journey」を使っている)。短文は、仮想キーボードの方がやりやすいし、声が出しにくい環境でも使える。

今後の知的生産

野口さんの本は、出発点が多少違うこともあって、内容には異論もある。それは追々分析していこう。当面、私は最近使い始めた「 Paperpile 」の紹介をしようと思う。

英語はどうだろう

ところで、オートメモは多くの外国語にも対応しているというので、英語の文字起こしをしてみよう。ここでは、Great Courses Plusの「OUR NIGHT SKY」という講義の冒頭部分をオートメモで録音して実験してみた。音声は次に挿入する。本当は画像付き音声でやりたいのだが、自宅環境なので、それは後回しにしよう。

OUR NIGHT SKYの冒頭部分

Using both students and the general public to the wonders of the night sky Murphy previously taught at the Johns Hopkins University where you work closely with Nessa on it’s for ultraviolet spectroscopic Explorer mission.
Welcome to the course our night sky my motivation for creating.
This course comes from years of experience showing people the night sky truly skytours many people have told me that they would like to know more about constellations their mythology the stars in the interesting objects that they can see in the constellations in a pair of binoculars or a small telescope expresses a feeling shared by many people did not somebody teach me the constellation and make me at home in the starry Heavens which are always overhead in which I don’t have no to this day.
My goal is to introduce you to the beauty and wonder of the night sky in the give you a basic knowledge needed to feel more comfortable navigating the sky and by the end.
I hope that you will feel more at home in several respects, which will be combining throughout the course.
The first is I would like you to know the constellations and their mythology so that season after season when you see them in the skyBaby, you’re good friends.
I’d like you to be able to notice features that you can see with the naked eye right to a little bit about the relevant science and physics of cosmology and astronomy that you can see in our night sky.
Now after two lectures of introductory material on the sky and its motions, I’ll give you advice in the Third on using binoculars and telescopes in the fourth lecture will learn about the Motions of the sun and the moon in the sky.

どうだろうか。時々脱落したり、区切りがおかしかったりするが、まずまずではないだろうか。ところで外国語への対応は、アプリの端末設定の言語設定でするのだが、日本語のまま送信すると「分かんない、バカみたい」とか表示されるが、英語に設定し直すと英語へのテキスト化をし直す、ただしメールは再度は来ないようなので、テキスト化されたものをアプリから別のエディター等に貼り付ければ良い(上記もそれだ。)。この場合、時間の使用は多分ダブるのだろう(最初から英語に設定すればいいはずだが、ある環境では事後的にしか英語に設定できなかったので、そう言うことが起こると、長時間のテキスト化をする場合は、問題となる。)。ところで、オートメモをきちんと使う場合は、毎月1時間の無料コースでは、話しにならない。月30時間か、10時間毎(ただし翌月への繰り越し可能)で、約1000円の利用料を払うコースに加入することになろう。

詳細目次 書くことについて

ブログ本の森と山ある日々,人の心と行動,日々雑感,法とルール

ブロックエディターは何とかこなせそうだから 

土日から集中してブロックエディターをいじっていたので、何とか私に必要な限りで見通しを得ることができた。あとは、「サイトを作る ぼくたちの失敗」に書いた課題をこなしつつ、思索を深め表現していこう。

再出発 

さて何の思索か。最近、私は、「世界の複雑な問題群」に焦点を定め、空いた時間で「デジタル・テクノロジー(IT・AI・DS)」や「問題解決と創造」の解読に熱中しているが、「世界の複雑な問題群」の解決のために私が提言できるのは、法やルールのあり方(+若干の思い付き)だということだ。これについてある程度の見通しがないと、単なる好事家で終わってしまうだろう。

だから方法論としての数学に加え、法とルールの基礎的な問題について、若干時間を費やしていこうと思う。当然、仕事の役にも立つ。

基礎論は「AI時代の法学入門」から、歴史を遡って基礎的な考察をしてみよう。これは隗より始めよだ。それだけでは、浮世離れしそうだから、弁護士の「実務書」と言われるものを批判的に読んで見よう。まず手始めにこれまでなら絶対に目を通さなかった「起案添削教室」を読んでみようか。

ノートを取って本を読もう

というのも、私は本を読む場合、いわゆる教科書を除き、ほとんどノートを取ってこなかった。これでは思索が深まらないことを最近痛感している。また起案する際も、ぶっつけ本番で、試行錯誤で修正してきた。これも無駄が多い。

このあたりに実践的に考えるべき問題があるように思う(例えば「独学大全:読書猿」。そこでウンウン考え頭を捻る前に、まず軽いのりでノート取りから入ってみよう。若い弁護士と裁判官が書いた「起案添削教室」を、ノートを取って読もうというのはいい心がけだ。内容はどうだったかは追ってだ。

こんな曲が好きなのはどうなんだろう

ところで、私は、「ブロックエディターを使う1」から、「永遠の嘘をついてくれ」「外は白い雪の夜」「ファイト!」「ぼくったちの失敗」と、どうみても酔っ払わないと歌えないような少し恥ずかしい歌をサイトに載せてきたが、今回が最後で「M」だ。要は、Mこと私が、再出発しようというわけだ。しかしこれが一番恥ずかしいかな。

載せるなら、俳句か、和歌がいいか。

人の心と行動,本の森,組織の問題解決,複雑な問題群

夜長に読むこの10+2冊

よそに鳴る夜長の時計数へけり  杉田久女

孫娘の「けろけろ時計」の不規則に叫ぶ「実家にカエラセテいただきます」、「この部屋好きケロ」、「夢は自分で見つケロ?」との声を数えながら、秋の夜長に読むこの10冊を選んでみた。というより、今このWebに手を入れていて大分形ができてきたが、ずらずらと参考本を並べるのはそろそろおしまいにして、柱になる何十冊かの本をしっかり把握して発信していかなくてはならない状況になったと思うので、比較的最近入手して柱にしようと思っている本を10冊選んでみた。これにあと2、30冊付け加えれば、おおよその道筋は開けるだろう。

10+2冊

  • 正義を振りかざす「極端な人」の正体 :山口 真一(Amazonにリンク
  • アフター・リベラル 怒りと憎悪の政治:吉田徹(Amazonにリンク
  1. ソーシャルメディアの生態系:オリバー・ラケット, マイケル ケーシー(Amazonにリンク)(「The Social Organism: A Radical Understanding of Social Media to Transform Your Business and Life」(Amazonにリンク
  2. あなたの脳は変えられる―「やめられない!」の神経ループから抜け出す方法:ジャドソン・ブルワー(Amazonにリンク
  3. BRAIN DRIVEN パフォーマンスが高まる脳の状態とは:青砥瑞人(Amazonにリンク
  4. 集団と集合知の心理学:有馬淑子(Amazonにリンク
  5. 持続不可能性-環境保全のための複雑系理論入門:サイモン・レヴィン(Amazonにリンク
  6. 崩壊学・人類が直面している脅威の実態:パブロ・セルヴィーニュ, ラファエル・スティーヴンス(Amazonにリンク
  7. Come On! 目を覚まそう!―ローマクラブ『成長の限界』から半世紀 ~環境危機を迎えた「人新世」をどう生きるか? :エルンスト・フォン・ワイツゼッカー,アンダース・ワイクマン(Amazonにリンク
  8. 出現する未来から導く ― U理論で自己と組織、社会のシステムを変革する :C・オットー・シャーマー, カトリン・カウファー(Amazonにリンク
  9. 経営改革大全 企業を壊す100の誤解 :名和高司(Amazonにリンク
  10. ビッグ・ピボット ― なぜ巨大グローバル企業が〈大転換〉するのか :アンドリュー・S・ウィンストン(Amazonにリンク

 

簡単なコメント

最初の2冊は「柱」ではなく、最新のネットとそれを大きな原因とする混乱した現在の政治の情況を把握するための情報本である。そうすると10冊にはあと2冊だが、それは最近別に投稿記事にしている「集団と集合知の心理学:有馬淑子」と「BRAIN DRIVEN パフォーマンスが高まる脳の状態とは:青砥瑞人」を加えることにしよう。

ⅰは、上記2冊の震源ともいえるソーシャルメディアのプラス面とマイナス面を新しい世代の感覚として取り上げており、検討に値する。

ⅱは、「やめられない! 」の神経ループから抜け出す方法!を「マインドフルネス」から解明する非常に説得力のある依存症脱却(及び目標達成)の基本とするに足りる本、ⅲはそれをもう少し細かく脳の機能と結び付けて説明する本、ⅳは、集団(組織)を社会的認知も含めて解説し、更に新しい科学的方法も簡潔に説明してくれる親切本である。ここまでが、現実、個人、組織を捉える基本的な観点を得ることの出来る本である。

ⅴからⅷは、持続可能性を論じた本である。なお持続可能性については、様々なアクセスがあるので、一概に論じられないが、私はローマクラブ-システム思考系が十分な検討をしていると考えているので、それ(ⅶ、ⅷ)を紹介する。
ⅴは今までまったく私の視野に入っていなかった本で、著者は数理生物学の専門家で複雑系と持続可能性をつなぐ議論が期待できそうである(ただ字も小さいし難解そうである。これを読まずして何を読むかという気概で挑もう。)。ⅵは、フランスの学者の本で「自然環境、エネルギー、社会システム、農業、金融…など多くの分野で、現行の枠組が崩壊間際になっている現状をデータとともに提示する驚嘆のレポート」という紹介だが、冷静に読むこむ必要がある。
ⅶはローマクラブのメンバー(ドネラらではない)の最新作で、資源、気候、情報、資本主義等々について、最新の議論を展開している。持続不可能性を理解するこの1冊といえば、これだろう。
ⅷはシステム思考を進化させたU理論で、自己と組織、社会のシステムを変革しようというもの、私にとっては大分先の話しだ。

ⅷもビジネスを含んでいるが、視野は広い。持続可能性をにらみつつ、これからのビジネス論を展開しているのが、ⅸである。持続可能性をどう考えるかは「人それぞれ」としても、ビジネスの今後を考えるには、ⅸは不可欠な重要書だと思う。

それぞれの本の各論は、これから順次作成していくとして、この記事では詳細目次だけ掲載しておこう。

詳細目次

次の頁に掲載します。