IT・AI・DX,プチ創造

デジタルで変わる日々の知的な作業

最近のデジタルやAIを利用した知的技法の「進化」は目覚ましい。今までこういう話題はだいたいこれをお金にしようとする人が先頭に立っていうだけで、実際はそれほどでもないし、あれこれいじっているうちにストレスがたまるだけということが多かった。だからもう飽き飽きという向きも多いだろうが、最近の「進化」を見ると今もう一度見直してみることには意味がありそうだ。といっても、今盛り上がっているのはあくまで「下拵え」の分野で、本丸の知的活動は依然として「闇の中」だ。
さて、「下拵え」の分野をどういう風に分類しようか。

音声のテキスト化

まず自分が発話することも含め音声を文字化する作業が容易にできることは、神の腕を持つブラインドタッチャーを除けばとても助かることに異論はないであろう。
音声のテキスト化には様々な方法がある。
スマホの音声検索の登場には驚かされた。それから何年も経ち、今、AndroidであればGoogleの音声入力は充分に実用的だが、何に入力してテキスト化するのか。短いメモであれば、私は今、Fast Notionを使っている。長いものであれば有料サービスだが、オートメモがお勧めである。長い会議であれ、英語の動画であれ、かなり正確にテキスト化できる。
文章を作成するために、自分で発話しながらそれを文章化するには、Google Documentを利用するのがいいだろう。短い文章であれば、今私がやっているのは、ライティングマウス(TESS GIFT)を利用する方法である(たまたまJust Systemが販売していた。)。これはパソコンの画面(メモ帳がいい)を見ながらどんどん入力できるのでとても良い。やることはマウスの横にあるボタンをクリックして音声を発することだけである。

画像文字のテキスト化

画像文字としてはパソコンに表示された画像文字と、Real本がある。日本語も英語もあるまずパソコンから。
Windowsの画像文字をクリップボードにコピーする。ただコピーしただけではクリップボードに保存されるだけなので、これを何かのファイルに貼り付ける。そして貼り付けた後でそれをテキスト化するという手順になる。
まず画像文字のファイルをテキストするには、あるフォルダーに収納されたファイルについてそれを個別にあるいはまとめてテキスト化できる「ImageScanOCR」というアプリがある。これは他にもあるだろう。
その前提としてクリップボードにコピーされた画像文字を自動的にファイルにする「ClipboardSaver」というアプリがある。この二つを組み合わせるのがよさそうだ。
例えばクリップボードにコピーしたものをワードに貼り付けそれをPDFとした上でOCRにかけるという方法もあるがこれはいかにも面倒くさい。よくある方法が画像文字のファイルををGoogleドキュメントで開くという方法だが、これもいいのだがその手順がやはり面倒だ。上記の方法が今のところ一番簡単である。
Real本については、スキャンしてテキスト化する。
次の記事を参照して欲しい(手書きメモを活用する-Google レンズの世界 | 弁護士村本道夫の未来の法律事務所))。

翻訳(日⇆英)

文章の翻訳

これはテキスト化された文章を、wordに貼り付けて翻訳するのが簡単だ。PDFは、wordだと形態の崩れが激しいので、Google翻訳の「ドキュメント」でPDFを選択する。長いとできないので、PDFを分割しよう。

音声の翻訳

これもいろいろあるのだろうが、長文であれば音声をテキスト化した上で、翻訳することになろう。
私としては、英語がどんどん読まれる中で、次々と日本語テキストに変換されるサービスはないかと探していた。「英語×IT ITツール活用で英語力10倍へ: 対訳コーパス、辞書、自動翻訳、校正、同時通訳、文字起こし:白辺 陽」や「自動翻訳大全 終わらない英語の仕事が5分で片づく超英語術:坂西 優; 山田 優」というKindle本を見ても、どうもそれは難しそうだった。英語の切れ目を入れてそこまでを翻訳することはスマホの「同時通訳」アプリで可能だが、連続してというところが難しそうだった。
しかし、つい最近、「ポケトーク同時通訳」(外国語での会議に、「ポケトーク同時通訳」|POCKETALK(ポケトーク))というソフトが公開され、それが可能となったようだ。まだまだぎこちないようだが、だんだん進化するだろう。

知的作業を支えるプラットフォーム

これまでに紹介したことは、知的作業の「下拵え」にすぎない。このようにして用意した素材について、これをどのように組立みてて考察・推論していくのかが課題である。
それを実現するのプラットフォームとして2つの「メモ」アプリが考えられる。一つはObsidianでありもうひとつはNotionである。
ただこれらのアプリは使うことが面白くて、趣味的にはまっているという面も確かにあり、れほど知的作業に役立つかは疑問もある。ただよりよく使えば役立つことは間違いない。
まずObsidianは日々の活動を記載することで、全体的な知的活動を切り開くというメモとしていいだろう。これはかなり実現しつつある。
Notionはよくわからないが、どうも仕事のデータベースとして使うのがよさそうだ。NotionAIという機能もある。
いずれにせよ、なかなか楽しい時代になったものだ。

IT・AI・DX,基本的な方法論

キーボードと手書き

学生時代は手書きのノートを使うのが当たり前だったが、仕事を始めパソコンを利用するようになってからは、手書きはヒアリング時のメモ程度になってしまった。しかしいつまでたってもタイピングは、キーボードを見ながらのミスタッチだらけで疲れ果て、手書きメモは乱雑な字で読み返せない。しかもどちらもすぐに散乱して所在不明となるので、文書作成はもストレスの元になるだけだった。この作業環境を改善することは積年の課題だ。

活字画像をテキストデータにする

文字はもともと画像だが、これをパソコンで扱うことのできるテキストデータにすると、所在探し(検索)や、情報処理・加工が容易になる(以下、テキストデータはパソコン画面でコピペできる文字とする)。

そこで①パソコンの外部にあるa手書き画像やb活字画像、②パソコン画面に表示されたb活字画像(やコピペに制限のあるテキストデータ)を、③パソコンで処理・加工ができるテキストデータにしたいが、どうすればよいか。
一番難しいのが①外部にあるa手書き画像を③テキストデータにすることだが、これは最後で取り上げよう。まず、活字画像のルートを考えよう。

パソコン画面の活字画像をテキストデータにする

最初に取り組むべきは、②パソコン画面の活字画像(やコピペに制限のあるテキストデータ)を③テキストデータにすることである。例えば、Kindleの画像本等だ。この方法はいろいろある。ただそれぞれ大なり小なり修正をしなければならないので、修正を少なくする工夫も必要である。

「瞬間テキスト2」

一番手軽なのは、「瞬間テキスト2」というOCR(文字認識)ソフトを使うことだ。「読み取り」をクリックして画面上の任意の文字部分を囲むだけでソフトのj上にテキスト化でき、価格も1,980円と手頃だ。短い文書はこれに限る。日本語+英語だけでなく、中国語、韓国語も読み取れるようだ。精度も2になって上がったような気がする。問題は「画面上の文字を囲む」前にソフトの「読み取り」をクリックするのが全画面表示にしているとできないことや、連続してテキストデータ化できないことぐらいだろうか。

その他の方法

Windows画面はコピーできるモード(Snipping。(windowsロゴマーク+shift+S))にして全画面あるいは任意の文字部分の画像を囲んでコピーできる。それをWORDに貼り付けてPDF形式で保存し、PDFelementというソフトのOCR機能でテキストデータにするという方法もある(OCRソフトは他にもいろいろある。)。連続してやりたいときは、複数のコピーを保存できるソフト(例えば「神コピ!」)を使う。
他にも、無料がよければ、1回毎にPaintに貼り付け、googleドライブに入れてgoogleドキュメントで開く方法もある。面倒だが、精度は相当なものだ。googleレンズを使ってもテキストデータにできる。

外部にある活字画像をテキストデータにする

次に①外部にある活字画像を③テキストデータにするにはどうすればよいか。まず①外部にある活字画像をパソコンで扱えるようにするためにスキャナーを利用する。その上で上記と同じように②パソコン画面の活字画像(のデータ)にして③テキストデータにするということになる。

事務所では

スキャン機能付きコピー複合機で外部にある活字画像(Real本や書類)をPDFないし画像データとしてスキャンしてパソコンに送付し、これを上記したPDFelementというソフトのOCR機能で③テキストデータにする。

自宅では

自宅では、古いスキャン機能付きコピー複合機を再利用しようと思ったが、さすがに活字画像の精度が低いので、スタンド型スキャナー(APEX AXSA4L)を購入してみた。スキャンだけを想定していたのだが、専用ソフトを使ってOCRもできる。ただ最初は少し分かりにくい。私用の備忘メモを作成しておく。
[[スタンド型スキャナーを使う]]

スキャンの違い

事務所のコピー複合機では、連続してスキャンすると一つのPDF文書となり、PDFelementでテキストデータ化できる。自宅のタンド型スキャナーでは、スキャンしていくと別文書になるが、選択して「エクスポート」すると一つの文書になる。

手書きの文書をテキストデータにする

Google レンズを使う

手書きの文書をテキストデータにするOCRは、AIOCRと言われ、現時点では非常に高価である。
しかし、通常使用する場面では、手書きの文書はそれほどの量にはならないので私レベルではGoogle レンズを使えば十分である。スマホ、タブレットで撮影して、Google レンズを使う方法もあるが、おそらくスキャナーで画像化し、パソコンのGoogle レンズを使う方が、使いやすいだろう。

音声をテキストデータにする

ただ考えてみれば、手書きの文書をスキャンーOCRを利用してテキストデータしようとしても、丁寧に文字を書いても変換精度はきわめて不十分である。それを考えれば、手書きの文書に基づいて、口頭で表現し、その音声をテキストデータ化する方がはるかにいいのではないか。音声のテキストデータ化は、Googleでもいい、私は「オートメモ」を使っている。
手書きノートの必要性は別に論じよう。

IT・AI・DX,基本的な方法論,日々雑感

増えすぎたKindle本をどうしよう

多くの人は今でも本屋に出かけ、早足にその本屋が在庫する本の全体像をスキャンし、良さそうなReal本を見繕って買うだろう。しかし、それを頻繁にすると居住空間が物理的に圧迫されることに加え、Real本は整理が難しい。
そこで私はReal本にKindle本があるときは、できるだけKindle本を買う(あるいは買い足す。)。結果、私のKindle本は、5千数百冊となってしまった。こうなると過去にどんな本を購入したか、この本は既に購入したかが分からなくなってしまう。
だからKindle本の一覧を取得し、整理できると便利だ。いろいろな方法が紹介されているが、今の一押しはKindlistだ。
これをインストールして起動し「変換」をクリックするとすぐに(10秒くらい?)に書籍名、出版社、著者、出版日、購入日等のExcelの「Kindle書籍一覧」が作成できる。Excelなので、当然、検索、並べ替えは簡単だ。私は、購入日の新しい順で並び変えている。

Excelの一覧表で整理する

ただ最初に書籍一覧を出力して見て、戸惑う人もあるだろう。人によっては書籍一覧にある本の数が随分多いはずだ。あれ??でも疑問は少しして解消される。ダウンロードだけして購入していない「サンプル」も書籍一覧に含まれているのだ。さてどうしよう。これはしばらく考えあぐねていたのだが、AmazonのWebの「コンテンツと端末の管理」「コンテンツ」「本」のページで、「サンプル」を表示し、不必要な「サンプル」を削除すると、書籍一覧にも表示されなくなる。後に購入したい「サンプル」を残しておきたいときは適宜のデバイスでそれをダウンロードしておけばよい。

検索・抽出した本を利用する

ただ書籍一覧から検索した本の情報を、コピペして利用できるかは別問題だ。これはExcel固有の問題だ。単純に全部検索するのは普通の検索だ。だがこれでは一つずつの検索結果に飛んでしかコピペできない。ある題名が含まれる「書籍名」の一覧を行毎すべてコピペできる状態で抽出するのは次の手順だ。放っておくと忘れてしまう。参考になる記事

1 ファイル(Kindle書籍一覧)を開く。
2 開いたシート(Kindle書籍一覧)の何も含まれない余分な1行目、1列目を全部削除する。
3 新しいシートを作成し、1列目の1,2行(A1セルとA2セル)に項目名(例:書籍名)及び半角のアスタリスクを付けた検索語(例:*人類。この*は全角)を記入する。
4 新しいシート1で抽出したデータを貼り付けたいセル(例:A4セル)を選択する。
5 新しいシート1で、データ→並び替えとフィルター→詳細設定を開き、詳細設定ダイアログボックスが表示されたら・・
①「抽出先」で「指定した範囲」を選択
②「リスト範囲」でシート(Kindle書籍一覧)シート1の全体を選択(一番左上の三角)を含む部分をクリック)して「↑」マークをクリック
③「検索条件範囲」に検索したい条件を記入したセル(書籍名と*人類(A1セルと
A2セル))を選択して「↑」マークをクリック
④「抽出範囲」に抽出したデータを貼り付けたいセル(A4セル))を選択して
「↑」マークをクリック
⑤OKボタンを押す

以上でどうでしょうか。

次は、Real本だが、私は「私本管理」を利用しているが、全然フォローしていない。。追ってまとめよう。