日々雑感

 謹んで新春のおよろこびを申し上げます。皆様方にとってこの一年が希望に満ちた年でありますように心よりお祈り申し上げます。

 新年です。箱根駅伝を見ると、減量したい人も、老化が気になる人も、さあ運動だと走り出しますが、これがなかなか継続出来ない。

 減量派には、タンザニアに現存する狩猟採集民ハッザ族の研究を踏まえた「運動しても痩せないのはなぜか  代謝の最新科学が示す「それでも運動すべき理由」:ハーマン・ポンツァー」(草思社)をお薦めしましょう。消費カロリー>摂取カロリーで痩せるのは科学的真実ですが、ホモサピエンスの身心における消費カロリーと摂取カロリー相互の複雑な振る舞いから、運動しても痩せないという因果な仕組みを学びましょう。

 それでもとにかく運動は(ウオーキングでも)誰にでもよいそうです。運動は、病気(慢性炎症等)にも、身体の衰えにも、呆け防止にも、万能薬だとこの本だけでなく、「一流の頭脳(運動脳):アンダース・ハンセン」(サンマーク出版)等、多くの最新の研究で紹介されています。でもその場合に最良の効果をもたらす前提は、酒も煙草もやめることらしい。おやおや。

 ところで昨年も紹介した俳句を再掲しましょう。 

                風が吹く仏来給ふけはひあり         虚子

   ここでの仏はあの世をさまようさみしい仏ですが、風が誘う仏は人により様々でしょう。今年の私の仏は、控えめなお酒で広がる素面の時間の読書と瞑想による充足としたいものです。「仏造って魂入れず」、「前途多難」?!

2023年 元旦

弁護士  村 本 道 夫

〒101-0063 東京都千代田区神田淡路町2丁目4番 ユニオンビル4階

カクイ法律事務所

TEL 03-5298-2031 FAX 03-5298-2032

知の方法,IT・AI・DX

キーボードと手書き

学生時代は手書きのノートを使うのが当たり前だったが、仕事を始めパソコンを利用するようになってからは、手書きはヒアリング時のメモ程度になってしまった。しかしいつまでたってもタイピングは、キーボードを見ながらのミスタッチだらけで疲れ果て、手書きメモは乱雑な字で読み返せない。しかもどちらもすぐに散乱して所在不明となるので、文書作成はもストレスの元になるだけだった。この作業環境を改善することは積年の課題だ。

活字画像をテキストデータにする

文字はもともと画像だが、これをパソコンで扱うことのできるテキストデータにすると、所在探し(検索)や、情報処理・加工が容易になる(以下、テキストデータはパソコン画面でコピペできる文字とする)。

そこで①パソコンの外部にあるa手書き画像やb活字画像、②パソコン画面に表示されたb活字画像(やコピペに制限のあるテキストデータ)を、③パソコンで処理・加工ができるテキストデータにしたいが、どうすればよいか。
一番難しいのが①外部にあるa手書き画像を③テキストデータにすることだが、これは最後で取り上げよう。まず、活字画像のルートを考えよう。

パソコン画面の活字画像をテキストデータにする

最初に取り組むべきは、②パソコン画面の活字画像(やコピペに制限のあるテキストデータ)を③テキストデータにすることである。例えば、Kindleの画像本等だ。この方法はいろいろある。ただそれぞれ大なり小なり修正をしなければならないので、修正を少なくする工夫も必要である。

「瞬間テキスト2」

一番手軽なのは、「瞬間テキスト2」というOCR(文字認識)ソフトを使うことだ。「読み取り」をクリックして画面上の任意の文字部分を囲むだけでソフトのj上にテキスト化でき、価格も1,980円と手頃だ。短い文書はこれに限る。日本語+英語だけでなく、中国語、韓国語も読み取れるようだ。精度も2になって上がったような気がする。問題は「画面上の文字を囲む」前にソフトの「読み取り」をクリックするのが全画面表示にしているとできないことや、連続してテキストデータ化できないことぐらいだろうか。

その他の方法

Windows画面はコピーできるモード(Snipping。(windowsロゴマーク+shift+S))にして全画面あるいは任意の文字部分の画像を囲んでコピーできる。それをWORDに貼り付けてPDF形式で保存し、PDFelementというソフトのOCR機能でテキストデータにするという方法もある(OCRソフトは他にもいろいろある。)。連続してやりたいときは、複数のコピーを保存できるソフト(例えば「神コピ!」)を使う。
他にも、無料がよければ、1回毎にPaintに貼り付け、googleドライブに入れてgoogleドキュメントで開く方法もある。面倒だが、精度は相当なものだ。googleレンズを使ってもテキストデータにできる。

外部にある活字画像をテキストデータにする

次に①外部にある活字画像を③テキストデータにするにはどうすればよいか。まず①外部にある活字画像をパソコンで扱えるようにするためにスキャナーを利用する。その上で上記と同じように②パソコン画面の活字画像(のデータ)にして③テキストデータにするということになる。

事務所では

スキャン機能付きコピー複合機で外部にある活字画像(Real本や書類)をPDFないし画像データとしてスキャンしてパソコンに送付し、これを上記したPDFelementというソフトのOCR機能で③テキストデータにする。

自宅では

自宅では、古いスキャン機能付きコピー複合機を再利用しようと思ったが、さすがに活字画像の精度が低いので、スタンド型スキャナー(APEX AXSA4L)を購入してみた。スキャンだけを想定していたのだが、専用ソフトを使ってOCRもできる。ただ最初は少し分かりにくい。私用の備忘メモを作成しておく。
[[スタンド型スキャナーを使う]]

スキャンの違い

事務所のコピー複合機では、連続してスキャンすると一つのPDF文書となり、PDFelementでテキストデータ化できる。自宅のタンド型スキャナーでは、スキャンしていくと別文書になるが、選択して「エクスポート」すると一つの文書になる。

手書きの文書をテキストデータにする

Google レンズを使う

手書きの文書をテキストデータにするOCRは、AIOCRと言われ、現時点では非常に高価である。
しかし、通常使用する場面では、手書きの文書はそれほどの量にはならないので私レベルではGoogle レンズを使えば十分である。スマホ、タブレットで撮影して、Google レンズを使う方法もあるが、おそらくスキャナーで画像化し、パソコンのGoogle レンズを使う方が、使いやすいだろう。

音声をテキストデータにする

ただ考えてみれば、手書きの文書をスキャンーOCRを利用してテキストデータしようとしても、丁寧に文字を書いても変換精度はきわめて不十分である。それを考えれば、手書きの文書に基づいて、口頭で表現し、その音声をテキストデータ化する方がはるかにいいのではないか。音声のテキストデータ化は、Googleでもいい、私は「オートメモ」を使っている。
手書きノートの必要性は別に論じよう。

知の方法,IT・AI・DX,日々雑感

増えすぎたKindle本をどうしよう

多くの人は今でも本屋に出かけ、早足にその本屋が在庫する本の全体像をスキャンし、良さそうなReal本を見繕って買うだろう。しかし、それを頻繁にすると居住空間が物理的に圧迫されることに加え、Real本は整理が難しい。
そこで私はReal本にKindle本があるときは、できるだけKindle本を買う(あるいは買い足す。)。結果、私のKindle本は、5千数百冊となってしまった。こうなると過去にどんな本を購入したか、この本は既に購入したかが分からなくなってしまう。
だからKindle本の一覧を取得し、整理できると便利だ。いろいろな方法が紹介されているが、今の一押しはKindlistだ。
これをインストールして起動し「変換」をクリックするとすぐに(10秒くらい?)に書籍名、出版社、著者、出版日、購入日等のExcelの「Kindle書籍一覧」が作成できる。Excelなので、当然、検索、並べ替えは簡単だ。私は、購入日の新しい順で並び変えている。

Excelの一覧表で整理する

ただ最初に書籍一覧を出力して見て、戸惑う人もあるだろう。人によっては書籍一覧にある本の数が随分多いはずだ。あれ??でも疑問は少しして解消される。ダウンロードだけして購入していない「サンプル」も書籍一覧に含まれているのだ。さてどうしよう。これはしばらく考えあぐねていたのだが、AmazonのWebの「コンテンツと端末の管理」「コンテンツ」「本」のページで、「サンプル」を表示し、不必要な「サンプル」を削除すると、書籍一覧にも表示されなくなる。後に購入したい「サンプル」を残しておきたいときは適宜のデバイスでそれをダウンロードしておけばよい。

検索・抽出した本を利用する

ただ書籍一覧から検索した本の情報を、コピペして利用できるかは別問題だ。これはExcel固有の問題だ。単純に全部検索するのは普通の検索だ。だがこれでは一つずつの検索結果に飛んでしかコピペできない。ある題名が含まれる「書籍名」の一覧を行毎すべてコピペできる状態で抽出するのは次の手順だ。放っておくと忘れてしまう。参考になる記事

1 ファイル(Kindle書籍一覧)を開く。
2 開いたシート(Kindle書籍一覧)の何も含まれない余分な1行目、1列目を全部削除する。
3 新しいシートを作成し、1列目の1,2行(A1セルとA2セル)に項目名(例:書籍名)及び半角のアスタリスクを付けた検索語(例:*人類。この*は全角)を記入する。
4 新しいシート1で抽出したデータを貼り付けたいセル(例:A4セル)を選択する。
5 新しいシート1で、データ→並び替えとフィルター→詳細設定を開き、詳細設定ダイアログボックスが表示されたら・・
①「抽出先」で「指定した範囲」を選択
②「リスト範囲」でシート(Kindle書籍一覧)シート1の全体を選択(一番左上の三角)を含む部分をクリック)して「↑」マークをクリック
③「検索条件範囲」に検索したい条件を記入したセル(書籍名と*人類(A1セルと
A2セル))を選択して「↑」マークをクリック
④「抽出範囲」に抽出したデータを貼り付けたいセル(A4セル))を選択して
「↑」マークをクリック
⑤OKボタンを押す

以上でどうでしょうか。

次は、Real本だが、私は「私本管理」を利用しているが、全然フォローしていない。。追ってまとめよう。