IT・AI・DX,プチ創造

ChatGPTとNotion AIとは何か

ChatGPTとNotion AI

せいぜいここ半年ぐらいだが、ChatGPTとNotion AIが話題となっている。ChatGPTとNotion AIは、Web上(前者)、あるいはNotionというメモアプリで(後者)、質問を記述すると、それに対してテキストで回答を返してくれたり、その他様々な文書作成補助をしてくれるるサービスである。

私は、メモアプリとして、Obisidianに加えて、Notionも利用できるかなと思い少し触ってみたら、Notion AIが搭載されていたので、これは何かなと触れてみた。

この記事は、何も知らない私が、ChatGPTとNotion AIに触ってみた「初発の印象」であるが、使えると思えば、今後更に展開してみよう。

なお私は、Notionを利用しようと考えている関係で、Notion AIは有料サービスに加入したが、ChatGPTにダブルで加入するメリットがあるかどうか分からないので、こちらは無料サービスである。

まずNotin AIに、「Notion AIとは何か」、質問してみた。

Notion AIとは何か

「Notion AIは、オンラインドキュメント管理プラットフォームであるNotionに統合された人工知能(AI)です。ドキュメントに関する質問に答えたり、タスクを自動化することができます。例えば、タスクリスト内で重要なタスクを自動的に強調表示したり、締め切りが近づいているタスクを自動的に通知することができます。Notion AIは、ドキュメントの作成や編集の手間を減らし、生産性を向上させるのに役立ちます。」という回答だった。

「続けて」とリクエストすると、内容が補充されるが、Notin AIについては、回答が用意されていて当然なので、今読みかけの本の主題である「メタ認知」について質問してみた。

メタ認知とは何か

「メタ認知とは、自分自身の認知についての知識や理解のことで、自分自身が何に気づいていて、何を知っているかを把握することが含まれます。
メタ認知は、自己理解を深めるために非常に重要です。自分自身がどのように考え、学び、問題を解決するかを理解することで、自分自身を改善するための戦略を開発することができます。特に、メタ認知は、学習や問題解決において、自己調整や自己評価を行うための必要不可欠なスキルです。
メタ認知を発展させるには、以下のような方法があります。
自己観察 – 自分自身を観察し、自分の思考プロセスや感情、行動を理解することが重要です。自己観察は、自分自身に対する内省を促し、自己理解を深めるための重要なステップです。
フィードバックの受け取り – 周りの人々からのフィードバックを受け取ることも、メタ認知を発展させるために重要です。自分自身の強みや弱みを知ることで、自己評価や自己調整がより容易になります。
認知的書き起こし – 自分自身の思考プロセスを書き起こすことで、自分自身の思考をより明確にすることができます。認知的書き起こしは、自分自身の思考プロセスを理解し、改善するための重要なステップです。
メタ認知を発展させることで、自分自身の学習や成長を促進し、より効果的に問題を解決することができます。」。
どうだろう。いずれもぼやっとして記述で、手応えがない。これなら普通に検索した方が良さそうだ。

百人一首の書き出し

次に「百人一首」の書き出しを指示してみた。快調な出だしだったが、60数首のところで止まってしまった。それは何かの制限かもしれないが、問題は、中に数首「間違った」歌が入っていたことだ。これは著作権の問題の可能性がある。どうも何かを書き出すことを指示することにはいろいろと問題がありそうだ。そういえば、Notion AIの提供会社サイドも、文書作成よりも、加工に利用することを想定しているという情報を見たような気がする。

要はNotion AIは、基本的に文書作成作業の補助ツールという位置付と考えるべきだろう。

Notion AIの活用法

Notion AIには、どのような利用法があるのか。もちろんNotionでもアナウンスされているが、ChatGPTとの差異を念頭に逐一確認しているKindle本の「Notion AI超徹底活用ガイド: ChatGPTとの違い・共通点を徹底解説 文書作成・執筆系AIの本命が始動!?:葵 あすか」によれば次のとおりである。使い方次第だろうが、今のところ余りピンとこない。

  • 文章作成支援編
    • 文書作成支援①:「文章を改善する(校正)」
    • 文書作成支援②:「スペルと文法を修正する」
    • 文書作成支援③:「短くする」
    • 文書作成支援④:「長くする」
    • 文書作成支援⑤:「トーンの変更(フォーマル化)」
    • 文書作成支援⑥:「トーンの変更(カジュアル化)」
    • 文書作成支援⑦:「シンプルな表現に書き換える」
    • 文書作成支援⑧:「要約する」
    • 文書作成支援⑨:「翻訳する(英訳)」
    • 文書作成支援⑩:「翻訳する(和訳)」 文書作成支援⑪:「説明を付ける」
    • 文書作成支援⑫:「アクションアイテムを抽出する」
    • 文書作成支援⑬:「続きを書く」
  • 基本活用編
    • 基本活用①:アイデアのブレインストーミング
    • 基本活用②:ブログ投稿文の作成
    • 基本活用③:アウトラインの作成
    • 基本活用④:SNSの投稿文の作成
    • 基本活用⑤:プレスリリースの作成
    • 基本活用⑥:創作ストーリーの生成
    • 基本活用⑦:エッセイの創作
    • 基本活用⑧:詩の創作
    • 基本活用⑨:会議のアジェンダの作成
    • 基本活用⑩:長所・短所のリストの作成
    • 基本活用⑪:職務記述書の作成
    • 基本活用⑫:営業メールの作成
    • 基本活用⑬:求人募集メールの作成
  • 応用活用編
    • 応用活用①:比較と表形式での出力
    • 応用活用②:ダミーデータの作成
    • 応用活用③:クレームに対する対応文の作成
    • 応用活用④:英文メールの返信文の作成
    • 応用活用⑤:エクセル関数を聞く
    • 応用活用⑥:プログラミングコードを聞く

ChatGPTとGPT 4.0

上掲書によると、Notion AIは「回答」を返すのに対し、ChatGPTは「会話」を返す、前者が専門的であるのに対し、後者は汎用的だとされている。多少の差異を除くと似たようなものなのだろう。
ところでみんながChatGPTに触っているうちに、ChatGPTは、GPT 4.0に進化した。つい最近だ。
その中身は、ChatGPTと違う?「GPT-4」使ってみたリアルな感想 | The New York Times | 東洋経済オンライン | 社会をよくする経済ニュースを見るとよいが、非常に「期待」されていることが分かる。

ChatGPT for Google

ところで、ChatGPTの開発会社OPENAI社に、マイクロソフトが多額の資金を提供したので、マイクロソフトの検索エンジンにAIが搭載されるらしいが、Google Chromeにもつい最近拡張機能としてChatGPT for Googleが搭載された。これもOPENAI社のもののようだ。Google ChromeのChatGPTについていったん「使ってみると、従前の検索が「改善」された気がする」としたが、これは従前の検索について画像とかも増えていただけで、ChatGPTは別のスペースに表示されるのだった。たまたま水戸家裁に行くので検索してみたところChatGPTは「「水戸家裁」という言葉は、「水戸家」が主導する家庭裁判のことを指します。」としていろいろと説明している。面白いが、どのよう検索し、どのように利用するのがいいのか。

聞き方(指示)次第のようだ

少しChatGPTについて説明した本に目を通してみると(「Excel ChatGPTでビジネスが加速するAI仕事術」「GPT-4 対応 おばちゃんでもわかる 超 入門 ChatGPT AI チャットボット: 15事例」、「GPT-4 対応 ChatGPT の 応答精度 は プロンプト が9割 テンプレート 付: GPT-3.5 Bing AI Perplexity Notion AI との比較」等)、充実した回答を得るためには、聞き方(指示の仕方)が重要なようだ。それと英語と日本語という問題もある。「すばらしい論文を書いた」というのは、当面、英語圏での固有の領域の問題のようだ。IT領域は、日本語でもかなりできそうなことが、「「Excel ChatGPTでビジネスが加速するAI仕事術」を見るとわかる。

使い方次第で役に立つこともあるだろうが

何でもできるAIは何もできないと同じで、これを有効に活用できる分野は限られるだろうし、そこで出来上がったものの大部分は「ゴミ」だ。例えば題名を与えて「詩」や「エッセイ」を作成する機能もあるが、その内容にはうんざりしてしまう。

当たり前だが、主として使うべきは脳の思考機能だ。

伊東乾さんの次の指摘は正しいと思う。
無能なAIを見破る「チャットボット・リテラシー」 チャットGPTなどの出力は基本「ゴミ」という分別を(1/4) | JBpress (ジェイビープレス)

IT・AI・DX,プチ創造

デジタルで変わる日々の知的な作業

最近のデジタルやAIを利用した知的技法の「進化」は目覚ましい。今までこういう話題はだいたいこれをお金にしようとする人が先頭に立っていうだけで、実際はそれほどでもないし、あれこれいじっているうちにストレスがたまるだけということが多かった。だからもう飽き飽きという向きも多いだろうが、最近の「進化」を見ると今もう一度見直してみることには意味がありそうだ。といっても、今盛り上がっているのはあくまで「下拵え」の分野で、本丸の知的活動は依然として「闇の中」だ。
さて、「下拵え」の分野をどういう風に分類しようか。

音声のテキスト化

まず自分が発話することも含め音声を文字化する作業が容易にできることは、神の腕を持つブラインドタッチャーを除けばとても助かることに異論はないであろう。
音声のテキスト化には様々な方法がある。
スマホの音声検索の登場には驚かされた。それから何年も経ち、今、AndroidであればGoogleの音声入力は充分に実用的だが、何に入力してテキスト化するのか。短いメモであれば、私は今、Fast Notionを使っている。長いものであれば有料サービスだが、オートメモがお勧めである。長い会議であれ、英語の動画であれ、かなり正確にテキスト化できる。
文章を作成するために、自分で発話しながらそれを文章化するには、Google Documentを利用するのがいいだろう。短い文章であれば、今私がやっているのは、ライティングマウス(TESS GIFT)を利用する方法である(たまたまJust Systemが販売していた。)。これはパソコンの画面(メモ帳がいい)を見ながらどんどん入力できるのでとても良い。やることはマウスの横にあるボタンをクリックして音声を発することだけである。

画像文字のテキスト化

画像文字としてはパソコンに表示された画像文字と、Real本がある。日本語も英語もあるまずパソコンから。
Windowsの画像文字をクリップボードにコピーする。ただコピーしただけではクリップボードに保存されるだけなので、これを何かのファイルに貼り付ける。そして貼り付けた後でそれをテキスト化するという手順になる。
まず画像文字のファイルをテキストするには、あるフォルダーに収納されたファイルについてそれを個別にあるいはまとめてテキスト化できる「ImageScanOCR」というアプリがある。これは他にもあるだろう。
その前提としてクリップボードにコピーされた画像文字を自動的にファイルにする「ClipboardSaver」というアプリがある。この二つを組み合わせるのがよさそうだ。
例えばクリップボードにコピーしたものをワードに貼り付けそれをPDFとした上でOCRにかけるという方法もあるがこれはいかにも面倒くさい。よくある方法が画像文字のファイルををGoogleドキュメントで開くという方法だが、これもいいのだがその手順がやはり面倒だ。上記の方法が今のところ一番簡単である。
Real本については、スキャンしてテキスト化する。
次の記事を参照して欲しい(手書きメモを活用する-Google レンズの世界 | 弁護士村本道夫の未来の法律事務所))。

翻訳(日⇆英)

文章の翻訳

これはテキスト化された文章を、wordに貼り付けて翻訳するのが簡単だ。PDFは、wordだと形態の崩れが激しいので、Google翻訳の「ドキュメント」でPDFを選択する。長いとできないので、PDFを分割しよう。

音声の翻訳

これもいろいろあるのだろうが、長文であれば音声をテキスト化した上で、翻訳することになろう。
私としては、英語がどんどん読まれる中で、次々と日本語テキストに変換されるサービスはないかと探していた。「英語×IT ITツール活用で英語力10倍へ: 対訳コーパス、辞書、自動翻訳、校正、同時通訳、文字起こし:白辺 陽」や「自動翻訳大全 終わらない英語の仕事が5分で片づく超英語術:坂西 優; 山田 優」というKindle本を見ても、どうもそれは難しそうだった。英語の切れ目を入れてそこまでを翻訳することはスマホの「同時通訳」アプリで可能だが、連続してというところが難しそうだった。
しかし、つい最近、「ポケトーク同時通訳」(外国語での会議に、「ポケトーク同時通訳」|POCKETALK(ポケトーク))というソフトが公開され、それが可能となったようだ。まだまだぎこちないようだが、だんだん進化するだろう。

知的作業を支えるプラットフォーム

これまでに紹介したことは、知的作業の「下拵え」にすぎない。このようにして用意した素材について、これをどのように組立みてて考察・推論していくのかが課題である。
それを実現するのプラットフォームとして2つの「メモ」アプリが考えられる。一つはObsidianでありもうひとつはNotionである。
ただこれらのアプリは使うことが面白くて、趣味的にはまっているという面も確かにあり、れほど知的作業に役立つかは疑問もある。ただよりよく使えば役立つことは間違いない。
まずObsidianは日々の活動を記載することで、全体的な知的活動を切り開くというメモとしていいだろう。これはかなり実現しつつある。
Notionはよくわからないが、どうも仕事のデータベースとして使うのがよさそうだ。NotionAIという機能もある。
いずれにせよ、なかなか楽しい時代になったものだ。

IT・AI・DX,基本的な方法論

キーボードと手書き

学生時代は手書きのノートを使うのが当たり前だったが、仕事を始めパソコンを利用するようになってからは、手書きはヒアリング時のメモ程度になってしまった。しかしいつまでたってもタイピングは、キーボードを見ながらのミスタッチだらけで疲れ果て、手書きメモは乱雑な字で読み返せない。しかもどちらもすぐに散乱して所在不明となるので、文書作成はもストレスの元になるだけだった。この作業環境を改善することは積年の課題だ。

活字画像をテキストデータにする

文字はもともと画像だが、これをパソコンで扱うことのできるテキストデータにすると、所在探し(検索)や、情報処理・加工が容易になる(以下、テキストデータはパソコン画面でコピペできる文字とする)。

そこで①パソコンの外部にあるa手書き画像やb活字画像、②パソコン画面に表示されたb活字画像(やコピペに制限のあるテキストデータ)を、③パソコンで処理・加工ができるテキストデータにしたいが、どうすればよいか。
一番難しいのが①外部にあるa手書き画像を③テキストデータにすることだが、これは最後で取り上げよう。まず、活字画像のルートを考えよう。

パソコン画面の活字画像をテキストデータにする

最初に取り組むべきは、②パソコン画面の活字画像(やコピペに制限のあるテキストデータ)を③テキストデータにすることである。例えば、Kindleの画像本等だ。この方法はいろいろある。ただそれぞれ大なり小なり修正をしなければならないので、修正を少なくする工夫も必要である。

「瞬間テキスト2」

一番手軽なのは、「瞬間テキスト2」というOCR(文字認識)ソフトを使うことだ。「読み取り」をクリックして画面上の任意の文字部分を囲むだけでソフトのj上にテキスト化でき、価格も1,980円と手頃だ。短い文書はこれに限る。日本語+英語だけでなく、中国語、韓国語も読み取れるようだ。精度も2になって上がったような気がする。問題は「画面上の文字を囲む」前にソフトの「読み取り」をクリックするのが全画面表示にしているとできないことや、連続してテキストデータ化できないことぐらいだろうか。

その他の方法

Windows画面はコピーできるモード(Snipping。(windowsロゴマーク+shift+S))にして全画面あるいは任意の文字部分の画像を囲んでコピーできる。それをWORDに貼り付けてPDF形式で保存し、PDFelementというソフトのOCR機能でテキストデータにするという方法もある(OCRソフトは他にもいろいろある。)。連続してやりたいときは、複数のコピーを保存できるソフト(例えば「神コピ!」)を使う。
他にも、無料がよければ、1回毎にPaintに貼り付け、googleドライブに入れてgoogleドキュメントで開く方法もある。面倒だが、精度は相当なものだ。googleレンズを使ってもテキストデータにできる。

外部にある活字画像をテキストデータにする

次に①外部にある活字画像を③テキストデータにするにはどうすればよいか。まず①外部にある活字画像をパソコンで扱えるようにするためにスキャナーを利用する。その上で上記と同じように②パソコン画面の活字画像(のデータ)にして③テキストデータにするということになる。

事務所では

スキャン機能付きコピー複合機で外部にある活字画像(Real本や書類)をPDFないし画像データとしてスキャンしてパソコンに送付し、これを上記したPDFelementというソフトのOCR機能で③テキストデータにする。

自宅では

自宅では、古いスキャン機能付きコピー複合機を再利用しようと思ったが、さすがに活字画像の精度が低いので、スタンド型スキャナー(APEX AXSA4L)を購入してみた。スキャンだけを想定していたのだが、専用ソフトを使ってOCRもできる。ただ最初は少し分かりにくい。私用の備忘メモを作成しておく。
[[スタンド型スキャナーを使う]]

スキャンの違い

事務所のコピー複合機では、連続してスキャンすると一つのPDF文書となり、PDFelementでテキストデータ化できる。自宅のタンド型スキャナーでは、スキャンしていくと別文書になるが、選択して「エクスポート」すると一つの文書になる。

手書きの文書をテキストデータにする

Google レンズを使う

手書きの文書をテキストデータにするOCRは、AIOCRと言われ、現時点では非常に高価である。
しかし、通常使用する場面では、手書きの文書はそれほどの量にはならないので私レベルではGoogle レンズを使えば十分である。スマホ、タブレットで撮影して、Google レンズを使う方法もあるが、おそらくスキャナーで画像化し、パソコンのGoogle レンズを使う方が、使いやすいだろう。

音声をテキストデータにする

ただ考えてみれば、手書きの文書をスキャンーOCRを利用してテキストデータしようとしても、丁寧に文字を書いても変換精度はきわめて不十分である。それを考えれば、手書きの文書に基づいて、口頭で表現し、その音声をテキストデータ化する方がはるかにいいのではないか。音声のテキストデータ化は、Googleでもいい、私は「オートメモ」を使っている。
手書きノートの必要性は別に論じよう。