GPT-4oとGeminiー新・生成AIの世界

2024-05-24

2週間前に

私は「生成AIを利用する」という記事で、「自然言語を利用する生成AIの用途として、①検索し説明してもらう、②文書の生成と修正、③長文の要約・翻訳が考えられるが、①はChat GPTで、②はCopilotを利用しよう、③はClaudeを利用している、とした。さすがにこれでは無駄なので、整理したいと思う。多分、②が有力候補だが、Microsoftは未だに、OneDriveを無理強いする体質なのでためらいもある。当面は趣味として、使い分け、使い込んで行こうと思う。」とした。ほんの2週間ちょっと前だ。

GPT-4o

2024年5月13日に、GPT-4o(omni)が発表され、有料版で直ちに使用できるようになった。高速化と共に、「テキスト、音声、画像を組み合わせてインプットもアウトプットもできる」とのことだ。高速化はそのとおりだが、後者をどう利用するのか、私には見通しはない。ただ当面、生成AIはGPT-4を中心に展開すると思うので、これは手放せない。

Geminiは使えそうだが

翌日、100万トークンの長いコンテキストウィンドウを備えたGemini1.5 Proのアップデートが発表された。日本語でも利用できる。これを利用すると③の長文の要約もできたし、Google WorkSpaceというサービス(有償だが、800円台だ。)を利用すれば、2TBのGoogleDriveが利用でき、(多分)②について、ドキュメント、スプレッドシートでも使えそうだ。 ②のCopilotはまだまだ使いにくいし、③は英語を介することで日本語が変わってしまうのが気になる。それで私は数日前、②と③を解約した。代わりにGemini1.5 Proを契約した。しかし…

ドメインの所有権の証明が進まない

Gemini1.5 Proだけでもチャット、APIの利用はできるが(ある種の提携もできるらしい。)、Google WorkSpaceを利用するには、ドメインの所有権証明が必要だということだ。私のドメインといえば、このWEBのためにレンタルサーバーで取得したmurachanlaw.comであるが、その所有権の証明のために「 DNS レコードへの確認コードの追加」が必要ということだが、内容は珍紛漢だし、レンタルサーバーにも余り触りたくない。しかし仕方がないので、手順書に従ってコワゴワ作業を進め、何回も試行錯誤を重ねたが、今だにうまくいかない。ただおおよそ何をしているのかは分かってきたし、やっている作業はどうやらよさそうだ。最大の問題は、追加をしてチェックしても「ドメインホストの情報が更新されるのに時間がかる」ということで、行った作業が正しいかどうかの確認ができないことだ(最大72時間かかるなどと言われるとお手上げだ。)。しばらく悩みの種だ。ただ会社での共同作業を想定しているのでGoogleも慎重な手順を要求しているのだろう。これが24日の情報だが、25日には、追加をしようとしていた作業場所が異なる気がして(単なるドメイン所有者と、サーバー利用者の手続は異なるという記述を見付けた。)、それでそれに従って訂正してみたところ(それも一筋縄ではいかなかったが)、ようやく所有者の証明はクリアだ。これがGoogleが5分でできると書いてある作業だ。
しかしその後やるべきことも内容がよく分からないので、しばらく様子見だ。それで分かったのだが、Google WorkSpaceを使おうとすると、現時点では英語でしか使えない。それも、有償で、Gemini1.0だ。当面、Gemini1.5 Proでの長文の日本語の要約はできるので(本1冊相当量ぐらいは問題ない、ただし1回で出力できず止まるので「続けて」とする必要はある。これはどの生成AIも同じだが。)。Google WorkSpaceがどうなるか、しばらく見守りたい。