導入
私の生成AIの利用は、NotebookLMやDeepReseachを使用しての長文の要約と検索・調査が中心であった。しかしそれでは用途が限られるので、ChatGPTが何に使えるのか、どのように使うのか、あれこれ見繕っているうちに、Geminiも目に入ってきた。
GeminiはAIチャットとして利用する限りは、ChatGPTと大同小異だが、Googleは、Chrome、Drive、アプリ、クラウド等の多様なサービスを提供しており、そこでGeminiを利用するという開発の方向性がとられているので、時々刻々と変化し、一見すると複雑怪奇で手がつけにくい。そこでGoogleを中心に、現時点でのAIサービスを概観してみることにした。あくまで個人の知的活動として利用すると場合というスタンスだ。円滑な企業業務の自動化・効率化はその先の問題だろう。
業務の自動化・効率化と個人の知的生産におけるAIサービス
AIの歴史は長く、数十年にわたり研究が重ねられてきた。そして、深層学習(ディープラーニング)の進化を背景とする「第三次AIブーム」の中で、2022年秋にChatGPTが登場し、一般ユーザーにも生成AIの能力が広く知れ渡ることとなった。
今、ChatGPT、Gemini、Claude等の生成AIサービス(AIチャット)の利用によって業務の自動化、効率化することが広く喧伝されているが、それを受けた企業での業務の自動化、効率化は、喧伝されているほど進んでいるであろうか。私には否と思える。企業の意欲、投資が不足しているといわれることもあるがそうだろうか。
実際、個人として知的生産(活動)に活動しようとする場合、生成AIサービスの利用に戸惑いを感じるケースが少なくない。その理由は端的に、AIサービスへの通路が多様化・複雑化しすぎていることにある。個人で使えなければ、企業で使えるはずがない。
特にGoogleが提供するAIサービスのエコシステムは、その広範さゆえに「迷路」というほかない。ユーザーが途中で迷うことなく、最も効率的かつ目的に合ったサービスにたどり着けるよう、予めその全体像を整理しておこう。
主要なAIチャットサービスとアクセス
現在、AIチャットとしてChatGPT、Claude、そしてGoogleのGeminiアプリが広く使われている。
ChatGPT / Claude: アクセスや入力方法は、基本的にウェブサイトや専用アプリを経由する「単線」的である。
Geminiアプリ: Googleの様々なアプリサービスやAIサービスのエコシステムの一画として位置づけられており、そこへのアクセスや入力方法は複雑である。
これとは別に、MicrosoftのCopilotもありアプリでも使用できるが、こちらはOneDrive以来、市場制覇を目指して「迷路」というより「迷走」しており、何が起こるかわからないので充分に落ち着いてから手を出した方がいいだろう。
その他にも様々なアプリにAIアシストが登場しているが、当該アプリが必要なら使えばよく、AIにつられない方がいい。
Geminiアプリの機能とCanvas、Gemsの重要性
Geminiアプリには、従来のチャット機能に加え、様々な機能が盛り込まれているが。基本的なAIチャットとしての利用法は他とほぼ同じである。しかし、Geminiの能力を最大限に引き出すためには、CanvasやGemsはすぐには使えないので、よく理解し、意識的に利用することが推奨される。使用法は、様々なところで紹介されている。それと回答の根拠を確認できる「回答を再確認」も重要なことがあるだろう。
CanvasとGemsの解説
Canvas
Geminiとの会話の内容を視覚的に整理し、アイデアを構造化するためのワークスペース機能である。ブレインストーミングや計画立案など、チャットの枠を超えた複雑なタスクに取り組む際に役立つ。
Gems
特定の役割やタスクに特化させたカスタム版Geminiである。ユーザーがプロンプトや指示、知識を組み込むことで、特定の専門分野や作業フローに最適化されたアシスタントを作成できる。
要は、Canvasは、Geminiの回答画面の有効活用スペースであり(普通の回答画面は固定されている)、Gemsは、プロンプトの拡張である。
GoogleエコシステムとGeminiの統合
Googleの様々なアプリサービス、AIサービスのプラットフォームとして、個人用としてGoogle One、企業向けとしてGoogleworkspaceがある。
それぞれのプラットフォームに含まれるアプリにGeminiが組み込まれ、利用可能となりつつある。
基本は「Geminiサイドパネル」の活用である。Googleドライブ、ドキュメント、スプレッドシート、Gmailなどの各アプリで、画面横に表示されるGeminiのサイドパネルを使うことで、現在開いているコンテンツ(ドキュメントやメールなど)の文脈を理解した上で、要約、添削、草稿作成などの支援を受けることができる。
GoogleのAIサービスに焦点を絞れば、NotebookLMに加えて、GeminiアプリでのCanvas、Gemsの活用と、GoogleアプリのサイドパネルにおけるGeminiの使い込みこそが、個人の知的生産性を飛躍的に高める鍵であろう。
加えて、Obsidian自体にはAIは組み込まれていないが、Obsidianのプラグインに、APIでChatGPT、Geminiを組み込むことも、今後の知的生産にとって重要であると考えている。
その他のAIサービス
labs.google/fxにおけるクリエイティブ生成
最近、Googleは、テキストから画像、動画、音楽などあらゆるものを生成できる新たな実験的サービス群を「labs.google/fx/」として提供し始めている。これらは、特定のクリエイティブなニーズを持つユーザーにとって、新たな可能性を開くとされる。labs.google/fx/ の主要サービス次のように紹介されている。
Whisk:驚くようなコンテンツを作成。
FIOW:動画を生成して、内なるストーリーテリングの才能を開花させる。
ImageFX:テキストから画像にアイデアを変換する。
MusicFX:新しい音楽のアイデアを形にする。
開発者向けのAI環境
個人のAI開発向け(AI Studio)
個人は、AI StudioでAI開発を試行できる。これは、プロトタイプ作成や実験を行うための環境であり、ここでGeminiを利用するのに必要なAPIを取得することが可能である。
企業のAI開発向け(Vertex AI )
企業での開発にとっては、Google Cloudとその中でのAI開発サービスであるVertex AIを知ることが重要となる。Vertex AIは、機械学習モデルの構築、デプロイ、管理を行うための統合プラットフォームであり、企業のAI戦略の核心をなす。
Gemini Cli
WindowsのPowershell(ターミナル)でGeminiを利用し、AI開発をすることができる。
Google Colab
Pytonを触ってみるには、今は、Google Colabがいいと思う。ここでもGeminiが活躍する。
その他
その他に、簡易な開発ツールとして、Google Apps Sheet、Google AppScriptがあるが名前も似ていて混乱するだけだ。あと最近、GoogleがMCPを開発し、利用可能になったという記事があるが、これは少し先の問題だ。その他にも紹介すべきことがあるが、以上の詳細及びその他の事項は今後紹介していこう。
参考文献
今の所、Geminiの理解には、次の3冊が有益だ。
- Gemini 最強のAI仕事術 AI仕事術シリーズ:池田朋弘
- 誰でもできる!Gemini for Google Workspace活用ガイド:井上 健語
- 今すぐ使えるかんたん Google Workspace & Gemini 完全ガイドブック 困った解決&便利技:田中 友尋; 栂安 賢吾; 横山 倫洋
12月下旬に次の3冊が刊行される。要は動きが激しく、絶えず新しい情報が求められているということだ。
- できるGemini (できるシリーズ):清水理史
- Gemini、NotebookLM、AI Studioで効率化 Google AI仕事術 :武井 一巳
- Obsidian×AI 自分だけの知識のデータベースをつくる情報収集・活用テクニック:山口大陽