導入
私のここ最近の生成AIの利用は、NotebookLMやDeepReseachを利用しての長文の要約と検索・調査が中心であった。しかしそれでは利用使途が限られるので、ChatGPTが何に使えるのか、どのように使うのか、あれこれ見繕っているうちに、Geminiも目に入った。AIチャットとして利用する限りは、ChatGPTと大同小異だが、Googleは、Chrome、Drive、アプリ、クラウド等の多様なサービスを提供しており、そこでGeminiが利用できる方向性がとられているので、一見するだけでは複雑怪奇である。そこでGoogleを中心に現時点でのAIサービスを概観してみることにした。但しあくまで個人の知的生産として利用するというスタンスだ。円滑な企業業務の自動化・効率化はその先の問題だろう。
業務の自動化・効率化と個人の知的生産におけるAIサービス
AIの歴史は長く、数十年にわたり研究が重ねられてきた。そして、深層学習(ディープラーニング)の進化を背景とした「第三次AIブーム」の中で、2022年秋にChatGPTが登場し、一般ユーザーにも生成AIの能力が広く知れ渡ることとなった。
今、ChatGPT、Gemini、Claude等の生成AIサービス(AIチャット)の利用が広く喧伝されているが、それを受けた業務の自動化、効率化は、喧伝されているほど進んでいるであろうか。私には否と思える。
特に個人が自らの知的生産(活動)に利用しようとする場合、生成AIサービスの利用に戸惑いを感じるケースが少なくない。その理由は端的に、AIサービスへの通路が多様化・複雑化しすぎていることにある。
GoogleのAIサービスの複雑さ
特にGoogleが提供するAIサービスのエコシステムは、その広範さゆえに「迷路」というほかない。ユーザーが途中で迷うことなく、最も効率的かつ目的に合ったサービスにたどり着けるよう、予めその全体像を整理しておこう。
主要なAIチャットサービスとそのアクセス
現在、AIチャットとしてChatGPT、Claude、そしてGoogleのGeminiアプリが広く使われている。
- ChatGPT / Claude: アクセスや入力は、基本的にウェブサイトや専用アプリを経由する「単線」的である。
- Geminiアプリ: Googleの様々なアプリサービスやAIサービスのエコシステムの一画として位置づけられており、その通路は複雑である。
Geminiアプリの機能とCanvas、Gemsの重要性
Geminiアプリには、従来のチャット機能に加え、様々な機能が盛り込まれているが、基本的なAIチャットとしての利用法は他とほぼ同じである。しかし、Geminiの能力を最大限に引き出すためには、CanvasやGemsといった特定の機能について理解し、意識的に利用することが推奨される。
CanvasとGemsの解説
- Canvas
Geminiとの会話の内容を視覚的に整理し、アイデアを構造化するためのワークスペース機能である。ブレインストーミングや計画立案など、チャットの枠を超えた複雑なタスクに取り組む際に役立つ。 - Gems
特定の役割やタスクに特化させたカスタム版Geminiである。ユーザーがプロンプトや指示、知識を組み込むことで、特定の専門分野や作業フローに最適化されたアシスタントを作成できる。
要は、Canvasは、Geminiの回答画面の有効活用(普通の回答画面は固定されている)、Gemsは、プロンプトの拡張である。GoogleエコシステムとGeminiの統合
Googleの様々なアプリサービス、AIサービスのプラットフォームとして、個人用はGoogle One、企業向けはGoogle Workspaceがあり、それぞれのプラットフォームに含まれるアプリにGeminiが組み込まれて利用可能となっている。
基本は「Geminiサイドパネル」の活用
Googleドライブ、ドキュメント、スプレッドシート、Gmailなどの各アプリでは、画面横に表示されるGeminiのサイドパネルを使うことで、現在開いているコンテンツ(ドキュメントやメールなど)の文脈を理解した上で、要約、添削、草稿作成などの支援を受けることができる。
Geminiの活用の深化
GeminiアプリでのCanvas、Gemsの活用と、GoogleアプリのサイドパネルにおけるGeminiの使い込みこそが、個人の知的生産性を飛躍的に高める鍵であろう。加えて、Obsidian自体にはAIは組み込まれていないが、Obsidianのプラグインに、APIでChatGPT、Geminiを組み込むことも、今後の知的生産にとって重要である。
その他のAIサービス
labs.google/fxにおけるクリエイティブ生成
最近、Googleは、テキストから画像、動画、音楽などあらゆるものを生成できる新たな実験的サービス群を「labs.google/fx/」として標榜し始めている。これらは、特定のクリエイティブなニーズを持つユーザーにとって、新たな可能性を開くとされる。
labs.google/fx/ の主要サービス
次のように紹介されている。
- Whisk:驚くようなコンテンツを作成。
- FIOW:動画を生成して、内なるストーリーテリングの才能を開花させる。
- ImageFX:テキストから画像にアイデアを変換する。
- MusicFX:新しい音楽のアイデアを形にする。
開発者向けのAI環境
個人のAI開発者向け(AI Studio)
AI StudioでAI開発を試行できる。これは、プロトタイプ作成や実験を行うための環境であり、ここで必要なAPIを取得することが可能である。
企業のAI開発向け(Vertex AI )
Google Cloudとその中でのAI開発サービスであるVertex AIを知ることが重要となる。Vertex AIは、機械学習モデルの構築、デプロイ、管理を行うための統合プラットフォームであり、企業のAI戦略の核心をなす。
Gemini Cli
WindowsのPowershell(ターミナル)でGeminiを利用し、AI開発をすることができる。
参考文献
今の所次の2冊が有益だ。
Gemini 最強のAI仕事術 AI仕事術シリーズ:池田朋弘
誰でもできる!Gemini for Google Workspace活用ガイド:井上 健語
12月下旬に次の3冊が刊行される。」要は新しい情報が求められているということだ。
できるGemini (できるシリーズ):清水理史
Gemini、NotebookLM、AI Studioで効率化 Google AI仕事術 :武井 一巳
Obsidian×AI 自分だけの知識のデータベースをつくる情報収集・活用テクニック:山口大陽