MENU

情報 第3版_を参照する

書誌

要旨

本文書は、東京大学教養学部テキスト『情報 第3版』の主要なテーマ、概念、および議論を総合的にまとめたものである。本書は単なるコンピュータ操作技術の習得(コンピュータリテラシー)を超え、情報の本質を多角的かつ体系的に理解することを目的としている。初版(2006年)、第2版(2017年)を経て、第3版(2025年)では、高等学校における「情報I」の必修化と大学入学共通テストへの導入という教育環境の大きな変化に対応している。特にプログラミング既習を前提とし、現代の情報社会で不可欠となった「機械学習と人工知能」に関する章が新設され、内容が大幅に刷新された。

本書の中心的なテーマは以下の通りである:

  1. 情報の基本概念: 情報とは物理的実体を持たない「人の心に働きかける何か」であり、その表現(モデル化、記号、デジタル符号化)と伝達(通信理論、プロトコル)が基本となる。
  2. 情報システム: 現代社会の基盤である情報システム(例:Google Maps)の構造(クライアントサーバ、P2P)、構成要素(ハードウェア、ソフトウェア、OS)、および評価基準(性能、信頼性、安全性)を解説する。
  3. 計算と問題解決: コンピュータによる問題解決の核となる「アルゴリズム」の概念を、計算量という評価軸を用いて解説する。二分探索やメモ化といったアルゴリズム戦略や、最適化問題(ナップサック問題、線形計画問題)の定式化と解法を示す。
  4. 機械学習と人工知能: ビッグデータを活用する現代の主要な問題解決手法として機械学習を詳述する。教師あり学習(回帰、分類)、教師なし学習(クラスタリング)、強化学習の基本パラダイムから、深層学習(ニューラルネットワーク)の仕組み、そして画像認識や大規模言語モデル(LLM)といったAI応用までを網羅する。
  5. コンピュータと人間・社会: プログラム内蔵方式に基づくコンピュータの動作原理(論理回路、CPU)、OSの役割、そして人間とシステムの接点であるユーザインタフェース設計の重要性を論じる。最終的に情報技術が社会に与える影響を考察し、情報社会の一員としてのリテラシー(リベラルアーツとしての情報学)の必要性を強調する。

総じて、本書は情報科学の基礎理論から最新技術、社会的影響までを網羅し、文理を問わず全ての大学初年次学生が現代情報社会を生きるための統一的な視点と知識基盤を獲得することを目的とした包括的な教科書である。


目次

1. 教科書『情報 第3版』の概要と変遷

1.1. 教科書の目的と位置づけ

本書は、東京大学教養学部前期課程における文理共通の基礎科目(必修)「情報」の教科書として執筆された。目的は、多面的な側面を持つ「情報」を人間、社会、問題解決という三つの観点から捉え、統一的な理解を提供することである。特に「情報の習熟」を「コンピュータ操作の習熟」と同一視する一面的な見方を批判し、情報の表現、伝達、計算原理、情報社会での素養などについて一貫した視点を提示することを目指している。

1.2. 各版の改訂経緯と背景

本書は社会や教育環境の変化に対応して改訂を重ねてきた。

発行年主な改訂背景と内容
初版2005年 (2006年度より使用)高等学校の普通教科「情報」履修者が大学に入学したことに対応。情報の本質的・基本的な性質を解説。
第2版2016年 (2017年度より使用)初版から11年が経過し内容の古くなった部分を刷新。章構成を変更し情報システムの歴史的変遷などを追加。
第3版2025年 (予定)高等学校の新学習指導要領により全高校生が「情報I」を履修し、プログラミングが既習となることに対応。大学入学共通テストに「情報」が主要教科として追加されたことに対応。プログラミング既習を前提としたより現実的な問題解決手法を扱う。特に機械学習の基礎を「問題解決の主要な分野」と位置づけ、第7章「機械学習と人工知能」を新設。

1.3. 第3版における主要な変更点

第3版では特に章構成が大幅に改訂された。

  • 第6章「問題解決のための情報表現」: 第2版の「計算の理論」から改訂し、より現実に即した対象のモデル化や問題解決を扱う。
  • 第7章「機械学習と人工知能」: 第2版の「データの扱い」から完全に刷新して新設。機械学習の基礎を学ぶ章である。
  • その他の章: 高等学校の学習指導要領や現行の情報技術に合わせて内容を更新。章によってはテーマは同じでも文章が大幅に改訂されている。

2. 情報の基本概念

2.1. 情報の性質と表現

  • 情報の定義: 情報には物理的実体がない。「人の心(情)に働きかける(報)何か」であり、事物のあり方や変化の表現・伝達に関わる概念である。
  • 表現の側面: 情報を表現する際には「何を(対象)」「なぜ(目的)」「どのように(方法)」の三つの側面を考慮する必要がある。表現方法は手続き的表現と宣言的表現、記号表現とパターン表現などに分類される。
  • モデル化: 現実世界を単純化・抽象化したものを「モデル」と呼び、モデルを構築する過程を「モデル化」という。モデル化は学問分野共通の中心的作業であり、表、図、グラフ(ノードとエッジで構成)などが用いられる。
  • デジタル符号化: コンピュータで情報を扱うための表現がデジタル符号化であり、0と1のビット列で表す2進符号が広く用いられる。数値、文字、画像、音声などあらゆる情報が2進符号化される。
  • 数値: 整数(符号絶対値、2の補数)、小数(固定小数点、浮動小数点—IEEE 754規格)。
  • 文字: 各文字をビット列に対応づける文字コード(ASCII, JIS, Unicode)。UnicodeではUTF-8やUTF-16といった可変長符号が効率的に利用される。
  • 画像: ピクセルごとの色情報で表すビットマップ形式と、図形要素で表すベクター形式に大別される。
  • アナログ量: 温度や音など連続的な量は標本化(サンプリング)と量子化によってデジタルに変換される。標本化定理(ナイキスト周波数)は元の情報を復元するために必要な標本化頻度を規定する。

2.2. 情報理論の基礎

  • シャノンの通信路モデル: 情報理論はクロード・シャノンによって定式化された。「送信者→通信路→受信者」というモデルで、記号の正確な伝達という技術的問題を扱う。
  • 情報量: ある事象の起こる確率 p にのみ依存する量として定義され、log₂(1/p) で計算される。単位は bit。生起確率が低い(意外性が大きい)事象ほど情報量は大きい。
  • エントロピー: 情報源から得られるメッセージの情報量の期待値。情報源が持つ不確実性を定量化する指標で、H(X) = Σ P(s) log₂(1/P(s)) で計算される。
  • 情報源符号化定理: どのような符号を用いても、1メッセージあたりの期待符号長を情報源のエントロピーより小さくすることはできない。これはデータ圧縮の理論的限界を示す。

3. 情報システムと通信

3.1. 情報システムの構造と評価

  • 定義: 情報通信技術(ICT)を駆使して何らかの価値(金銭的・実利的とは限らない)を提供する、相互に作用する複数の要素からなる仕組み。例:チャットアプリ、鉄道改札システム、Google Maps。
  • 構造:
  • 階層性: 多くの情報システムは下位の情報システム(例:スマートフォン)の上に成立する階層的構造を持つ。
  • クライアントサーバ型: 要求を送る「クライアント」と情報や機能を提供する「サーバ」が役割分担する構成。現代のウェブサービスの多くが採用している。
  • ピアツーピア(P2P)型: 各要素が対等に連携する構成。中央サーバが不要なため耐障害性が高いが、悪意ある利用者の排除が難しい。
  • 集中と分散: 機能を1台に集中させるか複数台に分散させるかという方針。分散(垂直分散、水平分散)は性能向上に寄与するがシステムが複雑化する。アムダールの法則により性能向上には限界がある。
  • 評価:
  • 処理速度: スループット(単位時間当たりの処理量)、レスポンスタイム(指示から最初の応答までの時間)、ターンアラウンドタイム(指示から完了までの時間)など複数の指標がある。
  • 正常動作の継続性: 稼働率、平均故障間隔(MTBF)、平均復旧時間(MTTR)で評価される。
  • 耐障害性: 故障や欠陥への耐性として Fault Tolerant(一部故障しても機能維持)、Fail Safe(故障時に安全側に倒す)、Fool Proof(誤操作対策)などの概念がある。
  • 攻撃への耐性: DoS攻撃や情報奪取(SQLインジェクション、フィッシング)など悪意ある攻撃に対する安全性が評価される。多要素認証などが対策として重要である。

3.2. 情報の伝達と通信技術

  • 通信規約(プロトコル): 通信を行うための取り決め。TCP/IPモデルのように階層的に構成されている。
  • アプリケーション層: HTTP、DNSなど。URLで宛先を指定する。
  • トランスポート層: TCP、UDPなど。IPアドレスとポート番号で通信を管理する。
  • インターネット層: IP。IPアドレスでネットワーク上の機器を特定する。
  • ネットワークインタフェース層: MACアドレスで物理的な機器を識別する。
  • インターネットの仕組み:
  • IPアドレスとルーティング: IPアドレスはネットワーク部とホスト部からなり、ルータがネットワークアドレスを見て次のルータへパケットを転送(ルーティング)することで宛先に届ける。
  • DNS (Domain Name System): ドメイン名(例: u-tokyo.ac.jp)とIPアドレスを対応づける分散データベース。階層的な権威サーバとユーザからの問い合わせを扱うリゾルバで構成される。
  • Web技術:
  • HTTP: Webブラウザ(クライアント)とWebサーバ間の通信プロトコル。要求(request)と応答(response)を基本とし、ヘッダ情報で補助的なデータをやり取りする。
  • Cookieとセッション: サーバがブラウザに保存させる小規模なデータ。ログイン状態の維持など、一連の通信(セッション)を管理するために用いられる。
  • 認証と暗号化:
  • 公開鍵暗号方式: 暗号化と復号に異なる鍵(公開鍵、秘密鍵)を用いる。暗号化だけでなくデジタル署名にも利用される。
  • デジタル署名: 送信者が秘密鍵でメッセージのハッシュ値(電子指紋)を暗号化したもの。受信者は送信者の公開鍵で検証することで、なりすましや改ざんを検知できる。
  • 電子証明書とPKI: 認証局(CA)がサーバの公開鍵やドメイン名を証明した証明書を発行する。ブラウザは信頼するルート認証局の証明書を事前に保持しており、提示された証明書を検証することで通信相手の正当性を確認する(HTTPSの基盤)。

4. 計算と問題解決

4.1. 計算の記述とアルゴリズム

  • アルゴリズムとプログラム: ある問題を解くための計算手順が「アルゴリズム」、それをプログラミング言語で記述したものが「プログラム」である。同じ問題でもアルゴリズムの選択によって実行時間が大きく異なるため、両者を区別して考えることが重要である。
  • 計算の基本要素:
  • 変数: 値を保持し変化させる。
  • 代入: 変数に値を設定する操作。
  • 逐次処理: 書かれた順に処理を実行する。
  • 条件付き処理: if-then-else のように条件で処理を切り替える。
  • 反復処理: while や for のように条件が満たされる間処理を繰り返す。
  • 配列: 複数の値を一列に並べたデータ構造。添字(インデックス)で要素を区別する。
  • モジュール化: 一連の処理を関数としてまとめ再利用可能にすること。
  • 計算量: アルゴリズムの効率を評価する指標。問題の大きさ n に対して計算回数がどのように増えるかをオーダー表記(O記法)で表す(例: O(n), O(n²), O(log n))。n が大きくなるとオーダーの違いが実行時間に決定的な差をもたらす。

4.2. アルゴリズム戦略と最適化問題

  • アルゴリズム戦略: 個別問題に依存しない汎用的な考え方。
  • 二分探索: 解の存在する範囲を半分ずつ狭めることで効率的に解を見つける。計算量は O(log n)。
  • 再帰とメモ化: 問題をより小さな同構の部分問題に分割して解くのが再帰。計算した部分問題の解を記録(メモ化)して同じ計算の繰り返しを防ぐことで効率化できる(動的計画法の一種)。
  • 問題解決のためのモデル化:
  • データ構造: 現実のデータは行列構造、ネットワーク構造(グラフ)、階層構造(木)といった典型的構造を持つ。
  • モデルとシミュレーション: 現象を数式でモデル化し(例: 人口推移のマルサスモデル、ロジスティック写像)、コンピュータ上でデータを生成(シミュレーション)することで現象の振る舞いを理解・予測する。
  • 最適化問題:
  • 定式化: 「制約条件」の下で「目的関数」を最大化または最小化する「決定変数」の値を求める問題として記述する。
  • 組合せ最適化: 決定変数が離散値を取る問題。例: ナップサック問題。
  • 全探索法: すべての可能性を調べる厳密解法だが計算量が爆発的に増大する(例: O(2ⁿ))。
  • 貪欲法: 局所的に最もよい選択を繰り返す近似解法。高速だが最適解が得られる保証はない。
  • 線形計画問題: 目的関数と制約条件が決定変数の線形結合で表される問題。効率的な厳密解法が知られており多くの現実問題がこれに帰着できる。

5. 機械学習と人工知能

5.1. 機械学習の基本パラダイム

機械学習は、コンピュータがデータからルールやパターンを学習し、未知のデータに対する予測や判断を行う技術である。

パラダイム説明主要なタスク
教師あり学習入力と正解(教師)出力のペアからなる訓練データを用いて、入力から出力を予測するモデルを学習する。回帰: 数値の予測(例:気温からアイスクリーム販売数を予測)
分類: カテゴリの予測(例:メール本文から迷惑メール判定)
教師なし学習正解出力がないデータからデータに潜む構造やパターン(クラスタなど)を見つける。クラスタリング: データを類似したグループに分ける(例:k-means)。
次元削減: 高次元データを情報損失を抑えつつ低次元に圧縮する(例:主成分分析 PCA)。
強化学習エージェントが環境内で試行錯誤し、得られる報酬を最大化するように行動方針(方策)を学習する。ロボット制御、ゲームAI(例:Q学習)
自己教師あり学習正解ラベルがないデータから一部を隠してそれを予測するタスクを人工的に作り、データ表現(埋め込み)を学習する。大規模言語モデルの事前学習などで活用。

5.2. 深層学習とニューラルネットワーク

  • モデルと学習: 教師あり学習ではモデルの予測と真値との誤差を測る損失関数を定義し、これを最小化するパラメータを求める最適化問題として学習が行われる。訓練データへの過剰適合(過学習)を防ぎ、未知データへの予測性能(汎化性能)を高めるために正則化などの技術が用いられる。
  • ニューラルネットワーク (DNN): 人間の脳神経を模した数理モデル。入力層、複数の中間層、出力層からなり、単純な関数(ノード)を多数組み合わせることで複雑な関係性を表現できる。中間層が多層のものを深層学習と呼ぶ。
  • 学習方法: 巨大なパラメータを持つDNNの学習には損失関数の勾配を用いてパラメータを更新する勾配降下法が用いられる。勾配計算を効率的に行うのが誤差逆伝播法である。
  • 主要なモデル:
  • CNN (畳み込みニューラルネットワーク): 画像の局所的な空間情報を捉えるのに適している。
  • RNN, LSTM, Transformer: テキストなどの系列情報を扱うのに適している。特に Transformer は大規模言語モデルの基礎となっている。

5.3. 人工知能(AI)への応用

機械学習、とりわけ深層学習の発展により様々なAI技術が実用化されている。

  • 画像処理: 画像分類、物体検出、画像生成(Text-to-Image など)。
  • 言語処理: テキスト分類、機械翻訳、情報検索、質問応答、文章生成。特に大規模言語モデル (LLM)(例: GPT, ChatGPT)は多様なタスクで高い性能を示す。
  • 音声処理: 音声認識、音声合成、話者認識。
  • ロボティクス: 自動運転、ロボットアームによる作業自動化。
  • マルチモーダルAI: 画像、言語、音声など複数のモダリティを統合的に扱うことで高度なタスクを実現する。
  • 実用上の注意: 訓練データの偏りによるアルゴリズムバイアスや、データ収集におけるプライバシー・著作権の問題など、倫理的・社会的課題への配慮が不可欠である。

6. コンピュータと人間・社会

6.1. コンピュータの仕組み

  • プログラム内蔵方式: プログラムとデータを共に主記憶装置(メモリ)に保持し、プログラムに従って処理を進める方式(フォン・ノイマン型)。コンピュータの汎用性の基礎である。
  • 中央処理装置 (CPU): 制御装置と演算装置(ALU)からなる。プログラムカウンタが示すアドレスの命令を読み込み(フェッチ)、解読(デコード)、実行するサイクルを繰り返す。
  • 論理回路: 2進符号の演算を実現する電子回路。基本的な論理演算(AND、OR、NOT)を組み合わせた組合せ回路(例: 加算器)と、記憶機能を持つ順序回路(例: フリップフロップ、レジスタ)から構成される。
  • オペレーティングシステム (OS): コンピュータの資源(CPU、メモリ、周辺装置)を管理する基本ソフトウェア。プロセス管理、メモリ管理(仮想記憶)、入出力管理、ファイルシステムなどの機能を提供する。

6.2. ユーザインタフェース(UI)

  • 定義: 人工物(コンピュータなど)とユーザとの接点。システムの使いやすさを決定づける重要な要素である。
  • 二重接面性: 複雑な人工物では、ユーザが直接操作する「第一接面」(操作インタフェース)と、人工物がタスク世界に作用する「第二接面」(制御インタフェース)が分離している。この分離が操作の困難さを生む一因となる。
  • 人に優しいデザイン: ユーザの目標設定から行動実行までの認知的負荷(実行の淵)と、システムの状態を解釈する負荷(評価の淵)をいかに小さくするかがデザインの鍵である。

6.3. 情報技術と社会

  • 社会への影響: ネットワークの発展により情報発信の主体がマスメディアから個人へ移行した。フェイクニュースの拡散や生成AIによる偽情報の生成など、情報の質に関する新たな課題が生じている。
  • 情報社会人の素養: 情報システムが社会の基盤となった現在、専門家でなくともその特性や危険性を理解し適切に利用する能力が求められる。本書で学ぶ体系的な知識は、現代社会を生きるためのリベラルアーツとしての重要性を増している。
  • 第3版 まえがき
  • 第2版 まえがき
  • 初版 まえがき
  • 担当一覧
  • 第1章 情報の学び方
    • 1.1 情報の性質ととらえ方
    • 1.2 情報システム
    • 1.3 情報の表現と伝達
    • 1.4 計算と問題解決
    • 1.5 コンピュータ
    • 1.6 人間と社会
  • 第2章 情報システム
    • 2.1 情報システムとは
    • 2.2 情報システムの構造
    • 2.3 情報システムの評価
    • より進んだ学習のための文献ガイド
  • 第3章 情報の表現||記号・符号化
    • 3.1 情報の表現
    • 3.2 記号と表現
    • 3.3 デジタル符号化
    • 3.4 通信(コミュニケーション)の理論
    • より進んだ学習のための文献ガイド
  • 第4章 情報の伝達と通信
    • 4.1 通信の自動制御
    • 4.2 認証と暗号化
    • 4.3 発展的な話題
    • より進んだ学習のための文献ガイド
  • 第5章 計算の方法
    • 5.1 計算とその記述方法
    • 5.2 アルゴリズム
    • より進んだ学習のための文献ガイド
  • 第6章 問題解決のための情報表現
    • 6.1 データの記述とモデル化
    • 6.2 モデルの記述とデータ生成
    • 6.3 問題の記述と解法
    • より進んだ学習のための文献ガイド
  • 第7章 機械学習と人工知能
    • 7.1 ビッグデータと機械学習
    • 7.2 教師あり機械学習
    • 7.3 教師なし機械学習
    • 7.4 強化学習
    • 7.5 自己教師あり学習と生成モデル
    • 7.6 機械学習の実用上の注意
    • 7.7 人工知能
    • より進んだ学習のための文献ガイド
  • 第8章 コンピュータの仕組み
    • 8.1 プログラム内蔵方式
    • 8.2 論理演算と組合せ回路
    • 8.3 演算回路
    • 8.4 順序回路とメモリ*
    • 8.5 中央処理装置の実現
    • 8.6 実際のコンピュータ
    • より進んだ学習のための文献ガイド
  • 第9章 ユーザインタフェース||人に優しいデザイン
    • 9.1 世の中,かくも使いにくい物ばかり?
    • 9.2 インタフェースとは何か?
    • 9.3 実際のインタフェース
    • 9.4 インタフェースデザインとユーザの行動
    • 9.5 インタフェースの評価
    • 9.6 インタフェースからインタラクションへ
    • より進んだ学習のための文献ガイド
  • 第10章 情報技術と社会
    • 10.1 技術と社会
    • 10.2 情報技術の発展と影響
    • 10.3 社会への影響||変わりゆく境界
    • 10.4 インターネットと民主主義
    • 10.5 人工知能と社会との接点
    • より進んだ学習のための文献ガイド
  • 章末問題解答・ヒント
  • 索引
目次
Translate »