ツールとしての統計学

ピーチ(P値)

大分前のことになると思うが,「nature ダイジェスト」に,P値(ピーチ)の使用に気を付けようという趣旨の記事がでていて,「P値」に気を付けるといっても「ピーチ ツリー フィズ」を飲みすぎるなということではないよ,というギャグを書こうと思って,そのままになってしまった。

今確認すると,「nature ダイジェスト」の2016年6月号である(「nature p値」と検索すると,トップに出てくる。)。その記事は,「米国統計学会(American Statistical Association;ASA)は,科学者の間でP値の誤用が蔓延していることが,多くの研究成果を再現できないものにする一因になっていると警告した。ASAは,科学的証拠の強さを判断するために広く用いられているP値について,P値では,仮説が真であるか否か,あるいは,結果が重要であるか否かの判断はできない」というものである。このころ私は,統計学に眼を向けていて,ピンと来たらしいが,今はさて?簡単にいえば,5%以下なら正しいと即断するのは,間違いだということだろうか。

統計学を理解する

経済指標に親しみ,理解することにした私としては,その作成ツールである統計学にも目を配る必要があるが,統計学の用途はこれだけではない。今では統計学は,社会や経済を分析,理解するための基本的なツールといわれている。私が学生だった頃は,あまり統計学云々とはいわれなかった(ような気がする。)。

これから漫然と統計学に取り組むのでは,頭には入らないだろう。①社会や経済(自然科学でもいいが)の分析,理解のための具体的な使われ方を把握した後で,②統計学そのものに進むのがよいだろう。①と②の関係について見通しを与えてくれる本αがあればもっと良い。

実はαについては,最近よく売れた有名な本がある。「統計学が最強の学問である」(著者:西内啓)で,実は4冊もある(正編・実践編・ビジネス編・数学編)。これらに書いてある,統計学は「今,ITという強力なパートナーを手に入れ,すべての学問分野を横断し,世界のいたるところで,そして人生のいたる瞬間で,知りたいと望む問いに対して最善の答えを与えるようになった」や,「現状把握,将来予測,洞察(因果関係)」の3機能があり,重要なのは,洞察(因果関係)であるという指摘は重要であるし,紹介されている下の「一般化線形モデルをまとめた1枚の表」は,今後,統計学に取り組むうえで,役に立ちそうな気がする。

 

 

 

 

分析軸(説明変数)
2グループ間の比較 多グループ間の比較 連続値の多寡で比較 複数の要因で同時に比較

連続値

 

平均値の違いをt検定 平均値の違いを分散分析 回帰分析

 

重回帰分析

 

あり/なしなどの二値 集計表の記述とカイ二乗検定 ロジスティック回帰

その他「統計学が最強の学問である」には,統計学の数学的な説明にあまり入り込まずにあれこれ書かれているのだが,それだけにどうも「専門的」なことまではわかった気がしないというのは事実である。でもαとしては優れていると思う。

統計学の使われ方

さて統計学の手法が何に使われるかについて,「統計学が最強の学問である」は,次の6つをあげる。

①実態把握を行なう社会調査法

②原因究明のための疫学・生物統計学

③抽象的なものを測定する心理統計学

④機械的分類のためのデータマイニング

⑤自然言語処理のためのテキストマイニング

⑥演繹に関心をよせる計量経済学

私としては,④⑤⑥あたりが興味の対象だ。ただ最初は⑥を入口にすべきだろう。これについては,「原因と結果の経済学」(著者:中室牧子他),この本の末尾に「因果推論を勉強したい人に第一におすすめしたい本」として挙げられている「計量経済学の第一歩―実証分析のススメ」(著者:田中隆一)を読むのがよいだろう。統計学を含む広い観点から,因果関係を検討する「原因を推論する:政治分析方法論のすゝめ」(著者:久米郁男)も,お薦めだと思う。買っただけで目を通していないが「データ分析の力 因果関係に迫る思考法 」(著者:伊藤公一朗)もよさそうだ。

これらのうちの1,2冊で計量経済学の概要にあたりをつけて,「統計学は最強の学問である」を参照しつつ,統計学を勉強する運びとなる。

統計学については適当な教科書を選べばいいのだろうが,勉強しているのがどのあたりの議論かといういことを把握するため,「統計学図鑑」(著者:」栗原真一他)を参照するのがよさそうだ。なおこのあたりの本の紹介は,現在進行形,未来進行形だ?

統計学と数学

統計学は,数学的な処理を前提とするので,数学的な素養も必要だ。

そこで私は,今後,まず,「計量経済学の第一歩―実証分析のススメ」(著者:田中隆一)を頭に入れて,「改訂版 経済学で出る数学: 高校数学からきちんと攻める」(著者:尾山大輔他),「経済学で出る数学 ワークブックでじっくり攻める」(著者:白石俊輔 )を勉強しようと思っている。それに加えて「大学初年級でマスターしたい物理と工学のベーシック数学」(著者:河辺 哲次)がほぼ理解できれば,私が通常読む本の数学的な処理については,問題がなくなるだろう。急がばまわえれだ。

法律学と統計学

ところで,法律学や律実務についても,少なくてもアメリカでは統計学的な手法が取り入れられている。翻訳されている「法統計学入門―法律家のための確率統計の初歩 」(著者:マイクル O.フィンケルスタイン)という本があるが,同じ著者のより詳細な「Statistics for Lawyers」があるが,未購入である。「数理法務nのすすめ」(著者:草野耕一)でも,確率,統計に多くの頁が割かれている。

なお「「法統計学入門」は,木鐸社の「法と経済学叢書」(11冊が刊行されている。)の一冊である。「法と経済学」において,経済学的分析や統計学に基づいた分析が行われるのは当然であるが,さて,それがどれほど立法や法解釈に生かされているかが問題である。

統計学の付録-統計局の学習頁

総務省統計局(「日本の統計の中核機関」と紹介されている。)のホームページに/,イラストがきれいな「統計学習サイト」があり,「なるほど統計学園」,「なるほど統計学園高等部」に分かれている。また「統計力向上サイト データサイエンス」もあるし,「データサイエンス・オンライン講座 社会人のためのデータサイエンス演習」も提供されている(gaccoでの受講)。統計ダッシュボード,You-Tubeの統計局動画,facebook,日本統計年鑑にもリンクしており,実にサービス満点だ。

だが,ほとんど利用されていないだろうな。例えば,多くの労力と費用をかけて作成されたであろう「動画」の視聴回数が,数百から数千だ。ネット上で需要拡大をするにはどうしたらいいか,本当に難しい。統計局は,人工知能の松尾豊さんや,上記の「統計学が最強の学問である」の西内啓さんを動員したが,だめなようだ。

でも私はこういう孤独の影がただようホームページは好きだな。これらの企画がなくならないうちに,せいぜいアクセスしよう。