エッセイ37　統計を疑う

入口＞トップメニュー＞ワインとＣＧと祈り＞現ページ

統計を疑え！　　　　　　(2009年 1月25記載)

　僕は、常々"統計"と言うものを疑っている。大学時代、経済学部だったので統計学の講義を取ったが、それでも世の中のメディアが扱う"統計"については、昔から常に疑っている。ベンジャミン・ディズレーリと言う人のこんな格言がある。｢嘘には、３つの種類があるものだ。嘘と大嘘、そして統計学である｣(※ベラの格言より引用)。

　"統計"と言うものの重要性は理解している。例えば、物理学や化学などの科学では、観察や実験のデータを蓄積していって、科学的考察や仮説の証明の根拠とする。再現性の高い科学の分野では、統計データはかなりの正確性を持っていると考えられる。医学などでも、治療法の確立等にデータの統計的蓄積はたいへん重要である。
　しかし、統計と言うものが、社会科学分野の領域に移行すると、次第に統計データの確実性・信頼性が落ちていく。今回は、これについて考えてみたいのである。

　統計と言うものの正確さについて、僕は自分自身で実験をした事がある。半分遊びなのでたいした実験ではないけれど、その実験は次のようなものである。ＰＣがウィンドウズマシンなら、フリーセルと言うゲームがインストールされていると思う。僕はＣＧ制作業なので、事務所に複数のＰＣがある。そこで、４台のＰＣでフリーセルのゲームをする。条件をなるべく同じにするため、ゲームの設定を全部統一し、どのＰＣでもゲームをするのはお昼休みと休憩時のみに限定する(当たり前か…仕事中にゲームをしているようじゃ困ったものだ)。
　フリーセルは、コンピューターが自動的にゲーム(カード配付)を決めるので、どのような難易度のゲームが提示されるかはこちらには分からない。だから、勝負回数が少なければ勝率にはかなりのバラツキがでる。５戦しか対戦しなかったら、ＰＣによって勝率２割(１勝４敗)だったり、勝率８割(４勝１敗)だったりするかもしれない。しかし、何十戦、何百戦と続けていくうちに、勝率はどのＰＣでも同じような値に近づいていく"はず"と仮定する。結果は、仮定通りの結果を示すだろうか？
　これは、サイコロの目の出方にも言える。たいへん精密に作られたバランスの良い、１から６の目のある立方体のサイコロを振る。最初、３の目が出たとしよう。もう一回、サイコロを振る。２回連続で、３の目が出るかもしれない。振る回数が少なければ、目の出る率は大きく違うかもしれない。しかし、サイコロを数十回、数百回、数千回と振り続けていくうちに、それぞれの目がでる確立は、限りなく１／６に近づくと考えられる。フリーセルのゲームも、同様に勝率が一定の傾向を示すと勝手に仮定してみる。

　さて、フリーセルの結果は、次のようなものであった。本来なら対戦回数は揃えるべきだが、残念ながら仕事の休憩時の片手間にやっているので、対戦回数は揃える事は出来なかった。この点は、要因としてフェアではない事を記しておく。

Ａマシンでのゲーム：３２３戦／２４２勝　８１敗　勝率７５％
Ｂマシンでのゲーム：７３４戦／５０１勝２３３敗　勝率６８％
Ｃマシンでのゲーム：４５３戦／３２４勝１２９敗　勝率７２％
Ｄマシンでのゲーム：９２５戦／５７６勝３４９敗　勝率６２％

全ゲーム合計：２,４３６戦／１,６４３勝７９２敗　平均勝率６７％

　う～ん…勝率が６２％から７５％と、なんと１３％もの開きがある。対戦回数が増えると勝率が下がると言う傾向はあるものの、１３％の開きである。１３％の誤差は、許容範囲と言えるのだろうか？"人の生き死に"を判断するような重要な事柄なら、１３％もの差異は決して小さいものではない。さほど市民自体の生活には重要とは思われない"テレビの視聴率"であっても、もし１０％もの誤差があったら、(１％の視聴率に凌ぎを削る)放送業界の人々にとっては、それはもはや信憑性が無く、まったく役に立たない数字である。
　１３％の差異…単純な機械的ゲームの数学的な確率の統計的データでも、このようなものである。サイコロの１／６の確立のような、安定した数字にならない。これは、実験の中で、色んな要因が関わってくるからである。思いつくだけでも、次のような要因が考えられる。
①ＰＣごとに対戦数が違う。②ＰＣの繰り出すゲームの難易度が毎回違う。③ゲームをする日の人間の体調や集中力の相違…等々が考えられる。それぞれの要因の小さな誤差が重なり、全体で１３％もの差異になって現れていると考えられるのである。

　さて、ここからが本題で、これが冒頭で述べた"社会科学"の領域…つまり社会的な複雑な要因が絡んでくると、正確な統計的確率を割り出す作業はもっとずっと困難になる。一例として、メディアで時折登場する"電話によるアンケート"による統計調査について考えてみよう。どんな設問でも良いのだが、とりあえず｢今の内閣を支持しますか？｣と言う設問で、１,０００件の電話アンケートを行なったとする。結果が、｢支持する１５％、どちらかといえば支持する２０％、支持しない３５％、どちらかと言えば支持しない２５％、どちらとも言えない５％｣だったとする。それをテレビのニュースや新聞報道で、電話調査の結果として発表して、一般の人は｢ああ、この内閣は支持されていないんだなぁ～｣と、漠然と判断する。
　だが、ちょっと立ち止まって、この調査についての問題点を考えて欲しい。

　まず第一点目、調査の対象者の選定。電話調査の対象者は(調査実行者の意図的作為を排除するため)無作為抽出だと仮定しても、調査対象者が限られる事は確実である。考えても欲しいのだが、仕事のため会社で働いているＯＬや、営業で外を歩き回っている営業マンが、日中これらの電話調査に協力する事は(仕事の休日でもない限り)ほぼ不可能である。電話調査に協力できるのは、①その時に家にいて、②電話対応できる時間があって、③アンケートに応える意思がある、と言う要件を満たした人だけになる。つまり、アンケート調査対象者は、主婦や自営業の人など、一部の限られた人になる。外回りの営業マンや、私用通話のできないＯＬは、アンケート調査に協力する時間も環境も無い事は明らかである。つまり、上記の電話による内閣支持アンケートは、サラリーマンやＯＬの意見はほとんど反映されていないことになる。無作為抽出と言っても、自ずからアンケート対象者には限界があるのである。

　問題点の第二点目は、調査の数。１,０００件程度のアンケートで果たして、全国的な傾向と言えるのか。統計の手法では、｢○○の確率を知りたければ、××万件調べれば、おおよそ統計学的に正しい数字となる｣としばしば言われる。"分母の数"と"調査の数"が、近ければ近いほどより正確な数字となるが、調査を行なう側としては調査数が少ないに越したことはない。一つの職場とか学校などの"目的"と"対象"の限られた分母の小さい調査なら、全員に近いデータを取る事は可能かもしれないが、国全体のような分母の大きい統計調査では、全員の調査は不可能である。５年に一回の国勢調査でも、その実行には多額の資金と労力が必要である。資金と人員の限られた一企業のアンケートのような調査では、国勢調査のような規模のデータ収集は不可能である。そこで、少ない対象者の調査で、なるべく全国的な傾向と相違しないような方策が模索される。都会と地方、関西と関東、民間人と公務員、その他様々な要因から、特定の人に偏らないように、その数の比率に応じてアンケートを取る必要がある。
　しかし、市町村の数だけでも３,０００近く存在する。色んな主義主張の団体、様々な経済活動を行なっている企業の数は、それ以上に存在する。１,０００件程度のアンケートで全国的傾向を推し量るのでは、統計学的手法云々を言うまでもなく、相当頼りない根拠データであるのは明らかだ。一例として、総務省の統計局が発表している"推定値の大きさ別標準誤差(基本集計)"と"推定値の標本誤差(詳細集計)"を上げると、次のようなものである。

　

　全国規模の推定値の大きさ別標準誤差を見ると、１０万人の調査でも１３％近い誤差が生じる可能性がある。まして、１,０００件程度で、どの程度の正確な推定値が得られるのだろうか？甚だ疑問である。調査をしないよりはやった方が良い…程度の調査なのか？
　アンケートの統計上の数と、本当の実数との相違を確認する研究と調査が、どこまで行なわれているのかも疑問だ。マスメディアが選挙の度に、出口調査で打つ当確情報だが、メディアによってその数が相違している。時には、当確の"誤報"も頻繁に出る。同じような統計学的手法を使っているはずなのに、メディアによって数がバラバラ。それだけ相違していても、次回もまた同じ間違いが繰り返される。

　問題の第三点目は、調査の内容。設問の仕方によって、アンケートの答が左右される事がある。別のコーナーでも触れた事があるが、例えば｢海外派兵につながる自衛隊の国外での活動に賛成ですか？｣と｢国際的な平和貢献となる自衛隊の国外での活動に賛成ですか？｣と言う設問があったとしたら、同じ"自衛隊の海外での活動"を問う質問なのに、前者では"戦争"を想起させ"No"と言う意見に誘導し、後者では"平和"を想起させ"Yes"と言う意見へ誘導する傾向が高くなると考えられる。メディアの作為的な意図がアンケートに混入していないか、どうか。

　問題の第四点目は、応える側の心情や態度。家族や友人の間では、政府や官庁や企業の悪口を散々言っていても、公なアンケートととなると身構えて本心とは違う事を言うかもしれない。先ほどの出口調査にしても、投票した党や候補者の名前を、見知らぬメディアに対して正しく伝えなければいけないと言う義務や法的根拠は何もない。事実、先日僕のところへも公の機関の調査票が来たが、ある事に関する正確な分数を記入するところを、大雑把に１０分と記入した。実際は、７分４５秒かもしれないし８分３０秒かもしれないが、調査票のために仕事の時間を犠牲にしてまで、ストップウォッチで測っているほど暇ではないし、そうする義理もない。他の人にしても同様だろうし、そもそも調査票を開封もせずそのままゴミ箱へ投げ捨てる人もいるだろう。こうして集められた調査票の一つ一つの誤差は、全体ではかなりの誤差になるはずである。

　他にも問題点を挙げる事はできると思うが、社会的な統計調査がいかに難しいかお分かりいただけると思う。物理学なら、同じ場所から同じ物を落とせば、ほぼ同じ結果が得られるかもしれない。そこに働く要因の数が、社会科学に比して圧倒的に少ないと考えられるからだ。
　しかし、社会科学は、あまりにも関連する要因が多い。同じ家族でも、趣味や嗜好が一緒とは限らない。同じ会社に勤めていても、才能とその能力の程度はバラバラ。収入も違うし、お金の投じ方もバラバラ。同じ日本に住んでいても、住んでいる地域が違えば、風習や考え方もバラバラ。否、隣同士ですら同じではない。同じ一人の人間を取っても、決して毎日同じではない。昨日は牛丼を食べたかったのに、今日は天丼を食べたいと思うかもしれない。
　"そんなこんな"のありとあらゆるミクロな要因の変数を考慮に入れて、全体としてマクロでとらえなければならない。物事はミクロな細部に宿っているが、これらを全部一つ一つ正しく捕らえるのは不可能に近い。でも、面倒だからと言って、途中を省略してマクロの結果に合うように辻褄を合わせようとすれば、天動説の星の運行のように、どこかに皺寄せが行って、結局無理な論理で埋め合わせていき、その方程式は最後は破綻する。経済の理論の多くが、そうして破綻したし、今後も破綻していくだろう。このように経済の学問と言うのは、物凄くたいへんな研究なのである。
　Ａから発生するＢと言う社会的な事象の結論を求めるのに、Ｖ、Ｗ、Ｘ、Ｙ、Ｚの５つの要因の変数を考慮する必要があるとする。Ｖの変数の誤差が僅か５％だけあるとする。以下、ＷからＺまで、やはり５％ずつの誤差があるとする。そうすると、Ａを１００とした場合、Ｂは最大２３％もの誤差が生じる可能性がある。たった５つの要因で、各要因の誤差が５％しかなくても、２割も結果が異なる可能性があるのである。しかし、実際の社会的事象を考察するには、たった５つの要因と言う事は有り得ず、更に数多くの細かな要因を組み入れる必要がある。それらの要因をすべて考慮するのも至難の技だが、一つ一つの要因にどれだけの誤差が存在するのかを調査するのも至難の技である。再び総務省統計局のデータを下記に示すが、｢労働力調査｣と言う目的の限定された調査でも、下記のような多数の要因が式に組み込まれている。人口数などは、５年毎の国勢調査に基づいている。

　我々は、ＧＮＰのような最終的・確定的なマクロの数字は、日頃あまり疑う事は無いだろう。しかし、｢どこどこのチームが優勝したら経済的効果は○○億円｣のような数字は疑う必要がある。デパートの売上げ増、飲食店の売上増等、様々な経済効果があるのは確かだろう。これらの計算式には、あらゆる要因(変数)を入れ込む必要があるが、そのチームが優勝した事により、他の地域の経済には逆効果をもたらしている事もあるだろう。
　最近よく目にする商品のモニター・アンケートも、たいへん怪しい。はっきり言って、交通費や謝礼などの金品をもらって出向き、わざわざ"商品"を悪く言う人はいない(※実際、私の友人もそんなバイトをしていたが、みんな適当に良いことだけ言ってお茶を濁していたそうだ)。仮に評価の良くない部分があったとしても、その部分は公表せず、評価の良かった部分だけを公表すれば、消費者に好印象を与える事ができる。
　週刊誌等のメディアに登場する統計調査も、気をつけて見た方が良い。｢女子高生の○○率は××％！!｣のような記事はセンセーショナルだが、わざと読者を勘違いさせるように導くデータの用い方をしてあって、実際は｢△△の条件に当てはまる女子高生｣や｢◇◇別の女子高生｣のように限定されていたりして、意図的に読者が勘違いするように仕組まれていたりする。また、週刊誌は、経済に大問題が発生した時に、実際の予測がどうであれ｢株価は上がる!｣なんて絶対に書かない。株価が下落しまった時に、読者にその責任を追及されないためである。週刊誌の記事、ジャーナリズムなんて、そんなものである。
　過去の例を見ても分かる通り、国民から集めた税金を使って調査をしている政府機関だって、自分に都合の悪いデータは公表しない。野党議員に問い詰められて、しぶしぶ小出しにする程度である。本来、公平でなければならない公僕の官公庁だって、そんなものである。また公表されたデータも、公の機関が出したデータ物だからと言って、そのまま受け入れるのも危険だ。定期的に失業者数が発表されているが、この数字には、実質的には失業者なのにバイトでわずかでも収入のあった人間、仕事が無く家事をしている人間、労働条件が規定以下の過酷な労働を強いられているのに辞められない潜在的失業者…などの数字はすべて除かれている。｢失業者の線引きが為政者側に都合が良い(?)｣と勘ぐりたくなるほど、行政側の発表している失業者数は随分と過少に"仕立て上げられた"数字に見える。
　メディアに度々登場する総務省の家計調査の"平均貯蓄額"も疑ってほしい。統計の額が間違っていると言う意味ではない。平均貯蓄額が"１千数百万円"と聞いて、｢ええ？そんなに貯金無いよ～！みんなそんなに貯金してるの！？｣と思った人は多いはずだ。安心してください。国民の大多数は平均貯蓄額の貯金を持っていません。あの数字は、一部の莫大な貯蓄を持っている人の貯金額が、平均額全体を滅茶苦茶押し上げているのである。だから、テレビ画面に平均貯蓄額を示して、｢日本の国民はなんだかんだ言って、他の国に比べたらまだまだ金持ちだ。心配ない。｣なんてしたり顔で発言しているテレビのコメンテーターがいたら、その人はさっさとコメンテーターを辞めた方が良い。
　色んな例を一つ一つ示したが、僕が言いたいのは、統計上の数字と言うのは、対象者の選定、サンプル調査数、設問や調査の内容、そして公表の仕方等によって、ある程度どうにでもコントロールできると言う事であって、何もかも鵜呑みにしない方が良いと言う事である。メディアに登場する円グラフや棒グラフやセンセーショナルな数字は、一度疑ってみる事をお薦めする。

　さて、統計学と切っても切れない関係にあるのが経済学である。経済学に関しては、こんな格言がある。｢経済学者とは、昨日予言したことが、なぜ今日起きなかったのかを、明日になってから知る専門家である｣(ローレンス･Ｊ･ピーター／ベラの格言からの引用)。
　(経済学士の僕が言うのは自己否定みたいで何なのだけれど)この皮肉でブラックな格言には、なかなか感心している。２０世紀末のバブル崩壊の時、学者がバブル崩壊を食い止めるために何かの役に立ったか…政府の御用学者達に問い尋ねてみたいものだ。｢あなたはバブルだと分かっていたのでしょ？何故、適切な方策を当時の政府に強く進言しなかったのですか？｣と。もし仮に、｢えっ？バブル経済を理解していなかった？言語道断、すぐに経済学者辞めなさい｣…である。当時、学生の僕ですら"バブルは遅かれ速かれ弾ける"と理解していた。バブルな数字は、遅かれ早かれ実体経済の数字に戻らねばならない。就職の面談でも、そう答えていたくらいだから。サブプライムローンをきっかけとした経済危機も、まったく同じ観を抱いている。米国の高給取りの政府御用学者さん、あなたは一体何をしていたの？自然を観察していれば分かる事は、いっぱいある。増えすぎてしまった種の動物は、自然淘汰によってある時点で減少に転じ、他の生物との均衡を保つようになる。経済だって例外ではないのだ。経済活動をきちんと観察、分析していれば、自ずとシステムや結果が見えてくる。
　本来、科学とは、事実を観察したり、実験で再現したりして行なう学問である。しかし、社会科学の領域では、過去往々して"事実を観察する事"の上位に"こうあるべき""こうでなければならない"と言う"哲学な考え方"が優先してしまった。おかしな話である。事実(※真理とは違う)を研究してるはずなのに、"現実はこうでなければならない"に逆さまになっている。経済学でも歴史学でも最近の環境問題にしても、そう言う傾向が多々見られる。科学の視点を持たないそう言った学者先生方は、科学者の看板を下ろされた方が良いと思う。特に、日本では"観念優先"傾向が高いように思う。
　本来、経済学は科学として、数学や統計的手法を駆使する非常に困難で難しい学問である。ところが、実際の経済学者を見ていると、｢本当にあなたは高度な数学を駆使できるのですか？統計データを収集したり、解析できるだけの能力があるのですか？｣と問いたくなる人で満ち溢れている気がしてならない。その学者の本を読めばすぐに分かる…その学者が、"正しく科学する目を持って客観的に経済学の研究に励んでいるのか"、もしくは"主観的な思い込みや信念だけで書いているのか"。一方的な"思い込み"の恋愛は、(稀な例を除いて)たいてい成就しない。現実の"彼女"と言う存在をしっかり見つめないとね。
　社会科学を志している人は、統計と統計学に関する知識や技術を含め、数学的思考をもっとしっかり学んだ方が良いと思うのである。

　今回は、統計と統計学にまつわるあれやこれやを、徒然なるままに書き散らかしてみました。

完全独習統計学入門
新品価格
￥1,944から
(2014/11/12 12:28時点)

統計学入門 (基礎統計学)
新品価格
￥3,024から
(2014/11/12 12:29時点)

統計の9割はウソ: 世界にはびこる「数字トリック」を見破る技術 (一般書)
新品価格
￥1,296から
(2014/11/12 12:30時点)

ウソを見破る統計学―退屈させない統計入門 (ブルーバックス)
新品価格
￥972から
(2014/11/12 12:31時点)

２０１２年６月３日追記：「統計を疑え！」と言うこの記事で、マスコミのアンケート調査の問題点を書いたけど、先日あからさまな世論誘導としか思えないアンケートがあった。５月某日の某マスメディアの「原子力発電」に関するアンケートの結果報告なんだけど、これがどう解釈しても公平とは思えない設問。
例えば、①「将来長年に渡り環境や健康に被害をもたらす可能性があり、かつ莫大な費用支出が想定される原発は必要だと思いますか？」と言う設問と、②「電力が不足することが明らかに予想される場合、原発は必要だと思いますか？」と言う設問の場合、①の場合「原発はいらない」と言う割合が増えるだろうし、②は「原発は必要」と言う割合が増えると考えられるでしょう。
前述の某メディアのアンケートは、正にこの後者のタイプで、どう解釈しても「原発必要」へ世論誘導しているとしか思えない。このメディア、前から企業や官僚の"代弁者"的な傾向が強いと思っていたのだけど、こう言うアンケートを見ると、原発関係者や電力会社の代弁者としか思えない。