まとめサイトなどにも取り上げられ、やや話題になったこのグラフ。2013年(2015年)の死因構成をグラフ化したものということですが、これに対してたくさんの「若者がやばい」的コメントが寄せられていました。ちなみに、グラフの作成者はツイート主である舞田さんの模様。データ系のブログなどを運営している方ですね。



graph01
一応画像も。

曰く、「日本、滅びます。若者に希望のもてる社会にと、思ってます。」、「異常事態です!」、「社会が病んでる‥」etc。しかし、このグラフは必然的にそういう結論を導くものなのでしょうか? 今回は、このグラフに潜む(ある種の)詐術について考えてみたいと思います。

コメントには、比較的冷静な意見も見られます。たとえば、「縦軸は何で取ってるんですか?」。「割合で表示するのはなんとなくアンフェアな気がする。」、「印象操作に使えるなあ。」など。

graph02

そう、まず根本的な問題としてこのグラフ、縦軸が何であるか分からないんです。「人数」なのか「割合」なのかで、大きく意味合いは変わってきます。もちろん、データ元とされている厚労省の「人口動態統計」を見れば済む話ですし、内容を見るにどう考えても「人数」であるわけはないのですが(20歳から100歳までほぼ同じ人数が死亡しているとは考え難い)、それでもこういったかたちでグラフ化するなら、きちんと書いて欲しいところです。舞田氏ご本人も「若いモンは病死が少ないから当然」とおっしゃっているので、なかば分かってやっておられるのかもしれません。(もしかすると前後のツイートでそれについて言及があったのかもしれませんが、ツイログ等がなく確認できなかったのでこのあたりは定かでありません。なのであくまで、このツイートのみで何かを判断する、ということを前提とします)

で、一応見に行ってみました。厚労省の人口動態統計(平成25年)。

 ▼人口動態統計概況(平成25年)

jinkoudoutai2501jinkoudoutai2502


おそらく、p.36~37の表をグラフ化したのが、くだんのツイートです。内容は、年齢別(5歳くぎり)の死亡原因1位~5位の「人数」および「死亡率(ただし、人口10万対)」を書いたものです。ちょっと確認してみましょう。

舞田氏が真っ黒に塗りつぶして強調している20~40歳代の死亡原因第一位は、自殺で間違いありません。その人数は、20~24歳が1250人、25~30歳が1423人、30~34歳が1598人、35~39歳が1977人です。60~64歳の死亡原因四位も自殺ですが、その数は2306人。若年層の自殺者数は、人数としては少ないということになります。

ちなみに、60~64歳の死亡原因一位である悪性新物質(癌など)では、30891人が死亡していて、文字通り桁が違う。

また、舞田氏のグラフは「死亡原因1位~5位の中に占める割合」を示しているのか、各年齢層の全死亡原因中に占める当該死因の割合なのかが、いまいち判然としません。(6位以下の死亡原因で死んでいる人も多数いるのでそれを考慮したグラフなのか、それともあくまで1位~5位しか問題にしていないのか)

ちなみに、全死亡数を考慮する場合は資料の9Pにデータが掲載されています。

graph03

数値のほうに注目すれば、(5歳区切りで見た場合)20代の自殺者数は、50代終盤から60代前半の自殺者より数が少ないのですから、「若者にとって生きやすい」あるいは相対的に「中高年にとって生きづらい」社会であると言えるかもしれません。いや、しかしそれぞれの年代で人口比率は違いますから、これも簡単に結論付けるわけにはいかないか。

……ということを考えていけば、何をピックアップしてどう並べたかもよくわからない舞田氏のグラフが、いかに曖昧なものかが分かるでしょう。また仮にこのグラフが「各年齢の死因上位1~5位の割合」を示したものだと明言していたとしても、そこから私たちは何を読み取れば良いんでしょうか? 正直、曖昧すぎて何も読み取れない……あるいは、いくらでも好きなように読めてしまうから意味がないと思います。

ちなみに、私は舞田氏の主張が正しいか間違っているかを問題にしているわけではありません(こういうことを書いておいても、正しいか間違っているかの二分法で判断される方がいらっしゃるのだとは思いますが)。日本の若年層自殺率が高い、というのはしょっちゅう話題になっていることですし。

 ▼「20代の自殺率はどの世代より高く就活自殺と学生自殺は最多-先進国で日本だけ若者の死因トップが自殺」(ガジェット通信)
若年層で死因トップが自殺となっているのは先進7カ国で日本のみで、その死亡率も他国に比べて高いものになっています。

ただ、こういう言説もまた「うのみ」にしてはいけない。自殺死亡率が高いということは、病死や事故死が少ないということでもありますから、国内の医療やインフラ・警備体制が非常に整っているということの裏返しなのかもしれません。実際日本は、「治安の良い国」として知られているわけでしょう? 他の死因が減れば、自殺の率は必然的に上昇するのですから。また、人数的に見れば、日本の半分ほどの人口のフランスで、若年層の死亡者は日本より割合が多いことになる。その辺を無視して考えるのはいかがなものか。もし20~25歳の死亡者が10人で、うち8人が自殺だったとしたら、この年代の死亡原因における自殺率は80%です。それでも大騒ぎするのでしょうか?

極論と思われるかもしれませんが、ことはデータの読み方の原則の問題です。「若年層の自殺問題」をただしく確認しようと思えば、単に年齢別の自殺人数や割合を調べるだけでなく、人口全体における若年層の死亡数や死亡原因をこまかく比較する必要があるはずです。

しかし、それは非常に根気がいるし面倒だし、やってみたところで明確な結論が出てくるか分からないわけです。そこで、データのほうを自分の都合のいい部分だけで解釈する、ということになるんですね。

結局舞田氏のグラフに多くの人が脊髄反射的にコミットしてしまったのは、

 (1)権威ある引用元が書かれてある
 (2)見やすく分かりやすい形式(グラフ、色付け等)におとしこんでいる
 (3)ある種の人が望む結論を導きやすいよう誘導している
 (自殺を黒く塗り、「自殺の膿」とコメントしたり)
 (4)ややこしくなりそうなことはうまく取り除いている

というところだと思います。他人に効率的に主張を伝えるための情報の取捨選択が巧いんですね。いやらしく言えば、見せかけのわかりやすさを演出するのが巧い。

こういうわかりやすさは、どうしても正確さと両立しづらいところがあって、嫌う人はすごく嫌います。私はある種のわかりやすさというのも大事だと考えていますが(自分ができるかはともかく)、まあある意味では、どうせ誰も確認しないだろうとか、誰も気づかないだろうという感じで相手のことをナメていると取られても仕方がないのかもしれません。

実際、TVなんかで一瞬だけ表示される「番組調べ」の棒グラフなんかは、縦軸がめちゃくちゃだったりすることがしばしばあります。ああいうのは、ちらっとしか映らないし検証もろくにされないのをいいことに、印象操作をしているわけですよね。

そして、そういう手口は何だかんだで「害悪」だと思います。ある問題について真剣に考え、解決のいとぐちを探ろうというときに、嘘やデタラメで塗り固めた部分というのはすぐ剥がれ落ちるし、それがかえって問題の本質を見えにくくするというのはよくあることです。たとえば朝日新聞の捏造問題なんかはその典型でしょう。日本の戦争責任について考えたい、という問題意識があったとしても、それを大げさに吹聴するために捏造記事を書いたということになれば、本質とは関係ない部分でしょうもない争いが起こるし、また周りに集まってくる人はろくすっぽ自分で考えない脊髄反射の「大衆」にしかすぎないわけです。およそ未来に繋がるやり方だとは思えない。

ちなみにちょっと調べていたら、舞田氏は過去、このようなツッコミも受けていました。

 ▼「博士課程修了者の多くが行方不明・死亡したと称するデマについて」(こりゃ、ほたえな)
舞田敏彦は、2012年に「博士が100にんいるむら」と同様のデマを流している。

記事のタイトルを煽情的な「~の惨状」とした上で、「(8)死亡・進路不明」を勝手に「死亡・行方不明」と読みかえて、不安を煽りたてている。かれは単なる書きまちがいだと言い訳するかもしれないが、ここだけが切りとられ、一人歩きして、当時はそうとうTwitterを賑わせたものである。

すぐに多くの批判が寄せられたが、大半は語彙の改竄についてではなく、統計処理の方法についてであった。そのため舞田敏彦は数日後、「分析の不備を補正する」と称してブログ記事を書いたが、けっきょく「進路不明」を勝手に「行方不明」と読みかえたことについては、謝罪も撤回もしないままであった。

やや感情的な論調ですが(この記事の最後に載ってる舞田氏とのツイッターでのやりとりは、たいへん趣深いものがあります)、これに続く下の部分などは、私が今回の記事で述べていることと大筋では同じ内容であると思われます。この方のブログのほうがコンパクトでまとまった言い方になってますね。

舞田敏彦が、冒頭ツイートにかかげるグラフにも問題がある。各専攻の人数が明らかにされていない。統計を専門的に行う者なら、サンプルのサイズやその偏りはとうぜん考慮するはずだが、舞田敏彦は社会統計学を専攻したと称しながら、まったく考慮した形跡がない。

2013年の調査対象となった学部別の学生数は、55万8853人である。一方、博士課程の修了者数は、わずか1万6440人である。約34倍の差がある。これだけサンプルサイズが異なるのに、同程度の精度で比較できるとでも言うのだろうか。

私は、氏がデマを流そうとしているのかどうなのかということは知りませんし興味もありませんが、引用した件と今回の件はどちらも統計処理の方法に問題があるというのは同意します。そのデータからその結論は早すぎる。そして、似たようなことは日本じゅういたるところで起こっているだろうとも思う。

私たちは胡散臭い手口に騙されないために、あるいは自分が胡散臭い手口に手を染めてしまわないように、データがじゅうぶんであるかチェックし、ソースを確認し、他の見方ができないかを探る慎重さを持つべきではないでしょうか。データはそこから情報を読み取る素材にすぎないのであって、特定の結論をみちびくために都合よく使ったり、自分の思い込みを強化するために用いるものではないのですから。