ちょぴん先生の数学部屋

数学の楽しさを、現役メーカーエンジニアが伝授するぞ!

「コロナ対策に自粛は無意味だ~!」というデマにご注意!!その3~データは嘘を付かない。しかしデータを使って嘘を作ることはできる~

その2で終わるはずでしたが、それを遥かに上回るトンデモグラフが出現してしまったので、急遽その3を作成することにしました。(今回の記事では、大分言葉遣いが荒くなっています。苦手な方はブラウザバック推奨です)

 

そのグラフがこちらです。発信者は、またしても京都大学藤井聡教授。。。

 

その1の記事で取り上げたグラフとは全然比較にならないレベルの、ツッコミどころ満載のグラフです。

 

何と言っても、縦軸です。

見てくださいよ。左側の縦軸が2桁の数字、右側の縦軸が6桁の数字、、実に4桁も大きさの違う縦軸が、仲良く共存しているんですよ。。見た瞬間に呆れたを通り越して腹を抱えて笑ってしまいました。

 

この数字たち、2重の意味でおかしいんです。

 

[問題点その1]

まず、そもそもですが、このグラフの内容自体を説明しておきましょう。

 

2020年以降の新型コロナウイルス、通称COVID19の感染者数の推移と、2019年以前の在来コロナウイルス(風邪の原因のひとつ)の感染者数の推移を比べて、「ほとんど一緒じゃん」と述べています。それを以て、いつものように「自粛に意味はなかった」という結論に持って行っています。

 

この説明で分かる通り、縦軸は「感染者数」を意味しています。

縦軸が感染者数だと思ったとき、果たして「左側の縦軸が2桁の数字、右側の縦軸が6桁の数字」というレベル感は妥当なのか?

 

常識の範疇で十分に察せられる(笑)とは思いますが、一応検証してみましょう。

 

(1) 左軸の2桁の数字(=在来コロナの感染者数)について

これは、フェルミ推定の手法で考えてみるとよいと思います(トンデモすぎて、フェルミ推定なんて持ち出すのが忍びないレベルではあるんですがね。。)

 

まず、学校に40人のクラスが4つあったとして、経験上1人くらいは体調を崩して休んでいるでしょう。ここから、「全人口のうち200人に1人は風邪を引いている」とざっくり考えてしまいましょう。

 

在来コロナは風邪の一種なのですから、このうちの何割かがコロナによる風邪になるでしょう。風邪になる原因は、気温の変化、過度な運動による疲れなど色々あるので、コロナ起因は10人に1人くらいの割合だと思いましょうか。

 

トータルすれば「全人口のうち、2000人に一人がコロナ起因の風邪を引いている」と推論できます。日本の総人口は1億人程度ですから、概算すると、在来コロナの感染者は、5000人程度となります。(1か月でこの程度なら割といい線いってるかもしれません。)

 

最初から分かっていたことではありますが、1か月に2桁なんてまずありえませんね。

 

[2/6 追記]

なぜ左軸の数字が異常に小さいのか、理由が分かりました。

ヒトコロナウイルス(HCoV)感染症の季節性について―病原微生物検出情報(2015~2019年)報告例から― (niid.go.jp)

新型コロナの感染者は「全数報告」になっているのに対して、在来コロナはその義務がないため7か所の地方衛生研究所からの情報のみになっているからだそうです。つまり、感染報告の数え方の違いに起因するものでした。

情報提供頂いた、おざけん(@ojaojaujauja)さん、ありがとうございました。

 

もっとも、それにしたって少なすぎる気がするのですが・・

 

[2/9追記]

さらに、在来コロナのデータについては次のような注釈が付いています。

 

「ウイルス学的に近縁であることからcHCoVと同様な動態を示す可能性がある一方、世界で蔓延し多くの人が過去に罹患していると考えられるcHCoVと新たに出現し大部分の人が感染歴をもたないSARS-CoV-2では、感受性者の分布が異なる可能性がある等のため、異なる動態を示すことも考えられる。(中略)病原微生物検出情報への報告は地衛研・保健所から任意に行われており、バイアスが含まれる可能性がある。

 

このように偏りのあるデータの可能性があることを念頭に置いてグラフを見ないといけません。

 

(2)右軸の6桁の数字(=新型コロナの感染者数)について

こちらは、とりあえず公式情報でファクトチェックをしましょう。

厚生労働省のHP(国内の発生状況など|厚生労働省 (mhlw.go.jp))に記載されている陽性者の推移は下のようなグラフになっています。

画像

ここ最近は軒並み1日当たり4桁オーダー、月単位で見れば最大5桁オーダーの数字で推移しています。

ちなみに、藤井氏のグラフの縦軸が「累計感染者数」だとすれば6桁オーダーで一応合致します。しかし、累計の数字だと仮定すると途中で減少することはあり得ません。なので、累計ではない月別の感染者数と解釈すべきです。

 

よって、どう取り繕っても、縦軸が6桁というのはおかしいという結論にしかなりません。

 

[2/6追記訂正]

上の厚労省のグラフの元データのexcelがありました。

https://www.mhlw.go.jp/content/pcr_positive_daily.csv

このデータを使ってプロットすると、藤井氏のグラフが再現できました。

f:id:stchopin:20210206062805p:plain

なので、右軸については妥当なことが分かりました。この点を訂正いたします。

ご指摘いただいた、おざけん(@ojaojaujauja)さん、ありがとうございました。

 

[問題点その2]

上記だけでもお腹一杯でしょうが、問題点その1が仮に正しかったとしても、データ処理が明らかにおかしいです。その心は、

「4桁も違う数字の推移を並べて、似ているかそうでないかを論じている」ことの滑稽さです。

 

6桁の「新型コロナ」のデータに対して、2桁の「在来コロナ」のデータなんて、ゴミみたいなもんです。工学的には、ノイズです。

 

実験でデータを取る時、欲しいデータSと、データに乗っかってくるノイズNの割合、通称SN比が重要になってきますが、そのSとNが4桁違えばSN比は、0.01%。率直に言ってありえないレベルの精密な実験で、こんなSN比が実現できれば間違いなくノーベル賞が取れます。

 

そんな4桁違う2つのデータを大真面目に比べているんですから、本当にお笑いです。

 

さらに、2桁オーダーのサンプル数と6桁オーダー数のサンプル数だと、統計データの信頼性が文字通り桁違いです。

 

統計データのバラツキ度合い(=標準偏差)は、サンプルの個数Nのルートで減っていくことが知られています。

今回の場合では、4桁分データの個数が違えば、バラツキは√10000 = 100倍違ってきます。つまり、在来コロナ(2桁)の推移のデータの信頼性が、新型コロナ(6桁の)のそれに対して、1/100しかないと言う事です。

 

こんな頼りないデータを根拠に「推移はおよそ一致している」なんて言えるわけがありません。

 

 

 

という具合に、「本当に名門京都大学の教授が作ったグラフなのか!?」と本気で心配してしまうレベルの、お粗末極まりないグラフでした。藤井先生、大丈夫ですか!?

 

コロナ禍においては、上昌弘氏が同じように縦軸を恣意的にいじったデータを出して顰蹙を買い、「縦軸おじさん」という不名誉な称号を手に入れました。

 

ですが、今回の藤井氏は、それを遥かに上回るトンデモグラフを出してしまったわけです。「縦軸おじさん」の称号は、今日をもって藤井氏に襲名されたと言っていいと思います。

 

最後に、このグラフに関する藤井氏のFacebookでのコメントを貼って、終わりにします。

画像

 

「藤井先生、今回のグラフは自粛の賛成反対関係なく、客観的に見て到底認められないトンデモデータですよ!!」

 

[2/6追記]

このトンデモグラフは、とうとう地上波でも流れてしまいました。発信者は、京都大学の宮沢孝幸准教授。

 ここでは、藤井氏の縦軸疑惑はそのままに、横軸まで疑義が発生しています。

藤井氏:在来コロナの横軸は月単位+新型コロナの横軸も月単位

宮沢氏:在来コロナの横軸は月単位+新型コロナの横軸は日単位

 

新型コロナの横軸を日単位にすれば感染者の数が減るので縦軸が6桁→4桁に減るため、在来コロナの2桁により近づけ、在来コロナの曲線が、新型コロナの感染者推移をトレースしているように見せかけるという、稚拙なトリックです。

 

基本的な話ですが、前提条件の違うデータを比較してはいけません。月単位のデータは月単位同士で、日単位のデータは日単位同士で比べなければ話にならないわけです。

 

旧帝大の准教授ともあろう人が、一体門下の学生にどういう指導をしているのでしょうかね!?

 

宮沢氏には、「縦軸おじさん」だけでなく「横軸おじさん」の称号も差し上げなければなりません。

 

ちなみに、この操作を行った結果、皮肉にも自粛の有効性を示唆するデータになってしまったというオチが付きます(↓筆者のツイート)

 

 [2/10追記]

藤井氏は、一連のグラフについて釈明や撤回をする気は一切ないようです。それどころか、ネットメディアに自説が取り上げられてご満悦のご様子です。

 

www.mag2.com

ツイッター上であれだけ突っ込まれたグラフに対して何の釈明をすることなく、拡散に勤しんでいます。これが良識ある、学者・言論人のすることなのか、甚だ疑問です。

 

[2/24追記]

ついに藤井氏は、自分の学生の修士論文まで利用し始めました。これで、自説が間違っていたとしても「それは学生の主張したことだ」と逃げることができるようになりました。控えめに言って卑怯者以外の言葉が見つかりません。

記事を読みましたが、この修士論文の結論は「藤井氏の主張とほぼ100%一致します」! 

もし一連のグラフや考察をこの修士学生が作成していたならば、本来であれば「データ分析と考察をやり直せ」と修正を求めるのが指導教員たる教授の務めです。しかし、修正どころか素晴らしいと誇らしげに紹介しているわけです。こうなると、可能性は以下ぐらいしかないでしょう。

 

1. 藤井氏が一連のお粗末さに気付いていない。

2. 修士論文のお粗末さに気付いてはいるが、温情で黙認した。

3. お粗末さを承知の上で藤井氏主導で強行した、ないし学生が藤井氏に忖度した。

 

1であれば謝罪撤回すれば失地回復する余地がありますが、学者としての信頼は大きく失墜するでしょう。そして、同氏に撤回する素振りは前述のようにありません。

 

2については、私自身の経験から「多少お粗末な修士論文であっても、就職など学生の将来を左右することになるから、温情で修士号を与える(本音としては、あまり役に立たない学生の面倒を見切れないので追い出したい)」教授はそれなりにいます。同級生に、修士2年間で実験を数回しかやらずに卒業できた人がいるくらいですから。でも、この場合誇らしげに紹介するのは不自然なので、2の説は薄いと思います。

 

これまでの同氏の論調から、考えたくはないですが3の線が濃厚なのではと考えています。

大学院の研究室にいたことがない人はピンとこないかと思いますが研究室における教授は良くも悪くも独裁者です。学生は学位を人質として教授に握られているので、基本的に教授に逆らえません。自説と反する意見・研究結果であっても「これはこれで筋が通っていて面白い結果だね」と認めてくれる度量の深い教授なら全然よいのですが、そうでない自説以外を認めようとしない頑固な教授だった場合が最悪です。もし教授の機嫌を損ねるようなことをすれば、「内定が決まっているのに卒業させてくれない」「アカデミックに残るにあたって便宜を図ってくれなくなる、コネが使えなくなる」といった将来を左右する不利益を被りかねないわけです。

こういった権力構造がある以上、「学生が教授の意向に忖度して、教授の主張に好都合な研究結果を出す」「教授側が、自分の言う通りにしないと卒業させないと学生を脅す」といった現象が普通に起こりえます。藤井氏の過去の言動を見ている限り、おそらく後者の悪いタイプの教授です。

 

もしこの3が合っていれば、自分の思惑通りに修論を書いてくれた学生を褒めちぎり誇らしげに紹介するのは、至って普通ですよね。

 

どうせ返答など来ないでしょうが、私がこれまでの論議を要約して批判差し上げましたので、良ければtwitterもご覧ください。

 

 [3/1,3/4追記]

大学入試を解いていて数日twitterから離れていた間に、こんなツイートをしています。

そして3/3にこんなツイートも

 

「政府がバカで不道徳」なのには私も大いに賛成しますが、一言、「お前が言うな」

数々のおかしなグラフを垂れ流して自粛緩和を扇動していた人が、未だに釈明もせずにいること自体が、バカであり不道徳なのです。

 

私の指摘している通り、「緊急事態宣言が統計学的に効果が無かったとの知見」自体が疑わしいものなのですから、藤井教授こそ釈明をする義務があるのです。さもなければ、非科学的な「自粛は無意味論」によって多くの国民が命の危険に晒されるかもしれないのですから。

 

終わり。