ちょぴん先生の数学部屋

数学の楽しさを、現役メーカーエンジニアが伝授するぞ!

感染者数のデータ分析の仕方 ~速度・加速度の計算~

最近、コロナ騒動に伴って、「緊急事態宣言に意味などなかった」「コロナなんて風邪と同じだ」「自粛はやりすぎだった」などなど、後出しジャンケンで専門家チームを批判する言説が増えています。

 

その一つがこれです。

 

https://www.kk-bestsellers.com/articles/-/554650/2/

藤井聡京大教授「第二波に備え『8割自粛』を徹底検証すべし」【緊急反論③:自粛でなく水際対策の強化が感染を収束させた】)

 

個人的には、つい先日「8割おじさん」こと西浦先生の予言通りに東京都の感染者が1日当たり100人超に増えた事実だけで、この記事の中身は否定できると思っているのですが、twitterを見ていると、ここで用いられているデータの取り扱いそのものに誤りがあるのではという指摘が上がっていました。

 

 

togetter.com

(藤井さん、そのグラフおかしくないですか?)

 

どうも加速度の定義が間違っていませんか?という指摘のようです。

 

ということで、前置きが長くなりましたが、今回は速度・加速度の計算の仕方について、解説していこうと思います。

 

 

 

まず、1日当たりに発見されるコロナ感染者の人数をf(x) 人とします。

xには日付が入ると思って下さい。

 

次に一般的な言葉の定義を挙げておきます。

・「変化の割合」: 増えた感染者の人数を、日数で割った値です。

         式で表現すると、( f(b) - f(a) ) ÷ (b-a) となります。

         要するに、1日当たり何人感染者が増えたかを表す量です。

 

・「速度」: 上の「変化の割合」で、割り算する日数を限りなく小さくしたときの値です。数学的には、f(x)を微分した値、ということになります。

理論上は、bをaに限りなく近づけた場合を考えるのですが、現実には1日ごとにしかデータが得られないので不可能です。よって、今回は「速度」v(a)は、

      v(a) = f(a+1) - f(a) と定義することにします。(※割り算の分母は1なので省略)

 

・「加速度」:速度を微分したもので、速度に対して「変化の割合」を取ったものになります。式を使うと、速度の定義と同じように

 A(a) = v(a+1) - v(a) と定義します。

 

f(x) = x^2としたときの速度と加速度をグラフにまとめてみると下の図のようになります。

<グラフが連続的な時(理想)>

f:id:stchopin:20200704085019p:plain

 

<データが1日おきの飛び飛びだったとき(現実)>

f:id:stchopin:20200704090016p:plain



さて、感染者の数f(x)が、指数関数的に増えていると仮定してみましょう。

 

f(x) = 2.1^x と考えて、まず、上記の「正しい」速度と加速度を算出すると下のようになります。

 

<正しい算出方法>

f:id:stchopin:20200704091751p:plain



この図の通り、速度も加速度も、両方とも指数関数的に増えていっています。

 

しかし、ここで「速度」「加速度」の定義に別の式を使ってみます(間違っています!!)

 

正しい定義では「差」で計算するところを、間違って「比」で計算してしまったとしたら・・・

つまり、v(a) = f(a+1) ÷ f(a),  A(a) = v(a+1) ÷ v(a)とやってしまうと、グラフは下のようになってしまいます。

 

<間違った算出方法>

f:id:stchopin:20200704091851p:plain
速度は2.1で一定値となり、加速度に至っては0になってしまいます。

 

この計算だと、感染者が指数関数的に増えているのに、「増え方は一定だよ」という誤った結論を導き出すことになります。

 

実際の、日本での感染者数のグラフに近い関数で検証してみましょう。

ここは、f(x)= 100/ [1+(x-3.5)^2 ]という関数を使ってみることにし、1日目の終わりの段階で緊急事態宣言が発令されたと考えることにします。

 

速度・加速度の正しい計算は、以下のようになります。

<正しい算出方法>

f:id:stchopin:20200704093355p:plain

こちらでは、

0-1日目:速度が増大し加速度もプラスの値になっているので感染爆発が進んでいる

     →やばいと思った政府が「緊急事態宣言」発令

2日目:加速度がマイナスとなり、感染拡大に歯止めがかかる。

3日目にピークアウトし、以降減少する

 

という様子がはっきりと分かります。

 

一方、先ほどの「間違った」算出方法では、以下のようになります。

<間違った算出方法>

f:id:stchopin:20200704094135p:plain

こちらでは、緊急事態宣言があろうがなかろうが、速度・加速度ともに0付近でほとんど変化していないことが分かります。これでは、何も実態は把握できません。

 

 

冒頭で取り上げた、「緊急事態宣言はムダだった」論の記事(https://www.kk-bestsellers.com/articles/-/554650/)では、どうやら「間違った算出方法」加速度のデータに基づいて構築された論理だったのでは、というのがtwitter上で巻き起こっている「疑義」だったわけです。

 

つまり、緊急事態宣言(というか自粛)の効果を否定したいがために、意図的に間違ったデータ解釈を行ったという疑惑の声が挙がっていると言い換えられます。

 

意図的でないとしたら、仮にも京大の土木工学の教授としてはお粗末すぎるミスですし、意図的だとすれば、これは立派な「デマ」記事です。

 

まして、この誤ったデータ解釈に基づいて、コロナの感染拡大防止に全力を尽くされた西浦先生・尾身先生に対して「大罪だ!」などと断じて公開質問状を叩きつけるなど、言語道断な行いだと思います。

 

第2波に備えた検証が必要なことは論を待ちませんが、嘘に基づいて相手を糾弾するようでは、建設的な議論などできるはずがありません。

 

このように、一般人が専門知識がないことをいいことに、データ算出の方法を隠して自説に都合のいいデータを引っ張って都合のいいデータ解釈をする、といった行いを平気でする輩がいるので困りものです。。。

 

みなさまも、「データに基づいて」と言われると鵜呑みにしてしまいそうになりますが、データ自体は1つでもその解釈の仕方によって全く別の結論が導ける、ということを頭の片隅に置いて、ニュースを見ていただければ、と思います。

 

ではでは

 

[7/27追記]

この件について、ご本人がfacebookにて今頃になって釈明しているようです。

 

Facebook

Facebook

以下引用

 

 (※なお、対数をとれば変化率の分析上の大小関係は差分の分析上の大小関係に必要十分に変換可能です

(※なお、速度や加速度といってもここでは差分ではなく、比率で計算しています。感染拡大はべき乗で増減するからです。高校レベルの物理学の知識に基づいて「速度や加速度は差分なのは常識じゃ無いか!藤井は間違っている!!」なんて騒ぐ一般の方がいるのですが、対数をとれば差分分析と比率性分析の知見についての傾向性は等価になるという数理的常識を思い起こして下さい)。

 

とはいえ、これを踏まえても、わざわざ比で加速度を計算する理由にはなっていないと考えます。

 

感染者数を指数関数と捉えた場合は、比による速度・加速度は意味をなさないことは、本記事で説明した通りです。

 

この「藤井式」が意味をなしうるのは、指数関数の底自体が増減する場合でしょう。1人が何人に感染させるかという「実効再生産数」のことでしょう。きっと。であれば、最初から「実効再生産数」の増減としてグラフを出せばよいのであって、「速度」として出す意味が分かりません。ツッコミ所を増やす効果しかないです。少なくとも、それは「実効再生産数」であって、「速度」ではないのですから。

 

次に、「対数をとれば差分分析と比率性分析の知見についての傾向性は等価になるという数理的常識」

意味がさっぱりわかりません。「知見」って何?「傾向性」って何?増えてるor減ってるという傾向が分かる程度でいいの? とにかく言葉の定義が曖昧なのです。

 

「差分分析」がan+1 -anとするならば、「比率性分析」はan+1÷anでしょうか。後者で対数を取れば、log an+1 - log an となりますから、確かに両者差の形にできますし、「増えてるか減ってるか」だけでいえば、「傾向性が等価」と言えてしまうのかもしれません。

 

これが、「対数をとれば変化率の分析上の大小関係は差分の分析上の大小関係に必要十分に変換可能です」の意味なのだと推測されます。

 

でも、同じ増えるにしても増え方が両者では全く違います。全然必要十分に変換可能な代物ではないのです。

 

ご存知の通り、関数の増え方は、「指数関数>>n次多項式>>対数関数」となるので、後者の「比率性分析」では、増え方がゆっくりになり、かつ値が小さくなります。つまり、実際は指数関数的に増えていても、「1次関数的に増える」と増え方を「低く見せられる」わけですよ。

 

こういうのがまさに数字のマジックと言いますか、典型的なごまかし・詭弁の手段だと私は思います。

 

百歩譲って、「傾向性が等価」が本当だったとしても、だったらなおのこと通常使用される「差分分析」を使えばよいではないですか。なぜ、一般的に使用されない「比率性分析」をわざわざ持ち出すのでしょうか?

 

今回の釈明は、「数理的処理の常識も知らねー奴が俺様の計算を叩いてるけど、俺は数理処理のプロなんだから正しいんだぞ~」と子供じみたマウント取りをしているに過ぎないばかりか、むしろ多くの人に突っ込まれて逆に評判を落とす結果になっている、と率直に感じました。