2学期に始めたいこと

高校生、大学生たちよ 新型肺炎感染拡大を解析してみないか?

準備

実際にやってみよう

\[i) \]    まずWHOなどホームページから感染者数の情報を見つけます。
   例えば 日本の1月21日からの感染者数の様子です
    1/21 1人
    1/22 1人
    1/23 1人
    1/24 2人
    1/25 3人
    1/26 3人
    1/27 4人
    1/28 6人
    1/29 7人
   となっています。(WHO situation reportsより)

   このデータを次のように表計算ソフトまたはテキスト編集ソフトで入力していきます
日付を表示できるグラフソフトなら日付のまま
    1/21 1
    1/22 1
    1/23 1
    1/24 2
    1/25 3
    1/26 3
    1/27 4
    1/28 6
    1/29 7

日付を表示できないグラフソフトなら日付を経過日数にして
    1 1
    2 1
    3 1
    4 2
    5 3
    6 3
    7 4
    8 6
    9 7
   のように「経過日数 感染者数」で書いていきます。

\[ii) \]    i)で入力したデータをグラフで表示します。
   例えば、1月21日から2月28日までの日本の様子をグラフにすると
    グラフ1

   このようなグラフはよく見ますが、このグラフの縦軸や横軸を対数目盛に変更します。

   解析に使うグラフその1 片対数グラフ
    グラフ2

   このグラフは縦軸だけを対数(底がeの自然対数 \(log_e\)をつかっています)にしたものです。
   このグラフを見る利点には次のようなものがあります
   対数の計算では \[log(20)-log(10)\] \[ = log(\frac{20}{10})\] \[ =log(2)\]  また \[log(2000)-log(1000)\] \[ = log(\frac{2000}{1000})\] \[ =log(2)\]  のように10が2倍の20になったときと、1000が2倍の2000になったときで、その差が同じ\(log(2)\)になります。一般的に表せば次のような式で表される性質です。 \[log(ka)-log(a)\] \[ = log(\frac{ka}{a})\] \[ =log(k)\]  
  このことから、2つの使い方で利点が得られます。
  1. ある時点の変数\(a\)が、次の時には\(2a\)や\(1.2a\)などのように2倍や1.2倍と、今ある数の何倍かで増える様子を見るのに適している。
  2. 10や1000など数の桁数が違うデータ同士で性質を比べることができる。

  次に、\(y=ae^{kx}\)という関数の性質を利用します。
  この関数は微分すると \[\frac{dy}{dx}\] \[=ake^{ke}\] \[=ky\]   となり\(\frac{dy}{dx}=ky\)が成り立ちます。
  この式は「ある時点から次の時点までの\(y\)の変化量は、現在のその変数\(y\)の\(k\)倍である」ということを表します。

  同じく\(y=ae^{kx}\)の両辺の対数をとると
\[log(y)=kxlog(e)+log(a)=kx+log(a)\]   となり\(Y=log(y)\)と変換すると\(Y=kx+log(a)\)となります。
  これより\(y=ae^{kx}\)をy軸を対数目盛で表示すると、直線になり、その直線の傾きは\(\frac{dy}{dx}=ky\)の右辺の\(k\)を表します。

  つまり、片対数グラフを見ることで、グラフが直線になった場合、または直線とみなせる部分があった場合、これらの増加のしかたである可能性を読み取れます。また、その直線の傾き\(\frac{log(s)-log(t)}{s-t}\)を計算することで、変数\(y\)の増加量が現時点の何倍に増えるかを読み取れるわけです。

  傾きが変わるような事柄(例えば、人々の意識が変わったとか、政府の対策が実行されたなど)が起きると、その過渡期は曲線的になるかもしれません。そうして曲線と直線部分の組み合わせでグラフが現れることもあるでしょう。

 「感染というのは、その時感染している人が、ある割合で他の人を感染させる」と考えると、\(\frac{dy}{dx}=ky\)となる増え方に似ているようにも思えます。けれども、そうであるというわけではありません。だから、データを解析するのです。その結果、例えばここで行ったように判断されれば、このタイプであると分かる・・・のではなく、可能性の1つに挙がってくるのです。可能性の1つとはいえ、性質としては同じような性質を持つことには変わりありませんから、その傾きの値で広がり方の1つの数値的尺度とすることも、やはり考え得るわけです。

 このような方法で、大まかに計算すると、中国の1月23日から1月28日までの傾きは0.41、1月31日から2月5日までが0.18でした。日本の場合は2月16日から2月22日で0.11でした。ダイヤモンドプリンセスでは、1日に検査できる人数から少しデータに統計判断を入れて計算すると2月12日から2月20日で0.16でした。この数値によって何を判断し、何を比較するかはそれぞれの人で考察を行ってみたり、友人と議論してみたり、大学や高校の先生と議論してみたり、報道されている様々な要素と照らし合わせてみたりして、テレビやネットの情報から受動的に判断するのではなく積極的に自分の判断を行ってみると、良い社会になりそうですね。

 もちろん、専門家たちは、どんな広がり方をするのかの可能性(方向性)が把握されたなら、その後、検証や微調整、モデル化によるフィードバックなどを行い、ときには初めから構築しなおしたりして、正確なものへとしていきます。

   解析に使うグラフその2 両対数グラフ
    グラフ2

  両対数グラフは、横軸まで対数目盛にして表したものです。このような表示が有効な関数の形は\(y=x^k\)タイプのもので両辺の対数をとることで \[log(y)=klog(x)\] \[\frac{dy}{dx}=kx^{k-1}\]   となります。やはりこのグラフで直線とみなせる場合は、傾きから、何らかの情報を読み取れます。

   解析に使うグラフその3 漸化式のグラフ
  ところで、読んでいて「潜伏期間はどうした?」と思った人もいるかもしれません。\(\frac{dy}{dx}\)というのは、あくまで、微小変化であって、今回の場合、1日前の感染者数が翌日の感染者数に対する直近のデータになります。ですから、前日感染して、翌日に検査で陽性ってこと?と思えてしまうかもしれません。その場合、データを変えましょう。

  今回のウィルスは潜伏期間は平均6日程度と言われていますから、グラフにするデータを
  「日数 感染者数」
  から
  「6日前の感染者 その日の感染者数」
  にしてグラフにすることで、潜伏期間を6日をはさんだ2日の関係を把握できます。
  例えば中国の感染者数をこのようにグラフにすると次のようになります。
   グラフ2
  ここで、横軸に\(a_n\) 縦軸に\(a_{n+6}\)とあるのは、漸化式的に表したものです。
  このグラフで直線になる場合、漸化式で\(a_{n+6} = ka_n + s\)のように表せます。
  さて、この方法でグラフ化し傾きを計算してみたところ、日本では横軸のデータが2月13日から2月19日までは比較的安定していましたが、2月20日から傾きがわずかに上がっている様子が観察されます。2月20日に何があったのでしょうか。日本のデータについて、同じようなグラフを作って確認してみてはいかがでしょうか。

まとめ

結果サンプル(片対数グラフの傾き)

東京の結果について

東京 結果サンプル

このページのトップヘ