東日本大震災・原発事故の臨床疫学 ─数字の一人歩きにご注意!(分割時系列デザインの記事)

(日本医事新報社のご許可を得て、転載・改変した小職の記事です。出典はこちら:日本医事新報. 2019(4975): 54-59)

1. はじめに

小職は、臨床疫学の教育と研究に携わる一介の教員である。臨床疫学とは、臨床のフィールドで疫学的手法を当てはめる研究分野であり、その代表的なカテゴリーは、治療の有効性や診断法の性能を評価する研究である。よって、このような仕事をしている小職に、東日本大震災・原発事故に関する研究についての原稿依頼が巡ってきたのは、福島に赴任した5年前では全く想像できなかったことだ。

臨床医学雑誌から東日本大震災・原発事故をテーマにした臨床疫学研究が出版される事例は最近増えている。東日本大震災・原発事故が起こった結果、どのような種類の健康関連アウトカムが、どのような属性の人に、どの時期に増えたのか? といった疑問を持つことは自然であり、疑問に対する根拠を検証することが重要だからであろう。震災から8年を経た今でも、自分の健康を震災と結びつけて不安を抱える人たちが確かにいるので、ふさわしい根拠があると不安の手当に有効であろう。小職自身も、後述するように東日本大震災・原発事故をテーマにした臨床疫学研究を報告している1

ところが、出版された論文であっても、健康関連アウトカムが「東日本大震災・原発事故が起こった結果」であるとは言い難い研究が散見されるようになった。そのような研究に対して、個別に論述する医師の寄稿も見られる2,3。また、小職自身が「東日本大震災・原発事故が起こった結果」と主張するには無理のある原稿を査読する機会もあった。

東日本大震災・原発事故に原因を結びつけようとする臨床疫学研究には、大きく分けて2つのピットフォールがあると考える。1つ目は「因果関係に関する合理的な考察の失敗」、2つ目は「研究デザインに関する適切性の欠如」である。東日本大震災・原発事故関連の臨床疫学研究で、特にその2つのピットフォールに陥りやすい研究デザインが、分割時系列解析(interrupted time series analysis:ITSA)である。

ひとたび論文が出版されてしまうと、内容が適切であるか否かにかかわらず、データだけが一人歩きしてしまう。小職の研究も、実際の研究内容や解釈と違った形でメディアに拡散しかけたことがある(図1)4。したがって、ある程度のリテラシーをもって一般医家もITSAの研究を評価できることが望ましい。

図1. 研究の一人歩き

小職の研究が、 匿名のツイッターアカウント保有者によって、「震災と福島県内の出生率」の因果関係を調査したものとして紹介された。その結果、このメッセージが拡散した。小職の研究は、「震災と福島市の出生率」の関係性を分析したものである

 

そこで本稿では一介の臨床疫学者の視点から、ITSAの研究がどのような目的で行われるのかを解説する。次に、内容の適切性を判断するために役立つ代表的なチェックポイント(表1)を、因果関係の考察の面と、研究デザインの面から解説する。

表1. 分割時系列解析を用いた論文の適切性を判断するために役立つチェックポイント

①因果関係に関する合理的な考察

・ 時間の順序性:健康アウトカムが震災後に増えたのは、「疾患が増えた」結果なのか?

・ 生物学的なもっともらしさや量反応関係が示せているか

②研究デザインに関する適切性

・ 共介入:震災以降の健康アウトカムの増加は、震災「以外の」効果のためではないか?

・ 「全集団への影響」の表現は適切か?

・ 季節性:健康アウトカムの周期性が考慮されているか?

・ アウトカムの種類:比較的急に発生するアウトカムか?

このリスト以外にも必要な視点はいくつもあるが、 文字数の制約で限定した

 

2. 分割時系列解析(ITSA)とは

東日本大震災・原発事故の健康アウトカムに与える影響を評価するには、ランダム化比較試験のようにコントロール(比較対照)のある研究デザインで研究するのが理想である。しかし、比較対照を置くことは不可能である。

そこで、集団全体に施した介入の効果を評価する目的で、ITSAが適用される。ITSAは、 医療・保健介入で比較対照が置けない状況での効果を評価する場合にも適用される。その事例を表2に示す。例えば、診療報酬の改定5、法律の制定6などは施行しない地域を設定できない。 診療ガイドラインの改訂(推奨治療のステートメント変更で、治療行為の増減が生じる)も7、比較対照を設定できない広義の介入といえる。

 

表2. 分割時系列解析が活用される介入の事例

法律の制定

ヘルメット着用の法律制定による、自転車乗車中の頭部外傷入院の減少は示せず

(Dennis J, et al: BMJ. 2013; 346: f2674.) 6

診療報酬の制度変更

支払い包括化で、血液透析患者の活性化ビタミンD注射薬の投与量が減少

(Spoendlin J, et al: Am J Kidney Dis. 2018; 72(2): 178-87.)5

影響力の強いランダム化比較試験の出版

透析の早期導入と晩期導入の比較研究の出版後、早期導入の割合が減少

(Ferguson TW, et al: JAMA Intern Med. 2019; 179(7): 934-41.) 8

診療ガイドラインの出版

2007年のAHAガイドライン発表後の、予防的抗生剤投与の減少と感染性心内膜炎発症の増加

(Thornhill MH, et al: J Am Coll Cardiol. 2018; 72(20): 2443-54.)7

大規模災害の発生

東日本大震災・原発事故の発生後、福島市の出生率が2年間低下、その震災前の水準に回復

(Kurita N. : JAMA Netw Open. 2019; 2(1): e187455.)1

 

誤解をおそれずに言えば、「条件が整っている場合」に限り、高度な前後比較をすることによって介入効果を評価できるのがITSAのメリットである。ITSAでは、集団全体を対象に、繰り返し測定された健康アウトカムのデータを分析する。経時的に見ると、健康アウトカムの量に傾向がみられる。ある時点で介入が生じると、健康アウトカムの傾向が変化する。ITSAでは介入前と後のアウトカムの傾向を別々に捉えて、 介入後の健康アウトカムの傾向を、介入がなければ続いたはずの傾向─すなわち介入前の傾向と比較することによって、介入の効果を評価している(図2)。

図2. 分割時系列解析で介入の効果を評価している概念図

 

 

3. 時間の順序性:健康アウトカムが震災後に増えたのは「疾患が増えた」結果なのか?

時間の順序性(temporality)・生物学的なもっともらしさ(biological plausibility)と生物学的量反応関係(biological gradient)は、研究結果から東日本大震災・原発事故とアウトカムの因果関係が示唆されたと判断するために有用な視点である9

時間の順序性が破綻している研究は、科学研究論文として失敗に終わっている。

例えば、先天性奇形が震災後に増えたかどうか?という疑問を「先天性奇形の『手術』が震災後に増えたかどうか?」 という問いで示そうと思ったら、様々な障壁を乗り越えない限り難しい。まず、手術が震災後に増えたのは「疾患が増えた」結果なのか? という部分で時間の順序に矛盾があってはならない。

仮に「震災後の手術数の増加が20%以上ある」という分析結果が示されたとする。 しかしこの分析に、手術時年齢が3~5歳のグループも含まれていたら、適切であろうか(図3)。

図3. 時間の順序性に矛盾が見られる分割時系列解析の例

震災の後(2012~13年度)に、震災の前(2010~11年度)に比べて手術件数が20%程度増えたからといって、「震災の結果、先天性奇形の発生が増えた」と考察することができない事例である。このグラフでは、縦軸が100病院当たりの年間手術件数とする。0~2歳の手術件数は27%増えている。3~5歳の手術件数は34%増えている。 震災直後に手術を受けた3~5歳の出生年度は、2007~09年度であるから、むしろ震災前から先天性奇形が増えている可能性を示している。このようなデータが、本文本体には記されておらず、サプリメントにのみ数値の表としてだけ示されている研究がある

 

震災直後に先天性奇形の手術を受けた3~5歳らの生年は、およそ2007~09年度となる。つまり、生年は震災前であり、震災前から先天性奇形を有している。

では、すでに震災前から先天性奇形を有していた子供たちの手術が震災後に増えたという分析結果より、「震災の影響で先天性奇形が増えた」と判断してよいだろうか。これは、誰しもが反対すると思う。しかし実は、このような研究が国際的な学術雑誌に出版されてしまっている。より慎重に研究するのであれば、少なくとも「0歳児で行われた先天性奇形の手術件数」に限定した上で、震災後に「0歳の手術件数は増えている」一方で、「3~5歳は増えていない」ことを示さないと、「震災の影響で先天性奇形が増えた」と説得することは無理があるだろう。

 

4. 生物学的なもっともらしさや量反応関係を示せているか

生物学的なもっともらしさとは、懸念する健康アウトカムの発生に放射性物質が作用するメカニズムを調べたこれまでの科学研究で、自分の研究結果を説明できるかどうかを指す。量反応関係とは、放射性物質の線量の作用が多いほど、懸念する健康アウトカムの発生が多いことを指す。

仮に放射性物質の線量が先天性奇形の発生に影響するならば、福島第一原発から離れた県であるほど、発生率は少ないかもしれない。なぜなら、放射性物質のエネルギーは、距離が離れるほど少なくなるためだ。

もしも、「震災後の手術数の増加が20%以上ある」というデータが距離によらず都道府県別でほぼ均一であったら、量反応関係が成立しない。「震災と先天性奇形の発生」に因果関係があることを主張したいならば、福島第一原発から離れた県であるほど、発生数が少なくなることを解析で示す方が説得力は高い。

「空間による量反応関係がなくても、よいではないか。食物などの流通を通して、放射性物質が全国に拡散した可能性だってある」と主張する人もいるかもしれない。しかし、その主張を通すには時間による量反応関係を示すべきである。

例えば震災後2~3年たってからも、全国レベルで先天性奇形が増えていたら、原発事故後、しばらくして放射性物質の線量が下がっているデータに反する。仮に震災直後に先天性奇形が増えたというデータであったとしても、放射性物質の線量が低下してからの発生率が震災前の水準に戻っていないと、「震災と先天性奇形」に量反応関係があるとは言えなくなる。

最近、全国レベルで先天性奇形が増えたと思わせる論文が散見される。しかしよく読んでみると、空間的な量反応関係もなく、また、時間的な量反応関係もない(当該論文では、震災から3~4年間、先天性奇形が全国レベルで増えているデータが示されている)。むしろそれでは、「震災と先天性奇形」に因果関係があるとする主張は、できないのではなかろうか。

したがって、「震災と先天性奇形」を研究テーマにするのであれば、先天性奇形に関して線量の作用を示す既存の基礎研究があるかどうか、量反応関係があるかどうかなど、因果関係を支えるデータを探して、研究者が考察する必要がある。

 

5. 震災以降の増加は震災「以外の」効果を見ていないだろうか?

ITSAが使われる目的は、前述した通り、診療報酬改定による影響5、診療ガイドラインの変更による影響7などの評価である。「手術」のような診療行為をアウトカムにするITSAでは、震災と同時期に手術点数がアップすると、インセンティブだけの理由で手術件数が増える可能性がある。表2で紹介した論文によれば、治療薬の支払い包括化によって、包括対象となった薬剤の使用量が減っている。

2012年度診療報酬改定で手術点数がアップした先天性奇形の治療がある。もしこの先天性奇形を対象に「震災後に手術件数が増えた」としたら、それをすべて震災の影響で説明することはできず、診療報酬の増額による影響も無視できなくなる

また、震災の数年前に早期の手術治療を推奨する診療ガイドラインが出ていると、推奨が徐々に浸透する結果、手術件数が徐々に増加する。震災によって手術件数が増えているかどうかを震災前後で解析するには、震災の数年前に出たガイドラインの影響をモデルに含めて解析して、それでも「震災後に手術件数が増えている」ことを示す。その方が、研究の説得力が増す。

さらに震災の研究で念頭に置くべきことは、原発事故による影響と、地震そのものによる影響を、分けて調べることが必ずしも出来ないことである。例えば、震災直後に好ましくない健康アウトカムが急増したとしたら、それが放射性物質による影響なのか、住宅の倒壊で生活がままならなくなった結果なのか、データから説明することはできない。

小職は、ITSAを応用して「福島市における出生率と震災の関係」の研究をJAMA Network Open誌に掲載して頂いた1。震災直後に出生率が減少して、2年後に回復するインパクトモデルがもっともデータを説明していた。 この発表の直後、JAMA Network Open誌のeditor in chiefが、「原発事故による影響と、地震そのものによる影響のどちらがどの程度、出生率の減少に寄与しただろうか」というコメントを残している。

 

6. 「全集団への影響」の表現は適切か?

ITSAでは、震災のような「全集団への影響」をパラメータとして解析モデルの中で表現する必要がある。 これをインパクトモデルと呼んだりもする10。インパクトモデルは、前述の生物学的なもっともらしさや先行研究に基づいて、複数の種類で分析することが望ましい(図4)。なぜならば、選んだモデルによって分析結果が全く異なることがあるためだ。例えば「震災後に手術件数が増えたか?」という仮説も、インパクトモデルの種類によっては仮説を示せない解析結果が出ることがある。

図4. インパクトモデルの例

縦の破線は、震災が生じた時点を示す。Aは、震災の直後に、手術の件数が急増したことを示すモデルである。解析ではβ1の値を推定することに相当する。Bは、Aに加えて、震災前から手術の件数が増加する傾向を加味したモデルである。これでも、β’1の値があると言えれば、震災前からの傾向があったとしても、震災直後に手術の件数が急増したと主張することも可能である。Cは、Bに加えて、震災後の経年傾向に変化が生じたことを加味したモデルである。Dは、震災直後に手術の件数が増加して、しばらく経過してから手術の件数が震災前の傾向に戻るモデルである。分割時系列解析では、既存の医学知識に基づいて、インパクトモデルを決めるのが望ましい。1つに決められなくても、複数の候補を検討することも重要である

 

シンプルなモデルは、震災後に健康アウトカムが増えて、そのまま続くモデルである(図4A)。これは切片だけが増加する。ただこれは、時間的な量反応関係を考慮したモデル、例えば震災後しばらくして放射線量の影響が減少するモデルにはなっていない(図4D)。量反応関係が大事な仮説であるにもかかわらず、図4Aのモデルで分析されている論文が散見される

もしも、震災前から手術件数が漸増している背景の中で、震災による影響を調べるのであれば、切片の変化に加えて「経年傾向」のベースも含めたモデルで分析するほうが理にかなっている(図4B)。それでも、切片の変化が明らかであれば「震災による影響」の説得力は増す。これに加えて、経年傾向の変化も入れたインパクトモデルで分析することもできる(図4C)。

前述の小職の「福島市における出生率と震災の関係」でのインパクトモデルは、切片の変化(震災の直後から妊婦が自主避難する事態なども考慮したため)だけでなく、経年傾向の変化も加えるモデルなども含めて、5種類のモデルで分析した1。ベースには必ず経年傾向を含めた。それは経年傾向があることを先行研究で確認していたからであった。さらに、当時の状況や資料、妊娠から出生までに約9カ月かかる生物学的な事実も取り入れて、震災の直後だけでなく、数年後にも出生率が変化するインパクトモデルを考案したのであった。

 

7. 季節性が考慮されているか

ITSAでは、季節性が自己相関を作り出すことがある。季節性とは、例えば待機手術がアウトカムになる場合、本人や家族の都合で夏休みや春休みに手術件数が増えるといった周期性を指す。

もしこの背景がある中で、震災前のデータに3月や7~8月のデータが欠けた年度が多いと、震災前の月当たり平均の手術件数は、3月や7~8月のデータが含まれているときの平均件数よりも少なくなる。そのデータと、震災後の手術件数を比べると、3月や7~8月の震災前のデータが少ないだけの理由で、震災後の手術件数が増加したように見えてしまう。これが自己相関である。

季節の出現度合いが震災の前後で不ぞろいであると、自己相関を生じる可能性がある。そのため、季節性に対処することが望ましい。例えば、月の違いを解析に加えて補正することで、季節性の影響が取り除ける場合がある。このように、ITSAの論文では、季節性についての言及があるかどうかを吟味することが重要である。

小職の震災と出生率の研究では、出生率が冬に低くて夏は高いという季節性があった。そのため、月の違いを解析に加えて季節性の影響を補正した1

 

8.「良いクエスチョンを伴わない研究はゴミである」(と言ったのは小職ではなくて医学雑誌です)

東日本大震災・原発事故をテーマにITSAの方法を当てはめるには、上記のように考慮すべきことが山ほどある。また、そもそも取り扱うのに支障のない健康アウトカムは、比較的早期に変化することが期待できる、 短期発生のアウトカムと言われている。「手術」には、疾患の発生だけではなく、医療者の診断・手術・経過観察といった医療行為のプロセスまで含まれる。 そこまでの医学的背景も含めて、比較的早期に診断がつき、ほとんどの患者に治療が行われるのかまで考えなければ、意味のある主張ができない。

臨床疫学の一流誌であるJournal of Clinical Epidemiology誌は、「良いクエスチョンを伴わない研究はゴミである」と述べている11。 ビッグデータ時代では、魚釣りのような探索から生じる偽陽性─つまり、本当は因果関係がないにもかかわらず、統計学的有意差をもって因果関係があるかのように結論づける状況─の危険性が以前よりも増していると警鐘されている。臨床的・科学的な見識、テーマに関する豊富な専門知識に基づいて、よく準備された疑問こそが臨床疫学研究の出発点である。したがって、ただの数遊びにならないよう、臨床疫学の研究者と臨床家が知識を結集して、意味のあるクエスチョンと適切な研究デザインで研究を立案しなければならない。自戒の念を込めてこの大切さを再確認しつつ、本稿を終えることとしたい。

 

9.謝辞

このコーナー(日本医事新報の福島リポート)への執筆を推薦して下さった竹之下誠一学長、大戸斉総括副学長、山下俊一副学長、長谷川有史教授に深謝します。本稿は、小職個人の所感や経験を記載したものであり、福島県立医科大学の教職員による校閲はありません。

 

10.参考文献

  1. Kurita N. Association of the Great East Japan Earthquake and the Daiichi Nuclear Disaster in Fukushima City, Japan, With Birth Rates. JAMA Netwok Open. 2019;2(1):e187455. doi: 10.1001/jamanetworkopen.2018.7455
  2. 岩田健太郎. 原発事故で先天性心疾患が増加!?. メディカルトリビューン. https://medical-tribune.co.jp/rensai/2019/0425520022/. Accessed Junly 2, 2019.
  3. 澤野豊明. Vol.114 福島第一原発事故後の先天奇形は増えていない-名古屋市立大学の研究をうけ. MRIC by 医療ガバナンス学会. http://medg.jp/mt/?p=9079. Accessed Junly 2, 2019.
  4. Overview of attention for article published in JAMA Network Open, January 2019. Altmetric. https://jamanetwork.altmetric.com/details/54494767/twitter. Accessed June 13, 2019
  5. Spoendlin J, Schneeweiss S, Tsacogianis T, et al. Association of Medicare’s Bundled Payment Reform With Changes in Use of Vitamin D Among Patients Receiving Maintenance Hemodialysis: An Interrupted Time-Series Analysis. American Journal of Kidney Diseases. 2018;72(2):178-187. doi: 10.1053/j.ajkd.2018.03.027
  6. Dennis J, Ramsay T, Turgeon AF, Zarychanski R. Helmet legislation and admissions to hospital for cycling related head injuries in Canadian provinces and territories: interrupted time series analysis. BMJ. 2013;346:f2674. doi: 10.1136/bmj.f2674
  7. Thornhill MH, Gibson TB, Cutler E, et al. Antibiotic Prophylaxis and Incidence of Endocarditis Before and After the 2007 AHA Recommendations. Journal of the American College of Cardiology. 2018;72(20):2443-2454. doi: 10.1016/j.jacc.2018.08.2178
  8. Ferguson TW, Garg AX, Sood MM, et al. Association Between the Publication of the Initiating Dialysis Early and Late Trial and the Timing of Dialysis Initiation in CanadaAssociation Between the IDEAL Trial and Dialysis Initiation TimingAssociation Between the IDEAL Trial and Dialysis Initiation Timing. JAMA Internal Medicine. 2019;179(7):934-941. doi: 10.1001/jamainternmed.2019.0489
  9. Hill AB. The environment and disease: association or causation? Proceedings of the Royal Society of Medicine. 1965;58:295-300.
  10. Bernal JL, Cummins S, Gasparrini A. Interrupted time series regression for the evaluation of public health interventions: a tutorial. International Journal of Epidemiology. 2017;46(1):348-355. doi: 10.1093/ije/dyw098
  11. Knottnerus JA, Tugwell P. Research without good questions is a waste. Journal of Clinical Epidemiology. 2019;108:vi-viii. doi: 10.1016/j.jclinepi.2019.02.017