NATROMのブログ

ニセ医学への注意喚起を中心に内科医が医療情報を発信します。

検診で発見されたがんの予後が良くても、がん検診が有効だとは言えないのはなぜか?

「わかる」って、たーのしー!よね

私たちは、地球が球形をしていて太陽の周りを回っていることを幼いうちから教えられている。けれども、地球が丸くて動いているなんて、よくよく考えると直観に反している仮説である。普通に考えれば地面は平らで動いていない。動いているのは太陽のほうだろう。人類で最初に地球が丸いと理解することは、さぞエキサイティングであっただろう。

別に人類で最初でなくったって、直観に反することが事実だわかる過程は素晴らしい体験である。私は大学生のころ、イギリスの進化生物学者であるドーキンスが書いた『利己的な遺伝子』(当時は『生物=生存機械論』)という本を読んで、動物の行動は「種の保存」のためのものであるという「常識」が間違っていることを思い知らされた*1。貴重な体験であるが、どういう感情なのか説明するのが難しい。ゲームをプレイしたことのない方にはまったく伝わらないたとえで申し訳ないが、『ゼルダの伝説』をプレイ中に行き詰まり、さんざん苦労したあげくやっと謎を解いたとき流れる「謎解き音」を聞いたときの快感を100倍したような感覚である。

直観に基づいて地球は平らであり太陽のほうが動いていると信じている人が、「偉い人がそう言っているから」とか「本にそう書いてあるから」とかではなく、基本的な観察事実と論理から実は地球は丸くて動いてることを正しく理解し、心の底から納得したとき、そのときの感情は喜びとしか言いようがないのではないか。ただ、私たちのほとんどは地球が丸いことを既に知っているので、いまさらこの喜びは味わえない。きわめて残念である。

研究者の方々、とくに一流の方々は、これまで人類の誰もが知らなかった事実を知るチャンスを持っているわけで実にうらやましい。我々の多くは人類初の事実を知ることはできない。けれども、人類初でなくても単に我々個人が知らないことはいくらでもある。役に立つ立たないは別として、論文や本やブログを読み、これまで知らなかったこと知ることで、知的な喜びを得ることはできる。「フェルマーの定理」とかだと私にとっては難しすぎてダメだけど、もうちょっと手ごろな謎を理解するとき、「謎解き音」が聞こえる。


がん検診で早期発見されたがんは予後が良いのに、がん検診が有効ではないなんてことがあるの?

前置きが長くなった。このエントリーでは、がん検診の疫学について、直観があてにならないという話をする。がん検診によってがんを早期発見でき、検診で早期発見されたがんの予後が良いとしても、そのがん検診は有効とは限らず、有害である可能性すらある。専門家の間では常識で、学生向けの教科書にも書かれていることであるが、知らない方も多いだろう。

がん検診は自覚症状のない人が対象である。検診で無症状のうちに発見されるがんがある一方で、何らかの自覚症状が生じ、病院に受診することで発見されるがんもある。また、がんは早期のうちに治療したほうが予後が良い。検診を行って早期発見・早期治療し、予後を改善させようというのががん検診の目的である。直観的には検診をやったほうがいいに決まっているように思える。

がんXに対して検診を行うと、早期がんがたくさん見つかるとしよう。検診で見つかったがんXの患者さんを追跡調査すると、早期がんは予後がよいため5年間で亡くなる人はたった10%であった。つまり5年生存率は90%である。一方で同じがんXであっても、検診外、つまり自覚症状が生じてから発見された患者さんは、5年間で亡くなるのは50%であった。5年生存率が90%対50%、直観的にはがん検診が予後を改善させたように思える。ところが、がん検診にまったく意味がなく、むしろ有害であったとしても、こうした見かけ上の生存率の改善が生じることはありうる。見せかけの検診の有効性を引き起こすバイアス(偏り)はいくつかあるが、ここでは3つほど紹介しよう。


リードタイムバイアス

具体的な人物の経過を例に挙げるのが理解の助けになるだろう。長井さんは60歳のときに検診でがんXが見つかり治療を受けるも後に再発し、68歳で亡くなった。長井さんの生存期間は8年間である。診断・治療の開始から5年目の時点では生存しているので、5年生存率の数字で言えば長井さんは生存にカウントされる。

では、もし長井さんが検診を受けていなかったらどうだっただろうか。実は、検診を受けていなかったら65歳のときに自覚症状が生じてがんXと診断され、治療を受けるも68歳のときに亡くなるはずであった。この場合、生存期間は3年間で、5年生存率では死亡にカウントされる(早期発見されても自覚症状が生じてから治療しても予後が変わらないのは、たとえば、早期発見された時点ですでに転移しており、最終的にその転移巣が原因で亡くなるといった場合に起こる)。




検診で予後が改善しなくても、リードタイムのため見かけ上、生存期間が長くなったように見える。

検診は長井さんの予後を改善させなかった。というかむしろ、検診を受けなかったほうが65歳までは平穏に過ごせていたはずで、検診のせいで罹病期間は長くなり、生活の質は落ちた。長井さんにとっては有害な検診であったのに、検診をしたほうが5年生存率は良い数字になる。

検診で発見された時点(長井さんの場合は60歳)から、検診を受けなかったら自覚症状が生じて診断されたであろうという時点(長井さんの場合は65歳)までの期間を「リードタイム」という(長井さんの場合はリードタイムは5年間)。検診がまったく予後を改善しなくても、リードタイムの分だけ生存期間は延び、よって生存率も改善する。これを「リードタイムバイアス」という。


レングスバイアス

遅山さんはあまり積極的にはがん検診を受けていなかった。毎年の検診を推奨されていたものの、5年に1度しか検診を受けなかった。60歳のときに検診を受け、61歳、62歳、63歳、64歳の検診はサボった。65歳時に5年ぶりに検診を受けたところ、早期のがんXが発見され、治療を受けた。幸い、治療はうまくいき、遅山さんは天寿を全うした。

一方で、速水さんは毎年きちっと検診を受けていた。60歳、61歳、62歳のときの検診は問題なかった。63歳時の検診も当然受けるつもりであったが、その直前に自覚症状が出て、病院を受診したところ、進行したがんXが発見された。検診を定期的に受けていても、検診と検診の間に自覚症状で発見されるがんは実際にも存在する。速水さんは治療を受けるも、66歳で死亡した。

遅山さんの例は検診で発見されたがんXの5年生存率を改善する方向に、速水さんの例は検診外で発見されたがんXの5年生存率を下げる方法に働く。これも一見すると、がん検診を受けたほうが予後を改善することを示しているように見える。




遅山さんのようにゆっくりと進行するがんは検診で発見されやすい一方で、速水さんのように急速に進行するがんは検診外で発見されやすい。

遅山さんが、もし検診を受けていなかったらどうだっただろう。遅山さんが65歳時の検診もサボっていたら、ゆっくりとがんは進行し、68歳のときに自覚症状が出てがんが発見されることになる。がんは進行はしていたが、手術で治癒切除でき、やはり天寿を全うできた。検診で発見可能になってから自覚症状が出るまでの期間が長いがんは、比較的予後が良い。ちなみに遅山さんがマメに検診を受けていたら、62歳のときにがんは発見されたはずである。

一方で、速水さんが自覚症状が出る直前、62歳11か月のときにがん検診を受けたとしても、やっぱり66歳で亡くなった。前回の検診のときには発見できなかったのに、今回の検診前に自覚症状が出るようながんは、進行のスピードが速く、たいへん予後が悪い。こういうがんは検診外で発見されやすい。

検診で発見可能になってから自覚症状が出るまでの期間(遅山さんは62歳〜68歳で6年間)が長いがんは検診でより発見されやすい。そしてこうしたがんは進行がゆっくりなので予後が良い。実際には検診が予後を改善しなくても、もともと予後のよいがんが検診でより多く発見される傾向があるがゆえに、がん検診が予後を改善するように誤認するのがレングスバイアスである。


過剰診断バイアス

がん検診の有効性は、がん死の減少で評価されることが多い。ただ、死亡以外の有害アウトカム(起こって欲しくないこと)が検診によって減るならば(デメリットと比較勘案する必要はあるものの)検診は有効であると言える。胃がん検診を胃がん死だけでなく進行胃がんの罹患で評価したり、あるいは子宮頸がん検診を子宮頸がん死だけではなく浸潤子宮頸がんの罹患で評価したりする研究もある。

成人に対する甲状腺がん検診は甲状腺がん死をほとんど、あるいはまったく減らさないことが観察研究で示されている*2。甲状腺がん死以外の有害アウトカム、たとえば転移性甲状腺がんを減らすかどうかもわかっていない*3。局所摘出すればいい限局した甲状腺がんと多臓器転移がある甲状腺がんは治療法が異なる。多臓器転移がある甲状腺がんは、甲状腺を全摘した上で、放射性ヨードによる治療を行わねばならない。体に負担がかかるし、一生、甲状腺ホルモンを飲み続けないといけない。がん死ほどではないが、甲状腺全摘はできれば起こって欲しくないことである。

仮に、自覚症状で発見された甲状腺がん患者のうち50%が全摘術を受けなければならない一方で、がん検診で早期発見された甲状腺がん患者は10%しか全摘術を受けなくてすむとしよう。この場合、甲状腺がん検診は甲状腺がん全摘を減らすと言えるだろうか?ここまで読んできた読者の皆さんは、甲状腺がん検診は甲状腺がん全摘を減らすとは言えないことがご理解できることと思う。

リードタイムバイアスおよびレングスバイアスをわかっていれば、「がん死」であろうと「甲状腺全摘」であろうと、予後を改善させない無効な検診が検診で発見された患者における「有害アウトカム」が生じた患者の割合を見かけ上小さく見えさせることを理解できるだろう。

過剰診断*4、つまり、「治療しなくても症状を起こしたり、死亡の原因になったりしない病気を診断すること」を考慮に入れるとさらにわかりやすい。甲状腺がんは過剰診断が多いがんである。たとえば、年齢性別そのほかの条件が同一の1万人ずつの集団の片方に対してのみ甲状腺がん検診を行ったとしよう。がん検診で早期発見された甲状腺がん患者は10%しか全摘術を受けなくてすむ(つまり、がん検診で発見されたがんは予後が良い)。一方で、がん検診を受けなかった群の甲状腺がんはすべて自覚症状を伴ってから発見された。進行がんの割合も多く、甲状腺がん患者のうち50%が全摘術を受けなければならない。

「確かに過剰診断によるデメリットはあるが、検診によって全摘術が減るわけだから、検診は有効である」とは言えないよね。検診を受けた1万人中、甲状腺がんと診断された人が100人(うち甲状腺全摘術を受けた人が10人)、一方で検診を受けなかった1万人中、甲状腺がんと診断された人が20人(うち甲状腺全摘術を受けた人が10人)だったとしたらどうだろうか。この甲状腺がん検診は無意味なだけでなく、有害である。1万人中80人の過剰診断が生じる一方で全摘術を減らさない。




甲状腺がん全摘率は下げるけれども、予後は改善しない検診の例。

過剰診断によって、がん検診が見かけ上有効に見えることを過剰診断バイアスという。過剰診断バイアスは、リードタイムバイアスの極端な例である。リードタイムが十分に長く、「検診を受けなかったら自覚症状が生じたであろうという時点」が寿命よりも先にあることが過剰診断である。また、過剰診断バイアスはレングスバイアスの極端な事例でもある。レングスバイアスはもともと予後の良いがんが選択的に検診で発見されることによって生じるが、生涯自覚症状を生じない過剰診断ほど予後の良いがんはない。


検診の有効性を評価するにはどうすればよいか

いろんなバイアスがあるけれども、じゃあどうやったら検診が有効かどうかを評価できるだろうか?検診で発見されたがんの臨床的特徴をいくら調べてもわからない。実際に比較をしてみなければならない。ここで比較すべきなのは、がん検診を受ける集団と、がん検診を受けない集団とにおける、がんで死ぬ人の数(あるいは甲状腺全摘術などの有害アウトカムの数)の割合である。

たとえば、過剰診断バイアスで挙げた例でいくと検診を受けた1万人中全摘術が5人、検診を受けなかった群で10人であれば、検診が全摘術を減らしたことになる*5。さっきまでと何が違うのか?分母ががん患者なのか、検診を受けた(あるいは受けなかった)人全体なのかが違う。ここがすごーく大事な点だ。検診で発見された患者さんは、リードタイムで生存期間が延びたり、もともと予後の良い患者さんを拾い上げたりするので、患者の数を分母にするとバイアスがかかってしまう。がん検診の有効性を「生存率」で評価してはならないのは、生存率は分母が患者の数だからである。一方、がん検診の有効性が一般的にがんによる「死亡率」で評価されるのは、分母が検診を受けた(あるいは受けなかった)人全体だからである*6

がん検診を受ける集団と、がん検診を受けない集団は、できればランダムに分けるほうが望ましい。でないと、今回は述べなかった別のバイアスが生じるからだ。現在、有効性が認められているがん検診は、原則としてランダム化比較試験で有効性が認められている*7

いろいろややこしいとは思うが、「検診で早期発見されたがんのほうが予後がいいにも関わらず、検診が予後を改善させるとは限らず、むしろ検診をしたほうが害が大きい場合もある」という直観に反する主張が、実は正しいとわかっていただけただろうか。

ゼルダの伝説の「謎解き音」が読者の皆さまの耳に届きますように。


さらに知るには

「このエントリーを読んだだけではいまいちわからん」あるいは「もっと詳しく知りたい」という読者もいるであろう。どの疫学の教科書にも書いてあることだが、強いて一冊だけ選ぶなら、
cover

■疫学 -医学的研究と実践のサイエンス-(メディカルサイエンスインターナショナル)をお勧めする。図が多くカラーでわかりやすい。また、初学者が混乱しないよう訳語に工夫をされている(ただし、いくつか気になる点はある)。

長井さん・遅山さん・速水さんのたとえ話はわかりやすさのために導入したが厳密さに欠け、読者によってはかえってわかりにくくなっているかもしれない。また、できるだけエントリーを短くするために意図的に言及しなかった点がある。
id:ublftboさん(TAKESAN)による■検診の意味と有効性評価――前編 - Interdisciplinaryは、言葉の定義から丁寧に順序だてて説明されており、理解の助けになるだろう。教科書を買ったり借りたりできない環境の方は、まずはここからはじめることをお勧めする。


*1:■生物=生存機械論 by ドーキンス

*2:■韓国における甲状腺がんの過剰診断

*3:普通は「検診が転移性甲状腺がんを減らすなら、甲状腺がん死も減らすはずだ。がん死が減っていない以上、転移性甲状腺がんも減らさないだろう」と考える

*4:■「過剰診断」とは何か

*5:1万人が検診を受けて5人の全摘術が減る。1人の全摘術を予防するために必要な検診数は2000人。これのメリットがデメリットと比較して見合うかどうかは別途検証しなければならない

*6:sivadさんが死亡率と致死率を取り違えて間違えたのもこの点にある→■死亡の指標とsivad氏の誤り - Interdisciplinary。死亡率の分母は集団全体の数(より正確には人年)、致死率の分母は罹患者数だ

*7:子宮頸がん検診のように、歴史的に検診の有効性が認められてきた検診については、いまさら「がん検診を受けない集団」を人為的に作ることは倫理的に許されない。よって、検診なし群を対照にしたランダム化比較試験以外の方法を使って評価するが、その場合でも分母は患者数ではいけない