NATROMのブログ

ニセ医学への注意喚起を中心に内科医が医療情報を発信します。

「線虫がん検査」の感度・特異度は過大評価されている

上部消化管内視鏡やCT検査など、がんの検査には一定の苦痛やリスクを伴うものが多いです。もし、微量の血液や尿でがん検査ができれば素晴らしいことです。すでに商業化されている検査法の一つに尿1滴で15種類のがんリスクがわかると称されているがん線虫検査(N-NOSE)があります。

線虫ががん患者の尿に反応すること自体は事実だとみなしていいでしょう。科学的には興味深い現象で、研究が進むことを願っています。ですが、臨床の現場におけるがん検査の使用に耐えうるほどの性能があるかどうかはわかっていません。とくに、がん検診、つまり無症状の人たちを対象に使用するのは時期尚早です。

まず第一に、がん線虫検査を受けると、受けない場合と比較して、がん死亡率が減少するかどうか検証されていません。付け加えて、がん検診を受けるような集団における検査の性能もわかっていません。検査の性能は、感度や特異度で表されます。感度はがん患者が正しく陽性と判定される割合で、特異度はがんではない人が正しく陰性と判定される割合です。

感度および特異度

HIROTSUバイオサイエンスのウェブサイトでは、感度86.3%、特異度90.8%とされていますが、これはがん患者集団と健常者集団の2つの集団から算出された数字です。一般的に、がん検診を受ける集団という一つの集団を対象にした場合は感度、特異度ともに下がります*1

がん患者集団と健常者集団とを対象にした研究でも感度・特異度はわかるだろうとお思いかもしれません。その通りですが、検査の感度・特異度は、対象となる集団や研究デザインによって変わります。ここでは、説明のために、大腸がん検診のための便潜血検査の感度・特異度を算出する研究について考えてみましょう。

便潜血検査は、便の中に血液が混じっているかどうかで陽性か陰性かを判断します。大腸がんがあってもたまたま出血していなかったり、あるいは出血していてもちょうど便のその部分を検体として採取できなかったりすれば、誤って便潜血陰性という結果になります。逆に、痔出血、大腸炎、憩室出血など、大腸がんでなくても便潜血が陽性になる病気もあります。大腸がんを見つけることを目的とした検査なら偽陽性ということになります。

がん患者集団と健常者集団の2つの集団から感度・特異度を算出してみよう

便潜血検査の感度を算出する方法の一つは、大腸がん患者をたくさん集めて便潜血検査をしてみて、陽性の割合を調べることです。大腸がん患者の診療をしている病院と提携すれば、数十人ぐらいはすぐ集まります。ここで注意が必要なのは、病院に集まる大腸がん患者は無症状とは限らないことです。むしろ、何らかの症状をきっかけに医療機関を受診し、下部消化管内視鏡といった精密検査を受け、大腸がんと診断された患者さんのほうが多いでしょう。一見しただけではわからない少量の出血だけではなく、肉眼的に明らかな下血をきっかけに受診した人も含みます。偽陰性は少なく感度は高くなります。

特異度を算出するには、大腸がんではない人たちをたくさん集めて検査をして、陰性の割合を調べます。ただ無症状というだけでは大腸がんではないと確信できないので、たとえば、下部消化管内視鏡をオプションにした人間ドックを受けて大腸に異常所見を認めなかった健常者の集団を検査します。痔出血、大腸炎、憩室出血などは除外されますので、偽陽性は少なく特異度は高くなります。

がん検診を受ける集団という一つの集団から感度・特異度を算出してみよう

検査を受ける時点では大腸がんだと診断されていない無症状の多くの人たちを対象する別の方法もあります。がん検診を受けるのはそのような人たちですので、がん検診に使いたいならこちらのほうがより実態に合っています。

がん患者の数を知るには、便潜血の結果に関わらず対象者全員に精密検査(下部消化管内視鏡検査)を受けていただくか、一定期間追跡しがんと診断された人の数を数える方法などがあります(参考:■がん検診の「見落とし」を数えるのは難しい)。対象は無症状ですので、当然、病院に集まる大腸がん患者を対象にした場合と比べて感度は落ちます。痔出血や大腸炎の患者も対象に含まれますので、健常者を対象にした場合と比べて特異度も落ちます。

"two-gate design"と"single-gate design"

がん患者集団と健常者集団の2つの集団から感度・特異度を算出する方法を"two-gate design"、一つの集団から感度・特異度を算出する方法を"single-gate design"と呼びます。公的に推奨されているがん検診の感度・特異度の多くは一つの集団から算出した"single-gate design"によります。がん線虫検査を擁護する意見の中に「公的に推奨されている他のがん検診と同じかそれ以上の感度・特異度だ」というものがありますが、がん線虫検査の感度・特異度は過大評価しやすい方法で算出されていることに注意しなければなりません。

がん線虫検査は早期がんでも高い感度を示すと主張されてます。しかし、早期がんなのになぜ、がんと診断されたのかを考えれば、やはり感度が過大評価されている可能性は否定できません。たとえば早期膵がんを考えましょう。がん線虫検査の感度を算出するために集められた早期膵がんは、がん自体の症状はなくても、何らかの理由で早期膵がんを発見できるような精密検査を受けたがゆえにがんと診断された人たちです。たとえば膵のう胞といった良性疾患をフォローされていたなどが考えられます。

もしかすると線虫は、膵がんではなく、併存する良性の膵疾患に反応していた可能性があります。だとすると、がん検診に使用したとき、良性の膵疾患がない早期膵がんは見落としますし、逆に、膵がんがない良性の膵疾患に反応します。それぞれ、感度・特異度が落ちる原因になります。本当に早期がんに対して期待通りの性能を発揮するかどうかは、"single-gate design"による研究を行わなければわかりません。

がん線虫検査は、がん検診に応用するために必要なフェーズをクリアしていない

がんの早期発見を目的としたバイオマーカー開発のために提案されたガイドラインでは、5つのフェーズが必要とされています*2。がん線虫検査は、その5つのフェーズのうち第2フェーズまでしかクリアしていません。薬やワクチンなら承認に必要な3つのフェーズの第1相試験と第2相試験の中間ぐらいまでしかクリアしていないようなものです。薬やワクチンなら許されないのに、検査は高額な対価を取って顧客に提供されています。

がん検診を受けるような一つの集団における検査の性能を評価するための"single-gate design"は第4フェーズに相当します。がん検診に応用するには第4フェーズをクリアしてもまだ不十分で、検診を受けると、受けない場合と比べて、がん死亡率が低下することを確認する第5フェーズをクリアしなければなりません。公的に推奨されているがん検診はすべて、何らかの研究でがん死亡率減少が確認されています。

臨床試験登録情報を検索した限りでは、現時点で、がん線虫検査の第4フェーズもしくは第5フェーズに相当する臨床試験は行われていませんし、行う計画すらありません。自費診療クリニックではがん線虫検査以外の有象無象の「がんリスク判定検査」が行われていますが、これらの検査についても広く臨床応用するための臨床試験が進んでいるという話は聞きません。

根拠の乏しいがん検査がはびこる構造的理由

こうしたがん検査が行われている理由の一端は、儲かるからです。公的ながん検診を受けたいが敷居を高く感じていたり、あるいは、公的ながん検診だけでは安心できないような人たちが顧客になります。ですが、無症状の人に対するがん検査は害を引き起こします。

偽陽性は、精密検査による経済的負担、身体的負担に加え、精密検査で見落とされているかもしれないという心理的不安をもたらします。これらの害は公的に推奨されているがん検診でも起きますが、がん線虫検査は15種類のがんのリスクがわかるという触れ込みなので、陽性ならば多くの精密検査を受ける羽目に陥るため、偽陽性の害が特に大きいのです。

実際にがんが発見・診断された患者さんは「検査によって利益を得た」と主観的には感じますが、実際のところ、利益があるとは限りません(参考:■過剰診断が多いほど検診から恩恵を受けたと感じる人が多くなる「ポピュラリティパラドクス」)。予後の改善をもたらさないがんの発見は、利益どころか害を及ぼします。

偽陽性でも精密検査を行う医療機関にとっては金銭的利益になりますし、予後を改善しなくてもがんの発見は患者さんから感謝され、口コミでさらに検査を受けたがる顧客が増えるでしょう。端的に言えば、がん検診の誤解を利用して患者の健康を犠牲しつつ医療機関と検査会社が儲かるビジネスです。下手に臨床試験を進めて、想定より感度・特異度が低かったり、がん死亡率減少に寄与しないことが明らかになったりするとヤブヘビです。必要な臨床試験は行わず、患者さんの誤解を放置したままのほうがビジネスには都合がよいのです。

線虫がん検査の開発者の言葉

"single-gate design"や、がん死亡率減少を検証するランダム化比較試験にはお金と時間がかかります。そのため、やむを得ず、今の段階では研究資金を集めるために実験的な検査を提供しているということかもしれません。その場合も、検査の限界や害について十分に情報を提供する義務があるはずです。

がん線虫検査の会社は、「すい臓がん早期発見へ」と称して、「N-NOSE plus すい臓」という商品の提供をはじめました。検査費用は5万~7万円です。2017年にダイヤモンド・オンラインに掲載された■「線虫がん検査」のニセモノ横行に開発者が警告、インチキ医療の見破り方 という記事を読んで、私は感銘を受けました。印象深い部分を引用しましょう。強調は引用者によります。



確かに。2015年に高視聴率をとったテレビドラマ『下町ロケット』(TBS)でも、不公正で意地悪な役人が登場し、誠実な主人公たちの邪魔をしていたし、腕利きドクターの治療を受けるのには、有力者の紹介が必須みたいなイメージがある。「世の中は不公平で、どこかできっと、いい情報は囲い込まれており、自分は知らないだけなのだ」と疑心暗鬼になっている人は多いのかもしれない。しかも、お金持ちや地位のある人の方が、インチキ医療のカモにされているように見える。
 (自分だけは、特別扱いしてほしい。お金は出すから、得したい)という心理こそ、詐欺集団の思う壺なのだ


線虫がん検査は、がん検診を受けるような集団における感度・特異度は不明ですし、検査を受けることでがん死亡率の減少といった利益があるかどうかもわかっていません。害はあり、とくに偽陽性の害は甚大です。こうした検査をわざわざお金を支払って受けることは「インチキ医療のカモにされている」ように、私には見えます。

『週刊現代』のジレンマ

以前、マスコミからのインタビューに対する報酬について話題になった(■「孤独のグルメ」久住先生が報酬・校正無しの取材を断った件で浮上した、『無償による真実性』という原則とそれに対する疑問の声 - Togetter)。私も、ときにメディアから取材やインタビューの依頼を受けるが、報酬は発生したりしなかったりする。これまでの経験では、週刊誌系メディアでは報酬が発生するのに対し、新聞系メディアでは発生しないことが多い。

無報酬を原則とする言い分も理解はできる。あくまで私の経験の範囲内だが、平均すると、無報酬のメディアのほうが質の高い記事が多い。謝礼を払うと、謝礼目的の有象無象の情報が集まりやすいという面はあろう。週刊誌の医療記事では、「お前はいったい何の専門家だ」と問い詰めたくなるような「常連」のコメンテイターが記事の質を下げている。記事を書く方にとっては都合のよい「専門家」のコメントが得られ、コメントする方にとってはお手軽にお小遣いを稼げるというWin-Winの構造ができあがっていると私は思っている。

無報酬原則に則れば、この手の小遣い稼ぎ目的の連中は排除できる。メディアに信用があれば、たとえ報酬がなくても読者に正確な情報を伝えるために協力してくれる専門家はいるだろう。おそらく、これまではそれでうまく回っていたのが、近年はメディアの信用が落ち、あるいは、メディアに頼らずにSNSなどで専門家が自分で情報を発信できるようになってきたために、無報酬の原則が疑問視されるようになってきたのではないか。付け加えて、アカデミックな場では相手にされないようなトンデモ本や根拠の乏しい高額な自費診療クリニックを宣伝して欲しい自称「専門家」に対して無報酬原則は脆弱である。

私個人については、報酬の有無はあまり気にしていない。また、多少怪しい企画であっても、私が協力できそうな内容なら積極的に取材を受けるようにしている。その結果、まるで私が病院を出入り禁止になったかのように見える支払明細書が送られてきたりする。

病院に行ってはいけない名取宏氏


以前「『週刊現代』のジレンマ」という概念を提唱したことがある。



医師などの専門家にインタビューして、専門家の言葉を不適切につなぎ合わせてデタラメな記事を書くメディアがある。最近の例は「飲み続けてはいけない薬」のシリーズを掲載している週刊誌「週刊現代」。そのようなメディアに対して専門家は取材を断る、という選択肢がある。しかしながら、まともな専門家すべてが取材を断ったとしたら、デタラメなことを主張するデタラメな自称専門家のみがそのようなメディアに登場することになる。ならば、多少は主張を捻じ曲げられることを承知の上で、相対的にまともな情報が掲載されるよう、メディアに協力するという選択肢もある。そこにはジレンマがある。


医療関係について不正確な記事を書いているのは週刊現代に限らないのだが、たまたまこの時分に週刊現代が立て続けに「飲んではいけない薬」の特集を掲載していたことによる。

なお、医療の専門家として取材を受けているときは、少なくとも自分の発言部分周りの事前のチェックは必ずさせていただけた*1。この点は、たとえば政治家に対するインタビューとは決定的に異なる。理想を言えば、取材を受けた人以外の第三者の専門家のチェックが欲しいところだが、週刊誌の記事ではそこまでコストはかけられないのは理解できる。

多くの医療関係者の中から私を選ぶだけあって、ほとんどの場合、私に取材した記事の内容の質は高く、事前チェックも細かい用語の訂正ぐらいで済む。だが例外もあって、私が言ってもいないことを言ったかのように書かれることもまれにはある。週刊誌の場合は文字数が決まっているので、その範囲内で修正案を出さなければならない。一例を挙げよう。がん検診に懐疑的な週刊誌の記事に取材協力したとき私が以下の発言をしたことになっていた。



修正前:「実は症状が無い人の場合、がん検査を受けたところでがんを見つけらないことが多いのです。たとえば、腫瘍マーカー検査も、前立腺がん以外のがんを発見できる有効性は確認されていません」


私はそんなことは言っていない。問題点はざっと3つ。「公的に推奨されているがん検診まで読者が避けることがないようにしたい」「がん検診の有効性はがんの発見ではなくがん死亡率の減少で評価する」「PSA以外の腫瘍マーカー検査でもがんを発見できることはあるが、がん死亡率の減少は証明されていない」。これらを踏まえて、字数制限の範囲内に収まるよう、修正案を出した。



修正案:「公的に推奨されている以外のがん検診の多くは、がん死亡率の減少が証明されていません。たとえば、腫瘍マーカーによるがん検診は、PSAによる前立腺がん検診を除いて、有効性は未確認です」


PSAによる前立腺がん検診も専門家の間では議論があるのだが、そこは割愛せざるを得ない。修正案は採用され、最終的にはそこそこよい記事になったと思う。週刊誌の記者は、自分の専門外のさまざまな分野で締め切りに追われて記事を書かなければならないので大変だ。自分が望んでではなく、編集部の方針として、あまり興味ない分野の記事も書かなくてはならないこともあろう。

その中でもプロフェッショナルといえる編集者もいた。新型コロナウイルス感染症の流行のはじめごろ、サージカルマスクが不足しているとある大学病院でマスクを使いまわしていることについてコメントを求められた。「公的なガイドラインでは『マスクは再利用しない。一回使ったらすみやかに廃棄する』となっている。しかし、そんなことは承知の上でやむを得ず苦肉の策で使っているのだろう」などと答えた。結果的にこのコメントは採用されたのだが、おそらくは締め切りの直前、電話で『『公的なガイドライン』とは具体的にどのガイドラインなのか」と聞かれた。誌面に載せる以上は、裏を取る必要があると判断したのだろう。「週刊文春」だった。

「週刊ダイヤモンド」の健康診断・検診の特集も多くの専門家に取材しており、質が高かった。たとえば線虫検査をはじめとしたリキッド・バイオプシーの記事では、感度・特異度が過大評価されている問題が指摘されていた。ほとんどの場合、宣伝されている感度・特異度は「すでにがんと診断された患者集団」と「すでにがんではないことがわかっている健常者集団」という二つの集団から求めた“two-gate design”研究から算出されており、がんであるかどうかがわかっていない自覚症状がない一つの集団を対象にした“single-gate design”の研究は行われていない。私の知る限りでは一般向けの記事でこの問題点を最初に指摘した記事である。このような質の高い記事が増えて欲しいのだが、やはりコストに見合わないのであろう。


*1:事前チェックが反映されず校正漏れが生じたことはある

WHOのがん統計グラフデータベースの使い方解説

WHOのがん統計のグラフデータベースがリニューアルされました。これを機会に使い方を解説します。「がん死亡数が増え続けているのは先進国では日本だけ」なんてデマを検証できますし、他国を含めてさまざまながんの統計を知るのは楽しいものです。リニューアル以前は、こういうグラフでした。

リニューアル以前・がん死亡者数の推移(日本、全がん、全年齢)


リニューアル後はこんな感じです。

リニューアル後・がん死亡者数の推移(日本、全がん・非メラノーマ皮膚がんを除く、全年齢)

以下、グラフの引用はすべて■Cancer Over Timeから、日本語の赤字は引用者によります。


WHOのサイトにアクセスして、がん統計の推移(Trends)のグラフをつくろう

WHOの下部組織のIARC(国際がん研究機関)は世界中の国のがんの統計情報を集め、データベースとして公開しています。さっそく、アクセスしてみましょう。


■Cancer Over Time

Cancer Over Timeのトップページ


左からTrends、Age-specific、Age, period, cohort、Bar、EAPCの5つの円が表示されました。今回は一番左のTrends(年次推移)をクリックします。

Cancer Over TimeのTrends(デフォルト)

さっそく何やらグラフが表示されました。現在のところ、デフォルトではスウェーデンの男女の肺がん年齢調整死亡率の推移が表示されるようです。以前と比べて明らかに変わった点は、縦軸が対数となったことと、グラフの線がなめらかになったことです。線形目盛やスムージングを止めたいときは、Options(オプション)から変更できます。スムージングなしだと、人口が少ない国やまれながんではグラフがカクカクします。

線形目盛り・スムージングなし

全がん年齢調整死亡率を比較してみよう

それではまず、日本とアメリカ合衆国の全がん年齢調整死亡率を比較してみましょう。"Cancer sites"(がんの部位)から"All site excl. non-melanoma skin cancer"(全がん・非メラノーマ皮膚がんを除く)を選択します。非メラノーマ皮膚がんは、国によってはがんとして登録されず統計に入りませんので、比較のときにはよく除外されます。全がん死亡を比較するときには気にしなくてもかまいません。

がんの部位→全がんを選択

次に、"Populations"(集団)から"Japan"(日本)と"USA"(アメリカ合衆国)を選択します。

集団から日本とアメリカ合衆国を選択

たくさんの国がありますが、アルファベット順に並んでいるのですぐ見つかります。どうでもいいことですが、さまざまな国の統計データをこうして利用できることにわくわくしませんか。私はします。

アメリカ合衆国および日本の全がん全年齢調整死亡率の推移・男女・全年齢

ネットではよく「欧米では禁止されている売れ残りの農薬・食物添加物・抗がん剤を押し付けられているから日本だけががん死亡が増えているんだよ!!」というデマをみますが、年齢調整死亡率でみますと、アメリカ合衆国と比べて日本がとくに悪いわけではないことがよくわかります。とくに日本女性は一貫してがん死亡率が低いですね。

年齢調整死亡率ではなく粗死亡率ではどうなるか試してみよう

よくある「アメリカ合衆国ではがん死亡率が下がっているのに日本では上がっている」グラフの出どころは、年齢調整をしていない粗死亡率です。年齢構成の異なる集団同士を粗死亡率で比較すべきではないのですが、ここではあえてやってみましょう。"Statistics"(統計)から"Crude rate"(粗死亡率)を選択します。ちなみに、"Cumulative risk"(累積リスク)と"Number"(がん死亡者数)も選択できます。

アメリカ合衆国および日本の全がん全年齢粗死亡率の推移・男女・全年齢

このグラフを切り取って「日本ではがん死亡率が激増している。時代遅れの抗がん剤治療で患者を殺しているんだよ!!」などと不安を煽るわけですな。しかし年齢調整がん死亡率が下がっていることを知っている我々は、日本でのがん粗死亡率の上昇の主因が高齢化であることを理解できます。

50歳台のがん死亡率の推移をみてみよう

たまに年齢調整の意味がよくわからない方もいらっしゃるようで、なんだかごまかされたように感じるそうです。そういう方のために、年齢別の粗死亡率の出し方も解説します。"Age groups"(年齢集団)から50~59歳を選択してみましょう。

年齢集団で50歳台を選択

これで、日本とアメリカ合衆国のそれぞれの国で50歳台の人たちがどれぐらいがんで亡くなるのかがわかります。もし、農薬やら抗がん剤やらで日本人のほうががんで死にやすいのなら、50歳台の比較でも日本のほうががん死亡率が高いはずです。さて、結果はどうでしょう。どうでもいいことですが、グラフの表示まで数秒を待つ間、わくわくしませんか。私はします。

アメリカ合衆国および日本の全がん50~59歳の粗死亡率の推移・男女・全年齢

50歳台で比較すると、男女ともに日本のほうがアメリカ合衆国よりがんの死亡率は低いのです。全年齢・年齢調整だとわずかですがアメリカ男性より日本男性のほうががん死亡率が高いのに、50歳台に限ると日本男性では景気よくがん死亡率が下がっており、アメリカ女性を追い抜いて日本女性にすら追い付きつつあるのは興味深いです。どのようながんが減っているのか、"Cancer sites"(がんの部位)からさまざまながん腫を選んでみてみると面白いですよ。私のおすすめは"Stomach"(胃がん)です。また、グラフや元データは右上のアイコンからダウンロードできます。

グラフやデータをダウンロード

みなさんも、ぜひWHOの統計情報を活用してみてください。