NATROMのブログ

ニセ医学への注意喚起を中心に内科医が医療情報を発信します。

ABO式血液型の遺伝様式をめぐる2つの仮説

オーストリアのカール・ラントシュタイナーによってABO式血液型が発見され、輸血医学の基礎が築かれたことは有名だ。1930年にラントシュタイナーはノーベル医学・生理学賞を受賞した。輸血の歴史については

■「血液は生理食塩水で代用できるから輸血は必要ない…」そんな荒唐無稽なデマの裏事情を医師が解説 動物の血を輸血した昔から、人の血を安全に輸血できるようになった今まで | PRESIDENT Online(プレジデントオンライン)

に書いた。輸血とは直接は関係ないが、ABO式血液型の遺伝様式が決定された歴史も興味深い。私は、もう20年以上も前、大学院生のころにはじめて知ったのだが、じつにエレガントに問題を解決しており、いつかこの話を書きたいと思っていた。数式がたくさん出てくるこの話は難解だが、個人ブログだし、少しぐらい難しくてもいいだろう。細かい数式はわからなくてもなんとなく雰囲気を感じていただければ幸いである。

ABO式血液型の発見は1901年ごろ。血液型が遺伝することは1910年ごろには知られていたが、ABO式血液型の正しい遺伝様式がドイツの数学者Bernsteinによって示されたのは1924年だったそうだ*1。ABO式血液型の遺伝様式を高校生物学で学んだ方もいらっしゃるだろう。ABO式血液型はメンデルが研究したエンドウマメの形質よりも少しだけ複雑である。たとえば、エンドウマメの種子の形は丸いかしわがあるかであり、この表現型は2種類の対立遺伝子によって決まる。一方、ABO式血液型は、A、B、Oの3種類の対立遺伝子によって決まる。一つの遺伝子座に3種類以上の対立遺伝子が存在することを複対立遺伝子といってABO式血液型は代表的な複対立遺伝子の例である*2

1924年までは、ABO式血液型は2つの遺伝子座のそれぞれ2種類の対立遺伝子によって決まるという誤った仮説(「二遺伝子座仮説」)が信じられていた。二遺伝子座仮説では、A抗原とB抗原は2つの独立した遺伝子座によって作られるとする。対立遺伝子Aはaに対して、対立遺伝子Bはbに対してそれぞれ顕性(優性)である。たとえばO型血液型は、2つの遺伝子座において潜性(劣性)ホモ接合である遺伝子型aabbの場合である。表にするとこう。

ABO式血液型の遺伝様式の2つの仮説

誤った二遺伝子座仮説が長らく信じられていた理由は、AB型とO型の両親からAB型やO型の子が生まれたことが観察されたからである。複対立遺伝子仮説が正しければ、AB型(遺伝子型AB)とO型(遺伝子型OO)の両親からは、A型(遺伝子型AO
)とB型(遺伝子型BO)の子が1対1の割合で生まれ、AB型やO型は生まれないはずだ*3。ただ、当時の血液型検査の性能には限界があり、一定の割合で不正確なデータが含まれた。ついでに言えば、申告された父親が生物学的な父親と異なることだってあっただろう。

検査の不正確さや父親の誤認を言い始めたら、正しい遺伝様式なんていつまで経ってもわからないような気もするが、1924年から1925年にかけて、実際に観察された集団の表現型の割合から遺伝子頻度を計算し突き合わせることで二遺伝子座仮説が誤っており複対立遺伝子仮説が正しいことが示された。その証明のプロセスを自分で計算してみたところ、なるほど、実にエレガントであり感動を覚えた。この感動をどうにかして伝えたい。エクセルで自分で計算することをお勧めするが、計算を追っかけるだけでもなんとなく雰囲気はわかるだろう。

集団のサイズが十分に大きくて交配がランダムに行われているといった複数の条件を満たす集団では、遺伝子頻度と表現型の割合に一定の関係が生じる。複対立遺伝子仮説では以下の表のとおりである。

複対立遺伝子仮説における遺伝子頻度と表現型の割合の関係

実際に観察できたのは集団中の表現型の割合であるが、表現型の割合がわかれば遺伝子頻度を逆算できる。ポイントは式は4つできるのに変数は2つしかないところだ。せっかくなので、なるべく正確な日本人集団のデータを利用したい。400万人以上もの日本人のデータによれば、O型29.25%、A型38.65%、B型22.15%、AB型9.95%だった*4

この表現型の割合のデータから対立遺伝子Aの遺伝子頻度p、および、対立遺伝子Bの遺伝子頻度qを計算できるはずだ。いろいろと計算方法はあるが、まずAB型のデータは使わずに計算してみよう。2次方程式の解の公式をつかってゴリゴリ計算もできるが、A型+O型の割合からqを、B型+O型の割合からpを計算するのがスマートである。

A型+O型の割合は0.2925+0.3865=0.679、(1-q)^2=0.679を解くとq≒0.1760となる。同様にB型+O型の割合0.2925+0.2215=0.514、(1-p)^2=0.514を解くとp≒0.2831となる。

次に検算だ。p=0.1760、q=0.2831となったので、この遺伝子頻度からAB型の割合を計算すると0.0997となり、実測値9.95%とほぼ一致する。めでたしめでたし。当り前のような気がするが、それは我々が複対立遺伝子仮説が正しいと知っているからである。

二遺伝子座仮説における遺伝子頻度と表現型の割合の関係

二遺伝子座仮説だとどうか。A型+O型の割合からqを、B型+O型の割合からpを計算できるところまでは同じだ。二遺伝子座仮説だとAB型の遺伝子型はAABB、AaBB、AABb、AaBbの4通り。計算方法はいくつかあるが、対立遺伝子Aを保有(遺伝子型AAまたはAa)かつ対立遺伝子Bを保有している(遺伝子型BBまたはBb)を考えれば、(p^2+2p(1-p))*(q^2+2q(1-q))=0.1560となる。この数字は実測値9.95%からだいぶ違っている。二遺伝子座仮説が誤っているからだ。

遺伝子頻度を利用する方法の利点は、不確かなヒトの親子関係に依存しないことである。また検査の不正確さにも頑健だ。多少は影響するだろうが、全体としては誤差の範囲内に収まる。Bernsteinは、朝鮮半島に住む日本人のデータなどの世界中の集団のABO式血液型のデータを用いて、複対立遺伝子仮説に基づいた遺伝子頻度からの予測値と実測値がよく合うことを示した。

現在は、ABO式血液型を決定する遺伝子が染色体のどこにあり、どのような塩基配列をしているかもよくわかっており、表現型ではなく遺伝子型を直接調べることも可能だ。しかし遺伝子型を調べるどころか表現型の検査にすら一定の誤りがあった時代に、正しいABO式血液型の遺伝様式を示したのがBernsteinの業績である。

*1:https://pubmed.ncbi.nlm.nih.gov/8417988/

*2:と高校生物学の教科書には書いてあったが論文であまり複対立遺伝子という言葉を見ない。というか、一つの遺伝子座に3種類以上の対立遺伝子が存在するのが普通であって、むしろメンデルのエンドウマメのような一遺伝子座に2種類の対立遺伝子しか存在しない古典的な事例のほうが例外的だと思う

*3:現在ではまれな例外としてcis ABや突然変異が知られている

*4:https://www.nature.com/articles/jhg19788.pdf

「線虫がん検査」の感度・特異度は過大評価されている

上部消化管内視鏡やCT検査など、がんの検査には一定の苦痛やリスクを伴うものが多いです。もし、微量の血液や尿でがん検査ができれば素晴らしいことです。すでに商業化されている検査法の一つに尿1滴で15種類のがんリスクがわかると称されているがん線虫検査(N-NOSE)があります。

線虫ががん患者の尿に反応すること自体は事実だとみなしていいでしょう。科学的には興味深い現象で、研究が進むことを願っています。ですが、臨床の現場におけるがん検査の使用に耐えうるほどの性能があるかどうかはわかっていません。とくに、がん検診、つまり無症状の人たちを対象に使用するのは時期尚早です。

まず第一に、がん線虫検査を受けると、受けない場合と比較して、がん死亡率が減少するかどうか検証されていません。付け加えて、がん検診を受けるような集団における検査の性能もわかっていません。検査の性能は、感度や特異度で表されます。感度はがん患者が正しく陽性と判定される割合で、特異度はがんではない人が正しく陰性と判定される割合です。

感度および特異度

HIROTSUバイオサイエンスのウェブサイトでは、感度86.3%、特異度90.8%とされていますが、これはがん患者集団と健常者集団の2つの集団から算出された数字です。一般的に、がん検診を受ける集団という一つの集団を対象にした場合は感度、特異度ともに下がります*1

がん患者集団と健常者集団とを対象にした研究でも感度・特異度はわかるだろうとお思いかもしれません。その通りですが、検査の感度・特異度は、対象となる集団や研究デザインによって変わります。ここでは、説明のために、大腸がん検診のための便潜血検査の感度・特異度を算出する研究について考えてみましょう。

便潜血検査は、便の中に血液が混じっているかどうかで陽性か陰性かを判断します。大腸がんがあってもたまたま出血していなかったり、あるいは出血していてもちょうど便のその部分を検体として採取できなかったりすれば、誤って便潜血陰性という結果になります。逆に、痔出血、大腸炎、憩室出血など、大腸がんでなくても便潜血が陽性になる病気もあります。大腸がんを見つけることを目的とした検査なら偽陽性ということになります。

がん患者集団と健常者集団の2つの集団から感度・特異度を算出してみよう

便潜血検査の感度を算出する方法の一つは、大腸がん患者をたくさん集めて便潜血検査をしてみて、陽性の割合を調べることです。大腸がん患者の診療をしている病院と提携すれば、数十人ぐらいはすぐ集まります。ここで注意が必要なのは、病院に集まる大腸がん患者は無症状とは限らないことです。むしろ、何らかの症状をきっかけに医療機関を受診し、下部消化管内視鏡といった精密検査を受け、大腸がんと診断された患者さんのほうが多いでしょう。一見しただけではわからない少量の出血だけではなく、肉眼的に明らかな下血をきっかけに受診した人も含みます。偽陰性は少なく感度は高くなります。

特異度を算出するには、大腸がんではない人たちをたくさん集めて検査をして、陰性の割合を調べます。ただ無症状というだけでは大腸がんではないと確信できないので、たとえば、下部消化管内視鏡をオプションにした人間ドックを受けて大腸に異常所見を認めなかった健常者の集団を検査します。痔出血、大腸炎、憩室出血などは除外されますので、偽陽性は少なく特異度は高くなります。

がん検診を受ける集団という一つの集団から感度・特異度を算出してみよう

検査を受ける時点では大腸がんだと診断されていない無症状の多くの人たちを対象する別の方法もあります。がん検診を受けるのはそのような人たちですので、がん検診に使いたいならこちらのほうがより実態に合っています。

がん患者の数を知るには、便潜血の結果に関わらず対象者全員に精密検査(下部消化管内視鏡検査)を受けていただくか、一定期間追跡しがんと診断された人の数を数える方法などがあります(参考:■がん検診の「見落とし」を数えるのは難しい)。対象は無症状ですので、当然、病院に集まる大腸がん患者を対象にした場合と比べて感度は落ちます。痔出血や大腸炎の患者も対象に含まれますので、健常者を対象にした場合と比べて特異度も落ちます。

"two-gate design"と"single-gate design"

がん患者集団と健常者集団の2つの集団から感度・特異度を算出する方法を"two-gate design"、一つの集団から感度・特異度を算出する方法を"single-gate design"と呼びます。公的に推奨されているがん検診の感度・特異度の多くは一つの集団から算出した"single-gate design"によります。がん線虫検査を擁護する意見の中に「公的に推奨されている他のがん検診と同じかそれ以上の感度・特異度だ」というものがありますが、がん線虫検査の感度・特異度は過大評価しやすい方法で算出されていることに注意しなければなりません。

がん線虫検査は早期がんでも高い感度を示すと主張されてます。しかし、早期がんなのになぜ、がんと診断されたのかを考えれば、やはり感度が過大評価されている可能性は否定できません。たとえば早期膵がんを考えましょう。がん線虫検査の感度を算出するために集められた早期膵がんは、がん自体の症状はなくても、何らかの理由で早期膵がんを発見できるような精密検査を受けたがゆえにがんと診断された人たちです。たとえば膵のう胞といった良性疾患をフォローされていたなどが考えられます。

もしかすると線虫は、膵がんではなく、併存する良性の膵疾患に反応していた可能性があります。だとすると、がん検診に使用したとき、良性の膵疾患がない早期膵がんは見落としますし、逆に、膵がんがない良性の膵疾患に反応します。それぞれ、感度・特異度が落ちる原因になります。本当に早期がんに対して期待通りの性能を発揮するかどうかは、"single-gate design"による研究を行わなければわかりません。

がん線虫検査は、がん検診に応用するために必要なフェーズをクリアしていない

がんの早期発見を目的としたバイオマーカー開発のために提案されたガイドラインでは、5つのフェーズが必要とされています*2。がん線虫検査は、その5つのフェーズのうち第2フェーズまでしかクリアしていません。薬やワクチンなら承認に必要な3つのフェーズの第1相試験と第2相試験の中間ぐらいまでしかクリアしていないようなものです。薬やワクチンなら許されないのに、検査は高額な対価を取って顧客に提供されています。

がん検診を受けるような一つの集団における検査の性能を評価するための"single-gate design"は第4フェーズに相当します。がん検診に応用するには第4フェーズをクリアしてもまだ不十分で、検診を受けると、受けない場合と比べて、がん死亡率が低下することを確認する第5フェーズをクリアしなければなりません。公的に推奨されているがん検診はすべて、何らかの研究でがん死亡率減少が確認されています。

臨床試験登録情報を検索した限りでは、現時点で、がん線虫検査の第4フェーズもしくは第5フェーズに相当する臨床試験は行われていませんし、行う計画すらありません。自費診療クリニックではがん線虫検査以外の有象無象の「がんリスク判定検査」が行われていますが、これらの検査についても広く臨床応用するための臨床試験が進んでいるという話は聞きません。

根拠の乏しいがん検査がはびこる構造的理由

こうしたがん検査が行われている理由の一端は、儲かるからです。公的ながん検診を受けたいが敷居を高く感じていたり、あるいは、公的ながん検診だけでは安心できないような人たちが顧客になります。ですが、無症状の人に対するがん検査は害を引き起こします。

偽陽性は、精密検査による経済的負担、身体的負担に加え、精密検査で見落とされているかもしれないという心理的不安をもたらします。これらの害は公的に推奨されているがん検診でも起きますが、がん線虫検査は15種類のがんのリスクがわかるという触れ込みなので、陽性ならば多くの精密検査を受ける羽目に陥るため、偽陽性の害が特に大きいのです。

実際にがんが発見・診断された患者さんは「検査によって利益を得た」と主観的には感じますが、実際のところ、利益があるとは限りません(参考:■過剰診断が多いほど検診から恩恵を受けたと感じる人が多くなる「ポピュラリティパラドクス」)。予後の改善をもたらさないがんの発見は、利益どころか害を及ぼします。

偽陽性でも精密検査を行う医療機関にとっては金銭的利益になりますし、予後を改善しなくてもがんの発見は患者さんから感謝され、口コミでさらに検査を受けたがる顧客が増えるでしょう。端的に言えば、がん検診の誤解を利用して患者の健康を犠牲しつつ医療機関と検査会社が儲かるビジネスです。下手に臨床試験を進めて、想定より感度・特異度が低かったり、がん死亡率減少に寄与しないことが明らかになったりするとヤブヘビです。必要な臨床試験は行わず、患者さんの誤解を放置したままのほうがビジネスには都合がよいのです。

線虫がん検査の開発者の言葉

"single-gate design"や、がん死亡率減少を検証するランダム化比較試験にはお金と時間がかかります。そのため、やむを得ず、今の段階では研究資金を集めるために実験的な検査を提供しているということかもしれません。その場合も、検査の限界や害について十分に情報を提供する義務があるはずです。

がん線虫検査の会社は、「すい臓がん早期発見へ」と称して、「N-NOSE plus すい臓」という商品の提供をはじめました。検査費用は5万~7万円です。2017年にダイヤモンド・オンラインに掲載された■「線虫がん検査」のニセモノ横行に開発者が警告、インチキ医療の見破り方 という記事を読んで、私は感銘を受けました。印象深い部分を引用しましょう。強調は引用者によります。



確かに。2015年に高視聴率をとったテレビドラマ『下町ロケット』(TBS)でも、不公正で意地悪な役人が登場し、誠実な主人公たちの邪魔をしていたし、腕利きドクターの治療を受けるのには、有力者の紹介が必須みたいなイメージがある。「世の中は不公平で、どこかできっと、いい情報は囲い込まれており、自分は知らないだけなのだ」と疑心暗鬼になっている人は多いのかもしれない。しかも、お金持ちや地位のある人の方が、インチキ医療のカモにされているように見える。
 (自分だけは、特別扱いしてほしい。お金は出すから、得したい)という心理こそ、詐欺集団の思う壺なのだ


線虫がん検査は、がん検診を受けるような集団における感度・特異度は不明ですし、検査を受けることでがん死亡率の減少といった利益があるかどうかもわかっていません。害はあり、とくに偽陽性の害は甚大です。こうした検査をわざわざお金を支払って受けることは「インチキ医療のカモにされている」ように、私には見えます。

『週刊現代』のジレンマ

以前、マスコミからのインタビューに対する報酬について話題になった(■「孤独のグルメ」久住先生が報酬・校正無しの取材を断った件で浮上した、『無償による真実性』という原則とそれに対する疑問の声 - Togetter)。私も、ときにメディアから取材やインタビューの依頼を受けるが、報酬は発生したりしなかったりする。これまでの経験では、週刊誌系メディアでは報酬が発生するのに対し、新聞系メディアでは発生しないことが多い。

無報酬を原則とする言い分も理解はできる。あくまで私の経験の範囲内だが、平均すると、無報酬のメディアのほうが質の高い記事が多い。謝礼を払うと、謝礼目的の有象無象の情報が集まりやすいという面はあろう。週刊誌の医療記事では、「お前はいったい何の専門家だ」と問い詰めたくなるような「常連」のコメンテイターが記事の質を下げている。記事を書く方にとっては都合のよい「専門家」のコメントが得られ、コメントする方にとってはお手軽にお小遣いを稼げるというWin-Winの構造ができあがっていると私は思っている。

無報酬原則に則れば、この手の小遣い稼ぎ目的の連中は排除できる。メディアに信用があれば、たとえ報酬がなくても読者に正確な情報を伝えるために協力してくれる専門家はいるだろう。おそらく、これまではそれでうまく回っていたのが、近年はメディアの信用が落ち、あるいは、メディアに頼らずにSNSなどで専門家が自分で情報を発信できるようになってきたために、無報酬の原則が疑問視されるようになってきたのではないか。付け加えて、アカデミックな場では相手にされないようなトンデモ本や根拠の乏しい高額な自費診療クリニックを宣伝して欲しい自称「専門家」に対して無報酬原則は脆弱である。

私個人については、報酬の有無はあまり気にしていない。また、多少怪しい企画であっても、私が協力できそうな内容なら積極的に取材を受けるようにしている。その結果、まるで私が病院を出入り禁止になったかのように見える支払明細書が送られてきたりする。

病院に行ってはいけない名取宏氏


以前「『週刊現代』のジレンマ」という概念を提唱したことがある。



医師などの専門家にインタビューして、専門家の言葉を不適切につなぎ合わせてデタラメな記事を書くメディアがある。最近の例は「飲み続けてはいけない薬」のシリーズを掲載している週刊誌「週刊現代」。そのようなメディアに対して専門家は取材を断る、という選択肢がある。しかしながら、まともな専門家すべてが取材を断ったとしたら、デタラメなことを主張するデタラメな自称専門家のみがそのようなメディアに登場することになる。ならば、多少は主張を捻じ曲げられることを承知の上で、相対的にまともな情報が掲載されるよう、メディアに協力するという選択肢もある。そこにはジレンマがある。


医療関係について不正確な記事を書いているのは週刊現代に限らないのだが、たまたまこの時分に週刊現代が立て続けに「飲んではいけない薬」の特集を掲載していたことによる。

なお、医療の専門家として取材を受けているときは、少なくとも自分の発言部分周りの事前のチェックは必ずさせていただけた*1。この点は、たとえば政治家に対するインタビューとは決定的に異なる。理想を言えば、取材を受けた人以外の第三者の専門家のチェックが欲しいところだが、週刊誌の記事ではそこまでコストはかけられないのは理解できる。

多くの医療関係者の中から私を選ぶだけあって、ほとんどの場合、私に取材した記事の内容の質は高く、事前チェックも細かい用語の訂正ぐらいで済む。だが例外もあって、私が言ってもいないことを言ったかのように書かれることもまれにはある。週刊誌の場合は文字数が決まっているので、その範囲内で修正案を出さなければならない。一例を挙げよう。がん検診に懐疑的な週刊誌の記事に取材協力したとき私が以下の発言をしたことになっていた。



修正前:「実は症状が無い人の場合、がん検査を受けたところでがんを見つけらないことが多いのです。たとえば、腫瘍マーカー検査も、前立腺がん以外のがんを発見できる有効性は確認されていません」


私はそんなことは言っていない。問題点はざっと3つ。「公的に推奨されているがん検診まで読者が避けることがないようにしたい」「がん検診の有効性はがんの発見ではなくがん死亡率の減少で評価する」「PSA以外の腫瘍マーカー検査でもがんを発見できることはあるが、がん死亡率の減少は証明されていない」。これらを踏まえて、字数制限の範囲内に収まるよう、修正案を出した。



修正案:「公的に推奨されている以外のがん検診の多くは、がん死亡率の減少が証明されていません。たとえば、腫瘍マーカーによるがん検診は、PSAによる前立腺がん検診を除いて、有効性は未確認です」


PSAによる前立腺がん検診も専門家の間では議論があるのだが、そこは割愛せざるを得ない。修正案は採用され、最終的にはそこそこよい記事になったと思う。週刊誌の記者は、自分の専門外のさまざまな分野で締め切りに追われて記事を書かなければならないので大変だ。自分が望んでではなく、編集部の方針として、あまり興味ない分野の記事も書かなくてはならないこともあろう。

その中でもプロフェッショナルといえる編集者もいた。新型コロナウイルス感染症の流行のはじめごろ、サージカルマスクが不足しているとある大学病院でマスクを使いまわしていることについてコメントを求められた。「公的なガイドラインでは『マスクは再利用しない。一回使ったらすみやかに廃棄する』となっている。しかし、そんなことは承知の上でやむを得ず苦肉の策で使っているのだろう」などと答えた。結果的にこのコメントは採用されたのだが、おそらくは締め切りの直前、電話で『『公的なガイドライン』とは具体的にどのガイドラインなのか」と聞かれた。誌面に載せる以上は、裏を取る必要があると判断したのだろう。「週刊文春」だった。

「週刊ダイヤモンド」の健康診断・検診の特集も多くの専門家に取材しており、質が高かった。たとえば線虫検査をはじめとしたリキッド・バイオプシーの記事では、感度・特異度が過大評価されている問題が指摘されていた。ほとんどの場合、宣伝されている感度・特異度は「すでにがんと診断された患者集団」と「すでにがんではないことがわかっている健常者集団」という二つの集団から求めた“two-gate design”研究から算出されており、がんであるかどうかがわかっていない自覚症状がない一つの集団を対象にした“single-gate design”の研究は行われていない。私の知る限りでは一般向けの記事でこの問題点を最初に指摘した記事である。このような質の高い記事が増えて欲しいのだが、やはりコストに見合わないのであろう。


*1:事前チェックが反映されず校正漏れが生じたことはある