東大・IBMの「ワトソン」のビッグデータが読み解く「がん遺伝子」 AIが切り拓くがん治療の最先端
富士山の高さを超える論文
その研究は、患者の組織検体を、シークエンサー(ゲノムを読み取る装置)で処理することから始まった。
再び宮野氏が言うには、
「次世代シークエンサーから出る生データの量は膨大です。具体的に言えば、30億文字が印刷された書類のコピー30部、900億文字がシュレッダーにかけられたと思ってください。その時に吐き出される断片は、100文字ほどの長さに切り刻まれ、山になる。がんのゲノムになると、40部ほどに増えます。解析にあたっては、前者の正常なゲノムとがんゲノムの2つ、70部のコピーを処理する必要があるので、およそ2100億文字がバラバラになる。この膨大な生データを、ジグソーパズルを完成させるように再生し、たった1文字の変異や欠損を見つけ出すことで詳細が分かるのです」
なんとも途方もない作業だが、宮野氏はこう続ける。
「ゲノム解析の研究がここまで可能になったのは、スパコンの性能向上と、東大医学部を首席で卒業するような、超人的な若手研究者の協力があってこそ。そのような優秀な若者たちが永続的に協力できるわけではないし、ゲノム解析の結果をどう“翻訳”していくか。その壁に突き当たったのは、4年ほど前のことでした」
せっかく苦労して得たがんゲノムのデータから、具体的な治療方法を知るためには、関連論文や薬の特許情報と紐づけなければならない。当時、対象となる論文は米国のデータベース上で2600万件、特許件数は1500万件以上あった。
「論文は長くても6ページほどですが、すべてを印刷すれば厚さ4キロ、富士山の高さを超えてしまう。論文数はがんだけで年20万のペースで指数関数的に上昇していますから、計算上2050年には大気圏外、高度100キロを超えてしまう。がんの理解は人知を超えているのです」(同)
光明が差したのはAI「IBMワトソン」との出会い。東大医科研は2015年7月に導入したが、北米以外の医療機関で初めての例だったと宮野氏は振り返る。
「電子化された論文の要旨を読み理解し推論できる。ワトソンを凌ぐAIは、今もってありません。急性骨髄性白血病(AML)と診断されたある患者さんは、人間ドックで白血球の好酸球増多を指摘されました。医師からはAMLが疑われ、セカンドオピニオンとして東大医科研にやって来られたのですが、全ゲノムの解析は3日と7時間30分で終了し、そのうちワトソンが要した時間は僅か10分でした。ちなみに、この患者さんの体細胞変異と構造異常には、グリベックという抗がん薬が有効なのですが、臨床医の判断とワトソンの結論も見事に一致、投与は功を奏しました」
[2/3ページ]