第40回(令和4年度)
大阪科学賞(OSAKA SCIENCE PRIZE)受賞者の横顔
略歴:
2005年 3月 東京大学医学部医学科卒業
2005年 4月 東京大学医学部附属病院 初期研修プログラム
2010年 4月 日本学術振興会 特別研究員
2011年 3月 東京大学大学院医学系研究科博士課程修了
2012年 1月 Harvard Medical School, Broad Institute 博士研究員
2012年 4月 日本学術振興会 海外特別研究員
2013年11月 東京医科歯科大学大学院医歯学総合研究科 テニュアトラック講師
2016年 4月 - 現在 大阪大学大学院医学系研究科 教授
2021年10月 - 現在 理化学研究所生命医科学研究センター チームリーダー
2022年 4月 - 現在 東京大学大学院医学系研究科 教授
研究業績:遺伝統計学を活用した疾患病態解明・ゲノム創薬・個別化医療に関する研究
皆さんは、遺伝統計学という学問分野をご存じでしょうか。遺伝統計学は、ヒトの設計図である遺伝情報と、病気などの形質情報の関わりを、統計学の観点から検討する学問です。なぜヒトは病気にかかるのか、なぜヒトによってかかる病気が異なるのか、そのカギは遺伝情報を構成するヒトゲノム配列の個人差の中に隠れています。近年、次世代シークエンサーなどのヒトゲノム配列解読技術の著しい発展に伴い、数百万人規模のヒトゲノム情報を用いた解析が可能となっています。ヒトゲノム配列が個人間でどのように異なり、その違いがどのような形質情報の違いをもたらすか、世界中で研究が行われています。すでに、数千を超えるヒト形質情報に関連する、多数の遺伝子配列の個人差のカタログが作られています。このようにして得られた病気に関するヒトゲノム配列情報を、情報解析技術を用いて、多彩な生物学や医学のデータベースと分野横断的に統合することで、病気のメカニズムの解明や、新しい創薬、個人の遺伝的背景にあわせた適切な医療の提供(=個別化医療)などが目指す研究活動が進んでいます。最近では、機械学習などの人工知能の活用も広がってきました。本講演では、遺伝統計学における最先端の研究活動をご紹介できればと考えています。一方、基礎医学研究の更なる発展に必要なのは、若手人材の育成です。特に本邦では遺伝統計学分野の人材不足が指摘されています。「遺伝統計学・夏の学校@大阪大学」の開催など、私達の取り組みも紹介させて頂ければと思います。
記念講演:「遺伝統計学の世界にようこそ」
*動画で記念講演をご覧いただけます。
第40回大阪科学賞 記念講演
遺伝統計学の世界にようこそ
大阪大学大学院医学系研究科 教授
岡田 随象
なぜヒトは病気にかかるのでしょうか?なぜヒトによって異なる病気にかかるのでしょうか?もちろん、生活習慣や怪我、加齢など、様々なイベントによって病気が誘発されます。一方で、生まれながらに特定の病気へのかかりやすさに個人差があることが知られています。それが、遺伝です。遺伝統計学(statistical genetics)は、ヒトの遺伝情報と、病気などの形質情報の関わりを、統計学の観点から検討する学問分野です。本日は皆さんに、遺伝統計学の世界をご紹介させて頂きます。
ヒトの遺伝情報は30億対の塩基配列で構成されるヒトゲノム配列として、身体を構成する一つ一つの細胞の中に保存されています。46本の染色体に分かれ、各染色体の中に、A、T、G、Cの4種類の塩基で構成された塩基配列が細かく折りたたまれています。ヒトゲノムプロジェクトによりヒトゲノム配列の全容が明らかになったのは、2000年代初頭のことでした。ヒトゲノム配列上で、機能的な働きを有する連続した短い配列を、遺伝子と呼びます。ヒトゲノムプロジェクトにより、ヒトゲノム配列上に何個の遺伝子が、どの場所に位置しているか、の全容が明らかになりました。
ヒトゲノム上の塩基配列は、個人間で少しずつ異なります。ヒトゲノム配列の個人差を、多型(polymorphism)と呼びます。最も代表的なのは、一塩基単位で変異が生じる、一塩基多型(single nucleotide polymorphism; SNP)です。一卵性双生児や親子の例に見るように、ゲノム配列が似ていると見た目(=身体的特徴)も似ることが知られています。現在では、ゲノム配列が似ていると、外見だけでなく、病気のかかりやすさや薬の効きやすさも似ていることがわかっています。そのため、ヒトゲノム多型の情報に基づいた、疾患や医療の研究が行われています。
2003年に、国際共同研究プロジェクトであるInternational HapMap Projectにより、欧米/アジア/アフリカ人集団270名におけるヒトゲノム多型の概要が解読されました。約200~300万のSNPが明らかになり、これまで手探りで行っていたヒト疾患感受性遺伝子の同定を網羅的に行うことが可能になりました。プロジェクト参加国の中で、日本は一番の貢献を果たしています。2010年には、1000 Genomes Projectにより、複数集団2,500名における、約1億個のSNPが明らかになり、集団中での頻度の低いレアバリアントのカタログが公開されています。
ヒトゲノム配列の解読コストは著しい低下を示しています。当初は100億円/サンプルと高額なコストが必要だった全ゲノム配列解読(=全ゲノムシークエンス)も、現在では10万円/サンプル以下で実施することが可能になり、将来的には1万円/サンプルも達成されると考えられています。ヒトゲノム上の数十万か所の代表的な一塩基多型をマイクロアレイ技術を用いて測定する場合は、5000円/サンプル程度となっており、ヒトゲノム研究の参入障壁は、ますます下がっています。
ヒトゲノム配列解読コストの低下は、ヒトゲノム研究の大規模化を引き起こしています。英国のUKバイオバンクは、50万人分のSNPマイクロアレイデータを中心とした大規模ゲノムデータを、数千種類の形質情報と共に一般公開しています。数百万人を対象としたヒトゲノム研究プロジェクトも進行中です。以前は、一部の研究施設に所属する限られた少数の研究者だけが大規模ゲノム情報にアクセスできる時代もありました。しかし現在では、世界最先端・最大規模のデータを、誰でも解析することができる時代が到来しています。
ゲノムデータの規模が大きくなると、ゲノム解析を通じて多くのことが解明されるようになりました。代表的な成果の一つが、ゲノムワイド関連解析(genome-wide association study; GWAS)を通じた病気の感受性遺伝子の同定です。ゲノムワイド関連解析は、遺伝統計学の解析手法の一つで、数千人から数十万人を対象に、ヒトゲノム全体を網羅する数千万箇所のSNPのタイピングを実施し、対象形質との関連を評価する手法です。2002年に日本の理化学研究所で世界に先駆けて実施された解析手法でもあります。2000年代後半以降、世界中の研究施設でゲノムワイド関連解析が精力的に実施され、現在までに、1,000以上の形質に対し約5,000報のゲノムワイド関連解析が報告されています。糖尿病やがんといった病気から、身長や肥満などの身体測定値、血液検査値などの臨床検査値、食生活習慣など、多彩なヒトの形質情報に関連する遺伝子変異が多数報告されています。新型コロナウイルス感染症の重症化についても、パンデミックの早期に国際共同研究を通じてゲノムワイド関連解析が実施され、重症化に関連する遺伝子変異が見つかっています。
このように、ヒトゲノム解析技術の発展に伴い、大規模ヒトゲノム研究を通じて病気に関連する遺伝子変異が数多く同定された一方で、ゲノム解析の成果をどのように活用すれば病気の病態解明や新規創薬、個別化医療に貢献できるのかは、ほとんどわかっていない状況です。30億塩基対のヒトゲノム配列はヒトの設計図なわけですから、そのメカニズムを完全に解明すれば、生命現象を再構成できるはずです。しかし実態としては、そのほとんどは未解明です。どうやって、ヒトゲノム配列に隠された生命現象を引き出すか、が私の一貫した研究テーマになります。
私が心がけていることとして、「実験技術・情報解析技術の進歩は、常に私たちの予想を上回る速度で進んできた」という客観的な事実があります。ヒトゲノム解析の分野においても、私が研究に参画した15年前からは想像ができないほど、技術革新が進んでいます。おそらく今後も、想像を超える速度で進んでいくものと期待されます。最先端の実験技術・情報解析技術を積極的に導入していくことが、生命科学研究の発展には必要です。また、単に実験機器や解析ツールを購入するだけでなく、その原理を正確に理解することが、革新的な研究には不可欠と考えています。
ゲノム情報から病気の病態を解明する方法として、オミクス解析が知られています。オミクス情報とは、「ゲノム」、「エピゲノム」、「プロテオーム」など、生体情報の網羅的データ(=-ome)をさらに統合して得られる情報を指します。多彩なオミクス情報を分野横断的に統合することで、生命現象につながる知見が得られることが知られています。異なるサンプル集団由来のオミクス情報であっても、共通の情報単位に変換することで、横断的な統合が可能になります。遺伝子というカテゴリに変換することに加え、ヒトゲノム標準配列に沿ったベクトル情報に変換するオミクス解析方法の開発が盛んです。多数の病気に対するゲノムワイド関連解析の結果を、色々な細胞組織におけるエピゲノム情報と横断的に統合することで、病気と細胞組織のつながりのネットワークが明らかになります。例えば、肥満の遺伝的背景における中枢神経系の関与や、免疫関連疾患における免疫細胞の関与などが、明らかになっています。
新しいオミクス情報層の開拓も進んでいます。大阪大学に着任してからは、微生物叢の研究に取り組みました。微生物叢は、宿主であるヒトや動物と共生関係にある多種多様な微生物の集まりで、宿主であるヒトと様々な相互作用を持ち、「第二の臓器」と呼ばれています。 微生物叢の個人差は腸管の病気に限らず、2型糖尿病や心血管障害、がんなど多くの病気の原因に関与していることが知られています。微生物叢研究の分野でも、新しい実験技術が革新的な研究成果を生み出しています。従来は、微生物叢に含まれる細菌のゲノム配列の一部のみを解読する16S rRNA解析が行われていましたが、現在では、微生物叢の全ゲノム情報を網羅的に解読する、メタゲノムショットガンシークエンス解析が主流になりつつあります。私たちは、メタゲノムショットガンシークエンス解析を活用することで、自己免疫疾患の患者さんの腸内微生物叢の特徴的なメタゲノム情報を同定することに成功しました。最近では、腸内に含まれる細菌に加え、ウイルスの研究も進めています。
遺伝統計学の可能性の一つに、ゲノム創薬があります。新規創薬には長い時間と多大な開発費用がかかりますが、その効率が年々低下しており、創薬プロセスの効率化の重要性が指摘されています。病気の研究から治療薬を探す「これまでの創薬」に加え、病気のサンプル由来のゲノム情報から治療薬を探す「これからのゲノム創薬」が今後は必要です。海外の製薬企業の研究では、病気のゲノム情報が創薬プロセスを効率化することが報告され、注目が集まっています。私たちは、ゲノムワイド関連解析などの大規模ゲノム解析の成果に基づき、病気の治療薬候補の探索が効率化できることを報告してきました。特に、既存の治療薬の他の病気への適用拡大する、ドラッグ・リポジショニングに貢献できると考えています。一般公開されているゲノム解析の結果から、治療薬候補を探索する遺伝統計解析ソフトウェアの開発を行っています。
最後にお話しするのが、ゲノム個別化医療への挑戦です。世の中には沢山の病気がありますが、同じ病気であっても、人によって病態が異なることが経験的に知られています。全員に画一的な標準治療を行うことも大事ですが、個人の体質に応じて最適化された治療法の確立が期待されています。それが、個別化医療です。2015年のオバマ大統領の一般教書演説で、”Precision Medicine Initiative”という言葉が注目を集めました。特に個人のゲノム情報の違いを活用した個別化医療の提言に重きを置いた点が画期的でした。ゲノム個別化医療の時代の幕開け、という解釈もできます。ゲノム個別化医療の研究分野では、特定の遺伝子変異に着目したり、ヒトゲノム全体に分布する無数の遺伝子変異を統合することで、個人の病気の発症リスクをゲノム情報に基づき予測することが可能となりつつあります。近い将来、自分がどんな病気になりやすく、またなりにくいのかを人生の早期の段階で判定して、個人の特性にあわせた最適なライフスタイルや医療を受けられる時代が来ると考えられます。その社会実装において必要となるプロセスを、遺伝統計学を通じて実現していきたいと考えています。
基礎医学研究の更なる発展に必要なのは、若手人材の育成です。特に日本では、遺伝統計学やバイオインフォマティクスの研究分野の人材不足が指摘されています。私たちの教室では、「遺伝統計学・夏の学校@大阪大学」と題して、夏休みに三日間のサマースクールを開催しています。遺伝統計学の座学から、プログラミングや実際のデータを使ったゲノムデータ解析演習まで、初心者を対象とした幅広い内容となっています。お陰様で、2022年度は300名の方に参加して頂くことができました。講義演習資料は教室のホームページで一般公開しておりますので、興味を持たれた方は、是非ともご覧ください。(http://www.sg.med.osaka-u.ac.jp/school_2022.html)
用 語 集
遺伝統計学
遺伝情報と形質情報の因果関係を統計学の観点から検討する学問で、古くはメンデルの遺伝の法則まで遡る歴史ある学問になります。ヒトの病気の原因となるヒトゲノム情報の個人差を同定することが主な研究対象でしたが、近年では、数百万人古保の大規模ヒトゲノム情報を色々な観点から解析する、情報解析学問としての側面も強くなってきています。
ヒト形質
ヒトによって異なる性質をヒト形質と呼びます。病気の有無が代表的な形質情報になりますが、それ以外にも身体測定値(身長や体重)、血液型、臨床検査値など、様々な形質情報が存在し、遺伝統計学の解析の対象となっています。
ヒトゲノム
ヒトの遺伝情報は30億の塩基配列として身体を構成する各細胞内に保存されており、ヒトゲノムと呼ばれています。ヒトゲノム配列には個人差があり、どのような個人差がどのようなヒト形質の違いにつながっているか、遺伝統計学の研究を通じて明らかとなりつつあります。
次世代シークエンサー
ヒトゲノム配列を解読する機械の一種で、従来の手法と比較してゲノム配列全体をハイスループットに解読する技術が2000年代に実用化され、次世代シークエンサーと呼ばれています。現在では、個人のヒトゲノムを構成する30億の塩基配列を、10万円以下のコストで決定することが可能となっています。
個別化医療
全ての患者さんに画一的な医療を施すのではなく、個人の患者さんの体質に応じて最適化された医療を提供することを、個別化医療といいます。個別化医療の社会実装には、ヒト形質の個人差を決めているヒトゲノム情報を活用することが不可欠と考えられています。
人工知能と機械学習
人間の知的活動をコンピューターで実現する技術を人工知能といいます。機械学習は、人工知能の実践的な解析技術の一つで、与えられたデータを学習して特徴を把握し、判断や予測を行うための手法になります。近年、機械学習のアルゴリズムの一つである深層学習の有用性が注目されています。
Q&A
記念講演の際にいただきました質問に対して、岡田先生にご回答いただきました。
<原理・適用可能性について>
ゲノムワイド関連解析にて、「対象物質との関連性を評価する」とありましたが、具体的にどの様に評価しているのでしょうか?
ゲノム解析を使って、効きそうな薬を選ぶときには、どういった点をみて選ぶのでしょうか?
再構築の概念がよくわからないです。
日本人に特異的なウイルスや菌を、腸内サンプルから再構成するとお話されていましたが、シークエンス解析をした後、どのように再構成するかについて教えていただきたいです。
どのようにしてこれは(身長と)関係しているのが分かるのですか?
なんでゲノムによって大きく薬の効きが違うのでしょうか?
ゲノムを基にした創薬は非常に効率的であることがわかりましたが、先生はこの製薬方法に何かしらデメリットなどを感じている点はありますか?
1人1人に対応した医薬品を作った場合、どのように治験を行うのでしょうか?
次世代シークエンサーによってゲノム配列の高速処理が可能になって、たくさんの情報をPythonやRを使って整理するというバイオインフォマティックスというものを聞いたことがあり、何だか似ているなと思いました。それと遺伝統計学はどう違いますか?
自分の家族がコロナウイルスにかかったときに、私一人だけコロナウイルスにかかりませんでした。遺伝子解析で、何故家族の中で私だけコロナウイルスにかからなかったのかというのは分かるのでしょうか? 遺伝子も似ていて、一緒に生活していた家族がかかって、私はかかっていないのが不思議です。(一人がかかって、自粛中に他の家族がかかりました)
これからゲノム解析の研究が進んでいくと、予防接種や薬の副作用の有無・程度等のリスクが事前に分かるのでしょうか? 全員一緒の予防接種から個人に沿った予防接種等に変わっていくのでしょうか?
<倫理面の課題について>
ゲノムによって個人の病気が予測できてしまうことから、倫理的に研究が難しかったことはありますか?
ヒトゲノムの情報はどこから手に入れるのでしょうか? また、一般に公開されているとのことですが、プライバシー保護についてはどのように考えられているのでしょうか?
ここまで技術が進化するとcivilによる管理、統制ができなくなるのではないですか?(閉鎖的技術になりかねないのでは)
地域間での医療の差がより開くのではないですか?(個別化医療できるかできないかは、かなり大きな差だと思います)
中国などではすでに胎児のヒトゲノムを解析してその胎児の先天的な病気だけでなく、容貌ですらも編集して親の希望に沿って子供が生まれるということがあったそうですが、先生はこのことに対してどう思われますか? ヒトゲノムの情報の取扱いについて先生の意見をお聞かせください。
<その他>
DOCK2遺伝子がコロナ重症化リスクに関係があると伺ったのですが、その遺伝子を活性化させる物質もわかっているのでしょうか?
遺伝によって起こり得る「がん」があると思いますが、日本人の多くががんで亡くなるという今日において、どうしてがんに効く薬があまりでないのでしょうか?
体内の菌と疾患の関係性を明らかにする方法には、どのようなものがありますか?
自己免疫疾患によって特定のウイルスが減少していることが分かりましたが、ウイルスは疾患によって減少したのか、それとも減少したことが発症のトリガーとなったのか、どうお考えですか?
菌やウイルスの数を調べた上で、見かけの関連ではなく、本当に疾患に関連あるのか、それが疾患の原因なのか結果なのかについてはどのように調べるのでしょうか?
「思わぬところが病気の原因になることがある」とのことでしたが、その場合、どうやってその原因を発見しているのでしょうか?
私は、生物の中にあるものの未知なる役割を見つけることに関心があります。ゲノムの他、酵素などのタンパク質、補酵素などとなるビタミン、細菌など色々なものが気になっていますが、おすすめはありますか? また、読むとよいと思う本をぜひ教えてください。
関係している遺伝子から作られるたんぱく質は調べないのに、本能といわれるものはどのようにして遺伝子にありますか?
大阪科学賞 運営委員会事務局