極限環境の微生物を研究する魅力は何でしょうか。
井上:海底熱水孔や高塩湖などの極限環境に棲む微生物は多様性に富み、私たち真核生物が失った古い遺伝子や特殊なタンパク質を保持しています。特殊なタンパク質の中には、PCRで使う酵素や医薬品など、人間社会に応用可能なものも多数見つかっています。また、極限環境の微生物の多様性の中には、生命進化の謎を解く鍵が隠れています。私の興味は生物の多様性と進化にあるので、極限環境に棲む微生物は極めて魅力的な研究対象なのです。
次世代シークエンサーという技術が登場する約20年前までは、微生物の遺伝子配列を解析するのは大変でした。微生物の遺伝子を解析するには、混在する無数の微生物の中から目的の微生物を単離して、解析可能な量にまで培養する必要がありましたが、微生物の培養は難しくほとんどが成功しません。現在でも培養できる微生物は地球上に存在する種類の0.01%にも満たないと言われています。
しかし、次世代シークエンサーの登場により、微生物を単離・培養しなくても遺伝子情報を読み取れるようになりました。その結果、微生物由来の遺伝子のデータは爆発的に増加しました。その膨大な情報と、研究者が積み上げてきた知見をもとに、タンパク質の構造を高精度で予測するAIプログラム「AlphaFold」も開発され、さまざまな生物に共通する遺伝子とそのタンパク質を網羅的に解析できるようになり、ますますこの分野の研究が面白くなりました。AlphaFoldが世に発表されたのは2018年ですが、そこからわずか6年後の2024年に開発チームへノーベル化学賞が授与されるくらい、革新的な発明でした。
どのような手法で研究しているのでしょうか。
井上:実験科学と情報科学を組み合わせたアプローチで研究を進めています。微生物学者はよく変わった環境に棲む微生物を採取するために海や山、温泉などに出向くことがありますが、私の場合はまずコンピュータ上で大量のゲノムデータを眺め、面白そうな遺伝子を探します。有名な遺伝子に似ているのにどこか変わっているもの、さまざまな生物に共通している遺伝子、特定の変わった生物だけが持っている遺伝子などに注目し、直感と経験で絞り込みます。研究対象とした遺伝子を複数生物で網羅的に解析することで、進化のどの段階で変化が起きたのかということや、遺伝子が作り出すタンパク質の機能の変遷も見えてきます。
情報科学の手法で探究したあとは、実際にその遺伝子からタンパク質を発現させて構造解析をしたり、その遺伝子を持つ微生物を培養して機能解析実験を行ったりします。
AIの登場でビックデータを扱えるようになりましたが、AIは万能ではありません。研究者としての経験と知識を活用してAIと「共創」し、同時にAIに負けないように「競争」もする。その両面を意識して研究を進めています。
研究からどのようなことがわかったのでしょうか。
井上:例として、DNAに結合して修復を担う酵素と、タンパク質を認識して分解する酵素が、共通のタンパク質から分岐して進化していったことを明らかにしました。タンパク質は生物の体の中で機械の歯車のように正確に働く小さな部品であり、その機能は生物の性質を大きく左右することもあります。生物の進化も面白いのですが、小さなタンパク質がどこかの時点で新たな機能を獲得していく「タンパク質の進化」も、私にとっては非常に興味深い現象です。
微生物の多様性だけでなく、遺伝子やタンパク質レベルの多様性まで踏み込むことで、生命の仕組みや進化の歴史がより立体的に浮かび上がります。こうした発見は、私たちと同じ環境の生物だけを研究していては得られません。極限状態に棲む“変わり者”の微生物と比較することで、新たな視点が開けるのです。
現在はどのような研究を進めていますか。
井上:タンパク質データベースの間違いを見つけて修正するための研究を行っています。AIの予測は完全ではありません。多くの研究者が頼りにしているデータベースであっても、まだまだ間違いは存在します。私のこれまでの研究者としての知見と直感を組み合わせ、大規模に間違いを発見していくAIプログラムを開発しています。
これが成功すればデータベースの精度が増し、研究コミュニティ全体に貢献できます。もっとも私の最大の動機は、データベースの間違いが潜むところにこそ面白い遺伝子があるという考えです。間違いを見つけて正すことができたら、そこはまだ誰も手をつけていない未踏の地です。新たなタンパク質に出会える可能性は高まります。
無数に存在するタンパク質を宇宙の星にたとえるなら、観測可能な星が増えるほど“推し”タンパク質に出会える確率も上がるわけです。私はいつもワクワクしながら、その広大な宇宙を探索しています。