AI最適化が無細胞システムにおけるゲノムワイドトランスクリプトミクスの扉を開く

長年にわたり、無細胞システムは合成生物学において強力でありながら限界のあるツールであった。研究者は生きた細胞の外で転写と翻訳を行うことができ、遺伝回路のプロトタイピング、困難なタンパク質の生産、バイオセンサーの構築に理想的である。しかし、トレードオフがあった。これらのシステムからのメッセンジャーRNA(mRNA)の収量は、一般にゲノムワイドなトランスクリプトミクス解析には低すぎたのである。

INRAEとパリ・サクレー大学のチームが今、その障壁を打破した。ベイズ最適化を用いて160万通りの可能な緩衝液組成の組み合わせ空間を探索し、標準的な大腸菌(E. coli)無細胞システムにおいてmRNA収量を20倍に向上させた。これにより、初めて完全なトランスクリプトームシーケンシングを実行し、遺伝子調節の段階的な層を明らかにすることが可能となった。この研究は6月27日付でNature Communicationsに掲載された。

古いシステムに新しい技を教える

出発点は、T7 RNAポリメラーゼによって駆動される大腸菌BL21(DE3)ライセートシステムであった。これは無細胞合成生物学で最も広く使用されているプラットフォームの1つである。Matthieu Jules氏とOlivier Borkowski氏が率いるMicalis Instituteのチームは、根本的な問題を克服する必要があった。標準的な緩衝液の製法は、mRNA収量のためではなく、タンパク質生産のために数十年前に最適化されていたのである。

彼らはマグネシウム、カリウム、アミノ酸、NTP、PEG-8000を含む8つの緩衝液成分を特定し、それぞれを6段階の濃度で変化させた。完全な組み合わせ空間は1,679,616通りの可能な組成であった。その一部でも力ずくでテストすることは不可能であった。

そこでチームは能動学習(アクティブラーニング)に目を向けた。ラテン超方格サンプリングによって選ばれた100の組成から出発したベイズ最適化アルゴリズムは、実験室でわずか653の組成をテストするだけで160万の可能性の landscape を探索した。10サイクルの能動学習を経て、参照緩衝液と比較してmRNA収量を20倍に増加させる製法を特定した。

「能動学習は、試行錯誤によって見つけることが極めて困難であったであろう組成空間の領域へと私たちを導きました」と著者らは記している。主要な調整点は、マグネシウムとNTP濃度を高く、カリウム、アミノ酸、PEG-8000を低くすることであった。

最適化からトランスクリプトームへ

20倍の収量改善により、無細胞システムではこれまで不可能であったことが可能になった。ゲノムワイドな直接RNAシーケンシングである。チームはコンパクトなゲノムを持つよく特性解析されたウイルスであるバクテリオファージT7に注目し、Oxford Nanopore社のMinIONプラットフォームを用いて、生物学的複雑性が増大する3つのシステムにわたって直接RNA-seqを実施した。

第1のシステムは、精製されたT7 RNAポリメラーゼ、DNA鋳型、ヌクレオチドのみを使用した、最小限の構成であった。これはプロモーター強度の階層を捉えた。つまり、天然のゲノムコンテクストにおいてどのT7プロモーターが強いか弱いかである。しかし、RNA分解機構が存在しないため、カバレッジは転写産物の5’末端に大きく偏っていた。

第2のシステムは、大腸菌タンパク質を完全に含む最適化された無細胞抽出液を使用した。これによりRNase III活性が回復し、T7転写産物におけるmRNA成熟部位が確認され、転写産物全体にわたって均一なカバレッジが得られた。これは真の定常状態スナップショットである。in vivoでの発現レベルの正確な推定値を提供した。

第3のシステムは完全な細胞コンテクストであり、T7感染を受けている大腸菌であった。これにより、無細胞ライセートにはない調節の層が追加された。膜結合型RNase Eによって引き起こされる3’末端バイアスのカバレッジである。

比較により、著者らが「段階的な調節の層」と呼ぶものが明らかになった。プロモーター強度、mRNA分解、RNase IIIを介したmRNA成熟、およびRNase Eを介した3’末端特異的分解である。各システムが1つ以上の層を追加し、生物学的複雑性の勾配を作り出し、チームが各プロセスを個別に解析することを可能にした。

より広い意義

この研究は、トランスクリプトミクスには不適切と長い間考えられてきた無細胞システムが、現在では細菌のトランスクリプトーム全体を解析できることを示している。「無細胞トランスクリプトミクスは、培養不可能な細菌の転写ランドスケープの探索を可能にする可能性があります」と研究者らは指摘する。これらの生物は、実験室条件下ではRNAにアクセスできないという理由だけで、特性解析が不十分なままである。

能動学習パイプライン自体は、緩衝液の最適化を超えて一般化可能である。培地の製法、タンパク質精製条件、代謝工学など、あらゆる多パラメータの生物学的最適化問題が、組み合わせ空間の0.04%を探索して準最適条件を見つけるという同じアプローチの恩恵を受けることができる。

限界も残っている。本研究は、T7 RNAポリメラーゼを用いた大腸菌BL21(DE3)ライセートでのみ実施された。最適化された緩衝液は、内在性の大腸菌RNAポリメラーゼや他の生物については検証されていない。無細胞システムは転写と分解を捉えるが、ライセート調製中に失われる膜結合型RNase Eによって媒介される3’末端特異的分解は捉えない。また、論文はまだ編集上の洗練を受けていない先行版として公開されている。

それでも、この研究は無細胞生物学の転換点を示している。トランスクリプトミクスを無細胞システムの能力に加えることにより、培養できない生物における遺伝子調節の研究、RNAレベルでの合成回路のプロトタイピング、および合成生物学における設計-構築-試験サイクルの加速への扉を開くものである。

論文「Active-learning-guided optimization of cell-free systems for genome-wide transcriptomic profiling reveals progressive layers of regulation」は、Nature Communications(DOI: 10.1038/s41467-026-74559-y)に、Lea Wagner氏、An Hoang氏、Olivier Rue氏ら、INRAE、パリ・サクレー大学、AgroParisTechの共同研究者によって発表された。

雅子 訳

Scroll to Top