研究内容紹介＜超先鋭研究プログラム＜JAMSTEC

研究内容紹介

[2019年]

「大海撈針にも楽な道がある
デジタル・タンパク質スクリーニング・システム」

張　翼　研究員

Accurate high-throughput screening based on digital protein synthesis in a massively parallel femtoliter droplet array
Yi Zhang, Yoshihiro Minagawa, Hiroto Kizoe, Kentaro Miyazaki, Ryota Iino, Hiroshi Ueno, Kazuhito V. Tabata, Yasuhiro Shimane, Hiroyuki Noji
Science Advances, 2019, 5, 8, eaav8185

日本語　 English　中国語

紹介を始める前に、、、

だいぶ間があいてしまいました「研究内容紹介シリーズ」、実は当初予定の第３回の執筆依頼者に「忙しいから落ち着いたら」と言われ半年以上待ち続け、「いい加減書いて？」と迫ったところ「忙しいって言ってるのに急かされるならそもそも書きません！」的な流れになり、ココロが折れ編集モチベーションがなくなっておりました。そんなこんなで第２回から３年半、組織名も変わり新しく快く執筆を受けてくれる研究者も増え今回に至りまする。

今回の著者　張翼氏は日本人？と思ってしまう程の達者な日本語力の持ち主でして、どうせならグローバルに研究成果を発信すべしとの高井部門長からのお達しにより、日本語、中国語、英語の３ヶ国語でお送りします、、、

(本文は日本語以外は基本的に本人の書いたまま。）

チョウ先鋭部門のチョウは、チョウ格好いい研究をしてまいりました。

科学の進展は、いつも新しい技術開発に頼っています。タンパク質工学の分野において、有用タンパク質の産生は、ハイスループット・スクリーニング（High-Throughput Screening, HTS）技術に大いに頼っています。ところが、既存のHTSは正確性が低く、膨大な時間とコストがかかっていました。この現状を打破して、スクリーニング作業を根本から改善したのが今回の研究成果です。

我々の共同研究チーム（JAMSTEC、東京大学、産総研、分子研）は、微細加工技術、顕微操作技術および統計学を高度に統合して、膨大なライブラリーからごく少数の優れた変異体を一発で正確に見つけ出す方法を確立しました。この方法を用いることで、たった1日で、高い正確性かつ低コストで期待の変異体を見つけることが可能となりました。

既知のタンパク質分子へ人工的に変異を導入することは、そのタンパク質機能を改善する未知の可能性を秘めています。その類の研究は、まるで自然界におけるダーウィン進化を真似ているようなので、「試験管内進化」と呼ばれています。その概念に基づいて先駆的な仕事をした研究者たちは、2018年のノーベル化学賞を授与されました。ちょうど、本研究論文を投稿する直前でした。(編集者註：参考サイト「Nature ダイジェスト」)

変異導入自体は比較的容易で速いのですが、可能性（変異のパターン）があまりにも多いため、優れた変異体を獲得するのは非常に難しいのです。タンパク質を構成する各アミノ酸部位には、20種類（天然アミノ酸は20種類）の可能性があり、例えばたった5箇所のアミノ酸をすべてカバーしたランダム変異ライブラリーには、100万種類（20⁵）を超える変異体が含まれることになります。もし、その範囲を100個のアミノ酸に拡張したら、ライブラリー・サイズが宇宙の総原子数（10⁸⁰）よりも大きくなってしまいます！一般的なタンパク質は100〜1000個程度のアミノ酸で構成されていることを考えると、タンパク質スクリーニングという作業は大海撈針のごとく、ある意味エンドレスです。「変異ライブラリー構築→スクリーニング→機能確認」といったサイクルを何度も繰り返していると、数ヶ月〜数年間かかってしまうこともあります。しかも、最終的に優れた変異体が取れる保証はまったくないので、結局何も得られないまま終わってしまうことも多々あります。運が良ければ “オイシイ” ですが、反面リスクが非常に高い研究分野なのです。
ティピカル・ハイリスク・ハイリターン。

これも、機能改善された応用価値の高いタンパク質（例えば、新規の蛍光タンパク質や酵素など）の発見が、数多く世界的に有名な科学雑誌に取り上げられている理由の一つです。それらの論文において、変異体の性能に対する評価実験は “水至りて渠成る” ことであって、如何に欲しい変異体を手に入れられるかが肝心要なところなのです。現在、有効な変異部位を確実に予測できる理論がまだ存在していないため、実験的なHTSは必然的な選択肢となっています。上述のように、スループットを如何に高めていっても、すべての可能性を探索するのは不可能である以上、本研究は、別の視点からスクリーニング分野にアプローチして、酵素活性の改善を例に、スクリーニングの正確性を上げる方法を考案しました。
ローリスク・ハイリターン！！

この方法は、ライブラリーにある各変異体の絶対発現量を測定せずに、簡単にタンパク質発現量の変動を見かけ上の酵素活性から差し引いて、確実に酵素活性が向上した変異体を識別できます。やや難しい内容ですが、ここから詳しく説明します。

私はまず、薄いガラス板に、超均一的で安定な微小液滴を、100万個/cm² 集積できる、フェムトリットル・ドロップレット・アレイ（Femtoliter Droplet Array, FemDA）という液滴作製技術を開発しました。(図 1)
FemDAのそれぞれの液滴の中には、タンパク質合成に必要なコンポーネント（鋳型DNA、転写翻訳系酵素群、等々）とタンパク質アッセイ用試薬（酵素特異的蛍光基質）を閉じ込めています。タンパク質合成の鋳型となるDNA分子は、ポアソン過程に従って、ランダムに液滴に入っていくため、それぞれの液滴に0個、1個、2個、3個……のDNA分子が含まれることになります。反応体積は、フェムトリットル・オーダー（10^-15L、つまり、ナノリットル・オーダーの液滴の100万分の1）のため、タンパク質分子および酵素に分解された蛍光基質は、分子数が少なくても、高い局所的濃度を示すことになります。これは、微小空間に起因する特有の濃縮効果です。

　
図１、フェムトリットル・ドロップレット・アレイ（FemDA）の作製。

合成された蛍光タンパク質の蛍光シグナル強度、または分解された蛍光基質の蛍光シグナル強度はリアルタイムで相対的なタンパク質合成量を反映しています。今回の実験系で無細胞タンパク質合成系におけるタンパク質合成量は、液滴中のDNA本数に綺麗に比例することが分かりました。（図 2）
これに辿り着くまでたくさんの試行錯誤があったので、「キレイだ！」と感動しました。そこで、液滴の数とDNAの濃度を事前に決めておけば、ポアソン統計学を用いて、液滴一個から得られる最大タンパク質合成量（蛍光強度による相対量）が予測できます。言い方を変えると、最多何本のDNAが一個の液滴に入ってほしいのかが決まれば、液滴の数とDNAの濃度をそれぞれ一定の閾値以下に抑える必要があります。（図 3）
そうしないと、タンパク質合成量が上がったのか、それとも酵素活性が改善されたのか、判別できなくなります。つまり、HTS実験において、単なるスループット（液滴の数）が高ければ高いほど良いわけではないのを、本研究で初めて提唱しました。

　
図２、FemDAによる無細胞タンパク質の合成例。[スケールバー：10 μm]
(A) 黄色蛍光タンパク質mVenus、(B)と(C)はmVenusの解析結果、(D) シアン色蛍光タンパク質mseCFP、(E) 緑色蛍光タンパク質mNeonGreen、(F) オレンジ色蛍光タンパク質tdTomato、(G) 赤色蛍光タンパク質mRuby2、(H) 遠赤色蛍光タンパク質smURFP、(I) アルカリフォスファターゼ。

　
図３、デジタル・スクリーニングの数理モデル。　　
図中の不等式は、液滴の数（変数m）と鋳型DNAの濃度（変数λ：液滴一個あたりの平均DNA分子数）との関係を表している。パラメーターkは一つの液滴に実際に入れる最多のDNA分子数。偽陽性を回避するために、λとmは、一定の閾値以下（半透明の色付きエリア）にする必要があると一目瞭然で分かる。スクリーニングのスループット（液滴の数）が高ければ高いほど良いわけではないことが、この図でよく伝わっている。

スクリーニング実験を行う際に、液滴一個に含まれるDNAの本数がポアソン分布の制約を必ず受けていますので、もし、あるFemDAの中に、ポアソン分布で予測した最大蛍光強度を超えた液滴が現れてきたら、タンパク質合成量向上（複数本の鋳型DNAが同時にその液滴に入っている）の可能性が極めて低く、その液滴の中に優れた変異体が入っている可能性が極めて高いことを意味します。この離散的なシグナル強度分布は変異体選定基準設定時の重要な根拠になるため、私はこの方法を「デジタル・スクリーニング（Digital screeningもしくはDigital HTS）」と名付けました。これは、デジタルPCR（一分子核酸増幅による核酸定量技術、1990~1992年頃に確立された）とデジタルELISA（一分子タンパク質免疫測定によるタンパク質定量技術、2010年に確立された）と並ぶ、もう一つのデジタル・バイオテクノロジーだと提唱しています。（図 4）

図４、デジタル化されたバイオテクノロジー。
本研究は、初めて生体分子を「検出」から「創出」へと導いた。

このデジタル・スクリーニング理論を用いて、アルカリフォスファターゼという酵素の進化実験を行いました。まずは大腸菌由来のアルカリフォスファターゼの変異体ライブラリーを作製して、そのスクリーニングを試みました。このライブラリーは48個のアミノ酸部位をカバーしていて、それぞれの変異体は変異部位を1箇所だけ持っています。コドンの縮重を含めて、それぞれの変異部位が20種類のアミノ酸に置換されるように設計しました。割と小さいライブラリーでしたが、これでも先行研究よりずっと大きいライブラリー・サイズとなっています。液滴一個当たりDNA分子が平均して0.1個入るような濃度で、変異体発現ライブラリーを18万個の液滴に導入すれば（図 3の丸い座標）、DNA分子が4個以上入る液滴の総数は1個以下になります。実際、DNA四個分相当の蛍光強度よりも強い蛍光強度を示した液滴が何個か出てきました。（図 5）

図５、アルカリフォスファターゼ変異体ライブラリーのデジタル・スクリーニング実験。
少数の液滴（赤いラベル）は、最大理論値（縦点線）を超えた蛍光強度を持っています。

これらの液滴をマイクロキャピラリーで一つずつ回収して、DNAシークエンサーでそれぞれの配列を解読しました。（図 6）
その結果、変異部位2箇所、変異体3種類が確認されました。スクリーニングから活性チェック・配列確認まで、1日で十分でした。喜ばしいことに、過去数十年の同酵素に対するスクリーニング実験から最も有効だと確認されている変異部位が再確認できたと同時に、もう一つ有効な変異部位も新しく確認できました。この変異部位は、活性中心から離れているせいか、今まで考慮に入れられたことすらなかったのです。アルカリフォスファターゼは、遺伝子組換え操作や体外診断の分野でよく使われているため、タンパク質分子構造や変異体作製の研究がたくさん行われてきました。本来この実験は、既知の有効な変異部位を大きなライブラリーから一発で見つけ出せるかどうか検証するつもりでしたが（いわゆるポジコン）、結果として既知の変異体だけでなく、これまで知られていない新しい変異体も取れました。まさしく一石二鳥！この予想外の展開は、実に興味深くて、タンパク質結晶構造から出発し構造機能相関を議論していくという古典的手法に、まだ不足があるのを強く示唆しています。網羅的に変異を導入するのは、未だ有効な戦略だと言えます。

図６、マイクロキャピラリーで液滴一個からDNA一分子を回収。
回収されたDNAは、PCR増幅にかけた後、電気泳動やシークエンシングに利用できます。

デジタル・スクリーニングの数理モデルで既に示唆されたように、実験条件設定時には、境界条件（図 3の実線）が存在していて、それに近づくと、より多くの液滴（より高いスループット）を投入でき、その結果より大きいライブラリーを探索できるようになります（図 3の四角い座標に該当する実験条件は、丸い座標の場合よりスループットが高い）。この設定に基づいて、まだタンパク質分子構造が報告されていない、非モデル生物の海洋性好冷菌由来の新型アルカリフォスファターゼに注目して、その活性向上を試みました。この酵素の野生型は、既知の微生物または哺乳類由来のアルカリフォスファターゼの中で活性が一番高いとされています。活性検出用の基質として非天然のフッ素化蛍光基質を使いました。任意の250個のアミノ酸部位を広くカバーした部位飽和変異ライブラリーをスクリーニングにかけたところ、この基質に対する酵素活性が大きく改善された変異体をいくつか獲得しました。これらの変異体は、同じ変異部位を示していて、その変異部位は、20種類の天然アミノ酸の中のたった二つの強塩基性（強い正電荷を帯びている）アミノ酸にだけ置換されています。水溶液中のフッ化物の特殊な荷電性質を考えると、ここの酵素活性向上は、変異体と基質との静電相互作用の強まりから寄与されているかもしれません。これらの変異体の発見も興味深くて、活性が非常に高い酵素でも、特殊な非天然基質（自然界に選択圧が存在していないと考えられる）に対して、改善される余地が残されているのを証明しています。たった1日で進化できるなんて、面白いでしょう！

デジタル・スクリーニングは、測定の定量性が改善されて初めて可能となり、この定量性の改善は、液滴の均一性と安定性と生体適合性に由来しています。多くのスクリーニング論文はまだナノリットル（10^-9 L）とピコリットル（10^-12 L）の液滴技術を熱く議論している中、今回の論文はいきなり、液滴の体積を1000倍〜100万倍縮小しました。これにより必要な試薬の消耗が激減し、実験のコストが大きく下がりました（ちょっと自慢）。僅かしか存在しない優れた変異体を正確性高く絞ることができるようになるにつれて、ポスト・スクリーニングを含めたスクリーニング作業全体の労力とコストが格段と下がりました（躊躇なく、とりあえずやってみようと）。本文の最初で述べたように、変異体ライブラリーのスクリーニングには、変異の可能性が無限にあります。私たちが取り扱えるライブラリーは、あくまでもあらゆる可能性の中のごく一部に過ぎません。作製した変異体ライブラリーの中に優れた変異体が一個も存在していない可能性も十分にあります。我々のデジタル・スクリーニングは、ハイスループット・タンパク質合成反応が終わった時点で、ライブラリーに優れた変異体が存在しているかどうかが即座に判明します。たとえ優れた変異体の無い “ハズレ” ライブラリーに出会っても、無駄せず、迅速にかつ低コストで次のライブラリー作製を実施できるのです。

近い将来には、生命情報科学（バイオインフォマティックス）の進展とライブラリー作製技術の向上に伴って、今日欲しいと思った高性能タンパク質が数日後には手元に届くという、タンパク質オンデマンド作製の時代が必ずやってくるでしょう。

ページ先頭へ戻る

研究内容紹介を読んでみて Q&A

★タンパク質って何ですか？私たちの生活にどう関わっているんでしょうか？サプリメントのことですか？

★「100万種類を超える変異体」とありますが、最近よく耳にする「ビッグデータ」はもっともっと数が多い印象があります。例えばスパコンやAIを使って、ア〇ア〇マンのジャービスみたいにチェックすれば簡単に調べられるような気がするんですけど・・・

★今回の研究成果で一番苦労した点はどこですか？FemDAの開発？それともデジタル・スクリーニング数理モデルの構築？

★デジタルPCR／デジタルELISAに続く、新たなデジタル・バイオテクノロジーとのことですが、先述の２つはすでに分析機器として広く普及してきておりますが、既にどこかの企業と機器のリリースに向けて動いているのでしょうか？

★あえて挙げるとすれば
実用化へ向けた一番大きな問題点は何ですか？？

ページ先頭へ戻る

JAMSTEC｜海洋研究開発機構｜ジャムステック

超先鋭研究プログラム