JAMSTEC > Institute for Extra-cutting-edge Science and Technology Avant-garde Research (X-star) > Super-cutting-edge Grand and Advanced Research (SUGAR) Program > RESEARCH INTRODUCTION

超先鋭研究プログラム

研究內容介紹

[2019年]

大海撈針亦有道——蛋白質“數字化”高通量篩選新工具


張 翼 研究員

Accurate high-throughput screening based on digital protein synthesis in a massively parallel femtoliter droplet array
Yi Zhang, Yoshihiro Minagawa, Hiroto Kizoe, Kentaro Miyazaki, Ryota Iino, Hiroshi Ueno, Kazuhito V. Tabata, Yasuhiro Shimane, Hiroyuki Noji
Science Advances, 2019, 5, 8, eaav8185



Japanese English Chinese

科學的發展往往依賴於新型研究工具的開發。在蛋白質工程領域,新型蛋白質的發現通常依賴於高通量篩選技術。針對高通量篩選準確度低、實驗週期長、成本高等一系列瓶頸問題,日本海洋研究開發機構的張翼研究員,聯合東京大學日本產業技術綜合研究所日本分子科學研究所的科研人員,將微納加工、顯微操作與統計分析理論高度整合,開發了從大規模蛋白質表達文庫中一次性準確地找出最佳突變體的新工具,使得在一天時間內迅速且低成本地獲得有效的突變體成為可能。

通過人工手段向蛋白質中引入突變,有可能對蛋白質的性能加以改進或改造。這類工作效仿自然界中的達爾文進化,被稱為「試管里的進化」,基於這一概念而作出先驅性貢獻的科學家於2018年獲得了諾貝爾化學獎。引入突變相對容易和快速,而獲得有效突變體則十分困難,其原因簡單來講是因為可能性實在是太多了。每個氨基酸位點有20種可能性,即使不考慮密碼子的簡並性(一種氨基酸可能由幾種不同的密碼子編碼),一個僅僅覆蓋5個氨基酸位點的完全隨機文庫,其所包含的突變體種類也將超過100萬種(205),如果將覆蓋範圍擴展至100個氨基酸,則文庫大小(20100)將超過整個宇宙的原子總數(1080)。另一個有趣的估算是,一個擁有地球質量(6.0×1027g)的基因文庫,其文庫大小僅僅大約1046,同樣遠遠小於20100。而一個蛋白質通常由成百上千個氨基酸組成,蛋白質篩選這類工作猶如大海撈針,從某種意義上來說,是永無止境的。此類工作從文庫構建、到初篩、再到確認,如此往復,多輪做下來,少則幾個月,多則好幾年,最終還未必一定能夠獲得性能改善的突變體,無果而終的例子比比皆是,屬於典型的高風險、高回報的研究領域。這也是為什麼具有巨大應用價值的蛋白質(例如:新型螢光蛋白、高性能酶)一旦被篩選到,通常都能在頂級雜誌發表論文的原因。在那些論文中,蛋白質性能的表徵只是水到渠成的事,關鍵在於如何拿到想要的蛋白質。由於目前尚無普適性的理論能夠精准地預測有效的突變位點,因此通過實驗手段實現高通量篩選就成為了必然的選擇。但如上所述,既然單純提高篩選通量的做法必然杯水車薪,因此本研究另辟蹊徑,以酶活性改善為例,著眼於提高高通量篩選的準確性,從而讓蛋白質篩選轉變成一種低風險、高回報的研究領域。

張翼研究員所發明的這一新方法,可以在不測量文庫中每個突變體的具體蛋白表達量的情況下,將蛋白表達量的變化從酶表觀活性指標中獨立出來,從而確切地獲得酶活性改善的信息。

首先,張翼研究員開發了一種高密度飛升級液滴陣列制備技術(圖 1),可以在超薄載玻片的1cm2區域上集成100萬個超級均勻、超級穩定、且生物相容性極好的液滴。每個液滴中含有編碼蛋白質的DNA分子和蛋白質合成反應所需的全部組分以及酶特異性螢光底物。其中,經過稀釋後的模版DNA分子遵循泊松原理,隨機地分布在每個液滴中,即每個液滴中有可能含有0、1、2、3、……個DNA分子。由於反應體積只有飛升(10-15L)量級——相當於將一個納升體積的液滴平均分成了100萬份,因此,少量被合成的酶分子以及由酶分子所催化生成的螢光反應產物可以展現出較高的局部濃度,這是超小尺度反應器所特有的濃縮效應。


圖 1. 用於大規模平行無細胞蛋白質合成反應的飛升液滴陣列制備流程。親水基底與疏水側壁所構成的每個飛升級反應小室可以穩定地存儲液滴。


在實驗中,合作團隊首先發現,無細胞蛋白質合成體系下的蛋白質合成量完美地正比於液滴中的DNA分子數(圖 2),也就是說,含有2個DNA分子的液滴,其信號強度是含有1個DNA分子時的兩倍。在此,螢光蛋白的螢光強度或者酶活性測定反應的信號強度可以直接反映蛋白質的相對含量。於是,在給定液滴個數和DNA濃度的情況下,可以使用泊松統計學準確地預測出一次實驗中單個液滴里所可能得到的蛋白質最大合成量(即由螢光強度所指示的相對量)——即單個液滴中所可能含有的最多DNA分子數是受泊松分布約束的。換一種說法,只要確定了最多想讓幾個DNA分子同時進入到一個液滴里,那麼液滴的總個數和DNA的濃度就必須分別控制在某個閾值以下(圖 3)。如果不這樣做,最後就無法區分到底是蛋白表達量提高了,還是酶活性提高了。於是,本研究首次提出,篩選的通量並非單純地越高越好。遵循此設定,如果在篩選實驗中出現了某個液滴,其信號強度大於上述泊松分布所預測的最大值,那麼它在統計學上具有極大的可能性是由於含有酶活性提高的有效突變體,而不是由於蛋白合成量的提高。由於液滴信號強度隨DNA分子數所呈現的等間隔離散分布為篩選閾值的設定提供了最重要的參照,張翼研究員將此技術命名為「數字篩選」技術(Digital HTS),這是繼「數字PCR」和「數字ELISA」之後的又一個數字化生物技術(圖 4)。


圖 2. 數字化無細胞蛋白質合成。(A)黃色螢光蛋白mVenus。(B)液滴信號強度隨DNA分子數所呈現的等間隔離散分布(以mVenus為例)。(C)包含有不同DNA分子數的液滴個數服從泊松分布(以mVenus為例)。(D-H)其他螢光蛋白合成實例。分別為:青色螢光蛋白mseCFP、綠色螢光蛋白mNeonGreen、橙色螢光蛋白tdTomato、紅色螢光蛋白mRuby2、遠紅色螢光蛋白smURFP。(I)鹼性磷酸酶。比例尺:10微米。



圖 3. 「數字化篩選」的數理模型。此圖中的不等式描述了液滴個數(m)與DNA濃度(λ:平均一個液滴的DNA個數)之間的關係。參數k表示實際最多進入到一個液滴里的DNA分子數。為了在篩選中避開假陽性,λ和m必須控制在一定的閾值以下(半透明著色區域)。此圖清楚地顯示,篩選的通量(即液滴個數)並非單純地越高越好。



圖 4. 「數字化」生物技術發展史。「數字篩選(Digital HTS)」技術首次將生物分子從分析檢測領域帶入到了生物分子創造領域。


為了驗證這一數字篩選理論的可行性,合作團隊制備並篩選了一個源自大腸桿菌鹼性磷酸酶的基因突變文庫,此文庫隨機覆蓋了其48個氨基酸位點,每個單克隆含有一個突變氨基酸位點,每個位點被20種天然氨基酸中的任何一個隨機取代。當以每個液滴平均含有0.1個(不會存在0.1個DNA分子,這是一個平均值)DNA的濃度,將蛋白質表達文庫導入由18萬個液滴組成的陣列時,根據泊松統計理論,含有4個或4個以上DNA分子的液滴數將小於1。實際實驗中最終出現了幾個螢光強度明顯高於最大理論值的液滴(圖 5),這僅有的幾個液滴被微毛細管逐個回收(圖 6),液滴中的DNA被擴增並用於測序,由此迅速地確定了兩個突變位點、共計三種突變體。從篩選到驗證,僅需花費1天左右的時間。令人欣喜的是,其中一個突變位點恰是過去幾十年的大量突變篩選實驗中已經被驗證過的最有效位點,而另一個突變位點由於稍微遠離酶活性中心,之前並未有報道過,甚至未曾被納入過考慮範疇。鹼性磷酸酶是一個已經被研究得非常多的酶,鑒於其在基因工程和體外診斷中的實用價值,已有大量的晶體結構以及突變體篩選工作被報道。此實驗原本主要目的是想驗證一下那個已知的有效突變位點是否可以從一個較大的突變文庫中被準確地找出來(即陽性對照實驗),沒想到不僅找到了這個已知的有效突變位點,還找到了新的突變位點,可謂一箭雙雕。這個意料之外的發現,頗具深意,這表明我們對蛋白質的結構功能關係仍然知之甚少,通過靜態的晶體結構來探討蛋白質構效關係的傳統做法仍然存在缺陷,廣泛地引入突變仍不失為一種有效的策略。


圖 5. 鹼性磷酸酶突變文庫的「數字化篩選」。少數的幾個液滴(紅色標注)展現出高於最大理論值(縱向虛線標注)的螢光強度。



圖 6. 利用微毛細管從單個飛升液滴里回收單分子DNA。回收的DNA分子可以通過PCR被擴增,用於電泳或測序分析。



正如數字篩選的數理模型所暗示的,在設定實驗條件時,存在臨界條件(圖 3的實線),接近此臨界條件,便能夠投入更多的液滴(這意味著更高的通量)到實驗中,從而可以覆蓋更大的文庫(圖 3方形坐標所對應的實驗條件比圓形坐標所對應的實驗條件的篩選通量要高)。於是基於此設定,本項研究還嘗試了一個相對較新、尚未有晶體結構報道的鹼性磷酸酶的突變體篩選實驗。此鹼性磷酸酶源自一種海洋嗜冷細菌,其野生型酶被認為是已知所有鹼性磷酸酶中活性最高的。本實驗針對其中的250個氨基酸位點制備了單一位點飽和突變文庫,將一種非天然的氟化螢光底物用於酶活性測定,基於相同的數字篩選原理,從文庫中確認了幾個展示出高酶活性的液滴,並對其進行了回收。活性確認實驗證實,這幾個突變體的酶活性特異性地針對此特殊底物得到了進一步的改善。這幾個突變體顯示了同一突變位點,此位點氨基酸只被20種天然氨基酸中有且僅有的兩個強帶正電的氨基酸所取代,考慮到水溶液中氟化物特殊的帶電特性,此結果暗示酶活性的提高或許跟酶與底物間增強的靜電相互作用有關。這個發現也是頗有意思,這表明即使是活性很高的酶,針對特定的非天然底物,仍然有被改進的空間。

本項研究所首次提出的數字篩選技術主要歸功於小尺度液滴在均一性、穩定性和生物相容性方面的改善。當還有大量的論文在熱議納升(10-9L)或皮升(10-12L)液滴技術的時候,本項研究將液滴的尺度一下子縮小了1000倍到100萬倍,這直接帶來的效果就是,反應溶液的消耗驟減,實驗的成本大大降低。在本文最開始的地方已經說過,基因突變文庫的篩選其實是個無底洞,可能性幾乎是無窮盡的,我們所能夠制備和篩選的文庫通常只是眾多可能性中極小的一部分,一個文庫里不存在有效突變體的可能性很大。由於數字篩選理論可以在高通量蛋白合成反應結束之時,就迅速地給出文庫中是否存在有效突變體的結論,因此,即使面對無效文庫,能夠迅速且低成本地給出這一結論,對於研究項目整體的推進而言也十分重要,有助於迅速地調整文庫制備的策略,避免將大量的時間和金錢浪費在無效的文庫上。

隨著生物信息學和基因文庫制備技術的發展,不久的將來,很有可能出現立等可取的高性能蛋白質定制服務。未來可期!


Back to top