Welcome to 头奖网址 為夢而年輕!

您好,歡迎來到上海翊聖生物科技有限公司官方網站!
400-6111-883
| EN
400-6111-883
新聞中心
首頁 > 新聞中心 > 技術資源更新
測序數據不好?是不是建庫出了問題?!

blob.png


——從測序數據看文庫構建

高通量測序中的文庫構建指的是在DNA兩端連接特定的接頭從而使其符合測序平台要求的過程,在高通量測序過程中,文庫質量直接影響最終測序數據的質量,打個比方,如果文庫上機測序的濃度很低,樣本在FlowCell上擴增所形成的DNA樣本簇就會很少,測序數據量也将減少,這就可能導緻測序失敗,所以我們說文庫的質量控制和質量評估也是NGS中的關鍵步驟。

文庫如何質控?
評估文庫質量的方法有哪些?


 文庫質控:文庫在上機之前都有會進行質量檢測,質量檢測合格的文庫才會上機測序。文庫上機之前的文庫質控主要包括文庫片段大小和文庫濃度的質控,具體質控标準和實驗設計見往期推送:文庫質檢方案的合理設計--文庫分布、文庫濃度、文庫質量(超鍊接:https://mp.weixin.qq.com/s/iM5eMweP1By6MoqrxOEBfw)。

 文庫評估:文庫評估方法除了文庫大小和濃度之外,還包括文庫轉化率、文庫複雜度、均一性、準确性和覆蓋度等。


      1
)文庫轉化率:是評估文庫質量的重要指标,它指的是文庫中兩端都連上接頭的目的片段占總片段數的比值,也代表測得産量與理論最高産量之間的比值,這裡的理論最高産量考慮了PCR的擴增效率問題及純化産生的損失。計算方法如下:

理論最高産量=輸入量×1+PCR擴增效率)PCR循環數)×(純化回收率)clean up數)

為什麼說文庫轉化率是重要指标呢?這是因為隻有雙端都連接上接頭的目的片段才能在FlowCell上面通過橋式擴增形成簇,最終完成測序過程,而不是雙端都連上接頭的目的片段最終都不能完成測序過程,視為無效片段,如果這樣的片段過多直接影響最終輸出數據的過少,甚至可能直接導緻測序的失敗。

blob.png

1.雙端帶接頭的DNA片段在Flowcell上擴增圖

2)文庫複雜度:指的是文庫中DNA序列的複雜程度,一定的文庫複雜度對後期測序數據的分析尤為重要,複雜度高的文庫測序得到的數據重複讀數少,可以帶來更多有意義的信息,反之,低複雜度的文庫在信号讀取時往往産生簇信号混雜,易産生低質量的測序數據。

文庫複雜度與Input樣本質量、文庫的轉化率、文庫擴增時循環數有關。當文庫的轉化率越高時,能從樣品種捕獲更多的特異分子,文庫複雜度就越高;當輸入樣本量越低或文庫擴增循環數越多時,文庫中不能帶來有意義信息的重複讀數就會增多,則文庫的複雜度越低。


1.測序數據關鍵參數比較

Sample Input

Library Prep

Uniquely Mapped

Duplication Rate

Transcripts   Detected

Genes Detected

4 μg

A*

69%

31%

111.370

20.547

B*

76%

24%

112.136

21.016

500 μg

A*

64%

36%

109.810

20.134

B*

71%

29%

110.690

20.644


       3
)均一性:指的是讀取數據在基因組或目标區域的分布均一程度。其生信分析圖如圖2所示,一般認為覆蓋越均勻,達到特定深度所需的測序數據就越少,覆蓋均一性的偏向通常是在文庫制備和文庫擴增步驟中引入的,也就是說,覆蓋均一性很多時候取決于GC含量。

blob.png

2.測序數據均一性

4)準确性:

NGS文庫制備的準确性越高,伱對變異報告的信任程度就越高。核苷酸錯誤通常在PCR擴增以及測序過程中引入。測序錯誤通常低于1%。通過使用高保真PCR試劑,可盡量減少文庫擴增的錯誤。NGS對照樣品也有助于評估NGS流程的準确性。

blob.png

3.PCR擴增存在一定的錯配率

5)測序深度和覆蓋度:

假設對長1000 bp的目标區域進行捕獲測序,每個read10 bp,總共得到3000reads,把所有的reads對比到目标區域後,1000 bp的目标區域中有990 bp的位置至少有1read覆蓋到,換言之剩餘的10bp沒有1read覆蓋。

則此時:

測序深度(depth3000*10/1000=30 也就是說測序深度為30*

覆蓋度(coverage990/1000*100%=99% 這次測序覆蓋度為99%

同理:

假設對長100bp的目标區域進行捕獲測序,每個read5bp,總共得到200reads,把所有的reads對比到目标區域後,100bp的目标區域中有98bp的位置至少有1read覆蓋到,換言之剩餘的2bp沒有1read覆蓋。

深度(depth200*5/1000=10 也就是說測序深度為 10*

覆蓋度(coverage98/100*100%=98% 這次測序覆蓋度為98%

文庫構建中的哪些步驟會直接影響測序質量?

NGS的最終目的就是得到優秀測序數據助力于下遊科學研究或實際應用,其中文庫構建是測序數據的重要影響因素,文庫構建一般包括以下幾類步驟(以DNA為例):樣本片段化、接頭連接、分選/純化、文庫擴增。文庫對測序數據的影響,具體到文庫構建的每個步驟,參考表2。


2.建庫步驟對測序結果的影響

步驟

評估指标

對測序結果的影響

樣本片段化

打斷随機性

文庫質量;測序數據的均一性和覆蓋度

片段大小是否集中

文庫濃度;測序數據覆蓋度

接頭連接

接頭連接效率

文庫轉化率;文庫複雜度;均一性;準确性和覆蓋度

分選/純化

片段大小的一緻性

片段大小與測序儀大小不匹配将無法上機測序

回收效率

文庫濃度;測序數據覆蓋度

文庫擴增

擴增偏好性

文庫複雜度;均一性

擴增效率

文庫濃度;文庫複雜度