国内精品久久久久久影院8f-国内精品久久久久久中文字幕-国内精品久久久久丫网址-国内精品久久久久影-国内精品久久久久影院6

Welcome!

This community is for professionals and enthusiasts of our products and services. Share and discuss the best content and new marketing ideas, build your professional profile and become a better marketer together.

0

Geneious中讀取下一代測(cè)序數(shù)據(jù)對(duì)基因組De Novo組裝教程

提供于
Johnson
18-5-20 下午1:12 ? 7,042 瀏覽次數(shù)
  • Flag
這個(gè)問(wèn)題已經(jīng)包含在 官方文檔.

0

Johnson

--Johnson--
北京沫之東生物技術(shù)有限公司
http://m.07315088.cn
2582
| 3 1 2
中國(guó)
--Johnson--
Johnson
開(kāi) 18-5-20 下午1:13

基于機(jī)器學(xué)習(xí)翻譯,僅供參考。

本教程將使用短讀取下一代測(cè)序數(shù)據(jù)來(lái)執(zhí)行金黃色葡萄球菌基因組的部分重新組裝這些基因組是高度重復(fù)的,對(duì)于短閱讀的組裝者來(lái)說(shuō)是一個(gè)挑戰(zhàn),無(wú)需額外的信息就可以進(jìn)行重建。

大多數(shù)新一代測(cè)序平臺(tái),如Illumina,Solid,Ion Torrent和454都提供了雙端測(cè)序的選項(xiàng)。這會(huì)從相同的DNA片段中產(chǎn)生兩個(gè)序列讀數(shù),這些片段被已知的插入片段長(zhǎng)度分開(kāi),這有助于數(shù)據(jù)的組裝。維基百科對(duì)如何在這里生成和使用配對(duì)的數(shù)據(jù)提供了很好的描述。

練習(xí)1:簡(jiǎn)短閱讀匯編在本練習(xí)中,您將匯編短期閱讀數(shù)據(jù),而不使用配對(duì)結(jié)束信息,并通過(guò)將結(jié)果與您嘗試重建的基因組的原始部分進(jìn)行比較來(lái)了解匯編程序的效果。

練習(xí)2:組裝雙端數(shù)據(jù)接下來(lái),您將使用雙端信息重新運(yùn)行組件。您將學(xué)習(xí)如何設(shè)置配對(duì)讀取,并了解額外信息如何影響程序集。

練習(xí)3:共識(shí)校正最后,您將看到從程序集產(chǎn)生的共有序列,并將其與您嘗試重建的基因組的原始部分對(duì)齊。然后,您將學(xué)習(xí)如何修改共識(shí)生成器來(lái)處理由原始數(shù)據(jù)中的讀取錯(cuò)誤引入的任何不正確的堿基調(diào)用。

練習(xí)1:簡(jiǎn)短閱讀程序集

對(duì)于第一個(gè)練習(xí),我們將使用數(shù)據(jù)作為單個(gè)讀取。如果您有雙端數(shù)據(jù),通常不會(huì)這樣做,但我們只是演示匯編程序如何管理未配對(duì)的數(shù)據(jù)。選擇包含讀取的兩個(gè)文檔(正向讀取和反向讀取)。

現(xiàn)在單擊??Align / Assemble?并選擇De Novo Assemble?,然后在窗口左下角的Settings cog下單擊Reset to defaults?。結(jié)果部分下,選擇保存程序集報(bào)告保存到子文件夾中。保留共有序列已開(kāi)啟,因?yàn)槲覀円獙⑺鼈冇成浠卦紖⒖夹蛄幸圆榭此鼈兤ヅ涞某潭取?/font>

Click?OK. This should produce an assembly with 4 contigs which will be placed in the Assembly subfolder.

Two of these are very short, the others much longer as you can see from the?Assembly Report. When there are multiple contigs produced, this document will also give you the?N50 statistic?which is a commonly used measure of the quality of an assembly.

要查看這些重疊群如何與原始序列對(duì)齊,請(qǐng)選擇De Novo Assembly Tutorial?父文件夾,然后單擊新的Assembly?文件夾,以查看兩者的內(nèi)容。按住cntrl /命令,選擇Consensus Sequences?NC_009487提取文檔。現(xiàn)在選擇對(duì)齊/組裝→映射到參考。檢查NC_009487是否設(shè)置為參考序列,然后單擊確定。

一旦這個(gè)程序集完成后,您可以查看重疊群,并查看組合的重疊群與原始序列的映射情況。您應(yīng)該看到有一個(gè)區(qū)域匯編程序遇到麻煩,無(wú)法加入它生成的最長(zhǎng)重疊群。

在程序集中選擇此區(qū)域(大約90,000)并放大。您應(yīng)該看到有一部分沒(méi)有重建重疊群,這就是為什么兩個(gè)最長(zhǎng)的重疊群無(wú)法連接的原因。在下一個(gè)練習(xí)中,我們將看看使用配對(duì)結(jié)束信息是否有幫助。

練習(xí)2:組裝雙端數(shù)據(jù)

所提供的數(shù)據(jù)實(shí)際上是125bp的雙末端讀數(shù),插入大小約為500bp。為了在Geneious中使用雙端讀取,需要將這兩組讀取組合為一個(gè)配對(duì)讀取文件,其中包含有關(guān)其方向和距離的額外信息。為此,請(qǐng)選擇正向和反向讀取文檔,然后從頂部菜單中選擇序列→設(shè)置配對(duì)讀取...。您有兩個(gè)序列表,請(qǐng)選擇序列對(duì)列表,然后選擇預(yù)期距離為500的正向/反向(Illumina短讀取試劑盒)然后單擊確定。

現(xiàn)在你有一個(gè)Paired Reads?文件,所以你可以選擇這個(gè)文件,然后再次運(yùn)行Align / Assemble→De Novo Assemble ...?和以前相同的設(shè)置。這一次,匯編器將能夠使用配對(duì)信息來(lái)幫助它定位讀取的位置并希望重現(xiàn)原始序列。

完成后,將制作的共有序列與先前相同的方式映射回NC_009487序列:選擇De Novo Assembly Tutorial?父文件夾和新的Paired Reads Assembly?文件夾,然后選擇NC_009487提取和新的共識(shí)序列,然后單擊對(duì)齊/組裝→映射到參考。

您現(xiàn)在應(yīng)該可以看到最后的重疊群幾乎是原始序列的全長(zhǎng),但“?統(tǒng)計(jì)”?選項(xiàng)卡將顯示序列不是100%相同的。您可以使用CTRL / CMD + D單步執(zhí)行錯(cuò)誤,或查看身份圖以檢查錯(cuò)誤。由于原始數(shù)據(jù)中的錯(cuò)誤,會(huì)有幾個(gè)位置在裝配中不明確。在最后的練習(xí)中,我們將在共識(shí)中糾正這些基調(diào)。

練習(xí)3:共識(shí)糾正

返回上一練習(xí)中配對(duì)讀數(shù)組合文件夾并打開(kāi)重疊群。為了確定變異的位置,選擇Annotate&Predict→Find Variations / SNPs?并重置為默認(rèn)值,然后將Minimum Coverage?更改4,因?yàn)楦采w率很低的區(qū)域會(huì)對(duì)變體調(diào)用做出貢獻(xiàn)。這些可能是組裝不良或閱讀錯(cuò)誤的產(chǎn)物,但將它們稱為SNP將使我們能夠輕松找到它們。保留最小變化頻率設(shè)置并取消選中最大變量P值最小股數(shù)偏置P值因?yàn)槲覀冎皇鞘褂肧NP查找器更容易地在共識(shí)代中查找這些錯(cuò)誤。點(diǎn)擊確定。

一旦變異已被調(diào)用,在共有序列中的第340?位選擇它們中的第一個(gè),然后放大該基地。這一組變體是由于讀取結(jié)束附近的缺口缺失的低覆蓋區(qū)域中的未對(duì)準(zhǔn)引起的。由于使用的評(píng)分方法,對(duì)齊器難以完成讀取結(jié)束時(shí)的差距。

單擊“注釋和跟蹤”?選項(xiàng)卡中“變體”注釋控件旁邊的右箭頭,直到找到基于18033的變體。

該基因在共有序列中被稱為'R',因?yàn)樽x數(shù)在該位置包含A和G的混合物。進(jìn)入“顯示”選項(xiàng)卡中的共識(shí)設(shè)置,并根據(jù)0% - 多數(shù)改變?cè)O(shè)置以調(diào)用

您現(xiàn)在將看到該基地在共識(shí)中被稱為A。逐步通過(guò)其余變體來(lái)檢查在共有序列中調(diào)用的堿基是否反映了讀取中的大多數(shù)堿基,然后通過(guò)選擇整個(gè)序列并單擊提取將共有序列提取到新文檔。

注意:對(duì)于大多數(shù)數(shù)據(jù)集,通過(guò)“最高質(zhì)量”調(diào)用共識(shí)將產(chǎn)生最準(zhǔn)確的結(jié)果,并且是推薦的選項(xiàng)。但是,對(duì)于本教程,我們使用了一個(gè)小的低覆蓋率數(shù)據(jù)集,因此使用“0%多數(shù)”可產(chǎn)生較少的歧義。

將新的共有序列重新映射到NC_009487參考序列,并查看您現(xiàn)在是否能夠找到任何分歧。“?統(tǒng)計(jì)信息”?選項(xiàng)卡應(yīng)顯示對(duì)齊現(xiàn)在為100%,并且您已更正原始數(shù)據(jù)中的讀取錯(cuò)誤。

您現(xiàn)在已經(jīng)完成了De Novo Assembly Tutorial。


隨時(shí)了解最新的技術(shù)快訊

關(guān)于這個(gè)技術(shù)問(wèn)答社區(qū)

Geneious最新版生物信息學(xué)軟件相關(guān)的技術(shù)文檔、技術(shù)手冊(cè)、技術(shù)教程、技術(shù)資料分享和問(wèn)答 閱讀指南

問(wèn)題工具

1 關(guān)注者

統(tǒng)計(jì)數(shù)據(jù)

問(wèn): 18-5-20 下午1:12
看到: 7042 時(shí)間
最后更新: 18-5-20 下午1:13
主站蜘蛛池模板: 日韩精品一区二三区中文| 久久精品国产夜色| 日韩特黄毛片| 中日韩国语视频在线观看| 久久国产精品亚洲| 粉嫩极品国产在线播放| 这里只有精品视频| 无圣光私拍一区二区三区| 亚洲女人网| 国产精品福利在线观看免费不卡 | 97r久久精品国产99国产精| 香蕉香蕉国产片一级一级毛片| 欧美 日韩 国产 成人 在线观看 | 一级黄色片一| 欧美性野久久久久久久久| 搞黄在线观看| 免费黄色视屏网站| 久久久精品2021免费观看| 轻轻啪在线视频播放| 婷婷资源综合| 免费观看日批视频| 三黄色片| 久久婷婷伊人| 最刺激黄a大片免费观看下截| 国产成人精品高清在线| 亚洲一级片免费看| japenese色系tube日本护士| 久久综合噜噜激激的五月天| 香蕉爱爱视频| 在线观看日韩视频| 在线污污视污免费| 国产的老妇人| 欧美视屏在线观看| 久久综合九色综合97飘花| 日韩日日日| 高清日韩在线| 在线国产毛片| redtube日本| 精品免费视在线视频观看| 国产精品1024| 中文字幕中出在线|