澳门在线威尼斯官方 > 电脑操作 > 澳门在线威尼斯官方:扩大与扩大子深入分析解

原标题:澳门在线威尼斯官方:扩大与扩大子深入分析解

浏览次数:154 时间:2019-12-13

本节课程,供给先实现《扩增子解析解读》体系以前的操作

1质控 实验设计 双端类别合併

2领取barcode 质量控制及样板拆分 切去扩大与扩大引物

3格式调换 去冗余 聚类

4去嵌合体 非细菌种类生成代表性类别和OTU表

浅析前盘算

# 进入工作目录
cd example_PE250

上一节回想:我们上学了嵌合体的变成,以致依据参照他事他说加以调查数据库去嵌合体;也学习了基于数据库比对来挑选细菌或细菌;最终依照最鲜明的OTU,我们转移代表性系列和OTU表,那是各个MediaTek量测序皆某个结果,后续的结果将整个基于那五个文件。

 

接下去大家上学对OTU举行物种注释;OTU的操作,包括格式转变、筛选增多物种音信、数据量筛选样本、筛选高丰度的OTU、物种筛选等。

 

OTU表常用的BIOM格式

主页: 。BIOM是法语The Biological Observation Matrix的缩写,普通话翻译为生物观测矩阵,是豆蔻梢头种通过格式,用于生物学样板对应观测值的报表。它最主要使用json/HD5F文件格式标准,即多维散列构造,保存表格布局数据结果。方今主流的宏基因组软件均帮助此格式文件,如QIIME、名爵-RAST、PICRUSt、Mothur、phyloseq、MEGAN、VAMPS、metagenomeSeq、Phinch、MuranoDP Classifier、USEARCH、PhyloToAST、EBI Metagenomics、GCModeller、MetaPhlAn 2。知道它有多种要了啊。

 

Biom文件管理系统biom程序是QIIME的必装包,若无安装好,可尝试上边步骤重装

# 安装依赖包
pip install numpy
# 安装biom格式转换包
pip install biom-format
# 安装2.0格式支持
pip install h5py
# 测序程序是否安装成功
biom
  1. 物种注释

对此扩大与扩张子深入分析,最根本的就是物种新闻。大家依据上节解析获得的代表性类别,接受上次已经下载的greengene的参照体系和物种注释音信,比对软件接纳rdp方法,实行注明。

# 物种注释
assign_taxonomy.py -i result/rep_seqs.fa 
 -r gg_13_8_otus/rep_set/97_otus.fasta 
 -t gg_13_8_otus/taxonomy/97_otu_taxonomy.txt 
 -m rdp -o result

注:尽管是ITS/18S多少,建议数据库校正为UNITE,方法改为blast。详细使用表明,请读官方文书档案

 

  1. OTU表计算、格式调换、加多新闻

将OTU表转换为Biom格式,那样便于其余软件对其操作。可增加上边获得的物种消息,那样表格的新闻就更丰裕了,再转变为文本,便于人类可读,同一时候接受summarize-table查看OTU表的主干音信。

# 文本OTU表转换为BIOM:方便操作
biom convert -i temp/otu_table.txt 
 -o result/otu_table.biom 
 --table-type="OTU table" --to-json
# 添加物种信息至OTU表最后一列,命名为taxonomy
biom add-metadata -i result/otu_table.biom 
 --observation-metadata-fp result/rep_seqs_tax_assignments.txt 
 -o result/otu_table_tax.biom 
 --sc-separated taxonomy --observation-header OTUID,taxonomy 
# 转换biom为txt格式,带有物种注释:人类可读
biom convert -i result/otu_table_tax.biom -o result/otu_table_tax.txt --to-tsv --header-key taxonomy
# 查看OTU表的基本信息:样品,OUT数量统计
biom summarize-table -i result/otu_table_tax.biom -o result/otu_table_tax.sum

几日前我们赢得了OTU表的基本总计消息,用less result/otu_table_tax.sum查看一下吧,内容如下:

Num samples: 27 # 样板数据

Num observations: 975 # OTU数据

Total count: 409647 # 总的数量据量

Table density (fraction of non-zero values): 0.464 # 非零的单元格

 

Counts/sample summary:

 Min: 2352.0 # 样本数据量最小值

 Max: 35955.0 # 样板数据量最大值

 Median: 14851.000 # 样本数据量中位数

 Mean: 15172.111 # 样本数据量平平均数量

 Std. dev.: 10691.823 # 样板数据量标准变异

 Sample Metadata Categories: None provided # 样本分类新闻:末提供

 Observation Metadata Categories: taxonomy # 观看值分类:物种音讯

 

Counts/sample detail: # 每一种样本的数据量

OE4: 2352.0

OE3: 2353.0

OE8: 3091.0

OE2: 3173.0

OE1: 3337.0

OE5: 3733.0

OE6: 4289.0

OE9: 4648.0

OE7: 5185.0

WT3: 10741.0

WT8: 12117.0

WT6: 14316.0

WT2: 14798.0

WT7: 14851.0

KO1: 14926.0

WT9: 15201.0

WT1: 15422.0

WT5: 15773.0

WT4: 16708.0

KO2: 17607.0

KO6: 23949.0

KO5: 26570.0

KO8: 27250.0

KO4: 32303.0

KO7: 33086.0

澳门在线威尼斯官方 ,KO9: 35913.0

KO3: 35955.0

biom的详实使用表明,可以biom查看具体的职能,如增加注释成效biom add-metadata --help可查阅详细表达。也可观察官方网站

 

  1. OTU表筛选

尝试中会有各样影响因素,大家要综合各个背景知识来推断什么筛选数据表,起到择善而从,去粗取粗,依此类推,有表及理的来解答纠缠正确难点。数据筛选是会运营剖析流程和多少深入分析师的山山岭岭。

 

看上面的的计算结果,样板数据量从2k-35k,我们应去除过小的数据量样品,提供更恐怕高的样本最低丰度的多寡用于上游标准化分析。这里咱们筛选只保留数据量大于3000的样板。

# 按样品数据量过滤:选择counts>3000的样品
filter_samples_from_otu_table.py -i result/otu_table_tax.biom -o result/otu_table2.biom -n 3000
# 查看过滤后结果:只有25个样品,975个OTU
biom summarize-table -i result/otu_table2.biom

与此同一时间还要过滤低丰度的OTU,日常低于至极之意气风发丰度的菌,在效果与利益研商或然依然相比不方便的(早先时代文章454测序数据量少,平日只关注丰度千分之五以上的OTU卡塔尔(قطر‎。

# 按OTU丰度过滤:选择相对丰度均值大于万分之一的OTU
filter_otus_from_otu_table.py --min_count_fraction 0.0001 -i result/otu_table2.biom -o result/otu_table3.biom
# 查看过滤后结果:只有25个样品,346个OTU
biom summarize-table -i result/otu_table3.biom

某些商量花招在一定有试验中存在过错,如二零一二Nature报纸发表V5-V7在植物中扩大与扩充会偏疼扩大与扩张Chloroflexi菌门,建议删除。

# 按物种筛选OTU表:去除p__Chloroflexi菌门
filter_taxa_from_otu_table.py -i result/otu_table3.biom -o result/otu_table4.biom -n p__Chloroflexi
# 查看过滤后结果:只有25个样品,307个OTU
biom summarize-table -i result/otu_table4.biom

上述过滤条件是依照经历、相关文献设计的,若是不知情,也毫无随意过滤,轻巧孳生假阳性。

 

收获的末梢结果,还要调换为文本格式,和领取OTU表对应的队列,用于上游剖判。

# 转换最终biom格式OTU表为文本OTU表格
biom convert -i result/otu_table4.biom -o result/otu_table4.txt --table-type="OTU table" --to-tsv
# OTU表格式调整方便R读取
sed -i '/# Const/d;s/#OTU //g;s/ID.//g' result/otu_table4.txt
# 筛选最终OTU表中对应的OTU序列
filter_fasta.py -f result/rep_seqs.fa -b result/otu_table4.biom -o result/rep_seqs4.fa

本文由澳门在线威尼斯官方发布于电脑操作,转载请注明出处:澳门在线威尼斯官方:扩大与扩大子深入分析解

关键词:

上一篇:澳门在线威尼斯官方构建镜像,相关命令汇总

下一篇:没有了