冗余分析(RDA)和典范对应分析(CCA)是当今生物学两种常用的约束性排序方法,RDA是基于线性模型,CCA是基于单峰模型。相对于PCA、PCoA、NMDS等非约束排序(只基于样本的物种组成数据),约束性排序可以同时使用物种组成和环境因子数据进行排序分析,从而解释环境因子对于样本中物种组成的影响。RDA或CCA选择原则:首先对物种组成数据进行决策曲线分析(DCA),看分析结果中Axis lengths的第一轴的大小:如果大于4.0,选择CCA;如果在3.0-4.0之间,选RDA和CCA均可,默认选择CCA;如果小于3.0,则应该选择RDA分析。
可以通过点击下图的“示例”按钮进行示例文件的下载,查看输入数据格式:样本丰度文件:通常输入的是样本信息矩阵,输入文件必须是.txt后缀的UTF-8纯文本,且必须有表头。每一行是一个特征(通常代表某个物种),每一列是一个样本,列之间用制表符(Tab键 )分隔。丰度数据必须为数值型,若某个样本存在丰度为空值,分析时将剔除该样本;若某一特征的丰度在所有样本中都为0,则剔除该特征。筛选后至少存在3个有效特征才能继续运行。
环境因子文件:通常输入的是环境因子矩阵,输入文件必须是.txt后缀的UTF-8纯文本,且必须有表头每一行是一个环境因子,每一列是一个样本,列之间用制表符(Tab键 )分隔。环境因子数据必须为数值型,非数值型也请转化为数值型,若某个样本存在环境因子为空值,分析时将剔除该样本。筛选后至少存在3个有效样本,2个环境因子才能继续运行。
样本分组文件:输入样本分组矩阵,输入文件必须是.txt后缀的UTF-8纯文本,且必须有表头。第一列为样本名,第二列为分组(仅用于区分绘图时样本点的颜色),列之间用制表符(Tab键 )分隔,多于两列则只取前两列;若只有一列样本,则样本点均采用相同颜色。
(以示例数据为例)
上传完成后,自动开始分析,等待十几秒即可完成。分析完成后即可预览、下载分析结果高清图。
运行完成示意图
运行结果一览
其中包含各个约束轴的包括特征值,解释度,累计解释度等数据
Inertia: 方差 Proportion: 方差占比其中 Constrained的Proportion方差占比(约束轴的方差解释度),类似于多元回归模型的R2值,取值范围[0, 1],值越大,说明RDA/CCA的模型越可靠。
sample_with_env_relationship.xls:
feature_with_env_relationship.xls:
environmentfactors.position.csv:
RDA/CCA绘图结果
横纵坐标为两个排序轴;彩色点/字体代表不同样本;黑色星号代表特征
红色箭头射线代表不同的环境因子,射线越长表示该环境因子影响越大
样本-虚线中心连线与箭头之间的夹角 代表了样本与环境因子之间的相关关系(夹角为锐角时表示呈正相关关系,钝角时呈负相关关系,直角表示不相关)。
这三个参数决定了绘制RDA/CCA图时样本点/特征点/环境因子的展示状态。其中样本方面默认只绘制散点,不添加样本名标签;特征方面默认绘制丰度占比在1%以上特征的散点,同时展示各个点的特征名;环境因子方面默认绘制从(0, 0)出发的向量箭头,同时展示各个向量的环境因子名。这两个参数决定了是否以样本为单位,对数据进行相对计算处理。其中对丰度数据的处理表现为样本某特征占所有特征的相对数量,而对环境因子的处理则表现为样本某环境因子占所有环境因子的相对数量。默认均不进行相对计算处理。该参数决定在对所给数据进行RDA/CCA计算时是否对数据进行标准化处理。客户可自行选择所需要的颜色,可以通过两种方式进行指定:(一)从所提供的不同调色板中选取,绘图颜色将会自动从该调色板中随机取出。
(二)自行指定颜色,需要使用6位的十六进制颜色代码。颜色个数不能少于颜色分组的个数,当指定颜色个数多于分组数时,就前读取,多种颜色用英文逗号隔开。
输入文件必须是.txt后缀的UTF-8纯文本,列之间用制表符(Tab键 )分隔。
[1] Oksanen J, Simpson G, Blanchet F, et al. (2022) vegan: Community Ecology Package https://CRAN.R-project.org/package=vegan[2] Paradis E, Schliep K (2019). ape 5.0: an environment for modern phylogenetics and evolutionary analyses in R, *35*, 526-528. doi:10.1093/bioinformatics/bty633
往期相关链接:
1、天昊云
三分钟绘制一张优美的PCoA图 | 天昊云;
绘制一张优美的Heatmap图|云平台;
2个矩阵的相关性热图和相关性网络图|云平台;
绘制一张优美的肿瘤突变谱图 | 天昊云;
绘制一张优美的t-SNE图 | 天昊云;
2、R基础篇
3、R进阶
【绘图进阶】之lefse定制化绘图(五);
【绘图进阶】之六种带中心点的PCA 图和三维PCA图绘制(四);
【绘图进阶】之交互式可删减分组和显示样品名的PCA 图(三);
【绘图进阶】之绘制PCA biplot图(二);
【进阶篇绘图】之带P值的箱体图、小提琴图绘制(一);
4、数据提交
3分钟学会微生物多样性云平台数据分析;
3分钟学会CHIP-seq类实验测序数据可视化 —IGV的使用手册;
10分钟搞定多样性数据提交,最快半天内获取登录号,史上最全的多样性原始数据提交教程;
20分钟搞定GEO上传,史上最简单、最详细的GEO数据上传攻略;
5、表达谱分析
6、医学数据分析
咨询沟通请联系
18964693703(微信同号)
官方网址:http://www.geneskybiotech.com