咨询热线:400-065-6886
首页>>市场动态>>公司新闻

三分钟绘制一张优美的PCoA图 | 天昊云


原创 生信部 上海天昊生物 


天昊云官网:
http://cloud.geneskybiotech.com/
PCoA图绘制:(可点击最下方阅读原文)
http://cloud.geneskybiotech.com/#/tools/all/PCoA

1.png



前言


1692257335127703.png

示例图

PCoA分析(Principal Coordinates Analysis)是一种非约束性的降维数据处理方法。从生物学的应用上来说,其主要目的是判断组内样本的重复性是否足够好(图上距离较近),组间样本的差异是否足够大(图上距离较远)。
PCoA分析基于不同的距离算法,对一系列的特征值和特征向量进行排序,然后选择排在前几位的最主要特征值,并将其表现在坐标系里。若PCoA分析结果不好,则后续差异分析结果不可靠;若存在离群样本,可剔除该样本再进行后续分析,以确保后续结果有意义。




1
PCoA工具预览

1692257363333810.png


2
了解输入数据格式
可以通过点击下图的“示例”按钮进行示例文件的下载,查看输入数据格式:

1692257391208487.png


天昊云数据输入

数据矩阵:文件必须是.txt后缀的UTF-8纯文本。每一行是一个特征,每一列是一个样本,列之间用制表符(Tab键 )分隔。其中,第一列是特征名称,第一行是样本名称,必须包含分组文件中所有样本。


1692257419170856.png


样本分组文件必须是.txt后缀的UTF-8纯文本。第一列是样本名,用于指定需要分析的样本,第二列用于指定样本分组,第一行为表头。分组信息可用于给样本设置不同的颜色,便于区分。可以附加第三列用于指定样本在绘图中的形状。

1692257441124752.png


3
上传数据并分析(以示例数据为例)

上传完成后,自动开始分析,等待十几秒即可完成。分析完成后即可预览、下载分析结果高清图。


1692257480113615.png

运行完成示意图


4
上传数据并分析(以示例数据为例)


1692257525182314.png

运行结果一览


16.png


5
参数调整
5.1距离算法的选择
客户可自行选择距离算法:

Bray-Curtis Distance : Bray-Curtis(布雷柯蒂斯)距离取值在[0,1]之间,用来计算样本之间的差异。n维空间中的距离公式为

1692257603631011.png

Jaccard Distance : Jaccard(杰卡德)距离用两个集合中不同元素占所有元素的比例来衡量两个集合的区分度。其距离公式为

1692257634104008.png


Manhattan Distance : Manhattan(曼哈顿)距离表示两个点在标准坐标系上的绝对轴距总和。其在二维数据中两点的距离为纵轴上的距离加上在横轴上的距离,即

1692257648683903.png


Euclidean Distance : Euclidean(欧几里得)距离表示空间中两点间的直线距离。n维空间中的欧几里得距离公式为

1692257663120425.png


5.2椭圆的绘制
客户可自行选择是否绘制椭圆。若选择绘制,后台则会根据颜色分组,用该组颜色绘制椭圆并进行区域的划分,更加直观展现组内样本的分布情况以及不同分组件间的差异情

5.3配色的指定
客户可自行选择所需要的颜色,可以通过两种方式进行指定:
(一)从所提供的不同调色板中选取,绘图颜色将会自动从该调色板中随机取出。

1692257686681703.png


(二)自行指定颜色,需要使用6或8位的十六进制颜色代码,前六位表示颜色,后两位表示透明度(透明度范围从00全透明—FF不透明),6位则默认不透明。
颜色个数不能少于颜色分组的个数,当指定颜色个数多于分组数时,就前读取,多种颜
色用英文逗号隔开。

1692257709181322.png


5.4优化结果

1692257729816432.png




6
注意事项
输入文件必须是.txt后缀的UTF-8纯文本,列之间用制表符(Tab键 )分隔。



7
参考文献

[1] Oksanen J, Simpson G, Blanchet F, et al. (2022) vegan: Community Ecology Package https://CRAN.R-project.org/package=vegan

[2] Paradis E, Schliep K (2019). ape 5.0: an environment for modern phylogenetics and evolutionary analyses in R, *35*, 526-528. doi:10.1093/bioinformatics/bty633



咨询沟通请联系

1692257754203654.png

18964693703(微信同号)

官方网址:http://www.geneskybiotech.com





上海昊为泰生物科技有限公司 版权所有 沪ICP备18028200号-1
地址:上海市浦东新区康桥路787号9号楼 邮箱:techsupport@geneskies.com 电话:400-065-6886