新闻中心

为什么要用降维分析T-SNE展示流式数据(为什么要进行降维,降维的方法有哪些?)

2023-11-18
浏览次数:
返回列表

刘老师最近对文献阅读很苦恼:“罗工,我看文献做免疫亚群分析的,这给出来的结果说是用流式做的结果,这怎么和常规的流式图不一样啊?真的是用流式做出来的?”

是的,这就是流式的数据分析结果,只是展示的方式使用的是最近比较火热的降维分析展示方式。

今天就来做一期超简单教学,告诉大家什么是降维分析,以及如何把自己的流式结果转换为降维分析进行展示。

什么是降维?简单地理解,你手上现在有一个快递盒子,啪一声,你把他拍扁了,这就是降维,或者说你在餐桌上发现一只嗡嗡嗡的苍蝇,这时母上大人啪一声,又扁了。或者说你看过著名的小说《三体》,相信你对其中太阳系二维化的描述也是难忘的吧,嗯,太阳系也扁了。所以简单的说降维分析的关键词就是“拍扁”。把高维度的信息拍扁到2个维度上,呈现出多种信息,就是降维。

那么什么是流式的降维分析?很简单,就是把多个荧光通道的实验结果及其相互关系展示在一张流式结果图上。其实flowjo本身最早的时候就支持3维降2维的常规分析,例如我们在flowjo的双参数散点图下方勾选第三个通道,第三个通道就会以颜色热力的方式展示出来:

此时CD4和CD8以散点的形式表现其荧光强度,而被勾选的CD3以热力的方式表现其荧光强度,同一张二维平面图上出现了3个维度的信息,这就是最简单的降维分析。

那么如果呈现更高,更多参数的维度到一张纸上呢?其实就是将这些荧光通道的信息通过电脑的整合,重新排布在一张散点图上即可。

原本施加2个维度的细胞排列可能是这样的:

当施加3个维度后一部分细胞会伴随第三个维度进行移动,形成新的群落:

当继续施加维度后会继续增加新的群落:

最终在施加多个维度后,实验结果以多个群落的方式进行最终的展示,群落的大小反应了细胞的占比,群落的远近和集中度反应了细胞的蛋白表达水平的高低以及相似度,这就是降维分析的结果展示。

降维分析的好处是原本要很多张流式结果图才能展示清楚的实验结果,现在就简单的1张图就展示清楚了,大大的节约了图片位置,为我们文章的信息量压缩添砖加瓦。所以这种分析方法已经成为信息科学领域的研究热点。在理论和应用上,降维的学习方法都具有重要的研究意义。

言归正传,如何使用flowjo完成数据的降维分析呢?其实非常非常简单,flowjo支持我们对当前的流式数据进行全自动的降维分析,即T-sne。T-Distributed random Neighbor embedded (tSNE)是一种降维算法,它允许在保持数据结构的同时,在更小的维数下实现复杂多维数据的可视化。

我们打开flowjo,把我们的样本拖入其中,选择样本或是进行必要的gating后(例如肿瘤细胞先圈出CD45+的门),选择合适的门,点击Workspace中的tSNE选项,然后直接点run即可:

之后flowjo会开始自动计算当前gating的降维结果,时间大约1-3分钟左右:

计算完成展示的结果如下:

此时我们将不同的gating代入layout,即可得到多个细胞亚群在当前Tsne上的展示结果:

一张T-sne降维分析的实验结果展示就顺利做出了。相比多张流式结果图得到的各个细胞亚群比例关系,这样一张图就得到所有的亚群关系的展示结果是否让你心动呢?怎么样,各位老师学会了吗?

搜索