高维数据的降维可视化是其探索性分析的起点,无法直观显示的模式或规律很难令人信服,当然能直观显示并不代表对应模式或规律的真实存在。这里我们关注的是高维度样本间的模式或规律而不是维度间的关系,因此可视化也是基于样本间关系的,特别是其异质性或相似性。虽然是三维空间生物,我们的视觉捕捉的是二维图像然后大脑利用透视阴影等信息处理为立体信息,但在可视化问题上搞透视跟阴影经常会产生误导,所以这里只讨论降维到2D平面的方法。样本间的关系在二维平面上无所谓就是用距离来描述,离得近表示样本相似,离得远表示样本差异大,这是降维可视化理论上的出发点,但一定注意很多常用降维方法并不保证这个出发点,需要理解算法搞清楚适用环境与目的,不要为了使用降维而降维。这里讨论下降维可视化常见方法 …