比如图片数据集,每个图片是一个n*n像素的,可以看成一个n*n维度的大向量。那么所有的图片数据是一个在n*n维空间中分布的“点云”。
但是这个图片数据集毕竟不是随机产生的,每张图片在这个空间中的位置肯定不是随机分布的,一般而言是聚集在某些区域上。所以学者们就假设这些数据实际分布的区域是一个卷曲在高维空间中的流形上。
可以这么想,这些图片对应的样本点实际分布在一张平面上,但是被揉吧揉吧塞进了一个高维的盒子里。