这种问题没必要过度解读,cosine相似度和Pearson系数就是形式上有关联(观测数据标准化以后二者相等),但是出发点是完全不同的。
Pearson系数在定义上就是两个随机变量的协方差,用二者的标准差归一化消除量纲影响。如果要问为什么Pearson系数需要中心化,实际上就是问为什么协方差的定义中要减去期望,为什么标准差的定义中要减去期望。
题主可以把这两个问题复制给身边统计背景的朋友,看看他们会不会打死你。