一共有多少个维度,每个维度各是什么意思?

度量空间的欧氏空间

设Rn,这是所有n个数组成的点。
例如,R2 是平面上的点(x1 ,x2 )。
R3 是空间中的点 (x1 , x2 , x3 )。

距离是 x=(x1 ,x2 ,…,xn) 和 y=(y1 ,y2 ,…,yn) 之间的距离。
一般来说距离是这样的:
d(x, y) = √[(x1
y1 )² + (x2
y2 )² + … + (xn
yn)²]
你看,每个对应位置的数字相减,平方,然后相加,最后开平方。
这称为欧几里得距离,是最常见的。

例如,R2 中x=(1 ,2 )和y=(4 ,6 )之间的距离为: √[(1 -4 )² + (2 -6 )²] = √[9 + 1 6 ] = √2 5 = 5
R3 中 x=(1 ,2 ,3 ) 和 y=(4 ,5 ,6 ) 之间的距离为: √[(1 -4 )² + (2 -5 )² + (3 -6 )²] = √[9 + 9 + 9 ] = √2 7 ≈ 5 .2
这个公式在机器学习中非常常用,与聚类和分类密不可分。
但说实话,有时也可以用其他距离,比如曼哈顿距离,就是(|x1
y1 | + |x2
y2 | + ... + |xn
yn|),不带平方根。
2 000年左右,从事数据挖掘的人们开始普遍使用曼哈顿距离,尤其是在城市网格场景中。

不过,一般默认的距离是欧氏距离,也就是平方根。