【人工智能】距离空间(最基本的数学模型)_距离空间圆-程序员宅基地

技术标签: 算法  基础理论  人工智能  

目录

一、说明

二、度量空间的意义

2.1 基于几何的定义

2.2 更抽象的距离问题

三、更广泛的距离空间定义

3.1  非物理意义的距离空间

3.2 代数学距离的定义

3.3  形形色色的距离模型

四、曼哈顿距离

4.1 曼哈顿距离定义

4.2 举个实际例子

4.3 下面证明,“曼哈顿距离”符合距离空间的定义。

五、欧几里得距离

5.1 欧氏距离定义

5.2 证明欧氏距离

5.2.1 首先柯西不等式

5.2.2 证明欧几里得距离          

六、闵可夫斯基距离

6.1 闵可夫斯基距离定义

6.2 闵可夫斯基距离证明

七、切比雪夫距离

7.1 切比雪夫距离定义

八、Hausdorff距离

九、单位圆 


一、说明

        纵观人类文明的历史,对事物性质的描述中,既然能用数,就说明有了“量”的概念;既然有了“量”就必然要解决,如何度量?量与量如何比较?这是无法回避的问题,距离空间就是度量空间,是“量”的具体化、关于度量的理论,本文将详细介绍各种度量机制的特点。

二、度量空间的意义

2.1 基于几何的定义

        距离空间是指将每个点之间的距离作为基本的度量方式来定义空间的一种数学结构。在距离空间中,任意两个点之间的距离都有明确的定义,而空间的形状和拓扑特征则由距离度量所决定。距离空间广泛应用于几何、分析、拓扑等领域,成为了研究空间性质的基本工具之一。

        在解析几何中,我们定义了欧几里得距离,那就是:

         在坐标平面中的两点A和B,它们的坐标为(X_A,Y_A)(X_B,Y_B),那么A和B的距离为:

                d(A,B) =\sqrt{(X_A-X_B)^2+(Y_A-Y_B)^2}

        度量空间最熟悉的例子是 3 维欧几里德空间,其通常的距离概念。其他众所周知的例子是配备角距和双曲平面的球体。 

2.2 更抽象的距离问题

        距离模型,是最基本的数学模型。换句话说,如果一个数学模型不符合距离模型,那么这个数学模型将毫无用途。可以说,任何规模事物的量化比较,都有距离空间的影子。以下给出几个距离的实例:

1)在下面照片的三个山头中,哪两个更为相似?

2)在下面音频序列中,能否识别出同一个语句?

 3)在曲线处理中,能否用更简单的数据近似表示?

三、更广泛的距离空间定义

3.1  非物理意义的距离空间

        度量可能对应于隐喻的而非物理的距离概念:例如,100 个字符的 Unicode 字符串集可以配备汉明距离,它测量需要更改的字符数才能从一个字符串到另一个。

        由于它们非常通用,度量空间是许多不同数学分支中使用的工具。许多类型的数学对象具有距离的自然概念,因此承认度量空间的结构,包括黎曼流形、赋范向量空间和图。在抽象代数中,p 进数作为有理数上度量结构完成的元素出现。在度量几何[2]和度量空间分析[3]中也对度量空间进行了研究。

        数学分析的许多基本概念,包括球、完备性以及均匀性、Lipschitz 和 Hölder 连续性,都可以在度量空间的设置中定义。其他概念,例如连续性、紧致性、开集和闭集,可以为度量空间定义,也可以在更一般的拓扑空间设置中定义。

3.2 代数学距离的定义

        定义:(度量空间)对于有序对(M,d),其中M为集合,d是定义在M上的度量(metric)函数,即为函数

                 d: M\times M \to \mathbb{R}

        对于任意 x, y, z \in \mathbb{M},下列条件成立:

                     1   d(x,y)\geqslant 0                (非负性)

                     2   d(x,y) = 0                那么x = y

                     3   d(x,y) = d(y,x)       (对称性)

                     4 d(x,y) \leq d(x,z) + d(y,z)       (三角不等式)

        对于任意的集合空间,它是否构成距离空间,换句话说,能否按照距离去度量,只要用以上定义进行

        因此,结论是:距离模型是多维向量到数量的一个映射函数。

        在数学中,度量空间是一个集合及其元素之间距离的概念,通常称为点。距离由称为度量或距离函数的函数测量。 [1]度量空间是研究许多数学分析和几何概念的最通用的设置。

   

3.3  形形色色的距离模型

        按照2.2 的定义,距离模型变得丰富多彩;二维空间内,有如下距离模型:

A, B \in \mathbb{M}

        1)曼哈顿距离: 那么 d(x,y) =\left | X_A-X_B \right | + \left | Y_A-Y_B \right |构成距离。

        2)欧几里得距离:d(x,y) = \sqrt[2]{ (X_A-X_B)^2 + (Y_A-Y_B)^2}

        3)闵可夫斯基距离:d(x,y) = \sqrt[s]{ (X_A-X_B)^s + (Y_A-Y_B)^s}

        4)切比雪夫距离:d(x,y) = \sqrt[ \infty ]{ (X_A-X_B)^\infty + (Y_A-Y_B)^\infty}

        5)  housdroff距离:

四、曼哈顿距离

        我们在学习计算机原理,常常遇到“曼哈顿距离”,曼哈顿距离是个啥?

4.1 曼哈顿距离定义

        有如下距离模型:若A, B \in \mathbb{M}

             那么 d(x,y) =\left | X_A-X_B \right | + \left | Y_A-Y_B \right |构成距离。

4.2 举个实际例子

        以上图说明曼哈顿距离:二维平面上,A坐标是(6,1),B点坐标(1,5),那么A到B距离函数为:

d(A,B)=5+4 =9 ;更加规范的表达是:

d(A,B)=|X_A-X_B| + |Y_A-Y_B|

4.3 下面证明,“曼哈顿距离”符合距离空间的定义。

        现在验证是否距离空间:

  • 非负性:d(A,B)=|X_A-X_B| + |Y_A-Y_B|\geq 0,  成立
  • 同一性:

                  \\d(A,B)=0,\Rightarrow A,B \;the\; same \\ A,A \;the\; same \Rightarrow d(A,A)=0,两点重合距离为

  • 对称性:d(A,B)=|X_A-X_B| + |Y_A-Y_B|=d(B,A)
  • 三角不等式:须证明d(A,B) \leq d(A,C) + d(C,B)验证如下:

\\d(A,B)=|X_A-X_B| + |Y_A-Y_B| \\ d(A,C)=|X_A-X_C| + |Y_A-Y_C| \\ d(C,B)=|X_C-X_B| + |Y_C-Y_B| \\

        只要证明目标不等式就可以了:

 |X_A-X_B| + |Y_A-Y_B| \leq |X_A-X_C| + |Y_A-Y_C|+|X_C-X_B| + |Y_C-Y_B| --(1)\\

 这里只验证X轴部分,同理推广到Y轴部分:

\\|X_A-X_C| \geq X_A-X_C ----1 \\ |X_A-X_C| \geq X_C-X_A----2 \\

\\|X_B-X_C| \geq X_B-X_C ----3 \\ |X_B-X_C| \geq X_C-X_B----4 \\

|X_A-X_C| +|X_C-X_B|\geq X_A-X_B(通过以上1、4合并得到)

|X_A-X_C| +|X_C-X_B|\geq X_B-X_A(通过以上2、3合并得到)

因此,|X_A-X_C| +|X_C-X_B|\geq |X_B-X_A|

同样有: |Y_A-Y_C| +|Y_C-Y_B|\geq |Y_B-Y_A|

因而以上(1)式成立,即曼哈顿距离符合距离空间。(证毕)

五、欧几里得距离

5.1 欧氏距离定义

        有如下距离模型:若A, B \in \mathbb{M}^d,设A=[a_1,a_2...a_d] \: \: \: \: B=[b_1,b_2,...b_d]

        欧几里得距离:d(A,B) = \sqrt[2]{ (a_1-b_1)^2 + (a_2-b_2)^2...+(a_d-b_d)^2}

         

5.2 证明欧氏距离

5.2.1 首先柯西不等式

 也就是A和B的内积,永远小于A和B模的乘积。

证明

1)对于两个维度的证明,假定A,B是二维,A=[a_1,a_2] \: \: \: B=[b_1,b_2]

要证a_1b_1+a_2b_2\leq \sqrt{a_1^2+a_2^2}\sqrt{b_1^2+b_2^2},只要:

(a_1b_1+a_2b_2)^2\leq ({a_1^2+a_2^2})({b_1^2+b_2^2}) 

 这很好证明,直接展开就可以了。

2)证明多维度扩展:如果n个维度成立,那么n+1维度也成立:

 假设以上不等式成立,那么:

 所以,从数学归纳法的角度,柯西不等式在任意维度上成立。

5.2.2 证明欧几里得距离

        首先说明:在A, B ,W\in \mathbb{M}^d,   d(A,B) = d(A+W,B+W)这是因为W是的A,B等长平移,因此距离不变。所以:

要证明的不等式为: d(A,B) \leq d(A,C) + d(C,B)

              d(A,C) = d(0,A-C)

          d(C,B) = d(0,B-C)

              d(A,B) = d(0,B-A)

令  U = A - C; \; \; \; \; V=B-C,因此,预期要证明:

d(A,B) \leq d(A,C) + d(C,B),等价于证明:

d(0,U+V) \leqslant d(0,U) + d(0,V),展开成坐标形式:

\sqrt{(u_1+v_1)^2+(u_2+v_2)^2...+(u_d+v_d)^2}\leqslant \\\sqrt{(u_1)^2+(u_2)^2...+(u_d)^2}+ \sqrt{(v_1)^2+(v_2)^2...+(v_d)^2}

两边都大于0;因此,不等式两遍可以平方;

(u_1+v_1)^2+(u_2+v_2)^2...+(u_d+v_d)^2 \leqslant [(u_1)^2+(u_2)^2...+(u_d)^2]+[(v_1)^2+(v_2)^2...+(v_d)^2]+ 2\times \sqrt{(u_1)^2+(u_2)^2...+(u_d)^2}\times \sqrt{(v_1)^2+(v_2)^2...+(v_d)^2}

消除等式两面相同项,简化不等式:

2(u_1*v_1) +2(u_2*v_2) ...+2(u_d*v_d) \leqslant 2\times \sqrt{(u_1)^2+(u_2)^2...+(u_d)^2}\times \sqrt{(v_1)^2+(v_2)^2...+(v_d)^2}

而这个不等式就是柯西不等式,原命题得证!

六、闵可夫斯基距离

6.1 闵可夫斯基距离定义

 有如下距离模型:若A, B \in \mathbb{M}^d,设A=[a_1,a_2...a_d] \: \: \: \: B=[b_1,b_2,...b_d]

闵可夫斯基距离:d(A,B) = \sqrt[s]{ (a_1-b_1)^s + (a_2-b_2)^s...+(a_d-b_d)^s}

其中s属于正整数。

6.2 闵可夫斯基距离证明

(因为证明很抽象,因此,读者按自己的程度,自行查阅)

七、切比雪夫距离

7.1 切比雪夫距离定义

 有如下距离模型:若A, B \in \mathbb{M}^d,设A=[a_1,a_2...a_d] \: \: \: \: B=[b_1,b_2,...b_d]

闵可夫斯基距离:d(A,B) = \sqrt[\infty ]{ (a_1-b_1)^\infty + (a_2-b_2)^\infty...+(a_d-b_d)^\infty}

切比雪夫距离

对于:d(A,B) = \sqrt[\infty ]{ (a_1-b_1)^\infty + (a_2-b_2)^\infty...+(a_d-b_d)^\infty}

取  L = max [ | a_1-b_1 |, { | a_2-b_2 | ...,|a_d-b_d| } ]

d(A,B) = \sqrt[\infty ]{( (a_1-b_1)^\infty + (a_2-b_2)^\infty...+(a_d-b_d)^\infty)\frac{L^\infty }{L^\infty }}

d(A,B) =|L| \sqrt[\infty ]{( (a_1-b_1)^\infty + (a_2-b_2)^\infty...+(a_d-b_d)^\infty)\frac{1 }{L^\infty }}

d(A,B) = |L|

八、Hausdorff距离

关Hausdorff距离有专题论述,这里给出链接: 基础理论:集合的Hausdorff距离_豪斯多夫距离_

九、单位圆 

        下面用各种距离构成单位圆:

  • 曼哈顿距离:红色
  • 欧几里得距离:绿色
  • 闵可夫距离:(N=3,4 )蓝色-黄色
  • 切比雪夫距离:紫色

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/gongdiwudu/article/details/128427470

智能推荐

使用nginx解决浏览器跨域问题_nginx不停的xhr-程序员宅基地

文章浏览阅读1k次。通过使用ajax方法跨域请求是浏览器所不允许的,浏览器出于安全考虑是禁止的。警告信息如下:不过jQuery对跨域问题也有解决方案,使用jsonp的方式解决,方法如下:$.ajax({ async:false, url: 'http://www.mysite.com/demo.do', // 跨域URL ty..._nginx不停的xhr

在 Oracle 中配置 extproc 以访问 ST_Geometry-程序员宅基地

文章浏览阅读2k次。关于在 Oracle 中配置 extproc 以访问 ST_Geometry,也就是我们所说的 使用空间SQL 的方法,官方文档链接如下。http://desktop.arcgis.com/zh-cn/arcmap/latest/manage-data/gdbs-in-oracle/configure-oracle-extproc.htm其实简单总结一下,主要就分为以下几个步骤。..._extproc

Linux C++ gbk转为utf-8_linux c++ gbk->utf8-程序员宅基地

文章浏览阅读1.5w次。linux下没有上面的两个函数,需要使用函数 mbstowcs和wcstombsmbstowcs将多字节编码转换为宽字节编码wcstombs将宽字节编码转换为多字节编码这两个函数,转换过程中受到系统编码类型的影响,需要通过设置来设定转换前和转换后的编码类型。通过函数setlocale进行系统编码的设置。linux下输入命名locale -a查看系统支持的编码_linux c++ gbk->utf8

IMP-00009: 导出文件异常结束-程序员宅基地

文章浏览阅读750次。今天准备从生产库向测试库进行数据导入,结果在imp导入的时候遇到“ IMP-00009:导出文件异常结束” 错误,google一下,发现可能有如下原因导致imp的数据太大,没有写buffer和commit两个数据库字符集不同从低版本exp的dmp文件,向高版本imp导出的dmp文件出错传输dmp文件时,文件损坏解决办法:imp时指定..._imp-00009导出文件异常结束

python程序员需要深入掌握的技能_Python用数据说明程序员需要掌握的技能-程序员宅基地

文章浏览阅读143次。当下是一个大数据的时代,各个行业都离不开数据的支持。因此,网络爬虫就应运而生。网络爬虫当下最为火热的是Python,Python开发爬虫相对简单,而且功能库相当完善,力压众多开发语言。本次教程我们爬取前程无忧的招聘信息来分析Python程序员需要掌握那些编程技术。首先在谷歌浏览器打开前程无忧的首页,按F12打开浏览器的开发者工具。浏览器开发者工具是用于捕捉网站的请求信息,通过分析请求信息可以了解请..._初级python程序员能力要求

Spring @Service生成bean名称的规则(当类的名字是以两个或以上的大写字母开头的话,bean的名字会与类名保持一致)_@service beanname-程序员宅基地

文章浏览阅读7.6k次,点赞2次,收藏6次。@Service标注的bean,类名:ABDemoService查看源码后发现,原来是经过一个特殊处理:当类的名字是以两个或以上的大写字母开头的话,bean的名字会与类名保持一致public class AnnotationBeanNameGenerator implements BeanNameGenerator { private static final String C..._@service beanname

随便推点

二叉树的各种创建方法_二叉树的建立-程序员宅基地

文章浏览阅读6.9w次,点赞73次,收藏463次。1.前序创建#include<stdio.h>#include<string.h>#include<stdlib.h>#include<malloc.h>#include<iostream>#include<stack>#include<queue>using namespace std;typed_二叉树的建立

解决asp.net导出excel时中文文件名乱码_asp.net utf8 导出中文字符乱码-程序员宅基地

文章浏览阅读7.1k次。在Asp.net上使用Excel导出功能,如果文件名出现中文,便会以乱码视之。 解决方法: fileName = HttpUtility.UrlEncode(fileName, System.Text.Encoding.UTF8);_asp.net utf8 导出中文字符乱码

笔记-编译原理-实验一-词法分析器设计_对pl/0作以下修改扩充。增加单词-程序员宅基地

文章浏览阅读2.1k次,点赞4次,收藏23次。第一次实验 词法分析实验报告设计思想词法分析的主要任务是根据文法的词汇表以及对应约定的编码进行一定的识别,找出文件中所有的合法的单词,并给出一定的信息作为最后的结果,用于后续语法分析程序的使用;本实验针对 PL/0 语言 的文法、词汇表编写一个词法分析程序,对于每个单词根据词汇表输出: (单词种类, 单词的值) 二元对。词汇表:种别编码单词符号助记符0beginb..._对pl/0作以下修改扩充。增加单词

android adb shell 权限,android adb shell权限被拒绝-程序员宅基地

文章浏览阅读773次。我在使用adb.exe时遇到了麻烦.我想使用与bash相同的adb.exe shell提示符,所以我决定更改默认的bash二进制文件(当然二进制文件是交叉编译的,一切都很完美)更改bash二进制文件遵循以下顺序> adb remount> adb push bash / system / bin /> adb shell> cd / system / bin> chm..._adb shell mv 权限

投影仪-相机标定_相机-投影仪标定-程序员宅基地

文章浏览阅读6.8k次,点赞12次,收藏125次。1. 单目相机标定引言相机标定已经研究多年,标定的算法可以分为基于摄影测量的标定和自标定。其中,应用最为广泛的还是张正友标定法。这是一种简单灵活、高鲁棒性、低成本的相机标定算法。仅需要一台相机和一块平面标定板构建相机标定系统,在标定过程中,相机拍摄多个角度下(至少两个角度,推荐10~20个角度)的标定板图像(相机和标定板都可以移动),即可对相机的内外参数进行标定。下面介绍张氏标定法(以下也这么称呼)的原理。原理相机模型和单应矩阵相机标定,就是对相机的内外参数进行计算的过程,从而得到物体到图像的投影_相机-投影仪标定

Wayland架构、渲染、硬件支持-程序员宅基地

文章浏览阅读2.2k次。文章目录Wayland 架构Wayland 渲染Wayland的 硬件支持简 述: 翻译一篇关于和 wayland 有关的技术文章, 其英文标题为Wayland Architecture .Wayland 架构若是想要更好的理解 Wayland 架构及其与 X (X11 or X Window System) 结构;一种很好的方法是将事件从输入设备就开始跟踪, 查看期间所有的屏幕上出现的变化。这就是我们现在对 X 的理解。 内核是从一个输入设备中获取一个事件,并通过 evdev 输入_wayland

推荐文章

热门文章

相关标签