机器学习15种常用数学符号

机器学习15种常用数学符号

Posted by BY on June 17, 2021

1. 变量名约定

s- 斜体小写字母用做标量 (例如一个数字)

x- 粗体小写字母用做向量 (例如一个2D点)

A- 粗体大写字母用做矩阵 (例如一个3D变换)

θ- 斜体小写希腊字母用做常量和特殊变量 (例如惩罚项的权重)

2. 等号

=表示相等 (值相同)

表示不相等 (值不同)

表示约等于 (π ≈ 3.14159

:=表示定义 (A 被定义为 B)

3. 平方根与复数

一个平方根运算是这种形式:

\[(\sqrt{x})^2=x\]

也可以有多次平方运算

\[(\sqrt[n]{x})^n=(x^{\frac{1}{n}})^n=x\]

复数是\(a+b_i\)形式的表达式, 其中\(a\)是实数部分,\(b_i\)是虚数部分。虚数的定义为\(i=\sqrt{-1}\)。

4. 点与叉

·和叉×符号根据上下文的不同有不同的用法,下面我们分开讨论:

  1. 标量乘法:

两个符号都可以表示简单的标量之间的乘法。下边的写法意思相同\(5\cdot4=5\times4\)

对于非常数的标量我们可以省略符号\(3kj=3\times k\times j\)

2. 向量乘法:

表示向量和标量之间相乘,或两向量的逐元素相乘,我们不用点·或叉×符号,一般使用空心点来表示

\[3k\circ j\]

有时作者可能会显式定义一个不同的符号,例如圆中点或实心圈

3. 点乘(内积):

点符号·可用来表示两向量之间的点乘。由于其值是一个标量,通常被叫做标量积(scalar product)。

4. 叉乘(外积):

叉乘符号×可以用来表示两向量的叉乘,由于其值是一个向量,又叫做向量积。

5. 西格玛(sigma)

大写希腊字母Σ(Sigma) 用来表示总和, 换句话说就是对一些数字求和。

\(\sum_{i}^{100}{i}\)这里,i=1是说从1西格玛上边的数字100为止。这些分别为上下边界。”E” 右边的\(i\)告诉我们求和的是什么。注意这里的范围上下都是闭区间。

6. 大写Pi

大写 Pi 或“大Pi”与sigma非常接近, 不同的是我们用乘法取得一系列数字的乘积。

\[\prod _{i}^{100}{i}\]

7. 管道(pipes)

管道符号,就是竖线,根据上下文不同,可以表示不同意思。下边的是3种常见用途,绝对值、模长和行列式。

这3种特性都是描述对象的长度(length)

  1. 绝对值$$ x $$

对于数字x,|x|表示x的绝对值。

2. 欧几里得模长(Euclidean norm)

对于向量v‖v‖v的欧几里得模长,在机器学习中被称作2范数(2-norm),计算方法是向量每个元素的平方根的和再开方。

通常用双竖线表示来避免与_绝对值_ 符号混淆,但有些时候也会看见单竖线。

一般的如果右下角加一个数字\(k\),表示k阶范数,什么都不加默认2范数$$   x   _2 =   x   $$

如果右上角加一个数字\(k\)就代表范数的k次方。

3. 行列式

对于一个矩阵,对于一个矩阵A|A|表示矩阵A的行列式,也可以表示它的1范数,这两个值不相同,需要根据上下文考虑。

8. 帽子

在几何里,字母上的 “帽子” 符号用来表示一个单位向量。例如,这是向量a的单位向量。

\[\hat{a}\]

9. 属于

集合理论中,“属于”符号可以被用来描述某物是否为集合中的一个元素。例如:

\[A={3,9,14},3\epsilon A\]

这里我们有一个数字集A{ 3, 9, 14 }而且我们说3是“属于”这个集合的,一般我们使用花括号表示集合。

10. 常见数字集合

全体实数集合描述_实数(real numbers)_的集合。他们包括整数,有理数,无理数。

有理数集合(rational numbers)是可以被表示为分数,或比率(类似)的实数。有理数不能以0作分母。这意味着所有的整数都是有理数,因为可以看成分母为1。换句话说无理数就是不能表示为比率的数,例如 π (PI)。

整数(integers)是没有小数部分的实数。可为正也可以为负。

自然数(natural numbers)自然数是正整数或非负整数。取决于所学领域和上下文,集合中可能包含也可能不包含0,所以可以是下边任意一种集合。

复数是实数与虚数的组合,被视为2D平面上的一个坐标。

11. 撇号(prime)

撇号 () 通常用在变量名上,用来描述某物很类似,而不用另起个名来描述它。也可以描述经过一些变换后的“下一个值”。

对于一个函数,撇号通常描述为函数的导函数(derivative)。

使用多个撇号可以用来表示 二阶导函数(derivative)_ƒ′′_或 三阶导函数(derivative)ƒ′′′,之后更高的数字,一般作者会用罗马数字\(f^{IV}\)或上标数字\(f^{(n)}\)表示。

12. 向下取整和向上取整(floor & ceiling)

⌊x⌋⌈x⌉这种特殊的括号分别用来表示floor和ceil函数。

记住下取整是地板(floor) 那两个小横线在下面,得到的是小的值。

向上取整是天花板(ceiling)那两个小横线在上面,得到的是大的值。

13. 箭头

优势被用作表示蕴涵(material implication)逻辑。意思是如果A是true,那么B也是true。箭头可以是左右任何方向⇐⇒,也可以双向。当_A ⇒ B_并且_B ⇒ A_,就是他们是相等的A⇔B。

通常用来表示明显(significant)不相等。k≫j也可以表示k的数量级大于j。

与(conjunction)和 或(disjunction)分别表示逻辑与或操作,类似于程序员的ANDOR操作。

14. 逻辑非(logical negation)

有时候,¬,~!符号都用来表示逻辑NOT。例如,只有在A为false的时候,¬A为true。

15. 区间

有时函数会处理被一些值限定范围的实数,这样的约束可以用区间(interval)来表示。

例如我们可以表示0和1之间的数,让他们包含或不包含0和1:

  • 不包含0或1 —– (0, 1)
  • 包含0但不包含1 —– [0, 1)
  • 不包含0但包含1 —– (0, 1]
  • 包含0和1 —– [0, 1]

16.内积

定义:概括地说,向量的内积(点乘/数量积)。对两个向量执行点乘运算,就是对这两个向量对应位一一相乘之后求和的操作,如下所示,对于向量a和向量b: \(a= \left [ a_1, a_2, a_3, ... , a_n\right ] \\ b= \left [ b_1, b_2, b_3, ... , b_n\right ]\) a和b的点积公式为: \(a·b = a_1b_1 + a_2b_2 + a_3b_3+... + a_nb_n\) 这里要求一维向量a和向量b的行列数相同。注意:点乘的结果是一个标量(数量而不是向量)

定义:两个向量ab的内积为 a·b = a   b cos∠(a, b),特别地,0·a =a·0 = 0;若ab是非零向量,则ab正交的充要条件是a·b = 0。

向量内积的性质:

  1. \(a^2 ≥ 0\);当\(a^2 = 0\)时,必有a = 0. (正定性)
  2. ab = b·a. (对称性)
  3. a + μbc = λa·c + μb·c,对任意实数λ, μ成立. (线性)
  4. cos∠(a,b) =a·b/( a   b ).
  5. a·b a   b ,等号只在ab共线时成立.

向量内积的几何意义

内积(点乘)的几何意义包括:

  1. 表征或计算两个向量之间的夹角
  2. b向量在a向量方向上的投影

有公式: \(a∙b=|a||b|cos\theta\) 推导过程如下,首先看一下向量组成:

image-20210313090642039

定义向量c

c=a-b

根据三角形余弦定理(这里a、b、c均为向量,下同)有: \(c^2 = a^2+b^2-2|a||b|cos\theta\) 根据关系c=a-b有: \((a-b)∙(a-b)=a^2+b^2-2a∙b=a^2+b^2-2|a||b|cos\theta\) 即: \(a∙b=|a||b|cos\theta\) 向量a,b的长度都是可以计算的已知量,从而有a和b间的夹角θ: \(θ=arccos⁡(a∙b|a||b|)\) 进而可以进一步判断两个向量是否同一方向或正交(即垂直)等方向关系,具体对应关系为:

a∙b>0→方向基本相同,夹角在0°到90°之间 a∙b=0→ 正交,相互垂直 a∙b<0→ 方向基本相反,夹角在90°到180°之间

17.叉乘(外积)

定义:概括地说,两个向量的外积,又叫叉乘、叉积向量积,其运算结果是一个向量而不是一个标量。并且两个向量的外积与这两个向量组成的坐标平面垂直。

定义:向量ab的外积a×b是一个向量,其长度等于|a×b| = |a||b|sin∠(a,b),其方向正交于ab。并且,(a,b,a×b)构成右手系。 特别地,0×a = a×0 = 0.此外,对任意向量aa×a=0

对于向量a和向量b: \(a = (x_1,y_1,z_1)\\ b = (x_2,y_2,z_2)\) a和b的外积公式为: \(a\times b= \left | \begin{matrix} i & j & k \\ x_1 & y_1 & z_1\\ x_2 & y_2 & z_2 \end{matrix} \right | = (y_1 z_2 - y_2 z_1)i - (x_1 z_2 - x_2 z_1)j + (x_1 y_2 - x_2 y_1)k\) 其中: \(i=(1,0,0)\\j=(0,1,0)\\k=(0,0,1)\) 根据i、j、k间关系,有: \(a\times b=(y_1 z_2 - y_2 z_1, -(x_1 z_2 - x_2 z_1), x_1 y_2 - x_2 y_1)\) 向量外积的性质

  1. a × b = -b × a. (反称性)
  2. a + μb) × c = λ(a ×c) + μ(b ×c). (线性)

向量外积的几何意义

在三维几何中,向量a和向量b的外积结果是一个向量,有个更通俗易懂的叫法是法向量,该向量垂直于a和b向量构成的平面。

在3D图像学中,外积的概念非常有用,可以通过两个向量的外积,生成第三个垂直于a,b的法向量,从而构建X、Y、Z坐标系。如下图所示:

image-20210313131105622

在二维空间中,外积还有另外一个几何意义就是: a×b 在数值上等于由向量a和向量b构成的平行四边形的面积。