numpy 基础教程【清晰详细带思维导图】_numpy知识点思维导图-程序员宅基地

技术标签: python  矩阵  1024程序员节  # Python  numpy  

思维导图

https://www.processon.com/view/link/6173b84fe401fd6d2b11663b

简介

NumPy(Numerical Python)是 Python 语言的一个扩展程序库,支持大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库。如果你使用 Python 语言进行科学计算,那么一定会接触到 NumPy。

NumPy 的英文全称为 Numerical Python,意味 Python 面向数值计算的第三方库。NumPy 的特点在于,针对 Python 内建的数组类型做了扩充,支持更高维度的数组和矩阵运算,以及更丰富的数学函数。

NumPy 的应用

NumPy 通常与 SciPy(算法库)、Pandas(数据分析库)和 Matplotlib(绘图库)一起使用, 这种组合广泛用于替代 MatLab,进行数据分析或者机器学习。

知识点

  • 数值类型及多维数组
  • 数组操作及随机抽样
  • 数学函数及代数运算
  • 数组索引及其他用法

NumPy 数据类型

Python 基本数据类型

先来回顾一下 Python 本身支持的数值类型:

类型 解释
int 整形
long 长整形,仅在 Python2 中存在
float 浮点型
bool 布尔类型
complex 复数型

dtype 数据类型

而 NumPy 支持比 Python 本身更为丰富的数值类型,细分如下:

类型 解释
bool 布尔类型,1 个字节,值为 True 或 False。
int 整数类型,通常为 int64 或 int32 。
intc 与 C 里的 int 相同,通常为 int32 或 int64。
intp 用于索引,通常为 int32 或 int64。
int8 字节(从 -128 到 127)
int16 整数(从 -32768 到 32767)
int32 整数(从 -2147483648 到 2147483647)
int64 整数(从 -9223372036854775808 到 9223372036854775807)
uint8 无符号整数(从 0 到 255)
uint16 无符号整数(从 0 到 65535)
uint32 无符号整数(从 0 到 4294967295)
uint64 无符号整数(从 0 到 18446744073709551615)
float float64 的简写。
float16 半精度浮点,5 位指数,10 位尾数
float32 单精度浮点,8 位指数,23 位尾数
float64 双精度浮点,11 位指数,52 位尾数
complex complex128 的简写。
complex64 复数,由两个 32 位浮点表示。
complex128 复数,由两个 64 位浮点表示。

在 NumPy 中,上面提到的这些数值类型都被归于 dtype(data-type) 对象的实例。 我们可以用 numpy.dtype(object, align, copy) 来指定数值类型。而在数组里面,可以用 dtype= 参数。例如:

import numpy as np  # 导入 NumPy 模块

a = np.array([1.1, 2.2, 3.3], dtype=np.float64)  # 指定 1 维数组的数值类型为 float64
a, a.dtype  # 查看 a 及 dtype 类型
(array([1.1, 2.2, 3.3]), dtype('float64'))

可以使用 .astype() 方法在不同的数值类型之间相互转换。

# 将 a 的数值类型从 float64 转换为 int,并查看 dtype 类型
a.astype(int).dtype
dtype('int64')

ndarray 数组类型

在 Python 内建对象中,数组有三种形式:

  • 列表:[1, 2, 3]
  • 元组:(1, 2, 3, 4, 5)
  • 字典:{A:1, B:2}

其中,元组与列表相似,不同之处在于元组的元素不能修改。而字典由键和值构成。python 标准类针对数组的处理局限于 1 维,并仅提供少量的功能。

而 NumPy 最核心且最重要的一个特性就是 ndarray 多维数组对象,它区别于 Python 的标准类,拥有对高维数组的处理能力,这也是数值计算过程中缺一不可的重要特性。

NumPy 中,ndarray 类具有六个参数,它们分别为:

  • shape:数组的形状。
  • dtype:数据类型。
  • buffer:对象暴露缓冲区接口。
  • offset:数组数据的偏移量。
  • strides:数据步长。
  • order{'C','F'},以行或列为主排列顺序。

下面,我们来了解创建 NumPy 多维数组的一些方法。在 NumPy 中,我们主要通过以下 5 种途径创建数组,它们分别是:

  • 从 Python 数组结构列表,元组等转换。
  • 使用 np.arangenp.onesnp.zeros 等 NumPy 原生方法。
  • 从存储空间读取数组。
  • 通过使用字符串或缓冲区从原始字节创建数组。
  • 使用特殊函数,如 random

创建 ndarray

创建 ndarray 类型的方法有多,我们下面说一下最常用的几种:

使用 Python 类型创建 ndarray

在 NumPy 中,我们使用 numpy.array 将列表或元组转换为 ndarray 数组。其方法为:

numpy.array(object, dtype=None, copy=True, order=None, subok=False, ndmin=0)

其中,参数:

  • object:列表、元组等。
  • dtype:数据类型。如果未给出,则类型为被保存对象所需的最小类型。
  • copy:布尔类型,默认 True,表示复制对象。
  • orde
  • r:顺序。
  • subok:布尔类型,表示子类是否被传递。
  • ndmin:生成的数组应具有的最小维数。

下面,通过列表和元组创建一个 ndarray 数组。

np.array([[1, 2, 3], [4, 5, 6]])
array([[1, 2, 3],
       [4, 5, 6]])
# 列表和元组结合也可以
np.array([(1, 2), (3, 4), (5, 6)])
array([[1, 2],
       [3, 4],
       [5, 6]])

arange 方法创建

除了直接使用 array 方法创建 ndarray,在 NumPy 中还有一些方法可以创建一些有规律性的多维数。首先,我们来看一看 arange()arange() 的功能是在给定区间内创建一系列均匀间隔的值。方法如下:

numpy.arange(start, stop, step, dtype=None)

你需要先设置值所在的区间 [开始, 停止),这是一个半开半闭区间。然后,在设置 step 步长用于设置值之间的间隔。最后的可选参数 dtype 可以设置返回 ndarray 的值类型。

# 在区间 [3, 7) 中以 0.5 为步长新建数组
np.arange(3, 7, 0.5, dtype='float32')
array([3. , 3.5, 4. , 4.5, 5. , 5.5, 6. , 6.5], dtype=float32)

linspace 方法创建

linspace 方法也可以像 arange 方法一样,创建数值有规律的数组。linspace 用于在指定的区间内返回间隔均匀的值。其方法如下:

numpy.linspace(start, stop, num=50, endpoint=True, retstep=False, dtype=None)
  • start:序列的起始值。
  • stop:序列的结束值。
  • num:生成的样本数。默认值为 50。
  • endpoint:布尔值,如果为真,则最后一个样本包含在序列内。
  • retstep:布尔值,如果为真,返回间距。
  • dtype:数组的类型。
# 在0~10之间生成等间隔的10个数
np.linspace(0, 10, 10, endpoint=True)
array([ 0.        ,  1.11111111,  2.22222222,  3.33333333,  4.44444444,
        5.55555556,  6.66666667,  7.77777778,  8.88888889, 10.        ])

endpoint 参数改成 False 看看区别:

np.linspace(0, 10, 10, endpoint=False)
array([0., 1., 2., 3., 4., 5., 6., 7., 8., 9.])

ones 方法创建

numpy.ones 用于快速创建数值全部为 1 的多维数组。其方法如下:

numpy.ones(shape, dtype=None, order='C')

其中:

  • shape:用于指定数组形状,例如(1, 2)或 3。
  • dtype:数据类型。
  • order{'C','F'},按行或列方式储存数组。
# 生成的数据为 1. 是因为默认 dtype 为 float
np.ones((2, 3))
array([[1., 1., 1.],
       [1., 1., 1.]])

zeros 方法创建

zeros 方法和上面的 ones 方法非常相似,不同的地方在于,这里全部填充为 0zeros 方法和 ones 是一致的。

np.zeros((3, 2))
array([[0., 0.],
       [0., 0.],
       [0., 0.]])

eye 方法创建

numpy.eye 用于创建一个二维数组,其特点是 k 对角线上的值为 1,其余值全部为 0,可以理解为单位矩阵。方法如下:

numpy.eye(N, M=None, k=0, dtype=<type 'float'>)

其中:

  • N:输出数组的行数。
  • M:输出数组的列数。
  • k:对角线索引:0(默认)是指主对角线,正值是指上对角线,负值是指下对角线。
np.eye(5, 4)
array([[1., 0., 0., 0.],
       [0., 1., 0., 0.],
       [0., 0., 1., 0.],
       [0., 0., 0., 1.],
       [0., 0., 0., 0.]])

从已知数据创建

还可以从已知数据文件、函数中创建 ndarray。NumPy 提供了下面 5 个方法:

  • frombuffer(buffer):将缓冲区转换为 1 维数组。
  • fromfile(file,dtype,count,sep):从文本或二进制文件中构建多维数组。
  • fromfunction(function,shape):通过函数返回值来创建多维数组。
  • fromiter(iterable,dtype,count):从可迭代对象创建 1 维数组。
  • fromstring(string,dtype,count,sep):从字符串中创建 1 维数组。
# 构建一个 lambda 表达式测试一下
np.fromfunction(lambda a, b: a + b, (5, 4))
array([[0., 1., 2., 3.],
       [1., 2., 3., 4.],
       [2., 3., 4., 5.],
       [3., 4., 5., 6.],
       [4., 5., 6., 7.]])		

ndarray 数组属性

首先,我们创建一个 ndarray 数组,首先,新建 a 并随意设定为一个 2 维数组。

a = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
a  # 查看 a 的值
array([[1, 2, 3],
       [4, 5, 6],
       [7, 8, 9]])

ndarray.T 用于数组的转置,与 .transpose() 相同。

a.T
array([[1, 4, 7],
       [2, 5, 8],
       [3, 6, 9]])

ndarray.dtype 用来输出数组包含元素的数据类型。

a.dtype
dtype('int64')

ndarray.imag 用来输出数组包含元素的虚部。

a.imag
array([[0, 0, 0],
       [0, 0, 0],
       [0, 0, 0]])

ndarray.real 用来输出数组包含元素的实部。

a.real
array([[1, 2, 3],
       [4, 5, 6],
       [7, 8, 9]])

ndarray.size 用来输出数组中的总包含元素数。

a.size
9

ndarray.itemsize 输出一个数组元素的字节数。

a.itemsize
8

ndarray.nbytes 用来输出数组的元素总字节数。

a.nbytes
72

ndarray.ndim 用来输出数组维度。

a.ndim
2

ndarray.shape 用来输出数组形状。

a.shape
(3, 3)

ndarray.strides 用来遍历数组时,输出每个维度中步进的字节数组。

a.strides
(24, 8)

数组维度和形状

在很多问题中,首先要搞清楚 NumPy 数组的维度和形状非常重要,NumPy 数组又被称之为 ndarray 多维数组,那么 n 就可以从 1 维依次递增。下图,我们展示了 1 至 3 维的 NumPy 数组示例。

1 维数组可以被看作数学中的向量,2 维数组可以看作是矩阵,而 3 维数组则是一个数据立方。

one = np.array([7, 2, 9, 10])
two = np.array([[5.2, 3.0, 4.5],
                [9.1, 0.1, 0.3]])
three = np.array([[[1, 1], [1, 1], [1, 1]],
                  [[1, 1], [1, 1], [1, 1]],
                  [[1, 1], [1, 1], [1, 1]],
                  [[1, 1], [1, 1], [1, 1]]])

接下来,我们通过 .shape 属性查看 NumPy 数组的形状。

one.shape, two.shape, three.shape
((4,), (2, 3), (4, 3, 2))

数组基本操作

至此,我们了解了如何利用 NumPy 创建各式各样的 ndarray,以及数组形状和维度的概念。接下来,我们将利用学会针对 ndarray 的各种操作技巧。

重设形状

reshape 可以在不改变数组数据的同时,改变数组的形状。其中,numpy.reshape() 等效于 ndarray.reshape()reshape 方法非常简单:

numpy.reshape(a, newshape)

其中,a 表示原数组,newshape 用于指定新的形状(整数或者元组)。

a = np.arange(10).reshape((2, 5))
a
array([[0, 1, 2, 3, 4],
       [5, 6, 7, 8, 9]])

数组展开

ravel 的目的是将任意形状的数组扁平化,变为 1 维数组ravel 方法如下:

numpy.ravel(a, order='C')

其中,a 表示需要处理的数组。order 表示变换时的读取顺序,默认是按照行依次读取,当 order='F' 时,可以按列依次读取排序。

a.ravel(order='F')
array([0, 5, 1, 6, 2, 7, 3, 8, 4, 9])

轴移动

moveaxis 可以将数组的轴移动到新的位置。其方法如下:

numpy.moveaxis(a, source, destination)

其中:

  • a:数组。
  • source:要移动的轴的原始位置。
  • destination:要移动的轴的目标位置。

我们可以输出二者的 shape 属性来对比一下发生了什么变化:

a = np.ones((1, 2, 3))
a.shape, np.moveaxis(a, 0, -1).shape
((1, 2, 3), (2, 3, 1))

可以看到主轴(可以理解为第一个维度),从 1 变成了 2

轴交换

moveaxis 不同的是,swapaxes 可以用来交换数组的轴。其方法如下:

numpy.swapaxes(a, axis1, axis2)

其中:

  • a:数组。
  • axis1:需要交换的轴 1 位置。
  • axis2:需要与轴 1 交换位置的轴 1 位置。
a = np.ones((1, 4, 3))
a.shape, np.swapaxes(a, 0, 2).shape
((1, 4, 3), (3, 4, 1))

可以看到 13 交换了顺序

数组转置

transpose 类似于矩阵的转置,但可以任选维度,例如它可以将 2 维数组的横轴和纵轴交换:

numpy.transpose(a, axes=None)
  • a:数组。
  • axis:该值默认为 none,表示转置。如果有值,那么则按照值替换轴。
a = np.arange(4).reshape(2, 2)
np.transpose(a)
array([[0, 2],
       [1, 3]])

首先是对这个 shape 的理解。直观地说, shape 中的各个数就是对应 axis 的元素个数 。比如说上图中的 x,它画出来会是这个样子的:


字比画还丑呢……

如果我们换一种思路的话,以 axis=0 为例,由于我们现在整个数组里面一共有 24 个数,而 axis=0 只有两个元素,所以可以理解为 在 axis=0 这个 axis 上,每隔 24 / 2 = 12 个数就跳一下 。比如说上面这个图中就可以看出,两个橙色矩阵对应的数之间差的都是 12

类似的,由于一个橙色矩阵中只有 24 / 2 = 12 个数,所以我们可以理解为 在 axis=1 这个 axis 上,每隔 12 / 3 = 4 个数就跳一下 。表现在图中,就是同一个橙色矩阵的两个相邻的蓝色向量对应的数之间差的都是 4

再次类似的,由于一个蓝色向量中只有 12 / 3 = 4 个数,我们可以理解为 在 axis=2 这个 axis 上,每隔 4 / 4 = 1 个数就跳一下 。表现在图中……观众老爷们想必也知道是怎样的了 ( σ’ω’)σ

所以我们现在可以定义一个新的东西,比如说叫做 strides 吧,它记录着每个 axis 上跳过的数。比如说上图对应的三维数组,它的 strides 就是 (12, 4, 1)

那么接下来激动人心的时刻到了: transpose 的本质,其实就是对 strides 中各个数的顺序进行调换 。举个例子:

在 transpose(1, 0, 2) 后,相应的 strides 会变成 (4, 12, 1)。而从上图可以看出,transpose 的结果确实满足:

  • axis=0 的 axis 上,每隔 4 个数跳一下
  • axis=1 的 axis 上,每隔 12 个数跳一下
  • axis=2 的 axis 上,每隔 1 个数跳一下

️具体介绍可以参见这篇文章

维度改变

atleast_xd 支持将输入数据的维度直接视为 x 维。这里的 x1,2,3。方法分别为:

numpy.atleast_1d()
numpy.atleast_2d()
numpy.atleast_3d()
print(np.atleast_1d([1, 2, 3]))
print(np.atleast_2d([4, 5, 6]))
print(np.atleast_3d([7, 8, 9]))
[1 2 3]
[[4 5 6]]
[[[7]
  [8]
  [9]]]

类型转换

在 NumPy 中,还有一系列以 as 开头的方法,它们可以将特定输入转换为数组,亦可将数组转换为矩阵、标量、ndarray 等。如下:

  • asarray(a,dtype,order):将特定输入转换为数组。
  • asanyarray(a,dtype,order):将特定输入转换为 ndarray
  • asmatrix(data,dtype):将特定输入转换为矩阵。
  • asfarray(a,dtype):将特定输入转换为 float 类型的数组。
  • asarray_chkfinite(a,dtype,order):将特定输入转换为数组,检查 NaNinfs
  • asscalar(a):将大小为 1 的数组转换为标量。

这里以 asmatrix(data,dtype) 方法举例:

a = np.arange(4).reshape(2, 2)
np.asmatrix(a)  # 将二维数组转化为矩阵类型
matrix([[0, 1],
        [2, 3]])

数组连接

concatenate 可以将多个数组沿指定轴连接在一起。其方法为:

numpy.concatenate((a1, a2, ...), axis=0)
  • (a1, a2, ...):需要连接的数组。
  • axis:指定连接轴。
a = np.array([[1, 2], [3, 4], [5, 6]])
b = np.array([[7, 8], [9, 10]])
c = np.array([[11, 12]])

np.concatenate((a, b, c), axis=0) # 默认纵轴连接
array([[ 1,  2],
       [ 3,  4],
       [ 5,  6],
       [ 7,  8],
       [ 9, 10],
       [11, 12]])

还可以尝试沿着横轴连接,但要保证连接处的维数一致,所以这里用到了 .T 转置。

a = np.array([[1, 2], [3, 4], [5, 6]])
b = np.array([[7, 8, 9]])

np.concatenate((a, b.T), axis=1)
array([[1, 2, 7],
       [3, 4, 8],
       [5, 6, 9]])

数组堆叠

在 NumPy 中,以下方法可用于数组的堆叠:

  • stack(arrays,axis):沿着新轴连接数组的序列。
  • column_stack():将 1 维数组作为列堆叠到 2 维数组中。
  • hstack():按水平方向堆叠数组。
  • vstack():按垂直方向堆叠数组。
  • dstack():按深度方向堆叠数组。

stack(arrays,axis) 方法举例:

a = np.array([1, 2, 3])
b = np.array([4, 5, 6])
np.stack((a, b)) # 默认 axis=0
array([[1, 2, 3],
       [4, 5, 6]])

️ 注意:堆叠和连接是不一样的,连接是在维度对应时连成一个,堆叠就只是直接堆在一起

数组拆分

split 及与之相似的一系列方法主要是用于数组的拆分,列举如下:

  • split(ary,indices_or_sections,axis):将数组拆分为多个子数组。
  • dsplit(ary,indices_or_sections):按深度方向将数组拆分成多个子数组。
  • hsplit(ary,indices_or_sections):按水平方向将数组拆分成多个子数组。
  • vsplit(ary,indices_or_sections):按垂直方向将数组拆分成多个子数组。

看一下 split 的效果:

a = np.arange(10)
np.split(a, 5)
[array([0, 1]), array([2, 3]), array([4, 5]), array([6, 7]), array([8, 9])]

除了 1 维数组,更高维度也是可以直接拆分的。例如,我们可以将下面的数组按行拆分为 2。

a = np.arange(10).reshape(2, 5)
np.split(a, 2)
[array([[0, 1, 2, 3, 4]]), array([[5, 6, 7, 8, 9]])]

数组删除

delete(arr,obj,axis):沿特定轴删除数组中的子数组。

a = np.arange(12).reshape(3, 4)
np.delete(a, 2, axis=1) #删除 a 的横轴的第三列
array([[ 0,  1,  3],
       [ 4,  5,  7],
       [ 8,  9, 11]])

数组插入

再看一看 insert 插入,用法和 delete 很相似,只是需要在第三个参数位置设置需要插入的数组对象:

insert(arr,obj,values,axis):依据索引在特定轴之前插入值。

a = np.arange(12).reshape(3, 4)
b = np.arange(4)

np.insert(a, 2, b, axis=0)
array([[ 0,  1,  2,  3],
       [ 4,  5,  6,  7],
       [ 0,  1,  2,  3],
       [ 8,  9, 10, 11]])

数组附加

append 的用法也非常简单。只需要设置好需要附加的值和轴位置就好了。它其实相当于只能在末尾插入的 insert,所以少了一个指定索引的参数。

append(arr,values,axis):将值附加到数组的末尾,并返回 1 维数组。

a = np.arange(6).reshape(2, 3)
b = np.arange(3)

np.append(a, b)
array([0, 1, 2, 3, 4, 5, 0, 1, 2])

️ 注意: append 方法返回值,默认是展平状态下的 1 维数组。

重设尺寸

resize(a,new_shape):对数组尺寸进行重新设定。

a = np.arange(10)
a.resize(2, 5)
a
array([[0, 1, 2, 3, 4],
       [5, 6, 7, 8, 9]])
resize 和 reshpe 的区别

resizereshape 一样,都是改变数组原有的形状。区别在于是否影响原数组reshape 在改变形状时,不会影响原数组,相当于对原数组做了一份拷贝,而 resize 则是对原数组执行操作。

翻转数组

在 NumPy 中,我们还可以对数组进行翻转操作

  • fliplr(m):左右翻转数组。
  • flipud(m):上下翻转数组。
a = np.arange(16).reshape(4, 4)
print(a)
print(np.fliplr(a))
print(np.flipud(a))
[[ 0  1  2  3]
 [ 4  5  6  7]
 [ 8  9 10 11]
 [12 13 14 15]]
[[ 3  2  1  0]
 [ 7  6  5  4]
 [11 10  9  8]
 [15 14 13 12]]
[[12 13 14 15]
 [ 8  9 10 11]
 [ 4  5  6  7]
 [ 0  1  2  3]]

数组索引和切片

我们已经明确了,Ndarray 是 NumPy 的组成核心,那么对于 NumPy 的多维数组,其实它完整集成了 Python 对于数组的索引语法 array[obj]。随着 obj 的不同,我们可以实现字段访问数组切片、以及其他高级索引功能。

数组索引

我们可以通过索引值(从 0 开始)来访问 Ndarray 中的特定位置元素。NumPy 中的索引和 Python 对 list 索引的方式非常相似,但又有所不同:

一维数组索引

取一维数据的索引和 list 一样:

a = np.arange(10)
a[1]
1

分别获取索引值为 1,2,3 的数据:

a[[1, 2, 3]] # 多加一层 [] 使用逗号隔开
array([1, 2, 3])
二维数组索引

二维数组获取索引值和一维不太一样,例如获取第 2 行,第 3 列的数据:

a = np.arange(20).reshape(4, 5)
a
array([[ 0,  1,  2,  3,  4],
       [ 5,  6,  7,  8,  9],
       [10, 11, 12, 13, 14],
       [15, 16, 17, 18, 19]])
a[1, 2] # 不加 [],直接使用逗号隔开
7

回顾一下,Python 中 list 索引 2 维数据的方法写法是 a[1][2],可以看到还是有点区别的。

而访问二维 Ndarray 中的多个元素值,使用逗号 , 分割 []

a[[1, 2], [3, 4]]
array([ 8, 14])

️tips:这里需要注意索引的对应关系。我们实际获取的是 [1, 3],也就是第 2 行和第 4 列对于的值 8。以及 [2, 4],也就是第 3 行和第 5 列对应的值 14

更高维的数组索引访问方法同理,多一层维度就加一级 [],使用 , 分割。

数组切片

NumPy 里面针对 Ndarray 的数组切片和 Python 里的 list 切片操作是一样的。其语法为:

Ndarray[start:stop:step]

[start:stop:step] 分别代表 [起始索引:截至索引:步长]

一维数组切片

对于一维数组:

a = np.arange(10)
a
array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
a[:5] # 默认左边从 0 开始,左闭右开
array([0, 1, 2, 3, 4])
a[5:] # 默认右边以最后一个结尾
array([5, 6, 7, 8, 9])
a[0:10:2] # 步长为2
array([0, 2, 4, 6, 8])
多维数组切片

对于多维数组,我们只需要用逗号 , 分割不同维度即可

a = np.arange(20).reshape(4, 5)
a
array([[ 0,  1,  2,  3,  4],
       [ 5,  6,  7,  8,  9],
       [10, 11, 12, 13, 14],
       [15, 16, 17, 18, 19]])

先取第 3,4 列(第一个维度),再取第 1,2,3 行(第二个维度)

a[0:3, 2:4] # 索引左闭右开
array([[ 2,  3],
       [ 7,  8],
       [12, 13]])

按步长为 2 取所有列和所有行的数据:

a[:, ::2]
array([[ 0,  2,  4],
       [ 5,  7,  9],
       [10, 12, 14],
       [15, 17, 19]])

更高维度的数组切片方法同理。

排序

可以使用 numpy.sort 方法对多维数组元素进行排序。其方法为:

numpy.sort(a, axis=-1, kind='quicksort', order=None)
  • a:数组。
  • axis要排序的轴。如果为 None,则在排序之前将数组铺平。默认值为 -1,沿最后一个轴排序。
  • kind{'quicksort','mergesort','heapsort'},排序算法。默认值为 quicksort

举个例子:

a = np.random.rand(20).reshape(4, 5)
a
array([[0.42730855, 0.3707029 , 0.7951701 , 0.57635449, 0.70399597],
       [0.41361828, 0.92518352, 0.50688757, 0.70157403, 0.28341615],
       [0.30372563, 0.48427295, 0.82747163, 0.73657111, 0.09485095],
       [0.24964126, 0.59232013, 0.75616743, 0.59185575, 0.35684219]])
np.sort(a) # 可以看到每行都是有序的
array([[0.3707029 , 0.42730855, 0.57635449, 0.70399597, 0.7951701 ],
       [0.28341615, 0.41361828, 0.50688757, 0.70157403, 0.92518352],
       [0.09485095, 0.30372563, 0.48427295, 0.73657111, 0.82747163],
       [0.24964126, 0.35684219, 0.59185575, 0.59232013, 0.75616743]])

除了 numpy.sort,还有这样一些对数组进行排序的方法:

  • numpy.lexsort(keys ,axis):使用多个键进行间接排序。
  • numpy.argsort(a ,axis,kind,order):沿给定轴执行间接排序。
  • numpy.msort(a):沿第 1 个轴排序。
  • numpy.sort_complex(a):针对复数排序。

搜索和计数

可以通过下面这些方法对数组中元素进行搜索和计数。列举如下:

  • argmax(a ,axis,out):返回数组中指定轴的最大值的索引。
  • nanargmax(a ,axis):返回数组中指定轴的最大值的索引,忽略 NaN。
  • argmin(a ,axis,out):返回数组中指定轴的最小值的索引。
  • nanargmin(a ,axis):返回数组中指定轴的最小值的索引,忽略 NaN。
  • argwhere(a):返回数组中非 0 元素的索引,按元素分组。
  • nonzero(a):返回数组中非 0 元素的索引。
  • flatnonzero(a):返回数组中非 0 元素的索引,并铺平。
  • where(条件,x,y):根据指定条件,从指定行、列返回元素。
  • searchsorted(a,v ,side,sorter):查找要插入元素以维持顺序的索引。
  • extract(condition,arr):返回满足某些条件的数组的元素。
  • count_nonzero(a):计算数组中非 0 元素的数量。

选取其中的一些方法举例:

a = np.random.randint(0, 10, 20) # 在 [0,10) 之间生成 20 个随机数
a
array([9, 2, 0, 5, 2, 4, 2, 0, 0, 0, 0, 7, 3, 6, 8, 1, 9, 1, 0, 3])
np.argmax(a)
0
np.nonzero(a)
(array([ 0,  1,  3,  4,  5,  6, 11, 12, 13, 14, 15, 16, 17, 19]),)
np.count_nonzero(a)
14

NumPy 随机数

NumPy 的随机数功能非常强大,主要由 numpy.random 模块完成,主要由一下这些方法完成基本的需求:

random.rand

numpy.random.rand(d0, d1, ..., dn) 方法的作用为:指定一个给定维度的数组((d0, d1, ..., dn) 就是维度),并使用 [0, 1) 区间随机数据填充,这些数据均匀分布

np.random.rand(2, 5)
array([[0.88867317, 0.84106629, 0.21903397, 0.75543074, 0.3367696 ],
       [0.33277929, 0.54021989, 0.86312003, 0.26351348, 0.79697483]])

random.randn

numpy.random.randn(d0, d1, ..., dn)numpy.random.rand(d0, d1, ..., dn) 的区别在于,randn 是从标准正态分布中返回一个或多个样本值,而 rand均匀分布

np.random.randn(1, 10)
array([[-0.18168975,  0.72013264,  0.85528531,  0.54410705, -0.01004868,
        -0.1124093 , -0.69805996,  0.12287924,  1.96541871,  0.34170891]])

random.randint

randint(low, high, size, dtype) 方法将会生成 [low, high) 的随机整数。注意这是一个半开半闭区间。

np.random.randint(2, 5, 10)
array([4, 2, 2, 2, 3, 4, 4, 4, 3, 3])

random.random_sample

random_sample(size) 方法将会在 [0, 1) 区间内生成指定 size 的随机浮点数。

np.random.random_sample([10])
array([0.97139033, 0.83173244, 0.54727373, 0.63702118, 0.60155771,
       0.3040471 , 0.95180472, 0.90646942, 0.58240337, 0.10323474])

numpy.random.random_sample 类似的方法还有:

  • numpy.random.random([size])
  • numpy.random.ranf([size])
  • numpy.random.sample([size])

它们 4 个的效果都差不多。

random.choice

choice(a, size, replace, p) 方法将会从给定的数组里随机抽取几个值,该方法类似于随机抽样

np.random.choice(10, 5) # 在 0~9 中随机抽取5个数
array([4, 1, 2, 2, 6])

概率密度分布

除了上面介绍的 6 种随机数生成方法,NumPy 还提供了大量的满足特定概率密度分布的样本生成方法。它们的使用方法和上面非常相似,这里就不再一一介绍了,用到的时候再学习一下就可以。列举如下:

  • numpy.random.beta(a,b,size):从 Beta 分布中生成随机数。

  • numpy.random.binomial(n, p, size):从二项分布中生成随机数。

  • numpy.random.chisquare(df,size):从卡方分布中生成随机数。

  • numpy.random.dirichlet(alpha,size):从 Dirichlet 分布中生成随机数。

  • numpy.random.exponential(scale,size):从指数分布中生成随机数。

  • numpy.random.f(dfnum,dfden,size):从 F 分布中生成随机数。

  • numpy.random.gamma(shape,scale,size):从 Gamma 分布中生成随机数。

  • numpy.random.geometric(p,size):从几何分布中生成随机数。

  • numpy.random.gumbel(loc,scale,size):从 Gumbel 分布中生成随机数。

  • numpy.random.hypergeometric(ngood, nbad, nsample, size):从超几何分布中生成随机数。

  • numpy.random.laplace(loc,scale,size):从拉普拉斯双指数分布中生成随机数。

  • numpy.random.logistic(loc,scale,size):从逻辑分布中生成随机数。

  • numpy.random.lognormal(mean,sigma,size):从对数正态分布中生成随机数。

  • numpy.random.logseries(p,size):从对数系列分布中生成随机数。

  • numpy.random.multinomial(n,pvals,size):从多项分布中生成随机数。

  • numpy.random.multivariate_normal(mean, cov, size):从多变量正态分布绘制随机样本。

  • numpy.random.negative_binomial(n, p, size):从负二项分布中生成随机数。

  • numpy.random.noncentral_chisquare(df,nonc,size):从非中心卡方分布中生成随机数。

  • numpy.random.noncentral_f(dfnum, dfden, nonc, size):从非中心 F 分布中抽取样本。

  • numpy.random.normal(loc,scale,size):从正态分布绘制随机样本。

  • numpy.random.pareto(a,size):从具有指定形状的 Pareto II 或 Lomax 分布中生成随机数。

  • numpy.random.poisson(lam,size):从泊松分布中生成随机数。

  • numpy.random.power(a,size):从具有正指数 a-1 的功率分布中在 0,1 中生成随机数。

  • numpy.random.rayleigh(scale,size):从瑞利分布中生成随机数。

  • numpy.random.standard_cauchy(size):从标准 Cauchy 分布中生成随机数。

  • numpy.random.standard_exponential(size):从标准指数分布中生成随机数。

  • numpy.random.standard_gamma(shape,size):从标准 Gamma 分布中生成随机数。

  • numpy.random.standard_normal(size):从标准正态分布中生成随机数。

  • numpy.random.standard_t(df,size):从具有 df 自由度的标准学生 t 分布中生成随机数。

  • numpy.random.triangular(left,mode,right,size):从三角分布中生成随机数。

  • numpy.random.uniform(low,high,size):从均匀分布中生成随机数。

  • numpy.random.vonmises(mu,kappa,size):从 von Mises 分布中生成随机数。

  • numpy.random.wald(mean,scale,size):从 Wald 或反高斯分布中生成随机数。

  • numpy.random.weibull(a,size):从威布尔分布中生成随机数。

  • numpy.random.zipf(a,size):从 Zipf 分布中生成随机数。

数学函数

Python 自带的运算符只能完成一些些几处的运算,如果要完成更加复杂一些的数学计算,就会显得捉襟见肘了,NumPy 为我们提供了更多的数学函数,以帮助我们更好地完成一些数值计算。

三角函数

首先, 看一看 NumPy 提供的三角函数功能。这些方法有:

  • numpy.sin(x):三角正弦。

  • numpy.cos(x):三角余弦。

  • numpy.tan(x):三角正切。

  • numpy.arcsin(x):三角反正弦。

  • numpy.arccos(x):三角反余弦。

  • numpy.arctan(x):三角反正切。

  • numpy.hypot(x1,x2):直角三角形求斜边。

  • numpy.degrees(x):弧度转换为度。

  • numpy.radians(x):度转换为弧度。

  • numpy.deg2rad(x):度转换为弧度。

  • numpy.rad2deg(x):弧度转换为度。

比如,我们可以用上面提到的 numpy.rad2deg(x) 将弧度转换为度。

np.rad2deg(np.pi)
180.0

双曲函数

在数学中,双曲函数是一类与常见的三角函数类似的函数。双曲函数经常出现于某些重要的线性微分方程的解中,使用 NumPy 计算它们的方法为:

  • numpy.sinh(x):双曲正弦。
  • numpy.cosh(x):双曲余弦。
  • numpy.tanh(x):双曲正切。
  • numpy.arcsinh(x):反双曲正弦。
  • numpy.arccosh(x):反双曲余弦。
  • numpy.arctanh(x):反双曲正切。

数值修约

数值修约,又称数字修约, 是指在进行具体的数字运算前,按照一定的规则确定一致的位数,然后舍去某些数字后面多余的尾数的过程。
比如,我们常听到的「4 舍 5 入」就属于数值修约中的一种

  • numpy.around(a):平均到给定的小数位数。
  • numpy.round_(a):将数组舍入到给定的小数位数。
  • numpy.rint(x):修约到最接近的整数。
  • numpy.fix(x, y):向 0 舍入到最接近的整数。
  • numpy.floor(x):返回输入的底部(标量 x 的底部是最大的整数 i)。
  • numpy.ceil(x):返回输入的上限(标量 x 的底部是最小的整数 i).
  • numpy.trunc(x):返回输入的截断值。

随机选择几个浮点数,看一看上面方法的区别。

a = np.random.randn(5)
a
array([-0.21022354,  0.36623749,  0.22474084,  0.15033514,  0.00386177])
np.around(a, 2) # 保留 2 位小数
array([-0.21,  0.37,  0.22,  0.15,  0.  ])
np.rint(a)
array([-0.,  0.,  0.,  0.,  0.])

求和、求积、差分

这些方法非常常用,可以用于数组(也就是向量)间的数学操作。

  • numpy.prod(a, axis, dtype, keepdims):返回指定轴上的数组元素的乘积。
  • numpy.sum(a, axis, dtype, keepdims):返回指定轴上的数组元素的总和。
  • numpy.nanprod(a, axis, dtype, keepdims):返回指定轴上的数组元素的乘积, 将 NaN 视作 1。
  • numpy.nansum(a, axis, dtype, keepdims):返回指定轴上的数组元素的总和, 将 NaN 视作 0。
  • numpy.cumprod(a, axis, dtype):返回沿给定轴的元素的累积乘积。
  • numpy.cumsum(a, axis, dtype):返回沿给定轴的元素的累积总和。
  • numpy.nancumprod(a, axis, dtype):返回沿给定轴的元素的累积乘积, 将 NaN 视作 1。
  • numpy.nancumsum(a, axis, dtype):返回沿给定轴的元素的累积总和, 将 NaN 视作 0。
  • numpy.diff(a, n, axis):计算沿指定轴的第 n 个离散差分。
  • numpy.ediff1d(ary, to_end, to_begin):数组的连续元素之间的差异。
  • numpy.gradient(f):返回 N 维数组的梯度。
  • numpy.cross(a, b, axisa, axisb, axisc, axis):返回两个(数组)向量的叉积。
  • numpy.trapz(y, x, dx, axis):使用复合梯形规则沿给定轴积分。

指数和对数

如果你需要进行指数或者对数求解,可以用到以下这些方法。

  • numpy.exp(x):计算输入数组中所有元素的指数。
  • numpy.log(x):计算自然对数。
  • numpy.log10(x):计算常用对数。
  • numpy.log2(x):计算二进制对数。

算术运算

NumPy 也提供了一些用于算术运算的方法,使用起来会比 Python 提供的运算符灵活一些,主要是可以直接针对数组

  • numpy.add(x1, x2):对应元素相加。
  • numpy.reciprocal(x):求倒数 1/x。
  • numpy.negative(x):求对应负数。
  • numpy.multiply(x1, x2):求解乘法。
  • numpy.divide(x1, x2):相除 x1/x2。
  • numpy.power(x1, x2):类似于 x1^x2。
  • numpy.subtract(x1, x2):减法。
  • numpy.fmod(x1, x2):返回除法的元素余项。
  • numpy.mod(x1, x2):返回余项。
  • numpy.modf(x1):返回数组的小数和整数部分。
  • numpy.remainder(x1, x2):返回除法余数。

矩阵和向量积

求解向量、矩阵、张量的点积等同样是 NumPy 非常强大的地方。

  • numpy.dot(a, b):求解两个数组的点积。
  • numpy.vdot(a, b):求解两个向量的点积。
  • numpy.inner(a, b):求解两个数组的内积。
  • numpy.outer(a, b):求解两个向量的外积。
  • numpy.matmul(a, b):求解两个数组的矩阵乘积。
  • numpy.tensordot(a, b):求解张量点积。
  • numpy.kron(a, b):计算 Kronecker 乘积。
a = np.matrix([[1, 2, 3], [4, 5, 6]])
b = np.matrix([[2, 2], [3, 3], [4, 4]])
np.matmul(a, b)
matrix([[20, 20],
        [47, 47]])

其他数学运算的方法

除了上面这些归好类别的方法,NumPy 中还有一些用于数学运算的方法,归纳如下:

  • numpy.angle(z, deg):返回复参数的角度。
  • numpy.real(val):返回数组元素的实部。
  • numpy.imag(val):返回数组元素的虚部。
  • numpy.conj(x):按元素方式返回共轭复数。
  • numpy.convolve(a, v, mode):返回线性卷积。
  • numpy.sqrt(x):平方根。
  • numpy.cbrt(x):立方根。
  • numpy.square(x):平方。
  • numpy.absolute(x):绝对值, 可求解复数。
  • numpy.fabs(x):绝对值。
  • numpy.sign(x):符号函数。
  • numpy.maximum(x1, x2):最大值。
  • numpy.minimum(x1, x2):最小值。
  • numpy.nan_to_num(x):用 0 替换 NaN。
  • numpy.interp(x, xp, fp, left, right, period):线性插值。

代数运算

上面,我们分为 8 个类别,介绍了 NumPy 中常用到的数学函数。这些方法让复杂的计算过程表达更为简单。除此之外,NumPy 中还包含一些代数运算的方法,尤其是涉及到矩阵的计算方法,求解特征值、特征向量、逆矩阵等,非常方便。

  • numpy.linalg.cholesky(a):Cholesky 分解。
  • numpy.linalg.qr(a ,mode):计算矩阵的 QR 因式分解。
  • numpy.linalg.svd(a ,full_matrices,compute_uv):奇异值分解。
  • numpy.linalg.eig(a):计算正方形数组的特征值和右特征向量。
  • numpy.linalg.eigh(a, UPLO):返回 Hermitian 或对称矩阵的特征值和特征向量。
  • numpy.linalg.eigvals(a):计算矩阵的特征值。
  • numpy.linalg.eigvalsh(a, UPLO):计算 Hermitian 或真实对称矩阵的特征值。
  • numpy.linalg.norm(x ,ord,axis,keepdims):计算矩阵或向量范数。
  • numpy.linalg.cond(x ,p):计算矩阵的条件数。
  • numpy.linalg.det(a):计算数组的行列式。
  • numpy.linalg.matrix_rank(M ,tol):使用奇异值分解方法返回秩。
  • numpy.linalg.slogdet(a):计算数组的行列式的符号和自然对数。
  • numpy.trace(a ,offset,axis1,axis2,dtype,out):沿数组的对角线返回总和。
  • numpy.linalg.solve(a, b):求解线性矩阵方程或线性标量方程组。
  • numpy.linalg.tensorsolve(a, b ,axes):为 x 解出张量方程 a x = b
  • numpy.linalg.lstsq(a, b ,rcond):将最小二乘解返回到线性矩阵方程。
  • numpy.linalg.inv(a):计算逆矩阵。
  • numpy.linalg.pinv(a ,rcond):计算矩阵的(Moore-Penrose)伪逆。
  • numpy.linalg.tensorinv(a ,ind):计算 N 维数组的逆。

这里我们就不再一一尝试了,阅读一遍留下印象,用到时查阅官方文档即可。

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/a1097304791/article/details/120901716

智能推荐

分布式光纤传感器的全球与中国市场2022-2028年:技术、参与者、趋势、市场规模及占有率研究报告_预计2026年中国分布式传感器市场规模有多大-程序员宅基地

文章浏览阅读3.2k次。本文研究全球与中国市场分布式光纤传感器的发展现状及未来发展趋势,分别从生产和消费的角度分析分布式光纤传感器的主要生产地区、主要消费地区以及主要的生产商。重点分析全球与中国市场的主要厂商产品特点、产品规格、不同规格产品的价格、产量、产值及全球和中国市场主要生产商的市场份额。主要生产商包括:FISO TechnologiesBrugg KabelSensor HighwayOmnisensAFL GlobalQinetiQ GroupLockheed MartinOSENSA Innovati_预计2026年中国分布式传感器市场规模有多大

07_08 常用组合逻辑电路结构——为IC设计的延时估计铺垫_基4布斯算法代码-程序员宅基地

文章浏览阅读1.1k次,点赞2次,收藏12次。常用组合逻辑电路结构——为IC设计的延时估计铺垫学习目的:估计模块间的delay,确保写的代码的timing 综合能给到多少HZ,以满足需求!_基4布斯算法代码

OpenAI Manager助手(基于SpringBoot和Vue)_chatgpt网页版-程序员宅基地

文章浏览阅读3.3k次,点赞3次,收藏5次。OpenAI Manager助手(基于SpringBoot和Vue)_chatgpt网页版

关于美国计算机奥赛USACO,你想知道的都在这_usaco可以多次提交吗-程序员宅基地

文章浏览阅读2.2k次。USACO自1992年举办,到目前为止已经举办了27届,目的是为了帮助美国信息学国家队选拔IOI的队员,目前逐渐发展为全球热门的线上赛事,成为美国大学申请条件下,含金量相当高的官方竞赛。USACO的比赛成绩可以助力计算机专业留学,越来越多的学生进入了康奈尔,麻省理工,普林斯顿,哈佛和耶鲁等大学,这些同学的共同点是他们都参加了美国计算机科学竞赛(USACO),并且取得过非常好的成绩。适合参赛人群USACO适合国内在读学生有意向申请美国大学的或者想锻炼自己编程能力的同学,高三学生也可以参加12月的第_usaco可以多次提交吗

MySQL存储过程和自定义函数_mysql自定义函数和存储过程-程序员宅基地

文章浏览阅读394次。1.1 存储程序1.2 创建存储过程1.3 创建自定义函数1.3.1 示例1.4 自定义函数和存储过程的区别1.5 变量的使用1.6 定义条件和处理程序1.6.1 定义条件1.6.1.1 示例1.6.2 定义处理程序1.6.2.1 示例1.7 光标的使用1.7.1 声明光标1.7.2 打开光标1.7.3 使用光标1.7.4 关闭光标1.8 流程控制的使用1.8.1 IF语句1.8.2 CASE语句1.8.3 LOOP语句1.8.4 LEAVE语句1.8.5 ITERATE语句1.8.6 REPEAT语句。_mysql自定义函数和存储过程

半导体基础知识与PN结_本征半导体电流为0-程序员宅基地

文章浏览阅读188次。半导体二极管——集成电路最小组成单元。_本征半导体电流为0

随便推点

【Unity3d Shader】水面和岩浆效果_unity 岩浆shader-程序员宅基地

文章浏览阅读2.8k次,点赞3次,收藏18次。游戏水面特效实现方式太多。咱们这边介绍的是一最简单的UV动画(无顶点位移),整个mesh由4个顶点构成。实现了水面效果(左图),不动代码稍微修改下参数和贴图可以实现岩浆效果(右图)。有要思路是1,uv按时间去做正弦波移动2,在1的基础上加个凹凸图混合uv3,在1、2的基础上加个水流方向4,加上对雾效的支持,如没必要请自行删除雾效代码(把包含fog的几行代码删除)S..._unity 岩浆shader

广义线性模型——Logistic回归模型(1)_广义线性回归模型-程序员宅基地

文章浏览阅读5k次。广义线性模型是线性模型的扩展,它通过连接函数建立响应变量的数学期望值与线性组合的预测变量之间的关系。广义线性模型拟合的形式为:其中g(μY)是条件均值的函数(称为连接函数)。另外,你可放松Y为正态分布的假设,改为Y 服从指数分布族中的一种分布即可。设定好连接函数和概率分布后,便可以通过最大似然估计的多次迭代推导出各参数值。在大部分情况下,线性模型就可以通过一系列连续型或类别型预测变量来预测正态分布的响应变量的工作。但是,有时候我们要进行非正态因变量的分析,例如:(1)类别型.._广义线性回归模型

HTML+CSS大作业 环境网页设计与实现(垃圾分类) web前端开发技术 web课程设计 网页规划与设计_垃圾分类网页设计目标怎么写-程序员宅基地

文章浏览阅读69次。环境保护、 保护地球、 校园环保、垃圾分类、绿色家园、等网站的设计与制作。 总结了一些学生网页制作的经验:一般的网页需要融入以下知识点:div+css布局、浮动、定位、高级css、表格、表单及验证、js轮播图、音频 视频 Flash的应用、ul li、下拉导航栏、鼠标划过效果等知识点,网页的风格主题也很全面:如爱好、风景、校园、美食、动漫、游戏、咖啡、音乐、家乡、电影、名人、商城以及个人主页等主题,学生、新手可参考下方页面的布局和设计和HTML源码(有用点赞△) 一套A+的网_垃圾分类网页设计目标怎么写

C# .Net 发布后,把dll全部放在一个文件夹中,让软件目录更整洁_.net dll 全局目录-程序员宅基地

文章浏览阅读614次,点赞7次,收藏11次。之前找到一个修改 exe 中 DLL地址 的方法, 不太好使,虽然能正确启动, 但无法改变 exe 的工作目录,这就影响了.Net 中很多获取 exe 执行目录来拼接的地址 ( 相对路径 ),比如 wwwroot 和 代码中相对目录还有一些复制到目录的普通文件 等等,它们的地址都会指向原来 exe 的目录, 而不是自定义的 “lib” 目录,根本原因就是没有修改 exe 的工作目录这次来搞一个启动程序,把 .net 的所有东西都放在一个文件夹,在文件夹同级的目录制作一个 exe._.net dll 全局目录

BRIEF特征点描述算法_breif description calculation 特征点-程序员宅基地

文章浏览阅读1.5k次。本文为转载,原博客地址:http://blog.csdn.net/hujingshuang/article/details/46910259简介 BRIEF是2010年的一篇名为《BRIEF:Binary Robust Independent Elementary Features》的文章中提出,BRIEF是对已检测到的特征点进行描述,它是一种二进制编码的描述子,摈弃了利用区域灰度..._breif description calculation 特征点

房屋租赁管理系统的设计和实现,SpringBoot计算机毕业设计论文_基于spring boot的房屋租赁系统论文-程序员宅基地

文章浏览阅读4.1k次,点赞21次,收藏79次。本文是《基于SpringBoot的房屋租赁管理系统》的配套原创说明文档,可以给应届毕业生提供格式撰写参考,也可以给开发类似系统的朋友们提供功能业务设计思路。_基于spring boot的房屋租赁系统论文