Python数据清洗np.argmax()函数用法解析

2022-09-23 12:19:44
  1. 简介
    numpy.argmax(array, axis) 用于返回一个numpy数组中最大值的索引值。当一组中同时出现几个最大值时,返回第一个最大值的索引值。

在运算时,相当于剥掉一层中括号,返回一个数组,分为一维和多维。一维数组剥掉一层中括号之后就成了一个索引值,是一个数,而n维数组剥掉一层中括号后,会返回一个 n-1 维数组,而剥掉哪一层中括号,取决于axis的取值。

n维的数组的 axis 可以取值从 0 到 n-1,其对应的括号层数为从最外层向内递进,详见后文。

一、一维数组的用法

one_dim_array= np.array([1,4,5,3,7,2,6])print(np.argmax(one_dim_array))

1
2
运算后,降一维,成为一个数值,7的索引值维4,所以运算结果:

4
1
二、多维数组的用法

  1. 二维
    遵循运算之后降一维的原则,因此返回的会是一个一维的array。同时,axis的取值为0和1,对应剥掉的中括号,将里面的内容直接按逗号分隔:
    0 —— 外层
    1 —— 内层

举例如下:

two_dim_array= np.array([[1,3,5],[0,4,3]])
max_index_axis0= np.argmax(two_dim_array, axis=0)
max_index_axis1= np.argmax(two_dim_array, axis=1)print(max_index_axis0)print(max_index_axis1)

1
2
3
4
5
输出结果

[0 1 0]
[2 1]
1
2
这里的two_dim_array是一个 2×3 的矩阵,对应axis为:
array axis
2 —— 0
3 —— 1
所以,在axis为0时,剥掉2,返回一个1×3的数组;在axis为1时,剥掉3,返回一个1×2的数组

two_dim_array = np.array([[1, 3, 5], [0, 4, 3]])
max_index_axis0 = np.argmax(two_dim_array, axis = 0)
“”"
在axis为0时,0层括号置外面提出来,0 层内按 “,” 换行对齐,
[[1, 3, 5],
[0, 4, 3]]
分别对已经对齐的元素按照 0 层括号外面的逗号分组,这里的
[1, 3, 5],
[0, 4, 3]
0 层外面没有逗号,因此是一组
然后按列比较大小即可,返回值为

[argmax(1,0), argmax(3,4), argmax(5,3)]:

[0, 1, 0]
“”"
1
2
3
4
5
6
7
8
9
10
11
12
13
14
同样的思路可以用在axis为1时

max_index_axis1= np.argmax(two_dim_array, axis=1)

“”"
在axis为1时,则从外向内 1 层的中括号,提出来,1层内按 “,” 换行对齐
[[1,
3,
5],
[0,
4,
3]]
分别对已经对齐的元素按照 1 层外逗号分组,[1,3,5]一组,[0.4.3]一组。
每组元素进行比较,将 1 层括号变成argmax()

[argmax(1,3,5),
 argmax(0,4,3)]

返回值为
[2,
1]
“”"
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
2. 高维
以三维为例,计算思路与二维相同。

三维计算之后降维,将返回一个二维数组。

一个m×n×p维的矩阵,
axis为0,舍去m,返回一个 n×p 维的矩阵
axis为1,舍去n,返回一个 m×p 维的矩阵
axis为2,舍去p,返回一个 m×n 维的矩阵

three_dim_array=[[[1,2,3,4],[-1,0,3,5]],[[2,7,-1,3],[0,3,12,4]],[[5,1,0,19],[4,2,-2,13]]]
a= np.argmax(three_dim_array, axis=0)print(a)
b= np.argmax(three_dim_array, axis=1)print(b)
c= np.argmax(test, axis=2)print(c)

1
2
3
4
5
6
7
8
9
例中数组shape为 3×2×4
输出结果为:
0 对应shape 2×4
1 对应shape 3×4
2 对应shape 3×2

[[2 1 0 2]
[2 1 1 2]]

[[0 0 0 1]
[0 0 1 1]
[0 1 0 0]]

[[3 3]
[1 2]
[3 3]]
1
2
3
4
5
6
7
8
9
10
由于原理类似,因此以axis = 1 举例解析

b = np.argmax(three_dim_array, axis = 1)
print(b)
“”"
保留0层1层中括号,1层内按照逗号进行换行对齐
[[[1, 2, 3, 4],
[-1, 0, 3, 5]],
[[2, 7, -1, 3],
[0, 3, 12, 4]],
[[5, 1, 0, 19],
[4, 2, -2, 13]]]

按1层外面逗号分组
[[1, 2, 3, 4],
[-1, 0, 3, 5]]为一组
[[2, 7, -1, 3],
[0, 3, 12, 4]]为一组
[[5, 1, 0, 19],
[4, 2, -2, 13]]为一组
对每组内,按列进行操作,并去掉2层括号
三组分别为:

[argmax(1,-1),argmax(2,0),argmax(3,3),argmax(4,5)][argmax(2,0),argmax(7,3),argmax(-1,12),argmax(3,4)][argmax(5,4),argmax(1,2),argmax(0,-2),argmax(19,13)]

进而,结果为
[[0 0 0 1]
[0 0 1 1]
[0 1 0 0]]
“”"

123456789101112131415161718192021222324252627282930

当axis为0和2时一样,分组后如下:

axis=0
three_dim_array=[[[1,2,3,4],[-1,0,3,5]],[[2,7,-1,3],[0,3,12,4]],[[5,1,0,19],[4,2,-2,13]]]
axis=2
three_dim_array=[[[1,2,3,4],[-1,0,3,5]],[[2,7,-1,3],[0,3,12,4]],[[5,1,0,19],[4,2,-2,13]]]
  • 作者:小猪课堂
  • 原文链接:https://blog.csdn.net/qq_39885465/article/details/115483840
    更新时间:2022-09-23 12:19:44