翼度科技»论坛 编程开发 python 查看内容

【numpy基础】--数组索引

6

主题

6

帖子

18

积分

新手上路

Rank: 1

积分
18
数组索引是指在numpy数组中引用特定元素的方法。
numpy的数组索引又称为fancy indexing,比其他编程语言的索引强大很多。
1. 选取数据

numpy的索引除了像其他语言一样选择一个元素,还可以间隔着选取多个元素,也可以用任意的顺序选取元素。
比如一维数组:
  1. arr = np.random.randint(0, 10, 5)
  2. print(arr)
  3. #运行结果
  4. [7 2 6 2 1]
  5. indexes = [0, 2, 3]
  6. print(arr[indexes])
  7. #运行结果
  8. [7 6 2]
  9. indexes = [4, 0, 2]
  10. print(arr[indexes])
  11. #运行结果
  12. [1 7 6]
复制代码
从上面的示例看出,通过传入 indexes 数组,可以一次选择多个元素。
indexes 数组中的值代表数组arr的下标,从0开始。
对于二维数组:
  1. arr = np.random.randint(0, 10, (5,5))
  2. print(arr)
  3. #运行结果
  4. [[5 7 3 3 2]
  5. [2 5 6 3 6]
  6. [4 1 1 0 1]
  7. [6 5 8 9 1]
  8. [2 6 5 2 0]]
  9. rows = np.array([3, 1, 4])
  10. cols = np.array([3, 0, 1])
  11. print(arr[rows, cols])
  12. #运行结果
  13. [9 2 6]
复制代码
这里 rows 和 cols 分别代表行和列的索引,从0开始。
运行结果选取的是单个元素,分别是:arr[3, 3],arr[1, 0],arr[4, 1]。
如果要从二维数组中通过选取行列,而不是选取单个元素的话:
  1. arr = np.random.randint(0, 10, (5,5))
  2. print(arr)
  3. #运行结果
  4. [[4 2 6 6 4]
  5. [1 8 8 1 9]
  6. [5 9 2 1 3]
  7. [8 9 1 6 9]
  8. [5 4 3 5 6]]
  9. rows = np.array([3, 1, 4])
  10. cols = np.array([3, 0, 1])
  11. arr[rows[:, np.newaxis], cols]
  12. #运行结果
  13. [[6 8 9]
  14. [1 1 8]
  15. [5 5 4]]
复制代码
arr[rows[:, np.newaxis], cols] 是先选取3,1,4 行,得到:
[[8 9 1 6 9]
[1 8 8 1 9]
[5 4 3 5 6]]
然后选取3,0,1 列,得到:
[[6 8 9]
[1 1 8]
[5 5 4]]
2. 与切片结合

fancy indexing可以和之前数组的切片操作相结合:
  1. arr = np.random.randint(0, 10, (5,5))
  2. print(arr)
  3. #运行结果
  4. [[4 2 6 6 4]
  5. [1 8 8 1 9]
  6. [5 9 2 1 3]
  7. [8 9 1 6 9]
  8. [5 4 3 5 6]]
  9. rows = np.array([3, 1, 4])
  10. cols = np.array([3, 0, 1])
  11. #切片在行上
  12. print(arr[:2, cols])
  13. #运行结果
  14. [[6 4 2]
  15. [1 1 8]]
  16. #切片在列上
  17. print(arr[rows, 1:])
  18. #运行结果
  19. [[9 1 6 9]
  20. [8 8 1 9]
  21. [4 3 5 6]]
复制代码
arr[:2, cols] 先选择前2行,然后按照 cols 顺序选择列。
arr[rows, 1:] 按照 rows 顺序选择行,然后选择后4列。
3. 与掩码结合

fancy indexing也可以和之前介绍的掩码相结合来过滤数组:
  1. arr = np.random.randint(0, 10, (5,5))
  2. print(arr)
  3. #运行结果
  4. [[4 2 6 6 4]
  5. [1 8 8 1 9]
  6. [5 9 2 1 3]
  7. [8 9 1 6 9]
  8. [5 4 3 5 6]]
  9. rows = np.array([3, 1, 4])
  10. mask = np.array([True, False, False, False, True])
  11. print(arr[rows[:, np.newaxis], mask])
  12. #运行结果
  13. [[8 9]
  14. [1 9]
  15. [5 6]]
复制代码
arr[rows[:, np.newaxis], mask] 先按照 rows 的顺序选择行,然后用mask过滤掉 False 的列。
最后剩下的是 3,1,4 行的 第一列和**最后一列**。
4. 修改数据

最后,fancy indexing还有个重要的作用是修改数据,我们通过fancy indexing选取数据之后,可以直接修改它们。
  1. arr = np.random.randint(0, 10, (5,5))
  2. print(arr)
  3. #运行结果
  4. [[6 4 7 8 1]
  5. [0 3 5 0 6]
  6. [8 9 4 7 0]
  7. [3 0 0 9 1]
  8. [4 5 5 0 5]]
  9. rows = np.array([3, 1, 4])
  10. cols = np.array([3, 0, 1])
  11. arr[rows, cols] = [100] * len(arr[rows, cols])
  12. print(arr)
  13. #运行结果
  14. [[  6   4   7   8   1]
  15. [100   3   5   0   6]
  16. [  8   9   4   7   0]
  17. [  3   0   0 100   1]
  18. [  4 100   5   0   5]]
复制代码
上面的示例中,将fancy indexing选取出的值修改为100。
注意,[100] * len(arr[rows, cols]) 这个代码是根据fancy indexing选取出的元素个数来决定将几个值修改成100。
5. 总结回顾

numpy数组索引的意义在于它可以使数组中的数据更加灵活和易于管理。
通过使用索引,开发人员可以快速访问数组中的特定元素,而不需要遍历整个数组。
这可以大大加快计算速度和减少内存使用。
此外,数组索引还可以用于数组的重构和维护。
通过对数组索引的有效使用,开发人员可以轻松地修改和维护数组中的数据,而不会影响到其他使用该数组的程序。

来源:https://www.cnblogs.com/wang_yb/p/17520930.html
免责声明:由于采集信息均来自互联网,如果侵犯了您的权益,请联系我们【E-Mail:cb@itdo.tech】 我们会及时删除侵权内容,谢谢合作!

举报 回复 使用道具