当前位置:首页 > 科技  > 软件

关于 Python 数据分析的 15 个 NumPy 应用

来源: 责编: 时间:2024-06-06 17:41:37 98观看
导读欢迎来到Python数据分析的世界!对于初学者来说,NumPy是你的第一站,它是Python科学计算的基石,特别是当你想要处理数组和进行大规模数据操作时。本文专为那些希望深入了解并掌握NumPy核心功能的数据分析新手设计。我们将通

欢迎来到Python数据分析的世界!对于初学者来说,NumPy是你的第一站,它是Python科学计算的基石,特别是当你想要处理数组和进行大规模数据操作时。本文专为那些希望深入了解并掌握NumPy核心功能的数据分析新手设计。我们将通过10个实用的应用示例,带你从基础操作到一些高级技巧,让你的数据分析之旅更加顺畅。pYU28资讯网——每日最新资讯28at.com

pYU28资讯网——每日最新资讯28at.com

1. 数组创建与基本操作

应用示例:pYU28资讯网——每日最新资讯28at.com

创建数组:pYU28资讯网——每日最新资讯28at.com

import numpy as nparr = np.array([1, 2, 3, 4])print("简单数组:", arr)

这段代码创建了一个一维数组,并打印出来。pYU28资讯网——每日最新资讯28at.com

解释:np.array()是创建NumPy数组的基本函数,它接受列表、元组等作为输入。pYU28资讯网——每日最新资讯28at.com

2. 维度变换

改变形状:pYU28资讯网——每日最新资讯28at.com

arr_2d = arr.reshape(2, 2)print("二维数组:", arr_2d)

通过reshape,我们可以不改变数据的情况下,调整数组的形状。pYU28资讯网——每日最新资讯28at.com

3. 数学运算

加法与乘法:pYU28资讯网——每日最新资讯28at.com

arr_add = arr + 10arr_mult = arr * 2print("加10:", arr_add, "/n乘2:", arr_mult)

数学运算在NumPy中可以直接对数组操作,非常高效。pYU28资讯网——每日最新资讯28at.com

4. 统计分析

求平均值与最大值:pYU28资讯网——每日最新资讯28at.com

mean_val = np.mean(arr)max_val = np.max(arr)print("平均值:", mean_val, "最大值:", max_val)

np.mean()和np.max()用于快速统计分析。pYU28资讯网——每日最新资讯28at.com

5. 布尔索引

筛选特定值:pYU28资讯网——每日最新资讯28at.com

bool_arr = arr > 2print("大于2的索引:", bool_arr)filtered_arr = arr[bool_arr]print("筛选结果:", filtered_arr)

布尔索引允许根据条件选择数组元素。pYU28资讯网——每日最新资讯28at.com

6. 随机数生成

生成随机数组:pYU28资讯网——每日最新资讯28at.com

random_arr = np.random.rand(3, 3)print("3x3随机数组:", random_arr)

np.random.rand()用于生成指定形状的随机数矩阵。pYU28资讯网——每日最新资讯28at.com

7. 线性代数操作

矩阵乘法:pYU28资讯网——每日最新资讯28at.com

mat1 = np.array([[1, 2], [3, 4]])mat2 = np.array([[5, 6], [7, 8]])product = np.dot(mat1, mat2)print("矩阵乘法结果:", product)

np.dot()进行矩阵乘法,是机器学习中的基础操作。pYU28资讯网——每日最新资讯28at.com

8. 广播机制

不同形状数组运算:pYU28资讯网——每日最新资讯28at.com

broad_arr = arr + np.array([10, 10])print("广播机制结果:", broad_arr)

NumPy的广播机制允许不同形状的数组进行运算。pYU28资讯网——每日最新资讯28at.com

9. 数据排序

排序数组:pYU28资讯网——每日最新资讯28at.com

sorted_arr = np.sort(arr)print("排序后的数组:", sorted_arr)

np.sort()按升序排序数组。pYU28资讯网——每日最新资讯28at.com

10. 文件读写

保存与加载数组:pYU28资讯网——每日最新资讯28at.com

np.save('my_array.npy', arr)loaded_arr = np.load('my_array.npy')print("从文件加载的数组:", loaded_arr)

使用np.save()和np.load()进行数组的持久化存储和读取。pYU28资讯网——每日最新资讯28at.com

11.高级统计功能

分位数与标准差 :pYU28资讯网——每日最新资讯28at.com

# 分位数quartiles = np.percentile(arr, [25, 50, 75])print("四分位数:", quartiles)# 标准差与方差std_dev = np.std(arr)variance = np.var(arr)print("标准差:", std_dev, "方差:", variance)

分位数和统计度量是评估数据分布的关键指标。pYU28资讯网——每日最新资讯28at.com

12.高级索引与切片

花式索引 :pYU28资讯网——每日最新资讯28at.com

# 索引数组indices = np.array([[0, 1], [2, 2]])print("根据索引选取元素:", arr[indices])# 切片与步长sliced_arr = arr[1:4:2]  # 从第二个元素开始,每隔一个取一个print("切片结果:", sliced_arr)

花式索引让你能以非常灵活的方式访问数组元素。pYU28资讯网——每日最新资讯28at.com

13.内存效率与视图

使用视图减少内存消耗 :pYU28资讯网——每日最新资讯28at.com

view_arr = arr.view()view_arr[:] = 100  # 注意:这会改变原数组,因为是视图print("原数组变化后:", arr)

了解视图和副本的区别对于处理大型数据集至关重要。pYU28资讯网——每日最新资讯28at.com

14.向量化操作的威力

向量化操作是NumPy的核心优势,相较于Python循环,它们提供了极大的性能提升。pYU28资讯网——每日最新资讯28at.com

比较与逻辑操作 :pYU28资讯网——每日最新资讯28at.com

# 等于特定值的索引equals_three = arr == 3print("等于3的索引:", equals_three)# 逻辑与both_greater = (arr > 2) & (arr < 4)print("大于2且小于4的索引:", both_greater)

利用逻辑操作符进行条件筛选,无需显式循环。pYU28资讯网——每日最新资讯28at.com

15.性能优化提示

  • 避免循环:尽量使用向量化操作替代Python循环。
  • 使用einsum进行复杂数组计算,它在某些情况下比直接的矩阵操作更快。
  • 数组预分配:预先确定数组大小并分配内存,可以避免运行时的内存分配开销。

本文链接://www.dmpip.com//www.dmpip.com/showinfo-26-92465-0.html关于 Python 数据分析的 15 个 NumPy 应用

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 喔!React19 中的 Hook 可以写在 If 条件判断中了。Use 实践:点击按钮更新数据

下一篇: 为了全面监控用户行为,我写了个超级前端工具库!

标签:
  • 热门焦点
Top
Baidu
map