如何使用 NumPy 库进行数据分析?
NumPy 是一个用于 Python 数据分析的开源库。它提供了许多用于数据分析的工具,包括数组、矩阵、索引和函数。NumPy 也是 NumPy 库的子库,它提供许多用于数值计算的工具。
使用 NumPy 库进行数据分析的步骤:
- 导入 NumPy 库:
import numpy as np
- 创建数组:
# 创建一个包含数字的数组
arr = np.array([1, 2, 3, 4, 5])
# 创建一个包含字符串的数组
arr = np.array(["a", "b", "c", "d", "e"])
- 访问数组元素:
# 获取第一个元素
print(arr[0])
# 获取指定索引的元素
print(arr[2])
- 进行数据分析:
# 计算数组的平均值
print(np.mean(arr))
# 计算数组的标准差
print(np.std(arr))
# 计算数组的最小值和最大值
print(np.min(arr), np.max(arr))
- 创建新的数组:
# 创建一个包含复制数组元素的数组
arr_copy = arr.copy()
# 创建一个包含扩展数组元素的数组
arr_extended = np.expand_dims(arr, -1)
- 使用函数:
# 使用 numpy.sum() 函数计算数组中所有元素的和
print(np.sum(arr))
# 使用 numpy.mean() 函数计算数组中所有元素的平均值
print(np.mean(arr))
示例:
import numpy as np
# 创建一个包含数字的数组
arr = np.array([1, 2, 3, 4, 5])
# 打印数组元素
print(arr[0])
# 打印数组中所有元素的平均值
print(np.mean(arr))
输出:
1
3.0
```