1. 数据导入与基础操作
1.1 导入Pandas库
import pandas as pd
1.2 读取CSV文件
df = pd.read_csv('data.csv')
1.3 查看数据基本信息
df.info()
1.4 显示前几行数据
df.head()
2. 数据清洗与处理
2.1 删除重复行
df.drop_duplicates(inplace=True)
2.2 删除缺失值
df.dropna(inplace=True)
2.3 填充缺失值
df.fillna(0, inplace=True)
2.4 转换数据类型
df['column'] = df['column'].astype('float')
3. 数据分组与聚合
3.1 按列分组
df.groupby('column').sum()
3.2 按行分组
df.groupby('column')['other_column'].mean()
3.3 使用聚合函数
df.groupby('column')['other_column'].agg(['sum', 'mean', 'max', 'min'])
4. 数据可视化基础
4.1 导入Matplotlib库
import matplotlib.pyplot as plt
4.2 绘制散点图
plt.scatter(df['x'], df['y'])
plt.show()
4.3 绘制折线图
plt.plot(df['x'], df['y'])
plt.show()
5. Pandas与Matplotlib结合
5.1 绘制柱状图
df.plot(kind='bar')
plt.show()
5.2 绘制箱线图
df.plot(kind='box')
plt.show()
5.3 绘制直方图
df.hist()
plt.show()
6. 高级数据可视化
6.1 绘制KDE图
df.plot(kind='kde')
plt.show()
6.2 绘制热力图
import seaborn as sns
sns.heatmap(df.corr(), annot=True)
plt.show()
6.3 绘制时间序列图
import pandas_datareader.data as web
df = web.DataReader('AAPL', 'yahoo', start='2010-01-01', end='2020-01-01')
df.plot()
plt.show()
7. 实用代码实例解析
7.1 实例1:数据导入与基础操作
# 导入Pandas库
import pandas as pd
# 读取CSV文件
df = pd.read_csv('data.csv')
# 查看数据基本信息
df.info()
# 显示前几行数据
df.head()
7.2 实例2:数据清洗与处理
# 删除重复行
df.drop_duplicates(inplace=True)
# 删除缺失值
df.dropna(inplace=True)
# 填充缺失值
df.fillna(0, inplace=True)
# 转换数据类型
df['column'] = df['column'].astype('float')
7.3 实例3:数据分组与聚合
# 按列分组
df.groupby('column').sum()
# 按行分组
df.groupby('column')['other_column'].mean()
# 使用聚合函数
df.groupby('column')['other_column'].agg(['sum', 'mean', 'max', 'min'])
7.4 实例4:数据可视化基础
# 导入Matplotlib库
import matplotlib.pyplot as plt
# 绘制散点图
plt.scatter(df['x'], df['y'])
plt.show()
# 绘制折线图
plt.plot(df['x'], df['y'])
plt.show()
7.5 实例6:高级数据可视化
# 导入Seaborn库
import seaborn as sns
# 绘制热力图
sns.heatmap(df.corr(), annot=True)
plt.show()
# 绘制时间序列图
import pandas_datareader.data as web
df = web.DataReader('AAPL', 'yahoo', start='2010-01-01', end='2020-01-01')
df.plot()
plt.show()
通过以上50个实用代码实例解析,相信你已经掌握了Pandas在数据可视化方面的强大功能。在实际应用中,你可以根据具体需求选择合适的代码进行操作,从而轻松实现数据可视化。
