Pandas 基础 (5) —— 处理缺失数据及层次化索引
发布日期:2021-05-10 08:47:37 浏览次数:21 分类:精选文章

本文共 2066 字,大约阅读时间需要 6 分钟。

���������������������������������������������������������������Pandas������������������������������NaN���Not a Number������������������������������������������������������������������������������������None������������������������������������������������������������������

1. ���������������

������isnull()������������������������������������������������������������Pandas������

data = Series(['a', 'b', np.nan, 'd'])
data.isnull()

���������������������������������False������������������True���������������������������Python���None���������������������������������

data[0] = None
data.isnull() # ��������� True

2. ������������������

������������������������������������dropna()���������������Series���������������������������������������������������

# ������������������������������
data.dropna()
# ������������������������������
data[data.notnull()]

���DataFrame������������������������������������������������������������������������������

data = DataFrame([[1, 2, 3], [1, np.nan, np.nan],
[np.nan, 4, 5]])
cleaned_data = data.dropna()

������������������������������������������������������axis���������

data.dropna(axis=1)  # ���������������������������

3. ���������������

������fillna()������������������������������������������������������������������������������������

df = DataFrame({'a': [1, None, 3], 'b': [4, 5, 6]})
df.fillna(0) # ��������������������� 0
# ������������`inplace=True`���������������������
df.fillna(10, inplace=True)

���������������������������������������������������������������������������������������������������������������������

4. ������������

������������������������HOW������������������������������������'all'���'any'���������������������������������������������������������������������������������������������������������������������������������������������

columns_with_na = df.columns[df.isin([np.nan, None]).any(axis=1)]
df[columns_with_na] = df[columns_with_na].fillna(df[columns_with_na].mean())

������������������������������������������������������������������������������������������������������������

上一篇:算法设计思想(1)—— 穷举法
下一篇:Letters

发表评论

最新留言

做的很好,不错不错
[***.243.131.199]2025年04月09日 18时09分41秒