
map函数
发布日期:2025-04-12 00:46:18
浏览次数:10
分类:精选文章
本文共 1260 字,大约阅读时间需要 4 分钟。
def get_type(df_obj, col): tmp = df_obj[col].value_counts().to_dict() dic = {} index = 0 for i in tmp: dic[i] = index index += 1 return dic# 可以根据需要定义不同的映射规则df_obj['education_num'] = df_obj['education'].map({ 'illiterate': 0, 'basic.4y': 1, 'basic.6y': 2, 'basic.9y': 3, 'high.school': 4, 'professional.course': 5, 'unknown': 6, 'university.degree': 7})df_obj['month_num'] = df_obj['month'].map({ 'jan': 1, 'feb': 2, 'mar': 3, 'apr': 4, 'may': 5, 'jun': 6, 'jul': 7, 'aug': 8, 'sep': 9, 'oct': 10, 'nov': 11, 'dec': 12})df_obj['loan_num'] = df_obj['loan'].map({ 'no': 0, 'unknown': 1, 'yes': 2})# 补充其他变量yCounts = df_obj['marital'].value_counts().to_dict()df_obj['marital_num'] = df_obj['marital'].map(get_type(df_obj, 'marital'))df_obj['housing_num'] = df_obj['housing'].map(get_type(df_obj, 'housing'))df_obj['contact_num'] = df_obj['contact'].map(get_type(df_obj, 'contact'))df_obj['day_of_week_num'] = df_obj['day_of_week'].map(get_type(df_obj, 'day_of_week'))df_obj['poutcome_num'] = df_obj['poutcome'].map(get_type(df_obj, 'poutcome'))# 定义处理后的列catCols = [ 'default_num', 'loan_num', 'marital_num', 'housing_num', 'day_of_week_num', 'education_num', 'month_num', 'poutcome_num', 'y']df_obj[catCols].head()
发表评论
最新留言
很好
[***.229.124.182]2025年05月06日 10时32分36秒
关于作者

喝酒易醉,品茶养心,人生如梦,品茶悟道,何以解忧?唯有杜康!
-- 愿君每日到此一游!
推荐文章
listview数据刷新后自动滑到底部
2025-04-10
list循环删除元素中的坑
2025-04-10
list深拷贝和浅拷贝
2025-04-10
List集合排序找出其中的最大和最小值
2025-04-11
List<String>用空串替换null值,并且都加上单引号,并且转为字符串用,分割
2025-04-11
liunx 下WebBench 安装与压力测试
2025-04-11
liunx-FTP服务器_无需整理
2025-04-11
Liunx挂载nfts盘数据方法
2025-04-11
liunx查找当前目录文件及子目录文件下的中文并替换
2025-04-11
liunx目录和文件管理(一)
2025-04-11
liunx系统中的文件压缩与解压
2025-04-11
LiveData的分析与简单使用
2025-04-11
LiveGBS user/save 逻辑缺陷漏洞复现(CNVD-2023-72138)
2025-04-11
live和on的区别
2025-04-11
li下的ul----多级列表
2025-04-11
lk部分没有msm8937相关目录原因(指向msm8952)
2025-04-11
llm 从0开始学习大语言模型, transformer架构学习
2025-04-11
LLM;超越记忆《第 2 部分 》
2025-04-11