spark sql去除某一行或某一属性值为空的行 最简单办法
发布日期:2021-05-08 14:12:37 浏览次数:21 分类:精选文章

本文共 381 字,大约阅读时间需要 1 分钟。

想去除某一属性为特定值或null的那一行

思路:
1、把你想要筛选的那一列,变为string类型新增一列。
2、用filter()过滤掉这一行
例如:

我想去除time列中为空,且1970年的行:

在这里插入图片描述

新增time_string,类型为string:

t=t.withColumn('time_string',t['time'].cast('String'))

在这里插入图片描述

过滤:

t = t.filter(t['time_string']!='null')t = t.filter(t['time_string']!='1970-01-01 00:00:00')

最后完成:

在这里插入图片描述
就这两行代码:

t=t.withColumn('time_string',t['time'].cast('String'))t = t.filter(t['time_string']!='null')
上一篇:技术美术面试问题整理
下一篇:搭建SpringCloud 系列demo

发表评论

最新留言

感谢大佬
[***.8.128.20]2025年04月19日 08时24分55秒