kettle从hive取数乱码-问题解决方法（可下载改写驱动）-白红宇的个人博客

kettle从hive取数乱码-问题解决方法（可下载改写驱动）

发布日期：2021-05-06 19:52:30 浏览次数：41 分类：技术文章

本文共 1558 字，大约阅读时间需要 5 分钟。

博主第一次使用kettle抽取hive中的数据时，遇到了取数结果乱码的问题。

经查阅相关资料，大致有以下几种解决办法：

hive连接页面设置characterEncoing=utf8。对关系型数据库可能有用，但对hive测试无效；

修改hive连接驱动中的jar包。

实现步骤：

工具：反编译工具jd-gui、java IDE工具Eclipse

我的实现步骤如下：

找到hive-jdbc-0.7.0-pentaho-1.0.2.jar这个jar包，把class文件解压在目录中；

使用jd-gui反编译class文件为java源码文件，保存；

新建java工程，把java源码文件导入工程；

从hive-jdbc-0.7.0-pentaho-1.0.2.jar这个文件名可猜测，驱动是针对hive0.7.0进行修改的，引入hive、hadoop0.20的相关jar包，jdk使用1.5来编译；

修改报错的代码——反编译的代码不一定是正确的，会有一定的语法错误；

修改HiveQueryResultSet.java为以下代码：

StructObjectInspector soi = (StructObjectInspector) serde.getObjectInspector();List fieldRefs = soi.getAllStructFieldRefs();//Object data = serde.deserialize(new BytesWritable(rowStr.getBytes()));//我们将该行屏蔽Object data = serde.deserialize(new BytesWritable(rowStr.getBytes("UTF-8")));//使用本行

替换原来包中的HiveQueryResultSet.class文件，对所有的class文件按原结构进行打为jar包；

替换原先的路径中的jar包就可以了。

资源下载：

楼主改好的jar包资源在这里：

http://download.csdn.net/detail/l714417743/9369816

上一篇：IDEA version Control 下没有git菜单

下一篇：大蛇丸实验室之Oracle by DWLIJX

发表评论

关于作者

喝酒易醉，品茶养心，人生如梦，品茶悟道，何以解忧？唯有杜康！

-- 愿君每日到此一游！

相关资料：

实现步骤：

资源下载：

发表评论

最新留言

关于作者

推荐文章