Hive自定义函数和Transform
1 | 当Hive提供的内置函数无法满足你的业务处理需要时,此时就可以考虑使用用户自定义函数(UDF:user-defined function)。 |
1.UDF开发实例
1.1、先开发一个java类,继承UDF,并重载evaluate方法
1 | package com.matrix.hiveudf; |
1.2、打成jar包上传到服务器
1.3、将jar包添加到hive的classpath
1 | hive> add JAR /home/hadoop/udf.jar; |
1.4、创建临时函数与开发好的java class关联
1 | Hive> create temporary function tolowercase as 'com.matrix.hiveudf.ToProvince'; |
1.5、即可在hql中使用自定义的函数strip
2.Transform实现
1 | Hive的TRANSFORM关键字提供了在SQL中调用自写脚本的功能 |
2.1、下面这句sql就是借用了weekday_mapper.py对数据进行了处理.
1 | CREATE TABLE u_data_new ( |
其中weekday_mapper.py内容如下
1 | #!/bin/python |
本文作者 : Matrix
原文链接 : https://matrixsparse.github.io/2016/02/12/Hive自定义函数和Transform/
版权声明 : 本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明出处!
知识 & 情怀 | 二者兼得