目录
结合Hive-北风网用户浏览日志实际案例分析
01.项目实战一创建表并导入日志数据,引出问题
02.项目实战二使用RegexSerDe处理Apache或者Ngnix日志文件
03.项目实战三依据原表创建子表及设置orcfile存储和snappy压缩数据
04.项目实战四数据清洗之自定义UDF去除数据双引号
05.项目实战五数据清洗之自定义UDF转换日期时间数据
06.项目实战六依据业务编写HiveQL分析数据
07.项目实战七MovieLens数据分析采用python脚本进行数据清洗和统计