博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
根据JSON创建对应的HIVE表
阅读量:6291 次
发布时间:2019-06-22

本文共 3028 字,大约阅读时间需要 10 分钟。

  本文提供一种用SCALA把JSON串转换为HIVE表的方法,由于比较简单,只贴代码,不做解释。有问题可以留言探讨

package com.gabry.hive import org.json4s._ import org.json4s.native.JsonMethods._ import scala.io.Source
class Json2Hive{  /**    * sealed abstract class JValue    *case object JNothing extends JValue // 'zero' for JValue    *case object JNull extends JValue    *case class JString(s: String) extends JValue    *case class JDouble(num: Double) extends JValue    *case class JDecimal(num: BigDecimal) extends JValue    *case class JInt(num: BigInt) extends JValue    *case class JBool(value: Boolean) extends JValue    *case class JObject(obj: List[JField]) extends JValue    *case class JArray(arr: List[JValue]) extends JValue    *type JField = (String, JValue)    *create table student_test(id INT, info struct< name:string,age:INT >)    *jsonString:{ "people_type":1,"people":{"person_id": 5,"test_count": 5,"para":{"name":"jack","age":6}}}    */  private def fieldDelimiter(level:Int) = if ( level == 2 ) " " else ":"  private def decodeJson(jv: Any,level:Int,hql:StringBuilder) :Unit = {    jv match {      case js:JString => hql.append(fieldDelimiter(level)+"string,")      case jdo:JDouble => hql.append(fieldDelimiter(level)+"double,")      case jde:JDecimal => hql.append(fieldDelimiter(level)+"decimal,")      case ji:JInt => hql.append(fieldDelimiter(level)+"bigint,")      case jb:JBool => hql.append(fieldDelimiter(level)+"int,")      case jf:JField=>        hql.append(jf._1)        decodeJson(jf._2,level+1,hql)      case ja:JArray=>          hql.append(level + " struct<")          ja.arr.foreach(decodeJson(_,level+1,hql))          hql.append(">")      case jo:JObject=>          if (level !=0) hql.append(" struct<")          jo.obj.foreach(decodeJson(_,level+1,hql))          if ( hql.endsWith(",") ) hql.deleteCharAt(hql.length-1)          if (level !=0) hql.append(">,")      case JNull=> hql.append(fieldDelimiter(level)+"string,")      case _ =>println(jv)    }  }  def toHive(jsonStr:String,tableName:String):String = {    val jsonObj = parse(jsonStr)    val hql = new StringBuilder()    decodeJson(jsonObj,0,hql)    "create table %s ( %s )".format(tableName,hql.toString())  }}object Json2Hive{  val json2hive = new Json2Hive()  def main (args :Array[String]) : Unit = {    if ( args.length != 2 ) println("usage : json2hive jsonFile hiveTableName")    val jsonFile = args(0)    val hiveTableName = args(1)    //val jsonstr ="{ \"people_type\":0,\"people_num\":0.1,\"people\":{\"person_id\": 5,\"test_count\": 5,\"para\":{\"name\":\"jack\",\"age\":6}},\"gender\":1}"    //val jsonstr ="{ \"people_type\":0,\"object\":{\"f1\":1,\"f2\":1},\"gender\":1}" /* 由于JSON串不容易用参数传递,故此处以json文件代替 */    val file = Source.fromFile(jsonFile,"UTF-8") /* 将文件中的json串转换为对应的HIVE表 */    file.getLines().foreach(line=>println(json2hive.toHive(line.toString,hiveTableName)))    file.close()  }}

  

以下是测试结果

 

create table example ( people_type bigint,people_num double,people struct<person_id:bigint,test_count:bigint,para struct<name:string,age:bigint>>,gender bigint )

转载地址:http://mwjta.baihongyu.com/

你可能感兴趣的文章
如何清理mac系统垃圾
查看>>
企业中最佳虚拟机软件应用程序—Parallels Deskto
查看>>
Nginx配置文件详细说明
查看>>
怎么用Navicat Premium图标编辑器创建表
查看>>
Spring配置文件(2)配置方式
查看>>
MariaDB/Mysql 批量插入 批量更新
查看>>
ItelliJ IDEA开发工具使用—创建一个web项目
查看>>
solr-4.10.4部署到tomcat6
查看>>
切片键(Shard Keys)
查看>>
淘宝API-类目
查看>>
virtualbox 笔记
查看>>
Git 常用命令
查看>>
驰骋工作流引擎三种项目集成开发模式
查看>>
SUSE11修改主机名方法
查看>>
jdk6.0 + Tomcat6.0的简单jsp,Servlet,javabean的调试
查看>>
Android:apk签名
查看>>
2(2).选择排序_冒泡(双向循环链表)
查看>>
MySQL 索引 BST树、B树、B+树、B*树
查看>>
微信支付
查看>>
CodeBlocks中的OpenGL
查看>>