Loading

随笔分类 -  数据分析

摘要:[\s]+\s+[\s]+\s+(.+) [\s]*\s+[\s]\s+)(.) 阅读全文
posted @ 2021-07-07 16:07 Mang0 阅读(422) 评论(0) 推荐(0)
摘要:常规思维: linux下: 数据库名与表名是严格区分大小写的; 表的别名是严格区分大小写的; 列名与列的别名在所有的情况下均是忽略大小写的; 变量名也是严格区分大小写的; windows下: ​ 都不区分大小写 Mac OS下(非UFS卷): ​ 都不区分大小写 翻了手册才知道并不是这样,linux 阅读全文
posted @ 2021-05-30 17:23 Mang0 阅读(51) 评论(0) 推荐(0)
摘要:https://blog.csdn.net/lsr40/article/details/82223923 阅读全文
posted @ 2021-04-21 16:08 Mang0 阅读(219) 评论(0) 推荐(0)
摘要:hive提取字符串中域名的sql方法 需求如下: 想取如下字段里的访问的域名: "GET http://suo.im/4xhnBL HTTP/1.1" "CONNECT sapi.ads.544.com:443 HTTP/1.1" "GET http://100.110.1.52:8080/job/ 阅读全文
posted @ 2021-04-13 21:53 Mang0 阅读(2034) 评论(0) 推荐(0)
摘要:hive工作中用到的一些拼接函数。 一, concat(string s1, string s2, string s3) 这个函数能够把字符串类型的数据连接起来,连接的某个元素可以是列值。 如 concat( aa, ‘:’, bb) 就相当于把aa列和bb列用冒号连接起来了,aa:bb。 二, c 阅读全文
posted @ 2021-03-05 14:49 Mang0 阅读(2093) 评论(0) 推荐(0)
摘要:错误写法: if(size(ip)>10, (ip[0],ip[1],ip[2],ip[3],ip[4],ip[5],ip[6],ip[7],ip[8],ip[9]), ip) as ip, 报错显示: Cannot convert column from string to array.解决办法 阅读全文
posted @ 2021-03-05 14:27 Mang0 阅读(2098) 评论(0) 推荐(0)
该文被密码保护。
posted @ 2021-03-03 20:16 Mang0 阅读(0) 评论(0) 推荐(0)
摘要:MySQL的IF既可以作为表达式用,也可在存储过程中作为流程控制语句使用,如下是做为表达式使用: IF表达式 IF(expr1,expr2,expr3) 如果 expr1 是TRUE (expr1 <> 0 and expr1 <> NULL),则 IF()的返回值为expr2; 否则返回值则为 e 阅读全文
posted @ 2021-03-03 20:15 Mang0 阅读(1697) 评论(0) 推荐(0)
摘要:网上解决办法一: https://stackoverflow.com/questions/22463444/hive-error-parseexception-missing-eof 把语句放在有()之前 网上解决办法二: https://blog.csdn.net/syfly007/article 阅读全文
posted @ 2021-03-03 16:38 Mang0 阅读(776) 评论(0) 推荐(0)
该文被密码保护。
posted @ 2021-01-25 21:53 Mang0 阅读(0) 评论(0) 推荐(0)
该文被密码保护。
posted @ 2021-01-25 21:48 Mang0 阅读(0) 评论(0) 推荐(0)
摘要:set hive.mapred.mode=nonstrict; 这是不严格模式,默认如此 对分区表进行查询,若在where子句中没有加分区的话,将禁止提交任务。 把属性值进行设置.默认值是没有开启的。默认是nonstrict 查看hive是否开启严格模式 set hive.mapred.mode 说 阅读全文
posted @ 2021-01-25 16:05 Mang0 阅读(337) 评论(0) 推荐(0)
摘要:https://blog.csdn.net/wireless_com/article/details/86486289 知识图谱和图数据库 阅读全文
posted @ 2021-01-24 16:40 Mang0 阅读(90) 评论(0) 推荐(0)
该文被密码保护。
posted @ 2021-01-12 17:18 Mang0 阅读(0) 评论(0) 推荐(0)
摘要:hive报错 解决办法: 设置set hive.mapred.mode = nonstrict; 见https://issues.apache.org/jira/browse/HIVE-14704 hive参数hive.mapred.mode分析:https://blog.csdn.net/lala 阅读全文
posted @ 2020-12-16 19:48 Mang0 阅读(1989) 评论(0) 推荐(0)
摘要:总结一下: sum()函数和count()函数的区别: 0)sum(*)对符合条件的记录的数值列求和; count(*)对符合条件的结果个数(或者记录)求和。 1)求和用累加sum(),求行的个数用累计count() 2)数据库中对空值的处理:sum()不计算,count()认为没有此项; 示例: 阅读全文
posted @ 2020-12-16 19:34 Mang0 阅读(2683) 评论(0) 推荐(0)
摘要:HQL的书写,select * from (select * from table) ; 执行此HQL,应该会报错:ql.Driver (SessionState.java:printError(960)) - FAILED: ParseException line 48:52 cannot rec 阅读全文
posted @ 2020-12-16 17:19 Mang0 阅读(3650) 评论(0) 推荐(0)
该文被密码保护。
posted @ 2020-12-16 17:18 Mang0 阅读(0) 评论(0) 推荐(0)

点击右上角即可分享
微信分享提示