Apache Pig GetHour()函数

2018-01-03 19:40 更新

此函数接受日期时间对象作为参数,并返回给定日期时间对象的当前日期的当前小时。

语法

这是 GetHour() 函数的语法。

grunt> GetHour(datetime)

假设在 HDFS 目录 /pig_data/ 中有一个名为 date.txt 的文件,如下所示。此文件包含特定人员的出生日期的详细信息:id,日期和时间。

date.txt

001,1989/09/26 09:00:00
002,1980/06/20 10:22:00
003,1990/12/19 03:11:44

通过使用 date_data 关系将此文件加载到Pig中,如下所示。

grunt> date_data = LOAD 'hdfs://localhost:9000/pig_data/date.txt' USING PigStorage(',')
   as (id:int,date:chararray);

下面是 GetHour() 函数的示例。 GetHour() 函数将从给定的Date-Time对象中检索一天中的小时。因此,首先,让我们使用 todate() 函数生成所有员工的Date-Time对象。

grunt> todate_data = foreach date_data generate ToDate(date,'yyyy/MM/dd HH:mm:ss')
   as (date_time:DateTime );
  
grunt> Dump todate_data;  
(1989-09-26T09:00:00.000+05:30)
(1980-06-20T10:22:00.000+05:30) 
(1990-12-19T03:11:44.000+05:30)

现在让我们使用 GetDay() 函数从每个员工的出生时间开始计算小时,并将其存储在名为 gethour_data 的关系中。

grunt> gethour_data = foreach todate_data generate (date_time), GetHour(date_time);

现在使用Dump运算符验证 getday_data 关系的内容,如下所示。

grunt> Dump gethour_data;  

(1989-09-26T09:00:00.000+05:30,9) 
(1980-06-20T10:22:00.000+05:30,10) 
(1990-12-19T03:11:44.000+05:30,3)


以上内容是否对您有帮助:
在线笔记
App下载
App下载

扫描二维码

下载编程狮App

公众号
微信公众号

编程狮公众号