2013年8月31日 星期六

Hadoop Pig

PigApache Hadoop專案的其中一個子專案,Pig提供了一個Script語言Pig Latin。在Pig下有兩種執行模式:
1.          Local模式:適用於測試程式偵錯,在此模式下Pig指存取一台主機並在短時間處裡少量資料。
2.          MapReduce模式:Pig需要把真正的查詢轉換成對應的MapReduce作業,並傳送到Hadoop叢集去執行,在此模式下為Pig LocalHadoop操作結合。
Pig Latin的資料型態表
單一資料型別
描述
範例
標量
int
有符號32為元整數
10
long
有符號64為元整數
資料:10L10I
顯示:10L
float
32位浮點數
資料:10.5F10.5f10.5e2f10.5E2F
顯示:10.5For1050.0F
double
64位浮點數
資料:10.5 or 10.5e2 or 10.5E2
顯示:10.5or1050.0
chararray
字元陣列使用UTF-8格式進行編碼
Hello world
bytearray
位元組陣列

複雜資料型態
Tuple
有序的欄位集
(19,2)
bag
元組集合
{(19,2)(19,2),(18,1)}
map
鍵值對集合
[open#apache]
參考資料:
1.          Pig環境

2.          Pig網路教學

沒有留言:

張貼留言