Pig是Apache
Hadoop專案的其中一個子專案,Pig提供了一個Script語言Pig Latin。在Pig下有兩種執行模式:
1.
Local模式:適用於測試程式偵錯,在此模式下Pig指存取一台主機並在短時間處裡少量資料。
2.
MapReduce模式:Pig需要把真正的查詢轉換成對應的MapReduce作業,並傳送到Hadoop叢集去執行,在此模式下為Pig Local與Hadoop操作結合。
Pig Latin的資料型態表
單一資料型別
|
描述
|
範例
|
標量
|
||
int
|
有符號32為元整數
|
10
|
long
|
有符號64為元整數
|
資料:10L或10I
顯示:10L
|
float
|
32位浮點數
|
資料:10.5F或10.5f或10.5e2f或10.5E2F
顯示:10.5For1050.0F
|
double
|
64位浮點數
|
資料:10.5 or 10.5e2 or 10.5E2
顯示:10.5or1050.0
|
chararray
|
字元陣列使用UTF-8格式進行編碼
|
Hello
world
|
bytearray
|
位元組陣列
|
|
複雜資料型態
|
||
Tuple
|
有序的欄位集
|
(19,2)
|
bag
|
元組集合
|
{(19,2)(19,2),(18,1)}
|
map
|
鍵值對集合
|
[open#apache]
|
參考資料:
1.
Pig環境安裝手冊
2.
Pig網路教學資料
沒有留言:
張貼留言