Pentaho Data Integration (PDI),是一套以純Java編寫的資料蒐集工具,是一套綠色軟體,不需安裝只需將檔案解壓縮就可以使用。
PDI支援多種資料來源(XML、JSON、HTML etc.)和資料庫(Oracle、DB2、MySQL、SQL Server etc.),採用拖拉式的關聯編輯方式,且包含了大量的預件模組,可以覺直覺的完成編碼過程。支援Apache Hadoop Cloudera、HortonWorks,MapReduce應用。
PDI有兩種工作模式:Transformation負責資料的提取、mapping、轉換和儲存,job則管理一或多個Transformation,可以定時將資料提取併存進資料庫。
沒有留言:
張貼留言