PDI( 也稱為Kettle ) 是一款開源的數據抽取、轉換、加載 (ETL) 工具,支持各種常見數據源,如各類數據庫,平面文件,XML文件、Excel 文件、Access文件等。
用戶可以方便的以拖拽的方式,設計數據的流程,定義數據格式的轉換。
除了數據轉換外,Kettle 還以作業的方式支持很多常用操作,如發送、接收郵件、FTP 上傳、下載、文件管理等。
將作業和流程配合使用,用戶可以輕松的完成大部分的數據處理工作。
即使不是開發人員通過 Kettle 也能做一些簡單的數據處理工作,如:
從 Excel 文件選擇銷售金額大于1000 元的商品放到 Access 文件中,類似這樣的功能,不用寫一行代碼,直接通過圖形界面配置就可以了。
- 綠色版查看
- 綠色版查看
- 綠色版查看
- 綠色版查看
對于開發人員來說更是一個強大的武器,通過本身功能和插件的擴展功能,可能做你想做的任何數據處理方面的工作。
趕集網信息采集器是 PDI 平臺的一個插件,可以采集到趕集網信息的標題、電話號碼、發布時間、URL、及用戶自定義的采集項。
您的評論需要經過審核才能顯示
有用
有用
有用