PDI( 也稱為Kettle ) 是一款開源的數(shù)據(jù)抽取、轉(zhuǎn)換、加載 (ETL) 工具,支持各種常見數(shù)據(jù)源,如各類數(shù)據(jù)庫,平面文件,XML文件、Excel 文件、Access文件等。
用戶可以方便的以拖拽的方式,設(shè)計數(shù)據(jù)的流程,定義數(shù)據(jù)格式的轉(zhuǎn)換。
除了數(shù)據(jù)轉(zhuǎn)換外,Kettle 還以作業(yè)的方式支持很多常用操作,如發(fā)送、接收郵件、FTP 上傳、下載、文件管理等。
將作業(yè)和流程配合使用,用戶可以輕松的完成大部分的數(shù)據(jù)處理工作。
即使不是開發(fā)人員通過 Kettle 也能做一些簡單的數(shù)據(jù)處理工作,如:
從 Excel 文件選擇銷售金額大于1000 元的商品放到 Access 文件中,類似這樣的功能,不用寫一行代碼,直接通過圖形界面配置就可以了。
- 綠色版查看
- 綠色版查看
- 綠色版查看
- 綠色版查看
對于開發(fā)人員來說更是一個強大的武器,通過本身功能和插件的擴展功能,可能做你想做的任何數(shù)據(jù)處理方面的工作。
趕集網(wǎng)信息采集器是 PDI 平臺的一個插件,可以采集到趕集網(wǎng)信息的標題、電話號碼、發(fā)布時間、URL、及用戶自定義的采集項。
您的評論需要經(jīng)過審核才能顯示
有用
有用
有用