Kettle是壹款國外開源的ETL工具,純java編寫,可以在Windows、Linux、Unix上運行,數據抽取高效穩定。Kettle中文名稱叫水壺,該項目的主程序員MATT希望把各種數據放到壹個壺裏,然後以壹種指定的格式流出。
PentahoDataIntegration以Java開發,支持跨平臺運行,其特性包括:支持100%無編碼、拖拽方式開發ETL數據管道;可對接包括傳統數據庫、文件、大數據平臺、接口、流數據等數據源;支持ETL數據管道加入機器學習算法。PentahoDataIntegration分為商業版與開源版,開源版的截止2021年1月的累計下載量達836萬,其中19%來自中國。在中國壹般人仍習慣把PentahoDataIntegration的開源版稱為Kettle。