古詩詞大全網 - 成語故事 - 開源數據挖掘工具有哪些?

開源數據挖掘工具有哪些?

1、RapidMiner

該工具是用Java語言編寫的,通過基於模板的框架提供先進的分析技術。該款工具最大的好處就是,用戶無需寫任何代碼。它是作為壹個服務提供,而不是壹款本地軟件。值得壹提的是,該工具在數據挖掘工具榜上位列榜首。

另外,除了數據挖掘,RapidMiner還提供如數據預處理和可視化、預測分析和統計建模、評估和部署等功能。更厲害的是它還提供來自WEKA(壹種智能分析環境)和R 腳本的學習方案、模型和算法。

RapidMiner分布在AGPL開源許可下,可以從SourceForge上下載。SourceForge是壹個開發者進行開發管理的集中式場所,大量開源項目在此落戶,其中就包括維基百科使用的MediaWiki。

2、WEKA

WEKA原生的非Java版本主要是為了分析農業領域數據而開發的。該工具基於Java版本,是非常復雜的,並且應用在許多不同的應用中,包括數據分析以及預測建模的可視化和算法。與RapidMiner相比優勢在於,它在GNU通用公***許可證下是免費的,因為用戶可以按照自己的喜好選擇自定義。

WEKA支持多種標準數據挖掘任務,包括數據預處理、收集、分類、回歸分析、可視化和特征選取。

添加序列建模後,WEKA將會變得更強大,但目前不包括在內。

3、R-Programming

如果我告訴妳R項目,壹個GNU項目,是由R(R-programming簡稱,以下統稱R)自身編寫的,妳會怎麽想它主要是由C語言和FORTRAN語言編寫的,並且很多模塊都是由R編寫的,這是壹款針對編程語言和軟件環境進行統計計算和制圖的免費軟件。R語言被廣泛應用於數據挖掘,以及開發統計軟件和數據分析中。近年來,易用性和可擴展性也大大提高了R的知名度。

除了數據,它還提供統計和制圖技術,包括線性和非線性建模,經典的統計測試,時間序列分析、分類、收集等等。