KontaktAGBDatenschutzImpressumDruckversionSitemapHome
.
ANZEIGE

S@PPORT Online

.
.
.


Analysen & Studien

Data-Mining-Studie 2009

Große Unterschiede in der Leistungsfähigkeit
von Data-Mining-Tools

Das BI-Beratungshaus mayato hat in seiner aktuellen Studie „Data Mining Software 2009“ zwölf Data-Mining-Suiten und -Werkzeuge einem Funktionsvergleich unterzogen. Vier der Lösungen durchliefen zudem einen detaillierten Praxistest. Ziel der Studie ist es, Unternehmen bei der Tool-Auswahl im stark diversifizierten Softwaremarkt für Data Mining (DM) zu unterstützen. Durch flexiblere Preismodelle der Anbieter rückt das bisher als kostenintensiv und risikobehaftet geltende Data Mining auch für Mittelständler in den Fokus.


Taxonomie aktueller Data-Mining-Lösungen (Quelle: mayato)

Neben den kommerziellen Data-Mining-Suiten „SAS Enterprise Miner“ und „Clementine“ von SPSS untersuchte die Studie die drei Open-Source-Suiten „RapidMiner“, „KNIME“ und „Weka“. Eine weitere Kategorie bestand in schlankeren Data-Mining-Werkzeugen mit reduzierter Funktionalität, die in der Regel auf bestimmte Anwendungsgebiete wie Controlling oder auf Analyseszenarien wie Prognose- und Klassifizierungsaufgaben spezialisiert sind. Dazu zählen „Viscovery SOMine 5.0“, „prudsys Disvoverer 5.5“ und „Bissantz Delta Master 5.3.6“. Eine Sonderstellung in dieser Kategorie nimmt das Self-Acting Data Mining am Beispiel von KXEN Analytic Framework ein. Der hoch automatisierte Ansatz kommt weit gehend ohne manuelle Datenvorverarbeitung und Parametrisierung aus. Weiterhin kamen die integrierten BI-Lösungen „Oracle 11g Data Mining“, „SAP NetWeaver 7.0 Data Mining Workbench“ und „Microsoft SQL-Server 2005 Analysis Services“ auf den Prüfstand.

Detaillierter Praxistest
Im Blickfeld der Untersuchung standen die häufigsten Auswahlkriterien von Anwendern. Das sind einer Studie der Aberdeen Group von 2008 zufolge: Hohe Stabilität, der unkomplizierte Umgang mit großen Datenmengen, die Automatisierung von Standardaufgaben sowie die Qualität und Interpretierbarkeit der Ergebnisse und eine einfache Bedienbarkeit ohne lange Einarbeitungszeiten. Besonderes Augenmerk galt auch der Gesamteffizienz des Analyseprozesses und der Anwendung der einzelnen Werkzeuge und Suiten sowie den daraus resultierenden Gesamtkosten. KXEN Analytic Framework, RapidMiner, SAS und SAP NetWeaver wurden zusätzlich anhand von Testdatensätzen detailliert auf ihre Praxistauglichkeit geprüft. Kriterien wie Geschwindigkeit, Automatisierungsgrad und Ergebnisqualität testeten die BI-Experten zunächst mittels einer überschaubaren Testdatei mit 30.000 Datensätzen und 15 Variablen. Das Systemverhalten bei großen Datenmengen wurde anschließend durch Einlesen eines umfangreichen Datenvolumens mit 100.000 Datensätzen und 450 Variablen gemessen. Die Palette der Benchmarkdaten enthielt eine Reihe typischer Probleme für DM-Tools. „Wir haben sehr unterschiedliche Werkzeuge verglichen – für die Frage, welche Art von Werkzeug das richtige ist, muss jedes Unternehmen jedoch im Vorfeld klar seine Zielsetzung definieren. Die Studie zeigt aber, dass der Einstieg in Data-Mining-Projekte heute deutlich leichter ist“, sagt Peter Neckel, Analyst und Leiter der Studie bei mayato. (ap) … @

(Mehr zur Data-Mining-Studie 2009 können Sie in der Ausgabe 7-8/2009 von S@PPORT ab Seite 10 lesen)

Zurück zur Übersicht Artikel drucken

Sie wollen diese Druckausgabe hier online bestellen? Hier gehts zum Heftarchiv…










Weitere Links

Die Themen und Inhalte in
der aktuellen Druckausgabe
finden Sie hier…

Die Vorschau auf die nächste
Druckausgabe von S@PPORT
finden Sie hier…

Die Mediadaten und Themen-
übersicht für S@PPORT
finden Sie hier…

© CMS artmedic