Hauptnavigation

Zurück zur Liste der veröffentlichten Software

RapidMiner Data Stream Plugin (formerly: YALE Concept Drift Plugin) - Machine Learning of Time-Varying and Drifting Concepts from Data Streams

Beschreibung:

Das Data-Stream-Plugin (vormals Concept-Drift-Plugin) für RapidMiner (vormals YALE (Yet Another Learning Environment)), einer kostenlosen im Quellcode erhältlichen Softwareumgebung für maschinelles Lernen, Data Mining und Wissensentdeckung (Knowledge Discovery), erweitert RapidMiner um Operatoren zur Behandlung realer und simulierter zeitlicher Veränderungen in Datenströmen (Concept Drift in Data Streams).

Die Operatoren dieses Plugins zum Analysieren von Datenströmen (Data Stream Mining) und zum Lernen und Verfolgen zeitlich veränderlicher Zielkonzepte (Concept Drift Tracking) können mit allen anderen Operatoren von RapidMiner kombiniert werden. Beispielsweise können die Vorverarbeitungsoperatoren von RapidMiner für Audio-Daten und Texte verwendet werden, um zeitliche Veränderungen eines zu lernenden Zielkonzepts in Audio- oder Textdatenströmen automatisch zu erkennen und zu behandeln und alle maschinellen Klassifikations-Lernverfahren von RapidMiner (und WEKA) können mit den angebotenen Rahmenverfahren zur Concept-Drift-Behandlung kombiniert werden. Allerdings setzen mancher dieser Rahmenverfahren zur Concept-Drift-Behandlung Basislernverfahren voraus, die in der Lage sind, ihre Performanz (Vorhersagegenauigkeit bzw. erwarteten Vorhersagefehler) zu schätzen.

Die Rahmenverfahren zur Concept-Drift-Behandlung, die von diesem Plugin angeboten werden, umfassen die folgenden:

  • Einfachstrategien zu Vergleichszwecken (baseline strategies): Lernen ohne Gedächtnis (no memory) oder mit unbegrenztem Gedächtnis (full memory)
  • Zeitfenster fester Größe (fixed size) oder Zeitfenster automatisch angepaßter Größe (adaptive size)
  • Automatische Batch- oder Beispiel-Auswahl (example selection)
  • globale alters-basierte oder lokale performanz-basierte Beispielsgewichtung (example weighting)
  • Ensemble-Methoden mit wissenbasiertem Sampling (knowledge-based sampling, KBS-stream)

Das Data-Stream-Plugin und sein Quellcode sind von der RapidMiner Download-Seite herunterladbar. Zur Installation und Verwendung des Plugins reicht es, die Datei rapidminer-datastream-4.0beta.jar ins lib/plugins/ Unterverzeichnis der RapidMiner-Installation. Bei Microsoft Windows Systemen kann alternativ der Windows Auto Installer verwendet werden (rapidminer-datastream-4.0beta-installer.exe).

Bei Fragen wenden Sie sich bitte an Ralf Klinkenberg.

Link:

http://yale.sf.net/

Software File:

Autoren:

Klinkenberg, Ralf

Projekte:

SFB 475 subproject A4

Publikationen:

Mierswa/etal/2003a Mierswa, Ingo and Klinkenberg, Ralf and Fischer, Simon and Ritthoff, Oliver. A Flexible Platform for Knowledge Discovery Experiments: YALE -- Yet Another Learning Environment. In LLWA 03 - Tagungsband der GI-Workshop-Woche Lernen - Lehren - Wissen - Adaptivitat, 2003.


Klinkenberg/Rueping/2003a Klinkenberg, Ralf and RĂ¼ping, Stefan. Concept Drift and the Importance of Examples. In Franke, Jurgen and Nakhaeizadeh, Gholamreza and Renz, Ingrid (editors), Text Mining -- Theoretical Aspects and Applications, Seiten 55--77, Berlin, Germany, Physica-Verlag, 2003.  


Klinkenberg/Renz/98b Klinkenberg, Ralf and Renz, Ingrid. Adaptive Information Filtering: Learning Drifting Concepts. In Wysotzki, F. and Geibel, P. and Schadler, K. (editors), Beitrage zum Treffen der GI-Fachgruppe 1.1.3 Maschinelles Lernen (FGML-98), No. 98/11, Seiten 98--105, Germany, Fachbereich Informatik, TU Berlin, 1998.


Klinkenberg/Renz/98a Klinkenberg, Ralf and Renz, Ingrid. Adaptive Information Filtering: Learning in the Presence of Concept Drifts. In Sahami, Mehran and Craven, Mark and Joachims, Thorsten and McCallum, Andrew (editors), Workshop Notes of the ICML/AAAI-98 Workshop \em Learning for Text Categorization, Seiten 33--40, Menlo Park, CA, USA, AAAI Press, 1998.


Klinkenberg/Joachims/2000a Klinkenberg, Ralf and Joachims, Thorsten. Detecting Concept Drift with Support Vector Machines. In Langley, Pat (editors), Proceedings of the Seventeenth International Conference on Machine Learning (ICML), Seiten 487--494, San Francisco, CA, USA, Morgan Kaufmann, 2000.


Klinkenberg/98a Klinkenberg, Ralf. Maschinelle Lernverfahren zum adaptiven Informationsfiltern bei sich verandernden Konzepten. Fachbereich Informatik, Universitat Dortmund, Germany, 1998.


Klinkenberg/2004a Klinkenberg, Ralf. Learning Drifting Concepts: Example Selection vs. Example Weighting. In Intelligent Data Analysis (IDA), Special Issue on Incremental Learning Systems Capable of Dealing with Concept Drift, Vol. 8, No. 3, Seiten 281--300, 2004.  


Klinkenberg/2003a Klinkenberg, Ralf. Predicting Phases in Business Cycles Under Concept Drift. In Hotho, Andreas and Stumme, Gerd (editors), LLWA 2003 -- Tagungsband der GI-Workshop-Woche \em Lehren -- Lernen -- Wissen -- Adaptivitat, Proceedings of the Workshop Week \em Teaching -- Learning -- Knowledge -- Adaptivity of the National German Computer Science Society (GI) / Annual Workshop on Machine Learning, Seiten 3--10, Karlsruhe, Germany, 2003.


Fischer/etal/2002a Fischer, Simon and Klinkenberg, Ralf and Mierswa, Ingo and Ritthoff, Oliver. \sc Yale: Yet Another Learning Environment -- Tutorial. No. CI-136/02, Collaborative Research Center 531, University of Dortmund, Dortmund, Germany, 2002.


Scholz/Klinkenberg/2005a Scholz, Martin and Klinkenberg, Ralf. An Ensemble Classifier for Drifting Concepts. In Gama, J. and Aguilar-Ruiz, J. S. (editors), Proceedings of the Second International Workshop on Knowledge Discovery in Data Streams, Seiten 53--64, Porto, Portugal, 2005.


Scholz/Klinkenberg/2006a Scholz, Martin and Klinkenberg, Ralf. Boosting Classifiers for Drifting Concepts. No. 6/06, Collaborative Research Center on the Reduction of Complexity for Multivariate Data Structures (SFB 475), University of Dortmund, Dortmund, Germany, 2006.


Scholz/Klinkenberg/2006b Scholz, Martin and Klinkenberg, Ralf. Boosting Classifiers for Drifting Concepts. In Intelligent Data Analysis (IDA), Special Issue on Knowledge Discovery from Data Streams, Vol. 11, No. 1, Seiten 3--28, 2007.  


Mierswa/etal/2006a Mierswa, Ingo and Wurst, Michael and Klinkenberg, Ralf and Scholz, Martin and Euler, Timm. YALE: Rapid Prototyping for Complex Data Mining Tasks. In ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (KDD 2006), Seiten 935--940, ACM, New York, USA, ACM Press, 2006.