Das Data-Stream-Plugin (vormals Concept-Drift-Plugin) für RapidMiner (vormals YALE (Yet Another Learning Environment)), einer kostenlosen im Quellcode erhältlichen Softwareumgebung für maschinelles Lernen, Data Mining und Wissensentdeckung (Knowledge Discovery), erweitert RapidMiner um Operatoren zur Behandlung realer und simulierter zeitlicher Veränderungen in Datenströmen (Concept Drift in Data Streams).
Die Operatoren dieses Plugins zum Analysieren von Datenströmen (Data Stream Mining) und zum Lernen und Verfolgen zeitlich veränderlicher Zielkonzepte (Concept Drift Tracking) können mit allen anderen Operatoren von RapidMiner kombiniert werden. Beispielsweise können die Vorverarbeitungsoperatoren von RapidMiner für Audio-Daten und Texte verwendet werden, um zeitliche Veränderungen eines zu lernenden Zielkonzepts in Audio- oder Textdatenströmen automatisch zu erkennen und zu behandeln und alle maschinellen Klassifikations-Lernverfahren von RapidMiner (und WEKA) können mit den angebotenen Rahmenverfahren zur Concept-Drift-Behandlung kombiniert werden. Allerdings setzen mancher dieser Rahmenverfahren zur Concept-Drift-Behandlung Basislernverfahren voraus, die in der Lage sind, ihre Performanz (Vorhersagegenauigkeit bzw. erwarteten Vorhersagefehler) zu schätzen.
Die Rahmenverfahren zur Concept-Drift-Behandlung, die von diesem Plugin angeboten werden, umfassen die folgenden:
Das Data-Stream-Plugin und sein Quellcode sind von der RapidMiner Download-Seite herunterladbar. Zur Installation und Verwendung des Plugins reicht es, die Datei rapidminer-datastream-4.0beta.jar ins lib/plugins/ Unterverzeichnis der RapidMiner-Installation. Bei Microsoft Windows Systemen kann alternativ der Windows Auto Installer verwendet werden (rapidminer-datastream-4.0beta-installer.exe).
Bei Fragen wenden Sie sich bitte an Ralf Klinkenberg.
| Mierswa/etal/2003a | Mierswa, Ingo and Klinkenberg, Ralf and Fischer, Simon and Ritthoff, Oliver. A Flexible Platform for Knowledge Discovery Experiments: YALE -- Yet Another Learning Environment. In LLWA 03 - Tagungsband der GI-Workshop-Woche Lernen - Lehren - Wissen - Adaptivitat, 2003. |
| Klinkenberg/Rueping/2003a | Klinkenberg, Ralf and RĂ¼ping, Stefan. Concept Drift and the Importance of Examples. In Franke, Jurgen and Nakhaeizadeh, Gholamreza and Renz, Ingrid (editors), Text Mining -- Theoretical Aspects and Applications, Seiten 55--77, Berlin, Germany, Physica-Verlag, 2003. |
| Klinkenberg/Renz/98b | Klinkenberg, Ralf and Renz, Ingrid. Adaptive Information Filtering: Learning Drifting Concepts. In Wysotzki, F. and Geibel, P. and Schadler, K. (editors), Beitrage zum Treffen der GI-Fachgruppe 1.1.3 Maschinelles Lernen (FGML-98), No. 98/11, Seiten 98--105, Germany, Fachbereich Informatik, TU Berlin, 1998. |
| Klinkenberg/Renz/98a | Klinkenberg, Ralf and Renz, Ingrid. Adaptive Information Filtering: Learning in the Presence of Concept Drifts. In Sahami, Mehran and Craven, Mark and Joachims, Thorsten and McCallum, Andrew (editors), Workshop Notes of the ICML/AAAI-98 Workshop \em Learning for Text Categorization, Seiten 33--40, Menlo Park, CA, USA, AAAI Press, 1998. |
| Klinkenberg/Joachims/2000a | Klinkenberg, Ralf and Joachims, Thorsten. Detecting Concept Drift with Support Vector Machines. In Langley, Pat (editors), Proceedings of the Seventeenth International Conference on Machine Learning (ICML), Seiten 487--494, San Francisco, CA, USA, Morgan Kaufmann, 2000. |
| Klinkenberg/98a | Klinkenberg, Ralf. Maschinelle Lernverfahren zum adaptiven Informationsfiltern bei sich verandernden Konzepten. Fachbereich Informatik, Universitat Dortmund, Germany, 1998. |
| Klinkenberg/2004a | Klinkenberg, Ralf. Learning Drifting Concepts: Example Selection vs. Example Weighting. In Intelligent Data Analysis (IDA), Special Issue on Incremental Learning Systems Capable of Dealing with Concept Drift, Vol. 8, No. 3, Seiten 281--300, 2004. |
| Klinkenberg/2003a |
Klinkenberg, Ralf.
Predicting Phases in Business Cycles Under Concept Drift.
In
Hotho, Andreas and Stumme, Gerd (editors),
LLWA 2003 -- Tagungsband der GI-Workshop-Woche \em Lehren -- Lernen -- Wissen -- Adaptivitat, Proceedings of the Workshop Week \em Teaching -- Learning -- Knowledge -- Adaptivity of the National German Computer Science Society (GI) / Annual Workshop on Machine Learning,
Seiten 3--10,
Karlsruhe, Germany,
2003.
klinkenberg_2003a.ps.gz [56 KB]
|
| Fischer/etal/2002a |
Fischer, Simon and Klinkenberg, Ralf and Mierswa, Ingo and Ritthoff, Oliver.
\sc Yale: Yet Another Learning Environment -- Tutorial.
No. CI-136/02,
Collaborative Research Center 531, University of Dortmund,
Dortmund, Germany,
2002.
fischer_etal_2002a.pdf [819 KB]
fischer_etal_2002a.pdf.gz [434 KB] fischer_etal_2002a.ps.gz [176 KB] |
| Scholz/Klinkenberg/2005a | Scholz, Martin and Klinkenberg, Ralf. An Ensemble Classifier for Drifting Concepts. In Gama, J. and Aguilar-Ruiz, J. S. (editors), Proceedings of the Second International Workshop on Knowledge Discovery in Data Streams, Seiten 53--64, Porto, Portugal, 2005. |
| Scholz/Klinkenberg/2006a | Scholz, Martin and Klinkenberg, Ralf. Boosting Classifiers for Drifting Concepts. No. 6/06, Collaborative Research Center on the Reduction of Complexity for Multivariate Data Structures (SFB 475), University of Dortmund, Dortmund, Germany, 2006. |
| Scholz/Klinkenberg/2006b | Scholz, Martin and Klinkenberg, Ralf. Boosting Classifiers for Drifting Concepts. In Intelligent Data Analysis (IDA), Special Issue on Knowledge Discovery from Data Streams, Vol. 11, No. 1, Seiten 3--28, 2007. |
| Mierswa/etal/2006a | Mierswa, Ingo and Wurst, Michael and Klinkenberg, Ralf and Scholz, Martin and Euler, Timm. YALE: Rapid Prototyping for Complex Data Mining Tasks. In ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (KDD 2006), Seiten 935--940, ACM, New York, USA, ACM Press, 2006. |