Der Lehrstuhl 8 der Fakultät für Informatik beschäftigt sich mit dem weitläufigen Gebiet des maschinellen Lernens. Insbesondere steht dabei die praktische Umsetzung von Lernverfahren, die Entwicklung von Algorithmen für herausfordernde Probleme im Vordergrund.
Der Lehrstuhl 8 Künstliche Intelligenz hat neue Webseiten. Diese finden Sie unter
Das Sekretariat des LS8 ist vom 24.12.2022 bis einschließlich 08.01.2023 nicht besetzt. In dieser Zeit ist die TU Dortmund komplett geschlossen.
Mit guten Wünschen für eine geruhsame, friedliche Weihnachtszeit und einen zuversichtlichen, gesunden Start in das Jahr 2023! LS8-Team
Der Statistiker John Ioannidis von Stanford veröffentlicht eine Liste mit den 100.000 einflussreichsten Wissenschaftlern (domänenübergreifend).
In dem single-year Ranking der aktuellen Ausgabe (basierend auf den Daten für das Jahr 2021, veröffentlicht November 2022) rangiert Prof. Schubert auf dem Platz 92735.
Die TU Dortmund ist mit 17 Mitgliedern in den Top 100.000 vertreten, angeführt von Erman Tekkaya (Maschinenbau, #25235) und Oliver Kayser (Biochemie, #38430). Unser Rektor Manfred Bayer (Physik, #87172) ist ebenso enthalten wie mit Boris Otto (Industrielles Informationsmanagement, #78427) ein weiterer an der Informatik kooptierter Professor. Knapp verpasst hat den Einzug Günter Rudolph (#105622).
Das Ranking basiert auf den Scopus-Daten von Elsevier und dem vom Stanford-Statistiker John Ioannidis entwickelten composite citation index (c-score), in den unter anderem Zitationszahlen (ohne Selbstzitate), h-Index und hm-Index aber auch die Autorenreihenfolge skaliert einfließen. Dennoch basiert jedes derartige Ranking auf Designentscheidungen und Daten die bestimmte Domänen oder Autoren bevorzugen können, e.g., waren die Elsevier Scopus-Daten immer sehr journal-zentriert und haben die in der Informatik wichtigen Konferenzen lange Zeit weitgehend ignoriert.
In dem ähnlichen "career" ranking sind 19 Mitglieder der TU Dortmund enthalten, unter anderem die drei Informatiker Günter Rudolph (#43603), Ingo Wegener (#67497) und Bernhard Steffen (#75346).
Amal Saadallah hat ihre Dissertation Explainable Adaptation of Time Series Forecasting am Lehrstuhl für Künstliche Intelligenz mit sehr gutem Ergebnis (magna cum laude) verteidigt. In ihrer Arbeit befasst sie sich mit der Online-Verwaltung vieler Modelle für die Zeitreihenprognose, der Kombination von Methoden des maschinellen Lernens und Prozesssimulationssystemen sowie der erklärbaren modellbasierten Qualitätsvorhersage in der Industrie 4.0.
Die Mitglieder des Promotionskomitees waren Prof. Dr. Katharina Morik (Betreuerin und Erstgutachterin), Prof. Dr. Barbara Hammer (Zweitgutachterin, Universität Bielefeld), Prof. Dr. Petra Wiederkehr (Vorsitzende) und Jun.-Prof. Dr. Thomas Liebig (Vertreter der Fakultät). Amal Saadallah ist wissenschaftliche Mitarbeiterin am LS8 und Mitglied des Sonderforschungsbereiches 876 (Projekt B3).
Lukas Pfahler hat seine Dissertation Some Representation Learning Tasks and the Inspection of Their Models am Lehrstuhl für Künstliche Intelligenz mit Auszeichnung (summa cum laude) verteidigt. Seine Forschungsschwerpunkte umfassen Representation Learning mit unüberwachten Verfahren, unter anderem zur Suche nach verwandten und relevanten Formeln in wissenschaftlichen Arbeiten mithilfe von Graph-Convolutional Neural Networks. Außerdem untersuchte er Verfahren aus dem Bereich Trustworthy ML zur Inspektion von Modellen.
Die Mitglieder des Promotionskomitees waren Prof. Dr. Katharina Morik (Betreuerin und Erstgutachterin), Prof. Dr. Andreas Hotho (Zweitgutachter, Julius-Maximilians-Universität Würzburg), Prof. Dr. Jakob Rehof (Vorsitzender) und Priv.-Doz. Dr. habil Frank Weichert (Vertreter der Fakultät). Lukas Pfahler ist wissenschaftlicher Mitarbeiter am LS8 und Mitglied des Sonderforschungsbereiches 876 (Projekt A1).
Mirko Bunse hat seine Dissertation Machine Learning for Acquiring Knowledge in Astro-Particle Physics am Lehrstuhl für Künstliche Intelligenz mit sehr gutem Ergebnis (magna cum laude) verteidigt. In seiner Arbeit erforscht er die vielfältigen Anwendungen maschineller Lernalgorithmen in der Astroteilchen-Physik. Er widmet sich insbesondere der intelligenten und ressourcen-gewahren Steuerung von Simulationen durch Active Class Selection und der domänen-spezifischen Aggregation von Vorhersagen im Sinne von Quantification und Unfolding.
Die Mitglieder des Promotionskomitees waren Prof. Dr. Katharina Morik (Betreuerin und Erstgutachterin), Dr. Fabrizio Sebastiani (Zweitgutachter, Consiglio Nazionale delle Ricerche, Pisa), Prof. Dr. Johannes Fischer (Vorsitzender) und Jun.-Prof. Dr. Thomas Liebig (Vertreter der Fakultät). Mirko Bunse ist wissenschaftlicher Mitarbeiter am LS8, Mitglied des Sonderforschungsbereiches 876 (Projekt C3) und Koordinator für das Anwendungsfeld Astroteilchenphysik am Lamarr-Institut für Maschinelles Lernen und Künstliche Intelligenz (ehemals Kompetenzzentrum ML2R).
Das 3. trilaterale Symposium zur Künstlichen Intelligenz von Japan, Deutschland und Frankreich fand am 27.10.2022 in Tokio statt. Katharina Morik leitete die Session zu Smart Cities mit je zwei Sprechern der drei Länder. Sie selbst stellte die EU-Projekte INSIGHT und VAVEL (Koordinator: Dimitrios Gunopoulos) vor, an denen sie und Thomas Liebig teilgenommen haben. Die abschließende Diskussion behandelte die Beschaffung von Mobilitätsdaten und die Interaktion der vielen Beteiligten. Wie können Verkehrsunternehmen, kommunale Institutionen, IT-Firmen und Nutzer gut zusammen arbeiten.
Auf der Konferenz SISAP 2022 an der Universität Bologna wurde Lars Lenssen mit dem "best student paper award" ausgezeichnet für den Beitrag "Lars Lenssen, Erich Schubert. Clustering by Direct Optimization of the Medoid Silhouette. In: Similarity Search and Applications. SISAP 2022. https://doi.org/10.1007/978-3-031-17849-8_15".
Der Springer-Verlag unterstützt diese Konferenz, und stellt ein Preisgeld für diese Auszeichnung. Die besten Beiträge der Konferenz werden zudem eingeladen, eine erweiterte Fassung für ein Special Issue des A*-Journals "Information Systems" einzureichen.
In diesem Artikel wird ein Clusteringverfahren vorgestellt, dass direkt die Medoid Silhouette optimiert, eine Variante des populären Qualitätsmaßes Silhouette; dabei ist das neue Verfahren aber O(k²) Mal schneller ist als bisherige Vorschläge. Dadurch können nun viel größere Datenmengen mit diesem Ansatz geclustert werden, den gerade bei großem k ist das neue Verfahren um Größenordnungen schneller und effizienter als bisherige Ansätze. Die Implementierung ist verfügbar im Rust "kmedoids" crate sowie dem Python-Paket "kmedoids", der Quellcode ist als Open Source auf Github.
Bereits 2020 war die Arbeitsgruppe bei dieser Auszeichnung erfolgreich, damals vertreten durch Erik Thordsen mit dem Beitrag "Erik Thordsen, Erich Schubert. ABID: Angle Based Intrinsic Dimensionality. In: Similarity Search and Applications. SISAP 2020. https://doi.org/10.1007/978-3-030-60936-8_17".
In diesem Beitrag wurde eine neuartige winkel-basierte Schätzung der lokalen intrinsischen Dimensionalität (einem Maß für die lokale Komplexität von Daten) vorgestellt hat, für das bisher normalerweise distanzbasierte Ansätze verwendet werden.
Sebastian Buschjäger hat seine Dissertation Ensemble Learning with Discrete Classifiers on Small Devices am Lehrstuhl für Künstliche Intelligenz mit Auszeichnung (summa cum laude) verteidigt. Er hat im Rahmen des Sonderforschungsbereichs 876, Projekt A1 zum Thema ressourcengewahres Maschinelles Lernen geforscht. Dabei erforschte er Ensemblemethoden im Kontext von eingebetteten Systemen. Dies beinhaltete das Training sowie das Deployment von Entscheidungswäldern auf kleinen Geräten.
Die Mitglieder des Promotionskomitees waren Prof. Dr. Katharina Morik (Betreuerin und Erstgutachterin), Prof. Johannes Fürnkranz (Zweitgutachter, Universität Linz), Prof. Dr. Jian-Jia Chen (Vorsitzender) und Prof. Dr. Jens Teubner (Vertreter der Fakultät). Sebastian Buschjäger ist wissenschaftlicher Mitarbeiter am LS8 und Mitglied des Sonderforschungsbereichs 876 (Projekt A1).
Als „Vordenker 2022“ wurde der Technologie-Pionier für autonomes Fahren, Prof. Sebastian Thrun, am 15. September an der Goethe-Universität Frankfurt ausgezeichnet. Der ehemalige Vize-Direktor von Google und Stanford-Professor hat die online-Lernplattform Udacity gegründet und widmet sich jetzt dem autonomen Fliegen. In seiner Rede würdigte er Katharina Morik als führende Vorreiterin im Feld des Künstlichen Lernens. Prof. Thrun sagte, sie „war damals bereits die Göttin des Künstlichen Lernens. Die Allererste, die es in Deutschland gemacht hat und bis heute ganz führend ist.“ In dem Panel erklärte Prof. Morik, wie Künstliche Intelligenz dabei helfen kann, Arbeit produktiver, sicherer und umweltfreundlicher zu gestalten und so Kapazitäten für Soziales zu schaffen. Die Direktorin des Lamarr-Instituts für Maschinelles Lernen und Künstliche Intelligenz stellte zudem die Lamarr-Forschung zur verständlichen Kommunikation Künstlicher Intelligenz in Form sogenannter Care Labels vor.
Ein Mitschnitt der Veranstaltung ist online abrufbar:
(Weiter... )
Mit dem 1. Juli 2022 tritt das Kompetenzzentrum ML2R, an welchem neben dem Lehrstuhl 8 für Künstliche Intelligenz an der TU Dortmund auch die Fraunhofer Institute IAIS und IML sowie die Universität Bonn beteiligt sind, in eine langfristige, institutionelle Förderung durch den Bund und das Land Nordrhein-Westfalen ein. Das Lamarr-Institut für Maschinelles Lernen und Künstliche Intelligenz baut auf den Erfolgen des ML2R auf und widmet sich der wertebasierten Erforschung und Entwicklung von leistungsfähiger und gleichzeitig vertrauenswürdiger sowie ressourcenschonender Künstlicher Intelligenz.
TU-Professorin Katharina Morik wird auch im neuen internationalen KI- Spitzenzentrum als Co-Direktorin die Leitung innehaben. Das Lamarr-Institut ist eines von fünf deutschen KI-Kompetenzzentren, die bislang als Projekte zeitlich befristet gefördert wurden und jetzt mit einer institutionellen Förderung als dauerhafte Einrichtungen verstetigt werden. Gemeinsam mit dem DFKI bilden sie den Nukleus der deutschen KI-Forschung.
Erhalten Sie erste Einblicke in das Lamarr-Institut: https://lamarr-institute.org/
(Weiter... )Wir haben es alle schon einmal gehört: KI nimmt uns die Arbeitsplätze weg! – Aber stimmt das? Am 07.04.2022 trafen sich 4 Expert*innen, moderiert von Katja Scherer, um über das Thema zu diskutieren und Möglichkeiten aufgezeigt, wie wir als Gesellschaft mit der technologischen Innovation umgehen können.
Am Lehrstuhl VIII der Fakultät für Informatik ist ab sofort eine Stelle für Hilfskräfte (SHK / WHF) im Bereich Federated Learning zu besetzen. Der Stundenumfang kann individuell besprochen werden. Das Angebot richtet sich an Studierende der Informatik, die ihr Studium bisher mit sehr gutem Erfolg absolviert haben.
Mehr Informationen zur Ausschreibung sowie Ihrer Bewerbung finden Sie hier
Am Lehrstuhl VIII der Fakultät für Informatik sind ab sofort mehrere Stellen für Hilfskräfte (SHK / WHF) zu besetzen. Der Stundenumfang kann individuell besprochen werden. Das Angebot richtet sich an Studierende der Informatik, die ihr Studium bisher mit sehr gutem Erfolg absolviert haben.
Mehr Informationen zur Ausschreibung sowie Ihrer Bewerbung finden Sie hier
Mit Freude geben wir bekannt, dass Pierre Haritz, Helena Kotthaus, Thomas Liebig und Lukas Pfahler den "Best Paper Award" für die Veröffentlichung "Self-Supervised Source Code Annotation from Related Research Papers" auf dem IEEE ICDM PhD Forum 2021 erhalten haben.
Um das Verständnis und die Wiederverwendbarkeit von fremdem Quellcode zu erhöhen, schlägt das Paper ein prototypisches Tool auf Basis von BERT-Modellen vor. Das zugrundeliegende neuronale Netz lernt gemeinsame Strukturen zwischen wissenschaftlichen Veröffentlichungen und ihren Implementierungen anhand im Text und Quellcode vorkommender Variablen und soll dazu benutzt werden, um wissenschaftlichen Code mit Informationen aus der jeweiligen Veröffentlichung zu annotieren.
(Weiter... )
Das 6GEM-Konsortium bündelt wissenschaftliche Exzellenz und Mobilfunkexpertise auf Netzwerk-, Material-, Komponenten-/Mikrochip- und Modulebene in Nordrhein-Westfalen. Verfolgt wird ein ganzheitlicher Ansatz, von der Produktion über die Logistik bis hin zum Menschen mit seinen Bedürfnissen nach Selbstbestimmung, Privatsphäre und Sicherheit in Zeiten des Klimawandels.
Aufbauend auf früheren Beiträgen im SFB 876 wird das LS8-Projektteam neuartige, echtzeitfähige 6G-Netztechnologien und innovative 6G-Anwendungsfelder erforschen. Die Ergebnisse werden unter anderem in die Standardisierung offener 6G-Netze, Open-Source-Projekte für softwaredefinierte Netze und Patente einfließen.
Prof. Christian Wietfeld vom Lehrstuhl für Kommunikationsnetze ist der Sprecher der TU Dortmund im 6GEM-Projekt. Aus der Fakultät für Elektrotechnik und Informationstechnik sind außerdem die Bereiche Eingebettete Systeme, Hochfrequenztechnik und Energieeffizienz beteiligt. Aus der Fakultät Informatik sind die Bereiche Design Automation for Embedded Systems und Smart City Science beteiligt. Aus der Fakultät für Maschinenbau ist der Bereich Materialhandhabung und Lagerhaltung beteiligt.
(Weiter... )
Der Bericht des Projekts der Volkswagen Stiftung zu Reflektierender KI ist nun erschienen. Dabei geht es um Möglichkeiten, die Aufmerksamkeit auf Implikationen des Gebrauchs von Systemen mit künstlicher Intelligenz zu lenken.
Die sichere und verantwortungsvolle Nutzung von KI kann nicht ausschließlich durch technologische Neuerungen und Regulierung gelingen — obwohl beides wichtig ist. Viele Probleme entstehen aufgrund der fehlenden persönlichen und gesellschaftlichen Erfahrung mit KI. Die Probleme spiegeln Vorurteile und Ungleichbehandlungen in Daten und Algorithmen ebenso wider wie die in Organisationsstrukturen und sozialen Kontexten, in denen KI entwickelt und verwendet wird.
Die Wissenschaftler Mirko Bunse (Sonderforschungsbereich/SFB 876) und Lukas Heppe (ML2R) haben den zweiten Platz in der Ariel Machine Learning Data Challenge auf der europäischen Fachkonferenz ECML PKDD 2021 belegt. Das Forscherteam entwickelte ein mehrstufiges Deep-Learning-Verfahren zur Analyse von stark verrauschten Zeitreihendaten. Mittels Datenvorverarbeitung bündelten sie hierbei Informationen des Datensatzes und des Rauschverhaltens. Diese Bündelung erlaubte es, neuronale Netze so effizient zu trainieren, dass ein Ensemble aus 45 einzelnen Netzen erzeugt werden konnte. Der entwickelte Ansatz wies einen durchschnittlichen Vorhersagefehler von nur drei Prozent auf.
Mehr Informationen zur Ariel Machine Learning Data Challenge
Veranstaltungsdatum: 15. Juli 2021 16:15
Abstract - Graph Neural Networks (GNNs) sind zu einem beliebten Werkzeug für das Lernen von Repräsentationen graph-strukturierter Eingaben geworden, mit Anwendungen in der Computerchemie, Empfehlungsforschung, Pharmazie, Argumentation und vielen anderen Bereichen. In diesem Vortrag werde ich einige aktuelle Ergebnisse zum Lernen mit Message-Passing GNNs vorstellen. Insbesondere besitzen GNNs wichtige Invarianzen und induktive Verzerrungen, die das Lernen und die Generalisierung beeinflussen. Wir setzen diese Eigenschaften und die Wahl der "Aggregationsfunktion" in Beziehung zu Vorhersagen innerhalb und außerhalb der Trainingsverteilung.
Dieser Vortrag basiert auf einer gemeinsamen Arbeit mit Keyulu Xu, Jingling Li, Mozhi Zhang, Simon S. Du, Ken-ichi Kawarabayashi, Vikas Garg und Tommi Jaakkola.
Kurzbiografie - Stefanie Jegelka ist außerordentliche Professorin im Department of EECS am MIT. Sie ist Mitglied des Computer Science and AI Lab (CSAIL), des Zentrums für Statistik und ein Mitglied des IDSS und des ORC. Bevor sie zum MIT kam, war sie als Postdoc an der UC Berkeley tätig und promovierte an der ETH Zürich und am Max-Planck-Institut für Intelligente Systeme. Stefanie erhielt ein Sloan-Forschungsstipendium, einen NSF CAREER Award, einen DARPA Young Faculty Award, einen Google-Forschungspreis, einen Two Sigma-Fakultätsforschungspreis, den Deutschen Mustererkennungspreis und einen Best Paper Award auf der International Conference for Machine Learning (ICML). Ihre Forschungsinteressen umfassen die Theorie und Praxis des algorithmischen maschinellen Lernens.
Im Gespräch zum Thema „Künstliche Intelligenz: Spitzenforschung und Anwendungen aus NRW“ berichtete Prof. Dr. Katharina Morik, Leiterin des Lehrstuhls für Künstliche Intelligenz und Sprecherin des Sonderforschungsbereich 876, live in der TU Dortmund über das Forschungsfeld Künstlicher Intelligenz und dabei unter anderem über den SFB 876. Sie erklärte hierbei, warum Maschinelles Lernen wichtig ist, um die Zukunft Deutschlands zu sichern. Teilnehmende der virtuellen Veranstaltung konnten live mitdiskutieren.
Ein Mitschnitt der Veranstaltung ist online verfügbar!
https://www.digitalstrategie.nrw/digitalnrw/de/process/55642
Im Rahmen des Digitaltages 2021 veranstaltet das Kompetenzzentrum Maschinelles Lernen Rhein-Ruhr (ML2R) gemeinsam mit dem Software-Hersteller RapidMiner einen virtuellen Hands-On Workshop. Die Aktion am 18. Juni unter dem Leitmotto „Maschinelles Lernen: Ein Einstieg in die Schlüsseltechnologie Künstlicher Intelligenz“ ermöglicht Teilnehmenden jedweder Vorkenntnis spannende Einblicke in die Grundlagen maschineller Lernverfahren (ML) sowie anschauliche Anwendungsbeispiele. Unter Einsatz der graphischen Software RapidMiner lernen die Teilnehmenden zudem einen typischen ML-Arbeitsablauf kennen. Anhand einer konkreten Problemstellung werden die Arbeitsschritte Datenaufbereitung, Modellbildung, Training, Prognose und Validierung erläutert und beispielhaft, unter Anleitung eines KI-Trainers, in der Software RapidMiner Studio durchgeführt.
Eine Registrierung für die Veranstaltung ist kostenlos. Schreiben Sie hierfür eine E-Mail an ann-kathrin.oster@tu-dortmund.de. Sie erhalten in der Folge die Zugangsdaten zur Veranstaltung sowie Instruktionen zur kostenfreien Installation der "RapidMiner Studio" Software, welche für den Praxisteil des Workshops benötigt wird.
Diese Stelle ist in der Fakultät für Informatik im Sonderforschungsbereich 876 (SFB 876) zum nächstmöglichen Zeitpunkt befristet bis zum 31.12.2022 zu besetzen. Die Tätigkeit wird nach Entgeltgruppe 13 TV-L vergütet.
Details finden Sie hier: https://karriere.tu-dortmund.de/job/view/802/referentin-referent-fuer-forschung-und-wissenschaft-m-w-d-ref-nr-083-21e?page_lang=de
Am Lehrstuhl VIII der Fakultät für Informatik ist ab sofort eine Stelle für Hilfskräfte (SHK / WHF) zu besetzen. Der Stundenumfang kann individuell besprochen werden. Das Angebot richtet sich an Studierende der Informatik, die ihr Studium bisher mit sehr gutem Erfolg absolviert haben. Konkret geht es in dieser Ausschreibung um die Umsetzung und Weiterentwicklung existierender Verfahren sowie deren Evaluation auf kleinen Geräten.
Mehr Informationen zur Stelle sowie Ihrer Bewerbung finden Sie hier
Die Initiative „She transforms IT” widmet sich der Stärkung von Frauen und Mädchen in der IT und zielt auf ihre verstärkte Teilhabe der Digitalisierung ab. Zu diesem Zweck setzt sich die Initiative unter anderem für die Förderung der Digitalkompetenz von Mädchen, die Sichtbarmachung von Frauen in der IT sowie eine Transformation hin zu diverseren und besser vernetzten Angeboten für Frauen in Forschung und Lehre ein.
Prof. Dr. Katharina Morik, Professorin für Künstliche Intelligenz sowie Sprecherin des Kompetenzzentrums ML2R und des Sonderforschungsbereiches 876, war unter den ersten 50 Unterzeichner*innen der Initiative, welche beim Digital-Gipfel 2020 vorgestellt wurde.
Das Kompetenzzentrum Maschinelles Lernen Rhein-Ruhr (ML2R) hat seinen neuen Blog veröffentlicht: https://machinelearning-blog.de. In den Rubriken Anwendung, Forschung und Grundlagen geben Forschende des Kompetenzzentrums und renommierte Gastautor*innen spannende Einblicke in wissenschaftliche Erkenntnisse, interdisziplinäre Projekte und für die Praxis relevante Ergebnisse rund um Maschinelles Lernen (ML) und Künstliche Intelligenz (KI). Das Kompetenzzentrum ML2R trägt zukunftsweisende Technologien und Forschungsergebnisse in Unternehmen und Gesellschaft.
Den Auftakt machen sieben Beiträge: die vierteilige Grundlagenserie ML-Basics sowie jeweils ein Beitrag in den Rubriken Anwendung, Forschung und Grundlagen. Die Autor*innen erläutern hier, warum KI erklärbar sein muss, wie unvollständige Satellitenbilder durch Maschinelles Lernen vervollständigt werden können und zeigen Verfahren zur automatisierten Vergabe von Stichworten für Kurztexte.
An der TU Dortmund, Fakultät für Informatik, Lehrstuhl VIII ist ab sofort eine Stelle für Hilfskräfte (SHK / WHF) zu besetzen. Der Stundenumfang kann individuell besprochen werden. Das Angebot richtet sich an Studierende der Informatik, die ihr Studium bisher mit sehr gutem Erfolg absolviert haben. Wir bieten Ihnen die Möglichkeit zur Mitarbeit in Forschung und Entwicklung im Rahmen nationaler und internationaler Projekte.
Am Lehrstuhl VIII der Fakultät für Informatik ist ab sofort eine Stelle für Hilfskräfte (SHK / WHF) zu besetzen. Der Stundenumfang kann individuell besprochen werden. Das Angebot richtet sich an Studierende der TU Dortmund und der FH Dortmund, welche Erfahrung in der Recherche von Sachverhalten haben und zudem über Web-Programmierkenntnisse verfügen. Die Ausschreibung richtet sich explizit nicht ausschließlich an Studierende des Fachbereichs Informatik, sondern steht auch Studierenden mit anderen Studienschwerpunkten bei entsprechender Eignung offen.
Mehr Informationen zur Stelle sowie Ihrer Bewerbung finden Sie hier
Wie kann KI nachhaltiger werden? Zu diesem Thema diskutierte Prof. Dr. Katharina Morik in einem Panel auf dem Digital-Gipfel 2020. Der seit 2016 unter wechselnden Schwerpunkten durch das Bundesministerium für Wirtschaft und Energie (BMWI) veranstaltete Digital-Gipfel stand in diesem Jahr unter dem Leitthema „Digital nachhaltiger leben“.
Im Rahmen einer Paneldiskussion hob Katharina Morik das ressourcenschonende Potenzial maschineller Lernverfahren hervor. Gleichwohl betonte sie den hohen Energieverbrauch der Lernverfahren, zum Beispiel beim Speichern und Trainieren tiefer neuronaler Netze. Prof. Morik leitet den Sonderforschungsbereich 876 und das Kompetenzzentrum ML2R, welche sich in ihrer Forschung unter anderem dem Maschinellen Lernen unter Ressourcenbeschränkung widmen.
Weitere Informationen zur Veranstaltung: Digital-Gipfel 2020
Das Kompetenzzentrum ML2R hat einen Bericht zu seinen Aktivitäten seit der Gründung 2018 veröffentlicht. Der Report, welcher einen Überblick über Forschungs- und Transferprojekte, Kollaborationsangebote und -partner sowie durchgeführte Veranstaltungen gibt, ist online verfügbar. Seit seiner Gründung im Jahr 2018, forschen Wissenschaftlerinnen und Wissenschaftler des Kompetenzzentrums ML2R zu zukunftsweisenden Technologien der Künstlichen Intelligenz (KI) und des Maschinellen Lernens (ML), treiben den Transfer von Forschung in die Industrie voran und schaffen nationale sowie internationale Sichtbarkeit für die hiesige KI-Forschung.
Prof. Dr. Katharina Morik, Professorin für Künstliche Intelligenz, leitet das Kompetenzzentrum gemeinsam mit Prof. Dr. Stefan Wrobel (Fraunhofer IAIS) in Ihrer Funktion als Sprecherin des ML2R. In einem nun erschienenen und online verfügbaren Bericht, präsentiert das ML2R Highlights aus zwei Jahren Arbeit. Erfahren Sie mehr über spannende Forschungs- und Flagship-Projekte sowie Kooperationsangebote, erhalten Sie Einblicke in das facettenreiche Netzwerk des Kompetenzzentrums und lassen Sie ereignisreiche ML2R-Veranstaltungen Revue passieren.
An der TU Dortmund, Fakultät für Informatik, Lehrstuhl VIII ist ab sofort eine Stelle für Hilfskräfte (SHK / WHF) zu besetzen. Der Stundenumfang kann individuell besprochen werden. Das Angebot richtet sich an Studierende der Informatik mit abgeschlossenem Grundstudium (Semester 1-4) und ersten Erfahrungen mit Methoden des maschinellen Lernens. Wir bieten Ihnen die Möglichkeit zur Mitarbeit in Forschung und Entwicklung im Rahmen nationaler und internationaler Projekte.
zur Stellenausschreibung Informatik
Die aktuelle Veranstaltung der Reihe „Grand Challenges: Answers from North Rhine-Westphalia“ nahm das Thema „KI made in NRW: Nachhaltigkeit und Vertrauenswürdigkeit für künstliche Intelligenz“ in den Blick und wurde maßgeblich durch das Kompetenzzentrum ML2R mitorganisiert. Die Veranstaltung fand am 29. Oktober 2020 virtuell statt und gab Forschenden aus NRW Gelegenheit zum Dialog mit EU-Vertreter*innen.
Den Auftakt machte die Ministerin für Kultur und Wissenschaft NRW, Isabel Pfeiffer-Poensgen gefolgt von einer Keynote von Eric Badiqué, Berater für Künstliche Intelligenz der Europäischen Kommission (Generaldirektion DG CONNECT). Die Sprecherin und der Sprecher des ML2R haben das Programm mitgestaltet und Impulse im Rahmen der deutschen EU-Ratspräsidentschaft gegeben: Prof. Dr. Stefan Wrobel leitete durch die Veranstaltung und Prof. Dr. Katharina Morik hielt einen Vortrag zum Thema „Trustworthy machine learning“. Sie stellte u.a. die Schwerpunkte des ML2R vor: Forschung zu vertrauenswürdigen maschinellen Lernverfahren (ML), die durch ihren schonenden Umgang mit Ressourcen Nachhaltigkeitsstandards erfüllen und für Anwender*innen verständlich gestaltet sind.
Mehr zur Veranstaltung „Grand Challenges: KI made in NRW“
Die begleitende Broschüre zum Event ist online verfügbar und gibt einen Überblick über die KI-Forschungslandschaft in NRW.
Ein Mitschnitt des Livestreams ist hier abrufbar.
Die diesjährige EBDVF (3. bis 5. November) brachte politische Entscheidungsträger*innen, Anwender*innen aus der Industrie und Forschende aus ganz Europa zusammen. Entlang des zentralen Veranstaltungsthemas diskutierten sie über die Etablierung eines europäischen Daten- und KI-Ökosystems.
Im Focus Track „Technology, Platforms and Trust“ präsentierte Prof. Dr. Katharina Morik, Leiterin des Lehrstuhls für Künstliche Intelligenz, Lösungsansätze und Projekte, welche darauf abzielen, das Vertrauen von Nutzer*innen in KI-Technologien zu stärken. Diesen Forschungsschwerpunkt greift auch das von Katharina Morik geleitete Kompetenzzentrum Maschinelles Lernen Rhein-Ruhr (ML2R) auf.
Das European Big Data Value Forum (EBDVF) ist die Leitveranstaltung der europäischen Gemeinschaft für Big Data und datengesteuerte KI-Forschung und Innovation, die von der Big Data Value Association (BDVA) und der Europäischen Kommission (DG CNECT) organisiert wird.
Bildnachweis: Prof. Dr. Dr. h.c. mult. Wolfgang Wahlster ML/DFKI
Künstliche Intelligenz begegnet uns mittlerweile in unserem Alltag an jeder Ecke – beim Online-Shopping, Videostreaming, Fitnesstraining oder bei der Partnersuche lassen wir uns von Künstlicher Intelligenz Empfehlungen geben oder überlassen sogar unsere Entscheidungen Algorithmen, die uns (vemeintlich?) besser kennen als wir uns selbst. Auch in der Arbeitswelt spielen KI-Technologien eine bedeutende Rolle – von intelligenten Fabrikanlagen bis zur KI-unterstützten Personalauswahl. Die 4. Dortmunder Wissenschaftskonferenz beschäftigt sich am 6. November mit Künstlicher Intelligenz aus verschiedenen Perspektiven – erstmals in digitalem Format.
Prof. Dr. Bernhard Schölkopf, Gründungsdirektor des Max-Planck-Instituts für Intelligente Systeme in Tübingen, ein KI-Pionier und mehrfach ausgezeichneter Forscher im Bereich der Künstlichen Intelligenz, konnte für den Eröffnungsvortrag gewonnen werden. In der Sitzung "KI Forschung made in Dortmund" diskutieren Prof. Dr. Katharina Morik und weitere Sprecher der TU Dortmund, des Kompetenzzentrums ML2R, des Fraunhofer IML und der Rapidminer GmbH folgende Themen:
| "Faszination Forschung" | Prof. Dr. Katharina Morik (TU Dortmund, ML2R) | |
| Prof. Dr. Christian Wietfeld (TU Dortmund) | ||
| Dr. Jens Buß (TU Dortmund) | ||
| Sebastian Buschjäger (TU Dortmund) | ||
| Lukas Pfahler (TU Dortmund) | ||
| "KI in der Logistik" | Prof. Dr. Dr. h.c. Michael ten Hompel (Fraunhofer IML) | |
| Moritz Roidl (Fraunhofer IML) | ||
| Anike Murrenhoff (Fraunhofer IML) | ||
| "KI Praxis" | Prof. Dr. Katharina Morik (TU Dortmund, ML2R) | |
| Dr. Helena Kotthaus (TU Dortmund, ML2R) | ||
| Philipp Schlunder (RapidMiner GmbH) |
Weitere Programmdetails und den Link zur kostenlosen Anmeldung finden Sie auf der Konferenzseite: www.wissenschaftskonferenz.dortmund.de. Ein Flyer kann hier abgerufen werden.
Wissenschaftliche Exzellenz und transnationaler Austausch prägten das Treffen des ML2R-Steering Boards, dem wissenschaftlichen Beirat und Beratungsorgan des Kompetenzzentrums ML2R. Das Steering Board bindet das ML2R in ein Netzwerk herausragender, weltweit renommierter Forscher*innen in den Bereichen Maschinelles Lernen und Künstliche Intelligenz ein. Im Rahmen einer dreitägigen virtuellen Veranstaltung, welche vom 21. bis 23. September stattfand, erhielten die Beiratsmitglieder weitreichende Einblicke in die Arbeit des Kompetenzzentrums, traten in den direkten Austausch mit ML2R-Wissenschaftler*innen und setzten wichtige Impulse für die weitere Arbeit des ML2R in Bezug auf Strategie und Sichtbarkeit. Gemäß dem Motto „Fresh Off Your Desk – Share Your Thoughts” bot das Treffen des ML2R-Teams und des Steering Boards die Möglichkeit zum fachlichen und strategischen Dialog sowie zum gemeinsamen Netzwerken.
In einer abschließenden Feedbackrunde betonten die internationalen Experten*innen die Exzellenz des Kompetenzzentrums und hoben die Beiträge hervor, welche ML2R-Wissenschaftler*innen in hochaktuellen Forschungsfeldern leisten. Sie verwiesen hierbei exemplarisch auf Forschungsbestrebungen des ML2R im Hinblick auf Quantentechnologien, modulares Maschinelles Lernen, ML-Verfahren zu Verständnis und Verarbeitung natürlicher Sprache sowie ML-Technologien unter Berücksichtigung von Hardwarebeschränkungen. Sie gaben zudem wichtige Impulse für die weitere strategische und öffentlichkeitswirksame Ausrichtung des Kompetenzzentrums.
Für weiterführende Informationen zum Event und den Mitgliedern des wissenschaftlichen Beirats, klicken Sie bitte hier.
Prof. Dr. Katharina Morik spricht in der neuesten Ausgabe von "Datenhelden" über Themen rund um Künstliche Intelligenz - wie diese unsere Gesellschaften bereits heute und in Zukunft verändert, aktuelle Forschungsthemen und den Bias-Effekt im Bereich Maschinelles Lernen. Im Online-Format "Datenhelden" des Softwareentwicklers QuinScape werden renommierte Persönlichkeiten aus dem Bereich Data & Analytics interviewt. Das Gespräch mit Prof. Morik ist hier abzurufen.
Über 830 registrierte Teilnehmende aus 64 Ländern: Die Sommerschule zum Maschinellen Lernen mit beschränkten Ressourcen fand große Resonanz innerhalb der internationalen Forschergemeinde. Das facettenreiche Programm umfasste Vorträge, interaktive Formate und Gelegenheiten zum Kennenlernen und Netzwerken. Parallel lief ein Hackathon zu einer aktuellen Aufgabe aus der Logistik. Als Abschluss und Höhepunkt der Sommerschule durften die Finalist*innen des Wettbewerbs in einem live übertragenen Event Logistik-Roboter aus der Ferne steuern. Die virtuelle Sommerschule fand erstmalig als Online-Veranstaltung statt und wurde gemeinsam durch das Kompetenzzentrum Maschinelles Lernen Rhein-Ruhr (ML2R) und dem Sonderforschungsbereich 876 „Verfügbarkeit von Information durch Analyse unter Ressourcenbeschränkung“ organisiert. Sowohl das ML2R als auch der SFB 876 sind unter Leitung Katharina Moriks am Lehrstuhl für Künstliche Intelligenz der TU Dortmund angesiedelt.
Das Kompetenzzentrum ML2R und der Sonderforschungsbereich 876 bedanken sich bei allen Referent*innen, Kooperationspartnern und den engagierten Teilnehmenden für eine gelungene Sommerschule. Für alle diejenigen, die nicht an der Sommerschule teilnehmen konnten oder die einige Highlights noch einmal erleben möchten, stehen ausgewählte Vorträge online zur Verfügung.
Auf der diesjährigen ECML-PKDD wurde im Rahmen des „Workshop on Parallel, Distributed and Federeated Learning“ die Veröffentlichung „Resource-Constrained On-Device Learning By Dynamic Averaging“ mit einem Best Paper Award ausgezeichnet. Die Zusammenarbeit zwischen der TU Dortmund, dem ML2R und SFB876, der Universität Bonn, des Fraunhofer IAIS sowie der Monash Universität ist durch den Forschungsaufenthalt in Melbourne von Katharina Morik enstanden.
In der Veröffentlichung wurde demonstriert, dass das verteilte Lernen von probabilistischen graphischen Modellen komplett mit Integer-Arithmetik realisierbar ist. Dies resultiert in einem verringerten Bedarf der Bandbreite sowie Energiekosten und ermöglicht dadurch die Nutzung der verteilten Modelle auf ressourcenbeschränkter Hardware. Weiterhin wurde der mögliche Fehler der Approximation theoretisch analysiert und beschränkt.
(Weiter... )Prof. Dr. Katharina Morik wurde als Beiratsmitglied der ISI Foundation ernannt. Die in Italien ansässige und international agierende ISI Foundation betreibt Forschung im Bereich der Komplexen Systeme. Dr. Francesco Bonchi, wissenschaftlicher Direktor der ISI Foundation, unterstützt das von Prof. Morik geleitete Kompetenzzentrum Maschinelles Lernen Rhein-Ruhr (ML2R) als wissenschaftliches Beiratsmitglied.
Das ML2R ist eines von sechs deutschen Kompetenzzentren für Künstliche Intelligenz. In seiner Arbeit profitiert es von dem ihm umspannenden Netzwerk. So komplementieren zwei Beiräte sowie zahlreiche Unterstützer und Kooperationspartner das innovative Forschungs- und Wirtschaftsumfeld an den Standorten des Kompetenzzentrums in Dortmund, Bonn und Sankt Augustin.
Gemeinsam mit dem Sonderforschungsbereich 876 „Verfügbarkeit von Information durch Analyse unter Ressourcenbeschränkung“ und dem Kompetenzzentrum Maschinelles Lernen Rhein-Ruhr (ML2R) veranstaltet der Lehrstuhl für Künstliche Intelligenz eine internationale Sommerschule. Die kostenfreie Online-Veranstaltung findet im Zeitraum des 31. August bis 4. September 2020 statt.
Die Sommerschule führt Expertinnen und Experten aus den Forschungsfeldern der Datenanalyse (Maschinelles Lernen, Data
Mining, Statistik) und der Eingebetteten Systeme (Cyber-physische Systeme) zusammen. In ihren Vorträgen widmen sie sich den Fragen des Maschinellen Lernens und der Datenanalyse auf Geräten mit beschränkten Ressourcen. Teilnehmende Doktoranden und Postdoktoranden haben darüber hinaus die Möglichkeit in der eigens eingerichteten Student Corner ihre Forschung vorzustellen.
Begleitet wird die Sommerschule von einem Hackathon in Form einer Kaggle-Challenge, in welcher die Teilnehmenden ihr Wissen über Maschinelles Lernen und cyber-physische Systeme testen können. In einem Lagerhaus-Szenario werden die Teilnehmenden hierbei Positionsvorhersagen über Roboter auf der Grundlage von Sensordaten erstellen. Die Gewinnerinnen und Gewinner der Challenge haben dann die Möglichkeit, die Roboter, welche zum Transport von Waren eingesetzt werden, live zu steuern. Sie werden zusätzlich für weitere Forschungskooperationen nach Dortmund eingeladen.
Eine Gruppe internationaler Wissenschaftlerinnen und Wissenschaftler aus Data Mining und Maschinellem Lernen hat ein Manifest für eine App zur Eindämmung des COVID-19 geschrieben.
Mit einem datengetriebenen Ansatz versuchen wir die Neuinfektionszahlen in Deutschland zu modellieren.
Helfen unsere Schutzmaßnahmen, den Coronavirus einzudämmen? Ist ein Ende der Welle in Sicht, so dass wir den Präsenzbetrieb an der Universität wieder aufnehmen können? Und welche Rolle spielen dabei Wochenenden und Meldeverzug – wie genau sind überhaupt unsere Daten?
Erkunden Sie unsere COVID-19 Prognosen für Deutschland in interaktiven Diagrammen.
(Weiter... )Mit einem der vier deutschen Kompetenzzentren für Maschinelles Lernen, ML Rhein-Ruhr, besteht die einzigartige Möglichkeit sich an der Gestaltung der Zukunft gemeinsam mit einem Team aus Spitzenforschern zu beteiligen. Die Stelle ist Bestandteil des Kompetenzzentrums ML2R in der Fakultät für Informatik und zunächst befristet bis zum 31.12.2022. Eine Verlängerung ist bei Fortführung des Zentrums möglich.
Prof. Dr. Katharina Morik widmet sich in der neuesten Ausgabe des Handelsblatt Journals „Künstliche Intelligenz“ der Fragestellung: Wie erreichen wir KI-Exzellenz in Deutschland? Im Rahmen ihres Gastbeitrages fordert sie eine Stärkung der deutschen KI-Forschung durch zusätzliche Professuren. Nur so könnten forschungsstarke und international sichtbare Forschungszentren gezielt gestärkt werden.
Zum Gastbeitrag von Professor Morik im Handelsblatt Journal „Künstliche Intelligenz“ geht es hier.
Prof. Dr. Katharina Morik hat die Notwendigkeit der europäischen Zusammenarbeit in der Erforschung Künstlicher Intelligenz betont. Im Format "3 Fragen an" der Plattform Lernende Systeme hob sie die international exponierte Stellung der deutschen KI-Forschungslandschaft hervor. Es bedürfe nun der langfristig gesicherten Zusammenarbeit zwischen europäischen Ländern, so Morik. Die Zusammenarbeit mit Frankreich anhand von Kompetenzzentren in beiden Ländern diene hierbei als positives Beispiel.
Das Format "3 Fragen an" mit Katharina Morik ist hier zu lesen. Professor Morik leitet die Arbeitsgruppe "Technologische Wegbereiter und Data Science" der Plattform Lernende Systeme und ist Sprecherin des Kompetenzzentrums Maschinelles Lernen Rhein-Ruhr (ML2R).
Prof. Dr. Katharina Morik hat im Rahmen eines Impulsvortrages in Straßburg langfristige Investitionsgarantien für ML-Kompetenzzentren gefordert. Anlass war die dritte Sitzung der deutsch-französischen Arbeitsgruppe „Disruptive Innovationen und Künstliche Intelligenz“ (AG DIKI) im Europäischen Parlament. Als Pionierin des Maschinellen Lernens betonte Katharina Morik die Rolle, die ihre Zusammenarbeit mit Yves Kodratoff von der Université Paris-Sud in den frühen Jahren des Faches hatte. "Die Zusammenarbeit mit Frankreich hat die europäische Community von Forschern am Maschinellen Lernen seit 1986 aufgebaut. Die so entstandene Tagung ECML PKDD umfasst nun alle europäischen Länder und hatte im letzten Jahr 800 Teilnehmerinnen und Teilnehmer."
Bei einem ersten Treffen der französischen und deutschen Zentren für KI und maschinelles Lernen, organisiert von Katharina Morik und Bertrand Braunschweig im letzten Jahr, wurden die thematischen Schwerpunkte der Zentren vorgestellt. Ein weiteres Treffen wird in diesem Jahr stattfinden, um die Vernetzung der deutschen und französischen Forschung voran zu treiben. “Was uns noch fehlt, ist die Verstetigung der Kompetenzzentren in Deutschland, um langfristige Perspektiven zu ermöglichen”, sagte Prof. Morik.
(Weiter... )
Das Bundesministerium für Bildung und Forschung (BMBF) hat einem Antrag des ML2R um Mittelaufstockung stattgegeben. Das ML2R wird bis zum Ende der ersten Projektphase Ende 2022 mit zusätzlichen 8 Millionen Euro gefördert. Dies ermöglicht die Erweiterung des Forschungsprofils und die Schaffung von bis zu 25 neuen Stellen für wissenschaftliche Mitarbeiter, welche die Forschungsaktivitäten zum Maschinellen Lernen (ML) maßgeblich stärken werden. „Dies ist ein wichtiges Zeichen für die Verstetigung des ML2R“, sagt Prof. Dr. Katharina Morik, Sprecherin des ML2R und Koordinatorin der Kompetenzzentren für Maschinelles Lernen auf Bundesebene. „Die Bundesregierung zeigt so ihre Bereitschaft, Investitionen in die Erforschung des Maschinellen Lernens als Schlüsseltechnologie zu erhöhen und den ML-Standort Rhein-Ruhr zu stärken.“
Neben der Vertiefung der existierenden wissenschaftlichen Arbeit kann im Rahmen der Mittelaufstockung das Forschungsprofil des Kompetenzzentrums um das Maschinelle Lernen auf Quantencomputern und die Vertrauenswürdigkeit maschineller Lernverfahren erweitert werden. Zudem wird ein Virtual ML Showroom in Form einer Online-Plattform eingerichtet. Auf dieser Plattform werden Ressourcen rund um das Thema ML kostenlos zur Verfügung gestellt.
(Weiter... )
The Program Committee was delighted to welcome you at the Global Forum on AI for Humanity, which took place in Paris last October.
For three days, some 400 attendees debated on AI’s human and scientific challenges: French President Emmanuel Macron delivered a speech on France’s position on AI research; the Minister of Higher Education, Research and Innovation, Frédérique Vidal, as well as the Secretary of State for the Digital Sector, Cédric O, spoke to the audience. Altogether, more than 150 international speakers shared their views at round-table discussion.
Relive the event with the video retrospective and the photos of the forum.
All the plenary sessions have been recorded, and are available on the dedicated playlist.
Als Koordinatorin der deutschen Kompetenzzentren für KI arbeitet Prof. Katharina Morik eng mit Prof. Bertrand Braunschweig von INRIA zusammen. So hat sie auch jetzt gemeinsam mit weiteren namhaften Experten aus Australien, Deutschland, den Niederlanden, England, Frankreich, Japan, Kanada und USA das Global Forum on AI for Humanity (GFAIH) vorbeitet, das vom 28.-30.10.2019 in Paris stattfand. Es diente der Vorbereitung einer Globalen Partnerschaft für AI (GPAI), wie sie auf dem letzten G7-Gipfel beschlossen wurde. Das Treffen in Paris mit einer Ansprache des Präsidenten Emmanuel Macron wurde als formelle Startrampe für GPAI genutzt und die zukünftige Agenda der GPAI-Arbeitsgruppen formuliert. Das GFAIH hat Experten aus KI, Sozial-, Geistes- und Ingenieurwissenschaften sowie Innovatoren, Wirtschaftsakteure, politische Entscheidungsträger und Vertreter der Zivilgesellschaft mit den folgenden Zielen zusammengebracht:
Das GFAIH wurde unter der Schirmherrschaft der französischen Regierung organisiert.
Am 01. Oktober 2019 zeichnete die Gesellschaft für Informatik e.V. (GI) mit dem GI-Fellowship Informatikerinnen und Informatiker aus, die sich in besonderer Weise um die Informatik und die GI verdient gemacht haben. Mit Prof. Oliver Günther, PhD, Prof. Dr. Guido Herrtwich, Prof. Dr. Katharina Morik und Prof. Dr. Günter Müller würdigt die Gesellschaft für Informatik dieses Jahr gleich vier herausragende Persönlichkeiten. Auf der GI-Jahrestagung INFORMATIK 2019 in Kassel fand die Ehrung statt.
Foto: Uni-Kassel/Nicolas Wefers
Machine learning (ML) is a driving force for many successful applications in Artificial Intelligence. ML pipelines ensure guarantees on the entirety of the system (i.e., horizontal certification) as well as on each single component (i.e., vertical certification). The horizontal certification covers the full pipeline from data acquisition to data visualization. Moreover, it spans over user-centered, technical, financial, and regulatory aspects of the system. The vertical certification exploits the theory of ML to guarantee error bounds, sampling complexity, energy consumption, execution time, time-to-think, and memory and communication demands. The understandability of an ML pipeline in its entirety requires the collaboration of researchers from the database and the ML communities.
ETMLP workshop will examine the aforementioned opportunities and their associated challenges. The main objective of this workshop is to create a forum where researchers from machine learning, data management, and practitioners engage with ideas around explainability and certified trustworthiness of ML pipelines, at the pipeline level, as well as the component level.
The ultimate goal of the workshop is to discuss recommendations for further work in science and industry and society regarding explainable ML pipelines.
30 March 2020, Copenhagen, Denmark
Submission deadline: December 20, 2019
Prof. Dr. Katharina Morik is part of the committee.
(Weiter... )
Am Rande der diesjährigen ECML-PKDD, der führenden europäischen Konferenz für Maschinelles Lernen und Data Mining, trafen sich am Montag, den 16. September 2019, Vertreter aller deutschen und französischen ML-Kompetenzzentren in Würzburg. Gemeinsame Zielsetzung war die Konkretisierung eines virtuellen deutsch-französischen Zentrums zur Zusammenarbeit der Kompetenzzentren beider Länder und die Konkretisierung eines Memorandums of Understanding (MoU) als Vereinbarung dieser Zusammenarbeit. Organisiert wurde das Treffen von Katharina Morik (TU Dortmund), der Koordinatorin der sechs deutschen Kompetenzzentren, und Bertrand Braunschweig (INRIA), welcher die vier französischen Kompetenzzentren koordiniert.
Am 29.10.2019 findet der Thementag Künstliche Intelligenz im Rahmen der Nordrhein-Westfälischen Akademie der Wissenschaft und der Künste statt. Der Schwerpunkt ist Maschinelles Lernen als Schlüssel für die Künstliche Intelligenz.
(Weiter... )Nico Piatkowski erhält die Auszeichnung als hervorragender Gutachter von ECML PKDD, Journal track. Dabei geht es nicht nur um die Fülle der Gutachten und die pünktliche Abgabe, sondern insbesondere um die Qualität.
(Weiter... )
Die zweite Veranstaltung im Rahmen der Dialog- und Beteiligungsmaßnahme zur Digitalstrategie.NRW lockte mehr als 100 Besucher in den Düsseldorfer Medienhafen. Die Teilnehmer konnten sich rund um das Thema „DATEN – der Schlüssel zu KI“ austauschen, insbesondere lag der Fokus auf dem Zugang und der Nutzbarkeit von Daten.
Die Landesregierung hat sich zum Ziel gesetzt, Nordrhein-Westfalen zum führenden KI-Standort zu machen. Zum Anlernen der Systeme werden unzählige, qualitativ hochwertige und aussagekräftige Daten benötigt, damit Künstliche Intelligenz entstehen kann. Über die Frage, wie Daten nutzbar gemacht werden können und wie der Zugang zu diesen Daten verbessert werden kann, möchten findet am 3. September 2019 eine Veranstaltung statt. Dabei gibt es auch den Vortrag:
Daten und was maschinelles Lernen daraus macht
Prof. Dr. Katharina Morik, Technische Universität Dortmund,
Lehrstuhl für Künstliche Intelligenz
Weitere Informationen hier.
Anja Karliczek, Bundesministerin für Bildung und Forschung, besuchte am 9. Juli gemeinsam mit Journalistinnen und Journalisten das Kompetenzzentrum Maschinelles Lernen Rhein-Ruhr (ML2R). Die Ministerin nutzte die Gelegenheit, praktische Anwendungen der Künstlichen Intelligenz und des Maschinellen Lernens live zu erleben und selbst auszuprobieren: Sie begegnete Robotern, die KI und ML spielerisch begreifbar machen, entdeckte KI-Systeme, die gesprochene Sprache analysieren, Satellitenbilder verbessern und autonomes Fahren sicherer machen, über ihr summte ein Drohnenschwarm. Damit verschaffte sich die Ministerin Eindrücke von herausragenden Projekten, die im Rahmen des ML2R durch das Bundesministerium für Bildung und Forschung (BMBF) gefördert werden.
(Weiter... )
Amal Saadallah has been selected as finalist at The European DatSci & AI Awards - Celebrating & Connecting Data Science Talent, category "Best Data Science Student of the Year". Amal works for the Research Project B3 "Data Mining in Sensor Data of Automated Processes" within the Collaborative Research Center 876.
The Data Science Award 2019 competition is open to individuals and teams working in the Data Science Ecosystem across Europe and is a unique opportunity to showcase research and application of Data Science/AI.
Sibylle Hess hat Ihre Dissertation A Mathematical Theory of Making Hard Decisions: Model Selection and Robustness of Matrix Factorization with Binary Constraints am Lehrstuhl für Künstliche Intelligenz erfolgreich verteidigt. Sie entwickelte dabei neue Methoden für zwei Zweige des Clusterings: Die eine betrifft die Ableitung von nicht-konvexen Clustern, bekannt als spektrales Clustering; die andere befasst sich mit der Identifizierung von Biclustern, einem Satz von Beispielen, zusammen mit ähnlichen Merkmalen, über die boolesche Matrixfaktorisierung.
Die Mitglieder des Promotionskomitees waren Prof. Dr. Katharina Morik (Betreuerin und Erstgutachterin), Prof. Dr. Arno Siebes (Zweitgutachter, Universität Utrecht) und Prof. Dr. Erich Schubert (Vertreter der Fakultät). Sibylle Hess war wissenschaftliche Mitarbeiterin am LS8, Mitglied des Sonderforschungsbereichs 876 (Projekt C1) und arbeitet nun als Postdoktorandin an der TU Eindhoven.
Die Jahreskonferenz der Plattform Lernende Systeme am 3.7.2019 in Berlin wurde von Bundesministerin Karliczek eröffnet. Natürlich war auch die Leiterin der AG 1 "technologische Wegbereiter" und Koordinatorin der Kompetenzzentren für maschinelles Lernen, Katharina Morik, dabei.
Am Mittwoch, 5. Juni, trafen sich an der TU Dortmund erstmals Vertreterinnen und Vertreter der vier deutschen Kompetenzzentren zum Maschinellen Lernen sowie Expertinnen und Experten aus Industrie, Wirtschaft und Wissenschaft zu einer gemeinsamen Tagung. Organisiert wurde diese vom Kompetenzzentrum Maschinelles Lernen Rhein-Ruhr (ML2R).
Foto: Oliver Schaper
(Weiter... )
Experten aus Wissenschaft, Wirtschaft und Politik kamen zusammen um die Frage zu diskutieren: Was kommt als nächstes in der KI? Was kommt durch die KI als nächstes?
Katharina Morik hielt den eingeladenen Hauptvortrag “AI and the sciences”.
Seine Promotion zum Thema „Exponential Families on Resource-Constrained Systems“ hat Dr. Nico Piatkowski mit Auszeichung (summa cum laude) abgeschlossen. Zudem erhielt er im Rahmen der akademischen Jahresfeier der TU Dortmund am 23. Januar 2019 einen der Dissertationspreise.
In seiner Doktorarbeit hat sich Nico Piatkowski mit dem Maschinellen Lernen unter beschränkten Ressourcen beschäftigt. Er hat untersucht, wie sich mathematische Verfahren des Maschinellen Lernens so vereinfachen lassen, dass sie auch auf Geräten funktionieren, denen nur eine beschränkte Rechenleistung, Speicherkapazität oder Energiereserve zur Verfügung steht. Dies sind beispielsweise mobile Geräte wie Smartphones oder Sensoren. Der Wissenschaftler studierte an der TU Dortmund Informatik und Wirtschaftswissenschaften und arbeitet nun weiterhin als PostDoc am ML2R.
An der TU Dortmund, Fakultät für Informatik, Lehrstuhl VIII sind ab sofort mehrere Stellen für Hilfskräfte (SHK / WHF) zu besetzen. Der Stundenumfang kann individuell besprochen werden. Das Angebot richtet sich an Studierende der Informatik, die ihr Studium bisher mit sehr gutem Erfolg absolviert haben. Wir bieten Ihnen die Möglichkeit zur Mitarbeit in Forschung und Entwicklung im Rahmen nationaler und internationaler Projekte.
Am 23. Januar 2019 eröffnet in Dortmund das Kompetenzzentrum Maschinelles Lernen Rhein-Ruhr (ML2R). ML2R ist eines von vier bundesweiten Zentren für Künstliche Intelligenz und Maschinelles Lernen: Dieses etablieret Spitzenforschung, fördert den wissenschaftlichen Nachwuchs und stärkt den Technologietransfer in Unternehmen.
Das ML2R verbindet Pionier-Institutionen der ML-Forschung in Deutschland: die Fakultät für Informatik der Technischen Universität
Dortmund, das Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme IAIS in Sankt Augustin, die Universität Bonn sowie das Fraunhofer-Institut für Materialfluss und Logistik IML in Dortmund. Die enge Verzahnung von grundlagenorientierter und anwendungsnaher Forschung bildet die ideale Basis für Innovationen.
In der Fakultät für Informatik der Technischen Universität Dortmund ist zum frühestmöglichen Zeitpunkt die Universitätsprofessur (W3) „Interactive Data Science" zu besetzen. Die Universitätsprofessur soll das Fach „Interactive Data Science" in Forschung und Lehre vertreten.
Mit 6.200 Beschäftigten in Forschung, Lehre und Verwaltung und Ihrem einzigartigen Profil gestaltet die Technische Universität Dortmund Zukunftsperspektiven. Das Zusammenspiel von Ingenieur- und Naturwissenschaften, Gesellschafts- und Kulturwissenschaften treibt technologische Innovationen ebenso voran wie Erkenntnis- und Methodenfortschritt, wovon nicht nur die rund 34.500 Studierenden profitieren. Die Fakultät für Informatik der Technischen Universität Dortmund gehört zu den größten und forschungsstärksten in Deutschland. Ihr Alleinstellungsmerkmal ist die Kombination aus Grundlagenforschung zu formalen Methoden mit der Entwicklung praktischer Anwendungen. Forschungsschwerpunkte sind dabei die Algorithmik, die Datenwissenschaften, Cyber-Physical Systems und das Software und Service Engineering.
Das Sekretariat des LS8 ist zwischen dem 19.12.2018 bis einschließlich dem 04.01.2019 nicht besetzt.
Auf der Digicon 2018 werden über 400 Top-Entscheider aus über 150 Firmen wie Allianz, BOSCH, Flughafen München, Generali, Google, u.v.m erwartet. Internationale Experten aus Wirtschaft und Wissenschaft stellen den Teilnehmern neueste Trends, Entwicklungen und Ergebnisse rund um das Thema Machine Learning vor. Anwender referieren über ihre Erfolgsgeschichten und Analysten über die Methoden dahinter. Dieses Jahr hält Prof. Dr. Katharina Morik einen Vortrag zum Thema „Machine Learning und Data Mining – Von der Theorie zur Praxis".
Der Lehrstuhl für künstliche Intelligenz sucht zum nächstmöglichen Zeitpunkt eine/einen Sachbearbeiterin/Sachbearbeiter im Sekretariatsbereich. Die Stelle ist Bestandteil des neu einzurichtenden Kompetenzzentrums Maschinelles Lernen Rhein-Ruhr und befristet bis zum 31.07.2022. Die Tätigkeit wird nach Entgeltgruppe 9k TV-L vergütet. Es handelt sich um eine Teilzeitstelle mit 50% der regelmäßigen Wochenarbeitszeit. Mehr Informationen zur Stelle sowie Ihrer Bewerbung finden Sie im angehängten PDF.
Der Umgang mit großen Datenmengen ist für viele Wissenschaftlerinnen und Wissenschaftler der TU Dortmund ein grundlegender Bestandteil ihrer täglichen Arbeit. Mit dem Sonderforschungsbereich 876 („Verfügbarkeit von Information durch Analyse unter Ressourcenbeschränkung“, Sprecherin: Prof. Dr. Morik) und dem Sonderforschungsbereich 823 („Statistik nichtlinearer dynamischer Prozesse“, Sprecher: Prof. Dr. Krämer) sind schon jetzt umfangreiche Forschungsprojekte an der TU Dortmund angesiedelt, die sich der Analyse großer Datenmengen zuwenden. Darüber hinaus wurde erst kürzlich, zusammen mit der Universität Bonn und den Fraunhofer-Instituten für Materialfluss und Logistik (IML) und für Intelligente Analyse- und Informationssysteme (IAIS), eines von vier Kompetenzzentren für Maschinelles Lernen in Deutschland eingeworben, womit der Profilbereich „Datenanalyse, Modellbildung und Simulation“ der TU Dortmund zusätzlich unterstrichen wird.
Diese interdisziplinäre Expertise zur Datenanalyse wird nun im Dortmund Data Science Center (DoDSc) gebündelt, denen die Fakultäten Statistik, Informatik, Mathematik und Physik angehören. Zur feierlichen Eröffnung am 24. Oktober wurden wissenschaftliche Vorträge von Kevin Kröninger (Fakultät Physik, TU Dortmund) sowie von Thomas Lengauer (Max-Planck-Institut für Informatik, Saarbrücken) gehalten, die weitere Forschungsperspektiven für Data Science aufzeigen. Für kommerzielle Anwendungen stand Florian Kruse von Pont 8 auf dem Programm. Zudem übersandte Trevor Hastie von der Stanford University einen Glückwunsch zur Eröffnung des Dortmund Data Science Center.
Newsbeitrag der TU Dortmund zur Eröffnung des DoDSc
Foto: TU Dortmund/Martina Hengesbach
Big Data, Data Science, maschinelles Lernen – Begriffe, die auf Daten und ihren Wert für vielfältige Anwendungen hinweisen. Wem nützen die Daten? Wer darf sie nutzen? Wie werden wissenschaftlicher Fortschritt, Erfolg im ökonomischen Wettbewerb und Schutz der Privatsphäre gleichzeitig erreicht? Der Sammelband gibt die Referate einer Fachtagung der Nordrhein-Westfälischen Akademie der Wissenschaften und der Künste wieder, mit Beiträgen aus der Informatik, Statistik, Medizin, den Ingenieursdisziplinen, Rechts- und Wirtschaftswissenschaften. Damit beteiligt sich die Akademie an der dringend nötigen Diskussion, wie den Herausforderungen durch die heutigen Möglichkeiten der Datensammlung und -nutzung zu begegnen ist.
(Weiter... )Am Lehrstuhl für künstliche Intelligenz ist eine Stelle als Sachbearbeiterin im Sekretariat ausgeschrieben.
(Weiter... )
Das Maschinelle Lernen ist die Grundlage der digitalen Transformation. International herausragende Exzellenz in der Forschung und effektiver Transfer in die Anwendung hat für Deutschland größte Bedeutung. Dazu startet jetzt in Dortmund und Bonn/Sankt Augustin das vom Bundesministerium für Bildung und Forschung BMBF geförderten Kompetenzzentren für Maschinelles Lernen Rhein-Ruhr (ML2R).
(Weiter... )
Als Expertin für maschinelles Lernen und Leiterin des Kompetenzzentrums maschinelles Lernen Rhein Ruhr war auch Katharina Morik dabei.
Bundeskanzlerin Angela Merkel führte am 29.05.2018 im Bundeskanzleramt ein Gespräch mit Experten zum Thema Künstliche Intelligenz. Die Künstliche Intelligenz ist eine der zentralen Zukunftstechnologien und derzeit einer der größten Treiber der Digitalisierung. Sie ist ein Teilgebiet der Informatik, bei dem es darum geht, technische Systeme so zu konzipieren, dass diese Probleme eigenständig lösen und sich dabei auf sich verändernde Bedingungen einstellen.
Die Bundeskanzlerin hat sich mit den Experten über Potenziale und Herausforderungen der Künstlichen Intelligenz für Deutschland ausgetauscht. Die Bundesregierung beabsichtigt, alle Maßnahmen in diesem Bereich zu bündeln und zu einer nationalen Strategie zusammenzuführen, um die Nutzung von Künstlicher Intelligenz zum Wohle von Wirtschaft und Gesellschaft voranzubringen.
Die Bundeskanzlerin hat zu dem Gespräch Fachleute aus Hochschulen, Forschungseinrichtungen und Unternehmen eingeladen. Seitens der Bundesregierung nahmen neben der Bundeskanzlerin der Chef des Bundeskanzleramtes, die Bundesministerin für Bildung und Forschung, der Bundesminister für Wirtschaft und Energie, der Bundesminister für Arbeit und Soziales, der Bundesminister für Verkehr und digitale Infrastruktur sowie die Beauftragte der Bundesregierung für Digitalisierung teil.
Das Gespräch ist nicht presseöffentlich.
Foto: Bundesregierung / Jochen Eckel
Daten, deren Vernetzung und Auswertung beeinflussen all unsere Lebensbereiche, nicht zuletzt auch Verkehr und Mobilität. Digitale Technologien werden u. a. zur Steuerung von Verkehrsmitteln, Verkehrsinfrastrukturen und Verkehrsflüssen eingesetzt, so dass immer spezifischere, individuellere Angebote gemacht werden können. Wie dabei die Privatheit der Nutzerdaten gewährleistet wird und welche Fallbeispiele es bereits gibt, wird auf der Tagung in Dortmund am 28. Mai vorgestellt.
Nico Piatkowski hat seine Dissertation „Exponential Families on Resource-Constrained Systems” mit einer Gesamtnote von summa cum laude erfolgreich verteidigt. Die Mitglieder des Promotionskomitees waren Prof. Jens Teubner (Vorsitz, TU Dortmund), Prof. Katharina Morik (Erstgutachterin,TU Dortmund), Prof. Stefano Ermon (Zweitgutachter, Stanford University), Prof. Jakob Rehof (TU Dortmund).
With more than 6,200 employees in research, teaching and administration and its unique profile, TU Dortmund University shapes prospects for the future: The cooperation between engineering and natural sciences as well as social and cultural studies promotes both technological innovations and progress in knowledge and methodology. And it is not only the more than 34,600 students who benefit from that. The Faculty for Computer Science at TU Dortmund University, Germany, is looking for a Assistant Professor(W1) in Smart City Science specialize in research and teaching in the field of Smart City Science with methodological focus in computer science (e.g. machine learning and/or algorithm design) and applications in the area of Smart Cities (e.g. traffic prediction, intelligent routing, entertainment, e-government or privacy).
Applicants profile:
The TU Dortmund University aims at increasing the percentage of women in academic positions in the Department of Computer Science and strongly encourages women to apply. Disabled candidates with equal qualifications will be given preference.
(Weiter... )
Die 12. Ausgabe der Science Notes in der Heidelberger Mathematik-Informatik-Station (MAINS) fand zum Thema "Künstliche Intelligenz" statt und konnte schon nach 7 Minuten keine weiteren Zuhörer mehr einlassen. Das Konzept der Science Notes ist "Unsere Zukunft in 5 x 15 Minuten". Dieses Mal: Christian Bauckhage (Fraunhofer IAIS), Dirk Helbing (ETH Zürich), Katharina Morik (TU Dortmund), Kai Polsterer (HITS Heidelberg) und Volker Tresp (LMU München).
Von intelligenter Kleidung, Fitness-Armbändern, Smartphones, Autos bis hin zu Fabriken oder großen wissenschaftlichen Experimenten werden gigantische Datenströme aufgenommen. Maschinelle Lernverfahren machen diese Datenmassen nutzbar. Allerdings verbraucht die Speicherung, Kommunikation und Analyse der Daten sehr viel Energie. Die kleinen Geräte sollen daher weniger, aber aussagekräftigere Daten an einen zentralen Rechner senden, wo weitere Analysen durchgeführt werden.
(Weiter... )
Deutschland zählt zu den Pionieren in den Bereichen Lernende Systeme und Künstliche Intelligenz. Die vom Bundesministerium für Bildung und Forschung (BMBF) initiierte Plattform Lernende Systeme soll dazu beitragen, diese Bereiche im Sinne der einzelnen Menschen und der Gesellschaft zu gestalten. Die Arbeitsgruppe 1 "Technologische Wegbereiter und Data Science" übernimmt eine Querschnittsfunktion innerhalb der Plattform und gibt Impulse an die weiteren 6 Arbeitsgruppen. Sie wird geleitet von Katharina Morik (TU Dortmund) und Volker Markl (TU Berlin).
(Weiter... )
Wir wünschen allen eine frohe Weihnacht und ein gutes Neues Jahr.
Dafür haben wir das Krippenbild mit der Deep Visualization Toolbox von Yosinski gestaltet.
Die Arbeit "On Avoiding Traffic Jams with Dynamic Self-Organizing Trip Planning" von Thomas Liebig und Maurice Sotzny hat auf der International Conference on Spatial Information Theory (COSIT) 2017 den Best Paper Award erhalten.
Bewerberinnen und Bewerber auf die Stelle sollen sich methodisch schwerpunktmäßig der Analyse sehr großer Datenmengen mit einer aktuellen Forschungsperspektive widmen und darin international in besonderem Maße wissenschaftlich ausgewiesen sein. Außerdem sind sie bereit, sich an Forschungsverbünden und -kooperationen zu beteiligen. Insbesondere wird die Mitwirkung am SFB 876 „Verfügbarkeit von Information durch Analyse unter Ressourcenbeschränkung“ erwartet.
Weiter Informationen zur Ausschreibung erhalten sie hier
Die Akademie der Technikwissenschaften hat auf der CeBIT einen Online Kurs zu maschinellem Lernen vorgestellt: http://www.acatech.de/de/projekte/projekte/mooc-maschinelles-lernen.html
Nach dem Überblick von Prof. Dr. Stefan Wrobel (Fraunhofer St. Augustin) führt Katharina Morik in zwei grundlegende Methoden mit Anwendungsbeispielen aus ihrer langjährigen Praxis ein: die Stützvektormethode und Entscheidungsbäume. Kristian Kersting stellt probabilistiscche graphische Modelle vor.
Vier Absolventen der TU Dortmund wurden am 13. März mit dem Hans-Uhde-Preis für ihre herausragenden Abschlussarbeiten in den Ingenieurwissenschaften ausgezeichnet: Niklas Haarmann (Fakultät Bio- und Chemieingenieurwesen), Chris Kittl (Fakultät für Elektrotechnik und Informationstechnik) und Lukas Pfahler (Fakultät für Informatik) erreichten mit ihrer Masterarbeit jeweils die Bestnote ihres Jahrgangs. Christian Gehring (Fakultät Maschinenbau) erzielte mit seiner Bachelorarbeit die Note 1,0. Die Hans-Uhde-Stiftung zeichnete zudem zwei Absolventinnen und einen Absolventen der Fachhochschule Dortmund sowie einen Mitarbeiter der Uhde Inventa-Fischer GmbH aus.
Guido Baranowski, Kuratoriumsvorsitzender der Hans-Uhde-Stiftung, überreichte den TU-Preisträgern eine Goldmünze sowie eine Urkunde und einen Geldpreis. Bei Informatiker Lukas Pfahler ging es um die Frage, wie Computer lernen können, den Satzbau der deutschen Sprache zu verstehen. Die Auszeichnung erfolgte im Rahmen einer Feierstunde im Hause der thyssenkrupp Industrial Solutions AG in Dortmund. Grußworte sprachen Lothar Jungemann, CEO, Network of Excellence der thyssenkrupp Industrial Solutions AG, und Prof. Ursula Gather, Rektorin der TU Dortmund. Den Festvortrag hielt Prof. Daniel Rauh von der Fakultät für Chemie und Chemische Biologie der TU Dortmund zum Thema „Präzisionsmedizin und Grundlagenforschung – Innovationen mit Potenzial“. Zweck der vor über 30 Jahren gegründeten Hans-Uhde-Stiftung ist die Förderung der Wissenschaft, Erziehung und Bildung. Dazu werden jährlich hervorragende Studien- und Schulleistungen ausgezeichnet. Nach dem Tod des Stifters im Jahre 2011 begleitete seine Witwe Roswitha Uhde die Preisverleihungen bis 2016 persönlich. Im Januar 2017 verstarb sie im Alter von 98 Jahren.
Hans-Uhde Award 2017
Lukas Pfahler, M.Sc.
TU Dortmund, Faculty of Computer Science
Master's Thesis: Explicit and Implicit Feature Maps for Structured Output Prediction
Marco Stolpe hat seine Dissertation mit dem Titel „Distributed Analysis of Vertically Partitioned Sensor Measurements under Communication Constraints” erfolgreich verteidigt. Seine Doktorarbeit wurde von Katharina Morik betreut. Im Folgenden wird die Arbeit zusammengefasst:
Schwerpunkt der Arbeit ist die verteilte Analyse großer Mengen vertikal partitionierter Sensordaten unter Berücksichtigung von Kommunikationsbeschränkungen. Hierbei hängt die vorherzusagende Zielgröße jeweils von an unterschiedlichen Knoten im Netzwerk gespeicherten Merkmalswerten ab. Das Szenario hat vielfältige Anwendungen im Kontext des Internet of Things und Industrie 4.0, wie etwa die Vorhersage der finalen Produktqualität anhand von an verschiedenen Bearbeitungsstationen erfassten Prozessparametern, die Vorhersage des Gesamtstromverbrauchs anhand des zuvor erfassten Verhaltens unterschiedlicher Stromabnehmer im Smart Grid oder die Vorhersage von Verkehrsflüssen in Smart Cities. Das Szenario erweist sich als besonders herausfordernd in Fällen, in denen Kommunikation oder Energie zu beschränkt sind, um alle Daten zu zentralisieren, da bereits für die Vorhersage Daten unterschiedlicher Knoten zusammengeführt werden müssen. In der Dissertation werden, motiviert durch eine Fallstudie zur Qualitätsvorhersage in verketteten Produktionsprozessen in der Stahlindustrie, kommunikationseffiziente Algorithmen für drei unterschiedliche Problemstellungen der verteilten Datenanalyse entwickelt: (1) Die lokale Reduktion von Messwerten unmittelbar dort, wo sie erfasst werden (also noch vor ihrer Übertragung), (2) die Reduktion von Messwerten, die zwischen lokalen Knoten und einem zentralen Koordinator übertragen werden und (3) die Reduktion von Informationen über vorherzusagende Zielgrößen, die zwischen Knoten übertragen werden. Die Algorithmen reduzieren die übertragene Datenmenge im Vergleich zur Übermittlung aller Daten in einem Netzwerk jeweils um ca. eine Größenordnung, bei ähnlicher Vorhersagegüte. Algorithmus (3) basiert wiederum auf einem neu entwickelten Ansatz für das relativ neuartige Problem des Lernens aus Label-Verhältnissen, dessen Lösung weitere Anwendungen im Kontext von Industrie 4.0 erschließt.
Christian Pölitz hat seine Dissertation mit dem Titel „Automatic Methods to Extract Latent Meanings in Large Text Corpora” erfolgreich verteidigt. Seine Doktorarbeit wurde von Katharina Morik betreut. Im Folgenden wird die Arbeit zusammengefasst:
This thesis concentrates on Data Mining in Corpus Linguistic. We show the use of modern Data Mining by developing efficient and effective methods for research and teaching in Corpus Linguistics in the fields of lexicography and semantics. Modern language resources as they are provided by Common Language Resources and Technology Infrastructure (http://clarin.eu) offer a large number of heterogeneous information resources of written language. Besides large text corpora, additional information about the sources or publication date of the documents from the corpora are available. Further, information about words from dictionaries or WordNets offer prior information of the word distributions. Starting with pre-studies in lexicography and semantics with large text corpora, we investigate the use of latent variable methods to extract hidden concepts in large text collections. We show that these hidden concepts correspond to meanings of words and subjects in text collections. This motivates an investigation of latent variable methods for large corpora to support linguistic research.
Das Sekretariat ist vom 19. Dezember 2016 bis zum 6. Januar 2017 nicht besetzt. Wir wünschen euch eine frohe Weihnacht und ein frohes neues Jahr.
Am 2. und 3. Dezember richtete das Bundesministerium für Verkehr und digitale Infrastruktur zum zweiten Mal den BMVI Data-Run aus, dieses Jahr mit dem Thema "Echtzeitdaten im Verkehr". Ziel für die Teilnehmer war es, innerhalb von zwei Tagen auf Basis der zur Verfügung gestellten Daten innovative Mobilitätslösungen zu entwickeln.
Teilgenommen haben auch Sebastian Peter und Philipp Honysz vom LS8 mit ihrer Idee einer App, die Pendlern helfen soll, Verkehrsprobleme zu kompensieren. Umgesetzt wurde eine Android-App, welche die Verkehrsgewohnheiten des Nutzers analysiert und vor Problemen warnt, etwa vor ausgelasteten Fahrradleihstationen. Weiterhin berechnet sie mittels einer Google API Routen für gängige Verkehrsmittel.
Drei unserer wissenschaftlichen Mitarbeiter waren in diesem Sommer zwischen Nachrichten, Weltraum und Wissenschaft unterwegs. Sie waren bei Google, der NASA, Stanford und der Wirtschaftswoche. Während all das sicherlich kein Spaziergang war, war es sicherlich eine tolle Erfahrung und vor allem ein Erfolg. Glückwunsch!
Elena Erdmann erhielt ein Google News Lab Fellowship und arbeitete zwei Monate bei der Wirtschaftwoche. Sie baute sowohl journalistisches Know-how als auch technische Fähigkeiten auf, um Innovation im Digital-und Daten-Journalismus voranzutreiben. Nico Piatkowski besuchte Stefano Ermon an der Stanford University. Zusammen arbeiteten sie an Techniken für das skalierbare und exakte Schlussfolgern in Graphischen Modellen. Er machte auch einen Abstecher zur NASA. Last but not least hat Martin Mladenov ein Praktikum bei Google ergattert. Einige Leute sagen, das ist schwieriger als in Stanford oder Harvard aufgenommen zu werden. Wer weiß das schon? Aber in diesem Jahr akzeptierten sie etwa 2% der Bewerber (1.600 Personen). Woran hat er gearbeitet? Wir wissen es nicht. Aber er besuchte Craig Boutilier, also sehr wahrscheinlich etwas im Zusammenhang mit Entscheidungen unter Unsicherheit.
Am 23. November 2016 fand im Leibniz-Institut für Analytische Wissenschaften (ISAS) das Kick-off der Fachgruppe "Smart Data & Data Analytics" von CPS.HUB statt. In dieser Sitzung gng es um vielfältige Aspekte der Daten und Datenanalyse im Hinblck auf Gesundheit und Gesundheitsökonomie.
Nach der Einführung durch Monika Gatzke wurde das Thema "Gesundheit" im Bezug auf Smart Data weiter diskutiert:
Das Projektteam vom LS8 und vom CERES in Bochum hat am 23.-24. Mai zum Eröffnungsworkshop des relNet Projektes zum Thema "Modellierung von Themen und Strukturen religiöser Online-Kommunikation" eingeladen. Das Ziel des Projektes ist, mithilfe von Methoden der Datenanalyse, Netzwerkanalyse und des Text-Minings Datenbestände nicht nur stichprobenartig, sondern in ihrer Gänze der Analyse zugänglich machen und zu analysieren, wie digitale Kommunikation Autorisierungsprozesse in religiösen Gruppierungen verändert.
An den zwei Tagen wurden in Bochum das Projekt präsentiert, spannende Vorträge von geladenen Gästen gehört und anregend über die Potenziale der Zusammenarbeit von Informatik und Religionswissenschaft diskutiert.
(Weiter... )
Katharina Morik und Kristian Kersting haben zusammen mit Jörg Lässig von der Hochschule Zittau/Görlitz ein Edited Volume über Computational Sustainability herausgegeben. Computational Sustainability ist ein relativ neues Wissenschaftsgebiet, welches unter Verwendung von Techniken und Methoden aus der Informatik und verwandten Disziplinen (Mathematik, Statistik, etc.) den Umgang mit soziale, ökonomische und ökologische Ressourcen zu optimieren.
| Jörg Lässig, Kristian Kersting, Katharina Morik, Computational Sustainability. Studies in Computational Intelligence, Volume 645 2016, Springer, ISBN: 978-3-319-31856-1, 2016. |
Kristian Kersting hat zusammen mit Kollegen der UBC, KU Leuven und der U. Indiana ein Buch über Statistical Relational AI geschrieben. Statistical Relational AI ist das Studium und Design von intelligenten Agenten, die in unsicheren Welten mit verschiedenen Objekten und Relationen zwischen den Objekten agieren:
![]() |
Luc De Raedt, Kristian Kersting, Sriraam Natarajan, David Poole, Statistical Relational Artificial Intelligence: Logic, Probability, and Computation. Morgan and Claypool Publishers,Synthesis Lectures on Artificial Intelligence and Machine Learning, ISBN: 9781627058414, 2016. |
Urbane Räume werden überflutet von großen Mengen ungenutzter Daten, aufgenommen von montierten und getragenen Sensoren. Würden diese Daten erfolgreich genutzt werden, könnten die Bewohner Europas in Gebieten wie dem Nahverkehr oder Kriminalprävention davon profitieren. Aber urbane Daten sind heterogen, verrauscht und unlabeled, was die Nutzbarkeit reduziert. Das Ziel des "VaVeL project" ist es diese Daten für Anwendungen zu nutzen, so dass die Lebensbedingungen in urbanen Räumen verbessert werden können. Ein allgemeines Framework zum managen und mining von multiplen heterogenen urbanen Datenströmen soll in diesem Projekt entwickelt werden.
Im Rahmen des Projekts soll unter anderem die funktionalität von aktuellen "Stream Frameworks" an die Datenströme von urbanen Seonsoren angepasst werden. Die Zugriffe auf die Datenströme sind nicht einfach, im Rahmen des Projekts soll eine Reihe von Black Boxen erstellt werden, womit der Zugriff erleichtert wird zusätzlich sollen Analysemöglichkeiten zur Verfügung gestellt werden. Das im Rahmen des Projekts gewonnen Wissen soll entsprechenden Unternehmen, im Bereich des Big Data, zur Verfügung gestellt werden. Mit diesem Wissen können aktuelle Probleme von urbanen Umgebungen gelöst werden.
(Weiter... )Es gibt einen Call for Papers von dem Journal Data Mining for Smart Cities. Gesucht werden Arbeiten zum Beispiel aus den folgenden Bereichen:
Artikel müssen bis zum 04.Juli,2016 23:59 eingereicht werden.
(Weiter... )
Die deutsche Akademie der Technikwissenschaften berät Politik und Gesellschaft in technologischen Zukunftsfragen. Sie ist damit eine der wichtigsten Arbeitsakademien zum besten Stand der Technologieforschung. Zusätzlich sorgt acatech für den Transfer in die Praxis und bildet eine Plattform für den Austausch zwischen Wissenschaft und Industrie. Die acatech Mitglieder arbeiten mit externen Wissenschaftlern in Projekten disziplinübergreifend zusammen - bereichert durch die praktische Expertise aus Wirtschaft und Gesellschaft. Damit will acatech als international orientierte Akademie einen Beitrag zur Lösung der globalen Herausforderungen leisten und diesen mit Wertschöpfungsperspektiven für Deutschland verbinden.
Mit der Aufnahme von Katharina Morik würdigt acatech ihr wissenschaftliches Profil, ihre Leistung als Sprecherin des Sonderforschungsbereichs 876, ihre internationale Reputation und Arbeit als innovative Forscherin im Bereich des maschinellen Lernens.
Christian Bockermann hat seine Dissertation mit dem Titel “Mining Big Data Streams for Multiple Concepts” ausgezeichnet verteidigt. Seine Doktorarbeit wurde von Katharina Morik betreut. Im Folgenden wird die Arbeit zusammengefasst:
Modelling streaming data applications in near real-time is motivated by today’s growing demand for in-time data analysis. The thesis reviews the Lambda architecture and state of the art frameworks for data streams and introduces a middle-layer easing the definition of streaming applications in a platform independent way. This enabling technique is demonstrated in two Big Data applications, namely the inline processing and analysis of data in Cherenkov astronomy and the near real-time extraction of viewership statistics in the context of an IP-TV platform.
Fabian Hadiji hat seine Dissertation unter dem Titel "Graphical Models Beyond Standard Settings: Lifted Decimation, Labeling, and Counting" erfolgreich verteidigt. Seine Doktorarbeit wurde von Professor Kristian Kersting betreut.
Im folgenden Abstract wird die Arbeit zusammengefasst:
With increasing complexity and growing problem sizes in AI and Machine Learning, inference and learning are still major issues in Probabilistic Graphical Models (PGMs). On the other hand, many problems are specified in such a way that symmetries arise from the underlying model structure. Exploiting these symmetries during inference, which is referred to as "lifted inference", has lead to significant efficiency gains. This thesis provides several enhanced versions of known algorithms that show to be liftable too and thereby applies lifting in "non-standard" settings. By doing so, the understanding of the applicability of lifted inference and lifting in general is extended. Among various other experiments, it is shown how lifted inference in combination with an innovative Web-based data harvesting pipeline is used to label author-paper-pairs with geographic information in online bibliographies. This results is a large-scale transnational bibliography containing affiliation information over time for roughly one million authors. Analyzing this dataset reveals the importance of understanding count data. Although counting is done literally everywhere, mainstream PGMs have widely been neglecting count data. In the case where the ranges of the random variables are defined over the natural numbers, crude approximations to the true distribution are often made by discretization or a Gaussian assumption. To handle count data, Poisson Dependency Networks (PDNs) are introduced which presents a new class of non-standard PGMs naturally handling count data.
Wer Interesse an Fabian's am LS8 abgeschlossenen und zukünftigen Arbeiten hat, sollte auch seine persönliche Homepage http://hadiji.com/ kennen.
Am Freitag, 13.11.2015, fand das zweite “on the record” zu Wirtschaftsjournalismus und Digitalisierung in der Lounge des BVB, Signal Iduna Park, statt. Die Pressekonferenz des LS 8 gab es allerdings nur in der Kaffeepause und - wie man sieht - ohne Mikrofon. http://www.wipojo.de/ontherecord/
Die Arbeit "Archetypal Analysis as an Autoencoder" von Kristian Kersting zusammen mit Kollegen des Fraunhofer IAIS und der Twenty Billion Neurons GmbH hat auf dem Workshop "Challenges in Neural Computation" (NC^2) der GI-Fachgruppe "Neuronale Netze" und der Deutschen Gesellschaft für Neuronale Netzwerke während der GCPR 2015 in Aachen den Best Paper Presentation Award erhalten.
Das Ziel des INIGHT Projekts war es, neue Möglichkeiten zu erforschen, wie mit Katastrophensituationen in Smart Citys umgegangen werden kann. INSIGHT steht für "Intelligent Synthesis and Real-time Response using massive Streaming of Heterogeneous Data"; die entwickelten Technologien für Data Stream Mining ermöglichen Städteplanern und Notfallpersonal neue Wege in der Analyse und Erkennung von Katastrophen-Szenarien.
(Weiter... )Vom 24. bis 26. Juli war der LS8 in Banff, Kanada im Workshop "Advances in interactive Knowledge Discovery and Data Mining in Complex and Big Data Sets" mit zwei Vorträgen repräsentiert.
Professor Katharina Morik hielt zunächst einen Vortrag zu "Big Data and Small Devices", in dem sie auf die Herausforderungen von Datenanalyse auf kleinen Devices im Hinblick auf Rechenzeit, Speicherverbrauch und Energieeffizienz eingeht. Mit graphischen Modellen für ressourcenbeschränkte Umgebungen wird ein Ansatz diskutiert, der im Sonderforschungsbereich 876 entwickelt wurde.

Außerdem präsentierte Sibylle Hess die Resultate ihrer Diplomarbeit unter dem Titel "Investigation of Code Tables to Compress and Describe Underlying Characteristics of Binary Databases". Die Zusammenhänge zwischen klassischen Frequent Itemset Methoden, dem Minimum-Description-Length Prinzip und Matrixfaktorisierungen werden dargestellt und zu neuen Algorithmen basierend auf numerischer Optimierung kombiniert.

An der TU Dortmund, Fakultät für Informatik am Lehrstuhl VIII, sind ab sofort Stellen für Studentische Hilfskräfte zu besetzen.
(Weiter... )
Die nächste Sommerschule findet vom 02. - 05. September an der naturwissenschaftlichen Fakultät der Universität Porto statt, zusammen mit der ECML 2015. Organisiert wird die Sommerschule in Kooperation von LIAAD-INESC TEC und der TU Dortmund.
Führende Wissenschaftler aus dem Bereich des maschinellen Lernens und des Data-Mining halten unter anderen Vorträge darüber, wie man mit großen Datenmengen oder spatio-temporal streaming data arbeitet.
(Weiter... )Bei den Unternehmenstagen , die vom 26.01.2015 bis zum 09.02.2015 stattfanden, waren Frauen im Berufsleben einer der Schwerpunkte der Veranstaltungsreihe. Um die Innovationen von klein und mittelständigen Unternehmen zu fördern, muss die Wahrnehmung von Frauen als Erfinderinnen gefördert werden. Professorin Katharina Morik nahm an einer Gesprächsrunde teil, die unter anderem über die Vereinbarkeit von Familie und Berufsleben und die mangelhafte Wahrnehmung von Frauen als Erfinderinnen diskutierte.
(Weiter... )
RapidMiner CEO und Gründer Ingo Mierswa präsentiert RapidMiner Academia: Ein Programm, das Studierenden Gratiszugang zu kommerziellen Versionen von RapidMiner Studio verschafft.
RapidMiner entstand 2001 ursprünglich unter dem Namen YALE am LS8 der TU Dortmund und ist heute eine der beliebtesten Softwareumgebungen für Datenanalyse und Data Mining.
(Weiter... )
Ein besonderes Spektrum an Vorträgen fand am Jahresende zum 60. Geburtstag von Katharina Morik statt. Gemeinsam war den drei Hauptrednern, dass sie im Bereich Maschinelles Lernen bzw. Data Mining international höchst renommiert sind und bei Katharina Morik an der (Technischen) Universität Dortmund promovierten. Völlig verschieden ihre Tätigkeitsfelder.
Inhaltliche Gemeinsamkeiten der Redner mit der Jubilarin wurden in der kurzen Einführung deutlich, in der Katharina Morik ihre Forschungsziele zusammenfasste, die sie an der TU Dortmund verfolgt: situierte Systeme, die durch Lernfähigkeit Sensorik, Kommunikation und Handlung verbinden. Anfang der 90er Jahre entstanden Arbeiten zur Robotik: realzeitlich wurden in verteilten, heterogenen Datenströmen Muster entdeckt, die zur Handlungsplanung eingesetzt wurden. Der SFB 876 (Informatik), dessen zweite Phase gerade bewilligt wurde, kann mit seiner Verbindung von Datenanalyse und Cyber Physical Systems in der Leitlinie lernfähiger, situierter Systeme gesehen werden.
Die Arbeiten zu sehr großen Datenmengen, die Katharina Morik in 12 Jahren im SFB 475 (Statistik) zusammen mit Claus Weihs durchgeführt hat, wurden von der Sprecherin dieses Sonderforschungsbereichs, Ursula Gather, in einer kurzen Ansprache gewürdigt.
Ganz unterschiedliche Herangehensweisen, maschinelles Lernen erfolgreich zu erforschen und anzuwenden, wurden durch die Hauptvorträge der drei herausragenden Wissenschaftler deutlich.

Unsere Studierenden mag es freuen, wenn sie einige Beispiele sehen, wozu das Studium an der TU Dortmund befähigt: Forschungsdirektor, Professor, CEO einer Firma – auf der Grundlage herausragender Forschung zu maschinellem Lernen, Data Mining, Big Data Analytics lässt sich einiges machen!
(Weiter... )

Vom 19. Dezember 2014 bis einschl. 9. Januar 2015 ist der Sekretariat des Lehrstuhls nicht besetzt.
Frohe Weihnachten und schöne Feiertage!
Das SpingerBrief beschäftigt sich mit der Analyse von verrauschten, multi-relationalen Daten und schlägt dazu statistisch-relationalen Lernverfahren basierend auf funktionalen Gradient vor. Solche Verfahren kombinieren die Expressivität der Logik erster Ordnung mit der Fähigkeit der Wahrscheinlichkeitstheorie, mit Unsicherheiten umzugehen.
(Weiter... )An der TU Dortmund, Fakultät für Informatik am Lehrstuhl VIII, sind ab Januar 2015 Stellen für Studentische Hilfskräfte zu besetzen.
(Weiter... )
Google, Facebook oder Netflix brauchen für viele ihrer Dienste die Verarbeitung natürlicher Sprache. So gibt es die große Abteilung Natural Language Processing bei Google http://research.google.com/pubs/NaturalLanguageProcessing.html
Das IBM-Programm Watson konnte im Februar 2011 in dem Quiz Jeopardy auf natürlichsprachliche Fragen besser antworten als zwei menschliche Quiz-Sieger.
Ray Kurzweil (Google Director of Engineering) möchte darüber hinausgehen: „So IBM’s Watson is a pretty weak reader on each page, but it read the 200m pages of Wikipedia. And basically what I'm doing at Google is to try to go beyond what Watson could do.“ http://searchengineland.com/ray-kurzweils-job-google-beat-ibms-watson-natural-language-search-185149 Es gibt eine Fülle von Methoden zur Analyse sehr großer Textmengen für ebenfalls viele Anwendungen: Sentiment Analysis, personalisierte Werbung, Empfehlungen, email Routing, automatische Texterstellung für Kurznachrichten und Reporting, automatische Fragebeantwortung, Informationsextraktion aus dem WWW. In der Vorlesung mit Übungen lernen Sie die Methoden und Werkzeuge dazu kennen. Das neue Lehrkonzept beinhaltet inverted class room Sitzungen und selbstständige Arbeiten, so dass Sie für die Praxis gerüstet sind. http://www-ai.cs.uni-dortmund.de/LEHRE/VORLESUNGEN/NLS/WS1415/index.html
Wie handelt man unter Unsicherheit, bei fehlenden oder fehlerhaften Daten? Um mit solchen Unsicherheiten umgehen zu können, haben sich in den letzten Jahren probabilistische, graphischen Modellen bewährt. Sie gehören zu den Bemühungen der modernen Informationstechnik, das Schlussfolgern unter Unsicherheit zu ermöglichen.
Prominente Anwendungsfelder sind die Robotik, die Bioinformatik, die Künstliche Intelligenz, das Maschinelle Lernen. So kommen sie zum Beispiel in der Auswertung von medizinischen Daten, der Analyse von Genexpressionsdaten und dem Tracken von Bewegungen zum Einsatz. Gegenstand der Vorlesung "Probabilistische Graphische Modelle" des LS8 sind grundlegende Fragestellungen und Techniken der graphischen Modelle. http://www-ai.cs.uni-dortmund.de/LEHRE/VORLESUNGEN/PGM/WS1415/index.html

Ganz allgemein sind Daten oft billiger zu erhalten als das Wissen von Experten zu extrahieren und dann zu modellieren. Aber wie können Rechner automatisch große Modelle --- wie sie in der Verarbeitung natürlicher Sprache, bei dem Schätzen von Graphischen Modellen und im statischen Maschinellen Lernen auftreten --- aus Daten schätzen?
In den meisten Lernverfahren steckt als Kern eine Optimierungsaufgabe: der Fehler soll miniert oder die Wahrscheinlichkeit für das richtige Ergebnis maximiert werden. Die theoretischen Grundlagen und Methoden behandelt in englischer Sprache die Vorlesung "Large-Scale Optimization".

Die Ansätze aus allen Vorlesungen können dann zur Anwendungen in der PG "Infoscreen" kommen. Infoscreens sind digitale Bildflächen und sollen eine besondere Aufmerksamkeit in "reizarmen" öffentlichen Räumen erzielen.
Es soll über Aktuelles an der Fakultät für Informatik der TU Dortmund informiert werden.
Ausverkauft! KDD 2014 ist mit 2200 Teilnehmern ausverkauft. Die Tagung konnte keine weiteren Anmeldungen annehmen. Katharina Morik hält einen eingeladenen Hauptvortrag auf dem Workshop BigMine’14.
(Weiter... )Nach der Pressekonferenz ist das Projekt des LS 8 (Katharina Morik, Hendrik Blom,Tobias Beckers) mit der SMS Siemag und der Dillinger Hütte in den VDI Nachrichten in zwei Interviews beschrieben: Dominik Schöne von der Dillinger Hütte und Katharina Morik.
Das europäische Projekt VistaTV hatte am 1.Juli in Amsterdam seine erfolgreiche Abschlussbegutachtung. Vom LS 8 stammt die realzeitliche Datenstromanalyse von Internet-Fernsehen, mit der Werbung von Programm unterschieden wird. Online Empfehlungen auf der Grundlage von Nutzerdaten wurden auf der Grundlage von Termset Clustering erstellt.
(Weiter... )Pressetag der SMS Group in Hilchenbach 3. Juli 2014
Data Mining / Industrie 4.0
Übersichtsvortrag von Katharina Morik zu “Data Mining, Big Data und Prognosemodelle”
Die jüngsten Enthüllungen des Whistle-blowers Edward Snowden haben einmal mehr verdeutlicht, dass im Zeitalter von Social Media das massenhafte Sammeln von Daten enorm attraktiv ist.
Im Rahmen der Veranstaltung soll der Frage, was mit unseren Daten passiert, aus technischer, betriebswirtschaftlicher und soziologischer Perspektive nachgegangen werden. Die technischen Möglichkeiten des modernen Data-Minings sind mannigfaltig und ermöglichen inzwischen weitgehende Schlussfolgerungen bis auf die Individualebene. Gesammelte Daten aus sozialen Netzwerken sind besonders attraktiv für das Marketing und für die Produktentwicklung. Der Datenschutz wird vor diesem Hintergrund vor neue Herausforderungen gestellt.
Die Fachreferenten werden jeweils ca. 10-15 Minuten vortragen und sich im Anschluss an einer Podiumsdiskussion mit dem Publikum beteiligen. Die Veranstaltung wird moderiert von Johannes Weyer.
Der Lehrstuhl VIII zieht in das neue TU-Gebäude der Otto-Hahn-Str. 12. In der Zeit zwischen dem 30.06.14 und dem 04.07.14 sind wir daher nur eingeschränkt erreichbar.

Abstract:
Machine learning can help to enhance small devices. For instance, keeping the energy consumption of smart phones low is one of the major concerns of the users, as is well illustrated by various “charge your mobile” stations at public places. Where the operating systems of smart phones already offer heuristics and battery apps show consumption profiles, machine learning can do more. Predictions allow better optimizations of the operating system, prepare for particular app usages at certain points in time, or manage services such as GPS or WLAN in a context-aware and adaptive manner. This challenges learning algorithms to real-time application of their models. Moreover, it demands the models to run on the resource-restricted device without consuming more energy themselves than they save!
Title: Data Analytics for Sustainability
Abstract:
Sustainability has many facets and researchers from many disciplines are working onthem. Particularly knowledge discovery always considered sustainability an importanttopic (e.g., special issue on data mining for sustainability in Data Mining andKnowledge Discovery Journal, March 2012).
Host: Dr. Kamalika Das
NASA Ames Research Center
MS 269-1, PO Box 1, Moffett Field, CA 94035
Am 27.05.2014 hält Prof. Katharina Morik einen Vortrag zum Thema "Resource-aware graphical models and spatio-temporal predictions" bei Google in Palo Alto, Kalifornien, USA.
Abstract:
Machine learning can help to enhance small devices. For instance, keeping the energy consumption of smart phones low is one of the major concerns of the users, as is well illustrated by various “charge your mobile” stations at public places. Where the operating systems of smart phones already offer heuristics and battery apps show consumption profiles, machine learning can do more. Predictions allow better optimizations of the operating system, prepare for particular app usages at certain points in time, or manage services such as GPS or WLAN in a context-aware and adaptive manner. This challenges learning algorithms to real-time application of their models. Moreover, it demands the models to run on the resource-restricted device without consuming more energy themselves than they save!
In the talk, graphical models are presented that face these challenges. Using Conditional Random Fields (CRF) for the prediction of files that the user will fetch next on her smart phone can be used by the operating system for organizing the memory. Analyzing groups of apps running on the smart phone may estimate the energy consumption over time.
A novel spatio-temporal random field (STRF) has been implemented, smoothing the temporal changes and distributing the optimization. This graphical model has been used to predict app usage over time. In another application, it has been combined with a trip planner resulting in smart routing for smart cities. In order to run graphical models on very restricted devices, even those withoutvfloating point calculation, one computing with integer values only has been developed. The integer approximation of graphical models shows good accuracy and speed-up and opens up novel applications on resource-restricted devices.
Sustainability has many facets and researchers from many disciplines are working on them. Particularly knowledge discovery always considered sustainability an important topic (e.g., special issue on data mining for sustainability in Data Mining and Knowledge Discovery Journal, March 2012).
(Weiter... )
Sustainability has many facets and researchers from many disciplines are working on them. Particularly knowledge discovery always considered sustainability an important topic (e.g., special issue on data mining for sustainability in Data Mining and Knowledge Discovery Journal, March 2012).
Global reports on the millennium goals and open government data regarding sustainability are publicly available. For the investigation of influence factors, however, data analytics is necessary. Big data challenges the analysis to create data summaries. Moreover, the prediction of states is necessary in order to plan accordingly. In this talk, two case studies will be presented. Disaster management in case of a flood combines diverse sensor data streams for a better traffic administration. A novel spatiotemporal random field approach is used for smart routing based on traffic predictions. The other case study is in engineering and saves energy in the steel production based on the multivariate prediction of the processing end-point by the regression support vector machine.
11:00am-12:30pm, Thursday 22 May 2014, ITE 456, UMBC
(Weiter... )MLDM 2015
11th International Conference on Machine Learning and Data Mining
July 11 - 24, 2015, Freie Hansestadt Hamburg, Germany
This congress will feature three events the 11th International Conference on Machine Learning and Data Mining MLDM, the 15 th Industrial Conference on Data Mining ICDM ( www.data-mining-forum.de), and the 10 th International Conference on Mass Data Analyisis of Signals and Images MDA (www.mda-signals.de). Workshops and Tutorial will also be given.
Mehr als 1 Jahr, nachdem die Fakultät für Informatik der TU Dortmund die Ehrendoktorwürde an Monika Henzinger, Professorin an der Universität Wien, verliehen hat, gibt Katharina Morik einen Kurs zu “Data Analytics” im Rahmen des interdisziplinären Kollegs an der Informatik der Universität Wien und stellte außerdem in einem gut besuchten Kolloquiumsvortrag Ergebnisse des SFB876 vor: “Big Data Analytics and Astrophysics”.
Workshop collocated with INFORMATIK 2014, September 22-26, Stuttgart, Germany.
This workshop focuses on the area where two branches of data analysis research meet: data stream mining, and local exceptionality detection.
Local exceptionality detection is an umbrella term describing data analysis methods that strive to find the needle in a hay stack: outliers, frequent patterns, subgroups, etcetera. The common ground is that a subset of the data is sought where something exceptional is going on: finding the needles in a hay stack.
Data stream mining can be seen as a facet of Big Data analysis. Streaming data is not necessarily big in terms of volume per se but instead it can be in terms of the high troughput rate. Gathering data for analyzing is infeasible so the relevant data of a data point has to be extracted when it arrives.
Submissions are possible as either a full paper or extended abstract. Full papers should present original studies that combine aspects of both the following branches of data analysis:
stream mining: extracting the relevant information from data that arrives at such a high throughput rate, that analysis or even recording of records in the data is prohibited;
local exceptionality mining: finding subsets of the data where something exceptional is going on.
In addition, extended abstracts may present position statements or results of original studies concerning only one of the aforementioned branches.
Full papers can consist of a maximum of 12 pages; extended abstracts of up to 4 pages, following the LNI formatting guidelines. The only accepted format for submitted papers is PDF. Each paper submission will be reviewed by at least two members of the program committee.
(Weiter... )"NEM position papers are documents giving the NEM Initiative view on any subject related to the networked electronic media area. The NEM position papers typically include: letters of advice to the Commission, formal opinions submitted to the Commissioner, submissions to regulatory bodies, or any other formal statement of this nature, as well as further views of the NEM community on various technological, societal, and policy issues related to NEM." Source: www.nem-initiative.org
(Weiter... )Unsere Studierende lernen am LS 8 genau das, was in der Wirtschaft stark nachgefragt wird.
(Weiter... )
Annually, the Faculty of Science at Leiden University, the Netherlands, grants the C.J. Kok Jury Award for the best PhD thesis of the past year. All institutes within the faculty (astronomy, physics, mathematics, computer science, chemistry, pharmacy, biology, and environmental sciences) are given the opportunity to nominate candidates for the award.
Out of a pool of over 120 dissertations, the C.J. Kok Jury Award 2013 was won by Wouter Duivesteijn, with his thesis "Exceptional Model Mining". Notably, this is the first time ever that the award (existing since 1971) has been bestowed upon a computer scientist.
Das Buch "RapidMiner: Data Mining Use Cases and Business Analytics Applications" erschien am 6. November 2013 im Chapman and Hall/CRC Verlag
"In this book, case studies communicate how to analyze databases, text collections, and image data. … How the given data are transformed to meet the requirements of the method is illustrated by screenshots of RapidMiner. The RapidMiner processes and datasets described in the case studies are published on the companion web page of this book. The inspiring applications may be used as a blueprint and a justification of future applications."
—From the Foreword by Professor Dr. Katharina Morik, Technical University of Dortmund

Der Artikel Spatio-Temporal Random Fields: Compressible Representation and Distributed Estimation von Nico Piatkowski, Sankyun Lee und Katharina Morik ist für die Publikation im Machine Learning Journal ausgewählt und erhält darüber hinaus den Preis für das beste Papier, zu dem ein Doktorand den entscheidenden Beitrag geleistet hat. Die Preisverleihung fand am Montag, 23. September in Prag statt (www.ecmlpkdd2013.org).
Der Artikel wurde aus 182 Einreichung für die Zeitschriften-Veröffentlichung ausgewählt. Bei einer Akzeptanzrate von 7% gab es 14 akzeptierte Zeitschriften-Veröffentlichungen. Von den 460 Einreichungen zu den Proceedings der Tagung wurden 124 Papiere angenommen (Akzeptanzrate 26%). Von den insgesamt 138 akzeptierten Beiträgen wurden 4 mit einem Preis ausgezeichnet, wovon einer an Nico Piatkowski, Sankyun Lee und Katharina Morik ging.
The International Conference on Extending Database Technology is a leading international forum for database researchers, practitioners, developers, and users to discuss cutting-edge ideas, and to exchange techniques, tools, and experiences related to data management. Data management is an essential enabling technology for scientific, engineering, business, and social communities. Data management technology is driven by the requirements of applications across many scientific and business communities, and runs on diverse technical platforms associated with the web, enterprises, clouds and mobile devices. The database community has a continuing tradition of contributing with models, algorithms and architectures, to the set of tools and applications enabling day-to-day functioning of our societies. Faced with the broad challenges of today's applications, data management technology constantly broadens its reach, exploiting new hardware and software to achieve innovative results.
EDBT 2014 invites submissions of original research contributions, as well as descriptions of industrial and application achievements, and proposals for tutorials and software demonstrations. We encourage submissions relating to all aspects of data management defined broadly, and particularly encourage work on topics of emerging interest in the research and development communities.
Deadline: 15. October 2013
(Weiter... )
Die große Fernseh- und Radio-Tagung IBC findet in Amsterdam statt und der LS8 ist dabei. Gezeigt wird die realzeitliche Analyse von Nutzergruppen des Internet-TV.
Mehr als 50.000 Besucher aus über 160 Ländern besuchen die International Broadcasting Convention, auf der mehr als 1.400 Aussteller die aktuelle Technologie elektronischer Medien präsentieren. Die IBC bietet auch Platz für Forschungsergebnisse in der "Future Zone". Dort stellt das EU-Projekt Vista-TV aus. Vista-TV bietet den Benutzern von Internet-TV realzeitliche Empfehlungen und eine Ansicht aller Programme, die es leichter macht, aus den angebotenen Kanälen eine Sendung auszuwählen. Für die Programmgestalter und die Werbung bietet Vista-TV eine fortlaufende Darstellung der Nutzung. Wie viele Benutzer sehen ein Programm gerade auf dem Mobiltelefon, auf dem Rechner oder über einen großen Bildschirm? Aus welcher Region kommen die aktuellen Zuschauer einer Sendung? Zu welchem Programm wird von einem bestimmten Kanal aus am häufigsten gewechselt? Diese Angaben lassen keine Rückschlüsse auf den einzelnen Zuschauer zu, liefern aber als realzeitliche Statistik wertvolle Informationen. Das streams framework von Christian Bockermann (LS 8) stellt für die live Darstellung der Nutzung die Software-Basis.
(Weiter... )In enger Zusammenarbeit mit dem Technion (Israel Institute of Technology) entstand basierend auf dem *streams* Framework ein System zur Echtzeitanalyse von Fußball-Daten für den Wettbewerb der diesjährigen DEBS Konferenz. Aufgabe der Challenge war die Berechnung von Statistiken über das Lauf- und Spielverhalten der Spieler, die mit Bewegungs- und Ortungssensoren des RedFIR Systems (Fraunhofer) augestattet wurden.
Im Rahmen des Wettbewerbs entwickelte der Lehrstuhl 8 zusammen mit dem Technion das "TechniBall" System auf Basis des *streams* Frameworks von Christian Bockermann. TechniBall ist in der Lage, die erforderlichen Statistiken deutlich schneller als in Echtzeit (mehr als 250.000 Events pro Sekunde) zu verarbeiten und wurde vom Publikum des Konferenz zum Gewinner des DEBS Challenge 2013 gekürt.
Seit der Veröffentlichung am 4. September 2008 gab es bis heute bereits 11732 Downloads einzelner Kapitel aus "Machine Learnung and Knowledge Discovery in Databases". Auch in 2012 bleibt das Buch mit 1055 Downloads gefragt und wird in der Liste der 50% meist verkauften eBooks geführt.
(Weiter... )The goal of the International Conference on Mobile Ubiquitous Computing, Systems, Services and Technologies, UBICOMM 2013, is to bring together researchers from the academia and practitioners from the industry in order to address fundamentals of ubiquitous systems and the new applications related to them. The conference will provide a forum where researchers shall be able to present recent research results and new research problems and directions related to them. The conference seeks contributions presenting novel research in all aspects of ubiquitous techniques and technologies applied to advanced mobile applications.
Deadline: 17. May 2013
(Weiter... )
Fernsehen über das Internet (IP-TV) spielt eine immer größere Rolle in der heutigen Medienlandschaft. Größere Programmvielfalt, Fernsehen auf mobilen Geräten, oder Mediatheken sind nur ein paar Vorzüge der neuen Fernsehwelt. Um das TV-Erlebnis für jeden Zuschauer zu optimieren ist im Hintergrund jede Menge Hightech gefragt. Das EU-Projekt ViSTA-TV erforscht das TV-Verhalten von Benutzern, sucht nach ähnlichen Sendungen und versucht so, dem Zuschauer das bestmögliche Programm zu empfehlen. Von der Lieblingssendung zu interessanten Dokumentationen oder die neuesten Trends - in der Fülle der Angebote wird für jeden Zuschauer das richtige gefunden.
Das Projekt ViSTA-TV ist ein Gemeinschaftsprojekt der Universitäten Zürich, Amsterdam und des Lehrstuhl 8 der Informatik der TU Dortmund, sowie den Unternehmen BBC, Zattoo und der Dortmunder Firma Rapid-I. Ziel des Projektes ist die Analyse des Fernsehverhaltens von IPTV Nutzern um z.B. Empfehlungen von Sendungen möglichst genau an die Bedürfnisse und Vorlieben der Zuschauer anzupassen. Dafür wird das Ein- und Umschaltverhaltens der Benutzer, sowie Eigenschaften des Video-Signals (z.B. Werbungserkennung) analysiert.
Eine Herausforderung stellt dabei die große Datenrate von Video-Daten, die in Echtzeit analysiert werden müssen. Dazu wurde die Datenstrom-Umgebung „streams“, die von Christian Bockermann am Lehrstuhl 8 entwickelt wurde, um die Fähigkeit der Video-Analyse erweitert. Dies ermöglicht die gleichzeitige Analyse von Video-Daten mit dem dazugehörigen Umschaltverhalten aus Log-Daten. Die Ergebnisse werden dann innerhalb eines Empfehlungssystems weiter verarbeitet um Nutzern einen maßgeschneiderten Blick auf das TV-Angebot zu bieten.
Mit im Blick haben die Forscher aus Dortmund dabei natürlich auch die Integra-tion weiterer Datenquellen, wie DBpedia, elektronische Fernsehzeitschriften oder die beliebte Internet Movie Database (imdb). Im Sinne des „Big Data“ Gedankens, werden alle diese Informationen zeitnah analysiert und lassen so auch Informationen über Schauspieler, Nachrichten oder aktuelle Trends auf Twitter und facebook mit in die Empfehlungen einfließen.
Coding-Camp an der TUIn dieser Woche findet an der TU Dortmund das zweite Coding-Camp zum ViSTA-TV Projekt statt. Dabei stehen insbesondere die Integration der Module der Projektpartner im Mittelpunkt. Das Ziel des Coding-Camp ist ein erster lauffähiger Prototyp des Projektes, der Programmempfehlungen an Zuschauer über Handy-Apps anbietet.
Das Buch Managing and Mining Sensor Data unter Beteiligung von SFB-Mitgliedern ist als EBook erschienen und wird ab 28. Februar 2013 auch als Hardcover-Version erhältlich sein. Marco Stolpe (Projekt B3, Lehrstuhl 8) und SFB-Gastwissenschaftler Kanishka Bhaduri haben gemeinsam das Kapitel Distributed Data Mining in Sensor Networks zum Buch beigetragen.
Gerade Sensornetze zeichnen sich durch eine verteilte Verfügbarkeit der Daten aus. Um diese effizient analysieren zu können, müssen Techniken entwickelt werden um Ergebnisse auch mit beschränkten Kommunikationsressourcen zu berechnen.
(Weiter... )
Im Anwendungsfall energie- und ressourcenintensiver Industrien besteht die Herausforderung darin, steigende Produktqualität bei gleichzeitiger Reduzierung von Kosten und Produktionszeiten zu realisieren. Prinzipien und Methoden von Qualitätsmanagement- und Produktionssystemen nach dem Vorbild der japanischen Automobilindustrie rücken dabei als vorrangiges Leitbild branchenübergreifend in den Mittelpunkt. Als ein wesentliches Element des TPS leistet das Prinzip einer prozessimmanenten Qualitätskontrolle, auch bekannt unter den Begriffen Jidoka oder Autonome Automation, einen entscheidenden Beitrag. Jedoch ist das Jidoka-Prinzip im Fall automatisierter, verketteter Produktionsprozesse, wie sie beispielsweise in der Stahlindustrie vorzufinden sind, auf konventionellem Weg nicht ohne weiteres realisierbar.
Ziel dieses Promotionsvorhabens ist die Entwicklung und Validierung einer Systematik zur Ausschussminimierung und Produktqualitätsoptimierung im Kontext starr verketteter, automatisierter Produktionsprozesse. Ein möglicher Ansatz stellt dabei das Konzept der Advanced Process Control dar. Zentraler Gedanke ist dabei die realzeitliche, prozessdatenbasierte Überwachung und Auswertung von Produktionsprozessen mit dem Ziel, kurzfristige Prozessschwankungen ausgleichen und somit die Produktqualität sicherstellen zu können. Das Promotionsvorhaben soll für das oben skizzierte Produktionssystem einen Ansatz entwickeln, der basierend auf der automatisierten Auswertung von Prozessparametern entscheidet, ob die Qualität des aktuell bearbeiteten Produkts den Spezifikationen entspricht oder ob und in welcher Form eine Anpassung der Prozessparameter erforderlich und realzeitlich möglich ist, um die Qualitätsspezifikationen zu erfüllen. Alternativ besteht eine weitere Entscheidungsmöglichkeit darin, das Produkt nicht weiter zu bearbeiten, wenn die Qualitätsabweichung durch Anpassung des Produktionsprozessablaufes nicht korrigiert werden kann.
Die Durchführung des Vorhabens umfasst neben der Entwicklung des theoretischen Konzeptes, eine simulationsbasierte Validierung sowie in enger Kooperation mit der Deutsche Edelstahlwerke GmbH am Standort Witten die Integration des Konzeptes in die betrieblichen Produktionsabläufe. Zur Lösung der Aufgabe soll auf den Einsatz modernster Data Mining-Techniken zurückgegriffen werden.
Betreuer: Prof. Deuse
Bewerbungen ab sofort an:
Dipl.-Wirt.-Ing. Uta Spörer
Tel.: +49 (231) 755 – 5787
Fax: +49 (231) 755 – 5772
E-Mail: spoerer@gsoflog.de
Mo- Do: 8:30 - 12:30 Uhr
(Weiter... )
Im Rahmen des Graduiertenkollegs des SFB 876 hält Stefan Manegold vom CWI Amsterdam am 17.2.2011 um 16 Uhr einen Vortrag über das vertikale DBMS MonetDB. Der Vortrag findet statt im Raum E23 der Otto-Hahn-Straße 14 (Campus Nord der TU Dortmund).
Abstract:
Column-store database management systems have recently experienced a
considerable popularity-boost. The underlying ideas, however, date back to
(at least) the mid 1980's and the technology has been pioneered since the
early 1990's in the MonetDB system, a column-store research prototype that
has been developed into a complete SQL- and XML/XQuery-compliant
column-store DBMS freely available in open source. Next to its column-store
back-bone, MonetDB focuses on high-performance hardware-conscious
algorithms, novel workload-adaptive query processing techniques such as
"cracking", "recycling" and run-time query optimization, and extensibility
at all layers of its software stack.
In this talk, we will provide detailed insight into MonetDB's column-store
architecture and query-processing technology as available in open-source,
discussing its benefits for data mining, OLAP, BI, as well as science
workloads.
BioDatatbases(bioDatabases.m4v, 170.6 MB)
(Weiter... )Das Sekretariat des LS8 ist vom 24.12.2021 bis einschließlich 02.01.2022 nicht besetzt. In dieser Zeit ist die TU Dortmund komplett geschlossen.
Mit guten Wünschen für eine geruhsame Weihnachtszeit und einen zuversichtlichen, gesunden Start in das Jahr 2022! LS8-Team