Guter Lehrer für Mining-Algorithmen
Die Vergabe der Bachelorarbeit erfolgte im Rahmen der im Frühjahr vereinbarten Zusammenarbeit der HdM mit der Firma Uniserv aus Pforzheim, einem spezialisierten Anbieter von Lösungen für das Kundendatenmanagement.
Der Autor der Arbeit, Paul Titze, Student am Fachbereich Information und Kommunikation des Studiengangs Wirtschaftsinformatik und digitale Medien an der HdM, überprüfte mithilfe verschiedener Testszenarien, in denen Datenanalysen mithilfe von Stammdaten verschiedener Qualität durchgeführt wurden, den Zusammenhang zwischen qualitativ hochwertigen Stammdaten und den Ergebnissen der Analyse via Supervised Machine Learning.
Ergebnis: Vor allem beim Supervised Learning, bei dem die Stammdaten die Grundlage für das Lernen des Algorithmus bilden, konnten mit einer durch Stammdatenmanagement qualitativ hochwertig aufbereiteten Datengrundlage deutlich bessere Vorhersagen erzielt werden als beim Machine Learning mit einem unbehandelten Datenset.
„Mit seiner Arbeit hat Herr Titze erstmals auch empirisch nachgewiesen, dass Datenqualität und Predictive-Analytics-Prognosequalität in direktem Zusammenhang stehen“
„Unternehmen, die heute Predictive Analytics als Grundlage für strategische Geschäftsentscheidungen nutzen, sollten also alles daransetzen, bei den der Analyse zugrunde liegenden Daten eine möglichst hohe Datenqualität zu erreichen.“
Studiengang und Prototyp
Die Vergabe der Bachelorarbeit ist nur eine der gemeinsamen Aktivitäten, die im Rahmen einer Kooperation zwischen Hochschule der Medien und Uniserv vereinbart wurden.
So bietet die HdM beispielsweise seit dem Wintersemester 2016/2017 den neuen Masterstudiengang Data Science und Business Analytics. Das Weiterbildungsangebot umfasst fünf Semester und ist berufsbegleitend.
„Der Bedarf an ausgebildeten Datenspezialisten ist enorm. Gerade internationale Konzerne benötigen dringend das Know-how, wie man aus großen Datenmengen Wissen generiert.
Praktische Szenarien gibt es etwa in der Automobilindustrie, die aufgrund der Fahrweise eines Autofahrers in der Lage ist, den Verschleiß eines Pkw vorherzusagen.
Aber vor allem im Marketing spielen Daten eine große Rolle. Das bekannteste Beispiel ist der Versandhändler Amazon, der dem Kunden auf Basis seiner Such- und Kaufhistorie personalisierte Angebote unterbreitet.“
Uniserv unterstützt das neue Ausbildungsangebot inhaltlich und finanziell.
Golden Profile
Für die Ausbildung setzt die Hochschule der Medien die von Uniserv neu entwickelte Lösungs- und Prozessmethodik Ground Truth ein.
Ground Truth unterstützt Unternehmen dabei, in einem mehrstufigen Vorgehen letztendlich das Golden Profile eines jeden Kunden zu erstellen, das dessen Adressdaten, sein Kaufverhalten, seine Interessen und Vorlieben, aber auch seine Kommunikation und Interaktion mit dem Unternehmen zu einem zentralen Datensatz aggregiert.
Speziell für Predictive Analytics entwickelten die beiden Kooperationspartner einen Prototyp auf der Basis des Ground Truth.
Anhand dieses Prototyps sollte die Bedeutung der Datenqualität als kritischer Erfolgsfaktor für die Güte von Prognosen veranschaulicht werden.
Professor Lehmann erklärt zur Bedeutung von Ground Truth als Grundlage für Predictive Analytics:
„Ground Truth ist ein didaktisch guter Lehrer für Mining-Algorithmen.“