Mehr wissen, besser planen
Es wird oft vergessen, dass der Kampf um Fachkräfte nicht nur auf dem Arbeitsmarkt geführt wird, sondern innerhalb der Unternehmen selbst. Wem es gelingt, qualifizierte Mitarbeiter dauerhaft zu binden, sichert sich deren Erfahrungsschatz und die eigene Wettbewerbsfähigkeit. Zu diesem Ergebnis kommt ein Pilotprojekt zum Thema maschinelles Lernen, das die Windhoff Group gemeinsam mit der Deutschen Rentenversicherung Bund (DRV Bund) durchgeführt hat.
„Bei der DRV Bund wird das Thema der strategischen Personalplanung in den kommenden Jahren wichtiger denn je. Aufgrund der Altersstruktur Deutschlands befinden wir uns in einem doppelten Demografie-Dilemma: Einerseits steigt mit der Zahl der Rentner die Menge der Anträge und damit unser Personalbedarf. Andererseits verlassen uns mittelfristig sehr viele Mitarbeitende altersbedingt, was unseren Personalbestand reduziert. Hinzu kommen ein immer intensiverer War for Talents und eine steigende Dynamik der Arbeitswelt“, erklärt Dr. Michael Tekieli, verantwortlich für People Analytics bei DRV Bund.
Wandelnde Prioritäten
Bisher habe das Thema Fluktuation nicht zu den Schmerzpunkten gehört, aber es werde in naher Zukunft definitiv an Relevanz zunehmen, so Dr. Tekieli weiter: „Um zu vermeiden, dass die Fluktuation ein Schmerzpunkt wird, benötigen wir zielgerichtete Lösungen. Diese sollten es uns ermöglichen, mindestens Veränderungen der Personallandschaft frühzeitig und genau zu antizipieren und im besten Fall mit unserem Wissen erfolgskritischen Austritten proaktiv und effektiv entgegenzuwirken.“
Vor diesem Hintergrund wurden für das Pilotprojekt zwei Fragestellungen formuliert: Inwiefern kann maschinelles Lernen dazu beitragen, Fluktuationsrisiken zu identifizieren? Ist erklärbare künstliche Intelligenz (engl. Explainable Artificial Intelligence, XAI) in der Lage, Gründe für nicht altersbedingte Fluktuation zu verstehen? Um die Antworten auf diese Fragen zu geben, entschieden sich die Projektverantwortlichen für den Einsatz von Smart Predict in Verbindung mit der SAP Analytics Cloud.
Im ersten Schritt war es wichtig, eine stimmige Datengrundlage aus internen (ERP- und HR-Systemen) sowie externen Quellen zu schaffen. In der Praxis bedeutete dies, dass die persönlichen und beruflichen Daten eines Mitarbeitenden durch Aspekte aus dem Unternehmensumfeld ergänzt wurden. In Summe wurden 40 deskriptive Attribute codiert. Als Nächstes wurden die wichtigsten Einflussfaktoren identifiziert: Alter, Alter des jüngsten Kindes, tatsächliche Arbeitszeit ohne Fehlzeiten, Betriebszugehörigkeit in Monaten, absolute Gehaltserhöhung in den vergangenen zwölf Monaten und die Stärke der Einschränkungen durch Maßnahmen während der Pandemie im Abgleich mit dem Covid Stringency Index.
Bei der Suche nach geeigneten deskriptiven Variablen wurden wissenschaftliche Veröffentlichungen sowie die Kreativität des gesamten Projektteams hinzugezogen. Als Zielvariable ergaben sich verschiedene Zeithorizonte einer nicht altersbedingten Kündigung in den kommenden Monaten (1/3/6/12). Die erfassten Attribute wurden für jeden der über 25.000 Mitarbeiter auf monatlicher Basis für die Jahre 2018 bis 2020 erhoben. Daraus resultierte ein Datensatz von 650.000 Zeilen oder 230 Megabyte.
Smart Predict
Smart Predict ermöglicht es, die Analyse der erhobenen Daten im Fachbereich als Self-Service durchzuführen. Entscheidende Argumente für den Einsatz der SAC waren die schnelle Erarbeitung der Ergebnisse durch automatisiertes maschinelles Lernen, transparente Ergebnisse dank XAI und eine hohe Prognosegüte der leistungsfähigen Algorithmen des maschinellen Lernens. Die Analyse funktioniert intuitiv und ist ohne Programmierkenntnisse durchführbar, sodass weder IT-Experten noch Data-Science-Ressourcen notwendig sind.
Um Vorbehalten bei der Akzeptanz entgegenzuwirken, wurde ein sogenannter Out-of-Sample-Test durchgeführt. In dem Projekt wurde unter anderem deutlich, dass ein Algorithmus, der mit den Daten vor Juni 2020 trainiert wurde, auch retroperspektivisch im zweiten Halbjahr 2020 abwandernde Mitarbeitende mit Trefferquote von 12,5 Prozent erkannt hätte. Der Test zeigte außerdem, dass die gelernten Zusammenhänge „robust“, also in die Zukunft übertragbar waren. Insgesamt wurden mehr als 50 Prozent der nicht altersbedingten Fluktuationen durch maschinelles Lernen erkannt.
Eine weitere Methode zur Steigerung der Akzeptanz war eine Plausibilitätsprüfung der gefundenen Muster, mit denen das Predictive-Analytics-Modell Prognosen erzeugt. Die gefundenen Muster waren weiterhin ein wichtiges Mittel, um zu verstehen, welcher Mitarbeitende aus welchen Beweggründen das Unternehmen verlassen könnte. Moderne Algorithmen des maschinellen Lernens sind allerdings so komplex, dass die Wirkung von Einflussfaktoren auf die Abwanderungswahrscheinlichkeit nicht unmittelbar nachvollziehbar ist. Man spricht von einem Blackbox-Phänomen. Hier wurden in den vergangenen Jahren im Forschungsgebiet XAI die Ansätze geschaffen, die Blackbox sukzessive zu erklären.
Die SAC nutzt seit dem Release Q3 2021 beispielsweise die SHAP Values. Hiermit lassen sich auf lokaler Ebene, also bezogen auf den einzelnen Mitarbeitenden, die Bedeutung und der Einfluss verschiedener Attribute erklären. Damit wird eine Plausibilitäts- und Kausalitätskontrolle durch Domänenexperten sowie die Extraktion von neuem Wissen möglich.
Neben der individuellen Auswertung einzelner Mitarbeitenden wurden zusätzlich Analysen bezüglich prototypischer Beispiele mit automatisierten Clusterverfahren (Smart Grouping) durchgeführt. Die Verknüpfung zur bestehenden Personalplanung für altersbedingte Fluktuation erfolgt über eine Aggregation der Erwartungswerte über verschiedene Dimensionen hinweg. So lässt sich erkennen, welche Abteilungen und Positionen voraussichtlich besonders stark von nicht altersbedingter Fluktuation betroffen sind. Dr. Tekieli ergänzt: „Für uns als Organisation kommt dabei lediglich eine Auswertung und Darstellung auf einem aggregierten Niveau infrage. Über diesen Weg schaffen wir daher eine gesunde Balance, die betrieblichen Rahmenbedingungen für unsere Mitarbeitenden zu verbessern, dabei die Vielfalt an Bedürfnissen zu berücksichtigen und gleichzeitig jederzeit den Schutz personenbezogener Daten gemäß DSGVO zu gewährleisten.“
Projektergebnisse überzeugen
Es bleibt festzuhalten: Mit modernen Technologien lassen sich objektive Antworten aus historischen HR-Daten extrahieren. So kann die Fluktuation bereits Monate im Voraus antizipiert und können sogar Wahrscheinlichkeiten prognostisch quantifiziert werden. Folglich lassen sich aktiv Personalhaltungsmaßnahmen (zum Beispiel gezielte Weiterentwicklungsmöglichkeiten) initiieren, um Mitarbeitergruppen im Unternehmen zu halten.
„Ich war zunächst sehr skeptisch, was den Einsatz von automatisiertem maschinellen Lernen angeht, da der vermeintlich wichtige Schritt der Hyperparametrisierung entfällt. Umso mehr war ich von der Prognosegüte positiv überrascht. Ein wichtiger Erfolgsfaktor von automatisiertem maschinellen Lernen ist dabei sicherlich die Datenqualität. Wenn man sämtliche Schritte der Maschine überlässt, wird die Qualität der Trainingsdaten noch wichtiger. Das eher unbeliebte und trockene Thema der Datenintegrität sollte daher für Organisationen mindestens genauso wichtig sein wie ein einheitliches und übersichtliches Machine-Learning-Dashboard“, hält Dr. Tekieli fest.