Umwelt- und Wirtschaftsinformatiker sind Datenfehlern auf der Spur!

Projektteam im Bereich Informations- und Datenqualität: Prof. Dr. Rolf Krieger (2. v.l), Dr. Christian Schorr (3. v.l.) und die Studierenden (v.l.n.r.) Berenike Kücker, Christoph Brosch, Maximilian Harth und Florian Sibelius

Weltweit wird die Künstliche Intelligenz (KI) als Schlüsseltechnologie angesehen. Sie wird über autonome und intelligente Systeme Arbeitsprozesse und ganze Produktions- und Wertschöpfungsketten in der Wirtschaft verändern. Dabei basieren moderne KI-Anwendungen auf der Auswertung von gigantischen Datenbergen, die in Softwaresystemen der Unternehmen, im Internet oder der sozialen Netzwerke erzeugt werden. Die Leistungsfähigkeit der KI-Anwendungen wird unteranderem von der Qualität dieser Daten bestimmt. Daten gelten als der Rohstoff des 21. Jahrhunderts.

In einem vom Bundesministerium für Forschung und Entwicklung im Förderprogramm KMU-innovativ geförderten Projekt (FKZ 01|S18018) arbeiten die Umwelt- und Wirtschaftsinformatiker am Umwelt-Campus Birkenfeld an einem KI-basierten System zur Messung, Verbesserung und Sicherstellung der Datenqualität. Schwerpunktmäßig werden Produktdaten und deren Verarbeitung in Handelsunternehmen betrachtet. Fehlerhafte Daten verursachen in Unternehmen hohe Kosten und können beispielsweise infolge von Retouren auch negative Auswirkungen auf die Umwelt haben. In der Projektarbeit werden Theorie und Praxis gleichermaßen berücksichtigt. So werden die entwickelten maschinellen Lernverfahren in enger Kooperation mit Unternehmen bewertet.

Die Entwicklung von KI-basierten Systemen ist sehr rechenzeitintensiv. Hierfür hat das Team um den Wirtschaftsinformatiker Prof. Dr. Rolf Krieger und den Mathematiker Dr. Christian Schorr einen leistungsfähigen Machine Learning Server eingesetzt. Dieser verfügt über zwei Intel Xeon Silver 4110 (8 Kerne, 16 Threads) CPUs und 64 GB RAM. Zusätzlich sind 4 Gigabyte GTX 1080TI GPUs mit jeweils 11GB RAM integriert, um anspruchsvolle parallelisierte Aufgaben schnell und effizient durchführen zu können. Des Weiteren besteht eine enge Kooperation mit der Rechenzentrumsallianz Rheinland-Pfalz (RARP), deren Hochleistungscluster „Elwetritsch“ mit über 15000 Kernen und über 80 TB RAM für das High Performance Computing zur Verfügung steht (https://elwe.rhrk.uni-kl.de/elwetritsch/hardware.shtml).

In das Forschungsprojekt sind auch Bachelor- und Masterstudierende über Projekt- und Abschlussarbeiten eingebunden. So wurde in einer Masterarbeit ein KI-basiertes System zur Klassifikation von Produkten entwickelt.

Klassifikation von Produktdaten nach der Global Product Classification Hierarchie

Bei der Klassifikation werden Produkte abhängig von ihren Eigenschaften Produktgruppen zugeordnet. In vielen Unternehmen geschieht das heute noch manuell, was sehr zeitaufwändig ist. Grund ist, dass bei der Klassifizierung in größeren Unternehmen über 3000 Produktgruppen berücksichtigt werden müssen. Mit dem hier entwickelten Verfahren erfolgt die Klassifizierung automatisch, wobei 86% der Klassenzuordnungen korrekt sind. Um das entwickelte Verfahren weiter zu optimieren und Fehlklassifikationen zu identifizieren wurde in einer studentischen Projektarbeit ein spezielles Analysewerkzeug entwickelt, das über die Güte der automatischen Klassifikation in der praktischen Anwendung kontinuierlich informiert. Die Fehlerursachen können interaktiv analysiert und Korrekturen vorgenommen werden.

In einem anderen Bereich wurde ein Programm entwickelt, mit dem Mitarbeiterinnen und Mitarbeiter eines Handelsunternehmens Tausende von Datenqualitätsregeln analysieren und ihren Nutzen bewerten können. Auch hier ist die Visualisierung der Daten aufgrund der Vielzahl von Regeln von zentraler Bedeutung.

Programm zur explorativen Analyse von Datenqualitätsregeln
Visualisierung von Datenqualitätsregeln

Das Forschungsthema ist dem Wissenschaftsfeld Data Science zugeordnet, mit dem sich derzeit viele Unternehmen beschäftigen und das für den Wirtschaftsstandort Deutschland enorm wichtig ist. Für Prof. Krieger, der auch Leiter des Studiengangs Umwelt- und Wirtschaftsinformatik ist, bietet das Projekt die Chance Studierende in einem hochaktuellen Bereich mit exzellenten beruflichen Perspektiven auszubilden.

 

01. Juli 2020

Von: Prof. Dr. Rolf Krieger

back-to-top nach oben