Datenauswertung unter Anwendung von maschinellem Lernen

Die Erfindung betrifft auf maschinellem Lernen (ML) basierende Verfahren und Systeme zur automatischen Erkennung von neuen und relevanten Daten zur kontinuierlichen Vervollständigung einer Datenbasis für ML-basierte Datenauswertungen, wie sie für autonome Systeme (z.B. Fahrzeuge, Roboter und Drohnen) benötigt wird.

Automatische Erkennung von neuen und relevanten Datensätzen unter Anwendung von maschinellem Lernen

Herausforderung

Autonome Systeme benötigen für eigenständige Planungen und sichere Aktionen ein präzises Modell ihrer Umgebung. Die Absicherung der Sensorik und Umweltwahrnehmung ist dabei entscheidend. Bei der Entwicklung von Umgebungswahrnehmungssystemen dominieren inzwischen auf künstlicher Intelligenz (KI) basierende Softwaresysteme, die auf „maschinellem Lernen“ (machine learning, ML) beruhen. Die für das Training von ML-basierten Systemen notwendigen Datenmengen sind allerdings immens. So sind bspw. für die Absicherung von autonomen Fahrfunktionen von Fahrzeugen 6,62 Milliarden Testkilometer notwendig,1 was die Datenspeicherung und -verarbeitung höchst aufwendig macht. Aktuell verfügbare Verfahren filtern die relevanten Daten manuell aus der Gesamtdatenmenge heraus, was einen zeit- und kostenintensiven Prozess darstellt.

Unsere Lösung

Die vorliegende Patentanmeldung präsentiert ein neuartiges Datenreduktionsverfahren für das Training ML-basierter Funktionen (Abb. 1), das von Prof. A. Rausch (TU Clausthal) entwickelt wurde. Mit den Daten aus einem vorliegenden Datenpool wird ein sog. semantischer Diskriminator trainiert. Dieser basiert auf einem Autoencoder-Netz und kann bewerten, ob der nächste eintreffende Datenstrom bereits bekannt ist oder ob dieser eine substantielle Erweiterung des bestehenden Datenpools darstellt. Auf diese Weise kann der ursprünglich sehr große Datenpool deutlich reduziert werden. Werden jedoch substantiell neue Daten in den Autoencoder eingespeist, wird dies beim Decodieren durch einen Differ erkannt und der Datenpool entsprechend erweitert.

Festoxidbrennstoffzelle in SchnittdarstellungAbb.1 Architektur und Prozess zum kontinuierlichen Monitoring von Daten basierend auf einem Dependability Cage Ansatz mit ML-basierter semantischer Neuheitsbestimmung. (Quelle: Adaption nach Patentanmeldung)

Vorteile

  • Speichermenge (Datenpool) erheblich reduziert
  • Datenverarbeitung beschleunigt/erleichtert
  • Effiziente Erkennung von neuen und relevanten Daten
  • Substantielle Erweiterung von Datenbanken
  • Zeit-, Energie- und Kostenersparnis

Anwendungsbereiche

  • Fahrzeuge
  • Roboter
  • Drohnen

Entwicklungsstand

Die Funktionalität wurde erfolgreich getestet.

Patentsituation

Europäische Patentanmeldung eingereicht

Patentinhaber

Technische Universität Clausthal

Kontakt

Dr. Mirza Mackovic
Patentmanager Technik
E-Mail: Diese E-Mail-Adresse ist vor Spambots geschützt! Zur Anzeige muss JavaScript eingeschaltet sein!
Tel.: +49 551 30724 153
Referenz: CPA-2250-T270

Tags: Software und Algorithmen

Suche

Eine Tochter der

Georg-August-Universität