Datenauswertung unter Anwendung von maschinellem Lernen
Die Erfindung betrifft auf maschinellem Lernen (ML) basierende Verfahren und Systeme zur automatischen Erkennung von neuen und relevanten Daten zur kontinuierlichen Vervollständigung einer Datenbasis für ML-basierte Datenauswertungen, wie sie für autonome Systeme (z.B. Fahrzeuge, Roboter und Drohnen) benötigt wird.
Automatische Erkennung von neuen und relevanten Datensätzen unter Anwendung von maschinellem Lernen
Herausforderung
Autonome Systeme benötigen für eigenständige Planungen und sichere Aktionen ein präzises Modell ihrer Umgebung. Die Absicherung der Sensorik und Umweltwahrnehmung ist dabei entscheidend. Bei der Entwicklung von Umgebungswahrnehmungssystemen dominieren inzwischen auf künstlicher Intelligenz (KI) basierende Softwaresysteme, die auf „maschinellem Lernen“ (machine learning, ML) beruhen. Die für das Training von ML-basierten Systemen notwendigen Datenmengen sind allerdings immens. So sind bspw. für die Absicherung von autonomen Fahrfunktionen von Fahrzeugen 6,62 Milliarden Testkilometer notwendig,1 was die Datenspeicherung und -verarbeitung höchst aufwendig macht. Aktuell verfügbare Verfahren filtern die relevanten Daten manuell aus der Gesamtdatenmenge heraus, was einen zeit- und kostenintensiven Prozess darstellt.
Unsere Lösung
Die vorliegende Patentanmeldung präsentiert ein neuartiges Datenreduktionsverfahren für das Training ML-basierter Funktionen (Abb. 1), das von Prof. A. Rausch (TU Clausthal) entwickelt wurde. Mit den Daten aus einem vorliegenden Datenpool wird ein sog. semantischer Diskriminator trainiert. Dieser basiert auf einem Autoencoder-Netz und kann bewerten, ob der nächste eintreffende Datenstrom bereits bekannt ist oder ob dieser eine substantielle Erweiterung des bestehenden Datenpools darstellt. Auf diese Weise kann der ursprünglich sehr große Datenpool deutlich reduziert werden. Werden jedoch substantiell neue Daten in den Autoencoder eingespeist, wird dies beim Decodieren durch einen Differ erkannt und der Datenpool entsprechend erweitert.
Abb.1 Architektur und Prozess zum kontinuierlichen Monitoring von Daten basierend auf einem Dependability Cage Ansatz mit ML-basierter semantischer Neuheitsbestimmung. (Quelle: Adaption nach Patentanmeldung)
Vorteile
- Speichermenge (Datenpool) erheblich reduziert
- Datenverarbeitung beschleunigt/erleichtert
- Effiziente Erkennung von neuen und relevanten Daten
- Substantielle Erweiterung von Datenbanken
- Zeit-, Energie- und Kostenersparnis
Anwendungsbereiche
- Fahrzeuge
- Roboter
- Drohnen
Entwicklungsstand
Die Funktionalität wurde erfolgreich getestet.
Patentsituation
Europäische Patentanmeldung eingereicht
Patentinhaber
Technische Universität Clausthal
Kontakt
Dr. Mirza Mackovic
Patentmanager Technik
E-Mail: Diese E-Mail-Adresse ist vor Spambots geschützt! Zur Anzeige muss JavaScript eingeschaltet sein!
Tel.: +49 551 30724 153
Referenz: CPA-2250-T270
Tags: Software und Algorithmen