Vermisste nach einem Erdbeben unter Trümmern aufzuspüren ist auch für Rettungsroboter eine große Herausforderung. Ähnlich ist es in der Medizin: Gene zu finden, die für spezifische Krankheiten verantwortlich sind, ist kompliziert. Manchmal ist das wie die Suche nach der Nadel im Heuhaufen. Für Anwendungsfälle wie diese, hat emergenCITY-Wissenschaftler Jasin Machkour mit dem T-Rex Selector eine effiziente Methode entwickelt. Zum T-Rex Selector ist jetzt ein Paper im Fachmagazin Signal Processing, einem der renommiertesten Journale für Signalverarbeitung, erschienen und ein weiteres Paper wurde bereits zur Veröffentlichung angenommen.

Unter dem Titel „The terminating-random experiments selector: Fast high-dimensional variable selection with false discovery rate control“ stellen die Autoren Jasin Machkour, Michael Muma und Daniel P. Palomar eine Methode vor, die in großen, hochdimensionalen Daten eine benutzerdefinierte Falscherkennungsrate (FDR) kontrolliert und gleichzeitig die Anzahl der ausgewählten Variablen maximiert. Der T-Rex Algorithmus kann in deutlich kürzerer Rechenzeit als bisherige Methoden reproduzierbare Ergebnisse liefern. Während Benchmarkmethoden unter anderem innerhalb von fünf Stunden Variablenauswahlprobleme mit nur 5000 Variablen berechnen können, sind bei der vorgestellten Methode in derselben Zeit fünf Millionen Variablen möglich.

„Das ist beispielsweise für den emergenCITY-Rettungsroboter Scout relevant“, sagt Jasin Machkour, wissenschaftlicher Mitarbeiter im Fachgebiet Robust Data Science an der TU Darmstadt. „Mithilfe der Radardaten können so schneller die richtigen Richtungen gefunden werden, in denen vermisste Personen liegen, und Fehlalarme reduziert werden.“

emergenCITYS Rettungsroboter Scout
© Sascha Mannel

Mithilfe des T-Rex Selectors könnten Rettungsroboter wie emergenCITYS Scout Vermisste schneller finden.

Generell kann der T-Rex Selector für verschiedene Anwendungen interessant sein, darunter medizinische Studien. So besteht bereits eine Kooperation mit der Charité Berlin, in der untersucht werden soll, ob die Methoden geeignet sind, um mit weniger Daten, also auch mit weniger Studienteilnehmer:innen, dieselben Ergebnisse zu erzielen wie herkömmliche Methoden.

Das ebenfalls von den Forschenden entwickelte Open-Source Softwarepaket ist bereits auf großes Interesse gestoßen. Seitdem es öffentlich zugänglich ist, wurde es bereits 16.000-mal heruntergeladen.

In einem weiteren Artikel, der demnächst ebenfalls im Fachmagazin Signal Processing erscheint, sowie zwei Konferenz-Papern, die im April auf der International Conference on Acoustics, Speech, and Signal Processing (IEEE ICASSP), der größten Konferenz für Forschende im Bereich der Signalverarbeitung, vorgestellt werden, präsentieren die Wissenschaftler weitere methodische und algorithmische Resultate sowie Software-Lösungen zum Thema, unter anderem eine Erweiterung auf komplexwertige Daten.

Publikation:

Jasin Machkour, Michael Muma, Daniel P. Palomar, The terminating-random experiments selector: Fast high-dimensional variable selection with false discovery rate control, Signal Processing, Volume 231, 2025, 109894, ISSN 0165-1684, https://doi.org/.

Weitere Informationen

Robust Data Science Group der TU Darmstadt: www.etit.tu-darmstadt.de/rds/index.en.jsp

T-Rex-Softwarepaket: https://cran.r-project.org