Trennung unbekannter Signale mit Hilfe von Zeit-Frequenz-Darstellungen

  • Projektgruppe: Signalverarbeitung

Das Gehör ist das wichtigste Kommunikationsorgan des Menschen. Doch die Leistungsfähigkeit dieses Organs geht weit über die reine Vermittlung sprachlicher Information hinaus. Unser Gehör dient uns zur Orientierung und wir können aus einer Vielzahl von Geräuschen die relevanten Signalanteile herausfiltern. Eine Umsetzung dieser Fähigkeiten (Lokalisation und Separation) auf technische Systeme könnte in vielen Bereichen unseres Lebens Anwendung finden. Insbesondere die Trennung der Signale bereitet jedoch große Probleme. Unter Verwendung von Zeit-Frequenz-Darstellungen sollen im Rahmen dieses Projekts Verfahren zur Signaltrennung entwickelt werden.

Beispiel für Signaltrennung

Hier finden Sie ein kleines Beispiel für die Trennung von akustischen Signalen. Der Datensatz wurde im Rahmen der SiSEC 2010 zur Verfügung gestellt. Die Nachhallzeit betrug 250 ms.

Gemischte Signale:

 Signal am linken Mikrofon

Rekonstruierte Signale:

 Sprecher 1  Sprecher 2  Sprecher 3

 

Licensing issue: These files are made available under the terms of the Creative Commons Attribution-NonCommercial-ShareAlike 2.0 license. The authors are Another Dreamer and Alex Q for music source signals and Hiroshi Sawada, Shoko Araki and Emmanuel Vincent for mixture signals.

Motivation und Problemstellung

Das menschliche Gehör nimmt jede Sekunde eine Vielzahl unterschiedlicher Geräusche wahr. Der Anteil störender Signale ist insbesondere in lauter Umgebung und bei Menschenansammlungen besonders hoch. Trotzdem können wir diesen Mix unterschiedlichster Geräusche entwirren und uns auf unseren Gesprächspartner konzentrieren. Auch die Herkunft der Geräusche können wir bestimmen.

 

Die effiziente Umsetzung dieser menschlichen Fähigkeiten (Lokalisation und Separation akustischer Signale) auf technische Systeme könnte in vielen Bereichen Anwendung finden.

Die Schwierigkeit einer technischen Realisierung liegen in der Unbestimmtheit des Systems. Man kennt ausschließlich die Sensorsignale, die mit einer bestimmten Anzahl an Mikrofonen aufgenommen werden können. Aus diesen Informationen muss die Übertragungsmatrix bestimmt werden und die ursprünglichen Signale rekonstruiert werden.

Konzepte zur Problemlösung

Seit ungefähr 10 Jahren wird intensiv auf diesem Gebiet geforscht. Es existieren bereits verschiedenste Verfahren zur Trennung unbekannter Signale (blind source separation). Die Anwendung der Methoden unterliegt jedoch unterschiedlichsten Einschränkungen. Insbesondere für reale Umgebungen (Reflexionen an Objekten, etc.) und eine unbekannte Anzahl an Signalen gibt es nahezu keine vernünftigen Verfahren.

Die besten Ergebnisse werden unter Verwendung von Zeit-Frequenz-Darstellungen erzielt. Durch diese Transformation geht die Faltung des Quellsignals mit der spezifischen Raumimpulsantwort in eine Multiplikation im Frequenzbereich über. Auf Grund der Instationarität der Sprachsignale dürfen jeoch nur beschränkte Zeitabschnitte betrachtet werden. Vor allem die Kurzzeit-Fouriertransformation (short-time Fourier transform) wird sehr häufig verwendet. Der Nachteil dieser Transformation liegt in einer starren Größe der Frequenz- und Zeitauflösung. Dieses Problem kann durch die Verwendung anderer Zeit-Frequenz-Darstellungen, insbesondere den Analytischen Wavelet-Packets behoben werden. Durch geschickte Vorverarbeitung der Signale kann zudem der Einfluß der Reflektionen reduziert werden.

Projektziele und Aufgaben

Im Rahmen des Projekts sollen Verfahren zur Signaltrennung verbessert und neue Algorithmen entwickelt werden. Die Verbesserung der Separationsergebnisse unter realen Umgebungsbedingungen (Reflexionen, unbekannte Anzahl an Schallquellen) ist dabei von besonderem Interesse. Neben einer Trennung der Signale soll eine Lokalisation der einzelnen Quellen ermöglicht werden. Aus diesem Anforderungen ergeben sich auch die einzelnen Forschungsschwerpunkte innerhalb des Projektes.

  • Separation der Signale
  • Echounterdrückung
  • Lokalisation der Schallquellen
  • Objektverfolgung