Klangblase per KI: Kopfhörer filtern gezielt Stimmen aus dem Lärm
KI-Kopfhörer erzeugen eine Klangblase: Stimmen in der Nähe klingen klar, Lärm aus der Ferne wird um bis zu 49 dB reduziert.
KI-Kopfhörer erzeugen eine „Klangblase“, die alle Geräusche, die mehr als ein paar Meter entfernt sind, verstummen lässt. Ein Forscherteam hat einen Prototyp entwickelt, der es ermöglicht, nahe Gespräche klar zu hören, während weiter entfernte Geräusche effektiv gedämpft werden. Die Innovation stammt von der University of Washington und nutzt künstliche Intelligenz, um eine akustische Blase mit einem Radius von etwa ein bis zwei Metern zu schaffen. Stimmen und Geräusche innerhalb dieser Blase werden verstärkt, während alle außerhalb durchschnittlich um 49 Dezibel reduziert werden – das entspricht dem Unterschied zwischen einem Staubsauger und raschelnden Blättern.
KI verarbeitet Geräusche blitzschnell und erkennt Entfernungen
Der Prototyp basiert auf handelsüblichen geräuschunterdrückenden Kopfhörern, die mit sechs Mikrofonen am Kopfbügel ausgestattet sind. Ein neuronales Netzwerk verarbeitet die Signale der Mikrofone in Echtzeit und erkennt, aus welcher Entfernung die Geräusche kommen.
„Unsere KI kann tatsächlich die Entfernung für jede Schallquelle im Raum lernen und dies in Echtzeit innerhalb von 8 Millisekunden auf dem Hörgerät selbst verarbeiten“, erklärt Shyam Gollakota, Professor an der University of Washington und leitender Autor der Studie. Dies ermöglicht es dem System, Geräusche außerhalb der Blase zu unterdrücken und gleichzeitig die innerhalb der Blase leicht zu verstärken.
Forscher trainieren KI präzise mit realen Schallmustern
Um das System zu trainieren, nutzten die Forscher einen datengestützten Ansatz mit realen Entfernungen. Sie platzierten die Kopfhörer auf einem Puppenkopf, der von einer robotischen Plattform gedreht wurde, während ein beweglicher Lautsprecher Geräusche aus unterschiedlichen Distanzen abspielte. Zusätzlich sammelten sie Daten mit menschlichen Nutzern in 22 verschiedenen Innenräumen wie Büros und Wohnräumen.
Das System funktioniert aus zwei Hauptgründen. Erstens reflektiert der Kopf des Trägers Schallwellen, was dem neuronalen Netzwerk hilft, Geräusche aus verschiedenen Entfernungen zu unterscheiden. Zweitens haben Töne wie menschliche Sprache mehrere Frequenzen, die unterschiedliche Phasen durchlaufen, während sie von der Quelle zum Empfänger reisen. Der KI-Algorithmus vergleicht diese Phasen, um die Entfernung jeder Schallquelle zu bestimmen.
KI-Kopfhörer verstärken Stimmen vielseitiger und effektiver
Im Vergleich zu Geräten wie den AirPods Pro 2 von Apple, die den Klang aus einer bestimmten Richtung verstärken, bietet dieses System den Vorteil, mehrere Sprecher gleichzeitig zu verstärken. Es verliert nicht an Effektivität, wenn der Träger den Kopf bewegt, und ist besser darin, laute Geräusche aus der Richtung des Sprechers zu reduzieren.
Das könnte dich auch interessieren:
- Ablenkung, Müdigkeit, KI: Deutsche kämpfen mit dem Lernen
- Weltpremiere: Das erste „KI-Selbstporträt“ setzt neue Maßstäbe für die Kunstwelt
- Öfter mal die KI anschreien: Chatbot hilft bei Wut und Stress
Derzeit wurde das System nur für den Innenbereich trainiert, da es schwieriger ist, saubere Audiodaten im Freien zu sammeln. Die Forscher der University of Washington arbeiten jedoch daran, die Technologie für Hörgeräte und geräuschunterdrückende Ohrhörer zu adaptieren, was eine neue Strategie für die Positionierung der Mikrofone erfordert. Die Entwickler planen, ein Startup zu gründen, um diese Technologie kommerziell zu nutzen. Der Quellcode für das Proof-of-Concept-Gerät ist bereits verfügbar, sodass andere auf dieser Grundlage weiterentwickeln können.
Was du dir merken solltest:
- KI-Kopfhörer schaffen eine Klangblase, die nahe Stimmen verstärkt und entfernte Geräusche um bis zu 49 Dezibel dämpft – ideal für laute Umgebungen.
- Ein neuronales Netzwerk erkennt Entfernungen blitzschnell durch Mikrofone am Kopfbügel und verarbeitet die Daten in Echtzeit innerhalb von 8 Millisekunden.
- Das System wurde präzise trainiert, nutzt Schallreflexionen und Frequenzphasen und bietet Vorteile gegenüber bestehenden Technologien, indem es vielseitiger und effektiver Stimmen verstärkt.
Bild: © University of Washington