FIR Filter zur Vermeidung von In-Kopf-Lokalisation beim Kopfhörer-Hören?
Liebe Forenten,
nun bin ich wieder einen Schritt weiter: Durch Einsatz von FIR Filter kann ich die in-Kopf-Lokalisation beim Kopfhörer-Hören vermeiden. Was jetzt folgt ist allerdings noch sehr im
Versuchststadium. Uli Brüggemann, dem ich die Methode vorab dargestellt habe, hat schon angedeutet, dass der Korrekturfilteransatz falsch ist. Aber der Reihe nach.
Ich verwende im Folgenden wieder die Methode, ein Kochrezept darzustellen. Wie das dann realiter schmeckt, findet man sicher erst beim "Nachkochen" heraus. Vielleicht kommen Euch beim Lesen aber auch Ideen, ohne dass Ihr es explizit nachvollziet.
Jedes Feed-back kann hilfreich sein. Und alles eben noch im Versuchsstadium ist, bin ich sehr, sehr daran interessiert, welche Ideen Ihr dazu habt.
Wer von Euch an dieser Fragestellung tieferes Interesse hat, kann sich auch gerne per PN bei mir melden. Meine gesamte Ausrüstung, die ich zum Messen und Abhören benötige, passt durchaus in eine Klappbox (wenn ich die LS mal ausklammere)...
1. Grundbegriffe und Vorgehensweise
Grundsättzlich bin ich mit meiner Kopfhörer Kette sehr zufrieden, was Klangfülle, Transparenz und Detailreichtum betrifft. Was ich verbessern will, ist das räumliche Hören, weil das Orchester mit meiner Kopfhörer-Kette eben in meinem Kopf lokalisiert zu sein scheint. Und das klingt beim AUDEZE nach 100 Musikern im eigenen Kopf (und das ist etwas heftig auch wenn es sehr schön differenziert ist).
Ideen hierzu wurden in diesem Thread ausgetauscht:
http://www.aktives-hoeren.de/viewtopic. ... 7&start=15
Nun folgt der Versuch, meine individuelle „Head Related Transfer Function“ (HRTF) zu messen und durch geeignete FIR Filter beim Abspielen zu berücksichtigen. Dies sollte die „In-Kopf-Lokalisation“ (IKL) vermeiden und zu einem räumlicheren Höreindruck beim Kopf-Hören führen.
Gehen wir dazu mal idealisiert von einer möglichst raum-neutralen Stereo-Abhörsituation mit zwei Lautsprechern aus. Mit dem linken Ohr OL hören wir dann nicht nur das aus dem linken Kanal L stammende Signal „L --> O
L“ sondern auch – leicht zeitversetzt und entsprechend durch unsere Anatomie verfremdet – das aus dem rechten Kanal R stammende “R --> O
L“. Die HRTF (vgl. etwa
http://de.wikipedia.org/wiki/HRTF) charakterisiert also eine Filterwirkung von Kopf, Außenohr, Rumpf etc.
Die Idee ist nun, die HRTF unter Verwendung einer Stereo-Abhörkette zu messen und entsprechende FIR Filter zu generieren, mit denen beim Abspielen die Stereo-Signale dann geeignet gefaltet werden.
Was die zeitliche Verzögerung der Pfade “L --> O
R“ und “R --> O
L“ betrifft, habe ich auf Basis meines Ohrabstandes und elementaren geometrischen Überlegungen einen Wert von 0,233 ms errechnet und ganz gute Erfahrungen gemacht mit 0,22 ms.
2. Messverfahren
Ich verwende eine Messaufbau wie folgt.
Dazu wurde ich angeregt durch den Aufbau eines älteren Sennheiser Kopfbügelmikrofons MKE 2002:
http://www.sennheiser.com/sennheiser/ol ... 90_Sp3.pdf
Bei der Messung von LogSweeps halte ich das Behringer Messmikro von Hand so, dass der vom jeweiligen Ohr reflektierte Schall gemessen wird, ganz analog zu den Zeichnungen in der Anleitung zum Sennheiser MKE 2002.
Ich benötige für die vier oben skizzierten Pfade zwei Stero-LogSweeps. Ich beschreibe das Verfahren jetzt für das linke Ohr. Für das rechte Ohr geht dann alles analog. Betrachten wir also zunächst den Stereo-Logsweep für das linke Ohr O
L. D.h. während der gesamten Messung wird das Mikro ans linke Ohr gehalten. Zuerst kommt das LogSweep Signal aus dem linken und dann aus dem rechten Kanal.
Im Resultat repräsentiert Pulse44L den Pfad „L --> O
L“ (rote Kurve) und Pulse44R den Pfad „R --> O
L“ (die grüne Kurve logischerweise mit geringerem Pegel).
Nun kenne ich mit (((acourate))) nicht sehr gut aus. Ich verwende daher auch für meinen Zweck die Room-Macros, auch wenn sie sicher für einen anderen Zweck entwickelt wurden. Gerade hier hoffe ich auf Tipps von den (((acourate))) Experten unter Euch.
Resultat von Room Macro 1 sind geglättete Pulsefunktionen.
Nun verwende ich die Macros 2 (Target Curve Design) und 3 (Inversion) nicht, da ich ja die spezifischen Eigenschaften der Pulsefunktionen nicht korrigieren sondern eben für die FIR Filter verwenden will. Ich behelfe mir daher damit, die Ergebnisse aus Macro 1 umzukopieren.
Pulse44Lmp.dbl --> Pulse44Linv.dbl und
Pulse44Rmp.dbl --> Pulse44Rinv.dbl
und tue so, als hätte Macro 3 ein entsprechendes Ergebnis geliefert. Anschließend wende ich Macro 4 (Filter Generation) an, um die FIR Filter zu generieren.
Die resultierenden Filter repräsentieren dann die Pfade für das linke Ohr O
L. Damit ich sie später unterscheiden kann von denjenigen fürs rechte Ohr, kopiere ich sie ebenfalls um, also z.B. Cor1S44.wav --> Cor1LS44.wav
Der Vollständigkeit halber liefert Macro 5 (Test Convolution) folgendes Resultat:
Dieselbe Prozedur für rechte Ohr O
R (also neues Projekt, ebenfalls Stereo-LogSweep, Glätten, Filter bestimmen) liefert die Filter fürs rechte Ohr, welche ich entsprechend umbenenne, z.B. Cor1S44.wav --> Cor1RS44.wav.
3. Wiedergabe
Für die Wiedergabe verwende ich den ConvolverVST. Die Pfade „L --> O
L“ und „R --> O
R“ könnten wie normale Stereo-FIR verwendet werden. Für die Pfade „R --> O
L“ und „L --> O
R“ dagegen benötige ich eine leichte zeitliche Verzögerung. Denn das entfernter liegende Ohr bekommt das Signal ja später. Um das dem Convolver VST beizubringen, verwende ich das foobar plugin „Channel Mixer“ und generiere damit aus dem Stereo-Signal ein Vier-Kanal-Signal.
Hierzu wähle ich folgende Einstellung des „Channel Mixer“
http://skipyrich.com/wiki/Foobar2000:Channel_Mixer
(ich gehe einfach die ersten drei Reiter durch)
Der Channel Mixer generiert damit (meinen Experimenten zufolge) folgende Kanalbelegung (beginnend mit 0)
Nun fehlt noch die Konfigurationsdatei für den Convolver VST. Die Syntax ist etwas kryptisch und daher erklärungsbedürftig. Ich habe die Zeilen nummeriert und interpretiere die Eintragungen anschließend. Die Nummern an den Zeilenanfängen gehören natürlich nicht in die Konfigurationsdatei.
Im foobar DSP Manager sieht die Konfiguration wie folgt aus:
Und nach Laden der oben skizzierten Konfigurationsdatei:
4. Hörergebnis
Hören mit Kopfhörer und mit der Konfiguration wie oben beschrieben. Das Klangbild ist räumlich richtiger, als ohne die Faltung. Die Klangquelle lokalisiere
ich nicht mehr in meinem Kopf sondern davor und etwas oberhalb der Stirn. Es ist, als wären meine Lautsprecher eingeschaltet und das „Hüttentheater“ – wie ich das Hören im Nahfeld genannt habe – ist ein wenig nach oben verschoben.
Der Preis, den ich für diesen räumlichen Klangeindruck zahle, ist ein gewisser, aber nicht allzu großer Verlust an Details, Genauigkeit und Dynamik. Meine Hoffnung liegt nun darin, dass ich bei der Filtergenerierung viele Fehler gemacht habe und dies verbessern kann.
Viele Grüße
Harald