Trinaurale Wiedergabe
Verfasst: 22.08.2022, 13:32
Was man nicht kennt vermisst man nicht. Man kann allenfalls ungewiß von etwas träumen.
In unserem Hobby gehört dazu eben das optimale Hörvergnügen. Das bedeutet m.b.M.n. aber nicht, dass es der Realität entsprechen muss.
Und so sind wir dann doch immer auf der Suche ...
Das haben allerdings auch schon viele versucht und es macht Sinn, sich mit dem zu beschäftigen, was andere schon einmal gemacht haben. Also sich etwas von den Altvorderen anschauen, überprüfen, auf den damaligen Zeitgeist Rücksicht nehmen und zwischenzeitliche Entwicklungen mit bedenken. Um dann alte/neue Ideen zu verifizieren, sie auch wieder zu verwerfen oder eben etwas daraus zu machen.
Und so schaue ich mir derzeit das Thema trinaurale Wiedergabe an. Und werfe den alten Teebeutel nochmal in frisches Wasser.
Klar ist, dass ein dritter Lautsprecher einen zusätzlichen Aufwand bedingt. Da mag und muss nicht jeder mitgehen.
Am Anfang steht also die Literaturrecherche. Oder heute auch das Nachgucken in allen möglichen Forumsbeiträgen. Davon gibt es reichlich. Natürlich findet man dann auch Berichte zwischen himmelhochjauchzend und zu Tode betrübt. Aber selbst rausfinden tut man es eben nur, wenn man sich selbst auf den Weg macht. Mir helfen Forenbeiträge dann weiter, wenn man nicht schwurbelt, sondern auf hilfreiche Literatur hinweist. Über dortige Verweise und Zitate geht es zu weiteren Arbeiten bis auch hin zu Patenten.
In diesem Fall sei z.B. auf Arbeiten von Michael Gerzon (https://de.wikipedia.org/wiki/Michael_Gerzon) und Elias Pekonen hingewiesen, die ich als sehr hilfreich empfinde.
Allerdings, einfaches Abkupfern einer Formel wie z.B.
Lout = Lin - 0,5 x Rin
Rout = Rin - 0,5 x Lin
Center-out = (1 - 0,5) x (Rin + Lin)
(genannt in viewtopic.php?p=222625#p222625)
mag die einfache Lösung sein, vor allem bequem. Und dabei auch der schnellste Weg zum Scheitern.
Ich will dazu einmal einige Fallstricke aufzeigen, die übrigens auch bei Gerzon und Pekonen nicht unbedingt erwähnt werden.
1. Gleichung mit Unbekannten
Enthalten Gleichungen z.B. drei Unbekannte, so benötigt man drei voneinander unabhängige Gleichungen um diese Unbekannten zu finden.
In unserem Fall liegt ein Stereosignal vor und es soll ein trinaurales Signal gerechnet werden. Aus stereoL (L2) und stereoR (R2) soll trinauralL (L3), trinauralC (C3) und trinauralR (R3) werden. In L2 und R2 ist soweit alles vorhanden, z.B. auch die Phantommitte. Die ja dann von C3 gespielt werden soll. Aber: man kann es drehen und wenden wie man will. Es gibt keine Lösung um voneinander unabhängige Ergebnisse für L3, C3 und R3 zu finden. Man bekommt keine saubere Lösung.
Am Beispiel der o.g. genannten Gleichung enthält L3 einen Anteil von R2. Was genau hat nun der rechte Kanalanteil im neuen linken Kanal zu suchen?
Erkenntnis: es gibt keine genaue Lösung. Nur Annäherungen. Und wenn man sich darüber bwusst ist weiss man, dass das trinaurale Hören keine absolute Lösung ist, wenn es aus einem Stereosignal erzeugt wird.
Historisch gesehen haben sich leider keine drei Kanäle im Musiksignal durchgesetzt, ist ja z.B. bei einer Schallplatte nicht trivial.
2. Energieerhaltung
Man weiss zumindest, dass eine Bedingung gelten muss:
L3² + C² + R3² = L2² + R2²
Rechnet man das für obiges Beispiel ist das Ergebnis 1.5(L2² - L2R2 + R2²). Also ist klar, dass die Beispielformel nicht passt. Und so lassen sich dann einige Beispiel schnell auf ihre Gültigkeit prüfen.
Nun, Gerzon und Pekonen (u.a.) haben das jedenfalls bereits postuliert, damit sind ihre Gleichungen denn auch in diesem Sinn korrekt.
3. Vergleichbarkeit von Lösungen
Gerzon betrachtet die Aufgabenstellung als Mathematiker als Transformation von Matrizen, genauer als Rotation abhängig von einem Winkel zwischen 0° und 90°. Daraus ergeben sich dann die von ihm dargestellten Parameter. Da "trinaural" für einen richtigen Mathematiker zu einfach ist, betrachtet er denn auch gleich den allgemeinen Fall mit Y Lautsprechern bei X Musikkanälen. Das freut dann den weniger vorgebildeten Anwender.
Pekonen wiederum variiert anstelle eines Winkels einen Multiplikationsfaktor im Bereich 0 bis 1. Was ist denn nun korrekt? Am Ende stellt sich heraus, dass sich eben die Ergebnisse von Gerzon und Pekonen schlichtweg ineinander umrechnen lassen. Das eine sieht für den Laien definitiv kryptischer aus, das andere einfacher.
4. Zeitgeist
Greift man auf frühere Lösungen zurück, ist es sinnvoll diese immer unter dem jeweiligen Zeitgeist zu betrachten. Und so wurden den vor einigen Jahren trinaurale Lösungen vorgestellt, die dann als Trinauralprozessoren in einem passenden Gehäuse angeboten wurden. Gefüllt mit entsprechender analoger Elektronik, die schlichtweg als Rechenwerk fungierte. Heute sieht man das eben anders, wozu gibt es denn Rechner.
Also, ich nehme mal eine der Formeln von Pekonen:
L3 = 0.5*L2 -0.5*R2
C3 = 0.707*(L2 + R2)
R3 = 0.5*R2 - 0.5*L2
Prima, das ist doch fix programmiert. Schnell das Ganze aufgebaut und Musik gehört. Und der eine findet das super während der andere nicht glücklich wird. Weil das Ergebnis vom Musikmaterial abhängt. Wenn zufällig linker und rechter Kanal voll ausgesteuert sind, betrachtet hier mit einem jeweils normierten Pegel mit Wert 1, dann ergibt sich mit C3 = 0.707*(1+1) = 1.4. Der Centerkanal ist dann voll übersteuert, er clippt. Das steht so aber nicht bei Gerzon und Pekonen, muss aber berücksichtigt werden.
5. Frequenzabhängiges Hören
Gerzon betrachtet richtigerweise die Frequenzabhängigkeit. Oberhalb von ca. 700 Hz hören wir im wesentlichen pegelabhängig (Intensitätsstereofonie), die Ohrabstände sind zu groß um Phasenunterschiede zwischen linkem und rechtem Ohrsignal ermitteln zu können.
Unterhalb 700 Hz beginnen wir, Phasenunterschiede wahrzunehmen (Laufzeitstereofonie). An dieser Stelle schaut Gerzon dann auf die Auswirkungen des Rotationswinkels und postuliert dann unterschiedliche Winkel für die jeweiligen Bereiche. Was dann dazu führt dass es sinnvoll ist für die jeweiligen Bereiche eigene Gleichungen zu realisieren und abzustimmen. Real bedingt dies aber auch, dass man Frequenzbereiche trennen muss. Mit üblichen Tiefpass- und Hochpassweichen werden aber jeweils andere Phasendrehungen eingeführt und bekanntlich ist die Addition oder Subtraktion von phasenverschobenen Signalen nicht notwendigerweise zielführend. Insofern spricht Gerzon dann auch wiederum von Phasenkompensation. Heute können wir ja denn doch einfacher linearphasige Weichen verwenden, ein Preis dabei ist jedoch ein prinzipbedingtes Delay.
Pekonen nimmt zu diesem Thema übrigens keine Stellung.
6. Umsetzung
Da ich selbst leider nach wie vor auf die eigene trinaurale Realisierung bei meinem System warten muss haben wir bei Holger die ersten Versuche gestartet, siehe dazu Holgers Faden (viewtopic.php?p=222585#p222585 ff.). Vielen Dank an Holger! Als pragmatischer Ansatz wurde hier ein Mitteltonhorn und ein Hochtonhorn als Center verwendet, der Frequenzbereich ist IIRC 500 Hz bis 8 kHz. Dabei ist als Basisgedanke zugrundegelegt, dass wir, zugehörend zur Gattung der Fluchttiere) für eine Lokalisierung bzw. Ortung beim Hören eben prinzipbedingt die höheren Frequenzen verwenden (das berühmte Knacken im Wald). Da das System linearphasige Weichen verwendet, ist eine Problemstellung beseitigt bzw. vermindert.
Meine Arbeitsversion des AcourateConvolvers erlaubt nun die Vorgabe des Rotationswinkels als Parameter und wir haben mit einem der von Gerzon betrachteten Winkel von 55° gestartet und den Freitag mit 4 Leuten gehört. Prima soweit.
Am Samstag wurde das gesamte System nochmals penibel eingemessen und dann der Rotationswinkel variiert. Z.B. haben wir den von Pekonen vorgeschlagenen Winkel von 41.8° getestet, der eine bestmögliche Übersprechdämpfung zwischen Links-Center-Rechts verspricht. Das Ergebnis war dabei ernüchternd, der Zauber verflogen, das Gegenteil erreicht. Es klang eindeutig zerfranst und verphast.
Es zeigt sich also ein weiterer Fallstrick abhängig vom einzustellenden Parameter. Ein Erklärungsansatz findet sich jedoch, siehe dazu die Formen oben unter 4.
Nehmen wir schlichtweg an, das Musiksignal enthält nur einen rechten Signalanteil. Dann spielt L3 = - 0.5*R2, C3=0.707*R2 und R3 = 0.5*R2. Mit C3 rutscht das Signal mehr in die Mitte und L3 wird versucht das wieder entsprechend auszugleichen. Die Subtraktion von 0.5*R2 ist aber gleichbeutend mit der Addition des invertierten Signals. Wie sich eine Stereowiedergabe anhört wenn man z.B. den linken Lautsprecher umpolt, sollte ja jeder schon mal gehört haben. Im trinauralen Fall betrifft das nun aber eher niederpegelige Anteile die sich aber trotzdem unangenehm bemerkbar machen. Bei einem passenden Rotationswinkel wird das Hören zum reinen Vergnügen, wir waren bzw. sind von einer mittigen Stimmwiedergabe und der räumlichen Wiedergabe geradezu fasziniert. Der Winkel ist nicht der in der Literatur genannte. Eine Optimierung fürs eigene Hören ist sinnvoll.
Bisheriges Resümee:
Die trinaurale Wiedergabe lohnt sich definitiv! Es sind herzu jedoch einige Bedingungen einzuhalten, siehe oben. Manche Erwartungen sollten m.M.n. gar nicht erst gestellt werden sofern es um höchste Qualität geht. Dazu gehört der angeblich verbreiterte Sweetspot für mehrere nebeneinander sitzende Hörer. Es klingt seitlich vom Sweetspot sitzend trotz trinauraler Wiedergabe sogar verphast und zwar speziell bei einem falsch gewählten Rotationswinkel. Wer jedoch sowieso richtig Musik hören will sollte immer den Sweetspot bevorzugen und feinfühlig die trinaurale Einstellung parameterisieren. Und dann macht es trinaural RICHTIG SPASS. Der zusätzliche Mittenanteil befreit Ohren und Hirm vom Suchen der Phantommitte, frei werdende Kapazitäten verbessern das räumliche Hörvermögen. Man ist dabei auch nicht festgenagelt, der Kopf darf gern bewegt werden.
Also: ich mache weiter und freue mich auch schon auf das Ergebnis bei mir zuhause. Wann kommen endlich die bestellten Hörner ...
Viele Grüsse
Uli
In unserem Hobby gehört dazu eben das optimale Hörvergnügen. Das bedeutet m.b.M.n. aber nicht, dass es der Realität entsprechen muss.
Und so sind wir dann doch immer auf der Suche ...
Das haben allerdings auch schon viele versucht und es macht Sinn, sich mit dem zu beschäftigen, was andere schon einmal gemacht haben. Also sich etwas von den Altvorderen anschauen, überprüfen, auf den damaligen Zeitgeist Rücksicht nehmen und zwischenzeitliche Entwicklungen mit bedenken. Um dann alte/neue Ideen zu verifizieren, sie auch wieder zu verwerfen oder eben etwas daraus zu machen.
Und so schaue ich mir derzeit das Thema trinaurale Wiedergabe an. Und werfe den alten Teebeutel nochmal in frisches Wasser.
Klar ist, dass ein dritter Lautsprecher einen zusätzlichen Aufwand bedingt. Da mag und muss nicht jeder mitgehen.
Am Anfang steht also die Literaturrecherche. Oder heute auch das Nachgucken in allen möglichen Forumsbeiträgen. Davon gibt es reichlich. Natürlich findet man dann auch Berichte zwischen himmelhochjauchzend und zu Tode betrübt. Aber selbst rausfinden tut man es eben nur, wenn man sich selbst auf den Weg macht. Mir helfen Forenbeiträge dann weiter, wenn man nicht schwurbelt, sondern auf hilfreiche Literatur hinweist. Über dortige Verweise und Zitate geht es zu weiteren Arbeiten bis auch hin zu Patenten.
In diesem Fall sei z.B. auf Arbeiten von Michael Gerzon (https://de.wikipedia.org/wiki/Michael_Gerzon) und Elias Pekonen hingewiesen, die ich als sehr hilfreich empfinde.
Allerdings, einfaches Abkupfern einer Formel wie z.B.
Lout = Lin - 0,5 x Rin
Rout = Rin - 0,5 x Lin
Center-out = (1 - 0,5) x (Rin + Lin)
(genannt in viewtopic.php?p=222625#p222625)
mag die einfache Lösung sein, vor allem bequem. Und dabei auch der schnellste Weg zum Scheitern.
Ich will dazu einmal einige Fallstricke aufzeigen, die übrigens auch bei Gerzon und Pekonen nicht unbedingt erwähnt werden.
1. Gleichung mit Unbekannten
Enthalten Gleichungen z.B. drei Unbekannte, so benötigt man drei voneinander unabhängige Gleichungen um diese Unbekannten zu finden.
In unserem Fall liegt ein Stereosignal vor und es soll ein trinaurales Signal gerechnet werden. Aus stereoL (L2) und stereoR (R2) soll trinauralL (L3), trinauralC (C3) und trinauralR (R3) werden. In L2 und R2 ist soweit alles vorhanden, z.B. auch die Phantommitte. Die ja dann von C3 gespielt werden soll. Aber: man kann es drehen und wenden wie man will. Es gibt keine Lösung um voneinander unabhängige Ergebnisse für L3, C3 und R3 zu finden. Man bekommt keine saubere Lösung.
Am Beispiel der o.g. genannten Gleichung enthält L3 einen Anteil von R2. Was genau hat nun der rechte Kanalanteil im neuen linken Kanal zu suchen?
Erkenntnis: es gibt keine genaue Lösung. Nur Annäherungen. Und wenn man sich darüber bwusst ist weiss man, dass das trinaurale Hören keine absolute Lösung ist, wenn es aus einem Stereosignal erzeugt wird.
Historisch gesehen haben sich leider keine drei Kanäle im Musiksignal durchgesetzt, ist ja z.B. bei einer Schallplatte nicht trivial.
2. Energieerhaltung
Man weiss zumindest, dass eine Bedingung gelten muss:
L3² + C² + R3² = L2² + R2²
Rechnet man das für obiges Beispiel ist das Ergebnis 1.5(L2² - L2R2 + R2²). Also ist klar, dass die Beispielformel nicht passt. Und so lassen sich dann einige Beispiel schnell auf ihre Gültigkeit prüfen.
Nun, Gerzon und Pekonen (u.a.) haben das jedenfalls bereits postuliert, damit sind ihre Gleichungen denn auch in diesem Sinn korrekt.
3. Vergleichbarkeit von Lösungen
Gerzon betrachtet die Aufgabenstellung als Mathematiker als Transformation von Matrizen, genauer als Rotation abhängig von einem Winkel zwischen 0° und 90°. Daraus ergeben sich dann die von ihm dargestellten Parameter. Da "trinaural" für einen richtigen Mathematiker zu einfach ist, betrachtet er denn auch gleich den allgemeinen Fall mit Y Lautsprechern bei X Musikkanälen. Das freut dann den weniger vorgebildeten Anwender.
Pekonen wiederum variiert anstelle eines Winkels einen Multiplikationsfaktor im Bereich 0 bis 1. Was ist denn nun korrekt? Am Ende stellt sich heraus, dass sich eben die Ergebnisse von Gerzon und Pekonen schlichtweg ineinander umrechnen lassen. Das eine sieht für den Laien definitiv kryptischer aus, das andere einfacher.
4. Zeitgeist
Greift man auf frühere Lösungen zurück, ist es sinnvoll diese immer unter dem jeweiligen Zeitgeist zu betrachten. Und so wurden den vor einigen Jahren trinaurale Lösungen vorgestellt, die dann als Trinauralprozessoren in einem passenden Gehäuse angeboten wurden. Gefüllt mit entsprechender analoger Elektronik, die schlichtweg als Rechenwerk fungierte. Heute sieht man das eben anders, wozu gibt es denn Rechner.
Also, ich nehme mal eine der Formeln von Pekonen:
L3 = 0.5*L2 -0.5*R2
C3 = 0.707*(L2 + R2)
R3 = 0.5*R2 - 0.5*L2
Prima, das ist doch fix programmiert. Schnell das Ganze aufgebaut und Musik gehört. Und der eine findet das super während der andere nicht glücklich wird. Weil das Ergebnis vom Musikmaterial abhängt. Wenn zufällig linker und rechter Kanal voll ausgesteuert sind, betrachtet hier mit einem jeweils normierten Pegel mit Wert 1, dann ergibt sich mit C3 = 0.707*(1+1) = 1.4. Der Centerkanal ist dann voll übersteuert, er clippt. Das steht so aber nicht bei Gerzon und Pekonen, muss aber berücksichtigt werden.
5. Frequenzabhängiges Hören
Gerzon betrachtet richtigerweise die Frequenzabhängigkeit. Oberhalb von ca. 700 Hz hören wir im wesentlichen pegelabhängig (Intensitätsstereofonie), die Ohrabstände sind zu groß um Phasenunterschiede zwischen linkem und rechtem Ohrsignal ermitteln zu können.
Unterhalb 700 Hz beginnen wir, Phasenunterschiede wahrzunehmen (Laufzeitstereofonie). An dieser Stelle schaut Gerzon dann auf die Auswirkungen des Rotationswinkels und postuliert dann unterschiedliche Winkel für die jeweiligen Bereiche. Was dann dazu führt dass es sinnvoll ist für die jeweiligen Bereiche eigene Gleichungen zu realisieren und abzustimmen. Real bedingt dies aber auch, dass man Frequenzbereiche trennen muss. Mit üblichen Tiefpass- und Hochpassweichen werden aber jeweils andere Phasendrehungen eingeführt und bekanntlich ist die Addition oder Subtraktion von phasenverschobenen Signalen nicht notwendigerweise zielführend. Insofern spricht Gerzon dann auch wiederum von Phasenkompensation. Heute können wir ja denn doch einfacher linearphasige Weichen verwenden, ein Preis dabei ist jedoch ein prinzipbedingtes Delay.
Pekonen nimmt zu diesem Thema übrigens keine Stellung.
6. Umsetzung
Da ich selbst leider nach wie vor auf die eigene trinaurale Realisierung bei meinem System warten muss haben wir bei Holger die ersten Versuche gestartet, siehe dazu Holgers Faden (viewtopic.php?p=222585#p222585 ff.). Vielen Dank an Holger! Als pragmatischer Ansatz wurde hier ein Mitteltonhorn und ein Hochtonhorn als Center verwendet, der Frequenzbereich ist IIRC 500 Hz bis 8 kHz. Dabei ist als Basisgedanke zugrundegelegt, dass wir, zugehörend zur Gattung der Fluchttiere) für eine Lokalisierung bzw. Ortung beim Hören eben prinzipbedingt die höheren Frequenzen verwenden (das berühmte Knacken im Wald). Da das System linearphasige Weichen verwendet, ist eine Problemstellung beseitigt bzw. vermindert.
Meine Arbeitsversion des AcourateConvolvers erlaubt nun die Vorgabe des Rotationswinkels als Parameter und wir haben mit einem der von Gerzon betrachteten Winkel von 55° gestartet und den Freitag mit 4 Leuten gehört. Prima soweit.
Am Samstag wurde das gesamte System nochmals penibel eingemessen und dann der Rotationswinkel variiert. Z.B. haben wir den von Pekonen vorgeschlagenen Winkel von 41.8° getestet, der eine bestmögliche Übersprechdämpfung zwischen Links-Center-Rechts verspricht. Das Ergebnis war dabei ernüchternd, der Zauber verflogen, das Gegenteil erreicht. Es klang eindeutig zerfranst und verphast.
Es zeigt sich also ein weiterer Fallstrick abhängig vom einzustellenden Parameter. Ein Erklärungsansatz findet sich jedoch, siehe dazu die Formen oben unter 4.
Nehmen wir schlichtweg an, das Musiksignal enthält nur einen rechten Signalanteil. Dann spielt L3 = - 0.5*R2, C3=0.707*R2 und R3 = 0.5*R2. Mit C3 rutscht das Signal mehr in die Mitte und L3 wird versucht das wieder entsprechend auszugleichen. Die Subtraktion von 0.5*R2 ist aber gleichbeutend mit der Addition des invertierten Signals. Wie sich eine Stereowiedergabe anhört wenn man z.B. den linken Lautsprecher umpolt, sollte ja jeder schon mal gehört haben. Im trinauralen Fall betrifft das nun aber eher niederpegelige Anteile die sich aber trotzdem unangenehm bemerkbar machen. Bei einem passenden Rotationswinkel wird das Hören zum reinen Vergnügen, wir waren bzw. sind von einer mittigen Stimmwiedergabe und der räumlichen Wiedergabe geradezu fasziniert. Der Winkel ist nicht der in der Literatur genannte. Eine Optimierung fürs eigene Hören ist sinnvoll.
Bisheriges Resümee:
Die trinaurale Wiedergabe lohnt sich definitiv! Es sind herzu jedoch einige Bedingungen einzuhalten, siehe oben. Manche Erwartungen sollten m.M.n. gar nicht erst gestellt werden sofern es um höchste Qualität geht. Dazu gehört der angeblich verbreiterte Sweetspot für mehrere nebeneinander sitzende Hörer. Es klingt seitlich vom Sweetspot sitzend trotz trinauraler Wiedergabe sogar verphast und zwar speziell bei einem falsch gewählten Rotationswinkel. Wer jedoch sowieso richtig Musik hören will sollte immer den Sweetspot bevorzugen und feinfühlig die trinaurale Einstellung parameterisieren. Und dann macht es trinaural RICHTIG SPASS. Der zusätzliche Mittenanteil befreit Ohren und Hirm vom Suchen der Phantommitte, frei werdende Kapazitäten verbessern das räumliche Hörvermögen. Man ist dabei auch nicht festgenagelt, der Kopf darf gern bewegt werden.
Also: ich mache weiter und freue mich auch schon auf das Ergebnis bei mir zuhause. Wann kommen endlich die bestellten Hörner ...
Viele Grüsse
Uli