Grenzen der digitalen Audiotechnik (Ralf Koschnicke)

Truesound
inaktiv
Beiträge: 1095
Registriert: 22.10.2011, 17:18
Wohnort: Everglades National Park

Beitrag von Truesound »

M.E. ist Jeder mehr oder minder "empfindlich" auf die Verpackung, Optik und Darreichungsform. Es wird entsprechend auch bei vermeintlich höherwertigen Erscheinen eine positive Vorspannung, Vorschußbonus für das Produkt und die Sache im Vorfeld aufgebaut..... die den Probanden dann beeinflussen kann. Es ist auch möglich durch eine entsprechende geschickte Vorankündigung die Probanden vor einem "Hörworkshop" durch entsprechend gesteuerte Wortwahl zu manipulieren :wink:

Grüße Truesound
Bild
O.Mertineit
inaktiv
Beiträge: 755
Registriert: 07.05.2012, 11:42
Wohnort: Reinheim bei Darmstadt
Kontaktdaten:

Beitrag von O.Mertineit »

Uli Brueggemann hat geschrieben: Logischerweise müsste demzufolge auch ein Rechner dazwischen als Transportmedium die Daten dann verschieben, natürlich ohne weitere Beeinflussung. Somit müsste sich dann der DA-Wandler z.B. per PLL auf das ankommende Signal synchronisieren. Wenn man auch dann keinen Unterschied wahrnimmt (statistisch im Blindtest) wäre das HighRes-Format tatsächlich hinsichtlich einer Notwendigkeit bei der Wiedergabe anzuzweifeln.
Hallo Uli,

verstehe ich Dich richtig, daß Du den Versuchsaufbau von Meyer und Moran für grundsätzlich ungeeignet hältst, eine "Transparenz" des 44.1/16 Formats ("Redbook") zu zeigen oder zu widerlegen ?

Kannst Du Deine Kritik bzw. die Deiner Meinung nach offenbar zu fordernden Eigenschaften eines möglichen verbesserten Versuchsaufbaus (in allgemeinverständlicher Form) konkretisieren ?

Grüße Oliver
Bild
Truesound
inaktiv
Beiträge: 1095
Registriert: 22.10.2011, 17:18
Wohnort: Everglades National Park

Beitrag von Truesound »

Hallo Oliver!

Ich habe so einen Versuchsaufbau bei mir auch schon gemacht. RME ADI-2 mit 192, 96, 48 kHz wiedergeben lassen....(klassische Musik, Rock und Pop, Jazz...
Routing via MTX Monitor auf Rec-Out MTX und von dort ADDA allerdings 44/24 mittels RTW Districon Modular....
Wenn ich dann die entsprechende Eingänge am MTX jeweils anwähle kann ich einmal ADI-2 direkt und einmal das analoge ADI-2 Signal ADDA via RTW Districon Modular ADDA geroutet vergleichen....

Das Ergebnis war auch ein Horneberger Schießen.....

Grüße Truesound
Bild
uli.brueggemann
Aktiver Hersteller
Beiträge: 4658
Registriert: 23.03.2009, 15:58
Wohnort: 33649
Kontaktdaten:

Beitrag von uli.brueggemann »

Der Versuchsaufbau zeigt m.E. nur eine Facette.

Ich bin selbst ja nun auch schon mal der Illusion erlegen, dass mir eine HighRes-Wiedergabe transparenter und feindynamischer erschien.
Nun kann es dafür ja mehrere Ursachen haben. Mich selbst mal ausgenommen wären das z.B. Bittiefe, hohe Frequenzen, Intermodulationseffekte, Wiedergabepegel, Aliasing.
Ein nicht unbeträchlicher Teil der Diskussionen hier im Forum rankt sich auch um das Thema Jitter, vielleicht sollte es besser das Thema Timing sein.

Nun weiss ich aus konkreter Erfahrung, dass das Timing bei getrennten Wandlern merkwürdige Effekte hervorrufen kann. Derzeit sind z.B. die USB-Mikrophone UMIK-1 von miniDSP an allen Ecken und Enden anzutreffen. Und dann wird damit versucht, Logsweep-Aufnahmen z.B. über 60 sek zu machen. Was dann darin endet, dass Pulsantworten nicht wie wirkliche Pulsantworten aussehen.
Grund: das UMIK-1 tickt anders als der den Sweep ausgebende DA-Wandler (Soundkarte). Also mal extrem gesprochen sowas wie Wiedergabe mit 48 kZ und Aufnahme mit 49 kHz.
Ok, man versucht es dann logischerweise mit einer Abtastratenkonvertierung zu korrigieren. Allerdings stellt man dann bei mehreren Sweeps auch schon mal Drifts fest.

Was hat das nun mit dem Thema hier zu tun? Wie bereits geschildert, vermute ich dass der Testaufbau dieselbe Clock verwendet hat. Soweit ok. Wenn wir aber irgendwelche Musik wiedergeben, so hat das i.a. mit entkoppelten Clocks zu tun. Man hat also nur das gespeicherte Medium und gibt den Stream wieder. Irgendwo stecken da PLLs drin, irgendwie synct sich das ja alles.

Das könnte dann beim Testaubau eben so sein, dass z.B. der AD-Wandler per spdif ausgibt und der DA-Wandler sich mit seiner eigenen Clock per PLL synchronisieren muss. Das Ergebnis könnte ja anders ausfallen als wie mit dem im Artikel geschilderten Testaufbau.

Spannend wäre es z.B. auch wenn man sogar vier unabhängige Geräte, zwei AD und zwei DA-Wandler dazu hernimmt. Das könnte ja das Zeitverhalten zwischen den Kanälen beeinflussen, eine Kohärenz könnte verschlechtert werden. Und wir dekodieren ja mit Hilfe beider Ohren.

Insgesamt wäre so ein Versuch spannend, selbst mit 24 Bit-Wandlern und Abtastraten auch > 44.1 kHz. Wenn sich dann ein anderes Blindtestergebnis zeigt, wäre es ein Hinweis, dass es nicht unbedingt f > 20 kHz bedarf, aber eines besseren Zeitverhaltens.

Also, mein Gedanke zum Testaufbau war schlichtweg so, dass man eben versucht, diverse Ursachen auszuschliessen oder eben zu analysieren. Der Artikel zeigt insofern nur eine Facette ...

Grüsse
Uli
Bild
O.Mertineit
inaktiv
Beiträge: 755
Registriert: 07.05.2012, 11:42
Wohnort: Reinheim bei Darmstadt
Kontaktdaten:

Beitrag von O.Mertineit »

Uli Bruegemann hat geschrieben: Was hat das nun mit dem Thema hier zu tun? Wie bereits geschildert, vermute ich dass der Testaufbau dieselbe Clock verwendet hat. Soweit ok. Wenn wir aber irgendwelche Musik wiedergeben, so hat das i.a. mit entkoppelten Clocks zu tun. Man hat also nur das gespeicherte Medium und gibt den Stream wieder. Irgendwo stecken da PLLs drin, irgendwie synct sich das ja alles.
Hallo Uli,

es tut mir leid, aber ich kann Deine Argumentation in keiner Weise nachvollziehen.

Der Versuchsaufbau von Meyer und Moran hat folgenden Gegenstandsbereich:

Festzustellen, ob das Redbook Format für Hörer akustisch transparent ist im Hinblick auf die getesteten Highres Formate.

Und genau dies - und nichts anderes - leistet der Versuchsaubau !

Die von Dir (nur ...?) vermutete Verwendung eines gemeinsamen Clock-Signals beider Wandler wäre im Hinblick auf die Fragestellung vollkommen unerheblich, u.U. aber sogar zu empfehlen.

Wenn Formate verglichen werden sollen, dann teste ich nicht etwa Qualitätsunterschiede oder Einflüsse von Wandlern oder mögliche Fehler in einer Signalübertragungskette, sondern versuche diese sogar weitestgehend in ihrem möglichen Einfluss für den Ausgang des ABX Tests auszuschließen.


Auch bei "gekauften" (materiellen) Tonträgern verschiedener Formate müsste ich bei einem Vergleich die bestmögliche Wandlerqualität sowohl für Hires wie auch für Redbook gewährleisten.

Deine Argumentation läuft - mit nur leichter Überteibung - darauf hinaus, daß man während des Tests aus dem Redbook Signal eine CD pressen soll, diese in einen LKW verladen und für den Hörtest einmal (zweimal ?) "um den Block fahren", damit man diese dann in einem CD-Player abspielen kann:

Das ist nicht notwendig, der Versuchsaufbau wäre selbst mit gemeinsamem Clock-Signal für Hires und Redbook Wandler einwandfrei, weil er seinen Gegenstandsbereich zu 100% erfüllt (*).


Grüße Oliver

____________________________

(*) Meyer und Moran zeigen mit Ihrem Versuchsaufbau, daß auch außerhalb dieses Forums qualifizierte Leute nachdenken ... und im Jahr 2007 bereits zu Ergebnissen kamen, die wir nun hier ca. 8 Jahre später aufarbeiten.

http://drewdaniels.com/audible.pdf
Bild
O.Mertineit
inaktiv
Beiträge: 755
Registriert: 07.05.2012, 11:42
Wohnort: Reinheim bei Darmstadt
Kontaktdaten:

Beitrag von O.Mertineit »

Wo stehen wir jetzt ?

"
( ) theories are not the same as facts
( ) measurements don't tell everything
( ) not everyone is subject to the placebo effect
( ) blind testing is dumb
( ) you can't prove what I can't hear
( ) science isn't everything
"

aus: http://www.thewelltemperedcomputer.com/Fun/Woo.htm

Ich fülle mal aus, wie ich denke:

(x) theories are not the same as facts
( ) measurements don't tell everything
(x) not everyone is subject to the placebo effect
(x) blind testing is dumb
(x) you can't prove what I can't hear
(x) science isn't everything

:wink:

Grüße Oliver
Bild
uli.brueggemann
Aktiver Hersteller
Beiträge: 4658
Registriert: 23.03.2009, 15:58
Wohnort: 33649
Kontaktdaten:

Beitrag von uli.brueggemann »

Oliver,

so leicht würde ich es mir nicht machen.

Fazit des Versuchs von Moran und Meyer ist demzufolge (verstehe das so als Deine Argumentation): alles >44/16 ist Schrott, Hype, Marketing, Geldschneiderei.
Das gesamte audiophile Volk unterliegt schlichtweg einer Selbsttäuschung und versagt bei Blindtests.

Nun, ich bezweifle das Ergebnis des Versuch nicht. Aber ich denke, dass man nicht mehr daraus folgern kann, als was enthalten ist.

Jede übliche Wiedergabe entspricht aber nicht dem Versuchsaufbau, sondern sieht anders aus. Da hängt nicht hinter einem DA-Wandler eine weitere AD/DA-Kombination. Da existiert ein Wandler, dem man 44/16 bzw. 96/24 und 192/24 zufüttert.

Und man hört, von vielen berichtet, Unterschiede. Ist da immer alles Selbstsuggestion?

Ergo nehme ich selbst eine neutrale Position ein, dass es ja auch andere Ursachen geben kann. Und frage mich, was man nun mit dem Versuch konkret zeigen bzw. nicht zeigen kann. Das Ergebnis ist für mich, dass eine sorgfältig aufgebaute Kette mit AD/DA-Wandlung 44/16, also ordentliche Linearität und gemeinsame Clock, so transparent sein kann, dass sie eben nicht wahrnehmbar ist.
Das Ergebnis beweist aber nicht, dass damit 192/24 völlig daneben und unnötig ist. Es muss ja nicht die Frequenz >20 kHz sein, die zählt.

Mir geht es also um die gezogenen Schlussfolgerungen. Wo mir scheint, dass es für einige eine prima Argumentation bietet um gegen hohe Abtastraten zu wettern.

Grüsse
Uli

PS: ich bin nebenbei bemerkt selbst mit 44/16 zufrieden, ich verkaufe auch nicht 192/24 (keine kommerziellen Interessen). Mich interessiert aber das Thema Dekodierung beim Hören.
Bild
Truesound
inaktiv
Beiträge: 1095
Registriert: 22.10.2011, 17:18
Wohnort: Everglades National Park

Beitrag von Truesound »

Offenbar waren die internen Clocks der beteiligten Geräte aber so gut das keiner sicher etwas heraushören konnte....

Grüße Truesound
Bild
Truesound
inaktiv
Beiträge: 1095
Registriert: 22.10.2011, 17:18
Wohnort: Everglades National Park

Beitrag von Truesound »

Hallo Uli!

Du sprichst da jetzt das Thema Wandlereigenklang in Form u.U. von Sounding an....oder Faktoren das z.b.die Hig Res Signale beispielsweise 0,5 dB lauter sind als ein 44,1 kHz Signal. Also hausgemachte Dinge je nachdem welchen Wandler man da gerade stehen hat....

Der Test von Moran zeigt das wenn ein Wandlersystem sauber funktioniert ein veränderter Klang des selben Materials nicht durch veränderte Samplingrate bis 44,1 kHz hinunter oder eine Bitauflösung bis 16 Bit hinunter anders klingt....

Was jeder dann macht wenn es bei ihm nicht so ist und welche Schlüsse gezogen werden obliegt jedem selber...

Grüße Truesound
Bild
Tinitus
Aktiver Hörer
Beiträge: 1322
Registriert: 10.11.2013, 21:48

Beitrag von Tinitus »

Hallo,

ich kann zwar fachlich nichts zur Diskussion beitragen, verfolge diese aber sehr interessiert. Ich für mich habe entschieden, dass ich mehr als 16/44,1 nicht brauche. Ich vermag allerdings nicht zu sagen, ob es an meinen Ohren oder der technischen Seite der Dinge liegt. Ich hege allerdings den verdacht, dass dies auch durch die Tatsache bedingt ist, dass einge meiner HiRes Dateien nur von 16/44,1 aufgebohrt wurden.
Zur aktuellen Diskussion wollte ich wissen, ich es richtig verstanden habe, Oliver/Sven sagen, dass durch den Versuchsaufbau alle möglichen Unwägbarkeiten ausgeschlossen werden und deshalb wirklich die Formate an sich verglichen werden und dies die eigentliche Fragestellung ist. Uli meint, dass die zusätliche ADDA Wandlung für den normalen Hifianer nicht dem normalen Musik(genuss?!) entspricht und das deshalb ein Test unter Bedingungen, die näher an der üblichen Art digital aufgezeichnete Musik zu hören ist, nützlich wäre. Dieser Test könnte auch Vorteile von HiRes aufzeigen, die jenseits der größeren Bittiefe und des Frequenzumfangs liegen? Ist dies korrekt? Wenn ja sind diese Aussagen nicht widersprüchlich, der geneigte Diskussionsverfolger kann (und sollte) für sich selbst die Entscheidung treffen, was (welche Fragestellung) für ihn wichtiger bzw. interessanter ist. An Alle Dank für die Diskussion, die Bemühungen/Arbeit bei der Bereitstellung der Dateien. Wie sagen die Anglosachsen food for thought

Gruß

Uwe
Bild
uli.brueggemann
Aktiver Hersteller
Beiträge: 4658
Registriert: 23.03.2009, 15:58
Wohnort: 33649
Kontaktdaten:

Beitrag von uli.brueggemann »

Truesound hat geschrieben:....oder Faktoren das z.b.die Hig Res Signale beispielsweise 0,5 dB lauter sind als ein 44,1 kHz Signal.
Ich liebe diese Pseudoargumente.
Wenn das also so ist, dass HighRes wegen 0.5 dB lauter besser ist als 44/16, wieso machst Du nicht das 44/16 um 0.5 dB lauter und alle finden es besser als HighRes und kaufen nur noch Dein 44/16 ? Das wär doch mal eine ausgefuchste Produktion.

Grüsse
Uli
Bild
Hans-Martin
Aktiver Hörer
Beiträge: 9118
Registriert: 14.06.2009, 15:45

Beitrag von Hans-Martin »

O.Mertineit hat geschrieben: Hallo Uli,
es tut mir leid, aber ich kann Deine Argumentation in keiner Weise nachvollziehen.
Der Versuchsaufbau von Meyer und Moran hat folgenden Gegenstandsbereich:

Festzustellen, ob das Redbook Format für Hörer akustisch transparent ist im Hinblick auf die getesteten Highres Formate.

Und genau dies - und nichts anderes - leistet der Versuchsaubau !
Hallo Oliver
Dann ist ja alles klar.
Die Kette Glas-Master, CD-Pressung mit Pitabformproblematik bei kommerziellen Massenstückzahlen, Jitter beim CD-Auslesen, Jitter der Clock und damit der digitalen PLL nach der Fehlerkorrektur im CD-Player sind in der Kette nicht berücksichtigt.
Bild 1 des zitierten Papers zeigt Analog In in "professionellen CD-Recorder" und dessen Analog Out.
Ich kenne keinen CD-Recorder, der 2 Clocks mit 44,1x256 eingebaut hat, das würde auch wenig Sinn machen. Natürlich sind beide, D/A- und A/D-Wandler wie Uli eingewandt hat, von derselben Clock getaktet, wodurch der Clock-Jitter im HF-Aspekt zwar nicht, unter NF-Aspekten aber schon sich praktisch zeitgleich synchron bewegt, NF-mäßig praktisch aus der Gleichung herausfällt.

Ob ein solcher Aufbau für unser Hören praxisrelevant ist?
Die von Dir (nur ...?) vermutete Verwendung eines gemeinsamen Clock-Signals beider Wandler wäre im Hinblick auf die Fragestellung vollkommen unerheblich, u.U. aber sogar zu empfehlen.
Einsicht?
Das wäre doch mal ein Aspekt, der erklärt, warum das Bostoner Experiment genauso viel oder wenig Aussage enthält wie die Diplomarbeit, die das Paderborner Duo "Blech, Yang" hervorgebracht hat, und die so vielfach fehlinterpretiert wurde. Überall konnte man sekundär lesen, das DVD-Audio und SACD keinen hörbaren Unterschied bringen. Das hat aber die Studie nicht gesagt, denn weder SACD- noch DVD-A-Player waren im Vergleich.
In Boston wurde die direkte Verkabelung mit dem Umweg über den CD-Recorder AnalogIN>ADC>DAC>Analog Out verglichen.
Nicht verglichen wurde das DAD-A Digitalsignal mit 96/24 gegen ein datenreduziertes Signal. 5-20000Hz gibt Pioneer an , 92dB.
Jetzt wäre interessant, die Audiobandbreite des vermutlich Yamaha DVD-A-Players zu kennen, sowie die der Aufnahmen.
Die beiden Autoren machen darüber keine Aussage, da mag sich jeder denken, was er davon hält.
Wenn Formate verglichen werden sollen, dann teste ich nicht etwa Qualitätsunterschiede oder Einflüsse von Wandlern oder mögliche Fehler in einer Signalübertragungskette, sondern versuche diese sogar weitestgehend in ihrem möglichen Einfluss für den Ausgang des ABX Tests auszuschließen.
2 THE RESULTS
The test results for the detectability of the 16/44.1 loop on SACD/DVD-A playback were the same as chance:
49.82%. There were 554 trials and 276 correct answers.
In diesem Test kamen Audiosignale von einem DVD-Player, gingen in den CD-Recorder, nach Bild 3. vermutlich ein Pioneer PDR-609 Derivat
Bild
Auf S.13 zeigt das Blockschaltbild die gemeinsame Taktung des AD- und DA-Wandlers (AK4524VF und PE8001A)
X501 hat 33,8688MHz (3x2^8x44,1kHz) am EFM-Encoder, hier sitzt die relevante Clock zentral, taktet AD- und DA-Wandler. Das bestätigt Ulis Aussage.
Auch bei "gekauften" (materiellen) Tonträgern verschiedener Formate müsste ich bei einem Vergleich die bestmögliche Wandlerqualität sowohl für Hires wie auch für Redbook gewährleisten.

Deine Argumentation läuft - mit nur leichter Überteibung - darauf hinaus, daß man während des Tests aus dem Redbook Signal eine CD pressen soll, diese in einen LKW verladen und für den Hörtest einmal (zweimal ?) "um den Block fahren", damit man diese dann in einem CD-Player abspielen kann:

Das ist nicht notwendig, der Versuchsaufbau wäre selbst mit gemeinsamem Clock-Signal für Hires und Redbook Wandler einwandfrei, weil er seinen Gegenstandsbereich zu 100% erfüllt (*).
Die Fahrt mit dem LKW ist geschenkt. Aber brenn mal eine CD von einer HighResolution Master und spiele sie parallel ab, dann hast du schon ernsthafte Probleme, wenn die Zeitdifferenz zwischen A/D-Clock und D/A-Clock (NF-mäßig betrachtet, woll'n mal großzügig sein) unbedeutend sein soll.
(*) Meyer und Moran zeigen mit Ihrem Versuchsaufbau, daß auch außerhalb dieses Forums qualifizierte Leute nachdenken ... und im Jahr 2007 bereits zu Ergebnissen kamen, die wir nun hier ca. 8 Jahre später aufarbeiten.
Das glaub ich jetzt nicht!
Die meisten denken offenbar nicht nach.
Sie vereinfachen und um dem üblichen "Siehste!" entgegenzuarbeiten, muss man schon etwas ausholen, genauer hinschauen, usw.
Uli hatte Recht!
Grüße Hans-Martin
Bild
Hans-Martin
Aktiver Hörer
Beiträge: 9118
Registriert: 14.06.2009, 15:45

Beitrag von Hans-Martin »

Hans-Martin hat geschrieben:Auf S.13 zeigt das Blockschaltbild die gemeinsame Taktung des AD- und DA-Wandlers (AK4524VF und PE8001A)
X501 hat 33,8688MHz (3x2^8x44,1kHz) am EFM-Encoder, hier sitzt die relevante Clock zentral, taktet AD- und DA-Wandler. Das bestätigt Ulis Aussage.
Gemeint waren die Angaben in der Pioneer Serviceanleitung zum Gerät.
Grüße Hans-Martin
Bild
frankl
Aktiver Hörer
Beiträge: 486
Registriert: 20.01.2013, 01:43
Wohnort: Aachen

Beitrag von frankl »

Hallo Forenten,

das ist ein interessanter Thread! Leider habe ich im Moment nicht viel Zeit, um aktiver daran teilzunehmen.

Hier sind aber Bemerkungen zu zwei Punkten.

(1) Ich habe mal die You_Gotta_Move Dateien von truesound runtergeladen und ohne vorheriges "Üben" zehn mal zufällig die 44/16 oder die 192/24 Version im meinem Setup angehört (mit Upsampling auf 192/32, Raumkorrektur, LoCo-Filter - halt so wie ich alle Musik abspiele). Ich habe jeweils nach 45-60 Sekunden abgebrochen und mir dann notiert, ob ich die aktuelle Version besser oder schlechter als die vorige fand. Zum Schluss wurde verglichen: Ich war mir (zurecht, wie sich zeigte) meist, aber nicht immer, ziemlich unsicher, und tatsächlich hatte ich 6 von 10 Treffern, habe also nur wild geraten.

Ob es wirklich am Stück liegt? Mir ist zumindest eine Eigenheit bei diesem Stück aufgefallen: Während ich bei sehr vielen Alben, die ich habe, einen deutlichen Unterschied beim Umschalten der Polarität höre, kann ich bei diesem Teststück beim besten Willen keinen Unterschied ausmachen. Das fand ich auffällig, weil ich einerseits finde, dass das Teststück wirklich gut klingt, ich aber andererseits diese Immunität beim Umschalten der Polarität eher von nicht so guten Aufnahmen/Produktionen kenne.

Ich werde gelegentlich mal den Blindtest mit einem Stück wiederholen, dass ich gut kenne und bei dem ich mir bisher eingebildet habe, dass die highres-Version einen (wenn auch geringen) Mehrwert hat.

(2) Thema Dithering. Hier stimme ich Ralf zu: wenn die Wortbreite reduziert wird, sollte ein Dithering gemacht werden. Die Argumentation mit dem Rauschanteil der Aufnahme ist meiner Meinung nach falsch. Das Band-, Mikrofon- oder Aufnahmeraum-Rauschen gehört zum NUTZSiGNAL, das quantisiert wird. Ich finde es irreführend, das Dithering einfach als ein Hinzufügen von Rauschen zu beschreiben.

Die Aussage, dass man mit 16 Bit nur Lautstärkeunterschiede von 96 dB kodieren kann, ist nicht richtig. Die 96dB gelten für zufällige Samples, aber nicht für ein Musik- oder Sprachsignal.

Ich habe mir vorhin mal ein Experiment ausgedacht, um das zu demonstrieren. Das kann jeder nachmachen, der 'sox' zur Verfügung hat, und vielleicht 'audacity' um ein Signal anzusehen (und abzuspielen). Bei dem Experiment nehme ich eine beliebige 44.1/16 Musikdatei im wav-Format (die heißt im Code unten data.wav). Mit Hilfe von sox erweitere ich dann die Wortbreite zuerst auf 32 Bit. Dann skaliere ich das Signal ungefähr um den Faktor 1/32768. In der Originaldatei sind die Samples mit Zahlen von -32768..+32768 kodiert, nach dem Skalieren wären bei 16Bit also alle Samples im Bereich -1..+1 und das Signal nahezu verloren. Durch die Wortbreite von 32 Bit ist aber die Originalinformation noch da. Jetzt verringere ich die Wortbreite wieder auf 16 Bit! Das mache ich auf drei Arten: ohne Dither (also einfach mit Rundung), einmal mit einfachem Dither, und einmal mit Dither und Noise-Shaping. In allen Fällen ist das Nutzsignal also nur im letzten oder den letzten beiden Bits versteckt! Damit man etwas an der Datei sehen und hören kann, skaliere ich das Ergebnis zum Schluss wieder mit einem Faktor von 512 hoch.

Code: Alles auswählen

sox data.wav -t raw -e signed -b 32 - | sox -t raw -c 2 -r 44100 -e signed -b 32 - -t raw -c 2 -r 44100 -e signed -b 32 - vol 0.0000305 | sox -V -D -t raw -c 2 -r 44100 -e signed -b 32 - -t raw -c 2 -r 44100 -e signed -b 16 - |sox -t raw -c 2 -r 44100 -e signed -b 16 - testbad.wav vol 512.0


sox data.wav -t raw -e signed -b 32 - | sox -t raw -c 2 -r 44100 -e signed -b 32 - -t raw -c 2 -r 44100 -e signed -b 32 - vol 0.0000305 | sox -V -D -t raw -c 2 -r 44100 -e signed -b 32 - -t raw -c 2 -r 44100 -e signed -b 16 - dither   |sox -t raw -c 2 -r 44100 -e signed -b 16 - test.wav vol 512.0


sox data.wav -t raw -e signed -b 32 - | sox -t raw -c 2 -r 44100 -e signed -b 32 - -t raw -c 2 -r 44100 -e signed -b 32 - vol 0.0000305 | sox -V -D -t raw -c 2 -r 44100 -e signed -b 32 - -t raw -c 2 -r 44100 -e signed -b 16 - dither -f high-shibata  |sox -t raw -c 2 -r 44100 -e signed -b 16 - testgood.wav vol 512.0

Nun schaut und hört Euch die Ergebnisdateien an (zum Beispiel mit audacity). In der Version ohne Dither
testbad.wav ist nur noch digitales Geknackse und vielleicht so gerade noch ein Originalsignal zu erahnen.
Die Datei test.wav mit einfachem Dither sieht nach weißem Rauschen aus, aber wenn man das anhört, oh Wunder, hört man durch einen lauten Rauschteppich doch gut erkennbar das Originalstück heraus. Und die Datei testgood.wav mit Noiseshaping sieht aus wie noch viel lauteres Rauschen. Dieses Rauschen ist allerdings hauptsächlich in nicht so störenden höheren Frequenzen. Wenn man diese Version anhört, ist noch erstaunlich viel vom Originalstück herauszuhören und das Rauschen nicht so nervig. Und das war alles noch in den letzten zwei Bits gespeichert!

Mein Fazit: Dithering ist bei Verkürzung der Wortbreite ein Muss, sonst verschenkt man viele Feinheiten, die im Signal noch vorhanden sind (und die viel weiter als 96 dB unter dem Maximalpegel liegen können).

Viele Grüße,
Frank
Bild
Ralf Koschnicke
Aktiver Hersteller
Beiträge: 374
Registriert: 22.07.2008, 11:24
Wohnort: Wöllstein
Kontaktdaten:

Beitrag von Ralf Koschnicke »

Uli,
Ich denke dieser Test von Moran und Meyer ist uns schon vor vielen Jahren begegnet. Das ist einmal mehr einer dieser Tests, die ein Grundproblem haben. Das haben die Verfasser selbst erkannt, wenngleich sie es zu relativieren suchen:
"Now, it is very difficult to use negative results to prove the inaudibility of any given phenomenon or process."

Genau so ist es. Der Versuch hat keine statistische Auffälligkeit ergeben, d.h. kein Ergebnis.
Das ist natürlich nach solch einem Aufwand unbefriedigend, aber mehr daraus zu machen ist Kaffeesatzleserei. Es gibt etliche Faktoren die zu keiner statistischen Signifikanz führen können. Die können wir alle nicht beurteilen. Meiner Meinung nach wäre aus keiner Auffälligkeit nur dann abzuleiten, dass dies bedeutet "es gibt keinen Unterschied", wenn man quasi mit einem Kontrolltest die prinzipielle Tauglichkeit des Verfahrens bewiesen hätte.

Kennt eigentlich irgendjemand einen Blindtest im Audiobereich - egal zu welcher Fragestellung - der jemals ein positives Ergebnis geliefert hat?
Ich habe das bereits öfter erwähnt, aber niemanden gefunden, der die Quelle noch weiß. Vor 10/15 Jahren habe ich mal eine interessante und plausibel klingende Abhandlung eines Psychologen gelesen, warum Blindtests bei Audio völlig ungeeignet sind. Ich gebe die Hoffnung nicht auf und frage bei der Gelegenheit nochmal in die Runde?
Ansonsten habe ich durchaus vollstes Vertrauen in die Methoden der Statistik. Wenn jemand einen Test liefert, bei dem beispielsweise 95% der Probanden klar das CD-Format gegenüber Highres präferieren, muss man das akzeptieren und könnte behaupten "es ist bewiesen, dass...". Dieser Test liefert aber einfach nur "kein Ergebnis".

Grüße
Ralf
Antworten