Sample Rate Converter (SRC) im Vergleich

play-mate · Beitrag von **play-mate** » 19.07.2011, 00:33

Hallo Ulli,

Es ist mir schon klar wo deine Bedenken bezüglich "Originalität" liegen, aber ich vertrete (auch) die Meinung dass die A/D Wandlung schon von vornherein nicht dem Original gerecht wird.
Ich kann dir jedoch versichern dass meine eigenen Maßstäbe sehr puritanisch liegen und in Sachen Audioqualität wirklich sehr wenig Platz für "Schönheitskuren" zulassen.
Ich muss nochmals betonen dass die einfach erhöhte Samplerate & das Einfügen von Nullen nicht wirklich eine großartige Art des Upsamplings ist, und dafür gibt es auch belegte Gründe.
Ich habe auch mal den DCX2496 gehabt, und weiß auch dass man diesen nicht viel friemeln muss um ihn zu verbessern.....

Wenn ich die Audioqualität von z.B. einer Acousense Aufnahme in CD- (44.1kHz) mit einer SRC-Upgesampelte (44.1>192kHz) vergleiche, erreicht das Upsamplingverfahren beinahe die Qualität, der 192kHz FLAC Datei. Das ist ein sehr, sehr überzeugender Vergleich !
Klar wird die upgesampelte Version nicht die Dynamik oder die ganz selbe Feinzeichnung haben wie die FLAC, aber sie ist um Längen besser als "das Original". Wer das nicht hören kann, sollte sich nicht mit High-End beschäftigen.
Es geht bei diesem hochwertigem Upsampling gar nicht um die Philosophische Frage ob es originaler am unzureichenden CD Format liegt, es gehr darum das es unglaublich überzeugend funktioniert !

Ich kann dir nicht die Formulierung von "besser" oder "gefallen" ändern, denn obwohl man den cPlay´er mal Probehören kann, bin ich auch der Auffassung dass ein Computer oft viel zu viel Jittert um cPlay wirklich in Topform zu hören....aber die Disskusion hatten wir ja auch schon....

Viele Grüße Leif

Rossi · Beitrag von **Rossi** » 19.07.2011, 14:45

play-mate hat geschrieben:Es geht bei diesem hochwertigem Upsampling gar nicht um die Philosophische Frage ob es originaler am unzureichenden CD Format liegt, es gehr darum das es unglaublich überzeugend funktioniert !

Wie sagte Helmut Kohl so schön? Entscheidend ist, was hinten raukommt.

Und wenn bei cmp/cPlay das was hinten rauskommt besser klingt, dann wäre mir das völlig ausreichend.

Gruß,
Stefan

play-mate · Beitrag von **play-mate** » 19.07.2011, 16:09

Geehrtes Forum,

Wer dieses Upsamplingverfahren weiterhin spannend findet, sollte sich (nochmals) den Ralf Koschnicke Artikel über Grenzen der Digital Technik durchlesen.
http://www.aktives-hoeren.de/downloads/ ... 300708.pdf

Speziell auffällig sind die Frequenzdiagramme am Ende des Artikels (S.20), denn das dritte Diagramm zeigt ein herkömmliches 44.1>192 kHz Upsampling wo die Samplingrate nur erhöht wird, aber keine neuen Interpolationspunkte eingesetzt werden.
Aber genau das sagt das Nyquist-Shannon Abtasttheorem nämlich, dass :

"Das Abtasttheorem besagt, dass ein kontinuierliches, bandbegrenztes Signal, mit einer Minimalfrequenz von 0 Hz und einer Maximalfrequenz fmax, mit einer Frequenz größer als 2 · fmax gleichförmig abgetastet werden muss, damit man aus dem so erhaltenen zeitdiskreten (digitalen) Signal das Ursprungssignal ohne Informationsverlust, aber mit unendlich großem Aufwand, exakt rekonstruieren, - oder mit endlichem Aufwand, - beliebig genau approximieren kann."

-hinzu kommt Ralf Koschnicke Formulierung :

Ausgehend von der Betrachtung typischer Musiksignale können wir davon ausgehen, dass unser Nutzsignal Frequenzen im Bereich bis etwa 40kHz enthält. Darüber hinaus finden wir Anteile nur in Ausnahmefällen. Die Übertragung höherer Frequenzen ist somit vernachlässigbar, denn egal wie fein die Strukturen im Nutzsignal tatsächlich sind, einen gewissen Wert – repräsentiert in der spektralen Zusammensetzung – können sie nicht unterschreiten, sonst hätten wir höhere Signalanteile im Frequenzdiagramm.
Schwieriger ist die Abschätzung des Einflusses der Anti-Aliasing-Filter, die wie gesagt künstliche Vorschwinger generieren. Wie wir aber gesehen haben, ist der Fortschritt von 44,1kHz/48kHz zu 96kHz immens, verglichen mit 96kHz zu 192kHz. Dies lässt sich akustisch auch genau so verifizieren.

Mit dem ungeheueren mathematischen Aufwand und der Präzision mit der Secret Rabbit Code die Interpolationspunkte erstellt, kämen die hohen Frequenzstrukturen wieder zurück in das Diagramm. Eben nicht weil diese vom Anti-aliasing Filter nur so hart weggeschnitten werden, aber weil sie neu berechnet werden.
Jetzt kann man darüber Diskutieren wie genau solche Strukturen/Oberwellen aus dem Nichts wieder "erraten" werden können, aber allein der Umstand dass Oberwellen überhaupt wieder hervortreten und dass der so wichtige Zeitfaktor weniger verschmiert wird, berechtigt es aber einen praxisbezogenen Kompromiss.
Sicherlich ist abzuwägen ob man 90% richtige Oberwellen haben will oder lieber gar keine Oberwellen….

Letztlich muss nochmals betont werden dass SRC nicht einfach x-beliebig Töne oder Oberwellen hinzufügt, aber dass die originalen zeitdiskreten Werte der 44.1 Datei absolut befolgt werden.
Der Clou ist aber mit welcher Genauigkeit die algothitmische Berechnung der neuen Punkte entstehen.
(Vielleicht kann Uli Brüggemann uns das mal technisch darstellen ?)

Viele Grüße Leif

uli.brueggemann · Beitrag von **uli.brueggemann** » 19.07.2011, 16:31

play-mate hat geschrieben:Mit dem ungeheueren mathematischen Aufwand und der Präzision mit der Secret Rabbit Code die Interpolationspunkte erstellt, kämen die hohen Frequenzstrukturen wieder zurück in das Diagramm. Eben nicht weil diese vom Anti-aliasing Filter nur so hart weggeschnitten werden, aber weil sie neu berechnet werden.
Jetzt kann man darüber Diskutieren wie genau solche Strukturen/Oberwellen aus dem Nichts wieder "erraten" werden können, aber allein der Umstand dass Oberwellen überhaupt wieder hervortreten und dass der so wichtige Zeitfaktor weniger verschmiert wird, berechtigt es aber einen praxisbezogenen Kompromiss.
Sicherlich ist abzuwägen ob man 90% richtige Oberwellen haben will oder lieber gar keine Oberwellen….

Letztlich muss nochmals betont werden dass SRC nicht einfach x-beliebig Töne oder Oberwellen hinzufügt, aber dass die originalen zeitdiskreten Werte der 44.1 Datei absolut befolgt werden.
Der Clou ist aber mit welcher Genauigkeit die algothitmische Berechnung der neuen Punkte entstehen.
(Vielleicht kann Uli Brüggemann uns das mal technisch darstellen ?)

Leif,

bevor ich etwas klarstellen kann, muss ich Dich richtig verstehen

Wenn eine CD vorliegt, die ja oberhalb von 22050 Hz alles abgeschnitten hat, und ich davon eine wav-Datei rippe, also 16/44 PCM und die über cPlay mit SRC abspiele, Ausgabe mit z.B. 192 kHz und die Ausgabe digital aufzeichne:
erhalte ich Deiner Meinung nach ein Bild wir in Ralfs Papier Seite 20 oben oder unten ? Was macht das SRC genau an dieser Stelle?

Grüsse, Uli

play-mate · Beitrag von **play-mate** » 19.07.2011, 16:48

Hallo Uli,

Bei dem, von dir beschriebenen Vorgang, erhällst du eine approximierte Variante der ersten Abbildung, denn cPlay rechnet die gesammte Datei hoch sodass sie einer echten 16Bit/192 kHz Datei nahekommt.
Falls wir Ralf Koschnicke dazu bringen können es auch mit dem abgebildeten Datei-Stück zu tun, hätten wir eine recht gute Grundlage....

Leif

uli.brueggemann · Beitrag von **uli.brueggemann** » 19.07.2011, 17:51

play-mate hat geschrieben:Hallo Uli,

Bei dem, von dir beschriebenen Vorgang, erhällst du eine approximierte Variante der ersten Abbildung, denn cPlay rechnet die gesammte Datei hoch sodass sie einer echten 16Bit/192 kHz Datei nahekommt.
Falls wir Ralf Koschnicke dazu bringen können es auch mit dem abgebildeten Datei-Stück zu tun, hätten wir eine recht gute Grundlage....

Leif

Hallo Leif,

leider kommt mir die Aufgabe zu Dir einen dicken Zahn zu ziehen. Du bist gewaltig auf dem Holzweg !!!
Ich habe mir aufgrund Deiner Antwort die Mühe gemacht, eine 192 kHz-Aufnahme zu erstellen. Dabei habe ich eine 44/16-Wav (klassisch, Händel-Konzert) per cPlay abgespielt. Hierbei die Ausgabe auf 192 kHz mit SRC 145 dB vorgegeben. Ausgabe auf meiner Fireface per spdif. Und direkt wieder vom spdif-Ausgang mit 192 kHz aufgenommen.
Das Ergebnis siehst Du im Bild:

Bild

Ganz klar ist da nix oberhalb von 22 kHz anso fs/2 zu finden. Keine Oberwellen.
Es gibt auch KEIN Programm welches so etwas restaurieren könnte, was ja gar nicht mehr vorhanden ist.

Falls Du es nicht glaubst, kannst Du den Versuch auch gerne selbst machen.

Fazit: SRC ist nichts anderes als ein Samplerateconverter mit sinc-Filter. Die Qualität unterscheidet sich hier durch Filterlänge und Datenqualität. Mehr nicht. Es gibt keine Geheimnisse hier, kein secret (Erik hat nur spasseshalber SRC als secret rabbit code benannt). Man kann beliebig genaue sinc-Filter stricken, wenn man genügend Länge zur Verfügung hat.

Ich hab schon länger vermutet, dass Deine eingeschlagene Richtung nicht ganz korrekt ist. Hier ist es eindeutig.

Ansonsten nichts fur ungut

Grüsse, Uli

Schorsch · Beitrag von **Schorsch** » 19.07.2011, 18:47

play-mate hat geschrieben: Mit dem ungeheueren mathematischen Aufwand und der Präzision mit der Secret Rabbit Code die Interpolationspunkte erstellt, kämen die hohen Frequenzstrukturen wieder zurück in das Diagramm. Eben nicht weil diese vom Anti-aliasing Filter nur so hart weggeschnitten werden, aber weil sie neu berechnet werden.

Hallo Leif,

es gibt durchaus Verfahren, welche versuchen, mittels Filterung abgeschnittene Oberschwingungen wieder hinzuzufügen. Das macht man vor allem bei Sprachsignalen, die mit einer niedrigen Abtastfreqeunz (z.B. 8 kHz) abgetastet wurden. Beträgt z.B. die Sprachgrundfrequenz im betrachteten Signalabschnitt 200 Hz, dann kann man das Signal nach einem Upsampling oberhalb der Nyquistfrequenz (hier 4 kHz) mit Vielfachen von 200 Hz (also 4200 Hz, 4400 Hz etc., in der Amplitude exponentiell abfallend) anreichern. Ob man dabei die Spektralanteile des Originalsignals getroffen hat, kann man nicht sagen, aber die Sprache hört sich dadurch etwas natürlicher an, weil einfach mehr Höhen drin sind. Sie hört sich also besser an, aber ist nicht zwingend näher am Original.

Nun 3 Dinge:

So etwas funktioniert nach meiner Kenntnis bei Musik aber nur sehr, sehr rudimentär. Man könnte bei Soloinstrumentalmusik Erfolge erzielen, aber Orchestermusik z.B. wäre da viel zu komplex in seiner Struktur.
Auf der SRC Seite konnte ich keinen Hinweis auf ein solches Verfahren finden. Hast Du eine Quelle, dann her damit!
So etwas wäre durch Interpolation nicht lösbar, dazu müsste eine Spektralanalyse durchgeführt werden, aufgrund derer dann die Oberschwingungen geschätzt werden.

uli.brueggemann hat geschrieben:Es gibt keine Geheimnisse hier, kein secret ...

Ich denke es wäre hier naheliegend, der Expertise von Uli zu vertrauen.

Viele Grüße
Georg

Fujak · Beitrag von **Fujak** » 19.07.2011, 20:13

Hallo Uli,

ich beobachte diesen Thread seit geraumer Zeit an der Seitenlinie und finde Dein Vorgehen immer wieder sehr konstruktiv, nämlich dass Du den vielen theoretischen Ausführungen konkrete Experimente zur Seite stellst, die auf einer fundierten Ebene das eine bestätigen und das andere widerlegen. So behält dieses komplexe Thema immer genügend Bodenhaftung.

Grüße
Fujak

play-mate · Beitrag von **play-mate** » 19.07.2011, 20:55

Hallo Uli,

Vielen Dank für deine Mühe....
-das Resultat überrascht mich und muss einstecken dass das Upsampling nichts über 20kHz hervorbringt. Da schneidet das Anti-Aliasing Filter beim Rippen gnadenlos alles auf der CD Weg.
Im Nachhinein ist das auch klar, dass wo Nichts ist, auch nichts Upgesampelt werden kann.
Dennoch ist in den Ergebnissen jedoch eine deutliche exponentielle Energiedichte in der unteren Grafik zu sehen, die in meiner Interpretation eine erhöhte Artikulierung des Signals mit zunehmender Frequenz nahelegt.
Ich gehe davon aus dass die untere Grafik das Upgesampelte Resultat ist.

Es geschiet jedenfalls Etwas, und weitere Interpretationen / Analysen des Bildlichen würde mich sehr interessieren.

Demütige Grüße Leif

play-mate · Beitrag von **play-mate** » 19.07.2011, 21:00

Hallo Fujak

-Ja !
-ohne Uli´s Einsatz und seine profunden akademischen Einsichten, wären wir (-ich sicherlich speziell viel

) einige Erkenntnisse ärmer.

LG. Leif

Schorsch · Beitrag von **Schorsch** » 19.07.2011, 21:20

Hallo Leif und Fujak,

dann will ich doch auch mal "praktisch werden".
Leif, wenn ich es richtig sehe, läuft cPlay nicht auf dem Mac. Welchen Player empfiehlst Du, um den SRC auf dem Mac zu nutzen?

Viele Grüße
Georg

PS:

play-mate hat geschrieben: Ich gehe davon aus dass die untere Grafik das Upgesampelte Resultat ist.

Ich denke, die beiden Bilder stellen die zwei Stereo Kanäle dar und sind daher verschieden.

uli.brueggemann · Beitrag von **uli.brueggemann** » 19.07.2011, 22:22

Schorsch hat geschrieben: Ich denke, die beiden Bilder stellen die zwei Stereo Kanäle dar und sind daher verschieden.

yep, das Bild zeigt beide upgesampelte Stereokanäle

Gruss, Uli

Rossi · Beitrag von **Rossi** » 19.07.2011, 23:45

Ist eigentlich logisch, daß dort, wo nichts ist, auch nicht der beste Algorithmus etwas hinzurechnen kann.

Viel interessanter ist aber doch, wie cPlay es schafft, das was da ist so zu verändern, daß es besser klingt.

LG,
Stefan

Hans-Martin · Beitrag von **Hans-Martin** » 20.07.2011, 06:44

Das Preringing erzeugt etwas an einer Stelle, wo es nicht higehört.
Grüße Hans-Martin

Ralf Koschnicke · Beitrag von **Ralf Koschnicke** » 20.07.2011, 11:33

Besten Dank an Uli! Die automatische Benachrichtigung der Forensoftware meidet mich seit einiger Zeit, sonst hätte ich die Aufgabe vielleicht auch übernommen. Nun habe ich aber erst jetzt entdeckt, dass die Diskussion weiterging.

Hier gibt es auch noch ein passendes Bildchen, das letzte von den dreien etwa in der Mitte der Seite: http://www.acousence.de/index.php?optio ... 61&lang=de

Hier sieht man auch nochmal deutlich, dass da nichts neues entsteht.

@Hans-Martin: Das Preringing schlägt dann zu, wenn mit dem dann notwendigen steilflankigen Filter auf 44,1kHz runtergerechnet wird. Dieses „etwas an einer Stelle, wo es nicht hingehört“ ist dann aber im Signal eingebettet und kann durch Upsampling nicht wieder entfernt werden. Woher sollte der Algorithmus auch wissen, was echte Einschwinger und was künstlich erzeugte sind. Also auch an dieser Stelle: Was durch Reduktion auf 44,1kHz erst mal passiert ist, kann mit Upsampling nicht wieder korrigiert werden.

Die spannende Frage bleibt also, was durch ein Upsampling nun wirklich besser werden soll? Die Sache mit den Analogfiltern scheidet ja bei modernen Wandlern also auch aus.
Ich hatte neulich einen sehr interessanten Diskurs mit einem Signaltheoretiker, der in der Bildverarbeitung neue Interpolationsverfahren entwickelt und dabei eben auch an den Rändern der bisherigen Auslegung des Abtasttheorems kratzt. Hier gibt es ein schönes Applet, das den Einfuss unterschiedlicher Interpolationsverfahren bei der Größenänderung von Bildern zeigt (was einem Resampling entspricht): http://bigwww.epfl.ch/demo/jresize/start.php

Ich habe nun folgende These bzgl. Upsampling: Hat man ein Interpolationsverfahren mit einer bestimmten Genauigkeit, dann arbeitet das stets umso genauer je kürzer das Abtastintervall ist.
D.h. ist die Interpolation außerhalb des Wandlerchips genauer als die im Wandler, so startet der DA-Chip mit größerer Genauigkeit. Ich vermute, dass könnte die Erklärung sein.

Viele Grüße
Ralf