Andree (Backes & Müller BM Prime 8)
Forumsregeln
Bei Vorstellungen steht die persönliche, subjektive Erfahrungswelt des Verfassers im Vordergrund. Insbesondere soll die Vorstellung als "Visitenkarte" des Mitglieds gewürdigt bzw. respektiert werden. Dialoge sollten hier vorrangig mit dem Verfasser und nicht mit Dritten geführt werden. Siehe auch die Forumsregeln.
Bei Vorstellungen steht die persönliche, subjektive Erfahrungswelt des Verfassers im Vordergrund. Insbesondere soll die Vorstellung als "Visitenkarte" des Mitglieds gewürdigt bzw. respektiert werden. Dialoge sollten hier vorrangig mit dem Verfasser und nicht mit Dritten geführt werden. Siehe auch die Forumsregeln.
Hallo Jürgen,
Viele Grüße,
Andree
Ok, also (re-)quantisierst du bereits mit ffmpeg auf 24 Bit. Damit bleibt das Problem das gleiche. Ohne Absenkung kommt es potenziell zu Übersteuerung, ohne Dithering verschenkst du Dynamik und fügst nichtlineare Verzerrungen hinzu. Ist aber natürlich deine Entscheidung.
Viele Grüße,
Andree
Hallo Jürgen
Eine vereinfachte Darstellung aus Wikipedia:
https://youtu.be/IBR-DwfCpfU
Viele Grüße
Christian
Eine vereinfachte Darstellung aus Wikipedia:
Ich habe auch noch dieses überzogene YouTube Video gefunden:Eine Lösung: zufällig auf- oder abrunden
Durch Zugabe von geeignetem Dither-Rauschen zum Signal erhöht sich zwar die Rauschenergie, aber die Kennlinie wird linearisiert, sodass die Verzerrungen verschwinden und sehr leise Signalanteile besser (oder überhaupt erst) wahrgenommen werden.
https://youtu.be/IBR-DwfCpfU
Viele Grüße
Christian
Hallo Chris,
danke, war mir schon klar soweit, habe aber immer noch kein "Problem" entdeckt. (Vermutlich brauche mal eine neue Brille,
oder eben eure Nachhilfe. )
Andree hatte gemeint, ich verliere Dynamik.
Eigentlich ist es nach meinem Verständnis eher anderes herum,
da ich Dithering-Rauschen hinzufüge, ist mein Rauschspannungsabstand kleiner.
Wir hatten mal bei Fujak einen Test beim Mikrostammtisch und hörten aus ConvoFS,
Versionen mit und ohne Dithering bzw. mit unterschiedlichen Einstellungen.
Hörbar war, dass ungedithert sauberer klang, gedithert zwar etwas unsauberer,
die Auflösung ließ etwas nach, aber es war musikalisch ansprechender.
Bei mir war das anders, bei mir war gedithert nicht musikalischer, aber die Unsauberkeit störte.
Das Problem mit der Quantisierung habe ich auch nicht verstanden,
ich stecke vorne 16 (bzw. 24 bit rein) und mache ein Upsampling auf 176 bzw. 192 kHz, je nach Original Samplerate.
Selbst wenn intern mit mehr als 24 bit gerechnet wird, wo ist das (theoretische) Problem wenn man nach dem Upsampling auf 24 bit "abschneidet"?
Langsam wäre das schon einen eigenen Thread wert, wir beanspruchen Andrees Thread schon stark.
Grüsse Jürgen
danke, war mir schon klar soweit, habe aber immer noch kein "Problem" entdeckt. (Vermutlich brauche mal eine neue Brille,
oder eben eure Nachhilfe. )
Andree hatte gemeint, ich verliere Dynamik.
Eigentlich ist es nach meinem Verständnis eher anderes herum,
da ich Dithering-Rauschen hinzufüge, ist mein Rauschspannungsabstand kleiner.
Wir hatten mal bei Fujak einen Test beim Mikrostammtisch und hörten aus ConvoFS,
Versionen mit und ohne Dithering bzw. mit unterschiedlichen Einstellungen.
Hörbar war, dass ungedithert sauberer klang, gedithert zwar etwas unsauberer,
die Auflösung ließ etwas nach, aber es war musikalisch ansprechender.
Bei mir war das anders, bei mir war gedithert nicht musikalischer, aber die Unsauberkeit störte.
Das Problem mit der Quantisierung habe ich auch nicht verstanden,
ich stecke vorne 16 (bzw. 24 bit rein) und mache ein Upsampling auf 176 bzw. 192 kHz, je nach Original Samplerate.
Selbst wenn intern mit mehr als 24 bit gerechnet wird, wo ist das (theoretische) Problem wenn man nach dem Upsampling auf 24 bit "abschneidet"?
Langsam wäre das schon einen eigenen Thread wert, wir beanspruchen Andrees Thread schon stark.
Grüsse Jürgen
Hallo Jürgen
Dynamik gewinnst Du zu den Zeiten, wo unten rum etwas aufgelöst wird, wo das ich’s geditherte Signal schon nichts mehr darstellt als Stille... mit dem Nachteil: es rauscht.
Jetzt wird es schwierig Dynamik zu erklären... Signal to Noise wird schlechter.. aber trotzdem kann man unten rum was hören, was im Signal mit mehr Dynamik verschwunden ist... im Sinne von Signaldynamik ist die für mich besser
Ich kann mit einem leicht verrauschtem Signal mittlerweile gut leben
Viele Grüße
Christian
Dynamik gewinnst Du zu den Zeiten, wo unten rum etwas aufgelöst wird, wo das ich’s geditherte Signal schon nichts mehr darstellt als Stille... mit dem Nachteil: es rauscht.
Jetzt wird es schwierig Dynamik zu erklären... Signal to Noise wird schlechter.. aber trotzdem kann man unten rum was hören, was im Signal mit mehr Dynamik verschwunden ist... im Sinne von Signaldynamik ist die für mich besser
Ich kann mit einem leicht verrauschtem Signal mittlerweile gut leben
Viele Grüße
Christian
Zufällig gegen korreliert
Hallo Jürgen,
as Wichtigste ist, das Du korelliertes Rauschen durch zufälliges Rauschen ersetzt. Beim Downsampling entstehen Störsignale, die mit dem zu übertragenden Signal korrelieren. Das heißt, die Energie des Rauschens „konzentriert sich auf wenige Frequenzen. Diese Peaks sind aber relativ hoch. Dither randomisiert das Rauschen, die Peaks werden kleiner, das Rauschen betrifft nicht mehr einzelne Frequenzen sondern einen Frequenzbereich. Kommt noise shaping dazu, macht man den Pegel des dither Rauschens Frequenz abhängig und macht den Pegel bei Frequenzen, bei denen das menschliche Gehör besonders empfindlich ist niedrig, bei Frequenzen, bei denen das menschliche Gehör unempfindlich ist höher.
Christian, das von Dir verlinkte Video finde ich gut zum Erklären der Grundlagen, Danke dafür.
Bei wurde untendrunter noch folgendes Video in Englisch angezeigt, das schön zeigt, das die Dynamik mit dither besser ist:
https://m.youtube.com/watch?v=ZMbTUD6c4a8
Gruß
Uwe
PS Falls Dir Andree das zu viel Rauschen in deinem Vorstellungs-Faden ist, können die Moderatoren das vielleicht auf deinen Wunsch woanders hin verschieben
as Wichtigste ist, das Du korelliertes Rauschen durch zufälliges Rauschen ersetzt. Beim Downsampling entstehen Störsignale, die mit dem zu übertragenden Signal korrelieren. Das heißt, die Energie des Rauschens „konzentriert sich auf wenige Frequenzen. Diese Peaks sind aber relativ hoch. Dither randomisiert das Rauschen, die Peaks werden kleiner, das Rauschen betrifft nicht mehr einzelne Frequenzen sondern einen Frequenzbereich. Kommt noise shaping dazu, macht man den Pegel des dither Rauschens Frequenz abhängig und macht den Pegel bei Frequenzen, bei denen das menschliche Gehör besonders empfindlich ist niedrig, bei Frequenzen, bei denen das menschliche Gehör unempfindlich ist höher.
Christian, das von Dir verlinkte Video finde ich gut zum Erklären der Grundlagen, Danke dafür.
Bei wurde untendrunter noch folgendes Video in Englisch angezeigt, das schön zeigt, das die Dynamik mit dither besser ist:
https://m.youtube.com/watch?v=ZMbTUD6c4a8
Gruß
Uwe
PS Falls Dir Andree das zu viel Rauschen in deinem Vorstellungs-Faden ist, können die Moderatoren das vielleicht auf deinen Wunsch woanders hin verschieben
Hallo ihr Lieben,
im verlinkten Video wird mit 24/44,1 gearbeitet und dann auf 16/44 gesampled.
Aber in meiner Anwendung geht es nur um Upsampling, ein Downsampling mache ich nicht.
Bleibt die Frage, ob die Artefakte auch beim Upsampling entstehen,
wenn mit höherer Bittiefe gearbeitet und später abgeschnitten wird?
Grüsse Jürgen
im verlinkten Video wird mit 24/44,1 gearbeitet und dann auf 16/44 gesampled.
Aber in meiner Anwendung geht es nur um Upsampling, ein Downsampling mache ich nicht.
Bleibt die Frage, ob die Artefakte auch beim Upsampling entstehen,
wenn mit höherer Bittiefe gearbeitet und später abgeschnitten wird?
Grüsse Jürgen
Hallo Jürgen,
Auf Audio übertragen bedeutet das, dass Kleinsignale unterhalb der Schwelle von s=0.5 ohne Dither komplett verschwinden, mit Dither aber noch erfasst werden können -- auf Kosten von erhöhtem Rauschen. Dynamik geht rauf, Rauschabstand geht runter.
Viele Grüße,
Andree
PS: Mich stört die Diskussion in meinem Thread nicht. Ich hoffe nur andere Leser finden die DIskussion hier auch.
Ich versuche das mal anschaulich zu erklären: Du hast ein hoch auflösendes Signal s und möchtest jetzt auf eine geringere Auflösung a quantisieren. Dabei ist a=1 der kleinste mögliche Wert, der nicht Null ist. Ein normaler Quantisierer würde jetzt jeden Wert s<0.5 auf a=0 runden, und alles s>=0.5 auf a=1. Ein Wert von s=0.5 wird also gerade noch erfasst, aber sobald der Wert kleiner ist wird das Sigal zu Null. Immer. Wenn jetzt vor der Quantisierung Dither ergänzt wird, sieht das anders aus: Dither ist ein zufälliges Signal, das z.B. Werte n=-0.5...+0.5 annimmt. Ein Signal von z.B. s=0.25 wird dann immer noch durch Zufall ab und zu erfasst (für alle Rauschwerte von n=0.25...0.5 ergibt sich eine Summe s+n>=0.5 und es wird auf a=1 quantisiert). Somit kann mit Dithering mehr Dynamik erreicht werden. Signale unterhalb der Quantisierungsschwelle werden erfasst.
Auf Audio übertragen bedeutet das, dass Kleinsignale unterhalb der Schwelle von s=0.5 ohne Dither komplett verschwinden, mit Dither aber noch erfasst werden können -- auf Kosten von erhöhtem Rauschen. Dynamik geht rauf, Rauschabstand geht runter.
Beim Upsampling/Downsampling/Pegelanpassung/Raumkorrektur machst du aus einem 16 oder 24 Bit Signal ein Signal mit höherer Auflösung (32 Bit, float32 oder sogar float64). Bei der Umwandlung auf die geringere 24 Bit Auflösung wird neu quantisiert. Wenn das mit Dither gemacht wird, bleiben wie oben beschrieben Anteile unterhalb der Schwelle erhalten.h0e hat geschrieben: ↑24.02.2020, 20:14 Das Problem mit der Quantisierung habe ich auch nicht verstanden,
ich stecke vorne 16 (bzw. 24 bit rein) und mache ein Upsampling auf 176 bzw. 192 kHz, je nach Original Samplerate.
Selbst wenn intern mit mehr als 24 bit gerechnet wird, wo ist das (theoretische) Problem wenn man nach dem Upsampling auf 24 bit "abschneidet"?
Die Artefakte treten immer und bei jedem Arbeitsschritt auf, bei dem die Auflösung verringert wird.
Viele Grüße,
Andree
PS: Mich stört die Diskussion in meinem Thread nicht. Ich hoffe nur andere Leser finden die DIskussion hier auch.
Guten Morgen,
auf youtube habe ich noch ein Video gefunden, dass sehr anschaulich zeigt wie mit Dither Kleinsignale unterhalb der eigentlichen Auflösung erhalten bleiben. Es werden Beispiele für Grafik und für Audio gezeigt. Außerdem wird kurz dargestellt, was bei einer Reduzierung der digitalen Wortbreite passiert (entspricht einer Quantisierung).
Video: Dither explained
Dither verschlechtert nicht das Signal nachträglich. Dither wird vor einer Quantisierung ergänzt und erhält Kleinsignale, die ansonsten verloren gehen. In einem von Uli in einem anderen Beitrag verlinkten Paper wird beschrieben wie es zu hörbarer Degradation bei fehlendem Dither im Bereich des 23ten und 24ten Bits kommen kann (Section 6 "CONVERTERS, WORKSTATIONS, AND SYSTEMS"). Und das sind genau die Auflösungen von denen wir hier meistens schreiben. Hier noch einmal der Link:
Andree
auf youtube habe ich noch ein Video gefunden, dass sehr anschaulich zeigt wie mit Dither Kleinsignale unterhalb der eigentlichen Auflösung erhalten bleiben. Es werden Beispiele für Grafik und für Audio gezeigt. Außerdem wird kurz dargestellt, was bei einer Reduzierung der digitalen Wortbreite passiert (entspricht einer Quantisierung).
Video: Dither explained
Dither verschlechtert nicht das Signal nachträglich. Dither wird vor einer Quantisierung ergänzt und erhält Kleinsignale, die ansonsten verloren gehen. In einem von Uli in einem anderen Beitrag verlinkten Paper wird beschrieben wie es zu hörbarer Degradation bei fehlendem Dither im Bereich des 23ten und 24ten Bits kommen kann (Section 6 "CONVERTERS, WORKSTATIONS, AND SYSTEMS"). Und das sind genau die Auflösungen von denen wir hier meistens schreiben. Hier noch einmal der Link:
Grüße,Bob Katz hat geschrieben:In Bob Stuart's paper, which is open access so you do not have to be an AES member to download this:
J. R. Stuart and P. G. Craven, “The Gentle Art of Dithering” J. Audio Eng. Soc., vol. 67, no. 5, pp. 278–299, (2019 May.). DOI: https://doi.org/10.17743/jaes.2019.0011
Andree
Hallo Andree,
Danke für den Link, anschauliches Video.
Ich habe immer noch ein Verständnisproblem bei der konkreten Umsetztung.
Eine Bitreduzierung findet nur statt, wenn mit höherer Auflösung gesampled wird.
Gibt es überhaupt „sinnvolle“ Signalanteile bei 24 bit Ausgangsmaterial und 24 bit Zielformat?
Das müssten jetzt also Signale sein, deren Amplitude unterhalb der 24bit gerutscht sind.
Entstehen die beim Resampling und sind die dann interessant?
Bei Bitreduzierung innerhalb der Nutzsignalbandbreite verstehe ich, dass ein Effekt zu Tage tritt,
der durchaus positiv sein kann.
Beim Hörtest bei Fujak fanden wir glaube ich Dithering mit Noise Shaping am angenehmsten,
als besten Kompromiss zwischen Sauberkeit und Auflösung vs. Musikfluß (und ermüdungsfreierer Wiedergabe) auf der anderen Seite.
Grüsse Jürgen
Danke für den Link, anschauliches Video.
Ich habe immer noch ein Verständnisproblem bei der konkreten Umsetztung.
Eine Bitreduzierung findet nur statt, wenn mit höherer Auflösung gesampled wird.
Gibt es überhaupt „sinnvolle“ Signalanteile bei 24 bit Ausgangsmaterial und 24 bit Zielformat?
Das müssten jetzt also Signale sein, deren Amplitude unterhalb der 24bit gerutscht sind.
Entstehen die beim Resampling und sind die dann interessant?
Bei Bitreduzierung innerhalb der Nutzsignalbandbreite verstehe ich, dass ein Effekt zu Tage tritt,
der durchaus positiv sein kann.
Beim Hörtest bei Fujak fanden wir glaube ich Dithering mit Noise Shaping am angenehmsten,
als besten Kompromiss zwischen Sauberkeit und Auflösung vs. Musikfluß (und ermüdungsfreierer Wiedergabe) auf der anderen Seite.
Grüsse Jürgen
-
- Aktiver Hersteller
- Beiträge: 4668
- Registriert: 23.03.2009, 15:58
- Wohnort: 33649
- Kontaktdaten:
Jürgen,
ein PCM Signal hat typischerweise 8, 16 oder 24 Bit. Damit ist die Anzahl der Bits gemeint. Die Bits beschreiben eine ganzzahlige Größe, der Werteumfang bei 24 Bit ist z.B. -8388608 ... +8388607 Stufen.
Angenommen ein Player spielt 24bit Material, dann ist erst einmal alles ok (Musiktracks werden gedithert ausgeliefert).
Wenn Du nun digital die Lautstärke veränderst (oder eine andere beliebige digitale Manipulation vornimmst inkl. Resampling), dann ändert sich der Werteumfang.
1.Beispiel: Du reduzierst den Pegel digital mit einem Faktor 0.5. Das ist gleichbedeutend mit einem Rechtsshift, das niederwertigste Bit fällt einfach raus. Es wird abgeschnitten, man spricht von Truncation.
2. Beispiel: der Pegel wird um den Faktor 5 reduziert. Wenn es Kommastellen gäbe, würden die Samples nun Nachkommastellen .0, .2, .4, .6, .8 aufweisen. Da es keine Nachkommastellen gibt, würden sie einfach wegfallen.
Eine Lösung wäre ein mathematisches Runden. Und eine zweite bessere Lösung ist eben das Dithering welches nun Rauschen hinzufügt. Das ist dann in dem von Andree verlinkten Video gezeigt.
Wenn Du JRiver hast: im DSP-Studio gibt es die Parametrischen Equalizer. Bei der Auswahl findest Du auch einen Bittiefen-Simulator wo man das Dithering aus- und einschalten kann. Dann kannst Du Dir einen Track z.B. mit 4 Bit anhören. Das ist also der 24 bit Track um 20 Stellen = -120 dB verringert und abgeschnitten, anschliessend um 120 dB verstärkt, damit die Originallautstärke wieder da ist.
Grüsse
Uli
Hallo Uli,
danke für die Erklärung für „Dummies“.
Es festigt mich aber in der Meinung, dass bei mir kein Dithering nötig ist, denn ich ändere am Ausgangssignal nichts außer der Samplerate und bei
16 Bit-Files die Bittiefe auf 24 Bit.
Ich habe keine digitale Lautstärke und auch Dein Acourate liegt hier brach, ich nutze keine Filter.
Also sollten doch keine Effekte auftreten, die ein Dithering nötig machen,
oder habe ich etwas übersehen?
In Fällen einer Veränderung des Digitalsignals durch digitale Lautstärkeregelung oder der Anwendung irgendwelcher Filter leuchtet mir das Dithering rein von der theoretischen Betrachtung schon ein.
Danke Andree, dass wir hier so schön diskutieren können,
wir sollten uns mal wieder gemeinsam vor eine Anlage setzen.
Schaust Du eigentlich beim Forumstreffen rein, ist ja nicht weit für Dich?
Grüsse Jürgen
danke für die Erklärung für „Dummies“.
Es festigt mich aber in der Meinung, dass bei mir kein Dithering nötig ist, denn ich ändere am Ausgangssignal nichts außer der Samplerate und bei
16 Bit-Files die Bittiefe auf 24 Bit.
Ich habe keine digitale Lautstärke und auch Dein Acourate liegt hier brach, ich nutze keine Filter.
Also sollten doch keine Effekte auftreten, die ein Dithering nötig machen,
oder habe ich etwas übersehen?
In Fällen einer Veränderung des Digitalsignals durch digitale Lautstärkeregelung oder der Anwendung irgendwelcher Filter leuchtet mir das Dithering rein von der theoretischen Betrachtung schon ein.
Danke Andree, dass wir hier so schön diskutieren können,
wir sollten uns mal wieder gemeinsam vor eine Anlage setzen.
Schaust Du eigentlich beim Forumstreffen rein, ist ja nicht weit für Dich?
Grüsse Jürgen
-
- Aktiver Hersteller
- Beiträge: 4668
- Registriert: 23.03.2009, 15:58
- Wohnort: 33649
- Kontaktdaten: