Andree (Backes & Müller BM Prime 8)

h0e · Beitrag von **h0e** » 24.02.2020, 07:39

Hallo Andree,

ich nutze ConvoFS nicht, sondern Minim mit FFMpeg.
Dort erfolgt Wave Ausgabe in 24 bit, 32 bit kann auch der Linn gar nicht,
d.h. auch dass der Renderer die Daten nur durchreicht.

Grüsse Jürgen

Buschel · Beitrag von **Buschel** » 24.02.2020, 15:46

Hallo Jürgen,

h0e hat geschrieben: ↑24.02.2020, 07:39 ich nutze ConvoFS nicht, sondern Minim mit FFMpeg.
Dort erfolgt Wave Ausgabe in 24 bit, 32 bit kann auch der Linn gar nicht,
d.h. auch dass der Renderer die Daten nur durchreicht.

Ok, also (re-)quantisierst du bereits mit ffmpeg auf 24 Bit. Damit bleibt das Problem das gleiche. Ohne Absenkung kommt es potenziell zu Übersteuerung, ohne Dithering verschenkst du Dynamik und fügst nichtlineare Verzerrungen hinzu. Ist aber natürlich deine Entscheidung.

Viele Grüße,
Andree

h0e · Beitrag von **h0e** » 24.02.2020, 16:34

Hallo Andree,

Dithering ist doch hinzufügen von Rauschen, mal ganz laienhaft, wie kann das Einfluss auf die Dynamik haben?

Grüsse Jürgen

chriss0212 · Beitrag von **chriss0212** » 24.02.2020, 19:28

Hallo Jürgen

Eine vereinfachte Darstellung aus Wikipedia:

Eine Lösung: zufällig auf- oder abrunden

Durch Zugabe von geeignetem Dither-Rauschen zum Signal erhöht sich zwar die Rauschenergie, aber die Kennlinie wird linearisiert, sodass die Verzerrungen verschwinden und sehr leise Signalanteile besser (oder überhaupt erst) wahrgenommen werden.

Ich habe auch noch dieses überzogene YouTube Video gefunden:
https://youtu.be/IBR-DwfCpfU

Viele Grüße

Christian

h0e · Beitrag von **h0e** » 24.02.2020, 20:14

Hallo Chris,

danke, war mir schon klar soweit, habe aber immer noch kein "Problem" entdeckt. (Vermutlich brauche mal eine neue Brille,
oder eben eure Nachhilfe.

)
Andree hatte gemeint, ich verliere Dynamik.
Eigentlich ist es nach meinem Verständnis eher anderes herum,
da ich Dithering-Rauschen hinzufüge, ist mein Rauschspannungsabstand kleiner.
Wir hatten mal bei Fujak einen Test beim Mikrostammtisch und hörten aus ConvoFS,
Versionen mit und ohne Dithering bzw. mit unterschiedlichen Einstellungen.
Hörbar war, dass ungedithert sauberer klang, gedithert zwar etwas unsauberer,
die Auflösung ließ etwas nach, aber es war musikalisch ansprechender.
Bei mir war das anders, bei mir war gedithert nicht musikalischer, aber die Unsauberkeit störte.

Das Problem mit der Quantisierung habe ich auch nicht verstanden,
ich stecke vorne 16 (bzw. 24 bit rein) und mache ein Upsampling auf 176 bzw. 192 kHz, je nach Original Samplerate.
Selbst wenn intern mit mehr als 24 bit gerechnet wird, wo ist das (theoretische) Problem wenn man nach dem Upsampling auf 24 bit "abschneidet"?

Langsam wäre das schon einen eigenen Thread wert, wir beanspruchen Andrees Thread schon stark.

Grüsse Jürgen

chriss0212 · Beitrag von **chriss0212** » 24.02.2020, 20:29

Hallo Jürgen

Dynamik gewinnst Du zu den Zeiten, wo unten rum etwas aufgelöst wird, wo das ich’s geditherte Signal schon nichts mehr darstellt als Stille... mit dem Nachteil: es rauscht.

Jetzt wird es schwierig Dynamik zu erklären... Signal to Noise wird schlechter.. aber trotzdem kann man unten rum was hören, was im Signal mit mehr Dynamik verschwunden ist... im Sinne von Signaldynamik ist die für mich besser

Ich kann mit einem leicht verrauschtem Signal mittlerweile gut leben

Viele Grüße

Christian

Tinitus · Beitrag von **Tinitus** » 24.02.2020, 20:49

Hallo Jürgen,

as Wichtigste ist, das Du korelliertes Rauschen durch zufälliges Rauschen ersetzt. Beim Downsampling entstehen Störsignale, die mit dem zu übertragenden Signal korrelieren. Das heißt, die Energie des Rauschens „konzentriert sich auf wenige Frequenzen. Diese Peaks sind aber relativ hoch. Dither randomisiert das Rauschen, die Peaks werden kleiner, das Rauschen betrifft nicht mehr einzelne Frequenzen sondern einen Frequenzbereich. Kommt noise shaping dazu, macht man den Pegel des dither Rauschens Frequenz abhängig und macht den Pegel bei Frequenzen, bei denen das menschliche Gehör besonders empfindlich ist niedrig, bei Frequenzen, bei denen das menschliche Gehör unempfindlich ist höher.

Christian, das von Dir verlinkte Video finde ich gut zum Erklären der Grundlagen, Danke dafür.
Bei wurde untendrunter noch folgendes Video in Englisch angezeigt, das schön zeigt, das die Dynamik mit dither besser ist:

https://m.youtube.com/watch?v=ZMbTUD6c4a8

Gruß

Uwe

PS Falls Dir Andree das zu viel Rauschen in deinem Vorstellungs-Faden ist, können die Moderatoren das vielleicht auf deinen Wunsch woanders hin verschieben

h0e · Beitrag von **h0e** » 24.02.2020, 21:18

Hallo ihr Lieben,

im verlinkten Video wird mit 24/44,1 gearbeitet und dann auf 16/44 gesampled.
Aber in meiner Anwendung geht es nur um Upsampling, ein Downsampling mache ich nicht.
Bleibt die Frage, ob die Artefakte auch beim Upsampling entstehen,
wenn mit höherer Bittiefe gearbeitet und später abgeschnitten wird?

Grüsse Jürgen

Buschel · Beitrag von **Buschel** » 24.02.2020, 21:44

Hallo Jürgen,

h0e hat geschrieben: ↑24.02.2020, 20:14 Andree hatte gemeint, ich verliere Dynamik.
Eigentlich ist es nach meinem Verständnis eher anderes herum,
da ich Dithering-Rauschen hinzufüge, ist mein Rauschspannungsabstand kleiner.

Ich versuche das mal anschaulich zu erklären: Du hast ein hoch auflösendes Signal s und möchtest jetzt auf eine geringere Auflösung a quantisieren. Dabei ist a=1 der kleinste mögliche Wert, der nicht Null ist. Ein normaler Quantisierer würde jetzt jeden Wert s<0.5 auf a=0 runden, und alles s>=0.5 auf a=1. Ein Wert von s=0.5 wird also gerade noch erfasst, aber sobald der Wert kleiner ist wird das Sigal zu Null. Immer. Wenn jetzt vor der Quantisierung Dither ergänzt wird, sieht das anders aus: Dither ist ein zufälliges Signal, das z.B. Werte n=-0.5...+0.5 annimmt. Ein Signal von z.B. s=0.25 wird dann immer noch durch Zufall ab und zu erfasst (für alle Rauschwerte von n=0.25...0.5 ergibt sich eine Summe s+n>=0.5 und es wird auf a=1 quantisiert). Somit kann mit Dithering mehr Dynamik erreicht werden. Signale unterhalb der Quantisierungsschwelle werden erfasst.

Auf Audio übertragen bedeutet das, dass Kleinsignale unterhalb der Schwelle von s=0.5 ohne Dither komplett verschwinden, mit Dither aber noch erfasst werden können -- auf Kosten von erhöhtem Rauschen. Dynamik geht rauf, Rauschabstand geht runter.

h0e hat geschrieben: ↑24.02.2020, 20:14 Das Problem mit der Quantisierung habe ich auch nicht verstanden,
ich stecke vorne 16 (bzw. 24 bit rein) und mache ein Upsampling auf 176 bzw. 192 kHz, je nach Original Samplerate.
Selbst wenn intern mit mehr als 24 bit gerechnet wird, wo ist das (theoretische) Problem wenn man nach dem Upsampling auf 24 bit "abschneidet"?

Beim Upsampling/Downsampling/Pegelanpassung/Raumkorrektur machst du aus einem 16 oder 24 Bit Signal ein Signal mit höherer Auflösung (32 Bit, float32 oder sogar float64). Bei der Umwandlung auf die geringere 24 Bit Auflösung wird neu quantisiert. Wenn das mit Dither gemacht wird, bleiben wie oben beschrieben Anteile unterhalb der Schwelle erhalten.

h0e hat geschrieben: ↑24.02.2020, 21:18Bleibt die Frage, ob die Artefakte auch beim Upsampling entstehen,
wenn mit höherer Bittiefe gearbeitet und später abgeschnitten wird?

Die Artefakte treten immer und bei jedem Arbeitsschritt auf, bei dem die Auflösung verringert wird.

Viele Grüße,
Andree

PS: Mich stört die Diskussion in meinem Thread nicht. Ich hoffe nur andere Leser finden die DIskussion hier auch.

Buschel · Beitrag von **Buschel** » 25.02.2020, 07:11

Guten Morgen,

auf youtube habe ich noch ein Video gefunden, dass sehr anschaulich zeigt wie mit Dither Kleinsignale unterhalb der eigentlichen Auflösung erhalten bleiben. Es werden Beispiele für Grafik und für Audio gezeigt. Außerdem wird kurz dargestellt, was bei einer Reduzierung der digitalen Wortbreite passiert (entspricht einer Quantisierung).

Video: Dither explained

Dither verschlechtert nicht das Signal nachträglich. Dither wird vor einer Quantisierung ergänzt und erhält Kleinsignale, die ansonsten verloren gehen. In einem von Uli in einem anderen Beitrag verlinkten Paper wird beschrieben wie es zu hörbarer Degradation bei fehlendem Dither im Bereich des 23ten und 24ten Bits kommen kann (Section 6 "CONVERTERS, WORKSTATIONS, AND SYSTEMS"). Und das sind genau die Auflösungen von denen wir hier meistens schreiben. Hier noch einmal der Link:

Bob Katz hat geschrieben:In Bob Stuart's paper, which is open access so you do not have to be an AES member to download this:
J. R. Stuart and P. G. Craven, “The Gentle Art of Dithering” J. Audio Eng. Soc., vol. 67, no. 5, pp. 278–299, (2019 May.). DOI: https://doi.org/10.17743/jaes.2019.0011

Grüße,
Andree

Jupiter · Beitrag von **Jupiter** » 25.02.2020, 08:00

Hallo André,

Klar finden das Thema andere auch interessant, ich lese sehr interessiert mit.

Ich nutze ConvoFS, Minimserver, FFMpeg, von daher bin ich sehr interessiert die Zusammenhänge von Dithering und Noise shaping zu verstehen.

Sehr gutes Thema

Gruß Harald

h0e · Beitrag von **h0e** » 25.02.2020, 08:26

Hallo Andree,

Danke für den Link, anschauliches Video.
Ich habe immer noch ein Verständnisproblem bei der konkreten Umsetztung.
Eine Bitreduzierung findet nur statt, wenn mit höherer Auflösung gesampled wird.
Gibt es überhaupt „sinnvolle“ Signalanteile bei 24 bit Ausgangsmaterial und 24 bit Zielformat?
Das müssten jetzt also Signale sein, deren Amplitude unterhalb der 24bit gerutscht sind.
Entstehen die beim Resampling und sind die dann interessant?

Bei Bitreduzierung innerhalb der Nutzsignalbandbreite verstehe ich, dass ein Effekt zu Tage tritt,
der durchaus positiv sein kann.

Beim Hörtest bei Fujak fanden wir glaube ich Dithering mit Noise Shaping am angenehmsten,
als besten Kompromiss zwischen Sauberkeit und Auflösung vs. Musikfluß (und ermüdungsfreierer Wiedergabe) auf der anderen Seite.

Grüsse Jürgen

uli.brueggemann · Beitrag von **uli.brueggemann** » 25.02.2020, 18:00

h0e hat geschrieben: ↑25.02.2020, 08:26 Ich habe immer noch ein Verständnisproblem bei der konkreten Umsetzung.

Jürgen,

ein PCM Signal hat typischerweise 8, 16 oder 24 Bit. Damit ist die Anzahl der Bits gemeint. Die Bits beschreiben eine ganzzahlige Größe, der Werteumfang bei 24 Bit ist z.B. -8388608 ... +8388607 Stufen.
Angenommen ein Player spielt 24bit Material, dann ist erst einmal alles ok (Musiktracks werden gedithert ausgeliefert).
Wenn Du nun digital die Lautstärke veränderst (oder eine andere beliebige digitale Manipulation vornimmst inkl. Resampling), dann ändert sich der Werteumfang.
1.Beispiel: Du reduzierst den Pegel digital mit einem Faktor 0.5. Das ist gleichbedeutend mit einem Rechtsshift, das niederwertigste Bit fällt einfach raus. Es wird abgeschnitten, man spricht von Truncation.
2. Beispiel: der Pegel wird um den Faktor 5 reduziert. Wenn es Kommastellen gäbe, würden die Samples nun Nachkommastellen .0, .2, .4, .6, .8 aufweisen. Da es keine Nachkommastellen gibt, würden sie einfach wegfallen.
Eine Lösung wäre ein mathematisches Runden. Und eine zweite bessere Lösung ist eben das Dithering welches nun Rauschen hinzufügt. Das ist dann in dem von Andree verlinkten Video gezeigt.

Wenn Du JRiver hast: im DSP-Studio gibt es die Parametrischen Equalizer. Bei der Auswahl findest Du auch einen Bittiefen-Simulator wo man das Dithering aus- und einschalten kann. Dann kannst Du Dir einen Track z.B. mit 4 Bit anhören. Das ist also der 24 bit Track um 20 Stellen = -120 dB verringert und abgeschnitten, anschliessend um 120 dB verstärkt, damit die Originallautstärke wieder da ist.

Grüsse
Uli

h0e · Beitrag von **h0e** » 25.02.2020, 19:11

Hallo Uli,

danke für die Erklärung für „Dummies“.
Es festigt mich aber in der Meinung, dass bei mir kein Dithering nötig ist, denn ich ändere am Ausgangssignal nichts außer der Samplerate und bei
16 Bit-Files die Bittiefe auf 24 Bit.
Ich habe keine digitale Lautstärke und auch Dein Acourate liegt hier brach, ich nutze keine Filter.
Also sollten doch keine Effekte auftreten, die ein Dithering nötig machen,
oder habe ich etwas übersehen?

In Fällen einer Veränderung des Digitalsignals durch digitale Lautstärkeregelung oder der Anwendung irgendwelcher Filter leuchtet mir das Dithering rein von der theoretischen Betrachtung schon ein.

Danke Andree, dass wir hier so schön diskutieren können,
wir sollten uns mal wieder gemeinsam vor eine Anlage setzen.
Schaust Du eigentlich beim Forumstreffen rein, ist ja nicht weit für Dich?

Grüsse Jürgen

uli.brueggemann · Beitrag von **uli.brueggemann** » 26.02.2020, 09:00

h0e hat geschrieben: ↑25.02.2020, 19:11 Also sollten doch keine Effekte auftreten, die ein Dithering nötig machen,
oder habe ich etwas übersehen?

Jürgen,

prinzipiell muss der Player dann bitperfekt spielen. Der geneigte Hörer kann da allerdings dann nicht viel tun.

Grüsse
Uli

Andree (Backes & Müller BM Prime 8)

Zufällig gegen korreliert