Übersteuerung in einer mp3 - wie ist das möglich?

Laut meinem Kenntsniss-Stand wird als maximaler Peak für den Export empfohlen:
-0.3dBfs wenn das Endprodukt eine Wav ist
-1.0dBfs wenn das Endrodukt eine mp3 ist.

Bitte belegen. Danke.

Das Video ist wirklich klasse, wenn man Digitalisierung, Quantisierung, Dithering und Noiseshaping verstehen will. Und vor allem: Es beweist alle Behauptungen durch Experimente.

Zu Deinen Fragen habe ich einige Experimente durchgeführt:

In Cubase habe ich in eine Audiospur eingefügt:

1: Testgenerator von Cubase
2: Softclipper von Cubase
3: ein Loudnessmeter mit True Peak Anzeige (TB-EBU Loudness) - hier kann man natürlich auch das Loudnessmeter von Cubase benutzen. Wichtig ist, dass es mit 4 fachem Oversampling misst, also 16 Zwischenwerte abbilden kann.
4. Zur Kontrolle noch ein Multiscope von Cubase (Oszilloskop)

Am Testgenerator habe ich einen Sinuston von 10 kHz und 0 dB (RMS!)Pegel eingestellt.
Das Cubasemeter steht auf Digital Scale:
Der im Generator einstellbare Pegel ist ein RMS-Pegel, deshalb muss man den Kanalfader auf + 3dB stellen, um 0 dB FS zu erhalten.

Ohne Softclipper:

a) Normale Peakanzeige (PP): 0 dB, True Peakanzeige (TP): +0,2 dB. Also zeigen sich hier schon die Interleaved Sample Peaks.
Das, was ich erwartet habe, denn bei 10 kHz hat man nur 2 Samplepunkte pro Schwingung zur Verfügung. Das kann nahe 0 dB kritisch werden. Das sieht man auch an der Oszilloskopanzeige. Man sieht, wie die Samplepunkte durchwandern, die Kurve ein bisschen hin- und herwobbelt, weil die Samplefrequenz kein ganzzahliges Vielfaches der Testtonfrequenz ist. Da dürften mittelmäßige Wandler Schwierigkeiten haben, den Sinus unverzerrt zu reproduzieren.

b) Mit Softclipper (eingestellt auf 100 % für 2. und 3. Oberwelle):
PP: -0,1 dB! TP: +0,7 dB. Auch zu erwarten. Mindestens die zweite Oberwelle fällt noch in den abbildbaren Frequenzbereich (bei 44,1 kHz Samplingrate ) bis etwas über 20 kHz. Es wird also für den Wandler immer schwieriger, die Frequenz analog abzubilden, wenn der Pegel nahe bei 0 dB FS liegt. Überschießer sind zwangsweise zu erwarten.

Die Ergebnisse mit einem Rechtecksignal waren identisch.

Bei einer Frequenz von 1 kHz sind die Ergebnisse allerdings widersprüchlich:

a) Sinus ohne Softclipper: PP: 0 dB, TP: 0 dB.
Mögliche Erklärung: Wahrscheinlich genügt bei 1 KHz die Sampelauflösung von (bei mir) 44,1 kHz, um die Sinuswelle auch bei 0 dB noch akurat darzustellen.

b) Sinus mit Softclipper: PP: -0,1 dB, TP: -0,1 dB!
Mögliche Erklärung: Der Softclipper nimmt Energie aus der Hauptfrequenz und verteilt sie auf die Oberwellen. Deshalb sinkt der Peakpegel etwas. Sieht man auch sehr schön an der Oszilloskopanzeige. Auch hier ist das Verhältnis Sampleauflösung/Testtonfrequenz mit rund 44:1 verhältnismäßig hoch, sodass auch die geclippte Welle akurat dargestellt werden kann.

c) Rechteck ohne Softclipper: PP: 0 dB, TP: +2,1 dB! Das war zu erwarten, weil die Rechteckwelle zahlreiche Oberschwingungen bis hinauf zur Hörgrenze hat.

d) Rechteck mit Softclipper: PP: -0,4 dB, TP: +1,5 dB. Die Rechteckwelle ist bereits maximal verzerrt und kann durch den Clipper gar nicht mehr verschlechtert werden.

Dennoch zeigt letzteres Beispiel: Bei kritischen Material (Rechteckwelle, sehr höhenreiche Musik) reicht ein Headroom auf dem normalen Peakmeter von -0,3 dB nicht aus, um Interleaved Sample Peaks zu vermeiden!

Die 0dB werden durch intersample peaks verursacht.
Wurde hier ja schon besprochen.
Dies kann man in der Wellenform sehen, indem man 2 Samples hintereinander auf den maximalen 16Bit positivwert oder negativwert der digitalen Wellenform vorfindet.

Je nachdem was davor passiert ist, kommen durch den Rekursionstiefpass im DA Wandler Überschwinger über die 0dB Marke am Ausgang des DA Wandlers zustande.

Nun hängt es davon ab wie viel Headroom der DA Wandler hat.
Die meisten Geräte haben heute DA Wandler, die keine Probleme mit Intersample Peaks haben.
Ich behaupte mal das alle MP3 Abspieler die heute Produziert werden keine Probleme damit haben , da die heutige Chartsmusik voll von intersample Peaks ist.

Ich hatte vor ca 12 Jahren allerdings eine Soundkarte (EWS 64), die damit echte Schwierigkeiten hatte.
Bei Intersample Peaks traten sofort heftigstes Clipping und sehr starke Verzerrungen auf.

Ihr könnt mal selber versuche durchführen.
Ich habe das bereits getan und schere mich nicht mehr um Intersample Peaks :wink:

Richtig. Gute Wandler haben keine Probleme damit. Allerdings ist dabei zu bedenken:

  1. Datenduziertes Material wie mp3 reagiert viel kritischer als verlustloses Material. Ich zitiere mal den Toningenieur und Mastering-Experten Friedemann Tischmeyer:

Audiodateien, die datenreduziert werden sollen (mp3, ac3, dts usw.), benötigen zusätzlichen Headroom nach der Grundregel: Je höher der Kompressionsgrad, desto höher der nötige Headroom!
Quelle: > http://www.delamar.de

  1. Ich wage zu bezweifeln, dass die Wandler in billigen Smartphones oder älteren MP3-Playern gut genug sind, um Interleaved Sample Peaks von einigen dB verzerrungsfrei abzubilden. Letztlich ist das aber nicht zu klären ohne Messungen an allen möglichen Geräten.
  2. Dass die heutige Chartmusik voll von Interleaved Sample Peaks sind, ist ja kein Qualitätskriterium.
  3. Als Produzent sollte man auch die weniger guten Consumergeräte und deren Mängel berücksichtigen, die Wandler also nicht überfordern. Dazu reicht es, ein halbes bis 1 dB leiser zu mastern, was immer noch konkurrenzfähig ist - obwohl der Begriff “konkurrenzfähige Loudness” meines Erachtens sowieso vielfach falsch verstanden wird. Doch das ist ein anderes Thema.

Edit: Ich habe mal ein bisschen gesurft und gerade einen Hi-End-DAC gefunden, der sich rühmt, einen Headroom von 3,5 dB für für intersample overs zu haben. Das Teil kostetüber 2500 $:

Friedemann Tischmeyers Aussagen stehe ich zum teil sehr kritisch gegenüber.

Ich konnte noch bei keinem aktuellen Smartphone (mit Headphones) /MP3 player wirklich störende Verzerrungen wahrnehmen.
Ich habe das mit Chartmaterial getestet bei dem ich wusste das es Intersample Peaks hatte.

Also immer mal selber testen und nicht auf die Aussagen von anderen verlassen!
Der Test ist nun wirklich nicht schwierig!

Ich muss mich selbst in einem Punkt korrigieren. Meine früheren Aussagen waren möglicherweise missverständlich:

  1. Alles, was ich über Interleaved Sample Peaks geschrieben habe, ist meiner Meinung nach korrekt (wenn auch etwas vereinfacht dargestellt). Es erklärt, warum nicht datenreduziertes Audiomaterial, das auf der digitalen Ebene einen Pegel von 0 dB FS oder knapp darunter hat, nach der Rückwandlung in ein analoges Signal möglicherweise verzerrt dargestellt wird (hängt von der Qualität des Wandlers und von der Höhe des Intersample Overs ab).

  2. Die Frage von Stefan Franz war aber, warum ein gekauftes MP3-File als übersteuert angezeigt wird. Interleaved Sample Peaks des nicht datenkomprimierten Ausgangsmaterials können dafür mit verantwortlich sein, sind aber nicht die einzige Ursache. Generell kann der Prozess der Konvertierung selbst Clipping erzeugen, auch wenn das Ausgangsmaterial unter 0 dB ausgesteuert ist. Ich bin da kein Experte, aber ich habe gelesen, dass das durch den Codierungsprozess zugefügte Quantisierungsrauschen den Pegel mimimal erhöht.

Im Prinzip stimme ich Dir da zu. Ich glaube auch, dass der Effekt für die meisten Ohren kaum zu hören ist. Das Problem ist ja, dass einem der Vergleich zum korrekt ausgesteuerten Signal fehlt. Unsere Ohren sind auch durch die aktuellen Produktionstechniken so an Verzerrungen gewöhnt, dass wir sie gar nicht immer als unangenehm wahrnehmen. Um Unterschiede zu hören, müsste man wirklich einen Hi-End-Sampler mit einem Smartphone vergleichen. Möglich, dass dann trotzdem nur die Minderheit der User einen Klangunterschied hören würde.
Viel schlimmer finde ich, und das hat mit Interleaved Sample Peaks jetzt gar nichts zu tun, dass viele aktuelle Produktionen so viele 0 dB Samples hintereinander haben, dass die Schwingung fast schon Rechteck-Charakter hat, und das hört man. Ein Beispiel ist die erste Version von Death Magnetic von Metallica. Eine große Zahl der Fans, die einiges an Verzerrungen gewöhnt sind, fand das Album zu harsch klingend. Deshalb haben sie ja auch eine audiophile Version nachgeschoben. Aber das ist eine andere Baustelle.

Na in einer floating point Umgebung eben.







Da hast Du recht, das gilt innerhalb der DAW, aber nicht mehr, sobald man wandelt. Und das war natürlich gemeint.

Das ist jetzt aber ein extremes Beispiel :smiley: !
Als mir das damals bei Erscheinung mein bester Freund (eingefleischter Metallica Fan) vorgespielt hatte dachte ich nur WTF da hatte aber jemand kaputte Ohren…er selbst dachte die CD wäre kaputt :wink:
Metallica wollte damals vom Mastering diesen Trash Sound!