Zurück zu Grundlagen

Anna log in Digital

Dieser Artikel beschäftigt mich bereits seit zwei Jahren. Ich beginne mit der Einleitung, dann kommt etwas dazwischen und es bleibt bei der Einleitung. Ein paar Monate später, wenn etwas Zeit da ist, lese ich das Geschriebene durch und schreibe die Einleitung um. Bis wieder etwas dazwischen kommt …

Die Begriffe „Analog“ und „Digital“ sind im heutigen Sprachgebrauch sehr häufig vertreten. Doch was ist der Unterschied zwischen den beiden? Der Artikel gibt auf diese Frage als erstes eine Antwort. Danach werde ich einige grundsätzliche Probleme bei dem Weg von der analogen Welt in die digitale und zurück beschreiben. Auf die Mathematik verzichte ich dabei weitest gehend. Einige Probleme werde ich nicht beschreiben, um den Einsteiger nicht zu überfordern. Wenn dennoch ein Aspekt interessant sein sollte, einfach eine Frage unter dem Artikel stellen. Die Community hier verfügt über ein erstaunliches Fachwissen, dass nur abgerufen werden muss.

Was ist nun „ANALOG“ und was ist „DIGITAL“

Als Ausgangsbeispiel nehme ich den Kammerton „A“ in absoluter Reinform. Der Mathematiker wird diesen Ton als Sinus-Ton bezeichnen. Wenn ich diesen Kammerton „A“ sichtbar mache, sieht der Betrachter eine Welle.


Abbildung 1: Kammerton A

Was muss nun gemacht werden, damit diese Welle „digital“ wird? Nun, unsere Rechenmaschinen, sei es Computer, Smartphone oder CD-Player kennen nur das Duale-System: Nullen und Einsen, also genau zwei Zahlen. Da die Nullen und Einsen immer einen einzelnen Wert darstellen, muss aus der Welle eine Folge von einzelnen Werten werden. Dazu wird die Welle in regelmäßigem Abstand gemessen. Dabei entstehen einzelne Messwerte, von denen bekannt ist, welcher zeitliche Abstand zwischen zwei Werten besteht.


Abbildung 2: Umwandlung in Messwerte

Mit etwas guten Willen und zugekniffenen Augen ist die oben dargestellte Welle erkennbar. Die Welle wurde digitalisiert und liegt als eine Reihe von Messwerten, also Zahlen vor. Dieser Vorgang wird Analog-Digital-Umwandlung genannt. In den elektronischen Schaltungen ist der entsprechende Baustein ein Analog-Digital-Converter (ADC). Der wesentliche Unterschied zwischen einer analogen und digitalen Aufnahme ist: Bei der digitalen Aufnahme fehlt die Information zwischen zwei Messpunkten.


Abbildung 3: Zu selten gemessen

Wie in der Abbildung 3 zu sehen ist, reicht die Anzahl der Messpunkte nicht aus, um die ursprüngliche Wellenform zu rekonstruieren. Der Abstand zwischen den Messpunkten wird kleiner, wenn öfter gemessen wird. Die Frage ist nun, wie oft muss mindestens gemessen werden?

Um diese Frage zu beantworten, haben zwei Mathematiker folgendes Theorem aufgestellt: Die Abtastfrequenz muss doppelt so hoch sein wie die zu messende Frequenz. (Wer sich für die dahinter stehende Mathematik interessiert, der kann diese in Wikipedia unter Nyquist-Shannon-Abtasttheorem nachvollziehen.)

Der Abstand zwischen den Messpunkten ist ein Zeitwert. Der Kehrwert des Zeitwerts ist die Frequenz. Beispiel: Die Messung des Werts der Welle findet alle 0,0011 Sekunden statt. Dies entspricht einer Abtastfrequenz von 909 Hz. Damit kann der Kammerton A gemessen werden, weil diese Abtastfrequenz mehr als doppelt so groß ist wie die Frequenz des Kammertons A (diese liegt bei 440 Hz). Die nun interessante Frage ist, was kann passieren, wenn die Abtastfrequenz viel zu klein ist. Das nachfolgende Bild aus Wikipedia zeigt das sehr eindrucksvoll:


Abbildung 4: Aliasing Effekt

Der Ton (schwarze Linie) wird mit zu wenig Messpunkten (Abtastfrequenz zu klein) in digitale Messwerte gewandelt. Hierbei entsteht ein wesentlich tieferer Ton (rote Linie), der in der Wirklichkeit nicht vorhanden war. Es wird also eine Fehlinformation oder besser geschrieben, Fehler bei der Umwandlung erzeugt. Wie kann dieser Fehler vermieden werden?

Es gibt nun zwei Möglichkeiten:

1. Öfter messen also die Abtastfrequenz erhöhen
2. Einen Tiefpassfilter vor den Messgeräten einfügen

In der Praxis werden beide Möglichkeiten angewendet. Der Tiefpassfilter begrenzt die maximale Tonfrequenz auf z.B. 20 000 Hz. Da jeder Tiefpassfilter langsam wirkt und auch z.B. 21 000 Hz abgeschwächt durchlassen kann, wird passend auch die Abtastfrequenz erhöht. So wird für die CD-Qualität eine Abtastfrequenz von 44 100 Hz verwendet.

Bisher bin ich in den Erklärungen von einer idealen Welt ausgegangen. Doch die Wirklichkeit ist leider nicht so perfekt, wie die Theorie es fordert. Der zeitliche Abstand zwischen zwei Messungen variiert ein wenig mehr (oder weniger). Somit muss im Diagramm statt eines Punktes eher etwas Flaches, Längliches verwendet werden.

Ein weiterer Punkt ist, dass unser Messapparat auch nicht wirklich exakt misst. Das Flache, Längliche wird nun zusätzlich um den Fehler der Messapparatur in die Höhe gezogen. Es sind keine Messpunkte, sondern Mess-Rechtecke, wobei die Wahrheit irgendwo im Rechteck liegt.

Jetzt hat der Messapparat technisch bedingt auch noch ein bestimmtes Auflösungsvermögen. Da die Messung einen digitalen Wert erzeugt, wird der Messwert in Stufen erfasst. Die Anzahl der Stufen hängt vom verwendeten Umwandlungsverfahren und der Qualität des Messbausteins (AD Wandler) ab. Ein AD Wandler mit 8 Bit Auflösung kann 256 verschiedene Stufen liefern. Ein AD Wandler mit 16 Bit Auflösung kann 65.536 Stufen liefern. Ein AD Wandler mit 24Bit Auflösung kann 16.777.216 Stufen liefern. Je mehr Stufen zur Verfügung stehen, um so flacher wird das Rechteck. Mit zunehmender Anzahl der Stufen, dauert die Messung länger und die Anforderungen an die Qualität der Mess-Schaltung steigen, damit die Messung nur das zu messende Signal (Welle) erfasst und nicht noch zusätzliches Rauschen oder andere Störsignale. Einfache Merkformel: Mehr Auflösung verlangsamt die Messung und steigert die Kosten für den Messapparat (hier AD-Wandler plus zugehörige Beschaltung).


Abbildung 5: “echte” digitale Messpunkte

Zum einen ist die Breite abhängig davon, wie gut die Uhr funktioniert, die den Takt für die Messungen angibt (Abtastfrequenz). Zum anderen, wie viele Mess-Stufen zur Verfügung stehen.

Wer jetzt die Abbildung 1 mit der Abbildung 5 vergleicht, dem fällt auf, dass in den Verlauf der Klötzchen, recht viele dünne Wellenlinien durch jedes Kästchen passen. Das Besondere ist in jedem Kästchen, kann die Linie mal mehr links oder rechts bzw. mehr oben oder unten durchgehen. Das Ergebnis wäre keine gerade Linie, sondern etwas irgendwie Gezacktes. Wer sich für die Auswirkung der Anzahl der Stufen interessiert, holt sich weitere Informationen in Wikipedia zum Thema „Quantisierungsfehler“.

Bei der Reise von Analog nach Digital habe ich jetzt die wichtigsten Herausforderungen beschrieben:

1. Ausreichende Abtastfrequenz
2. Auflösungsvermögen

Der Zusammenhang zwischen den beiden Größen ist: Höhere Abtastfrequenz lässt weniger Zeit zum Messen, was wiederrum das Auflösungsvermögen begrenzt bzw. teure technische Verfahren zu Messung erfordert. Je mehr gemessen wird, desto größer ist der Bedarf an Speicherplatz. Dies ist heute kein Problem, war jedoch eine Herausforderung bei der Entwicklung der CD. Es bringt jedoch nichts, wenn altes, digitales Material auf höhere Abtastfrequenz oder Auflösung hoch gerechnet wird. Es wird nicht mehr Information erzeugt als vorher da war. (Wer hat nicht schon mal versucht ein 640×480 Pixel großes Bild auf 4k Format hoch zu rechnen?) Wer sich mehr mit der Materie befassen möchte, dem Hilft zum Einstig der Artikel „Analog-Digital-Umsetzer“ in Wikipedia.

Bessere Aufnahme mit Analog?

Die analogen Verfahren haben ihre eigenen Probleme: Rauschen, Informationsverlust beim Kopieren, Verzerrungen usw. In der Musikproduktion werden mehrere Aufnahmespuren zusammengefügt und gemischt, dies lässt sich deutlich leichter mit dem PC erledigen als mit mehreren Tonbandgeräten. Die Qualität der Aufnahme hängt zudem von der Fähigkeit und Erfahrung vieler Menschen ab (vom Toningenieur bei der Aufnahme bis zum Mastering für die Produktion). Das eingesetzte Verfahren ist nur so gut, wie der Bediener es beherrscht.

Und nun die Reise zurück

Die Musik liegt als digitale Information vor: Vielleicht als CD, Stream oder Datei. In jedem Fall sind die Nullen und Einsen in einem vorher festgelegten Format abgelegt. Das bekannteste Format ist MP3, bei dem die Aufnahmedaten zusätzlich bearbeitet werden und die „unnötigen“ Anteile der Musik entfernt werden. MP3 gehört zu den Datei- oder Streamingformaten bei denen eine verlustbehaftete Komprimierung stattgefunden hat. Sie hilft, den benötigten Speicherplatz oder die benötigte Bandbreite (bei Streaming) klein zu halten. Ein ebenfalls weit verbreitetes Format ist FLAC. Hier findet auch eine Komprimierung statt, diese ist jedoch verlustfrei. Es wird die gesamte, vorhandene Information gespeichert.

Unabhängig vom verwendeten Format müssen die Musikdaten für den Digital-Analog-Umsetzer in eine jeweils vorgegebene Folge von digitalen Werten umgewandelt werden. Dafür ist die Software des Abspielgeräts (CD Player, Netzwerkplayer, Smartphone App usw.) verantwortlich. Die Software kann die Musikdaten bei der Umwandlung, beabsichtigt oder unbeabsichtigt, verändern.

Wie wird nun aus den übertragenen Nullen und Einsen wieder etwas Analoges?

Der Digital-Analog-Umsetzer (oder Digital-Analog-Converter kurz DAC) erzeugt aus den digitalen Werten ein entsprechendes Ausgangssignal. Das Ausgangssignal ist eine Spannung, die dem gespeicherten digitalen Wert entspricht. Da der digitale Wert keinen Bezugspunkt für die Spannung kennt, wird bei der Umsetzung eine Referenzspannung benötigt. Diese Spannung baut der Digital-Analog-Umsetzer mit Hilfe der Referenzspannung. Je nach technischer Umsetzung des DAC-Bausteins kann die Referenzspannung im Baustein selbst aus der Versorgungspannung erzeugt werden oder die Referenzspannung wird extern erzeugt und dem Baustein bereit gestellt. Aus dem vorliegenden Wert erzeugt der Umsetzer eine Spannung. Diese Spannung wird die gleiche Zeitspanne gehalten, wie bei der Aufnahme der zeitliche Abstand zwischen zwei Messpunkten war. Die Abbildung 6 zeigt das Ergebnis der Umsetzung – es unterscheidet sich stark vom Ausgangssignal den Kammerton A in der Abbildung 1


Abbildung 6: Erstes erzeugtes Signal


Abbildung 7: Vergleich Kammerton A in ROT mit der ersten Umsetzung der digitalen Werte in BLAU

Auf der Abbildung 7 ist hier der Verlust der Information zwischen den Messpunkten gut zu erkennen. Die fehlende Information muss der DAC nun geschickt „erraten“ oder wie der Fachmann schreibt „interpolieren“. Es gibt im Audio-Bereich dazu zwei sehr bekannte Verfahren:

1. Oversampling
2. Delta-Sigma-Modulation (oder 1-Bit-Wandler)

Der Artikel geht nicht auf die Verfahren ein. Wer Interessiert ist, wie der DAC das Ratespiel gestaltet, der schaut in Wikipedia nach.

Nach der Interpolation werden die Stufen kleiner, ergeben jedoch noch keine glatte Linie. Dieses wird mit passenden Ausgangsfiltern (integriert oder extern) erreicht.

DAC „Klang“

Die Interpolation oder das Raten der Zwischenstellen führt dazu, dass jeder Hersteller seine eigene elektronische, orakelnde Schaltung im DAC hat. Die Art der Interpolation und die Gestaltung der Ausgangsfilter beeinflusst das Ausgangs-Signal: Die Musik. Wenn das vorliegende Musik-Material bereits in hoher Auflösung aufgenommen wurde (z.B. Abtastfrequenz 96 000Hz und in 24Bit Stufenauflösung) muss der DAC weniger große Stücke „raten“. Daher kann das Ergebnis der Wandlung näher an das Original kommen.

Einige Anbieter haben damit begonnen, altes, in CD Qualität vorhandenes Material (Abtastfrequenz 44 100 Hz und Auflösung 16 Bit) hoch zu rechnen. Je nach der Interpolationsqualität und der Qualität des Ratens beim verwendeten DAC im Abspielgerät, kann damit eine sehr subjektive Klangverbesserung erzielt werden. Dies bedeutet jedoch nicht, dass die Musik näher am Original ist.

Tipps für die DIY Praxis

Nach der Theorie folgen ein paar praktische Tipps für den Selbstfrickler, der seinen Digital-Analog-Umsetzer in einem DIY Netzwerkplayer möglichst optimal einsetzen möchte. Der Einsatz der Tipps erfordert ein wenig gesunden Menschenverstand. Ich würde kein externes Netzteil für 80 Euro einsetzen, wenn die DAC Platine selbst vielleicht im Einkauf 10 Euro gekostet hat.

Chip vs. Gesamtpaket

Der DAC ist elektronischer Baustein, der je nach Spezifikation mehr oder weniger andere externe Bauteile erfordert, damit es mit der Wandlung funktioniert. Hier kommt es auf die Erfahrung des Entwicklers bzw. Entwickler-Teams an, wie das Gesamtpaket dem Zuhörer gefällt. Es ist dabei wie in der Küche: Ein schlechter Koch kann das beste Steak-Fleisch ruinieren, ein guter Koch holt selbst aus mittelmäßigen Fleisch ein sehr leckeres Ergebnis heraus. Sprich der beste DAC Chip bringt nix, wenn Stümper diesen in eine unpassende Beschaltung gezwängt haben.


Abbildung 8: “curryman DAC” mit zwei Spannungsversorgungen (Analog und Digital + Filter um RaspberryPi Einstreuungen auf DAC zu unterbinden)

Auf der Abbildung 8 ist ein „einfacher“ DAC Baustein: ES9023 verbaut. Der Entwickler hat mit zusätzlichen Zeitgebern und einem J-FET basierten Audio-Buffer sowie aufwändiger Stromversorgung, das Maximum aus dem Baustein herausgeholt.

Spannungsversorgung

Wie bereits geschrieben, die Referenzspannung des DACs bildet den Bezugspunkt für die Erzeugung des Ausgangssignals. Was passiert nun, wenn die Referenzspannung anfängt zu „wackeln“? Das gesamte Ausgangssignal wackelt mit, Verzerrungen, fehlende Räumlichkeit oder sogar Mangel an Dynamik können die Folge sein. Die Methoden, um die Referenzspannung sauber zu halten, sind folgende:

1. Zusätzliche Spannungsregler-Bausteine auf der DAC Platine verwenden
2. „Saubere“ Gleichspannung für den DAC verwenden


Abbildung 9: Auf dem Produkt der Schweizer Entwickler sitzt unscheinbar der kleine Chip (im blauen Kreis) neben dem DAC.

Der Spannungsregler kann kleinere Störungen aus der Versorgungsspannung ausgleichen. Er ist jedoch machtlos, wenn ein Steckernetzteil, wie in Abbildung 10 zu sehen ist, ca. 0.5V nicht nur wackelt, sondern etwas “Ungleichmäßiges“ liefert. Da hilft auch kein zusätzlicher Puffer (roter Kreis).


Abbildung 10: Preiswertes 1,5A USB Netzteil.

Mit einem linearen Netzteil sieht es auf dem Oszilloskop nicht nur besser aus, es klingt auch deutlich besser.


Abbildung 11: Innenansicht lineares Netzteil der Firma Tomanek: solide und langlebig aufgebaut


Abbildung 12: Gemessene Spannung im Betrieb mit RaspberryPi 3 und HiFiBerry DAC+ Pro. Harmloses Rauschen

Abschlussbemerkung

Es gibt noch viele weitere Faktoren die eine Rolle spielen (z.B. Quantisierungsrauschen, Empfindlichkeitsfehler usw.), auf die ich im Artikel nicht eingegangen bin. Der Artikel ist nur zum Einstieg gedacht. Wer sich also für das Thema interessiert, kann sich im ersten Schritt den weiterführenden Links in Wikipedia widmen. Wer jetzt eine Empfehlung zum Chip XY vom Hersteller Z vermisst, so ist dies gewollt. Das Gesamtpaket für den jeweiligen Einsatzzweck ist hier das Maß der Dinge. Wer seine Küche mit Hintergrundgeräusch versorgen will, der wird sich mit einer recht einfach gestrickten DAC-Platine zufrieden geben. Der Suchende nach dem Heiligen Gral des universellen Wohlklangs wird immer wieder seine Suche mit verschiedenen DACs fortsetzen. Jedem das Seine!

Peter Gawrych aka Rincewind

Permanentlink zu diesem Beitrag: https://www.acoustic-design-magazin.de/grundlagen/anna-log-in-digital/