Immer wieder treffen wir während der Audioproduktion auf störende Latenzen, von leichten Echos bei der Gesangsaufnahme bis hin zu mehrsekündigen Verzögerungen bei großen Produktionen.
Übeltäter ist in den meisten Fällen die Ein- und Ausgangslatenz, hervorgerufen durch den Buffer des Audio Treibers. Als notwendige Schnittstelle zwischen Soundkarte und Betriebssystem sammelt dieser Zwischenspeicher alle Audiodaten, bevor sie weiter bearbeitet werden.
Die Länge der Verzögerung bestimmen die Buffersize und die eingestellte Samplerate. Ein Buffer mit 512 Samples benötigt bei 44.1 kHz ca. 11 Millisekunden für eine Füllung, ein kleinerer Buffer mit 128 Samples ist hingegen schon nach 3 ms bereit für den Weitertransport. Liegen die Daten in der doppelten Abtastrate 88.1 kHz vor, halbieren sich entsprechend die Zeiten, da der Buffer im selben Zeitraum mehr Samples erhält.
Buffer Underrun
Durch die Abhängigkeit von der Buffersize und Samplingrate, liegt es nahe im Treiber zunächst den geringsten Wert auszuwählen und die Produktion mit einem vielfachen der Grundauflösung von 44.1 kHz zu fahren, doch birgt dieser Ansatz auch Nebenwirkungen.
Geringe Latenzen sind nur möglich, wenn Hardware und Treiber diese zulassen. Ein zu geringer Zwischenspeicher führt im schlimmsten Fall zu einem Buffer Underrun, eine Situation in der entweder der Rechner oder die Soundkarte mit der Datenlast überfordert ist und dies mit hörbaren Aussetzern (Dropouts) quittiert. Je nach Rechenleistung, Qualität des Treibers, Anzahl der Spuren und verwendeten Plugins sind 512 Samples und mehr für einen reibungslosen Betrieb durchaus erforderlich.
Dass es auf der anderen Seite gar keine „Null-Latenzen“ sein müssen, sehen wir anhand alltäglicher Beispiele.
- Schall aus einem 2 Meter entfernten Gitarrenverstärker trifft beim Musiker erst nach 5 ms ein und dennoch kann er problemlos in die Saiten greifen.
- Eine Unterhaltung über 10 Meter verzögert den Schall um 29 ms und dennoch empfinden wir Sprache und Lippenbewegung als synchron.
Lediglich die eigene Stimme wird quasi unmittelbar Empfangen, wobei auch hier wenige Millisekunden Delay dem Präzedenz-Effekt zum Opfer fallen und nicht als störend gelten.
Da nicht jeder Geldbeutel ein nahezu latenzfreies Pro Tools TDM System oder eine mit DSP Power vollgestopfte RME Soundkarte erlaubt, heißt es in der Praxis „Trial and Error“. Taste Dich langsam an die optimalen Einstellungen heran und verwende im Zweifel lieber ein größeren Buffer als einen Datenverlust zu riskieren.
Direkt Monitoring
Ist die Latenz während der Aufnahme weiterhin zu groß, können wir unnötige Verzögerungen auf Kosten einer „Tape Return“ Kontrolle durch Direkt Monitoring umgehen. Bei aktivierter Funktion wird das Eingangssignal nicht erst durch den Buffer und die DAW geschickt, sondern kommt unmittelbar von der Soundkarte zum Musiker zurück.
Latenzen im Mixdown
Sind alle Aufnahmen im Kasten, können wir die Eingangslatenzen vernachlässigen und den Puffer so weit erhöhen, bis alle Spuren synchron und ohne Aussetzer abspielen. In der Praxis sollten selbst schlechte Soundkarten mit 2048 Samples jede Mischung bewältigen. Der einzige Nachteil ist die jeweils kurze Wartezeit auf die ersten Töne nachdem wir den Playbefehl erteilen.
Funktionsbedingt sorgen auch viele Effekt-Plugins für eine erhöhte Latenz. Gerade Lineare Equalizer, Pitch Shifter und Faltungshall benötigen mehrere tausend Samples als Zwischenspeicher für die Berechnung. Der eingebaute Latenzausgleich der Workstation verzögert für eine synchrone Wiedergabe die gesamte Ausgabe aller Spuren.
Fazit
Mit leistungsfähiger Hard- und Software sind störende Latenzen bei richtiger Konfiguration schnell Geschichte oder treten erst gar nicht auf. Können wir auf eine klassische „Hinterbandkontrolle“ verzichten, ermöglicht Direct Monitoring auch auf einfachen Systemen eine akzeptable Performance.