4. Holofonie

 

Soweit eng benachbarte Lautsprecher alle Wände des Wiedergaberaumes vollständig bedecken würden, könnte mittels Wellenfeldsynthese der Schalldruck und die Schallschnelle eines beliebigen Schallfeldes an jedem Punkt im Inneren des Raumes wiedergestellt werden. Das ist mit dem Kirchhoff-Helmholtz-Integral nachweisbar. Doch neben dem Aufwand würde im Heimkinobereich der Akzeptanzfaktor den Erfolg dieses Konzeptes verhindern.

Dieses Kapitel beschreibt einen anderen Weg, der die Reduktion des Verfahrens auf die horizontale Ebene überwindet, obwohl sich die Schallwandler weitgehend unsichtbar in das Heimkino einfügen. Sie sind allein hinter der Leinwand angeordnet. Vergleichbar den bekannten Sound-Projektoren, die durch Reflexionen der Wiedergaberaum Wände Lautsprecher simulieren, täuscht dieser WFS- Lautsprecherschirm die Reflexionen der Schallquelle selbst im Aufnahmeraum durch Reflexionen der Wände im Wiedergaberaum vor. Das ist in dieser Animation dargestellt:

4.1 Nahfeld und "akustischer Vorhang"

Die Akustik des Wiedergaberaumes verändert ungewollt die Wahrnehmung. Neben dem Tragen von Kopfhörern oder Leben im schalltoten Raum, bleibt allein die Nahfeld- Wiedergabe, um diesen störenden Einfluss zu reduzieren. Dafür gibt es zwei Möglichkeiten. Entweder die Lautsprecher sind nah am Zuhörer, oder die abstrahlende Membranfläche ist sehr groß. Abhängig von Bündelungsgrad der Lautsprecher und Nachhallzeit des Wiedergabe Raumes, überschreitet der Pegel der Wiedergaberaum Reflexionen den direkt abgestrahlten Schall unter normalen Wohnverhältnissen in weniger als einem Meter Abstand vom Lautsprecher. Um einen drei Meter entfernten Zuhörer in das Nahfeld einzubeziehen, wäre ein Membrandurchmesser von mindestens 1, 5 Meter notwendig.

Das ist unmöglich für einen einzelnen Lautsprecher. Doch bei Wellenfeldsynthese arbeiten viele Lautsprecher als Einheit. In einer ebenen Fläche angeordnet, realisiert ein solcher Lautsprecherschirm das bekannte Prinzip des akustischen Vorhanges. Mehr als ein halbes Jahrhundert ist es her, als diese Lösung ein Traum einiger Erfinder war. Mit der Wellenfeldsynthese wird der Ansatz nun realisierbar:

Jede der Membranauslenkungen in einem solchen Lautsprecherfeld ist aus der Distanz zu dem virtuellen Ausgangspunkt der Wellenfront einfach zu berechnen. Die Krümmung der sich dabei ergebenden, gemeinsamen Membran ist nur abhängig von dieser Position und von der Signalfrequenz. In dem Beispiel befindet sich eine 440Hz abstrahlende, virtuelle Quelle in 3 Meter Abstand hinter der Lautsprecheranordnung aus 48x27 Einzeln angesteuerten Strahlern:

Bei abnehmenden Frequenzen verschwindet die Krümmung, alle Lautsprecher führen zusammen eine Kolbenbewegung aus. Bei zwei Zoll Abstand zwischen den 1296 Wandlern in einer solchen Schallwand hätte die resultierende Membran eine Größe von 2,43m x 1,38 m. Daher sind alle Zuhörer Positionen im Heimkino im Nahfeld. Leider können wir nicht den Abstand zwischen den einzelnen Lautsprechern vergrößern. Dann würden Spatial Aliasing-Effekte auftreten. Ihre Stärke ist Abhängig vom Ein- und Ausfallswinkel der Wellenfront in Bezug auf die strahlende Fläche, sie entstehen oberhalb dieser Frequenz:

Zum Beispiel tritt bei 30 Grad-Winkelunterschied Aliasing oberhalb von 13,5 kHz auf, wenn die Lautsprecher zwei Zoll voneinander getrennt montiert sind. Das ist ein akzeptabler Wert. Es ist bekannt, dass unsere Wahrnehmung nicht sehr empfindlich in Bezug auf räumliche Aliasingeffekte ist. Von technischer Sicht wäre ein solches Feld werden heute machbar, einige bestehende WFS-Setups enthalten bereits eine vergleichbare Anzahl von Lautsprechern. Eigentlich geht die Entwicklung schon hin zu solchen "sprechenden Leinwänden". Die Spiegelschallquellen der ersten Reflexionen im Wiedergaberaum werden dann kaum noch mit Energie versorgt, wegen der extrem gerichteten Strahlung einer so großen resultierenden Membran. Weil die ersten Reflexionen die Quelle für die Entstehung der zweiten Reflexionen sind, und so weiter, wird sich auch die Nachhallzeit deutlich verringern. Alles in allem, wird der störende Einfluss der Wiedergaberaumakustik erheblich reduziert sein. Der Aufwand für ihre Bedämpfung kann entfallen, oder zumindest deutlich reduziert werden.

4.2 Subtraktion der Wiedergaberaumakustik

Wie bereits erwähnt, bietet die Wellenfeldsynthese im Gegensatz zu den herkömmlichen Verfahren separaten Zugriff auf jede einzelne Komponente des Signals. Kein anderes Verfahren ist in der Lage, bei der Wiedergabe direkte Welle, erste Reflexionen und Nachhall in einer anderen Weise zu manipulieren. Alle herkömmlichen Verfahren verschmelzen alle Komponenten bereits während der Aufzeichnung untrennbar. Dank dieses Vorteils eröffnet die Wellenfeldsynthese völlig neue Möglichkeiten für die Beseitigung Hauptprobleme der Audio-Wiedergabe.

Für die Nutzung dieses Vorteils müssen wir einen neuen Systemansatz sehen. Traditionell beginnt die Übertragungskette am Mikrofon und endet am Lautsprecher. Doch die deutlichsten Veränderungen erfährt das Signal, wenn die Lautsprecher ihre Arbeit getan haben. Für die korrekte Wiedergabe ist es deshalb unerlässlich, die akustischen Eigenschaften Wiedergaberaumes in den Systemansatz einzubeziehen. Das beschriebene Holofonie- Verfahren zielt nicht darauf ab, perfekte Signale in den Lautsprechern zu erzeugen. Endpunkt der Übertragungskette ist der Zuhörer selbst. An seinen Ohren müssen wir die gleichen Verhältnisse schaffen, die auch an den Ohren Zuhörers im Aufnahmeraum entstehen würden. Dazu müssen wir nicht wirklich einen Zuhörer in den Aufnahmeraum setzen. Wir müssen nur eine dezidierte Position festlegen, die er dort einnehmen könnte. Das verändert alles. Wir müssen dann die Wiedergaberaumakustik nicht mehr mit viel Aufwand unterdrücken. Sie wird zum, zuweilen sogar nützlichen Glied in dieser Übertragungskette.

Ungleiche Umwege zwischen Aufnahme- und Wiedergaberaum werden dann bei der Synthese ausgeglichen. Das geschieht getrennt für jede Wellenfront und wird nur möglich, weil das Verfahren den separaten Zugriff auf jede einzelne Komponente erlaubt. Differenziert für jede dieser Signalkomponenten und für jede der reflektierenden Oberflächen, wird der Zeitpunkt für die Synthese und die jeweilige Amplitude des Signalanteils bestimmt. Im Ergebnis entsteht ein kongruentes Signal an der Position des virtuellen Zuhörers im Aufnahmeraum und bei dem realen Zuhörer im Heimkino. Er wird seine zusätzliche Wiedergabe Raumakustik nicht mehr wahrnehmen. Sie ist bei der Synthese für die direkte Welle und die ersten Reflexionen subtrahiert worden.

Für eine solch überschaubare Anzahl von Ausgangspunkten können wir die Verzögerungszeiten und Pegel für jeden einzelnen Lautsprecher in einem einfachen Modell, selbst in normalen Heimcomputern fast in Echtzeit berechnen. Dabei ist es möglich, die Ausgangspunkte der Wellenfronten zu verschieben, ohne dass sich der Pegel an der definierten Zuhörerposition ändert. Weil alle Wege bekannt sind, lässt sich die Korrektur leicht bestimmen. Das führt dann aber zu einer veränderten Ankunftszeit der Wellenfront beim Zuhörer. Wird der virtuelle Ausgangspunkt von ihm weg verschoben, kommt die Wellenfront später an. Nur auf die ersten Reflexionen angewendet, wird der wahrgenommene Raum größer. Wird die direkte Welle erst erzeugt, wenn ihre eigenen Reflexionen schon auf dem Weg sind, so werden wir einen Raum wahrnehmen der kleiner ist als unser Heimkino selbst. Diese Wahrnehmung wird dann dadurch unterstützt, dass die gerichtete Abstrahlung nur wenig Nachhall erzeugt. Für das gemeinsame Modell müssen Aufnahme-und Wiedergaberaumgeometrie und die Reflexionsfaktoren bekannt sein. Die Eigenschaften des Wiedergaberaumes werden bei der Installation der Lautsprecherwand gespeichert. Die Aufnahmeraum Daten können zu Beginn der Signalübertragung übermittelt oder aus gespeicherten Bibliotheken abgerufen werden. Wesentlich ist bei dem Verfahren, das die Standard- Zuhörerposition im Wiedergaberaum und mit der virtuellen Zuhörerposition im Aufnahmeraum zur Deckung gebracht wird. Damit entsteht das gemeinsame Modell. Dies ist der Kern des Patentes DE 10 2005 001 395. Es besteht kein anderer Weg, um übereinstimmende Signale an den beiden Positionen zu erzeugen. Bei den herkömmlichen Methoden, einschließlich der allgemein bekannten Wellenfeldsynthese, gibt es keine dedizierte Position für einen virtuellen Zuhörer im Aufnahmeraum. Wie wichtig sie ist, wird in der nächsten Skizze deutlich. Der äußere Raum ist der Aufnahme Raum,innen ist das Heimkino (3b) dargestellt. In der Mitte liegt die gemeinsame Zuhörer Position (3i):

 

Die direkte Welle der Quelle (3c) selbst, wird durch den frontalen "akustischen Vorhang" nahezu perfekt restauriert. Die Spiegelschallquelle der Aufnahmeraum Decke, hier Beispielhaft dargestellt, liegt außerhalb dieses Bereichs. Wir können sie deshalb nicht direkt abstrahlen. Allerdings, wenn ihre Position in einem ersten Schritt auf einer Kreisbahn um die gemeinsame Zuhörerposition in den Bereich, in dem sich das Lautsprecherfeld selbst an der Decke spiegelt, verschoben wird, entsteht eine Möglichkeit. Dann können wir die Deckenreflexion des Wiedergaberaumes missbrauchen, um die Reflexion der Aufnahmeraumdecke vorzutäuschen. Die geometrische Spiegelung der verschobenen Quellposition Wiedergaberaum Decke liefert den endgültigen Ausgangspunkt (4b).Nun ist die Berechnung der Laufzeiten und Pegel für die einzelnen Lautsprecher einfach, in diesem Modell. Nur der Abstand zu dem betreffenden Lautsprecher bestimmt die Verzögerungszeit und den Pegel, mit dem das zugehörige Quellsignal wiedergegeben wird. Die Animation zeigt beispielhaft nur die Wiederherstellung der wahrgenommenen Höhe des Aufnahmeraumes. Die entsprechende Anwendung des Verfahrens auf alle wichtigen Reflexionsflächen lässt den gesamten Aufnahmeraum wieder in seiner ursprünglichen Gösse entstehen.

4.3 Die Kombination von Modellbasierenden und Datenbasierenden Ansatz

Das beschriebene, gemeinsame Modell wird nur für die direkte Welle und ihre ersten Reflexionen anwendbar sein. Alle Reflexionen so zu berechnen, dürfte selbst die Möglichkeiten der modernsten Rechner überschreiten. Aber, das ist auch nicht notwendig. Wie im zweiten Kapitel mit dem Modell der verschneiten Winterwiese geklärt wurde, ändern nur die Ausgangspunkte der direkten Welle und ihrer ersten Reflexionen deutlich ihre relative Position zum Zuhörer, wenn der sich im Aufnahmeraum bewegt. Zu den weiter entfernten Ausgangspunkten der späteren Reflexionen bleiben relativer Abstand und Einfallswinkel nahezu unverändert. Deshalb kann eine Kombination aus dem beschriebenen modellbasierenden Ansatz mit der datenbasierenden, also auf der Faltung in Impulsantworten beruhenden, Vorgehensweise, wie sie allgemein bei der Wellenfeldsynthese angewendet wird, viele der verbleibenden Probleme lösen. Eine solche Kombination scheint auch aus Sicht der Psychoakustik sinnvoll. Der Nachhall enthält wichtige Informationen über die Akustik des Aufnahmeraumes. Die Feinstruktur der Oberflächen, von der die Klangfarbe des Raumes bestimmt wird, wirkt sich vor allem im Nachhall aus. Die Faltung in die Impulsantwort der Aufnahmeraum ist eine bewährte Methode, den sehr authentisch zu erzeugen. Jedoch, aus welcher Richtung diese Wellenfronten beim Hörer eintreffen, ist von untergeordneter Bedeutung für Wahrnehmung. Auch im Aufnahmeraum kommt der Nachhall aus allen möglichen Richtungen. Wir können nicht erkennen, aus welcher konkreten Richtung die zweiten oder späteren Reflexionen kommen. Wir müssen sie einfach von überall her erzeugen [4].

Andererseits bestimmt direkte Wellenfront und erste Reflexionen kaum das Timbre des Raumes. Sie werden im Spektrum kaum von ihm verändert. Sie enthalten aber die wichtigsten Informationen zur Lokalisation der Quelle. Durch erlernte Verknüpfungen mit optischen Reizen sind wir in der Lage, den Ausgangspunkt der ersten Wellenfront schon durch winzige Unterschiede in Ankunftszeit oder die Amplitude dieser Wellenfronten zu bestimmen. Erste Reflexionen sind manchmal sehr stark. Oft unterscheidet sich ihr Sachalldruck beim Zuhörer kaum von der direkten Welle. So kann die Überlagerung zu tiefen Kammfiltereffekte führen. Mit den korrekten Umwegen sind die daraus resultierenden Kerben im Frequenzgang jedoch aussagekräftige Indikatoren für den Raumeindruck. Im Gegensatz dazu führen falsch Umwege, wie im unbedämpften Wiedergaberaum normalerweise kaum zu vermeiden sind, zu einem abweichenden Muster von Hügeln und Kerben. Manchmal entstehen dabei Pegelfehler bis zu 20 dB. Daraus resultieren starke, irreführende Signale.

Spätere Reflexionen verursachen nicht solche groben, schmalbandigen Fehler im Frequenzgang. Ihre statistische Verteilung der Umwege wirkt Ausgleichend. Das Ergebnis ist in eine Veränderung im Timbre, abhängig vom gesamten Reflexionsverhalten des Wiedergaberaumes. Wegen dieser unterschiedlichen Bedingungen in der Wahrnehmung ist es nicht sinnvoll, die direkte Welle und ihre ersten Reflektionen bei der Synthese in der gleichen Weise zu erzeugen, wie den Nachhall. Das ist aber bei der Wellenfeldsynthese bisher üblich. Der Datenbasierende Ansatz liefert zwar perfekte Ergebnisse, aber er überfordert die derzeit verfügbare Rechenleistung, wenn er auf alle Signalanteile angewendet wird. Das gilt insbesondere für dreidimensionale Umgebungen und darin bewegte Schallquellen. Deren Berechnung ist viel einfacher im modellbasierten Ansatz. Der folgende Screenshot zeigt die modellbasierte Berechnung für einen ausgewählten Lautsprecher. Einfache Vektorberechnung liefert die Anzahl der Frames für die Verzögerung und die Amplitude jeder virtuellen Schallquelle, auch von denen der ersten Reflexionen:

blank

Jeder Lautsprecher wird durch die Addition der direkten Wellen aller primären Schallquellen und sechs ihrer Reflexionen an den Wänden gesteuert. In dem akustischen Vorhang aus 1024 Lautsprechern ändern sich dann 7168 Berechnungsergebnisse, wenn der Tenor einen kleinen Schritt auf die Bühne macht. Wird die virtuelle Hörposition im Aufnahmeraum verändert, dann werden in unserem Beispiel mit n 32 Eingangskanälen 229376 neue Vektorberechnungen nötig. Glücklicherweise sind nach [5] acht Daten-Updates pro Sekunde für eine reibungslose Bewegung der Quelle ausreichend. Das ist heute eine lösbare Aufgabe für jeden normalen PC. Alle resultierenden Additionen und Multiplikationen mit dem Signal lassen sich bei geschickter Programmierung sogar in einem einzigen Taktzyklus ausführen. Die Modellbasierte Lösung erzeugt dabei ein dreidimensionales Abbild der akustischen Szene.

Der Nachhall wird durch Faltung des Summensignals aus allen Eingangsquellen in die Impulsantwort des Aufnahmeraumes erstellt und aus unterschiedlichen Richtungen eingespielt. Wie von Wittek [6] bewiesen, sind einige ebene Wellenfronten dafür völlig ausreichend. Wie im Aufnahmeraum, kommt der Hall dann von überall. Für dieses Verfahren ist es entbehrlich, von einem Team hochqualifizierter Techniker mit einer teuren Mikrofon Line-Array eine besondere, räumliche Impulsantwort einfangen zu lassen, wie das bei der wissenschaftlichen, Datenbasierenden Umsetzung der Wellenfeldsynthese der Fall ist. Jede herkömmliche Impulsantwort, wie für alle interessanten Umgebungen heute sogar schon im Netz verfügbar ist, reicht für das Verfahren aus. Zusammen mit einem groben geometrisches Modell des Aufnahmeraumes, oder eines passenden Raumes aus der gespeicherten Bibliothek, kann dann jedes trocken aufgenommene Signal so dargestellt werden kann, als wäre es in einer der schönsten akustischen Umgebungen rund um den Globus aufgenommen.

Welche akustische Perspektive gewählt wird, legt der Regisseur bei der Aufnahme fest. Die Daten werden in MPEG4 oder einem anderen geeigneten Standard mit dem Signal übertragen, aber der Zuhörer im Heimkino kann sie bei Bedarf interaktiv mit seinem Joystick oder der Fernbedienung modifizieren und sich so an jede beliebige Schallquelle im Aufnahmeraum heranzoomen. Auch die Ausrichtung des virtuellen Zuhörers im Aufnahmeraum kann in die Berechnung eingehen, so das er den Kopf drehen oder heben, oder sich auch in der virtuellen Umgebung umdrehen kann. Dann spielt das Orchester hinter ihm. Die im Kapitel Divergenzproblem beschriebene Lösung, laufzeitbedingte Fehlortungen im Bereich der konkaven Wellenfronten zwischen abstrahlendem Lautsprecher und virtueller Schallquelle zu vermeiden, ist schon entsprechend DE 102006054961A1 in die Kalkulation der Werte einbezogen.

4.4 Interaktivität

Die definierten Zuhörerpunkte in Aufnahme- und Wiedergaberaum ermöglichen einen interaktiven Ansatz. Weil die Prozedur darauf ausgerichtet ist, kongruente Signale an beiden Punkten zu schaffen, wird jede Änderung der Koordinaten des virtuellen Zuhörers im Aufnahmeraum zu einer entsprechenden Änderung in der Wahrnehmung beim realen Zuhörer führen. Das vereinfacht die Audio-Produktion. In der herkömmlichen Technologie wäre es zum Beispiel sehr aufwendig, eine akustische Szene abzubilden, in der die Kamera einen Akteur eines tanzenden Paares aufnimmt. Alle Schallquellen, aber auch alle Reflexionen, müssten sich dann um den Zuhörer drehen. Sicher wäre das auch bisher nicht unmöglich, aber im Holophony-Ansatz bliebe für den Produzenten keine weitere Aufgabe, als den Winkels des virtuellen Hörers im virtuellen Aufnahmeraum mit zudrehen.

Darüber hinaus hätte sogar der Zuschauer im Heimkino noch die Möglichkeit, diesen Wert zu verändern. Er kann sich drehen, dann wird die Musik hinter ihm spielen. Er kann aber auch die Position, die der Produzent dem virtuellen Punkt im Aufnahmeraum gegeben hat, noch bei der Wiedergabe verändern. Kein Problem, werden alle Signale entsprechend berechnet, wenn er mit Hilfe seiner Fernbedienung durch den virtuellen Aufnahmeraum gehen will.

4.5 Kompatibilität

Meistens findet man bezüglich der Kompatibilität der Wellenfeldsynthese die Argumentation, dass der Sweetspot für die Reproduktion der traditionellen Audio-Aufzeichnungen deutlich vergrößert ist. Bedingt ist das durch den großen Abstand der "virtual paning spot“ genannten virtuellen Schallquellen, die weit außerhalb der realen Wände des Wiedergaberaumes die Lautsprecher vortäuschen. Für einen Zuhörer in der Mitte des Zimmers ist das aber nicht wirklich ein Vorteil. Viel wichtiger für ihn ist, auch bei der Wiedergabe von konventionell produziertem Audiomaterial, die Nahfeldwiedergabe in Reichweite der großen resultierenden Membran. Neben der nahezu unbegrenzten Dynamik, die durch die perfekte Anpassung des großen Lautsprecherfeldes an den Strahlungswiderstand der Luft gegeben ist, wird der störende Einfluss der Wiedergaberaumakustik deutlich reduziert.

Einige Arten von Programm-Material, zum Beispiel der Nachrichtensprecher oder menschliche Stimmen in freier Umgebung aufgenommen, können nur bei sehr trockener Wiedergaberaumakustik überzeugend dargestellt werden. Dann wird die Abstrahlung des Lautsprecherfeldes nur auf die Zuhörer ausgerichtet, das hat die gleiche Wirkung. Es entstehen dann kaum erste Reflexionen, weil kaum Energie in Richtung ihres Ausgangspunktes abgestrahlt wird. Die Ersten Reflexionen sind aber Quelle für die Zweiten, und so weiter. Deshalb entsteht auch kaum Nachhall. Im Nahbereich des Lautsprecherschirmes wäre selbst in einer leeren Kathedrale eine relativ trockene Audiowiedergabe möglich.

Dem Wunsch nach einem reduzierten Eigenleben des Schalls im Wiedergaberaum steht zuweilen auch ein Interesse einigen nützlichen Reflexionen, die eine glaubhaftere räumliche Wahrnehmung hervorrufen, entgegen. Die Wiedergabe von manchem Programmmaterial wirkt langweilig, wenn fast alle Wellenfronten nur von den Lautsprechern ausgehen. Meistens würden wir uns dann wünschen, unser Wiedergaberaum wäre mäßig reflektierend, aber deutlich größer als das reale Zimmer. Für traditionelles Audio öffnet das WFS- Lautsprecherfeld die Möglichkeit, eine solche variable Raumakustik zu schaffen. Wir können Reflexionen vermeiden, wir können aber auch zusätzlichen Reflexionen generieren, in der Zeit unabhängig vom Signal selbst, also auch mit einer ausreichenden ITDG- Lücke, und ohne dass ihre Abstrahlung zuerst den Zuhörer trifft.

Der separate Zugriff auf Wellenfronten verschiedener Richtung bietet auch einen wesentlichen Vorteil in Bezug auf die Entzerrung des Frequenzganges. Normalerweise entzerren wir das Gesamte Signal mit der gleichen Einstellung. Jedoch, außer ein wenig Verlust im oberen Frequenzbereich bei zunehmender Entfernung, wird die direkte Wellenfront nie im Spektrum verändert. Sie trifft nicht auf eine Reflexionsfläche, weder im Aufnahmeraum, noch im Wiedergaberaum. Kollektive Entzerrung aller Signalanteile ist deshalb falsch. Nur die Reflexionen getrennt zu regeln würde die Klangfarbe des Aufnahmeraumes überzeugender rekonstruieren. Mit objektbasierend aufgezeichnetem Programmaterial wird das perfekt gelingen, wenn aber die konventionelle Aufzeichnung ein paar zusätzliche Reflexionen verträgt, wird mit dem Lautsprecherfeld eine deutlich feinere Anpassung möglich werden.

In der anderen Richtung wird es schwieriger. Der trockene Ton der objektbasierenen Verfahren wird in herkömmlichen Playern nicht wirklich überzeugend klingen. Faltung in eine Impulsantwort ist dann unverzichtbar für eine zufriedenstellende Wiedergabe mit Einzellautsprechern. Doch die Audioproduktionen werden sich sowieso in Richtung der Computerangepassten Formate entwickeln. Dort ist Convolution längst Standard bei der Wiedergabe. Die Grenzen verschwinden. Bis dahin scheint es unvermeidlich, zusätzlich herkömmliche Kanäle im Audiomaterial bereitzustellen. Für die Objektbasierenden Verfahren werden auch in Zukunft 32 getrennte Kanäle völlig ausreichend sein, mehr Positionen von primären Schallquellen können wir auch direkt im Aufnahmeraum auditiv nicht voneinander trennen.

Wenn wir davon acht als traditionelle Audiokanäle reservieren, können wir das gesamte bestehende Kulturgut aus dem Bereich weiter uneingeschränkt verwenden. Darüber hinaus ergibt sich die Möglichkeit, dass beide Ansätze gemeinsam genutzt werden. Manche Geräusche oder auch räumlich sehr ausgedehnte Instrumente, kann man selbst aus einiger Entfernung nicht mehr als Punktschallquelle betrachten. Dann sind sie für den objektbasierenden Ansatz schwer zu fassen. Es wird leichter und oft überzeugender sein, sie weiter als Phantomschallquelle wiederzugeben. Andererseits wird es konventionelle Aufnahmen deutlich aufwerten, wenn nun auch einzelne Stimmen oder Instrumente vor den Lautsprechern abgebildet werden können.

Zweiunddreißig Audiokanäle zu übertragen, scheint auf den ersten Blick sehr aufwendig zu sein. Doch meist werden nur einige, manchmal eine einzige primäre Schallquelle allein gleichzeitig aktiv sein. In einem angepassten Standard werden die leeren Audiokanäle dann kein Datenvolumen erzeugen. So wird die Übertragung sogar effizienter, als die Ausstrahlung des Signals in 5.1, 7. 1 oder mehr, manchmal völlig deckungsgleichen Kanälen.

4.6 Fazit

Aus technischer Sicht, wäre es heute erreichbar eine virtuelle, physikalische Kopie des Ausgangsschallfeldes zu erzeugen. Die Frage bleibt, ob dies das Ziel der Audiowiedergabe ist. Kritische Experten argumentieren, dass auch herkömmliche Verfahren der Lage wären, eine nahezu perfekte Reproduktion, oft sogar besser als das Original, zu erzeugen.

Das ist zweifellos richtig, vor allem wenn das Original unter akustisch ungünstigen Bedingungen aufgeführt wird. Auf der anderen Seite ist auch die beste Ausrüstung zu Hause bis heute weit entfernt, die emotionale Wirkung eines Brahms Konzertes beim Andante der Hörner in einem guten Konzerthaus , oder auch nur die Illusion das eine Biene dicht vor unsrer Nase summt, zu erzeugen. Die beschriebene Lösung ist ein Hilfsmittel zur Verbesserung des räumlichen Eindruckes, auch von konventionell produziertem Material. Dabei gibt es keinerlei Abstriche bei den künstlerischen Möglichkeiten dieser traditionellen Verfahren. Auf der anderen Seite bietet der objektbasierende Ansatz auch völlig neue künstlerische Möglichkeiten. Luft wird wie formbare Materie vor dem Lautsprecherfeld, wir haben völlig neue Möglichkeiten, die Wahrnehmung zu verändern. Definitiv könnte der beschriebene Holofonie - Ansatz viele der verbleibenden Probleme bei der Audioreproduktion lösen.

 

 

Literatur

[1] Berkhout, A.J. (1988): A holographic approach to acoustic control'. Journal of the Audio Engineering Society, Vol.36, No.12, December 1988, pp.977-995.

[2] Jens Blauert: Räumliches Hören . S. Hirzel Verlag, Stuttgart 1974. ISBN 3-7776-0250-7

[3] Andreas Franck, Karlheinz Brandenburg : Efficient Delay Interpolation for Wave Field Synthesis, AES Convention 125 ( San Francisco , October 2008), Paper 7613

[4] Heinrich, Gregor; Jung, Christoph; Hahn, Volker; Leitner, Michael: A Platform for Audiovisual Telepresence Using Model- and Data-Based Wave-Field Synthesis, AES Convention 125 ( San Francisco , October 2008), Paper 7608

[5] William Francis Wolcott IV: Wave Field Synthesis with Real-time Control,Project Report, University of California Santa Barbara 2007

[6] The theory of wave field synthesis revised. S. Spors, R. Rabenstein, and J. Ahrens. In 124th AES Convention, Amsterdam , The Netherlands , May 2008. Audio Engineering Society

last update 2011-01-31