3D-Verfahren in jedem beliebigen Raum

Immersive Sound: Raumsound in der Festinstallation mit Iosono

von Thomas Zahn , Artikel aus dem Archiv vom 13. April 2016

Surround Sound, 3D-Sound oder Immersive Sound sind derzeit häufige Schlagworte, wenn es um die klangliche Nutzung eines gegebenen Raumes geht. Der Klang soll nicht nur in Stereo von vorne kommen oder nur in einem Sweet-Spot optimal wirken. Vielmehr soll ein gesamter Raum zu einem Erlebnisraum werden, in den Besucher förmlich eintauchen können.

Die Themen dieses Grundlagenartikels:

Immersive Sound über objektbasierte Verfahren
Exkurs Wellenfeldsynthese (WFS)
WFS angepasst an die Realität
Immersive Sound in the Real World
Interview mit Stephan Mauer
Referenzen (Auszüge)

Bei herkömmlichen 5.1 oder 7.1 Surroundsound-Verfahren konzentriert sich das optimale Hörerlebnis auf einen relativ kleinen Bereich im Zentrum des jeweiligen Raumes – den sogenannten Sweet-Spot. Nur hier kann der Klang optimal wahrgenommen werden. Sobald man sich als Zuhörer aus diesem kleinen Bereich heraus bewegt, bricht das Klangbild gewissermaßen zusammen. Stereo-, 5.1- oder 7.1-Verfahren sind kanalbasierten Verfahren: Klänge werden bestimmten Lautsprechern zugeordnet und sind somit gewissermaßen an diese gebunden. Es wird mit Phantomschallquellen, z. B. der Stereomitte bei einer Links-Rechts-Lautsprecheranordnung, gearbeitet. Diese funktionieren nur, wenn der Zuhörer optimal zwischen den Lautsprechern platziert ist. Das ist natürlich schön und gut, solange sich der Zuhörer im Sweet-Spot befindet und sich nicht bewegt.

>> zurück zur Übersicht

Immersive Sound über objektbasierte Verfahren

In zahlreichen Anwendungen aber, in denen 3D-Sound wünschenswert ist, bewegen sich die Zuhörer nun einmal – etwa in Themenparks oder Ausstellungen. In vielen dieser Anwendungsbereiche sollen die Besucher mobil sein, um in den vollen Genuss der Veranstaltung zu kommen. Konventionelle kanalbezogene Wiedergabesysteme stoßen hier nicht nur an ihre Grenzen, sondern sind letztlich unbrauchbar. Die Lösung bieten objektbasierte Verfahren.

Im Labor für Siemens Audiologische Technik in Erlangen wurde ein Isono WFS-System mit Genelec-Lautsprechern eingesetzt (Bild: Isono)

Was sich erst etwas kryptisch anhört, bedeutet letztlich nichts anders, als dass Klänge nicht mehr fest an einen oder mehrere bestimmte Lautsprecher gebunden sind. In einem solchen Verfahren werden die eigentlichen Klänge mit Metadaten gekoppelt, die Informationen darüber enthalten, wie und wo der entsprechende Klang im realen Raum wahrgenommen werden soll.

Die Kombination aus Audio- und Metadaten wird dann als Objekt bezeichnet. Letztlich wird ein komplexes raumbezogenes Schallfeld berechnet und dargestellt. Objektbasierte Daten enthalten die notwendigen Informationen und Anweisungen, die es ermöglichen, ein Schallereignis und dessen räumliche Anordnung quasi unabhängig von den real vorhandenen Speakern darzustellen, egal wie viele davon letztlich tatsächlich vorhanden sind. Je nach Raumgröße sollten es aber schon ca. 20 sein, um ein solches Verfahren zu ermöglichen.

>> Laden Sie sich hier das ausführliche Basiswissen Immersive Sound als praktischen Download herunter!

>> zurück zur Übersicht

Exkurs Wellenfeldsynthese (WFS)

Ein solches Verfahren ist in langjähriger Forschung entwickelt worden. Die Rede ist von der sogenannten Wellenfeldsynthese (kurz WFS). Die Entwicklung der WFS begann bereits in den 80er Jahren an der TU Delft und wurde in den Jahren 2001 bis 2003 im Rahmen des EU Forschungsprojekts Carruso u. a. vom Fraunhofer IDTM weiter vorangetrieben. Im Anschluss daran wurden die Forschungen am Fraunhofer IDTM weitergeführt was u. a. auch zur Gründung des Spin-Offs Iosono führte.

Bei der Wellenfeldsynthese handelt es sich um ein 3D-Sound- Verfahren, bei dem nicht wie bei anderen konventionellen Mehrkanal-Verfahren, die räumliche Wahrnehmung der Zuhörer auf Phantomquellen beruht. Vielmehr wird hier ein komplexes Schallfeld berechnet und generiert, basierend auf einer Vielzahl von Elementarwellen. Es handelt sich um ein raumbezogenes und nicht um ein kanalbezogenes Verfahren.

Prinzip der Wellenfeldsynthese (Bild: Helmut Oellers)

Dies ermöglicht ein sehr stabiles Klangfeld und erlaubt es, einzelne Klangquellen auf Wunsch auch frei im Raum zu positionieren und zu bewegen. Es können darüber hinaus auch akustische Situationen erzeugt werden, die mit dem tatsächlichen Raum nicht mehr viel zu tun haben. So können beispielsweise Klangquellen auch hinter den realen Wänden platziert werden. Zur Realisierung dieses Verfahrens werden um den Zuhörer herum einzeln steuerbare Lautsprecher in einem horizontalen Ring (meist entlang der Raumwände) aufgebaut.

Theoretisch sollten dies am besten unendlich viele, unendlich kleine Lautsprecher sein, die auch noch unendlich nah beieinander liegen – in der Praxis natürlich ein Ding der Unmöglichkeit! Hinter den Lautsprechern versteckt sich ein komplexer Algorithmus (und selbstverständlich die notwendige Hardware) zur Berechnung des Klangfeldes.

>> zurück zur Übersicht

WFS angepasst an die Realität

Die in der WFS-Theorie geforderte Anordnung der Lautsprecher ist natürlich in der Praxis so nicht umsetzbar. Eine praxisorientierte Lösung musste also gefunden werden. Wie erwähnt war man am Fraunhofer IDMT in Ilmenau bereits seit geraumer Zeit mit WFS und deren praktischer Anwendbarkeit beschäftigt. Als direkter Fraunhofer Spin-Off entstand 2004 Iosono, der praxisgerechte Lösungen für 3D-Sound anbietet – und zwar sowohl das notwendige Know-how als auch die erforderliche Hardware in Form von Prozessoren.

Hinsichtlich der angeschlossenen Lautsprecher ist das System offen, solange die Lautsprecher gewisse Voraussetzungen erfüllen (siehe Kasten „Schallwandler für 3D-Soundsysteme“), auch wenn seit einiger Zeit im Fohhn Sound Lab in Nürtingen ein Iosono-System installiert ist, da sich diverse Fohhn-Lautsprecher für das Iosono-Verfahren eignen. Seit 2014 ist Iosono ein Teil der Barco-Familie, was einer weiteren Verbreitung der Iosono-Systeme sicherlich nicht hinderlich sein dürfte.

Fohhn Sound Lab in Nürtingen nutzt ein Iosono-System mit diversen Fohhn-Lautsprechern (Bild: Iosono)

Seit wenigen Jahren gibt es auch zwischen der Firma Shure und dem Fraunhofer IDMT eine Zusammenarbeit, deren Ergebnis ebenfalls ein auf WFS basierendes 3D-Sound-System ist. Unter dem Namen Atmosphea gibt es hier die notwendigen Prozessoren. Allerdings werden für das Atmosphea-System Lautsprecher aus dem Hause Shure verwendet.

Beiden Systemen gemeinsam ist, dass sie auf eine realistischere Anzahl von Lautsprechern zurückgreifen und so in der Praxis auch tatsächlich umsetzbar sind. Je nach Raum und Anwendung sind Abstände von bis zu 2 Metern zwischen den Lautsprechern des horizontalen Ringes möglich. Dabei entsteht natürlich ein realistischeres Ergebnis, je näher die Lautsprecher beieinander stehen.

Lautsprecheranordnung der Athmosphea- Anlage im Show-Room von Shure Deutschland (Bild: Shure)

Außerdem ermöglichen beide Systeme durch die Einbeziehung von Deckenlautsprechern eine tatsächliche Annäherung an echten 3D-Sound. Der Zuhörer befindet sich nicht nur auf einer horizontalen Hörebene, sondern wird durch die Einbeziehung der Vertikalen tatsächlich in einen Klangraum gestellt. Dieser kann durchaus größer wirken als der tatsächlich vorhandene Raum, da es die jeweils verwendeten Algorithmen gestatten, Klangquellen auch hinter den tatsächlichen physischen Raumgrenzen zu platzieren.

>> zurück zur Übersicht

Immersive Sound in the Real World

Nachdem WFS bzw. davon abgeleitete Systeme nun endlich Marktreife erreicht haben, sind sie zunehmend in diversen Installationen anzutreffen. Planer und Betreiber müssen keine Angst vor der vergleichsweise neuen Technologie haben, da sowohl Shure als auch Iosono gerne beratend zur Seite stehen, um ein optimales System zu entwerfen. Überraschend an den realisierten Projekten ist dabei deren Bandbreite: Wer glaubt, Immersive Sound sei in erster Linie etwas für Kinos, sieht sich schnell eines Besseren belehrt.

So findet man Atmosphea etwa in Planetarien (Hamburg und Bochum) oder der Autostadt in Wolfsburg, während Iosono sowohl Ausstellungen und Planetarien als auch etwa Konzerte als Referenzen aufweisen kann. Der Mehrwehrt für die Besucher ist in jedem Fall gegeben, erhalten sie doch u. a. dank 3D-Sound eine Erlebnisqualität, die sich mit konventionellen kanalbezogenen Verfahren nicht erreichen ließe.

In folgenden Interview erläutert Stephan Mauer, Head of Professional Audio bei Iosono, die Besonderheiten des firmeneigenen Immersive Sound-Verfahrens.

>> zurück zur Übersicht

Interview mit Stephan Mauer

Herr Mauer, wie unterscheidet sich ein Immersive Audio System wie Iosono von herkömmlichen Surroundsystemen auf technischer Ebene?

Was zuerst ins Auge fällt sind natürlich die Unterschiede im Lautsprecheraufbau. Bei 5.1 und verwandten Formaten gibt es eine definierte Lautsprecheranzahl und -aufstellung. Bei Iosono können technisch gesehen tausend und mehr Lautsprecher in einem System spielen. Typisch sind jedoch 20 bis 100 Lautsprecher, die als System zusammenspielen.

Währen bei 5.1 oder 7.1 die Front klar die Vorzugsrichtung ist, werden unsere Systeme meist so designt, dass räumliche Abbildung, Klangfarbe und akustische Leistungsfähigkeit in allen Raumrichtungen vergleichbar sind und es deswegen keine Vorzugsrichtung gibt. Natürlich unterstützen wir auch dreidimensionale Aufbauten mit Decken- und Bodenlautsprechern oder mehreren Lautsprecherringen übereinander.

Zwingende Voraussetzung für diese Flexibilität im Systemlayout ist primär das von uns verwendete objektbasierte Audiomodell, während etwa herkömmliche 5.1- oder 7.1-Systeme kanalbasiert arbeiten. Herkömmlich wird während der Mischung jeder Klang so auf die Lautsprecher, also die Kanäle, verteilt wie gewünscht und in genau dieser Kanalkonfiguration am Ende auch wiedergegeben. Wie gut dies tatsächlich funktioniert, hängt letztlich davon ab, wie genau Produktionssystem und Wiedergabesystem übereinstimmen.

Beim objektbasierten Mischen wird ein Klang wie herkömmlich gestaltet und bearbeitet, aber die Informationen darüber, von wo und wie ein Klang wahrgenommen werden soll, werden als Metadaten gespeichert. Für den Tongestalter bedeutet das praktisch, dass ein zusätzliches Icon, das etwa einer Tonspur zugeordnet ist, auf einer grafischen Oberfläche der gewünschten Position im Raum entsprechend positioniert und automatisiert wird – unabhängig von den tatsächlich vorhandenen Lautsprecherkanälen. Dieses Paar aus Audiodaten und Metadaten bezeichnen wir als Objekt oder als virtuelle Schallquelle. Wenn es nun gleichzeitig mehrere Objekte in einer Klangszene gibt, entstehen komplexe räumliche Mischungen.

Das Iosono-System wurde auf der EXPO 2015 (Mailand) in der Main-Show des vielfach beachteten Pavillons von Kasachstan eingesetzt (Bild: Martin Misere)

Diese objektbasierten Mischungen werden für Produktion und Wiedergabe entweder zum Iosono CORE-Prozessor gestreamt oder darauf lokal gespeichert und in Echtzeit durch den Iosono-Algorithmus auf das konkrete Lautsprechersetup bestmöglich gerendert, also abgebildet. Die Mischung existiert also objektbasiert und damit unabhängig vom tatsächlich gegebenen Lautsprecheraufbau und wird immer in Echtzeit an diesen Aufbau passend „maßgeschneidert“.

Die Verwendung von mehr als 5 Lautsprechern ermöglicht uns den Einsatz von leistungsfähigen Algorithmen, die weit über bloßes Panning hinausgehen. In Verbindung mit 20 und mehr Lautsprechern führt das dazu, dass der von Stereo und 5.1 bekannte Sweet-Spot aufgelöst werden kann. Eine Klangszene kann mit Iosono von allen Hörern auf einer Hörfläche richtungskorrekt und plausibel wahrgenommen werden; damit eignet sich das System besonders für die Bespielung größerer Zuhörergruppen.

Worauf muss man achten, wenn man möglichst überall auf einer Hörfläche eine korrekte Wiedergabe erreichen möchte?

Da gibt es zwei wesentliche Parameter. Zum einen ist das der Abstand zwischen benachbarten Lautsprechern. Denn wenn ein Zuhörer näher an die Lautsprecher herantritt als deren Abstand ist, fällt der Hörer zurück in ein Situation, die mit Stereo vergleichbar ist. Steht der Hörer nicht mittig zwischen den betreffenden Lautsprechern fallen Klänge quasi „in“ einen einzelnen Lautsprecher, die Lokalisation der Szene bricht zusammen. Bei einem kreisförmigen Aufbau mit 10 m Durchmesser und 2 m Abstand zwischen benachbarten Lautsprechern habe ich also eine effektive Hörfläche mit einem Durchmesser von 6 m.

Auch im Planetarium Hamburg kommt Shure Atmosphea zum Einsatz – die Pfeile deuten die Lautsprecherpositionen an (Bild: Shure)

Die Abstrahlcharakteristik der Lautsprecher ist der zweite begrenzende Faktor. Nur dort, wo der Zuhörer von allen Lautsprechern einen sinnvollen Anteil des Spektrums mit einem angemessenen Pegel wahrnehmen kann, kann er auch die akustische Szene korrekt wahrnehmen. Im Idealfall sollte also jeder Lautsprecher das komplette Spektrum mit gleichbleibendem Pegel auf der ganzen Hörfläche abbilden können.

Ist das, was Sie mit den genannten Lautsprecherabständen von 2 m betreiben, denn noch Wellenfeldsynthese? Bei Ihrem Verfahren können die Lautsprecher ja relativ weit auseinander stehen, verglichen mit den in der WFS theoretisch benötigten unendlich vielen, unendlich nah beieinander liegenden Lautsprechern.

Das ist richtig: Wie alle mir bekannten Anwendungen dieser Art betreiben wir, physikalisch betrachtet, keine korrekte Wellenfeldsynthese. Dafür bräuchte es in der Tat lückenlos angeordnete Lautsprecher mit ca. 8,5 mm Durchmesser.

Je größer die Lautsprecherabstände werden, umso weiter verringert sich die Grenzfrequenz, unterhalb derer man physikalisch korrekt arbeitet. Bei 2 m Lautsprecherabstand ist die WFS nur unterhalb von etwa 85 Hz physikalisch korrekt. Menschen hören jedoch anders als Mikrofonarrays messen und weil wir uns mit unseren Iosono-Produkten auf den Entertainment und Simulationsmarkt konzentrieren, haben wir unsere Algorithmen und Systeme auf die menschliche Wahrnehmung hin optimiert.

Das bedeutet, dass unser Iosono-Algorithmus, der auf Wellenfeldsynthese basiert, die perzeptiven Eigenschaften von Wellenfeldsynthese, wie stabile und kontrollierbare Lokalisation, ermöglicht, dafür aber keine lückenlosen Lautsprecherarrays erfordert! Dadurch wird es auch erst möglich, große und leistungsfähige Beschallungslautsprecher einzusetzen, die die Systeme erst sinnvoll anwendbar machen. Und mit den Deckenlautsprechern, die meines Wissens in der WFS nicht wirklich vorgesehen sind, steht nun nicht nur die Horizontale, sondern auch noch die Vertikale zur Verfügung – echter 3D-Sound rückt damit ein gutes Stück näher.

Man kann Lautsprecher auch vertikal eng anordnen und dann in der Vertikalen WFS machen. Nur bedeutet das eine relativ unpraktische Matrix aus Lautsprechern, um Horizontale und Vertikale gleichzeitig abbilden zu können. Außerdem hat das menschliche Gehör in der Vertikalen deutlich geringere Auflösung als in der Horizontalen. Deswegen arbeiten wir mit übereinander angeordneten Lautsprechern mit deutlich mehr Abstand als in der Horizontalen.

Studioausstattung mit Immersive Sound, hier in Shanghai (Bild: Iosono)

Der minimale Aufbau für ein echtes 3D-Tonsystem besteht aus zwei Lautsprecherebenen, dem besagten Lautsprecherring etwa auf Ohrhöhe und einer flächigen, matrixartigen Anordnung von Lautsprechern in der Decke über den Zuhörern. Klänge können auf diesem Deckenarray stabil positioniert und bewegt und zwischen beiden Ebenen hin- und her geblendet werden. Damit sind also vertikale Bewegungen im einfachsten Fall möglich.

Wenn man nun mehr als zwei Lautsprecherebenen übereinander vorsieht oder das Deckenarray an den Seiten weiter nach unten verlängert, zum Beispiel als Kuppel, kann man die Auflösung von vertikaler Positionierung und Bewegung deutlich verbessern. Die Iosono Prozessoren CORE und ONE unterstützen dafür bis zu fünf vertikal angeordnete Lautsprecherebenen in einem System.

Wie bestimmen Sie Anzahl und Anordnung der für einen gegebenen Raum notwendigen Lautsprecher?

Das passiert in jedem Falle unter Berücksichtigung der räumlichen Gegebenheiten und der Aufgaben, die das System erfüllen soll. Für den horizontalen Ring benutzen wir meist minimal 20, selten mehr als 60 Lautsprecher. Auf einen Kreis gerechnet erreicht man mit einer gleichmäßigen Verteilung von 60 Lautsprechern eine Winkelauflösung von 6 Grad, mehr Lautsprecher im horizontalen Ring braucht man nur für fokussierte Quellen, das sind Schallquellen, die tatsächlich im Raum wahrnehmbar sind. Die Dichte der Deckenlautsprecher richtet sich maßgeblich nach der Höhe der Decke.

Wir versuchen, einen Winkel von 30 Grad zwischen zwei Deckenlautsprechern nicht zu überschreiten. Wie gesagt, kann es dann noch weitere Lautsprecher in weiteren Ringen, im Boden oder anderswo, je nach Anwendung, geben. Für die Beratung beim Systemdesign stehen wir mit unserer Erfahrung aus über 100 Systemen natürlich gerne zur Verfügung und helfen, alle relevanten Faktoren einzubeziehen!

Lässt sich das Iosono-Verfahren in jedem beliebigem Raum anwenden, oder sollte der zu bespielende Raum gewisse Voraussetzungen erfüllen, um für Immersive Sound geeignet zu sein?

Wir haben Systeme bereits in den verschiedensten Arten von Räumen erfolgreich eingesetzt, von Kirchen bis Open Air und alles Mögliche dazwischen. Natürlich gibt es Wechselwirkungen zwischen System und Raum, zu Kunden sagen wir oft: Sie wissen sicher, was ein Lautsprecher in Ihrem Raum tut, jetzt stellen Sie sich vor, es wären 50.

Es ist wichtig, dass die Raumakustik bei der Lautsprecherauswahl und dem Layout des Systems berücksichtigt wird und alles zusammen spielt. In manchen Fällen raten wir dem Kunden, die Raumakustik anzupassen und einen Raumakustiker zu Rate zu ziehen, damit befriedigende Ergebnisse erzielt werden können.

Ein idealer Raum hätte eine kurze, spektral ausgewogene Nachhallzeit und keine diskreten ersten Reflexionen, was eine Herausforderung ist, wenn man bedenkt, dass die Lautsprecher von vielen Positionen aus in fast alle Richtungen spielen.

Welche Voraussetzungen muss ein Lautsprecher idealerweise erfüllen, um für Ihr Verfahren geeignet zu sein?

Grundsätzlich muss ein Lautsprecher die gestellte Beschallungsaufgabe hinsichtlich Pegel und Directivity lösen können. Eine breite horizontale Abstrahlung ist dafür in den meisten Fällen vorteilhaft. Natürlich müssen die klanglichen Qualitäten der Lautsprecher und das erforderliche Budget für den Kunden auch zufriedenstellend sein. Je nach Integration der Lautsprecher und Anspruch kann aber auch die Größe der Lautsprecher bzw. deren Ästhetik ein entscheidender Faktor sein.

In welchen Bereichen sehen bzw. hören Sie Iosono?

Immersive Audio ist im Kino natürlich ein großes Thema, das seitens Barco mit den Produkten und Konzepten um Auro 11.1 und AuroMax, dem neuen objektbasierten Kinotonformat von Barco, adressiert wird. Iosono ist ein System, das sich ganz auf professionelle Anwendungen konzentriert. So sind viele unserer Systeme im Entertainmentbereich, also in Themenparks, musealen Ausstellungen, Corporate Events, Planetarien und anderen temporären und festen immersiven Medieninstallationen verbaut.

Weitere Anwendungsschwerpunkte Studioausstattung mit Immersive Sound, hier in Shanghai sind die technische und künstlerische Forschung, bei der Iosono-Systeme wichtige Werkzeuge sind, und die Simulation realistischer akustischer Umgebungen in Caves und Simulatoren.

Die Praxiserfahrungen in Sachen 3D-Sound sind bei den meisten Planern und potenziellen Nutzern noch vergleichsweise überschaubar. Wie hilft hier Iosono bei der konkreten Umsetzung von Projekten?

Wir begreifen Beratung neben den eigentlichen Hard- und Softwareprodukten als wichtigen und integralen Bestandteil unseres Angebots. Auf der einen Seite haben wir dafür bei Iosono ein Team von Planungs- und Anwendungsingenieuren mit Erfahrungen aus dutzenden Projekten, die wir gerne in neue Projekte und Ideen einbringen und sehen uns dahingehend als Consultants. Dabei kann es je nach Anforderungen im Projekt von ganz grober Konzeption eines System und einer Lautsprecherempfehlung bis zu detailliertem Training für Benutzer und Planer gehen.

Auf der anderen Seite können wir auf ein globales Netzwerk von Kreativen mit Erfahrungen in immersivem Sounddesign zurückgreifen, die aus jedem System das maximal Mögliche herausholen können. Wir freuen uns über alle Fragen und Ideen die uns erreichen!

>> zurück zur Übersicht