Binaurale Aufnahmen, Übertragungen oder Simulationen enthalten auf zwei Tonkanälen alle Komponenten, die das menschliche Gehör zur räumlichen Wahrnehmung und Lokalisierung von Schallereignissen heranzieht. Im Einzelnen sind dies Intensitäts-, Laufzeit- und Klangfarbenunterschiede. Für binaurale Aufnahmen werden überwiegend Kunstkopf-, Kugelflächen- oder Trennkörper-Mikrofone verwendet, die bereits nativ alle genannten Komponenten verwerten. Die binaurale Aufnahmetechnik nutzt damit die Tatsache, dass der Mensch von Natur aus über eine sehr effiziente, akustische Raumwahrnehmung verfügt. Mit nur zwei Ohren gelingt es ihm, Schallereignisse aus nahezu beliebigen Richtungen nicht nur wahrzunehmen, sondern auch präzise zu lokalisieren.
Eine wichtige Rolle kommt hierbei den Ohrmuscheln zu: Sie wirken als mechanisch-akustische Filter und sorgen dafür, dass der Schall abhängig von der eintreffenden Richtung ein jeweils typisches Frequenzgangprofil am Trommelfell aufweist – man nennt dies Außenohr-Übertragungsfunktion oder Head Related Transfer Function (HRTF).
Verwendet man für binaurale Aufnahmen beispielsweise einen dem menschlichen Kopf nachgebildeten Dummy (zu Deutsch: Kunstkopf) mit detailliert ausgeführten Ohrmuscheln und zwei Mikrofonen anstelle der Trommelfelle, so genügen zwei Aufnahmekanäle zur vollständigen, räumlichen Tonübertragung. Hört man solche Aufnahmen über einen (geeigneten) Kopfhörer, stellt sich eine gegenüber herkömmlicher Stereo-Wiedergabe deutlich bessere und natürlichere Raumwahrnehmung ein.
Einschränkend gilt hier allerdings: Mit den eigenen Ohren hört sich’s noch immer am besten, will sagen: Besonders authentisch wirkt die Raumwiedergabe dann, wenn die eigenen Ohrmuscheln für die Aufnahme herangezogen werden (können). Das Gehör hat von Kindesbeinen an deren Eigenschaften verinnerlicht; diese sind in der Tat mindestens ebenso persönlich wie der Fingerabdruck.
Alternativ hierzu lassen sich auf mathematischem Wege generische Ohrmuschelnachbildungen entwickeln, die der durchschnittlichen Anatomie entsprechen – solche verwenden beispielsweise die Dummy Heads vom Aachener Spezialisten Head Acoustics. Auch ist es – zumindest für den Raumeindruck – nicht zwingend erforderlich, dass sich die Mikrofonkapseln exakt an den Trommelfell-Positionen befinden, wie die beiden dänischen AkustikerInnen Dorte Hammershøi und Henrik Møller bereits im Jahre 1992 publizierten.
Der Hauptnachteil von binauralen Aufnahmen mittels Kunstkopf besteht darin, dass sie bei Wiedergabe über Lautsprecher relativ starke Klangverfärbungen sowie eine stark eingeschränkte Stereo-Perspektive aufweisen. Das Problem liegt auf der Hand: Die auf der Aufnahme befindlichen, HRTF-kodierten Rauminformationen kollidieren mit denjenigen HRTFs, die sich bei der für Stereowiedergabe typischen Lautsprecheraufstellung einstellen. An dieser Tatsache haben auch Kunstgriffe – wie etwa die vielgepriesene (Quasi-)-Diffusfeldentzerrung von Kunstkopfmikrofonen – grundsätzlich nichts ändern können.
Nachteilig wirkt sich außerdem der akustische Einfluss des Hörraums aus. Da die Mikrofonkapseln während der Aufnahme sozusagen das Trommelfell des Zuhörers „ersetzen“, erfordern Kunstkopfaufnahmen eine möglichst unmittelbare, akustische Ankopplung ans Gehör. Die ist bei Kopfhörerwiedergabe im Wesentlichen gewährleistet – nicht jedoch bei Lautsprecherwiedergabe: Bedingt durch das akustische Kanalübersprechen im Hörraum wird die auf der Aufnahme enthaltene Rauminformation deutlich geschwächt.
Aus diesen Gründen haben sich Kunstkopfaufnahmen für kommerzielle Musikproduktionen nie wirklich durchsetzen können. Im Zeitalter von 3D und Virtual Reality rücken Kopfhörer als primär genutzte Schallwandler jedoch mehr und mehr in den Vordergrund. Damit erlebt auch die binaurale Aufnahmetechnik mit Kunstkopf-Mikrofonen und ihren Ablegern derzeit eine wahre Renaissance.