Masterarbeit, 2009
98 Seiten, Note: 1,3
Ingenieurwissenschaften - Nachrichten- und Kommunikationstechnik
Abkürzungen
Formelzeichen
1 Einleitung und Motivation
2 Grundlagen des Beamformings
2.1 Prinzip der räumlichen Filterung
2.2 Delay and Sum-Beamformer
2.3 Nachteile statischer Beamformer, Beampattern Shaping
2.4 Adaptive Beamformer
3 Breitbandiges adaptives Beamforming
3.1 Allgemeines
3.2 Breitband-MVDR-Beamformer im Zeitbereich
3.3 Breitband-MVDR-Beamformer im Frequenzbereich
3.4 Beamformer-Robustheit
3.5 Anmerkungen zum Presteering
4 Performance-Analysen
4.1 Vorbetrachtungen
4.2 Rauschsignale
4.2.1 Vergleich zwischen Block- und Sliding Window-Processing
4.2.2 Vergleich zwischen Delay and Sum- und MVDR-Beamformer
4.2.3 Auswirkungen unterschiedlicher Filter- und FFT-Pufferlängen
4.2.4 Beeinflussung des Messergebnisses durch Änderung der Anzahl der Abtast- werte und Einsatz von Diagonal Loading
4.2.5 Performance bei mehreren Schallquellen unterschiedlicher Leistungen
4.2.6 Auswirkungen fehlerbehafteter Mikrofonortsvektoren
4.3 Geräusch- und Stimmensignale
4.3.1 Performance bei Vorhandensein einer Quelle iv Inhalt
4.3.2 Performance bei Vorhandensein mehrerer Schallquellen
4.3.3 Modellierung von Mehrwegeausbreitungen
4.4 Zusammenfassung
5 Fazit
A Quellen
B Abbildungen
C Anhang
C.1 Zeitabhängige Spektren der Geräuschsignale
C.2 Zeitabhängige Spektren der Stimmensignale
C.3 Beamformerausgangsleistungen für Geräuschsignale
C.4 Beamformerausgangsleistungen für Stimmensignale
Abbildung in dieser Leseprobe nicht enthalten
Formelzeichen
Abbildung in dieser Leseprobe nicht enthalten
Notationen
Abbildung in dieser Leseprobe nicht enthalten
Diese Arbeit bildete den Abschluss meines zweijährigen Masterstudiums an der Hochschule für Telekommunikation Leipzig
Ich möchte mich besonders bei den Herren Prof. Dr.-Ing. Michael Dlabka und Kai Kuhnert, M.Eng. sowie bei Frau Prof. Dr.-Ing. Ines Rennert für die Unterstützung und fachlichen Diskussionen bei der Bearbeitung dieses Themas bedanken. Ebenso danke ich Frau Dipl. Bibl. (FH) Gisela Biermann für die unkomplizierte Literaturbeschaffung sowie den Herren Dipl. Ing. (FH) Andrzej Wiatrek, Dipl. Ing. (FH) Sebastian Höpfner, Dipl. Ing. (FH) Georg Müller und Frau Pia Heine für die vielfältigen und zahlreichen Anregungen
Schließlich gilt herzlicher Dank meiner Familie, die mich während der gesamten Zeit unterstützte und das Studium erst ermöglichte
Karlsruhe, Hermsdorf, im September 2010 Michael Franke
Die Thematik der Arbeit ordnet sich in das Entwicklungsprojekt „Schallquellenidentifika- tor für Raum- und Bauakustik“ (SIRA) ein, welches die Hochschule für Telekommunikati- on Leipzig in Kooperation mit der MTL Mikrofontechnik Leipzig GmbH durchführt. Das Ziel dieses Projektes ist die Realisierung eines Messsystems, welches durch die Verarbei- tung akustischer Signale eine Lokalisierung von Schallquellen in Räumen ermöglichen soll. Das Messsystem besteht aus der räumlichen Anordnung mehrerer Mikrofone (Mikrofonar- ray), deren Ausgangssignale in einem nachgeschalteten Verarbeitungsalgorithmus additiv überlagert werden. Dieses Prinzip wird als Beamforming bezeichnet, da ein aus isotro- pen Sensoren bestehendes Array eine anisotrope Richtcharakteristik (engl. Beampattern) ausbildet. Mithilfe des Signalverarbeitungsalgorithmus ist es möglich, die Richtcharakte- ristik so zu beeinflussen, dass Signale aus einer Vorzugsrichtung ungestört empfangen und gleichzeitig potenzielle Störer richtungsselektiv gedämpft werden.
Beamformer sind in der Lage, die Vorzugsrichtung des Arrays ohne eine mechanische Einflussnahme zu verändern. Da dies vergleichbar mit der Wirkung eines herkömmli- chen elektrischen Frequenzfilters ist, wird Beamforming auch als räumliche Filterung oder räumliche Abtastung bezeichnet. Aus diesem Grund eignen sich Beamformer zur Schallquellenlokalisation, was u. a. durch Kuhnert [Kuh06] dargelegt wurde. Die Arbeit beschäftigte sich mit verschiedenen statischen, d. h. datenunabhängigen Beamforming- verfahren und zeigte auf, dass die geometrische Ausführung des Mikrofonarrays großen Einfluss auf die Richtcharakteristik und damit auch auf die Eignung zur Schallquellenloka- lisation hat. Weiterführende theoretische Untersuchungen und Simulationen zum Array- design wurden später von Uhlich [Uhl07] sowie von Seifert und Wunderlich [SW08] durchgeführt.
Auf der Basis von [Kuh06] wurde der Delay and Sum-Beamformer (DSB) für das SIRA- Projekt ausgewählt. Dabei handelt es sich um einen einfachen, signalunabhängigen Beam- formingalgorithmus. Durch Simulationen und praktische Messungen konnte demonstriert werden, dass der DSB in der Lage ist, eine Schallquelle im Raum zu orten - die Existenz mehrerer Quellen führte jedoch meist zu mehrdeutigen oder falschen Analyseergebnissen.
Diese Tatsache war Anlass für die Untersuchung der Einsatzmöglichkeiten adaptiver Be- amformer zur Schallquellenlokalisation durch Küttner [Küt07]. Darin wurde der sog. Minimum Variance Distortionless Response-Beamformer (MVDR) betrachtet. Das Ver- fahren ist in der Lage, Störquellen, welche nicht aus der Beamformerblickrichtung ein- strahlen, sehr stark zu dämpfen. Dies erfolgt durch eine signalabhängige Anpassung des Übertragungsverhaltens.
Bei theoretischer Betrachtung ermöglicht der MVDR-Ansatz eine im statistischen Sinne optimale Störerunterdrückung und sollte sich dadurch hervorragend zur Schallquellenlo- kalisation eignen. Deshalb werden in dieser Arbeit anhand von MatLab-Simulationen Performance-Analysen des MVDR-Beamformers durchgeführt und die erzielbaren Ergeb- nisse mit denen des Delay and Sum-Beamformers verglichen. Es wird untersucht, wie die Systeme auf verschiedene Parameteränderungen reagieren und welche Konsequenzen sich daraus für die Anwendung zur Schallquellenlokalisation ergeben. Des Weiteren wird die Performance der Beamformer in unterschiedlich „anspruchsvollen“ akustischen Umgebun- gen betrachtet. Sowohl in vergangenen Arbeiten als auch in der Mehrzahl der themenre- levanten Veröffentlichungen wurden meist nur zwei oder drei Rauschsignale simuliert und damit die grundlegenden Funktionsweisen eines Beamformers demonstriert. Um einen stärkeren Praxisbezug herzustellen, werden in der vorliegenden Arbeit Simulationen mit bis zu 20 Schallquellen durchgeführt, wobei neben Rauschsignalen auch reale Geräusch- und Stimmensignale verwendet werden.
In Kapitel 2 erfolgt zunächst eine Einführung in die Grundlagen von Beamformingverfah- ren. Es werden die räumliche Abtastung durch ein Mikrofonarray und anschließend der De- lay and Sum-Beamformer mathematisch beschrieben. Anhand der Schilderung der Nach- teile des statischen Beamformings erfolgt die Überleitung zum MVDR-Prinzip. An dieser Stelle sei auch auf die Veröffentlichung von Van Veen und Buckley [VVB88] hingewie- sen - darin enthalten ist eine relativ umfangreiche und zugleich leicht verständliche Dar- legung aller Aspekte, die im Zusammenhang mit Beamformingverfahren von Bedeutung sein können. Die Erweiterung des (schmalbandigen) adaptiven MVDR-Beamformings auf breitbandige Anwendungen erfolgt in Kapitel 3. Darin werden die Zeit- und Frequenzbe- reichrealisierungen eines solchen Systems hergeleitet, welche die Grundlage für die oben erwähnten und in Kapitel 4 dokumentierten Performance-Untersuchungen bilden. Kapi- tel 5 schließt die Arbeit mit einem Fazit ab.
Wie schon einleitend in Kapitel 1 erwähnt, wird die gezielte Beeinflussung der Richtcha- rakteristik eines Sensor- (bzw. im konkreten Fall Mikrofon-) arrays als Beamforming be- zeichnet. Das Array besteht aus mehreren im Raum angeordneten Mikrofonen, wobei die Anzahl N von den konkreten Anforderungen an die Richtcharakteristik abhängt. Weitere Einflussfaktoren sind u. a. die Mikrofonabstände sowie die Art der räumlichen Anordnung [Uhl07]. Die Richtcharakteristik des Arrays ist im Allgemeinen gekennzeichnet durch einen Hauptkeulenbereich, innerhalb dessen einfallende Signale bevorzugt empfangen werden, und einen Nebenkeulenbereich, der zur Unterdrückung oder Dämpfung von Störsignalen genutzt werden kann. Beim Beamforming wird die Lage dieser Bereiche beeinflusst, indem die Signale xn(t) der einzelnen Mikrofone gezielt mit unterschiedlichen Zeit- oder Pha- senverzögerungen und Gewichtungen beaufschlagt werden. Die Mikrofonsignale werden in jedem räumlichen Abtastpunkt zum Ausgangssignal y(t) des Beamformers aufsummiert; eine Schallquelle ist in der Richtung zu vermuten, bei der y(t) ein Extremum aufweist.
Um die mathematische Modellierung dieses Prozesses möglichst übersichtlich zu gestal- ten, werden die Betrachtungen für ein lineares Array mit N äquidistant im Abstand d angeordneten Mikrofonen durchgeführt (ULA, engl. uniform linear array, Abb. 2.1). Es soll zunächst nur eine Schallquelle existieren, welche sich im Fernfeld des Arrays befindet. Diese Bedingung rechtfertigt es, die einfallenden Wellenfronten als eben zu betrachten. Sowohl die Quelle als auch die Sensoren besitzen eine isotrope Richtcharakteristik und keine räumliche Ausdehnung. Die Schallgeschwindigkeit im Medium sei c = 343 m/s und es wird davon ausgegangen, dass keine Mehrwegeausbreitung stattfindet.
Abbildung in dieser Leseprobe nicht enthalten
Abbildung 2.1: lineares Array mit äquidistant angeordneten Mikrofonen (ULA)
Abbildung in dieser Leseprobe nicht enthalten
Abbildung 2.2: Definition der Kugelkoordinaten
Zur Beschreibung der Richtung, aus der die ebenen Wellenfronten der Quelle s(t) einfallen, ist eine Darstellung in Kugelkoordinaten mit
Abbildung in dieser Leseprobe nicht enthalten
vorteilhaft (Abb. 2.2).
Damit kann der Einheitsvektor ξS definiert werden, welcher die Einfallsrichtung (DOA, engl. direction of arrival) des Schallfeldes in Abhängigkeit der Elevation θS sowie dem Azimut φS angibt.
Abbildung in dieser Leseprobe nicht enthalten
Die Anordnung der Mikrofone führt dazu, dass das Wellenfeld diese mit unterschiedlichen Zeitverzögerungen τn erreicht, wenn |φS | = 90◦ (siehe Abb. 2.1). Da es nicht möglich ist, Rückschlüsse auf die Übertragung des Signals zwischen der Quelle und dem Mikrofonar- ray zu ziehen, wird nur die Ausbreitung des Schallfeldes innerhalb der Arraygeometrie betrachtet. Für die Berechnung der Verzögerungen zwischen den Mikrofonen ist ein Be- zugspunkt notwendig, welcher nachfolgend in den Koordinatenursprung gelegt wird. Bei Vernachlässigung von Dämpfungserscheinungen bzw. der Pfadverluste zwischen Signal- quelle und Mikrofon ist die Beschreibung durch die Raumimpulsantwort gn(t) möglich.
Abbildung in dieser Leseprobe nicht enthalten
Für die Mikrofonsignale gilt dann
Abbildung in dieser Leseprobe nicht enthalten
Wird die Position des n-ten Mikrofons mit dem Ortsvektor
Abbildung in dieser Leseprobe nicht enthalten
beschrieben, so gilt nach [Kuh06, VT02] für τn der Zusammenhang
Abbildung in dieser Leseprobe nicht enthalten
Die Signale werden in den Frequenzbereich überführt. Mit (2.6) lautet die Fouriertransformierte der Gleichung (2.4)
Abbildung in dieser Leseprobe nicht enthalten
Abbildung 2.3: Prinzipschaltbild eines Beamformers im Frequenzbereich
Die Xn(jω) sind die in den Frequenzbereich transformierten Eingangssignale des Beam- formers (Abb. 2.3); die Exponentialterme werden als Phasenfaktoren an(jω, ξS ) bezeich- net.
Abbildung in dieser Leseprobe nicht enthalten
Es ist zweckmäßig, die jeweils N Phasenfaktoren und Fourier-transformierten Mikrofonsignale in N × 1-Vektoren zusammenzufassen.
Abbildung in dieser Leseprobe nicht enthalten
Mit dem Skalarprodukt ξTS rn enthälta(jω,ξS ) die Arraygeometrie sowie die Einfallsrich- tung des Wellenfeldesa. Somit beschreibt dieser Vektor die Antwort des Mikrofonarrays auf ein Signal ohne Berücksichtigung des verwendeten Beamformingalgorithmus. In der Lite- ratur wird a(ξS ) deshalb meist als Array Response- oder Array Manifold-Vektor [VT02] bezeichnet.
aNachfolgend wird auf das Mitführen der Frequenzabhängigkeit verzichtet.
Aufbauend auf den zuvor genannten grundlegenden Zusammenhängen beim Einsatz eines Sensorarrays wird in diesem Abschnitt einer der einfachsten statischen Beamformer, der sog. Delay and Sum-Beamformer (DSB), erläutert. Der Begriff „statisch“ impliziert hierbei, dass die Signalverarbeitung unabhängig von den empfangenen Daten erfolgt.
Die Grundidee des DSB-Algorithmus ist es, durch zusätzliche Phasenverschiebungen (Delay) der Signale xn(t) das Array virtuell zu „drehen“. Dadurch werden die Mikrofone des linearen Arrays blickrichtungsabhängig in einer Ebene parallel zu den einfallenden Wellenfronten positioniert, auch wenn Einfallswinkel |φs| = 90◦ auftreten. Somit wird erreicht, dass bei der nachfolgenden Überlagerung der einzelnen Signale (Sum) jeweils in der Blickrichtung konstruktive Interferenz auftritt und das räumlich abgetastete Quellensignal ungestört am Ausgang anliegt. Die virtuelle Ausrichtung durch den Beamformer wird mittels des Einheitsvektors ξ0 beschrieben (vgl. Abb. 2.1).
Abbildung in dieser Leseprobe nicht enthalten
Da das Array nicht mechanisch bewegt wird, wird ξ0 als Blickrichtung des Beamformers bezeichnet. Mit dieser Definition und der Gleichung (2.2) gilt für den bedeutsamen Fall der Ausrichtung des Beamformers auf die Schallquelle
Abbildung in dieser Leseprobe nicht enthalten
Unter dieser Bedingung ist a0 der sog. Array Steering-Vektor (ASV). Zur Vereinfachung der Schreibweise wird folgende Festlegung getroffen:
Abbildung in dieser Leseprobe nicht enthalten
Die durch den Beamformer erzeugten Phasenverzögerungen werden durch komplexe Gewichte w∗n realisiert.Angewendetauf(2.7 )folgtdamit
Abbildung in dieser Leseprobe nicht enthalten
Das Ausgangssignal des DSB besteht aus der additiven Überlagerung der zusätzlich pha- senverschobenen Mikrofonsignale (2.15).
Abbildung in dieser Leseprobe nicht enthalten
Die Normierung mit dem Faktor 1/N ist notwendig, um eine N -fache Signalverstärkung zu vermeiden. In Abb. 2.4 ist das dazugehörige Blockschaltbild dargestellt.
Abbildung in dieser Leseprobe nicht enthalten
Abbildung 2.4: Blockschaltbild des DSB im Frequenzbereich
Um die noch unbestimmten Gewichte w∗n zuermitteln,wird(2.16 )durchS(jω)dividiert und (2.2 ) eingesetzt; man erhält bhängige Übertragungsfunktion des Systems zu
Abbildung in dieser Leseprobe nicht enthalten
Es wird gefordert, dass ein aus der Blickrichtung ξ0 einfallendes Signal das System ungedämpft und unverzerrt passieren kann.
Abbildung in dieser Leseprobe nicht enthalten
Wird die Ausrichtungsbedingung (2.13) in (2.17) eingesetzt, heißt das, dass für jedes der
Abbildung in dieser Leseprobe nicht enthalten
erfüllt sein muss. Für die Wichtungskoeffizienten folgt damit
Abbildung in dieser Leseprobe nicht enthalten
und die (auch von der Blickrichtung abhängige) DSB-Übertragungsfunktion (2.17) lautet
Abbildung in dieser Leseprobe nicht enthalten
Die Summation in (2.21) ermöglicht die Verwendung einer kompakten Vektorschreibweise. Hierfür werden die w∗n unddieNormierung1 /Nineinem1 ×N-VektorwH zusammen-
Abbildung in dieser Leseprobe nicht enthalten
Unter Einbeziehung der Definition des Array Response Vektors (2.10) lautet (2.21)
Abbildung in dieser Leseprobe nicht enthalten
und entsprechend gilt für das Spektrum des Ausgangssignals
Abbildung in dieser Leseprobe nicht enthalten
Diese beiden Gleichungen gelten grundsätzlich für alle Beamformingalgorithmen. Die Indizierung deutet darauf hin, dass sich verschiedene Verfahren letztendlich nur in der Berechnung des Wichtungsvektors w unterscheiden. Aus diesem Grund ist es gerechtfertigt, den Vektor w als Beamformer im engeren Sinne zu bezeichnen.
Gleichung (2.23) gestattet es, das Beampattern |G(jω, ξ0, ξS )| eines DSB-Systems grafisch darzustellen, wenn eine konkrete Arraygeometrie vorliegt. Dies soll am Beispiel des ULA mit N = 5 Mikrofonen erfolgen, obwohl (2.23) aufgrund der Vektoren rn, ξ0 und ξS für beliebige Arraygeometrien Gültigkeit besitzt.
Die Frequenz des Schallfeldes s(t) betrage f = 3430 Hz und die Mikrofone seien im Ab- stand d = λ/2 = 0,05 m angeordnet. Abbildung 2.5 zeigt die Beampattern für die Beam- formerblickrichtungen φ0 = 90◦ und φ0 = 40◦; Haupt- und Nebenkeulenbereiche sind deutlich erkennbar. Bei φ0 = 90◦ (−) wird die Richtcharakteristik des ULA durch den Beamformer nicht beeinflusst. Wird der Beamformer auf φ0 = 40◦ ausgerichtet (− · −) verschiebt sich die Hauptkeule entsprechend. Außerdem ist dabei ersichtlich, dass sich die Hauptkeule auch verbreitert. Die Ursache dafür ist die virtuelle Verschiebung der Mikrofone. Diese erfolgt entlang einer Geraden in Richtung φ0, was wiederrum zu einer Verkürzung des effektiven Abstandes zwischen den Mikrofonen und damit zu einer ver-
Abbildung in dieser Leseprobe nicht enthalten
Abbildung 2.5: Beampattern eines DSB bei verschiedenen Ausrichtungen (ULA mit N = 5, d = 0,05 m)
ringerten räumlichen Auflösung des Systems führt. Nähere Ausführungen dazu sind in [Kuh06, Uhl07, VT02] zu finden.
Aus Abb. 2.5 geht hervor, dass der Betrag des Beampatterns |G(jω, ξ0, ξS )| in der Rich- tung ξ0 stets 1 ist. Außerhalb des Hauptkeulenbereichs treten Nullstellen sowie unter- schiedlich große Nebenmaxima auf, deren Lage von der jeweiligen Blickrichtung des Be- amformers abhängt. Diese Eigenschaften sind im Allgemeinen typisch für statische Beam- formingalgorithmen und wie in [SW08] gezeigt wurde, können sie auch durch vom ULA abweichende Arraydesigns nicht völlig vermieden werden. Für eine Schallquellenlokalisati- on in Räumen stellen jedoch solche Eigenschaften einer Array/Beamformer-Kombination einen erheblichen Nachteil dar.
Wie schon ansatzweise in Abschnitt 2.1 erläutert, erfolgt die Quellenlokalisation dadurch, dass die Ausrichtung des Beamformers in einem bestimmten Winkelraster diskret ver- ändert wird. In jeder Richtung wird das räumliche Schallfeld abgetastet und die Signa- le entsprechend des verwendeten Beamformingalgorithmus verarbeitet. Bei Anwendung des zuvor genannten stark idealisierten Signalmodells ist die Ortung einer Schallquelle s1(t) möglich [Küt07]. Wird aber vom „üblicheren“ Fall ausgegangen, dass in der akus- tischen Umgebung des Mikrofonarrays noch mindestens eine weitere Quelle s2(t) mit φS1,θS1 =φS2 ,θS2 vorhandenist,soversagtdiesesPrinzip.IstderBeamformerbeispiels- weise auf die Quelle s1(t) ausgerichtet, besteht das Ausgangssignal y(t) nicht nur aus s1(t), sondern immer auch teilweise aus s2(t). Der konkrete Anteil von s2(t) am Ausgang y(t)
hängt vom Betrag des Beampatterns |G(jω, ξ0, ξS2 )| ab. Nur wenn die Einfallsrichtung des Störers s2(t) mit einer der Positionen der Nullstellen im Beampattern übereinstimmt, wird dieser unterdrückt und das Signal in Blickrichtung unverfälscht detektiert. Daraus resultiert die Forderung, dass in Hinblick auf ein präzises Analyseergebnis die Nebenkeulen der Richtcharakteristik möglichst „klein“ sein müssen - ein Verlauf wie der in Abb. 2.5 für φ0 = 40◦ dargestellte ist deshalb unbrauchbar.
Aus diesem Grund wurden im Rahmen des SIRA-Projektes durch Uhlich [Uhl07] und Franke [Fra08] verschiedene Möglichkeiten einer a priori-Beeinflussung des Beampat- terns untersucht (engl. beampattern shaping). Prinzipiell vergleichbar mit FIR-Filter- designmethoden erfolgt dabei die Berechnung des Wichtungsvektors w abweichend vom herkömmlichen DSB-Algorithmus (2.22). Es wird i. d. R. eine N -abhängige Anzahl von Nebenbedingungen formuliert, mittels derer Wert- bzw. Betragsvorgaben an bestimmten Stellen der Richtcharakteristik möglich sind. Die Untersuchungen zeigten, dass es bei der Anwendung der Verfahren auf ein ULA beispielsweise möglich ist, die Nebenkeulenhöhen sehr stark zu minimieren (|G| < 0,1 ) oder gezielte Nullstellenpositionierungen vorzuneh- men. Eine positive Beeinflussung war jedoch stets nur in einem bestimmten Bereich des Beampatterns möglich und ging mit negativen Effekten bspw. im Bereich der Hauptkeu- le einher (Verbreiterung oder teilweise auch Verschiebungseffekte). Ein weiterer Nachteil war, dass die Einflussnahme ad hoc, d. h. ohne Kenntnis der akustischen Gegebenheiten erfolgen musste . Deshalb war das Ergebnis der Anwendung dieser Methoden lediglich als Kompromiss zu interpretieren.
Die genannten negativen Aspekte des statischen Beamformings waren Ausgangspunkt da- für, dass durch Küttner [Küt07] die Performance adaptiver Beamformingalgorithmen bei der Schallquellenlokalisation analysiert wurde. Adaptive Beamformer (ABF) sind in der Lage, das Beampattern in Abhängigkeit der empfangenen Daten zu beeinflussen. Der Wichtungsvektor w wird mithilfe von Optimierungsmethoden und unter Berücksichti- gung statistischer Größen der Signale berechnet. Im Gegensatz zum signalunabhängigen statischen Beamforming können deshalb Störer (theoretisch) besser gedämpft oder u. U. sogar vollständig unterdrückt werden. Es existieren verschiedene Kategorien adaptiver Beamformer, die sich bezüglich der zugrunde liegenden Anwendung durch die jeweili- gen Optimierungsansätze unterscheiden [VVB88]. Die für die Schallquellenlokalisation aus heutiger Sicht bedeutsamste Gruppe ist die der sog. Minimum Variance-Beamformer. Bei diesen Verfahren wird der Wichtungsvektor so bestimmt, dass das aus der Blickrichtung einfallende gestörte Signal (SOI, engl. signal of interest) möglichst ungestört am Beam- formerausgang anliegt und gleichzeitig die Varianz σ2 n desStöranteilsminimiertwird.
Für die folgenden Betrachtungen muss zunächst das im Abschnitt2.1 eingeführte Modell der akustischen Umgebung erweitert werden. Die Eingangssignale x des Beamformers im Frequenzbereich bestehen nicht mehr nur aus dem Spektrum des Signals S1 · a, sondern sind durch additive Störungen n überlagert.
Abbildung in dieser Leseprobe nicht enthalten
Der Vektor n modelliert neben dem Rauschen auch diejenigen Störquellen, die neben dem SOI existieren, und wird deshalb als interference-plus-noise- bzw. IN-Komponente bezeichnet [LS06]. Mit (2.25) gilt dann gemäß (2.24) für das Frequenzspektrum des Ausgangssignals des adaptiven Beamformers
Abbildung in dieser Leseprobe nicht enthalten
Da eine Mehrwegeausbreitung ausgeschlossen wird, sind das SOI und die vom Array detektierten Störsignale unkorreliert. Ausgehend von diesen Annahmen kann die Herleitung eines der einfachsten adaptiven Beamformer erfolgen.
Der Ansatz des oben genannten Problems der Varianzminimierung des Störanteils lautet
Abbildung in dieser Leseprobe nicht enthalten
Die Forderung hinsichtlich einer unverzerrten und ungedämpften Übertragung des SOI zum Beamformerausgang bedeutet, dass die Übertragungsfunktion den Wert 1 haben muss, wenn der Beamformer auf die Quelle ausgerichtet ist. Wegen (2.23) muss deshalb
Abbildung in dieser Leseprobe nicht enthalten
als Gleichungsnebenbedingung der Optimierungsaufgabe gelten. Aus diesen beiden Glei- chungen leitet sich die Verfahrensbezeichnung „Minimum Variance Distortionless Respon- se“ (MVDR) abb. Zu erwähnen ist, dass der Delay and Sum-Beamformer ausschließlich auf dem DR-Kriterium basiert. Die Optimierungsaufgabe zur Findung des MVDRWichtungsvektors wird formuliert als
Abbildung in dieser Leseprobe nicht enthalten
Die Varianz des Störanteils kann unter Anwendung von (2.26) ersetzt werden durch
Abbildung in dieser Leseprobe nicht enthalten
Hierbei ist Φnn die spektrale Leistungsdichtematrix der IN-Komponente. Die Kostenfunktion wird mittels der Lagrange’schen Multiplikatormethode aufgestellt.
Abbildung in dieser Leseprobe nicht enthalten
Die Minimierung der Kostenfunktion erfordert die komplexe Gradientenbildung bezüglich w und das Gleichsetzen mit 0.
Abbildung in dieser Leseprobe nicht enthalten
Zur Bestimmung des unbekannten Lagrange-Multiplikators wird die Nebenbedingung (2.28) eingearbeitet, indem (2.33) mit a0 multipliziert und gleich 1 gesetzt wird.
Abbildung in dieser Leseprobe nicht enthalten
Die Lösung der Optimierungsaufgabe erhält man durch Einsetzen von (2.35) in (2.33).
Abbildung in dieser Leseprobe nicht enthalten
Somit liegt die Gleichung des Wichtungsvektors eines MVDR-Beamformers vor. Aus (2.36) geht hervor, dass die Berechnung die Kenntnis der (SOI-freien) spektralen Leistungsdich- tematrix Φnn erfordert. Diese ist aber bei Anwendungen der Schallquellenlokalisation in aller Regel nicht mess- oder schätzbar und es kann nur auf die Leistungsdichtematrix Φxx des „kompletten“ Eingangssignals zurückgegriffen werden (vgl. (2.25)). Das Optimierungs- ziel lautet dann
Abbildung in dieser Leseprobe nicht enthalten
was dazu führt, dass in (2.36) Φnn durch Φxx ersetzt werden muss. Das Verfahren wird dann als „Minimum Power Distortionless Response“ (MPDR) bezeichnet.
Abbildung in dieser Leseprobe nicht enthalten
Von vielen Autoren wird sowohl für (2.36) als auch für (2.38) die Bezeichnung „MVDRBeamformer“ verwendet (u.a. [BEVT00, KAM07]), obwohl die Gleichungen jeweils nur bei bestimmten Beamforming-Anwendungen nutzbar sind. Deshalb wird auch in dieser Arbeit auf eine Unterscheidung verzichtet; eine dezidierte Abgrenzung findet der geneigte Leser bei van Trees [VT02].
Der im Abschnitt 2.4 hergeleitete adaptive Beamformer
Abbildung in dieser Leseprobe nicht enthalten
ist wegen der Frequenzabhängigkeit des Steering Vektors nur bei schmalbandigen Anwendungen sinnvoll einsetzbar. Der Begriff der Schmalbandigkeit wird in diesem Zusammenhang in der Literatur sehr unterschiedlich definiert. In [VT02] wird die Annahme eines Schmalbandmodells von der Gültigkeit der Bedingung
Abbildung in dieser Leseprobe nicht enthalten
abhängig gemacht. Hierbei ist B die Bandbreite des Signals und ΔTmax die größte auf- tretende Zeitverzögerung zwischen zwei Mikrofonen des Arrays. Im Falle eines ULA gilt aufgrund der linearen Anordnung der Sensoren bspw. ΔTmax = N dc−1. Das bedeutet, dass die Bedingung (3.2) bereits ungültig ist, wenn ein Signal mit einer Bandbreite von B = 100Hz durch ein Array mit N = 11 und d = 0,05m räumlich abgetastet wird. Ein weiteres Kriterium für Schmalbandigkeit ist das Verhältnis zwischen Signalbandbreite und der oberen Frequenz, für die das Array bzw. der Abstand der Mikrofone dimensioniert ist. Als Grenze für schmalbandige Betrachtungen findet man in der Literatur häufig auch die Relation
Abbildung in dieser Leseprobe nicht enthalten
Da das SIRA-Messsystem in verschiedenen akustischen Umgebungen einsetzbar sein soll, kann nicht davon ausgegangen werden, dass die Bedingungen (3.2) und/oder (3.3) stets erfüllt sind. Deshalb werden nachfolgend Realisierungen eines breitbandigen Beamformers hergeleitet, deren Funktionsweise nicht von den o.g. Bedingungen abhängig ist.
Im Zeitbereich (TDM, engl. time domain method) erfolgt die Implementation eines breit- bandigen MVDR-Beamformers mittels einer FIR-Filtermatrix, mit der die Ausgangssi- gnale der Mikrofone verarbeitet werden. In Abb. 3.1 ist das dazugehörige Blockschaltbild dargestellt, wobei die Gewichte bzw. Filterkoeffizienten entsprechend dem MVDR-Prinzip adaptiert werden. Der Vorteil dieser Struktur ist, dass die Fähigkeit zur Störerunter- drückung unmittelbar durch die Filterordnung beeinflusst wird. Da das Verfahren auf Frost [Fro72] zurückgeht, wird dieser Beamformer in der Literatur häufig als Frost- Beamformer bezeichnet; die nachfolgende Herleitung basiert sowohl auf [Fro72] als auch auf [VT02].
Abbildung in dieser Leseprobe nicht enthalten
Abbildung 3.1: Breitband-MVDR-Beamformer im Zeitbereich nach [Fro72]
Ein wesentliches Merkmal eines Breitband-Beamformers ist die von den Wichtungen ge- trennte Vorausrichtung (engl. presteering). Damit wird eine zeitliche Verschiebung der Mi- krofonsignale entsprechend der jeweiligen Beamformerblickrichtung realisiert, d. h. es werden die (blickrichtungsabhängigen) Zeitverzögerungen der Mikrofonsignale x1, x2, . . . , xN kompensiert, die aus den unterschiedlichen Sensorpositionen resultieren. In Abb. 3.1 ist die Presteering-Funktion in allgemeiner Form dargestellt, da sie für die Berechnung der Koeffizienten der FIR-Struktur eine untergeordnete Rolle spielt. An dieser Stelle ist zunächst nur relevant, dass die Ausgangssignale des Presteering-Blocks x11, x21, . . . , xN1 die zeitlich ausgerichteten Eingangssignale der Filtermatrix darstellen. In Abschnitt 3.5 wird auf die Realisierung der Vorausrichtung nochmals Bezug genommen.
Es wird davon ausgegangen, dass je Mikrofonkanal K Abtastwerte zur Verfügung stehen. Das Signal eines jeden Kanals wird mit der Abtastperiode TA gesampelt (x1(kTA), x2(kTA), . .. , xN (kTA)) und mit einem FIR-Filter der Ordnung L verarbeitet. Das bedeutet, dass für jeden Kanal
Abbildung in dieser Leseprobe nicht enthalten
(reelle) Filterkoeffizienten zu berechnen sind. Die unverzögerten Signale xn(kTA), n = 1...N, werden mit den Koeffizienten wn1 gewichtet und sollen bezeichnet werden als
Abbildung in dieser Leseprobe nicht enthalten
die um einen Takt verzögerten Signale
Abbildung in dieser Leseprobe nicht enthalten
werden mit den Gewichten wn2 multipliziert usw. Entsprechend ihrer zeitlichen Verzöge- rung werden die Signale in L Vektoren xl, l = 1 . . . L, der Dimension N × 1 angeordnet,
Abbildung in dieser Leseprobe nicht enthalten
und anschließend in einem N L × 1-Vektor x zusammengefasst.
18 3 Breitbandiges adaptives Beamforming
Abbildung in dieser Leseprobe nicht enthalten
Nach dem gleichen Schema wird der Wichtungsvektor w definiert. Die reellen FIR-Koeffi- zienten zur Wichtung der unverzögerten Signale lauten
Abbildung in dieser Leseprobe nicht enthalten
nach der L-ten Verzögerung erfolgt die Wichtung mit
Abbildung in dieser Leseprobe nicht enthalten
Für den Wichtungsvektor w der kompletten Filtermatrix (Dimension N L×1) gilt dann
Abbildung in dieser Leseprobe nicht enthalten
Bedingt durch die FIR-Filterstruktur wird das Ausgangssignal y des Breitband-Beam- formers berechnet mit
Abbildung in dieser Leseprobe nicht enthalten
woraus sich durch Anwendung der Definitionen (3.8) und (3.11)
Abbildung in dieser Leseprobe nicht enthalten
ergibt. Vergleichbar mit den Ausführungen zu Schmalband-Beamformern in Abschnitt 2.4 gilt somit auch für die Leistung des Ausgangssignals
Abbildung in dieser Leseprobe nicht enthalten
Da die Betrachtung bzw. Implementation des Systems im Zeitbereich erfolgt, wird für die Leistungsschätzung nicht mehr die spektrale Leistungsdichtematrix Φxx (vgl. (2.30)), sondern die Autokorrelationsmatrix Rxx der Eingangssignale benötigt (mit der Dimension NL × NL).
Zur Formulierung des MVDR-Optimierungsansatzes muss noch die Nebenbedingung aufgestellt werden, welche die verzerrungs- und verzögerungsfreie Übertragung des Signals aus der Blickrichtung ermöglicht. Ausgehend von der Filterstruktur in Abb. 3.1 folgt daraus, dass die Summe der Gewichte wn1 1 sein muss; die Summe aller weiteren Gewichte wn2 . .. wnL muss für alle n jeweils 0 sein.
Abbildung in dieser Leseprobe nicht enthalten
Um dieses Gleichungssystem in Vektorschreibweise darstellen zu können, werden N L × 1-Vektoren cl definiert, deren l-te Komponente der N × 1 große Einheitsvektor 1N ist (begründet durch die Vorausrichtung); alle weiteren Elemente sind Nullvektoren 0N der Größe N × 1.
Abbildung in dieser Leseprobe nicht enthalten
Spaltenweise werden die cl in der N L × L-Bedingungsmatrix C (engl. constraint) ange- ordnet, [ ]
Abbildung in dieser Leseprobe nicht enthalten
und die Absolutglieder aus (3.15) im L × 1-Vektor g zusammengefasst, [ ]T
Abbildung in dieser Leseprobe nicht enthalten
Nach diesen Schritten ist es möglich, das Gleichungssystem der Nebenbedingungen (3.15)
unter Einbeziehung der Definition des Wichtungsvektors (3.11) sowie (3.17) und (3.18)
darzustellen als
Abbildung in dieser Leseprobe nicht enthalten
Das Optimierungsproblem ist somit formulierbar als
Abbildung in dieser Leseprobe nicht enthalten
Da im Unterschied zum Schmalband-MVDR-Beamformer die Gewichte reell und die Ne- benbedingungen vektoriell sind, lautet die Kostenfunktion nach [VT02]
Abbildung in dieser Leseprobe nicht enthalten
Das Finden der Lösung erfolgt analog zu den Gleichungen (2.32) bis (2.36) und der Wichtungsvektor resultiert zu
Abbildung in dieser Leseprobe nicht enthalten
Bei der Umsetzung dieser Methode kommt der Berechnung der Autokorrelationsmatrix Rxx eine besondere Bedeutung zu. Wenn davon ausgegangen wird, dass der Beamformer nicht in Echtzeit arbeitet, dann stehen für den Ortungsprozess je Mikrofonkanal K Ab- tastwerte zur Verfügung (insgesamt N K). Die Autokorrelationsmatrix wird in diesem Fall
Abbildung in dieser Leseprobe nicht enthalten
berechnet, wobei xk der Definition (3.8) entspricht. In Kapitel 4 wird u. a. auch untersucht, inwiefern die Gesamtanzahl der zur Verfügung stehenden Abtastwerte K das Analyseergebnis beeinflusst.
Der oben erwähnte Zusammenhang zwischen Filterordnung und Störerunterdrückung geht aus dem Gleichungssystem der Nebenbedingungen (3.19) hervor. Die Anzahl der Koeffi- zienten der FIR-Filtermatrix nach Abb. 3.1 bzw. die der Elemente des Wichtungsvektors (3.11) entspricht der Gesamtzahl der Freiheitsgrade des Systems (N L). Durch die Vorga- be von L Gleichungen für das distortionless response-Kriterium (3.15) stehen insgesamt NL−L = L(N −1) Freiheitsgrade zur Verfügung. Die Fähigkeit zur Störerunterdrückung kann also verbessert werden, indem entweder die Anzahl der Mikrofone oder der Filter- elemente erhöht wird.
Die Implementation des Breitband-Beamformers im Frequenzbereich (FDM, engl. fre- quency domain method) basiert darauf, dass aus den K vorausgerichteten Abtastwerten jedes Mikrofonkanals sequenziell jeweils Q aufeinander folgende Werte (Q < K) mit- tels der FFT Fourier-transformiert werden [God95, VT02]. Daraus resultieren für jeden Kanal insgesamt Q diskrete Spektralanteile bzw. Subbänder, die mit Xn1, Xn2, . . . , XnQ bezeichnet werden sollen. Der spektrale Abstand beträgt Δf = fA/Q. Aufgrund die- ser Zerlegung im Frequenzbereich ist es möglich, jedes Subband mit einem Schmalband- MVDR-Beamformer zu verarbeiten. Das Ergebnis dieser Verarbeitung ist das Spektrum Y1, Y2, .. . ,YQ des Ausgangssignals y(kTA). Abbildung 3.2 zeigt das dieser Methode zu- grunde liegende Blockschaltbild.
Für jedes Subband q, q = 1, . . . , Q, werden N ×1-Vektoren xq definiert, deren Komponen- ten die q-ten Spektralanteile jedes Kanals enthalten. Der Index f soll hierbei verdeutlichen,
[...]
b Da das Verfahren auf Jack Capon (1969) zurückgeht, ist in der Literatur (bspw. [LSW03]) anstelle von MVDR- auch die Bezeichnung Capon-Beamformer gebräuchlich.
Der GRIN Verlag hat sich seit 1998 auf die Veröffentlichung akademischer eBooks und Bücher spezialisiert. Der GRIN Verlag steht damit als erstes Unternehmen für User Generated Quality Content. Die Verlagsseiten GRIN.com, Hausarbeiten.de und Diplomarbeiten24 bieten für Hochschullehrer, Absolventen und Studenten die ideale Plattform, wissenschaftliche Texte wie Hausarbeiten, Referate, Bachelorarbeiten, Masterarbeiten, Diplomarbeiten, Dissertationen und wissenschaftliche Aufsätze einem breiten Publikum zu präsentieren.
Kostenfreie Veröffentlichung: Hausarbeit, Bachelorarbeit, Diplomarbeit, Dissertation, Masterarbeit, Interpretation oder Referat jetzt veröffentlichen!
Kommentare