Zeit-basierte Darstellung (oben) und Frequenz-basierte Darstellung (unten) desselben Signals, wobei die untere Darstellung aus der oberen durch Fouriertransformation gewonnen werden kann

Die schnelle Fourier-Transformation (englisch fast Fourier transform, daher meist FFT abgekürzt) ist ein Algorithmus zur effizienten Berechnung der diskreten Fourier-Transformation (DFT). Mit ihr kann ein zeitdiskretes Signal in seine Frequenzanteile zerlegt und dadurch analysiert werden.

Analog gibt es für die diskrete inverse Fourier-Transformation die inverse schnelle Fourier-Transformation (IFFT). Es kommen bei der IFFT die gleichen Algorithmen, aber mit konjugierten Koeffizienten zur Anwendung.

Die FFT hat zahlreiche Anwendungen im Bereich der Ingenieurwissenschaften, der Naturwissenschaften und der angewandten Mathematik. Außerdem kommt sie in Mobilfunktechnologien wie UMTS und LTE und bei der drahtlosen Datenübertragung zum Einsatz, etwa in der WLAN-Funknetztechnik.

Die FFT gehört zu den Teile-und-herrsche-Verfahren, sodass – im Gegensatz zur direkten Berechnung – zuvor berechnete Zwischenergebnisse wiederverwendet und dadurch arithmetische Rechenoperationen eingespart werden können.

Historisch wurde die erste Form des Algorithmus 1805 von Carl Friedrich Gauß entdeckt und zur Berechnung der Flugbahnen der Asteroiden (2) Pallas und (3) Juno verwendet. Zum ersten Mal publiziert wurde eine Variante des Algorithmus von Carl Runge im Jahre 1903 und 1905. Es folgten weitere Adaptionen, beispielsweise von Irving John Good um 1960. Das heute bekannteste Verfahren der Fouriertransformation wird James Cooley und John W. Tukey zugeschrieben, die es auf der Suche nach einem Algorithmus, um Kernwaffentests in seismografischen Daten schnell und effizient aufzuspüren, entdeckten und 1965 veröffentlichten.[1][2] Nach Cooley und Tukey hat es darüber hinaus zahlreiche weitere Verbesserungsvorschläge und Variationen gegeben, so etwa von Georg Bruun, C. M. Rader und Leo I. Bluestein.

Informelle Beschreibung des Algorithmus (Cooley und Tukey)

[Bearbeiten | Quelltext bearbeiten]

Der Algorithmus von Cooley und Tukey ist ein klassisches Teile-und-herrsche-Verfahren. Voraussetzung für seine Anwendung ist, dass die Anzahl der Stützstellen bzw. Abtastpunkte eine Zweierpotenz ist.

Der Algorithmus basiert auf der Beobachtung, dass die Berechnung einer DFT der Größe 2n in zwei Berechnungen einer DFT der Größe n zerlegbar ist (über den Vektor mit den Einträgen der geraden bzw. der ungeraden Indizes), wobei die beiden Teilergebnisse nach der Transformation wieder zu einer Fouriertransformation der Größe 2n zusammenzufassen sind.

Da die Berechnung einer DFT der halben Länge nur ein Viertel der komplexen Multiplikationen und Additionen der originalen DFT benötigt, und je nach Länge des Ausgangsvektors diese Vorschrift mehrfach hintereinander anwendbar ist, erlaubt die rekursive Anwendung dieser Grundidee schließlich eine Berechnung in Zeit; zur Einsparung von trigonometrischen Rechenoperationen können bei der FFT zusätzlich die Eigenschaften der Einheitswurzeln aus der Fouriermatrix ausgenutzt werden.

Algorithmus von Cooley und Tukey

[Bearbeiten | Quelltext bearbeiten]

Die diskrete Fouriertransformation (DFT) eines Vektors der Dimension lautet

.

Die Einträge mit geraden Indizes werden notiert als

und deren DFT der Dimension als .

Entsprechend seien die Einträge mit ungeraden Indizes notiert als

mit DFT .

Dann folgt

Mit der Berechnung von und () ist sowohl als auch bestimmt. Der Rechenaufwand hat sich durch diese Zerlegung also praktisch halbiert.

Mathematische Beschreibung (allgemeiner Fall)

[Bearbeiten | Quelltext bearbeiten]

In der Mathematik wird die schnelle diskrete Fouriertransformation in einem wesentlich allgemeineren Kontext behandelt:

Sei ein kommutativer unitärer Ring. In sei die Zahl eine Einheit (d. h. invertierbar); ferner sei eine -te Einheitswurzel mit . Zum Beispiel ist im Restklassenring

mit , , d ungerade (das ist gleichbedeutend mit der Forderung „teilerfremd zu “),

das Element eine solche Einheitswurzel, die entsprechende FFT wird im Schönhage-Strassen-Algorithmus verwendet.

Dann lässt sich im Modul zu die diskrete Fouriertransformierte mit

wie folgt optimiert berechnen:

Zunächst stellen wir die Indizes und wie folgt dyadisch dar:

.

Damit haben wir folgende Rekursion:

,
.

Wegen

erhalten wir hieraus die diskrete Fouriertransformierte .

Eigenschaften

[Bearbeiten | Quelltext bearbeiten]

Diese klassische Variante der FFT nach Cooley und Tukey ist im Gegensatz zur DFT nur durchführbar, wenn die Länge des Eingangsvektors einer Zweierpotenz entspricht. Die Anzahl der Abtastpunkte kann also beispielsweise 1, 2, 4, 8, 16, 32 usw. betragen. Man spricht hier von einer Radix-2-FFT. Andere Längen sind mit den unten angeführten alternativen Algorithmen möglich.

Aus obiger Rekursion ergibt sich folgende Rekursionsgleichung für die Laufzeit der FFT:

Hierbei beschreibt der Term den Aufwand, um die Ergebnisse mit einer Potenz der Einheitswurzel zu multiplizieren und die Ergebnisse zu addieren. Es werden N Paare von Zahlen addiert und N/2 Zahlen mit Einheitswurzeln multipliziert. Insgesamt ist f(N) also linear beschränkt:

Mit dem Master-Theorem ergibt sich eine Laufzeit von:

Die Struktur des Datenflusses kann durch einen Schmetterlingsgraphen beschrieben werden, der die Reihenfolge der Berechnung festlegt.

Die Aussage hinsichtlich der Höhe der Amplitude eines Signalanteils und dessen Frequenz unterliegt einer Unschärfe: Je enger man die Frequenzbetrachtung fasst, desto weniger ist der Wert der FFT für diese Frequenz genau. Eine Präzisierung ist nur mittels Ausdehnung der FFT mit mehr Stützstellen möglich. Eine Interpretation der Amplituden für Zwischenfrequenzen ist mittels Umrechnungen möglich.[3]

Implementierung als rekursiver Algorithmus

[Bearbeiten | Quelltext bearbeiten]

Die direkte Implementierung der FFT in Pseudocode nach obiger Vorschrift besitzt die Form eines rekursiven Algorithmus:

Dies wird nun fortgeführt, bis das Argument eines Aufrufs der Funktion nur noch aus einem einzigen Element besteht (Rekursionsabbruch): Die FFT eines einzelnen Wertes ist (er besitzt sich selbst als Gleichanteil und keine weiteren Frequenzen) er selbst. Die Funktion, die nur noch einen einzigen Wert als Parameter erhält, kann also ganz ohne Rechnung die FFT dieses Wertes zurückliefern; die Funktion, die sie aufgerufen hat, kombiniert die beiden jeweils einen Punkt langen FFTs, die sie zurückerhält, die Funktion, die diese wiederum aufgerufen hat, die beiden 2-Punkte-FFTs, und so weiter.

Der Geschwindigkeitsvorteil der FFT gegenüber der DFT kann anhand dieses Algorithmus gut abgeschätzt werden:

Implementierung als nichtrekursiver Algorithmus

[Bearbeiten | Quelltext bearbeiten]

Die Implementierung eines rekursiven Algorithmus ist im Regelfall vom Ressourcenverbrauch her nicht ideal, da die vielen dabei notwendigen Funktionsaufrufe Rechenzeit und Speicher für das Merken der Rücksprungadressen benötigen. In der Praxis wird daher meist ein nichtrekursiver Algorithmus verwendet, der gegenüber der hier abgebildeten, auf einfaches Verständnis optimierten Form je nach Anwendung noch optimiert werden kann:

über einen Schmetterlingsgraphen kombiniert:

Alternative Formen der FFT

[Bearbeiten | Quelltext bearbeiten]

Neben dem oben dargestellten FFT-Algorithmus von Cooley und Tukey, auch Radix-2-Algorithmus genannt, existieren noch eine Reihe weiterer Algorithmen zur schnellen Fourier-Transformation. Die Varianten unterscheiden sich darin, wie bestimmte Teile des „naiven“ Algorithmus so umgeformt werden, dass weniger (Hochpräzisions-)Multiplikationen notwendig sind. Dabei gilt meist, dass die Reduktion in der Anzahl der Multiplikationen eine erhöhte Anzahl von Additionen sowie von gleichzeitig im Speicher zu haltenden Zwischenergebnissen hervorruft.

Im Folgenden sind übersichtsartig einige weitere Algorithmen dargestellt. Details und genaue mathematische Beschreibungen samt Herleitungen finden sich in der unten angegebenen Literatur.

Radix-4-Algorithmus

[Bearbeiten | Quelltext bearbeiten]

Der Radix-4-Algorithmus, und analog dazu der Radix-8-Algorithmus oder allgemein Radix-2N-Algorithmus, ist eine Weiterentwicklung des obigen Radix-2-Algorithmus. Der Hauptunterschied besteht darin, dass die Anzahl der zu verarbeitenden Datenpunkte eine Potenz von 4 bzw. 2N darstellen muss. Die Verarbeitungstruktur bleibt dabei gleich, nur dass in dem Schmetterlingsgraphen pro Element statt zweier Datenpfade vier bzw. acht und allgemein 2N Datenpfade miteinander verknüpft werden müssen. Der Vorteil besteht in einem weiter reduzierten Rechenaufwand und damit Geschwindigkeitsvorteil. So sind, verglichen mit dem obigen Algorithmus von Cooley und Tukey, bei dem Radix-4-Algorithmus ca. 25 % weniger Multiplikationen notwendig. Bei dem Radix-8-Algorithmus reduziert sich die Anzahl der Multiplikationen um ca. 40 %.

Nachteil dieser Verfahren ist die gröbere Struktur und ein aufwendigerer Programmcode. So lassen sich mit Radix-4-Algorithmus nur Blöcke der Längen 4, 16, 64, 256, 1024, 4096, … verarbeiten. Bei dem Radix-8-Algorithmus sind die Einschränkungen analog zu sehen.

Winograd-Algorithmus

[Bearbeiten | Quelltext bearbeiten]

Bei diesem Algorithmus ist nur eine bestimmte, endliche Anzahl von Stützstellen der Anzahl möglich, nämlich:

wobei alle Kombinationen von zulässig sind, bei denen die verwendeten teilerfremd sind. Dadurch ist nur eine maximale Blocklänge von 5040 möglich. Die möglichen Werte für liegen aber in dem Bereich bis 5040 dichter auf der Zahlengeraden als die Zweierpotenzen. Es ist damit eine bessere Feinabstimmung der Blocklänge möglich. Aufgebaut wird der Algorithmus aus Basisblöcken der DFT, deren Längen mit korrespondieren. Bei diesem Verfahren wird zwar die Anzahl der Multiplikationen gegenüber dem Radix-2-Algorithmus reduziert, gleichzeitig steigt aber die Anzahl der notwendigen Additionen. Außerdem ist am Eingang und Ausgang jeder DFT eine aufwendige Permutation der Daten notwendig, die nach den Regeln des Chinesischen Restsatzes gebildet wird.

Diese Art der schnellen Fourier-Transformation besitzt in praktischen Implementierungen dann Vorteile gegenüber der Radix-2-Methode, wenn der für die FFT verwendete Mikrocontroller keine eigene Multipliziereinheit besitzt und für die Multiplikationen sehr viel Rechenzeit aufgewendet werden muss. In heutigen Signalprozessoren mit eigenen Multipliziereinheiten hat dieser Algorithmus keine wesentliche Bedeutung mehr.

Primfaktor-Algorithmus

[Bearbeiten | Quelltext bearbeiten]

Dieser FFT-Algorithmus basiert auf ähnlichen Ideen wie der Winograd-Algorithmus, allerdings ist die Struktur einfacher und damit der Aufwand an Multiplikationen höher als beim Winograd-Algorithmus. Der wesentliche Vorteil bei der Implementierung liegt in der effizienten Ausnutzung des zur Verfügung stehenden Speichers durch optimale Anpassung der Blocklänge. Wenn in einer bestimmten Anwendung zwar eine schnelle Multipliziereinheit verfügbar ist und gleichzeitig der Speicher knapp, kann dieser Algorithmus optimal sein. Die Ausführungszeit ist bei ähnlicher Blocklänge mit der des Algorithmus von Cooley und Tukey vergleichbar.

Goertzel-Algorithmus

[Bearbeiten | Quelltext bearbeiten]

Der Goertzel-Algorithmus stellt eine besondere Form zur effizienten Berechnung einzelner Spektralkomponenten dar und ist bei der Berechnung von nur einigen wenigen Spektralanteilen (englisch Bins) effizienter als alle blockbasierenden FFT-Algorithmen, welche immer das komplette diskrete Spektrum berechnen.

Chirp-z-Transformation

[Bearbeiten | Quelltext bearbeiten]

Bluestein-FFT-Algorithmus für Datenmengen beliebiger Größe (einschließlich Primzahlen).

Die inverse FFT

[Bearbeiten | Quelltext bearbeiten]

Die Inverse der diskreten Fourier-Transformation (DFT) stimmt bis auf den Normierungsfaktor und ein Vorzeichen mit der DFT überein. Da die schnelle Fourier-Transformation ein Algorithmus zur Berechnung der DFT ist, gilt dies dann natürlich auch für die IFFT.

Anwendungen

[Bearbeiten | Quelltext bearbeiten]

Computeralgebra

[Bearbeiten | Quelltext bearbeiten]
Schnelle Polynommultiplikation in subquadratischer Laufzeit

Klassische Anwendungen der schnellen Fourier-Transformation finden sich beispielsweise in der Computeralgebra im Zusammenhang der Implementierung schneller Polynome-verarbeitender Algorithmen. Wie im Schaubild rechts illustriert lässt sich etwa eine schnelle Multiplikation zweier Polynome und zu in subquadratischer Laufzeit realisieren. Dabei werden zunächst die zu den beiden Polynomen und korrespondierenden Koeffizientenfolgen durch schnelle Fourier-Transformation in Laufzeit transformiert, sodass sich die zum Polynom korrespondierende fouriertransformierte Koeffizientenfolgen durch komponentenweise Multiplikation in Laufzeit ergibt. Diese wird schlussendlich durch schnelle inverse Fourier-Transformation in Laufzeit rücktransformiert. Die Gesamtlaufzeit liegt in und ist damit asymptotisch effizienter im Vergleich zur klassischen Polynommultiplikation mit Laufzeit .

Weitere Anwendungsgebiete

[Bearbeiten | Quelltext bearbeiten]

Die weiteren Anwendungsgebiete der FFT sind so vielseitig, dass hier nur eine Auswahl wiedergegeben werden kann:

Literatur

[Bearbeiten | Quelltext bearbeiten]

Zeitschriftenartikel

[Bearbeiten | Quelltext bearbeiten]

Bücher

[Bearbeiten | Quelltext bearbeiten]
[Bearbeiten | Quelltext bearbeiten]

Einzelnachweise

[Bearbeiten | Quelltext bearbeiten]
  1. Ein Algorithmus für den Weltfrieden
  2. The re-discovery of the fast Fourier transform algorithm
  3. Zhongdong Liu; Jörg Himmel; Karl Walter Bonfig: Improved processing of harmonics and interharmonics by time-domain averaging. In: IEEE-Paper. https://ieeexplore.ieee.org, 3. Oktober 2005, abgerufen am 1. Mai 2024 (englisch, DOI:10.1109/TPWRD.2005.855477).
  4. JPEG (Transform Compression). Abgerufen am 27. Juli 2021.