Grundlagen der ARMA-Modelle unter besonderer Berücksichtigung der
Anwendung in der EEG-Analyse
Ralf BENDER
Medizinische Hochschule Hannover
01.02.1991
1. Grundidee der Zeitreihenanalyse
Um die Theorie der ARMA-Modelle auf die EEG-Analyse anzuwenden, muß ein betrachteter
EEG-Abschnitt als Zeitreihe
|
y = (yt)t=1,...,n = (y1,...,yn)
|
d.h. als Folge von n reellen Zahlen yt angesehen werden.
Ein EEG-Abschnitt von z.B. zwei Sekunden ist also gegeben durch n=256 Werte yt,
falls pro Sekunde 128 Werte gemessen werden. Eine gegebene Zeitreihe wird betrachtet als
Realisation eines stochastischen Prozesses Y=(Yt). Zu jedem Zeitpunkt t ist
Yt eine Zufallsvariable; die einzelnen Yt sind untereinander
abhängig. Jeder stochastische Prozess besitzt ein eigenes charakteristisches
Abhängigkeitsmuster. Die möglichen Realisationen eines stochastischen Prozesses,
auch "Pfade" genannt, sind i.a. voneinander verschieden, lassen aber alle ein
bestimmtes Abhängigkeitsmuster erkennen.
Ziel der Zeitreihenanalyse ist es, mit Hilfe eines Pfades, nämlich der gemessenen
Zeitreihe, die Eigenschaften des zugrundeliegenden stochastischen Prozesses zu untersuchen.
Damit dies überhaupt möglich ist, muß der stochastische Prozeß gewisse
Eigenschaften erfüllen. Eine zentrale Bedingung ist die Stationarität,
d.h. - grob gesprochen - die Wahrscheinlichkeitsverteilungen und Abhängigkeiten
der Yt dürfen sich im Zeitverlauf nicht ändern. Das EEG ist über
lange Zeiträume gesehen im Prinzip ein nicht-stationäres Signal.
Die Veränderungen vollziehen sich jedoch i.d.R. langsam, so daß ein
quasi-stationäres Signal entsteht. Das bedeutet, daß kurze EEG-Abschnitte
bis zu 10 Sekunden als stationär angesehen werden können. Damit erhält
man die Möglichkeit, Verfahren der Zeitreihenanalyse, die die Stationarität
voraussetzen, für kurze EEG-Abschnitte zu nutzen.
2. Das ARMA-Modell
Es hat sich herausgestellt, daß gewisse mathematische stochastische Modelle besonders
gut geeignet sind, um die Struktur von stochastischen Prozessen zu beschreiben. Eine der
wichtigsten Modellklassen der Zeitreihenanalyse ist die der Autoregressiven Moving-Average
(ARMA)-Prozesse, die auf BOX & JENKINS (1970) zurückgehen.
Spezialfälle hiervon sind das reine AR- sowie das reine MA-Modell.
Ein AR(p)-Modell ist gegeben durch die Gleichung
|
Yt = a1Yt-1+...+apYt-p + et
|
(1) |
wobei die et unabhängige und identisch verteilte Zufallsvariablen sind,
d.h. keinem Abhängigkeitsmuster folgen; p heißt die Ordnung des Modells.
Formal sieht (1) aus wie eine lineare Regressionsgleichung, die erklärenden Variablen
für Yt sind jedoch die eigenen p Vergangenheitswerte
Yt-1,...,Yt-p. Anschaulich bedeutet (1), daß der Wert
Yt zum Zeitpunkt t entsteht durch eine Linearkombination von p Vergangenheitswerten
und einer zusätzlichen stochastischen Größe et.
Ein MA(q)-Modell genügt der Gleichung
|
Yt = b1et-1+...+bqet-q + et
|
(2) |
d.h. hier bilden die Yt gleitende gewichtete Mittel ("Moving Average") aus
gegenwärtigen und vergangenen Zufallseinflüssen. Durch eine Kombination von
AR(p)- und MA(q)-Modell ensteht das gemischte
ARMA(p,q)-Modell
| Yt = a1Yt-1+...+apYt-p + b1
et-1+...+bqet-q + et |
(3) |
Viele ähnlich lautende Modelle (ARIMA, SARIMA, BARMA, ARMAX, VARMA, STARMA, RARMA, TAR,
etc.) sind Verallgemeinerungen des grundlegenden Modells (3).
Der Vorteil all dieser parametrischen Modelle ist, daß die wesentlichen Eigenschaften
des stochastischen Prozesses in relativ wenigen Parametern zusammengefaßt werden.
Schwierig ist hingegen die Auswahl des richtigen Modells, die sehr sorgfältig erfolgen
sollte.
Für die EEG-Analyse sind in erster Linie reine AR-Modelle von Bedeutung.
Ansätze hierzu liefern ZETTERBERG (1969), GERSCH (1970),
LOPES DA SILVA et al.(1975), GERSCH &
YONEMOTO (1977), JANSEN et al.(1979),
JANSEN et al.(1981) sowie JANSEN et al.(1982).
3. Der Box-Jenkins-Ansatz
Zur Anpassung eines Modells an eine gegebene Zeitreihe lieferten
BOX & JENKINS (1970) einen grunglegenden
Ansatz, der sich grob in drei Schritte gliedern läßt.
- Spezifikation (Festlegung der Ordnung des Modells)
- Schätzung (Schätzung der Modellparameter)
- Diagnose (Überprüfung der Modellgüte)
Zur Spezifikation des Modells werden gewisse Kenngrößen der Zeitreihe wie die
Autokorrelationsfunktion (ACF) und die partielle Autokorrelationsfunktion (PACF) und
Selektionskriterien wie das Akaike-(AIC) oder das Bayes'sche Informationskriterium (BIC)
benutzt. Letztere berücksichtigen das Prinzip der Sparsamkeit, indem die Anzahl der
Modellparameter in das Kriterium eingeht.
Zur Schätzung der Modellparameter kommen Kleinste-Quadrate-Methoden sowie die
Maximum-Likelihood-Methode in Frage. Während zur Schätzung von gemischten
ARMA-Modellen immer Iterations-Algorithmen nötig sind, haben reine AR-Modelle den
Vorteil, daß auch einfache Verfahren wie z.B. die gewöhnliche Kleinste-
Quadrate-(OLS) oder die bedingte Kleinste-Quadrate-Methode (CLS) verwendet werden
können.
Zur Überprüfung auf Modelladäquatheit werden die Residuen des Modells mit
Hilfe von Plots und der Berechnung der residualen ACF untersucht. Zusätzlich können
Anpassungstests wie der Portmanteau-Test verwendet werden. Führt die Modell-Diagnose
nicht zu einem zufriedenstellenden Ergebnis, muß das Modell neu spezifiziert werden.
4. Anwendung
Ist die Anpassung eines Modells an eine betrachtete Zeitreihe genügend gut,
so beinhalten die Modellparameter die Information über die Struktur und die wesentlichen
Eigenschaften der Reihe. Folglich können die Modellparameter bei der EEG-Analyse z.B. zur
Narkosetiefe-Klassifikation benutzt werden. Weitere Anwendungsmöglichkeiten sind
- Berechnung des Spektrums (man erhält glattere Spektren als bei der FFT)
- Berechnung der ACF und der PACF
- Prognosen in die Zukunft ("Forecasting")
- Schätzung von fehlenden Werten
- Interventionsanalyse.
LITERATUR
1. Lehrbücher
-
BOX, G.E.P. & JENKINS, G.M. (1970):
Time Series Analysis. Forecasting and Control. Holden-Day, San
Francisco.
-
SCHLITTGEN, R. & STREITBERG, B.H.J. (1987):
Zeitreihenanalyse (2.Aufl.). Oldenbourg, München.
(Insbesondere S. 95-114 und 165-256).
2. EEG-Anwendung
-
GERSCH, W. (1970):
Spectral analysis of EEG's by autoregressive decomposition of time series.
Mathematical Biosciences 7, 205-222.
-
GERSCH, W. & YONEMOTO, J. (1977):
Parametric time series models for multivariate EEG analysis.
Computers and Biomedical Research 10, 113-125.
-
GERSCH, W. & YONEMOTO, J. (1977):
Automatic classification of multivariate EEG, using an amount of information
measure and the eigenvalues of parametric time series model features.
Computers and Biomedical Research 10, 297-316.
-
JANSEN, B.H., HASMAN, A. LENTEN, R.
& VISSER, S.L. (1979):
The usefulness of autoregressive models to classify EEG segments.
Biomedizinische Technik 24, 216-223.
-
JANSEN, B.H., BOURNE, J.R. & WARD, J.W. (1981):
Autoregressive estimation of short segment spectra for computerized EEG analysis.
IEEE Transactions on Biomedical Engineering 28, 630-638.
-
JANSEN, B.H., BOURNE, J.R. & WARD, J.W. (1982):
Identification and labeling of EEG graphic elements using autoregressive spectral estimates.
Computers in Biology and Medicine 12, 97-106.
-
LOPES DA SILVA, F., DIJK, A. &
SMITS, H. (1975):
Detection of nonstationarities in EEG's using the autoregressive
model - an application to EEG's of epileptics.
In: DOLCE, G. & KÜNKEL, H., eds.:
CEAN - Computerized EEG Analysis. Fischer, Stuttgart.
-
ZETTERBERG, L.H. (1969):
Estimation of parameters for a linear difference equation with application to EEG analysis.
Mathematical Biosciences 5, 227-235.