Healthcare and Medicine Reference
In-Depth Information
Als Beispiele seien das Körpergewicht der erwachsenen Bevölkerung, systolischer und diastoli-
scher Blutdruck oder die Senkungsgeschwindigkeit von Erythrozyten genannt (jeweils mit 0 als
untere Grenze). In diesen Fällen ist es eventuell möglich, durch eine logarithmische Transforma-
tion der Originaldaten eine angenäherte Normalverteilung zu erhalten. Man betrachtet also an-
stelle der X -Variablen die transformierte Y -Variable:
YX
= ln
(7.20)
Ist Y = ln X normalverteilt, heißt X logarithmisch normalverteilt (oder lognormalverteilt ). Dabei
ist »ln« der natürliche Logarithmus zur Basis e (Euler-Zahl;
Abschn. 7.1.3). Man schreibt abkür-
zend X ~ LN (μ, σ 2 ), wobei μ den Erwartungswert und σ 2 die Varianz von Y bezeichnen. Eine log-
normalverteilte Zufallsvariable X muss positiv sein, da andernfalls die Transformation X o ln X
nicht möglich ist. Auf diese Weise werden kleine x -Werte zwischen 0 und 1 in negative y -Werte
abgebildet; große x -Werte am rechten Rand der Verteilung werden gestaucht. Die Rücktransfor-
mation erfolgt über:
7
7
X Y
=
(7.21)
Die Umrechnung von
Formel (7.21) ist mühelos mit einem Taschenrech-
ner zu bewältigen. Da die e -Funktion streng monoton wachsend ist, gilt für jede Zahl c > 0: Y c
ist gleichbedeutend mit X = e Y e c . Daraus folgt:
7
Formel (7.20) oder
7
PY c PX e c
(
≤= ≤
)
(
)
(7.22)
Aus dieser Eigenschaft lassen sich folgende Aussagen herleiten:
4
Allgemein lassen sich aus den Quantilen von Y = ln X nach Rücktransformation die
entsprechenden Quantilen von X bestimmen.
4
Aus den Grenzen des Referenzbereichs von Y ergeben sich durch Rücktransformation nach
7 Formel (7.21) die Grenzen des Referenzbereichs von X .
4
Der Median der transformierten Variablen Y ist gleich deren Erwartungswert μ
(da Y normalverteilt ist). Dann ist der Median der lognormalen Verteilung X gleich e μ ;
denn wegen
7 Formel (7.22) gilt: P ( X e μ ) = P ( Y μ) = 0,5.
4
Der Erwartungswert von X ist nicht einfach zu bestimmen; bei dieser Verteilung ist jedoch
das geometrische Mittel (
7 Abschn. 4.2.5) ohnedies das sinnvollere Lagemaß.
7 Formel (4.5) lässt sich mit elementaren Berechnungen herleiten: Das geometrische
Mittel der x -Werte entspricht dem Median e μ .
4
Aus
i
Befinden sich die 0 oder negative Werte unter den Originaldaten, bietet sich eine
Transformation der Form Y = ln( X + a ) an (wobei a eine konstante, positive Zahl
ist). Bei sehr schiefen Verteilungen mit extrem großen Werten erreicht man eine
Normalverteilung eventuell durch zweifaches Logarithmieren: Y = ln ln( X ). Die
optimale Art der Transfomation muss empirisch bestimmt werden.
 
Search Pocayo ::




Custom Search