Die Lorenz-Kurve (auch: Lorenzkurve) wurde 1905 vom US-amerikanischen Statistiker und Ökonomen Max Otto Lorenz (1876–1959) entwickelt. Sie stellt statistische Verteilungen grafisch dar und veranschaulicht dabei das Ausmaß an Disparität (Ungleichheit) beziehungsweise relativer Konzentration innerhalb der Verteilung; deshalb wird sie auch als Disparitätskurve betitelt. Amtliche Statistiken nutzen die Lorenz-Kurve, um die Einkommensverteilung in einem Land zu verdeutlichen;[1] Grundlage dieser Berechnungen ist eine Liste der von links nach rechts aufsteigend sortierten Einzeleinkommen oder -vermögen (siehe auch: Pen’s Parade).
Aufbau und Erläuterung
Die Lorenz-Kurve ist eine Funktion im Einheitsquadrat des 1. Quadranten. Sie stellt dar, welche Anteile der gesamten Merkmalssumme auf welche Anteile der Grundmenge mit Merkmalsträgern entfallen. So werden auf der -Achse (Abszisse) die Anteile an der Gesamtheit der Merkmalsträger (zum Beispiel: Bevölkerung), auf der -Achse (Ordinate) die Anteile an der gesamten Merkmalssumme (beispielsweise: Einkommen) abgetragen. Zunächst werden die Daten dafür aufsteigend sortiert – beginnend mit dem geringsten Anteil an der Merkmalssumme – und dann kumuliert („aufsummiert“). Dadurch entsteht der charakteristische „Bauch“ der Lorenz-Kurve unterhalb der Diagonalen, welcher das Maß der Ungleichverteilung wiedergibt. Jeder Punkt auf der Lorenz-Kurve steht für eine Aussage wie „die unteren 20 % aller Haushalte beziehen 10 % des Gesamteinkommens“ (siehe: Paretoprinzip). Eine perfekte Einkommensgleichverteilung wäre eine Einkommensverteilung, bei der alle Personen das gleiche Einkommen besitzen. In diesem Falle würden stets die unteren der Gesellschaft des Einkommens haben. Dies lässt sich anschaulich durch eine Gerade darstellen; man nennt sie perfekte Gleichverteilungsgerade (line of perfect equality). Dagegen wäre die perfekte Ungleichverteilung eine Verteilung, bei der eine Person über das gesamte Einkommen verfügt und alle anderen Personen kein Einkommen beziehen. In diesem Fall wäre die Kurve für alle und bei Diese Kurve wird als perfekte Ungleichverteilungsgerade (line of perfect inequality) bezeichnet.
Der Gini-Koeffizient ist der Anteil der Fläche zwischen der perfekten Gleichverteilungsgerade und der beobachteten Lorenz-Kurve an der Fläche unter der Gleichverteilungsgerade. Der Gini-Koeffizient ist damit eine Zahl zwischen 0 und 1, je höher er ist, desto ungleicher ist die Verteilung.
Berechnung
Diskreter Fall
Die Lorenz-Kurve ist als abschnittsweise definierte lineare Kurve (d. h. als Polygonzug) durch die Punkte definiert. Sind die Anteile an der Gesamtheit der Merkmalsträger und die Anteile an der gesamten Merkmalssumme (zu diesen Begrifflichkeiten s. o. „Aufbau und Erläuterung“), so sind die Koordinaten der Punkte für definiert mit:
- .
und
- .
Stetiger/Kontinuierlicher Fall
Generell
Die Lorenz-Kurve kann häufig durch eine Funktion dargestellt werden, wobei auf der Abszisse und auf der Ordinate abgetragen wird.
Für eine Population der Größe mit einer Folge von Werten , , die nach aufsteigender Reihenfolge indiziert werden ist die Lorenz-Kurve die stetige, abschnittsweise lineare Funktion, die die Punkte (, ), verbindet, wobei , ist und für :
Dabei nennt man auch Lorenz-Asymmetrie-Koeffizient.
Für eine diskrete Wahrscheinlichkeitsfunktion seien , , die Punkte mit Non-/Nicht-Null-Wahrscheinlichkeiten nach steigender Reihenfolge indiziert . Die Lorenz-Kurve ist die stetige, abschnittsweise definierte, lineare Funktion, welche die Punkte (, ), , miteinander verbindet, wobei , ist und für gilt:
Für die Laplace-Verteilung, das heißt für alle , erhält man genau die oben genannten Formeln für und .
Für eine Wahrscheinlichkeitsdichtefunktion mit der kumulierten Wahrscheinlichkeitsverteilungsfunktion ist die Lorenz-Kurve definiert durch:
Für eine kumulierte Verteilungsfunktion mit der Umkehrfunktion ist die Lorenz-Kurve gegeben durch:
Die Umkehrfunktion könnte nicht existieren, da die kumulierte Verteilungsfunktion Sprungstellen (Unstetigkeitsstellen) oder Intervalle konstanter Werte aufweist. Die vorherige Gleichung behält ihre Gültigkeit, wenn man allgemeiner durch folgende Formel definiert: [2]
Gastwirths Definition
Betrachtet werde eine nichtnegative Zufallsvariable mit der dazugehörigen normierten Quantilsfunktion . Nach Joseph Lewis Gastwirth wird die Abbildung
als (stetige) Lorenz-Kurve von oder zur Verteilung von bezeichnet.[3][2]
Eigenschaften
Die Lorenz-Kurve hat folgende Eigenschaften:[4]
- Sie beginnt stets im Koordinatenursprung und endet im Punkt .
- Die Ableitung der Kurve ist monoton steigend, weshalb die Kurve selber konvex ist und unterhalb der Diagonalen liegt.
- Die Lorenzkurve ist stetig auf dem offenen Intervall (0,1), im diskreten Fall sogar stückweise linear.
Die Lorenz-Kurve ist für einen Mittelwert der Wahrscheinlichkeitsverteilung von null oder unendlich nicht definiert.
Die Lorenz-Kurve für eine Wahrscheinlichkeitsverteilung ist eine stetige Funktion. Aber Lorenz-Kurven unstetiger Funktionen können als Grenzwert (Limes) der Lorenz-Kurven der Wahrscheinlichkeitsverteilungen formuliert werden – wie beispielsweise die perfekte Ungleichheitsgerade (line of perfect inequality).
Die Daten einer Lorenz-Kurve können durch den Gini-Koeffizienten und den Lorenz-Asymmetrie-Koeffizienten zusammengefasst werden.[5]
Die Lorenz-Kurve ist invariant unter positiver Skalierung. Falls eine Zufallsvariable ist, so besitzt die Zufallsvariable für jede positive Zahl die gleiche Lorenz-Kurve wie , wobei man unter der Lorenzkurve einer Zufallsvariablen natürlich diejenige der zugehörigen Verteilung versteht.
Die Lorenz-Kurve ist nicht invariant unter Translationen, das heißt unter einer konstanten Verschiebung der Werte. Ist eine Zufallsvariable mit einer Lorenz-Kurve und dem Mittel ist, dann erhält man für die Lorenz-Kurve der verschobenen Zufallsvariablen , wobei eine feste Konstante sei, folgende Formel:
Für eine kumulierte Verteilungsfunktion mit dem Mittelwert und der (verallgemeinerten) Umkehrfunktion gilt für jedes mit
- Falls die Lorenz-Kurve differenzierbar ist, gilt:
- Wenn die Lorenz-Kurve zweifach differenzierbar ist, dann existiert die Wahrscheinlichkeitsdichtefunktion in diesem Punkt und:
- Falls stetig-differenzierbar ist, so ist die Tangente von parallel zur perfekten Gleichheitsgerade im Punkt . Dies ist auch der Punkt, in welchem die Gleichheitsdiskrepanz , der vertikale Abstand zwischen der Lorenz-Kurve und der perfekten Gleichheitsgerade, am größten ist. Die Größe der Diskrepanz ist gleich der Hälfte der relativen mittleren Abweichung:
Die Lorenz-Kurve einer Zufallsvariablen wird am Punkt gespiegelt, wenn man von zu übergeht, das heißt mit oben eingeführten Bezeichnungen:
Extremfälle
Je gleichmäßiger die Merkmalssumme unter den Trägern verteilt ist, desto stärker nähert sich die Lorenz-Kurve der Diagonalen an. Im Extremfall der ökonomischen Gleichverteilung (statistische Einpunktverteilung) fällt sie mit ihr zusammen.
Im Falle größerer Disparität bewegt sich die Kurve nach unten in Richtung der Abszisse. Für den Extremfall der maximalen Ungleichverteilung (ein Merkmalsträger vereinigt die gesamte Merkmalssumme auf sich) verläuft die Lorenz-Kurve als Streckenzug auf der Abszisse bis und führt von dort zum Punkt .
Stetig und diskret klassierte Daten
Welche Form die Lorenz-Kurve genau annimmt, hängt davon ab, welcher Art die Daten des Merkmals sind. Grundsätzlich sind stetige Daten (siehe Beispielbild oben) von diskreten Daten zu unterscheiden. Im zweiten Fall ist die Lorenzkurve ein Streckenzug durch die Punkte .
Messung der relativen Konzentration (Disparität)
Die Lorenz-Kurve bietet eine grafische Möglichkeit, das Ausmaß an Disparität innerhalb einer Verteilung zu betrachten. Je stärker sich die Kurve nach unten wölbt, desto größer die Disparität (siehe Abschnitt Extremfälle). Für den Fall, dass sich zwei Lorenz-Kurven schneiden, lässt sich anhand der Grafik jedoch nicht mehr eindeutig bestimmen, welche die größere Disparität aufweist. Auch ist die Messung mittels Grafik zu ungenau. Präzise Werte liefern dafür die Maßzahlen Gini-Koeffizient und Variationskoeffizient. Der Gini-Koeffizient steht dabei in einem direkten Zusammenhang mit der Lorenz-Kurve: Er ist das Zweifache der Fläche zwischen Lorenz-Kurve und Diagonale im Einheitsquadrat.
Beispieltabelle für diskret klassierte Daten
Eine Datenerhebung habe für 5 Klassen, die mit einem Index benannt seien, die relativen Häufigkeiten (Anteil der Merkmalsträger der Klasse an der Gesamtheit der Merkmalsträger) und die Anteile der Merkmalssumme, die auf die Klasse entfallen, der unten stehenden Tabelle ergeben. Daraus ermitteln wir
- kumulierte (relative Häufigkeit),
- kumulierte (Disparität) .
Index | Relative Häufigkeit | Kumulierte relative Häufigkeit | Disparität | Kumulierte Disparität |
---|---|---|---|---|
1 | 0,2 | 0,2 | 0,00 | 0,00 |
2 | 0,4 | 0,6 | 0,05 | 0,05 |
3 | 0,1 | 0,7 | 0,15 | 0,20 |
4 | 0,1 | 0,8 | 0,30 | 0,50 |
5 | 0,2 | 1,0 | 0,50 | 1,00 |
Erläuterung:
Die Lorenz-Kurve entsteht, indem man auf der Abszisse, auf der Ordinate aufträgt und die Punkte durch einen Streckenzug verbindet.
Der Artikel zur Paretoverteilung enthält ein weiteres Beispiel für eine Lorenz-Kurve.
Satz von Rothschild und Stiglitz
Gegeben seien zwei Verteilungen und mit Die Lorenz-Kurve von liegt oberhalb der Lorenz-Kurve von dann und nur dann, wenn für jede symmetrische und quasikonvexe Funktion gilt
- .
Folgerung: Wenn sich zwei Lorenz-Kurven schneiden, hängt es von der Wahl der jeweiligen symmetrischen und quasikonvexen Funktion ab, welche der beiden Kurven als die mit der größeren Ungleichheit zu bezeichnen ist.
Länge
Als Disparitätsmaß (Maß der relativen Konzentration) lässt sich auch die Lorenz-Kurven-Länge anführen. Der Wertebereich ist für den Definitionsbereich gilt
Diskreter Fall
Diese lässt sich – wie der Name bereits vermuten lässt – von der diskreten Lorenz-Kurve ableiten, indem die Längen der Streckenabschnitte kumuliert werden. Für die Länge der diskreten Lorenz-Kurve gilt:
Bei Gleichverteilung ist Bei absoluter Konzentration auf lediglich einen einzigen Merkmalswert ist
Stetiger/Kontinuierlicher Fall
Die Länge der stetigen/kontinuierlichen, differenzierbaren Lorenz-Kurve [zwischen den Punkten sowie ] berechnet sich aus der ersten Ableitung der Lorenz-Kurven-Funktion , wie folgt:
mit .
Anwendungen
Wirtschaftswissenschaften
In der Ökonomie wird die Lorenz-Kurve zur grafischen Darstellung der kumulierten Verteilungsfunktion der empirischen Wahrscheinlichkeitsverteilung des Vermögens benutzt; sie ist ein Graph, der das Maß der Verteilung zeigt, die für die unteren der Werte angenommen wird. Häufig wird sie dazu verwendet, um eine Einkommensverteilung darzustellen, wobei für die unteren der Haushalte illustriert wird, wie groß der Anteil des Gesamteinkommens in ist, den sie besitzen.[6] Der Anteil der Haushalte wird auf der Abszisse abgetragen, der Anteil des Einkommens auf der Ordinate. Sie kann ebenfalls zur Darstellung der Einkommensverteilung verwandt werden. In diesem Sinne betrachten viele Ökonomen die Lorenz-Kurve als Maß sozialer Ungleichheit (soziales Ungleichheitsmaß). Sie wurde im Jahre 1905 von Max O. Lorenz zur Darstellung der Ungleichheit der Einkommensverteilung entwickelt.
Neben der Illustration der Einkommensverteilung wird die Lorenz-Kurve auch zur Darstellung von Marktmacht oder räumlichen Verteilungen verwendet (vergleiche: Segregation).
Eine weitere Anwendung findet die Lorenz-Kurve in der logistischen ABC-Analyse, bei der die Lorenz-Kurve die Verteilung der Güter verdeutlicht, geordnet nach Klassifizierungseigenschaft (beispielsweise Wert) und Verbrauchsmenge.
Die Lorenz-Kurve lässt sich auch für Geschäftsmodelle verwenden – beispielsweise in den Konsumentenfinanzen, um die reale Nichtzahlung bei Fälligkeit (Delinquenz) von der Konsumenten mit den schlechtesten vorhergesagten Risiko-/Kreditscores.
Ökologie
Das Konzept der Lorenz-Kurve ist hilfreich für die Beschreibung der Ungleichheit zwischen den Anzahlen an Individuen in der Ökologie[5] und in Forschungsstudien zur Biodiversität nutzt man es, indem man den kumulierten Anteilen an Tierarten die kumulierten Anteile an Individuen gegenüberstellt.[7]
Konzentration sowie Disparität
Die Disparität (Lorenz-Kurve) und (absolute) Konzentration (Konzentrationskurve) sind verwandte Maße, beschreiben aber unterschiedliche Dinge. Während die Lorenz-Kurve darstellt, welche Anteile der Merkmalssumme (Ordinate) auf welche Anteile an der Gruppe der Merkmalsträger (Abszisse) entfallen, stellt die Konzentrationskurve dar, welche Anteile der Merkmalssumme (Ordinate) auf welchen Merkmalsträger (Abszisse) entfallen. Das bedeutet, dass die Lorenz-Kurve Anteile mit Anteilen vergleicht, die Konzentrationskurve Anteile mit absoluten Zahlen (Abszisse). So können hohe Disparität und geringe Konzentration oder hohe Konzentration und geringe Disparität gleichzeitig auftreten. Folgendes Beispiel verdeutlicht die Frage:
Angenommen Unternehmen teilen sich einen Markt. In der Tabelle werden die Fälle von hoher und geringer Disparität bzw. Konzentration mit (fiktiven) absoluten Zahlen durchgespielt:
Disparität hoch | Disparität gering | |
---|---|---|
Konzentration hoch | ||
Konzentration gering |
Literatur
- Joseph Lewis Gastwirth: A General Definition of the Lorenz Curve. In: Econometrica, Bd. 39, Nr. 6, New York Nov. 1971. S. 1037–1039.
- Josef Bleymüller, Günther Gehlert, Herbert Gülicher: Statistik für Wirtschaftswissenschaftler. WiSt-Studienkurs. 10. Aufl. Verlag Franz Vahlen, München 1996. ISBN 978-3-8006-2081-4 (3-8006-2081-2). 244 S.
Weblinks
- Günter Faes: Übersichtliche Beschreibung der Lorenz-Kurve sowie des Gini-Koeffizienten, faes.de
Einzelnachweise
- ↑ Duden: Lorenz-Kurve. In: Duden Wirtschaft von A bis Z: Grundlagenwissen für Schule und Studium, Beruf und Alltag. 4. Aufl. Bibliographisches Institut, Mannheim 2009 (Lizenzausgabe: Bundeszentrale für politische Bildung, Bonn)
- ↑ 2.0 2.1 Thomas Augustin, Sebastian Petry: Wirtschafts- und Sozialstatistik ( des vom 1. Februar 2012 im Internet Archive) Info: Der Archivlink wurde automatisch eingesetzt und noch nicht geprüft. Bitte prüfe Original- und Archivlink gemäß Anleitung und entferne dann diesen Hinweis. . (PDF-Datei; 216 kB), LMU, München 2010. S. 45 ff.
- ↑ Joseph Lewis Gastwirth: A General Definition of the Lorenz Curve. In: Econometrica, Bd. 39, Nr. 6, New York Nov. 1971. S. 1037–1039.
- ↑ Karl Mosler, Friedrich Schmid: Beschreibende Statistik und Wirtschaftsstatistik. Springer, Berlin/Heidelberg 2009, ISBN 978-3-642-01556-4.
- ↑ 5.0 5.1 Christian Damgaard, Jacob Weiner: Describing inequality in plant size or fecundity. 4. Aufl. Ecology, 2000. Bd. 81. doi:10.1890/0012-9658(2000)081[1139:DIIPSO]2.0.CO;2 S. 1139–1142.
- ↑ Arthur O’ Sullivan, Steven M. Sheffrin: Economics: Principles in action. Prentice Hall, Upper Saddle River (New Jersey 07458) 2003. ISBN 0-13-063085-3. S. 349 ff.
- ↑ Lieven Wittebolle et al.: Initial community evenness favours functionality under selective stress. 7238. Ausg. Nature, 2009. Bd. 458. S. 623–626. doi:10.1038/nature07840. PMID 19270679.