Gini index

WORK IN PROGRESS!

Με μια φράση

A low Gini coefficient indicates a more equal distribution, with 0 corresponding to complete equality, while higher Gini coefficients indicate more unequal distribution, with 1 corresponding to complete inequality

Καμπύλη Lorenz

πηγή EASYPOl, Charting Income Inequality The Lorenz Curve (11/11/13)
http://www.fao.org/docs/up/easypol/302/charting_income_inequality_000en.pdf

Η καμπύλη Lorenz είναι ένα εργαλείο που χρησιμοποιείτε για να αναπαραστήσει την κατανομή του εισοδήματος όπως προτάθηκε από τον Lorenz (1905). Μας λέει, ποίο μέρος του συνολικού εισοδήματος είναι στα χέρια ενός δεδομένου ποσοστού του πληθυσμού. Η κατανομή του εισοδήματος ενός πεπερασμένου πληθυσμού από n άτομα είναι μια ταξινομημένη λίστα από εισοδήματα (από το χαμηλότερο, προς το υψηλότερο) όπου κάθε εισόδημα yi είναι συνδεδεμένο με ένα δεδομένο άτομο I. Η αναλυτική αναπαράσταση είναι y=(y1, y2,…, yn) όπου το y είναι ένα “διάνυσμα” από ατομικά εισοδήματα. Στην περίπτωση εισοδημάτων νοικοκυριών, τότε στο εισόδημα κάθε νοικοκυριού θα πρέπει να υπάρχει συνδεδεμένος και ένας αριθμός w που να δείχνει το μέγεθος του νοικοκυριού, ώστε να έχουν νόημα οι συγκρίσεις μεταξύ των εισοδημάτων: y=((w1,y1),(w2,y2),…, (wn,yn)). Στην περίπτωση που τα εισοδήματα ανήκουν σε άτομα τότε το wi=1 σε όλες τις παρατηρήσεις.
Η μέθοδος αυτή είναι πολύ παρόμοια με τη μέθοδο BY QUANTILES. Αλλά, αντί να τελειώνει με τη μοιρασιά του εισοδήματος, η καμπύλη Lorenz συσχετίζει την αθροιστική αναλογία του εισοδήματος με την αθροιστική αναλογία των ατόμων.

Η καμπύλη Lorenz λαμβάνεται ως εξής:

Στον άξονα x καταγράφεται η αθροιστική αναλογία του πληθυσμού, ταξινομημένη με το επίπεδο του εισοδήματος. Έτσι είναι μεταξύ (0,1).

Στον y άξονα καταγράφεται η αθροιστική αναλογία του εισοδήματος για ένα δεδομένο τμήμα του πληθυσμού. Δηλαδή, το μερίδιο του εισοδήματος υπολογίζεται λαμβάνοντας το αθροιστικό εισόδημα μιας δεδομένης μερίδας του πληθυσμού, διαιρώντας την με το συνολικό εισόδημα Υ, ως ακολούθως:

formula 1όπου:
k=1…n είναι η θέση (κατάταξη) του κάθε ατόμου στην κατανομή του εισοδήματος.
i=1…k είναι η θέση (κατάταξη) του κάθε ατόμου στην κατανομή του εισοδήματος.
P είναι το πλήθος των ατόμων στην κατανομή.
yi είναι το εισόδημα του iστου ατόμου στην κατανομή.
Ο αριθμιτής είναι το άθροισμα του εισοδήματος από το 1-ο μέχρι το k-στο άτομο
Είναι φανερό ότι ο αριθμιτής είναι από 0, για k=0 και Υ, για k=n, συνεπώς το L κυμαίνεται μεταξύ 0 και 1.

Η επόμενη εικόνα δείχνει μια τυπική καμπύλη Lorenz. Μπορούμε να δούμε ότι η καμπύλη αρχίζει από το σημείο (0,0), καθώς το μηδενικό τμήμα του πληθυσμού έχει το μηδενικό τμήμα του εισοδήματος. Μιας και η καμπύλη Lorenz καταγράφει τα αθροιστικά ποσοστά, πρέπει το σύνολο του πληθυσμού να κατέχει το σύνολο του εισοδήματος. Έτσι η καμπύλη Lorenz έχει τελικό σημείο το (1,1). Αν το εισόδημα είναι ίσα κατανεμημένο στον πληθυσμό (όλοι έχουν το ίδιο εισόδημα), για παράδειγμα σε ένα πληθυσμό 100 ατόμων όλοι έχουν το 1/100 του εισοδήματος, η καμπύλη του παρακάτω σχήματος θα ήταν η γραμμή της ισοκατανομής. Τυπικά μια κατανομή εισοδήματος αποτελείτε από φτωχούς και πλούσιους, που σημαίνει ότι οι φτωχοί κατέχουν λιγότερα από ένα ισοκατανεμημένο μερίδιο του συνολικού εισοδήματος, γιατί οι πλούσιοι έχουν περισσότερα από το ισοκαταμενημένο μερίδιο. Συνεπώς για μια τυπική κατανομή, η καμπύλη είναι αυτή που αποτυπώνεται στο επόμενο σχήμα.

fig1

Μια διαδικασία για την κατασκευή της καμπύλης Lorenz βήμα-βήμα

Βήμα Διαδικασία
1 Αν δεν είναι ταξινομημένα, ταξινομούμε τα εισοδήματα σε αύξουσα ταξινόμηση
2 Υπολογίζουμε την αναλογία από το συνολικό εισόδημα που κατέχει κάθε άτομο και την αναλογία του στον συνολικό πληθυσμό
3 Υπολογίζουμε την αθροιστική αναλογία εισοδήματος και τον αθροιστική αναλογία στον πληθυσμό
4 Κάνουμε γράφημα την αθροιστική αναλογία του εισοδήματος με την αθροιστική αναλογία του πληθυσμού.

Για παράδειγμα, έχουμε την απλή κατανομή εισοδήματος του επόμενου πίνακα.

Άτομο Εισόδημα
1 2.417
2 7.800
3 8.489
4 10.072
5 12.957

Στον επόμενο πίνακα βλέπουμε τον υπολογισμό της καμπύλης σύμφωνα με τα βήματα που περιγράψαμε

Άτομο

Εισόδημα

Αθροιστική αναλογία στον πληθυσμό

Αθροιστική αναλογία στο εισόδημα

1

2.417

0,2

0,058

2

7.800

0,4

0,245

3

8.489

0,6

0,448

4

10.072

0,8

0,690

5

12.957

1

1,000

Πληθυσμός

Συνολικό εισόδημα

5

41.735

Οι υπολογισμοί έγιναν με τις παρακάτω formulas σε φύλλο εργασίας

A

B

C

D

1

Άτομο

Εισόδημα

Αθροιστική αναλογία στον πληθυσμό

Αθροιστική αναλογία στο εισόδημα

2

1

2.417

=A2/$A$8

=B2/$B$8

3

2

7.800

=A3/$A$8

=D2+B3/$B$8

4

3

8.489

=A4/$A$8

=D3+B4/$B$8

5

4

10.072

=A5/$A$8

=D4+B5/$B$8

6

5

12.957

=A6/$A$8

=D5+B6/$B$8

7

Πληθυσμός

Συνολικό εισόδημα

8

=COUNTIF(A2:A6; “>0”)

=SUM(B2:B6)

 

Η καμπύλη Lorenz είναι:

fig2

Συντελεστής Gini

Πηγές:

1. EASYPOl, Inequality Analysis The Gini Index

http://www.fao.org/docs/up/easypol/329/gini_index_040EN.pdf (11/11/13)

2. Guide to Calculating the Gini Coefficient

http://teamsportsanalysis.blogspot.gr/2012/12/guide-to-calculating-gini-coefficient.html (11/11/13)

Ο δείκτης Gini αναπτύχθηκε από τον Gini το 1912, και είναι αυστηρά συνδεδεμένος με την αναπαράσταση της άνισης κατανομής του εισοδήματος μέσω της καμπύλης Lorenz. Ειδικότερα μετράει το λόγο της περιοχής μεταξύ της καμπύλης Lorenz και της γραμμής ισοκατανομής (στο εφεξής περιοχή συγκέντρωσης) με την περιοχή της μέγιστης συγκέντρωσης.

Η επόμενη εικόνα δίνει μια οπτική αναπαράσταση αυτών των περιοχών, σχεδιάζοντας τρεις καμπύλες Lorenz για τις 3 υποθετικές κατανομές, τις ονομάζουμε Α, B και C. Η μορφή της καμπύλης Lorenz για την κατανομή Α είναι η τυπική καμπύλη Lorenz που βρίσκουμε μελετώντας πραγματικά εισοδήματα. Η καμπύλη B είναι η εξαιρετική περίπτωση όπου τα εισοδήματα είναι ίσα. Αυτή ονομάζεται γραμμή ισοκατανομής. Τέλος η καμπύλη C είναι άλλη μια ακραία περίπτωση όπου όλα τα εισοδήματα είναι μηδέν εκτός από το τελευταίο.

Ορίζουμε OP την γραμμή ισοκατανομής, ORP είναι η περιοχή που ορίζεται από την καμπύλη Lorenz της τυπικής κατανομής εισοδήματος και την γραμμή ισοκατανομής, την οποία ονομάζουμε περιοχή συγκέντρωσης. Τέλος, OPQ είναι η περιοχή μέγιστης συγκέντρωσης, δηλαδή η περιοχή ανάμεσα στην καμπύλη Lorenz της κατανομής C και της γραμμής ισοκατανομής.

Πρέπει να είναι σαφές ότι η γραμμή ισοκατανομής OP και η επιφάνεια OPQ αναπαριστούν τις ακραίες τιμές που μπορεί να υποτεθεί ότι αναπαριστά η καμπύλη Lorenz. Η επιφάνεια αυτή μπορεί να είναι 0 (για την περίπτωση της ισοκατανομής) ή να έχει την μέγιστη τιμή της (για την κατανομή C). Για την τυπική κατανομή εισοδήματος, η περιοχή συγκέντρωσης μπορεί να έχει κάποια τιμή από 0 έως την επιφάνεια της μέγιστης συγκέντρωσης.

Ο δείκτης Gini μετρά την σχέση της περιοχής συγκέντρωσης με την περιοχή μέγιστης συγκέντρωσης. Έτσι:

Ως περιοχή μέγιστης συγκέντρωσης ορίζουμε αυτή της κατανομής όπου το συνολικό εισόδημα κατέχεται από ένα και μόνο άτομο. Ο δείκτης Gini G, γενικώς, μετράει την απόσταση από την περιοχή που ορίζεται από οποιαδήποτε τυπική κατανομή εισοδήματος μέχρι την μέγιστη συγκέντρωση.



Τώρα είναι σημαντικό να καταλάβουμε πως ο προηγούμενος τύπος εφαρμόζεται στην πράξη. Ας αρχίσουμε από τον παρανομαστή του G. Έχουμε ήδη εξηγήσει στην καμπύλη Lorenz ότι το μέγιστο σημείο της είναι το (1,1). Η περιοχή OPQ είναι ένα τρίγωνο με βάση μήκους 1 και ύψος 1. Συνεπώς η επιφάνειά της έχει εμβαδό 1/2. Ο παρανομαστής του G επομένως είναι 1/2.

Ο αριθμητής τώρα. Αντί να υπολογίσουμε κατευθείαν την επιφάνεια συγκέντρωσης, εκμεταλλευόμαστε το γεγονός ότι η επιφάνεια είναι η διαφορά της μέγιστης συγκέντρωσης με την επιφάνεια κάτω από την καμπύλη Lorenz (ORPQ). Η επιφάνεια κάτω από την καμπύλη Lorenz μπορεί εύκολα να υπολογιστεί ως ακολούθως.

Ας θυμηθούμε τον ορισμό των συντεταγμένων της καμπύλης Lorenz. Δεδομένου ότι , είναι:

 

 

με q0=p0=0 και qn=pn=1.

Τώρα, η επιφάνεια είναι ORPQ κάτω από την καμπύλη Lorenz είναι το άθροισμα των επιφανειών μιας σειράς πολυγώνων. Ας θεωρήσουμε την επόμενη εικόνα, όπου έχουμε μια απλοποιημένη καμπύλη Lorenz για πληθυσμό τεσσάρων ατόμων.



Το πρώτο πολύγωνο είναι ένα τρίγωνο (p0q1p1), τα άλλα τρία πολύγωνα είναι περιστραμμένα τραπέζια. Η κάθε επιφάνεια μπορεί να υπολογιστεί χωριστά, και να προσθέσουμε τα αποτελέσματα ώστε να πάρουμε την συνολική επιφάνεια. Ορίζουμε Ζi την επιφάνεια του i-στού πολυγώνου και Ζ τη συνολική.

Η επιφάνεια του τριγώνου είναι:

(βάση x ύψος / 2)

ενώ η επιφάνεια κάθε τραπεζίου είναι:

,

όπου είναι βάση μεγάλη + βάση μικρή και είναι το ύψος του τραπεζίου.

Αφού q0=p0=0, το άθροισμα όλων των εμβαδών είναι:

Όμως το Ζ δεν είναι η περιοχή συγκέντρωσης, αλλά η περιοχή κάτω από την καμπύλη Lorenz. Για να υπολογίζουμε την περιοχή συγκέντρωσης (τον αριθμητή του Gini) τώρα αρκεί να αφαιρέσουμε το Z από την περιοχή μέγιστης συγκέντρωσης (το 1/2):

τελικά ο δείκτης Gini G είναι

το οποίο μπορεί να γραφεί και ως

Από αυτό τον τύπο βλέπουμε ότι ο δείκτης Gini είναι ίσος με 1 μείον δύο φορές την επιφάνεια κάτω από την καμπύλη Lorenz.

Μια διαδικασία υπολογισμού του δείκτη Gini βήμα-βήμα

Βήμα Διαδικασία
1 Αν δεν είναι ταξινομημένη, ταξινομούμε την κατανομή κατά εισόδημα
2 Αριθμούμε τα άτομα, ξεκινώντας από το 1 μέχρι το n
3 Υπολογίζουμε την αθροιστική αναλογία των ατόμων
4

Υπολογίζουμε την αθροιστική αναλογία εισοδήματος της κατανομής , προσοχή q0=0

5 Υπολογίζουμε την επιφάνεια κάθε πολυγώνου

και για i>1

6 Υπολογίζουμε το σύνολο των Zi , έστω Ζ
7 Τέλος υπολογίζουμε δείκτη Gini G = 1- 2Ζ

Comments are closed.