Ko šta radi, ja ispada samo pljujem Vučića po ovom blogu. Evo još jedan tekst, kao neki pokušaj analize podataka, ovaj put o tome ko sa kojom platom glasa za dragog nam Vučka.

BTW, ako vam se sviđaju ove moje debilne analize sa ovako random temama, onda će vam se sigurno svidi i datatata blog od mog kolege:) Sad kad sam završio sa reklamama:), da se bacimo na stvar.

Kako sam došao do ove analize

Na prethodnim izborima, Vučko je odneo ubedljivu pobedu. Svako može da priča sad o razlozima (čak sam se i ja okušao u tome), jedan od češćih je bio da su ljudi naterani da glasaju za njega, ili da tamo neki seljaci glasaju, a da je ta “građanska opcija” inertna itd., itd. Mene je zanimalo da vidim da li stvarno ima u tome nešto. Jedan od retkih otvorenih izvora podataka u Srbiji je republički zavod za statistiku. Tamo, duboko skriveni, da ih slučajno neko ne nađe (pu-pu-pu, daleko bilo), ili ne daj Bože skrejpuje (pa su često dostupni samo iz browser-a, nicht .csv, nicht Excel), su razni podaci, manje ili više zanimljivi. Razmišljalo je nas nekoliko šta bi to bilo najbolje i najzanimljivije gledati, ali ništa pametno osim plata nismo našli. Ako vi imate neki dobar izvor podataka, koji ima smisla ukrstiti nekako sa rezultatima izborima, javite!

Elem, na publikacijama za zaposlenost i zarade možete naći ZP14, tj. zarade po opštinama i gradovima, a najnoviji izveštaj u trenutku pisanja ovog teksta je iz maja. Malo sređivanja i lako dobijemo spisak svih prosečnih plata po opštinama. Na sajtu RZS-a se mogu skinuti i rezultati izbora po opštinama. Isto malo dorade, i ova dva izvora su spremna za ukrštanje. Mislim, da se ne lažemo, jasno je bilo da će biti korelacije, pitanje je samo bilo kolike:) Sređene i ukrštene podatke, kao jedan mali i pitki Excel, možete da preuzmete odavde.

Analiza

OK, definitivno postoji korelacija, jasno se vidi sa ove slike:

(klik na sliku za veću verziju)

Na X-osi je prosečna plata po mestima, a na Y-osi je procenat glasova za Vučića. Nažalost, nisam mogao da ubacim da se vidi svako mesto, ali većinu ovih “izbačenijih” (da ne kažem outlier-a) jesam (kliknite na sliku za veću verziju). Ako želite da vidite kako se kotira vaše mesto, pravac na download Excel-a i nađite se sami! Evo par stvari koje sam ja uočio (vi javite ako primetite još nešto interesantno):

  • Korelisane su babe i žabe u neku ruku. Prosečna plata je uzimana sa mesta gde su prijavljene firme, a procenat glasova za Vučka sa mesta gde su prijavljivani ljudi. Tako da nije baš tačno preslikavanje. Kako god, mislim da nisam mnogo omanuo, jer iako se na bolje povezanim mestima (npr. Novi Beograd↔Vračar) ljudi više kreću, postoji prostorna korelacija (prijavljen u Vlasotincu neće raditi u firmi koja je registrovana u Subotici)
  • Surčin je outlier jer je tamo kontrola letenja i aerodrom (a oni su poznati da nemaju baš male plate:). Ja bar tako objašnjavam
  • Od ostalih zanimljivih outlier-a, ukazao bih na Čajetinu – bastion slobodne Srbije:p (ne smatram beogradski trougao “Vračar-Novi Beograd-Stari Grad” nešto zanimljivim)
  • Trgovište je pobedilo:) Znam da nije politički korektno, ali svaki put kad vidim ovaj grafik sa njim na vrhu, malo se nasmejem:)
  • Od Mladenovca (ovde nije prikazan) i Belog sam očekivao da postanu outlier, ali nisu – Beli nije uspeo da izvede Mladenovac van mediokritetske 3σ korelacije
  • I na kraju – cum hoc ergo propter hoc. Samo zato što veza postoji, ne znači da je niska plata uzrok, već mnogo verovatnije postoji uzajmna povezanost ova dva. Drugim rečima, može se reći da siromašniji ljudi glasaju za Vučića (globalno gledano), ali ne možemo da kažemo da ako u Trgovište sipamo milione evra, da će ti ljudi da glasaju za nekog drugog. Ili obrnuto, da će Stari Grad postati siromašniji ako počne da glasa za Vučića – sve je to lepo uvezano i povezano, ovi grafici samo surface-uju mali stepen jednostavnosti u opštem haosu realnosti;) (da, znam, nekad mnogo kenjam)

A da vidimo trend:

R squared je 0.27. Za trend sam uzeo linearni (najviše mi je ličilo i najbolje je rezultate davao na ovom uzorku, mada je nemoguće da je ovo linearni model:). Po ovom trendline-u možemo da zaključimo da u mestu u kome je plata 0 dinara, procenat glasova za Vučića bi bio oko 85%, a spao bi ispod 50% kada je prosečna plata 80.000. Vučić (i njemu slični) će dobiti 0% glasova kada prosečna plata bude 210.000 dinara. Sada je valjda jasno odakle mi ideja za naslov teksta:) Ne znam za tebe čitaoče, ali meni ove brojke totalno imaju smisla.

Po oblastima

Korelacija je jasna i kada se pogledaju agregirani rezultati po oblastima:

Samo beogradski pašaluk

Ako niste iz Beograda, ovo će biti još jedan od onih “jebo ih Beograd” momenata (znam kako je…živeo sam van tog Beograda:), i slažem se da nema ništa više poente analizirati Beograd ovde nego npr. Niš, ali šta da radim – za Beograd ima više opština, lepše izgleda na grafikonima, a i moj je grad, mene je zanimao on najviše:

Kad gledate Beograd, podsetite se samo prve stavke gore kada sam pominjao mešanje baba i žaba – na Beogradu je to najizraženije, pa uzmite ovaj grafikon sa rezervom.