Ubedljivo najčešći pojam vezan za bilo kakvu analitiku ili statistiku je prosek, prosečna vrednost.

Ovaj pojam čujete i koristite više puta dnevno:
Prosečna plata, prosečna cena, prosečna temperature, prosečan korisnik, prosečna starost i tako u nedogled...

I nikad niko ko govori o proseku ne kaže na koju vrstu prosečne vrednosti je mislio ,a to nije jednoznačan pojam.

Postoji više vrsta srednje vrednosti:
Aritmetička sredina, medijana, modus, geometrijska sredina, harmonijska sredina.

Aritmetička sredina nekog skupa računa se tako što se saberu sve vrednosti skupa i podele sa brojem članova:
Za neki tim sa pet igrača čije su visine: 185, 196, 205, 207 i 212 cm kažemo da ima prosečnu visinu od 201 cm (185 + 196 – 205 – 207 +212)/5 = 201

Medijana je vrednost srednjeg člana nekog skupa. Poređamo članove skupa po vrednosti i medijana je vrednost srednjeg člana.
Obavili smo recimo 7 kupovina u vrednostima: 57 din, 753 din, 834 din, 911 din, 1222 din, 1237 din i 1408 din. Medijana je vrednost kupovine koja je u sredini niza, u ovom slučaju to je četvrta kupovina ( postoje tri veće i tri manje ) i njena vrednost za ovaj skup je 911 din.

Modus je najučestalija vrednost nekog skupa, vrednost koja se najčešće pojavljuje. U skupu: 0,1,2,2,2,3,3,1,3,5,3,4,3,0,1,3,3,5,4 modus je broj 3 jer se pojavljuje 7 puta.

Harmonijsku i geometrijsku sredinu neću objašnjavati jer je ređe koriste.
Sad je pitanje: OK, a koja od ovih srednjih vrednosti je ispravna, koja se koristi ili koju treba koristiti?

Zavisi od konteksta primene.
Več to što ima više srednjih vrednosti sugeriše da ne može svaka uvek da se koristi na isti način.

Najčešće korišćena je aritimetička sredina, često ćete videti engleski naziv average avg.
I na jeste najprimenjivija na sve kontinualne nizove kod kojih nema velikih izuzetaka: visina ljudi, težina ljudi, atmosferski pritisak itd…
Kod visine ljudi recimo, najvišlji ljudi su visoki oko 220cm što je jedva 50 % iznad proseka, to i nije neki veliki izuzetak sa stanovišta matematike.
Kod težine npr. Najteži ljudi imaju oko 300 kg što je 4-5 puta iznad proseka i dovoljno je da imate uzorak od 100 tinak ljudi pa da taj izuzetak jedva promeni prosek.

Međutim, postoje pojave kod kojih su amplitude vrednosti daleko veće: cene nekretnina, visine zarada, vreme potrebno za obavljanje nekog zadatka itd…

Kod analiza takvih podataka, odnos između najmanje, očekivane i najveće vrednosti može biti daleko veći i tada postojanje samo jednog izuzetka može znatno uticati na rezultat merenja.

Primer:
Imamo firmu sa 11 radnika. 2 radnika ima platu od 250 e, 8 platu od 300 e a jedan ima platu 5000 e. Ako računamo aritmetičku sredinu, prosečna plata je 718 eura. I to je matematički tačno ali nije baš primenjivo za dati slučaj.

Za ovakve situacije, uvek je bolje koristiti medijanu. Poredajmo plate u niz od najmanje ka najvećoj; 250, 250, 300, 300, 300, 300, 300, 300, 300, 300, 5000 i pogledajmo koliku platu ima srednji clan niza, u ovom slučaju šesti član a to je 300 e prosečne plate za tu firmu.

Slično je i sa svim merenjima vremena.
Jedna avio kompanija meri prosečno vreme kašnjenja svojih poletanja u celom mesecu u minutima i dobija niz: 0, 0, 3, 2, 0, 1, 1, 1, 3, 3, 0, 2, 3, 4, 0, 0, 2, 2 , 2 ,4, 2, 2, 3, 548, 0, 2, 2, 2 , 3, 3.
Aritmetička sredina je 20 minuta.
Ako letite ovom kompanijom i vidite da u proseku kasni 20 minuta i rešite da na osnovu toga i vi kasnije dođete, u 29 od 30 slučajeva propustićete let.
Medijana pokazuje da je najčešće kašnjenje 2 minuta što je za ovo merenje daleko realnije.

Modus ima malu primenu i pokazuje najćešču vrednost članova nekog niza.
Ovo obično nema nikakvog smisla za kontinualne vrednosti. Težina ljudi može bit ii 75,2 kg i 75,3 kg i 75,32 kg i isti set će imati potpuno različite moduse zavisno od toga da li koristimo decimale ili ne što nije ispravno.

Modus ima smisla samo kod kategorija. Recimo, ako gledamo kojim vidom prevoza ljudi najčešće idu na posao nekom gradu pa pokušamo odrediti srednju vrednost, i ako imamo: peške ide 12123, autoobilom 25437, autobusom 78324, vozom 34219, kombinacijom dva prevoza 44386.
Tu možemo reći da je modus ( najčešći vid prevoza ) autobus sa 78324 predstavnika.

Generalni zaključak bi bio:
Ako se vaš set sastoji od kontinualnih vrednosti bez većih ekstrema koristite aritmetičku sredinu.
Ako je vaš set sastavljen od ekonomskih pokazatelja iskazanih novcem, uvek koristite medijanu.
Za odnos među kategorijama, koristite modus.

Zanimljiva stvar je ovo korišćenje aritmetičke sredine za objašnjavanje ekonomskih fenomena (cene, plate, krediti, itd… ).
Ovi fenomeni najčešće imaju ekstreme samo na jednoj strani ( jedna plata može biti 100 puta veća od prosečne, ali ne može biti 100 puta manja od prosečne) i u tim situacijama aritmetička sredina je ovek veća od medijane.

Stručnjaci to znaju, a publika ne obraća pažnju i često se manipuliše prosecima zavisno od toga koji efekat manipulator želi da postigne.

Primer je upravo prosečna plata. Iako svaki statističar zna da je jedini ispravan prosek za visinu plate medijana, firme pa i državni organi kao svoje proseke uvek prikazuju aritmetičku sredinu jer je veća.

Zato obratite pažnju i na analize koje vam neko dostavlja i proverite uvek kojom metodom su računati proseci. Ako vam neko servira aritmetičku sredinu za ekonomske pokazatelje, ili je šarlatan ili pokušava da vas prevari.
A i jedne i druge treba izbegavati.

Želite da pokrenete novi projekat sa nama?