Valoarea medie - caracteristică generală
Evaluare: 0/5
Continuăm examinarea subiectului mediilor. În discuțiile anterioare despre articol ce valoarea medie ca datele originale pot afecta calitatea mediului și ce să facă la valoarea medie a fost indicator informativ, mai degrabă decât „temperatura medie în spital.“
Acum, ia în considerare o altă funcție importantă a acestei statistici, ceea ce explică în mare parte, în scopul utilizării sale. Funcția principală a valorii medii este în „comprimarea“ a informațiilor inițiale. Să ne imaginăm că suntem interesați să compare nivelul salariilor în unele țări, care sunt acasa, la mai multe milioane de oameni. Salariile sunt diferite, sunt bogați săraci, medie,. Cum de a determina țara în care oamenii obține mai mult? Cum să obțineți bunăstarea evaluare sumativă? Și a fost atât de des întrebarea este: în cazul în care mai mult se obține de la noi sau de la ei? Este imposibil să se răspundă la această întrebare, fără a recurge la analiza statistică a datelor. Cu toate acestea, dacă se calculează salariul mediu din țară, cantitatea mare de date brute „shrink“ la doar un singur indicator pentru fiecare țară. Ulterior, valorile medii pot fi foarte ușor și vizual comparate între ele. Trebuie să se înțeleagă că, în tranziția de la date brute la valorile medii diversitatea datelor originale dispare. Nu vom vedea salariul fiecărui angajat în mod individual (unele informații este pierdut), dar o cantitate mare de informații sursă care nu pot înțelege și digera creierul gol se transformă într-o descriere destul de compact și informativ al întregului set de valori. Jongla o minge este mai ușor decât câteva. Ferește-te de o pasăre este mai ușor decât zece. Pe scurt, cu un subiect mai ușor de manipulat decât mulți.
Calitatea unei astfel de caracteristici (medie) depinde de datele originale, dar punctul rămâne aceeași - cantități mari de date „comprimate“ la o singură valoare. În cazul în care datele sursă, în sensul statistic al calității (omogene), valoarea medie, reține conținutul de informații (de exemplu, să reflecte în mod corect modelul de) datele brute și de multe ori va reduce volumul lor. Dar, în realitate, set omogen de date nu apare de multe ori. Ce se întâmplă în continuare depinde de scopul analizei. Dacă suntem încă importante pentru a obține rapid și ușor o evaluare generalizată a salariului în țară, este posibil să se calculeze medii, ignorând omogenitatea lor. Apoi, trebuie să țină cont de faptul că valorile medii calculate nu sunt reflectă în mod fiabil nivelul natural al salariilor, și va arăta doar cheltuieli salariale totale pe angajat. Acest indicator este cel mai adesea pot fi găsite în diverse publicații. Dar noi suntem acum, ca analiștii competente să înțeleagă că nu ar trebui să fie interpretată ca o medie niveluri (naturale) s / n, și așa cum se calculează: Fondul c / n per angajat. Aceasta, desigur, un fleac pentru nespecialiști, dar încă sunt de acord că între rândurile de numere și există o anumită diferență calitativă, cu toate că ambele serii media aritmetică a acestora - 5. Pentru claritate, diferențele în graficele reprezintă datele.
Figura din stânga arată în mod clar că într-un prim set de date numere sunt eterogene - valori Partea substanțial mai mare decât valoarea medie (linia roșie), partea - considerabil mai puțin; în al doilea set (figura din dreapta), toate valorile sunt mult mai omogene (ușor diferite una de cealaltă și aglomerarea în jurul valorii medii - linia roșie). Acest exemplu cu numere similare cu exemplul din articolul anterior despre cei săraci și cei bogați.
Dacă dorim să obținem o calitate medie punct de vedere statistic, setul original de eterogen ar trebui să fie împărțite în grupuri omogene și deja grupate de date pentru a calcula medii. Cum se va grupuri, și ca valori medii. Acest lucru dacă este făcută pentru știință. În practică, puțini oameni știu că o astfel de omogenitate și continuă să creadă, „temperatura medie în spital.“ Pe de altă parte, uniformitatea este de multe ori nu este deloc necesar, deoarece analistul este de obicei interesantă analiză a situației în dinamica. Iar dinamica eterogenitate nivelat aproximativ la fel ca și fracțiunea redusă (nu vom intra intr-o clasa a 6-algebră interesant). În general, uniformitatea datelor - aceasta este o cerință importantă, dar nu întotdeauna necesar. Dar să revenim la statistici corecte și riguroase.
Evident, cu atât mai mult un număr mai mare de grupuri pentru a împărți datele originale, astfel încât acestea vor fi mai uniforme în cadrul fiecărui grup. Cu toate acestea, acest lucru crește numărul de medii în sine, iar acest lucru la rândul său, face dificilă realizarea și interpretarea unei analize statistice. Din acest motiv, analistul trebuie să încerce să realizeze un raport optim între numărul de grupuri și calitatea acestora (omogenitate). Ar trebui, de asemenea, să acorde o atenție la numărul de valori în cadrul grupurilor. Se întâmplă adesea ca întregul corp este împărțit astfel încât majoritatea valorilor devine doar una sau două grupe, iar valorile rămase sunt atât de diferită de cea mai mare parte, că cel puțin unele grupuri de a le face. Desigur, pentru a analiza datele de la una sau două nu face observații sens. Aceste valori sunt numite anormale, iar în multe cazuri, acestea ar trebui să fie eliminate cu totul din calcule (fără a uita despre existența lor).
Astfel, există două tipuri de informații polare: fie cele mai exacte (în cazul în care valoarea inițială de a opera fiecare separat) sau maxim compact (atunci când toate informațiile se înlocuiește cu o altă caracteristică, cum ar fi valoarea medie). Variantele intermediare definite de grup de date. Cu cat mai mare grup, cu atât mai omogenă datele în ele, dar cu atât mai mare media. Această situație face ca problema de a alege între precizie și compactitate. În cazul în care datele sunt analizate în dinamică, neomogenitatea poate fi neglijată, deoarece are un efect redus asupra dinamicii indicelui. Dar, dacă vom compara valorile medii ale altor medii (cu alte obiecte în spațiu, dar nu și în vorbitor), este încă necesar să se acorde o atenție indicatorilor de calitate. Pentru date eterogene ar fi corect să dețină grup și / sau a interpreta rezultatele calculelor corect. Cel mai important lucru pentru analist nu ridice de pe sol și pentru fiecare calcul să se simtă o legătură cu realitatea.
Asta este tot. Cu toate acestea, tema medii vor continua, există încă o mulțime de interesante și informative.
Toate cele bune.