Statističke karakteristike. Osnovne statističke karakteristike disperzije Koji broj je statistička karakteristika serije

Ključne riječi sažetka: statistička obilježja, statističko istraživanje, uzorkovanje, varijante, veličina uzorka, aritmetička sredina, varijacijski niz, raspon niza, način uzorkovanja, medijan niza.

Statistička istraživanja

Proučavati, obrađivati ​​i analizirati kvantitativne podatke različitih masovnih društveno-ekonomskih procesa i pojava, statistički(od latinske riječi status - "stanje, stanje stvari") istraživanje. Već u antičkim državama vodili su evidenciju o stanovništvu sposobnom za plaćanje poreza. S razvojem društva bile su potrebne znanstvene metode za obradu i analizu najrazličitijih informacija. Dakle, u 19.st. pojavila se biološka statistika, nazvana biometrija, a proučavala je brojčane karakteristike pojedinih bioloških jedinki i njihove populacije. Možete navesti više od desetak različitih statistika: ekonomske, financijske, porezne, demografske, medicinske, meteorološke itd.

Svaka statistička studija sastoji se od prikupljanje i obrada informacija . Na temelju dobivenih podataka izrađuju se razne prognoze, procjenjuje se njihova pouzdanost itd. Važan zadatak, bez kojeg statistički podaci gube svaki smisao, je obrada primljenih podataka.

Pogledajmo primjer. Učenici dvaju sedmih razreda imali su test iz matematike koji se sastojao od 10 zadataka. Prilikom provjere rada zabilježen je broj zadataka koje su učenici točno riješili. Imamo dva niza brojeva:

7 „A“ razred: 8; 7; 2; 5; 10; 9; 8; 7; 7; 10; 9; 6; 5; 8; 8; 10; 9; 9; 10; 7; 9; 10; 7; 9; 6;
7 "B" razred: 8; 7; 8; 6; 9; 9; 7; 8; 7; 9; 9; 6; 5; 8; 7; 10; 9; 10; 10; 7; 8; 9; 7; 9; 9.

Skup podataka dobivenih kao rezultat statističke studije naziva se uzorkovanje, a svaki broj u ovoj seriji je opcija uzorci. Broj brojeva u nizu naziva se veličina uzorka. U našem primjeru veličina uzorka je broj učenika u svakom razredu koji su sudjelovali u testiranju. U svakom slučaju, veličina uzorka je 25.

Imajući gornja dva niza podataka, teško je usporediti rezultate testiranja učenika dvaju razreda. A ako uzmemo u obzir rezultate koje pokazuju svi sedmaši u jednom gradu ili cijeloj regiji, podaci će biti toliko glomazni da će biti beskorisni. Stoga se za statističku obradu podataka koriste razni statističke karakteristike.

Prosjek. Varijacijski nizovi

Jedna od karakteristika koja se široko koristi u statističkim istraživanjima je prosjek.

Definicija. Aritmetička sredina niz podataka naziva se kvocijent zbroja svih varijanti niza i količina varijante.

Budući da je broj opcija veličina uzorka, aritmetička sredina uzorka je kvocijent zbroja svih opcija i veličine uzorka.

Pogledajmo primjer. Nađimo prosječnu ocjenu koju su učenici 7. "A" razreda dobili prilikom polaganja testa:

Ovaj izračun aritmetičke sredine uzorka nije baš prikladan. Možete učiniti stvari drugačije.Prepišimo izbor za klasu 7 "A", rasporedivši njegove opcije tako da svaka sljedeća nije ništa manja od prethodne. Dobivamo:
2; 5; 5; 6; 6; 7; 7; 7; 7; 7; 8; 8; 8; 8; 9; 9; 9; 9; 9; 9; 10; 10; 10; 10; 10.

Ovaj ogledni zapis se zove uređen niz podataka (ili varijacijske serije ). Sada je lako vidjeti da je jedan učenik dobio 2 boda, dva učenika su dobila 5 bodova, dva učenika su dobila 6 bodova, pet učenika je dobilo 7 bodova itd. Broj pojavljivanja iste varijante u uzorku naziva se učestalost te varijante. Tako je, na primjer, učestalost opcije 7 5, učestalost opcije 10 je 5. Napravimo tablicu učestalosti opcije za učenike 7. razreda "A". U prvom retku upisujemo sve moguće brojeve bodova koje bi studenti mogli dobiti prilikom rješavanja testa, tj. brojevima od 0 do 10. U drugom retku upisujemo pripadajuće frekvencije, t.j. broj studenata koji su dobili navedeni broj bodova.

Provjerimo jesmo li pogriješili pri izračunavanju frekvencija: zbroj frekvencija treba biti jednak veličini uzorka. Zaista, 0 + 0 + 1+ 0 + 0 + 2 + 2 + 5 + 4 + 6 + 5 = 25 (naravno, ne morate pisati nule). Sada možete jednostavnije izračunati aritmetičku sredinu uzorka:

Imajte na umu da su aritmetička sredina uređene serije podataka i aritmetička sredina uzorka isti broj. Napravimo tablicu frekvencija uzorkovanja za ocjenu 7 "B".

Imajte na umu da tablica frekvencija obično ne uključuje opcije čije su frekvencije jednake nuli. U ovom slučaju, tablica učestalosti za klasu 7 "B" bit će sljedeća:

Nađimo veličinu uzorka: 1 + 2 + 6 + 5 + 8 + 3 = 25. Nađimo sada aritmetičku sredinu:

Poznavajući prosječne rezultate učenika 7. “A” i 7. “B” razreda, možemo zaključiti da su učenici 7. “B” općenito bolje riješili test, jer 8,04 > 7,8 .

Sastavljene tablice učestalosti omogućuju nam izvlačenje drugih korisnih zaključaka na temelju rezultata testiranja. Na primjer, za prvi uzorak (rezultati učenika 7. razreda) najniža dobivena ocjena je 2, a najveća 10. Rezultati svih učenika u razredu nalaze se između ovih brojeva. Za drugi uzorak, najmanja opcija je 5, najveća je 10. To može značiti da je klasa 7 “B” homogenija u svojoj matematičkoj pripremi od klase 7 “A”.

Raspon redaka. Modno uzorkovanje

Još jedan pokazatelj koji se koristi pri analizi statističkih podataka je raspon serije.

Definicija. Razlika između najveće i najmanje opcije uzorka naziva se raspon niza.

U ranije razmatranom primjeru, raspon prvog uzorka (ili uređenog niza podataka) je 10 - 2 = 8, a drugog 10 - 5 = 5. Raspon uzorka nalazi se u slučaju kada je količina širenje podataka u seriji značajno je za studiju. Na primjer, u meteorologiji nije važna samo prosječna dnevna temperatura, već i brojčane karakteristike kolebanja temperature zraka tijekom dana, odnosno opseg uzorkovanja.

Imajte na umu da je u praksi, kada se analiziraju podaci dobiveni kao rezultat studije, prikladno koristiti drugu statističku karakteristiku - tzv. način uzorkovanja.

Definicija. Opcija uzorkovanja koja ima najveću frekvenciju naziva se načinom uzorkovanja.

U razmatranom primjeru s proučavanjem rezultata testa provedenog u dva sedma razreda, modus i prvog i drugog reda je broj 9, koji se češće od ostalih pojavljuje i u prvom i u drugom uzorku.

Način niza nalazi se kada je potrebno identificirati pokazatelj tipičan za dati uzorak. Ako, na primjer, proučavamo podatke o veličinama muških košulja koje se prodaju u trgovini na određeni dan, može biti zgodno koristiti pokazatelj kao što je moda, koji karakterizira veličinu za kojom postoji najveća potražnja.

Ako se u uzorku dva broja pojavljuju s istom učestalošću, koja premašuje učestalosti s kojima se pojavljuju drugi brojevi, tada su obje ove opcije način za ovu seriju. Dakle, u 2. redu; 3; 3; 3; 5; 5; 6; 6; 6; 7; 8; 8 dva modusa su brojevi 3 i 6. Može se dogoditi da u uzorku bude više od dva modusa ili da ga uopće neće biti. Na primjer, red 2; 2; 3; 3; 4; 4; 5; 5 nema mod.

Medijan serije

Druga karakteristika koja se koristi u statistici je medijan niza.

Pogledajmo primjer. Djelatnici laboratorija kupili su udjele u jednom poduzeću. Broj dionica koje su kupili zaposlenici je sljedeći: 2; 3; 5; 6; 8; 9; 51. Morate procijeniti prosječan broj kupljenih dionica.

Ova serija nema modu. Nađimo aritmetičku sredinu niza:

Pronađeni broj ne odražava stvarno stanje raspodjele udjela između zaposlenika laboratorija, jer je više od šest od sedam varijanti serije. Da bismo procijenili prosječnu vrijednost, postupit ćemo drugačije. Napravimo uređeni niz od dobivenih podataka i pronađemo opciju napisanu u sredini niza.
2; 3; 5; 6 ; 8; 9; 51.
Ova opcija se zove medijan . Jednaka je 6. Naravno, pronađena vrijednost samo približno karakterizira prosjek niza, ali ova je karakteristika bliža stvarnosti.

Ako niz ima paran broj varijanti, tada se aritmetička sredina dva srednja elementa smatra medijanom. Na primjer, medijan serije je 3; 3; 4; 5; 5: 6 : 6; 7; 7; 40 je aritmetička sredina brojeva 5 i 6, tj. (5 + 6)/2 = 5,5.

Definicija. Ako postoji neparan broj opcija u uređenom nizu podataka, tada se prosječan broj opcija naziva medijan niza. Ako postoji paran broj varijanti u uređenom nizu, tada se aritmetička sredina dviju srednjih varijanti naziva medijan niza.

Medijan slučajnog uzorka je medijan odgovarajuće uređene serije. Imajte na umu da ako uređeni niz podataka sadrži 2n - 1 opcija ( n- prirodni broj), tada je medijan n-i opciju, a ako uređeni niz podataka sadrži 2n brojeva, tada je medijan aritmetička sredina n th i n+1 ti brojevi.

Pogledajmo primjer. Tijekom natjecanja u gađanju sportaš je osvojio sljedeći broj bodova: 9; 9; 8; 10; 8; 7; 9; 10; 8; 7. Nađimo: a) veličinu uzorka; b) aritmetička sredina uzorka; c) opseg; d) način serije; e) medijan uzorka.

Da bismo riješili problem, zapišimo uređeni niz podataka:
7; 7; 8; 8; 8; 9; 9; 9; 10; 10.

A) Sportaš je ispalio 10 hitaca, što znači da je veličina uzorka 10.

B) Odredite aritmetičku sredinu uzorka

C) Raspon niza je 10 - 7 = 3.

D) Ova serija ima dva načina: 8 i 9.

D) Pronađite medijan uzorka. Ova serija sadrži paran broj opcija. Nađimo aritmetičku sredinu dvaju brojeva zapisanih u sredini niza: (8 + 9)/2 = 8,5. Medijan uzorka je 8,5.

Ovo je sažetak matematike na tu temu "Statističke karakteristike". Odaberite sljedeće korake:

  • Idi na sljedeći sažetak:

Statistika je jedna od najstarijih grana primijenjene matematike, koja široko koristi teorijsku osnovu mnogih aritmetičkih definicija za obavljanje praktičnih ljudskih aktivnosti. Još u starim državama pojavila se potreba za striktnim evidentiranjem dohotka građana po skupinama kako bi se proveo učinkovit proces oporezivanja. Statistička istraživanja su od velike važnosti za gospodarski razvoj društva, i ne samo to. Stoga ćemo u ovom video vodiču pogledati osnovne definicije statističkih karakteristika.

Recimo da trebamo proučiti statistiku izvedbe testa za učenike sedmog razreda. Prvo, moramo stvoriti niz informacija s kojima možemo raditi. Podaci će u ovom slučaju biti brojevi koji određuju broj testova koje je svaki učenik ispunio. Zamislite dva razreda od kojih svaki ima po 15 učenika. Ukupni zadatak uključivao je 10 vježbi. Rezultati su bili sljedeći:

7A: 4, 10, 6, 4, 7, 8, 2, 10, 8, 5, 7, 9, 10, 6, 3;

7B: 7, 5, 9, 7, 8, 10, 7, 1, 7, 6, 5, 9, 8, 10, 7.

Dobili smo, u matematičkoj interpretaciji, dva niza brojeva, od kojih se svaki sastoji od 15 elemenata. Ovaj niz informacija, sam po sebi, može malo pomoći u procjeni učinkovitosti izvršenja zadatka. Stoga ga je potrebno statistički transformirati. Da bismo to učinili, uvodimo osnovne pojmove statistike. Niz brojeva dobivenih istraživanjem naziva se uzorak. Svaki broj (broj odrađenih vježbi) je ogledna opcija. A broj svih brojeva (u ovom slučaju to je 30 - zbroj svih učenika u oba razreda) je veličina uzorka.

Jedna od glavnih statističkih karakteristika je aritmetička sredina. Ova se vrijednost definira kao kvocijent dobiven dijeljenjem zbroja vrijednosti uzorka s njegovim volumenom. U našem slučaju potrebno je sve dobivene brojeve zbrojiti i podijeliti s 15 (ako računamo aritmetičku sredinu za bilo koji razred), odnosno s 30 (ako računamo ukupnu aritmetičku sredinu). U prikazanom primjeru zbroj svih brojeva riješenih zadataka za razred 7A bit će 99. Podijelimo li s 15, dobivamo 6,6 - to je aritmetički prosjek riješenih zadataka za ovu grupu učenika.

Rad s kaotičnim skupom brojeva nije baš zgodan, pa se vrlo često niz informacija svodi na uređen skup podataka. Kreirajmo niz varijacija za razred 7B koristeći metodu postupnog povećanja, slažući brojeve od najmanjeg do najvećeg:

1, 5, 5, 6, 7, 7, 7, 7, 7, 8, 8, 9, 9, 10, 10.

Broj pojavljivanja bilo koje vrijednosti u uzorku podataka naziva se učestalost uzorka. Na primjer, učestalost opcije "7" u gornjoj seriji varijacija lako se određuje i jednaka je pet. Radi lakšeg prikaza, poredani niz se pretvara u tablicu koja prikazuje odnos između standardnog niza vrijednosti opcija i učestalosti pojavljivanja (broj učenika koji su izvršili isti broj zadataka).

U klasi 7A, najmanja opcija uzorkovanja je "2", a najveća je "10". Interval između 2 i 10 naziva se raspon varijacijske serije. Za klasu 7B, raspon niza je od 1 do 10. Najveća, u smislu učestalosti pojavljivanja, varijanta naziva se način uzorkovanja - za 7A to je broj 7, koji se pojavljuje 5 puta.

PREDAVANJE 2

Osnovni pojmovi matematičke statistike. Metoda uzorkovanja. Numeričke karakteristike statističkih nizova Točkaste statističke procjene i zahtjevi za njih. Metoda intervala povjerenja. Testiranje statističkih hipoteza.

Poglavlje 3.
OSNOVNI POJMOVI MATEMATIČKE STATISTIKE

Metoda uzorkovanja

Ovo poglavlje daje kratak pregled osnovnih koncepata i rezultata matematičke statistike koji se koriste u tečaju ekonometrije.

Jedna od središnjih zadaća matematičke statistike je identificirati obrasce u statističkim podacima, na temelju kojih je moguće izgraditi odgovarajuće modele i donijeti informirane odluke. Prvi zadatak matematička statistika sastoji se od razvijanja metoda za prikupljanje i grupiranje statističkih informacija dobivenih kao rezultat opažanja ili kao rezultat posebno dizajniranih eksperimenata. Drugi zadatak matematička statistika je razviti metode za obradu i analizu statističkih podataka ovisno o ciljevima studija. Elementi takve analize posebice su: procjena parametara poznate funkcije razdiobe, provjera statističkih hipoteza o vrsti razdiobe itd.

Postoji bliska veza između matematičke statistike i teorije vjerojatnosti. Teorija vjerojatnosti naširoko se koristi u statističkom proučavanju masovnih pojava, koje se mogu, ali i ne moraju klasificirati kao slučajne. To se radi kroz teoriju uzorkovanja. Ovdje nisu sami fenomeni koji se proučavaju podložni zakonima vjerojatnosti, već metode njihova istraživanja. Osim toga, teorija vjerojatnosti igra važnu ulogu u statističkom proučavanju probabilističkih pojava. U tim slučajevima, same pojave koje se proučavaju podliježu dobro definiranim probabilističkim zakonima.

Glavna zadaća matematičke statistike je razvoj metoda za dobivanje znanstveno utemeljenih zaključaka o masovnim pojavama i procesima iz podataka promatranja ili eksperimenta. Na primjer, trebate provesti kontrolu kvalitete proizvedene serije dijelova ili istražiti kvalitetu tehnološkog procesa. Moguće je, naravno, provesti kompletan pregled, t.j. pregledati svaki detalj serije. Međutim, ako ima previše dijelova, tada je fizički nemoguće provesti cjelovito snimanje, a ako je snimanje objekta povezano s njegovim uništenjem ili zahtijeva velike troškove, nema smisla provoditi cjelovito istraživanje. Stoga je potrebno odabrati samo dio cjelokupnog skupa objekata za ispitivanje, tj. provesti anketu uzorka. Stoga je u praksi često potrebno procijeniti parametre velike populacije iz malog broja nasumično odabranih elemenata.



Cijeli skup objekata koji se proučavaju naziva se opća populacija. Onaj dio objekata koji je odabran iz opće populacije naziva se uzorak populacije ili kraće - uzorkovanje. Dogovorimo se da veličinu uzorka označimo slovom n, a obujam stanovništva je slov N.

Uzorak se, općenito, formira za procjenu bilo koje karakteristike populacije. Međutim, ne može svaki uzorak dati pravu sliku populacije. Na primjer, dijelove obično proizvode radnici različitih kvalifikacija. Ako su podvrgnuti kontroli samo dijelovi koje izrađuju radnici niže kvalifikacije, tada će ideja o kvaliteti cjelokupnog proizvoda biti "podcijenjena", ako samo dijelovi koje izrađuju radnici viših kvalifikacija, tada će ta ideja biti precijenjena.

Kako bismo iz podataka uzorka mogli pouzdano prosuditi obilježje opće populacije koje nas zanima, potrebno je da objekti uzorka to ispravno predstavljaju. Drugim riječima, uzorak mora ispravno predstavljati omjere populacije. Ovaj zahtjev je ukratko formuliran na sljedeći način: uzorak bi trebao biti predstavnik(ili predstavnik) .

Reprezentativnost uzorka osigurava se slučajnim odabirom. Sa slučajnim odabirom svi objekti u populaciji imaju istu priliku biti uključeni u uzorak. U ovom slučaju, u zakon velikih brojeva, može se tvrditi da će uzorak biti reprezentativan. Na primjer, kakvoća žitarica prosuđuje se prema malom uzorku. Iako je broj nasumično odabranih zrna malen u odnosu na cjelokupnu masu zrna, sam po sebi je prilično velik. Posljedično, karakteristike uzorka populacije vjerojatno će se malo razlikovati od karakteristika opće populacije.

razlikovati ponovljeno I ponavljajući uzorci. U prvom slučaju, odabrani objekt se vraća općoj populaciji prije odabira sljedećeg. U drugom slučaju, objekt odabran za uzorak ne vraća se općoj populaciji. Ako je veličina uzorka znatno manja od veličine populacije, tada će oba uzorka biti praktički jednaka.

U mnogim slučajevima za analizu pojedinih ekonomskih procesa bitan je redoslijed dobivanja statističkih podataka. No kada se razmatraju takozvani prostorni podaci, redoslijed kojim su oni dobiveni ne igra značajnu ulogu. Osim toga, rezultati uzorka vrijednosti x 1 , x 2 , …, x n kvantitativna karakteristika x opće populacije, zabilježeni redoslijedom kojim su zabilježeni, obično su teško vidljivi i nezgodni za daljnju analizu. Zadatak opisa statističkih podataka je dobiti prikaz koji će omogućiti jasno identificiranje vjerojatnosnih karakteristika. U tu svrhu koriste se različiti oblici sređivanja i grupiranja podataka.

Statistički materijal koji proizlazi iz promatranja (mjerenja) može se napisati u obliku tablice koja se sastoji od dva retka. Prvi red označava mjerni broj, drugi red označava dobivenu vrijednost. Ova tablica se zove jednostavne statističke serije:

ja n
x 1 x 2 x i x n

Međutim, s velikim brojem mjerenja, statističku seriju je teško analizirati. Stoga, rezultati promatranja moraju biti nekako urediti. Da biste to učinili, promatrane vrijednosti raspoređene su uzlaznim redoslijedom:

Gdje . Takav statistički niz naziva se rangiran.

Budući da neke vrijednosti statističke serije mogu imati isto značenje, mogu se kombinirati. Zatim svaka vrijednost x i broj će se uskladiti n i, jednako učestalosti pojavljivanja ove vrijednosti:

x 1 x 2 x k
n 1 n 2 n k

Takav niz se zove grupirani.

Poziva se rangirana i grupirana serija varijacijski. Promatrane vrijednosti x i se zovu opcije, a broj svih opažanja je varijante n ifrekvencija. Broj svih opažanja n nazvao volumen varijacijske serije. Omjer frekvencija n i na volumen serije n nazvao relativna frekvencija:

Osim diskretnih varijacijskih serija, oni također koriste interval varijacijske serije. Da bi se konstruirao takav niz, potrebno je odrediti veličinu intervala i grupirati rezultate promatranja u skladu s njima:

[x 1 ,x 2 ] (x 2 ,x 3 ] (x 3 ,x 4 ] (x k-1, x k]
n 1 n 2 n 3 n k

Intervalni niz varijacija obično se konstruira u slučajevima kada je broj promatranih varijanti vrlo velik. Obično se ova situacija javlja kada se promatra kontinuirana veličina (na primjer, mjerenje fizičke veličine). Postoji određeni odnos između intervalnih i diskretnih varijacijskih nizova: svaki diskretni niz može se napisati kao intervalni niz i obrnuto.

Za grafički opis niza diskretnih varijacija koristim poligon. Za konstrukciju poligona u pravokutnom koordinatnom sustavu potrebno je uzeti točke s koordinatama ( x i,n i) ili ( x i,w i). Te su točke zatim spojene segmentima. Rezultirajuća isprekidana linija naziva se poligon (vidi, na primjer, sl. 3.1a).

Da biste grafički opisali niz intervalnih varijacija, koristite histogram. Za njegovu konstrukciju duž apscisne osi polažu se segmenti koji prikazuju intervale varijacije, a na tim segmentima, kao na temelju, grade se pravokutnici s visinama jednakim frekvencijama ili relativnim frekvencijama odgovarajućeg intervala. Rezultat je lik koji se sastoji od pravokutnika, koji se naziva histogram (vidi, na primjer, sl. 3.1b).

A b
Riža. 3.1

Numeričke karakteristike statističkog niza

Konstruiranje niza varijacija samo je prvi korak prema razumijevanju niza opažanja. To nije dovoljno za potpuno proučavanje distribucije fenomena koji se proučava. Najprikladnija i najcjelovitija metoda je analitička metoda proučavanja serije, koja se sastoji u izračunavanju numeričkih karakteristika. Numeričke karakteristike koje se koriste za proučavanje nizova varijacija slične su onima koje se koriste u teoriji vjerojatnosti.

Najprirodnija karakteristika niza varijacija je koncept prosječne veličine. U statistici se koristi nekoliko vrsta prosjeka: aritmetička sredina, geometrijska sredina, harmonijska sredina itd. Najčešći je koncept aritmetička sredina:

Ako je niz varijacija konstruiran na temelju podataka opažanja, tada se koristi koncept ponderirana aritmetička sredina:

. (3.3)

Aritmetička sredina ima ista svojstva kao i matematičko očekivanje.

Kao mjeru disperzije vrijednosti promatrane veličine oko njezine prosječne vrijednosti uzimamo veličinu

, (3.4)

koji se kao i u teoriji vjerojatnosti naziva disperzija. Veličina

nazvao standardna devijacija(ili standardna devijacija). Statistička varijanca ima ista svojstva kao varijanca vjerojatnosti i za njezino izračunavanje može se koristiti alternativna formula

. (3.6)

Primjer 3.1. Za teritorije regije navedeni su podaci za 199X (tablica 3.1).

Tablica 3.1

Nađite aritmetičku sredinu i standardnu ​​devijaciju. Konstruirajte frekvencijski histogram.

Riješenje. Za izračun aritmetičke sredine i varijance gradimo proračunsku tablicu (tablica 3.4):

Tablica 3.4

x i n i n i x i n i x i 2
Iznos

Ovdje umjesto toga x i uzimaju se sredine odgovarajućih intervala. Prema tablici nalazimo:

, ,

Izgradimo frekvencijski histogram na temelju izvornih podataka (slika 3.3). â

Osnovne statističke karakteristike dijele se u dvije glavne skupine: mjere središnje tendencije i karakteristike varijacije.

Središnja tendencija uzorka omogućuju nam procjenu takvih statističkih karakteristika kao što su aritmetička sredina, mod, medijan.

Najlakše dobivena mjera središnje tendencije je način. Moda (Mo)– ovo je vrijednost u skupu opažanja koja se najčešće pojavljuje. U skupu vrijednosti (2, 6, 6, 8, 7, 33, 9, 9, 9, 10), mod je 9 jer se pojavljuje češće od bilo koje druge vrijednosti. U slučaju kada se sve vrijednosti u grupi pojavljuju jednako često, smatra se da ova grupa nema način.

Kada dvije susjedne vrijednosti u rangiranom nizu imaju istu frekvenciju i veće su od frekvencije bilo koje druge vrijednosti, mod je prosjek dviju vrijednosti.

Ako dvije nesusjedne vrijednosti u skupini imaju jednake frekvencije, a veće su od frekvencija bilo koje vrijednosti, tada postoje dva načina (na primjer, u zbirci vrijednosti 10, 11, 11, 11, 12, 13, 14, 14, 14, 17, načini su 11 i 14); u takvom slučaju, skupina mjerenja ili procjena je bimodalni.

Najveći mod u grupi je jedina vrijednost koja zadovoljava definiciju moda. Međutim, može postojati nekoliko manjih načina u cijeloj grupi. Ovi manji modovi predstavljaju lokalne vrhove distribucije frekvencije.

Medijan (ja)– sredina rangiranog niza rezultata mjerenja. Ako podaci sadrže paran broj različitih vrijednosti, tada je medijan točka koja se nalazi na sredini između dvije središnje vrijednosti kada su poredane.

Aritmetička sredina za neuređeni niz mjerenja izračunava se pomoću formule:

,

Gdje
. Na primjer, za podatke 4.1; 4.4; 4,5; 4,7; 4.8 izračunajmo:

.

Svaka od gore izračunatih središnjih mjera najprikladnija je za upotrebu u određenim uvjetima.

Način se izračunava najjednostavnije - može se odrediti okom. Štoviše, za vrlo velike skupine podataka to je prilično stabilna mjera središta distribucije.

Medijan je posrednik između modusa i srednje vrijednosti u smislu svog izračuna. Ovu je mjeru posebno lako dobiti u slučaju rangiranih podataka.

Prosječni skup podataka uključuje uglavnom aritmetičke operacije.

Na vrijednost prosjeka utječu vrijednosti svih rezultata. Medijan i način nisu potrebni za određivanje svih vrijednosti. Pogledajmo što se događa sa sredinom, medijanom i modom kada se maksimalna vrijednost u sljedećem skupu udvostruči:



1. set: 1, 3, 3, 5, 6, 7, 8 33/7 5 3

2. set: 1, 3, 3, 5, 6, 7, 16 41/7 5 3

Na vrijednost prosjeka posebno utječu rezultati koji se nazivaju “outliers”, tj. podaci koji se nalaze daleko od središta skupine procjena.

Izračunavanje moda, medijana ili srednje vrijednosti čisto je tehnički postupak. Međutim, odabir jedne od ove tri mjere i njihovo tumačenje često zahtijeva malo razmišljanja. Tijekom postupka odabira trebali biste utvrditi sljedeće:

– u malim skupinama moda može biti potpuno nestabilna. Na primjer, način grupe: 1, 1, 1, 3, 5, 7, 7, 8 jednak je 1; ali ako se jedna od jedinica pretvori u nulu, a druga u dvojku, tada će način biti jednak 7;

– na medijan ne utječu vrijednosti „velikih“ i „malih“ vrijednosti. Na primjer, u skupini od 50 vrijednosti, medijan se neće promijeniti ako se najveća vrijednost utrostruči;

– vrijednost prosjeka je pod utjecajem svake vrijednosti. Ako se jedna vrijednost promijeni za c jedinica, promijenit će se u istom smjeru za c/n jedinica;

– Neki skupovi podataka nemaju središnju tendenciju, što često dovodi u zabludu kada se izračunava samo jedna mjera središnje tendencije. Ovo posebno vrijedi za grupe koje imaju više od jednog načina;

– kada se skupina podataka smatra uzorkom iz velike simetrične skupine, srednja vrijednost uzorka vjerojatno će biti bliža središtu velike skupine od medijana i moda.

Sve prosječne karakteristike daju opći opis niza rezultata mjerenja. U praksi nas često zanima koliko koji rezultat odstupa od prosjeka. Međutim, lako je zamisliti da dvije skupine rezultata mjerenja imaju iste srednje, ali različite vrijednosti mjerenja. Na primjer, za redak 3, 6, 3 – prosjek = 4; za serije 5, 2, 5 – također prosječna vrijednost = 4, unatoč značajnoj razlici između ovih serija.

Stoga se prosječne karakteristike uvijek moraju dopuniti pokazateljima varijacije, odnosno varijabilnosti.



Na karakteristike varijacije, ili fluktuacije, rezultati mjerenja uključuju raspon varijacije, disperziju, standardnu ​​devijaciju, koeficijent varijacije, standardnu ​​pogrešku aritmetičke sredine.

Najjednostavnija karakteristika varijacije je raspon varijacije. Definira se kao razlika između najvećeg i najmanjeg rezultata mjerenja. Međutim, bilježi samo ekstremna odstupanja, a ne bilježi odstupanja svih rezultata.

Da bi se dobila opća karakteristika, mogu se izračunati odstupanja od prosječnog rezultata. Na primjer, za redak 3, 6, 3 vrijednosti bit će kako slijedi: 3 – 4 = – 1; 6 – 4 = 2; 3 – 4 = – 1. Zbroj ovih odstupanja (– 1) + 2 + (– 1) uvijek je jednak 0. Da bi se to izbjeglo, vrijednosti svakog odstupanja se kvadriraju: (– 1) 2 + 2 2 + (– 1) 2 = 6.

Značenje čini odstupanja od prosjeka očitijima: mala odstupanja postaju još manja (0,5 2 = 0,25), a velika odstupanja još veća (5 2 = 25). Dobiveni iznos nazvao zbroj kvadrata odstupanja. Dijeljenje ovog zbroja s brojem mjerenja daje srednje kvadratno odstupanje, odn disperzija. Označava se s 2 i izračunava se po formuli:

.

Ako broj mjerenja nije veći od 30, tj. n ≤ 30, koristi se formula:

.

Naziva se veličina n – 1 = k broj stupnjeva slobode, koji se odnosi na broj slobodno varirajućih članova populacije. Utvrđeno je da pri izračunavanju indeksa varijacije jedan član empirijske populacije uvijek nema stupanj slobode.

Ove se formule koriste kada su rezultati predstavljeni nesređenim (običnim) uzorkom.

Od oscilacijskih karakteristika najčešće se koristi standardna devijacija, koja je definirana kao pozitivna vrijednost kvadratnog korijena vrijednosti varijance, tj.:

.

Standardna devijacija ili standardna devijacija karakterizira stupanj odstupanja rezultata od prosječne vrijednosti u apsolutnim jedinicama i ima iste mjerne jedinice kao i rezultati mjerenja.

Međutim, ova karakteristika nije prikladna za usporedbu varijabilnosti dviju ili više populacija koje imaju različite mjerne jedinice.

Koeficijent varijacije definira se kao omjer standardne devijacije i aritmetičke sredine, izražen kao postotak. Izračunava se po formuli:

.

U sportskoj praksi varijabilnost rezultata mjerenja ovisno o vrijednosti koeficijenta varijacije smatra se malom
(0 – 10%), srednji (11 – 20%) i veliki (V > 20%).

Koeficijent varijacije je od velike važnosti u statističkoj obradi rezultata mjerenja, jer kao relativna vrijednost (mjerena u postocima) omogućuje usporedbu varijabilnosti rezultata mjerenja u različitim mjernim jedinicama. Koeficijent varijacije može se koristiti samo ako se mjerenja provode na skali omjera.

Osnovne statističke karakteristike dijele se u dvije glavne skupine: mjere središnje tendencije i karakteristike varijacije.

Središnja tendencija uzorka omogućuju nam procjenu takvih statističkih karakteristika kao što su aritmetička sredina, mod, medijan.

Najlakše dobivena mjera središnje tendencije je način. Moda (Mo)– ovo je vrijednost u skupu opažanja koja se najčešće pojavljuje. U skupu vrijednosti (2, 6, 6, 8, 7, 33, 9, 9, 9, 10), mod je 9 jer se pojavljuje češće od bilo koje druge vrijednosti. U slučaju kada se sve vrijednosti u grupi pojavljuju jednako često, smatra se da ova grupa nema način.

Kada dvije susjedne vrijednosti u rangiranom nizu imaju istu frekvenciju i veće su od frekvencije bilo koje druge vrijednosti, mod je prosjek dviju vrijednosti.

Ako dvije nesusjedne vrijednosti u skupini imaju jednake frekvencije, a veće su od frekvencija bilo koje vrijednosti, tada postoje dva načina (na primjer, u zbirci vrijednosti 10, 11, 11, 11, 12, 13, 14, 14, 14, 17, načini su 11 i 14); u takvom slučaju, skupina mjerenja ili procjena je bimodalni.

Najveći mod u grupi je jedina vrijednost koja zadovoljava definiciju moda. Međutim, može postojati nekoliko manjih načina u cijeloj grupi. Ovi manji modovi predstavljaju lokalne vrhove distribucije frekvencije.

Medijan (ja)– sredina rangiranog niza rezultata mjerenja. Ako podaci sadrže paran broj različitih vrijednosti, tada je medijan točka koja se nalazi na sredini između dvije središnje vrijednosti kada su poredane.

Aritmetička sredina za neuređeni niz mjerenja izračunava se pomoću formule:

Gdje . Na primjer, za podatke 4.1; 4.4; 4,5; 4,7; 4.8 izračunajmo:

.

Svaka od gore izračunatih središnjih mjera najprikladnija je za upotrebu u određenim uvjetima.

Način se izračunava najjednostavnije - može se odrediti okom. Štoviše, za vrlo velike skupine podataka to je prilično stabilna mjera središta distribucije.

Medijan je posrednik između modusa i srednje vrijednosti u smislu svog izračuna. Ovu je mjeru posebno lako dobiti u slučaju rangiranih podataka.

Prosječni skup podataka uključuje uglavnom aritmetičke operacije.

Na vrijednost prosjeka utječu vrijednosti svih rezultata. Medijan i način nisu potrebni za određivanje svih vrijednosti. Pogledajmo što se događa sa sredinom, medijanom i modom kada se maksimalna vrijednost u sljedećem skupu udvostruči:

1. set: 1, 3, 3, 5, 6, 7, 8 33/7 5 3

2. set: 1, 3, 3, 5, 6, 7, 16 41/7 5 3

Na vrijednost prosjeka posebno utječu rezultati koji se nazivaju “outliers”, tj. podaci koji se nalaze daleko od središta skupine procjena.

Izračunavanje moda, medijana ili srednje vrijednosti čisto je tehnički postupak. Međutim, odabir jedne od ove tri mjere i njihovo tumačenje često zahtijeva malo razmišljanja. Tijekom postupka odabira trebali biste utvrditi sljedeće:

– u malim skupinama moda može biti potpuno nestabilna. Na primjer, način grupe: 1, 1, 1, 3, 5, 7, 7, 8 jednak je 1; ali ako se jedna od jedinica pretvori u nulu, a druga u dvojku, tada će način biti jednak 7;

– na medijan ne utječu vrijednosti „velikih“ i „malih“ vrijednosti. Na primjer, u skupini od 50 vrijednosti, medijan se neće promijeniti ako se najveća vrijednost utrostruči;

– vrijednost prosjeka je pod utjecajem svake vrijednosti. Ako se jedna vrijednost promijeni za c jedinica, promijenit će se u istom smjeru za c/n jedinica;

– Neki skupovi podataka nemaju središnju tendenciju, što često dovodi u zabludu kada se izračunava samo jedna mjera središnje tendencije. Ovo posebno vrijedi za grupe koje imaju više od jednog načina;

– kada se skupina podataka smatra uzorkom iz velike simetrične skupine, srednja vrijednost uzorka vjerojatno će biti bliža središtu velike skupine od medijana i moda.

Sve prosječne karakteristike daju opći opis niza rezultata mjerenja. U praksi nas često zanima koliko koji rezultat odstupa od prosjeka. Međutim, lako je zamisliti da dvije skupine rezultata mjerenja imaju iste srednje, ali različite vrijednosti mjerenja. Na primjer, za redak 3, 6, 3 – prosjek = 4; za serije 5, 2, 5 – također prosječna vrijednost = 4, unatoč značajnoj razlici između ovih serija.

Stoga se prosječne karakteristike uvijek moraju dopuniti pokazateljima varijacije, odnosno varijabilnosti.

Na karakteristike varijacije, ili fluktuacije, rezultati mjerenja uključuju raspon varijacije, disperziju, standardnu ​​devijaciju, koeficijent varijacije, standardnu ​​pogrešku aritmetičke sredine.

Najjednostavnija karakteristika varijacije je raspon varijacije. Definira se kao razlika između najvećeg i najmanjeg rezultata mjerenja. Međutim, bilježi samo ekstremna odstupanja, a ne bilježi odstupanja svih rezultata.

Da bi se dobila opća karakteristika, mogu se izračunati odstupanja od prosječnog rezultata. Na primjer, za redak 3, 6, 3 vrijednosti će biti sljedeće: 3 – 4 = – 1; 6 – 4 = 2; 3 – 4 = – 1. Zbroj ovih odstupanja (– 1) + 2 + (– 1) uvijek je jednak 0. Da bi se to izbjeglo, vrijednosti svakog odstupanja se kvadriraju: (– 1) 2 + 2 2 + (– 1) 2 = 6.

Vrijednost čini odstupanja od prosjeka očitijima: mala odstupanja postaju još manja (0,5 2 = 0,25), a velika odstupanja još veća (5 2 = 25). Dobiveni iznos se zove zbroj kvadrata odstupanja. Dijeljenje ovog zbroja s brojem mjerenja daje srednje kvadratno odstupanje, odn disperzija. Označava se s 2 i izračunava se po formuli:

.

Ako broj mjerenja nije veći od 30, tj. n ≤ 30, koristi se formula:

.

Naziva se veličina n – 1 = k broj stupnjeva slobode, koji se odnosi na broj slobodno varirajućih članova populacije. Utvrđeno je da pri izračunavanju indeksa varijacije jedan član empirijske populacije uvijek nema stupanj slobode.

Ove se formule koriste kada su rezultati predstavljeni nesređenim (običnim) uzorkom.

Od oscilacijskih karakteristika najčešće se koristi standardna devijacija, koja je definirana kao pozitivna vrijednost kvadratnog korijena vrijednosti varijance, tj.:

.

Standardna devijacija ili standardna devijacija karakterizira stupanj odstupanja rezultata od prosječne vrijednosti u apsolutnim jedinicama i ima iste mjerne jedinice kao i rezultati mjerenja.

Međutim, ova karakteristika nije prikladna za usporedbu varijabilnosti dviju ili više populacija koje imaju različite mjerne jedinice.

Koeficijent varijacije definira se kao omjer standardne devijacije i aritmetičke sredine, izražen kao postotak. Izračunava se po formuli:

.

U sportskoj praksi varijabilnost rezultata mjerenja ovisno o vrijednosti koeficijenta varijacije smatra se malom
(0 – 10%), srednji (11 – 20%) i veliki (V > 20%).

Koeficijent varijacije je od velike važnosti u statističkoj obradi rezultata mjerenja, jer kao relativna vrijednost (mjerena u postocima) omogućuje usporedbu varijabilnosti rezultata mjerenja u različitim mjernim jedinicama. Koeficijent varijacije može se koristiti samo ako se mjerenja provode na skali omjera.

2.4.2. Analiza statističkih podataka u MS Excelu. Alati analize: deskriptivna statistika, korelacija.

Microsoft Excel proračunske tablice uključuju takozvani paket za analizu - skup alata dizajniranih za rješavanje složenih statističkih problema. Ovaj paket analizira statističke podatke pomoću makro funkcija i omogućuje, izvođenjem jedne radnje, dobivanje velikog broja rezultata. Excelov paket za analizu uključuje odjeljke Deskriptivna statistika i Korelacija, između ostalih alata za analizu.

Alat Deskriptivna statistika omogućuje nam da dobijemo značajnu listu izračunatih statističkih karakteristika za veliki broj nizova brojeva. Pomoću alata Correlation dobivamo korelacijsku matricu koja sadrži sve moguće parne koeficijente korelacije. Za k serije dobit će se k (k – 1)/2 korelacijskih koeficijenata.

Paket za analizu poziva se pomoću stavke izbornika Alati – Analiza podataka... Ako ove stavke izbornika nema, to znači da paket za analizu nije instaliran. Da biste ga instalirali, potrebno je pozvati stavku izbornika Alati – Dodaci... i uključiti dodatak “Analysis package”, OK (vidi sliku 1).

Slika 1. Omogući/onemogući dijaloški okvir dodataka

Nakon što omogućite dodatak “Analysis Package”, stavka izbornika Tools – Data Analysis... Kada je odabrana, pojavljuje se sljedeći dijaloški okvir (slika 2).

Slika 2. Dijaloški okvir za odabir alata za analizu podataka

Nakon odabira alata Deskriptivna statistika i klika na OK, pojavit će se još jedan dijaloški okvir (Slika 3), koji zahtijeva da unesete ulazne podatke i gdje ispisati rezultate. Ovdje je dovoljno u polje “Interval unosa” unijeti raspon ćelija koje sadrže izvorne podatke. Možete odrediti raspon s naslovima stupaca, u kojem slučaju ćete morati omogućiti potvrdni okvir "Oznake u prvom redu". Za navođenje izlaznog intervala dovoljno je navesti samo gornju lijevu ćeliju raspona. Rezultati izračuna automatski će zauzeti potreban broj redaka i stupaca u tablici.

Slika 3. Dijaloški okvir alata za deskriptivnu statistiku

Pogledajmo rad alata za analizu “Descriptive Statistics” koristeći sljedeći primjer. Tijekom ispitivanja skupine učenika (n=21) mjereni su sljedeći pokazatelji: visina, tjelesna težina, dinamometrija desne i lijeve ruke, vitalni kapacitet, Stange test i Genci test. Rezultati su prikazani u tabeli (Slika 4).

Za dobivanje statističkih karakteristika koristit ćemo paket za analizu, alat “Opisna statistika”. U polje “Interval unosa” unesite raspon ćelija B1:H22. Budući da odabrani interval unosa sadrži zaglavlja stupaca, uključite potvrdni okvir "Oznake u prvom redu". Radi lakšeg rada odaberite "Novi radni list" kao izlaznu lokaciju za rezultat. Za izlazne podatke označite potvrdne okvire "Konačna statistika" i "Razina pouzdanosti: 95%". Zadnji potvrdni okvir omogućit će vam prikaz parametara intervala pouzdanosti s vjerojatnošću pouzdanosti od 0,95. Rezultirajući rezultat nakon malog formatiranja izgledat će kao što je prikazano na slici 5.

Slika 4. Rezultati ankete grupe školaraca

Slika 5. Rezultat alata Deskriptivna statistika

Nakon odabira alata "Korrelacija" i klika na OK u dijaloškom okviru "Analiza podataka" (slike 2, 6), pojavit će se još jedan dijaloški okvir (slika 7), koji zahtijeva unos podataka i gdje ispisati rezultate. Ovdje je dovoljno u polje “Interval unosa” unijeti raspon ćelija koje sadrže izvorne podatke. Možete odrediti raspon s naslovima stupaca, u kojem slučaju ćete morati omogućiti potvrdni okvir "Oznake u prvom redu". Za navođenje izlaznog intervala dovoljno je navesti samo gornju lijevu ćeliju raspona. Rezultati izračuna automatski će zauzeti potreban broj redaka i stupaca u tablici.

Slika 6. Dijaloški okvir za odabir alata za analizu podataka

Slika 7. Dijaloški okvir alata za korelaciju

Razmotrimo rad alata za analizu "Korelacija" koristeći primjer prikazan na slici 4.

Za dobivanje korelacijske matrice upotrijebit ćemo paket za analizu, alat “Korelacija”. U polje “Interval unosa” unesite raspon ćelija B1:H22. Budući da odabrani interval unosa sadrži zaglavlja stupaca, uključite potvrdni okvir "Oznake u prvom redu". Radi lakšeg rada odaberite "Novi radni list" kao izlaznu lokaciju za rezultat. Rezultirajući rezultat, nakon malog formatiranja, izgledat će kao što je prikazano na slici 8.

Slika 8. Korelacijska matrica

Dakle, izvođenjem jednostavnih operacija dobivamo veliki broj rezultata izračuna. Važno je napomenuti da iako informacijske tehnologije otvaraju istraživaču mogućnost dobivanja ogromne količine informacija za analizu, odabir najinformativnijih rezultata, konačna interpretacija i formuliranje zaključaka posao je samog istraživača.

Osnovni pojmovi korelacijske analize eksperimentalnih podataka. Procjena koeficijenta korelacije iz eksperimentalnih podataka.

U sportskim istraživanjima često se pronalazi odnos između proučavanih pokazatelja. Njegov izgled varira. Na primjer, određivanje ubrzanja iz poznatih podataka o brzini, drugi Newtonov zakon i drugi karakteriziraju tzv funkcionalni ovisnost, odnosno odnos, u kojem svaka vrijednost jednog pokazatelja odgovara strogo definiranoj vrijednosti drugog.

Druga vrsta odnosa uključuje, na primjer, ovisnost težine o duljini tijela. Jedna vrijednost duljine tijela može odgovarati nekoliko vrijednosti težine i obrnuto. U takvim slučajevima, kada jedna vrijednost jednog pokazatelja odgovara nekoliko vrijednosti drugog, naziva se odnos statistički.

Proučavanju statističkog odnosa između različitih pokazatelja u sportskim istraživanjima posvećuje se velika pažnja, budući da se na taj način mogu otkriti neki zakonitosti te ih naknadno verbalno i matematički opisati u svrhu korištenja u praktičnom radu trenera i učitelja. .

Među statističkim odnosima najvažniji su korelacijski. Korelacija je statistička ovisnost između slučajnih varijabli, u kojoj promjena jedne od slučajnih varijabli dovodi do promjene matematičkog očekivanja (prosječne vrijednosti) druge. Na primjer, bacanje kugle 3 kg i 5 kg. Poboljšanje u bacanju kugle od 3 kg rezultira poboljšanjem (u prosjeku) u bacanju kugle od 5 kg.

Statistička metoda koja se koristi za proučavanje odnosa naziva se korelacijska analiza. Njegova glavna zadaća je određivanje oblika, čvrstoće i usmjerenosti odnosa između proučavanih pokazatelja. Korelacijska analiza omogućuje vam istraživanje samo statističkih odnosa. Naširoko se koristi u teoriji testova za procjenu njihove pouzdanosti i sadržaja informacija. Različite mjerne ljestvice zahtijevaju različite vrste korelacijske analize.

Veličina korelacijskog koeficijenta izračunava se uzimajući u obzir mjerilo koje se koristi za mjerenja.

Za procjenu odnosa, kada se mjerenja provode na skali omjera ili intervala, a oblik veze je linearan, koristi se Bravais-Pearsonov koeficijent korelacije (koeficijenti korelacije za druge mjerne skale nisu razmatrani u ovom priručniku). Označava se latiničnim slovom – r. Vrijednost r se najčešće izračunava pomoću formule:

,

gdje su i aritmetičke srednje vrijednosti indikatora x i y, i standardne su devijacije, n– broj mjerenja (subjekata).

U nekim slučajevima bliskost odnosa određuje se na temelju koeficijenta odlučnost D, koji se izračunava po formuli:

.

Ovaj koeficijent mjeri udio ukupne varijacije u jednom pokazatelju koji se objašnjava varijacijom u drugom pokazatelju. Primjerice, koeficijent korelacije je r = –0,677 (između rezultata u trčanju na 30 m i troskoku iz mjesta). Koeficijent determinacije jednak je:

Posljedično, 45,8% disperzije sportskog rezultata u troskoku objašnjava se promjenama rezultata u trčanju na 30 m. Drugim riječima, na obje proučavane karakteristike utječu zajednički čimbenici koji uzrokuju varijacije u tim karakteristikama, a udio zajedničkih faktora je 45,8%. Preostalih 100% - 45,8% = 54,2% posljedica su čimbenika koji selektivno djeluju na karakteristike koje se proučavaju.

Procjena statističke pouzdanosti koeficijenta korelacije znači utvrđivanje postoji li ili ne linearna korelacija između općih populacija ili, što je isto, utvrđivanje razlikuje li se koeficijent korelacije između uzoraka značajno ili beznačajno od nule. Ovaj problem se može riješiti korištenjem tablica kritičnih točaka raspodjele koeficijenta korelacije sljedećim redoslijedom:

1. Postavljaju se statističke hipoteze. Hipoteza H 0 pretpostavlja nepostojanje statistički značajne veze između proučavanih pokazatelja ( r gen=0). Hipoteza H 1 pretpostavlja da postoji statistički značajan odnos između pokazatelja ( r gen>0).

2. Izračunava se promatrana vrijednost koeficijenta korelacije r zam..

3. Kritična vrijednost koeficijenta korelacije nalazi se iz tablice r krit ovisno o veličini uzorka n, razina značajnosti a i vrsta kritične regije (jednostrana ili dvostrana).

3. Uspoređuje r zam. I r krit.

Ako r zam. < r krit– statistički nepouzdano (neznačajno). Hipoteza H 0 se prihvaća Ako r zam.r krit, koeficijent korelacije se smatra statistički pouzdanim (značajnim). Hipoteza H 1 je prihvaćena.