VARIANTS - Excel ja Google'i arvutustabelid

See õpetus näitab, kuidas Funktsioon Excel VARIANCE Excelis, et hinnata dispersiooni antud valimi põhjal.

VARIANCE Funktsiooni ülevaade

Funktsioon VARIANCE Arvutab antud valimi põhjal hinnangulise dispersiooni.

VARIANCE Exceli töölehe funktsiooni kasutamiseks valige lahter ja tippige:

(Pange tähele, kuidas valemisisendid ilmuvad)

Funktsioon VARIANCE Süntaks ja sisendid:

1 = VAR (number1, [number2],…)

numbrid- Väärtused dispersiooni saamiseks

Kuidas Excelis dispersiooni arvutada

Dispersioon ütleb teile, kui andmekogumi väärtused on keskmisest hajutatud. Matemaatiliselt öeldes on dispersioon iga skoori ruudu erinevuse keskmine keskmisest (kuid jõuame selleni varsti).

Excel pakub dispersiooni arvutamiseks mitmeid funktsioone - VAR.S, VAR.P, VARA, VARPA ja kaks vanemat funktsiooni, VAR ja VARP.

Enne nende funktsioonide uurimist ja nende kasutamise õppimist räägime dispersioonist ja selle arvutamisest.

Mis on dispersioon?

Andmete analüüsimisel on tavaline esimene samm keskmise arvutamine. See on muidugi kasulik statistika, mida arvutada, kuid see ei anna teile täielikku ülevaadet teie andmetega toimuvast.

Võtke järgmine andmekogum, mis võib olla rühm testitulemusi 100 -st:

1 48,49,50,51,52

Selle vahemiku keskmine on 50 (summeerige arvud ja jagage n -ga, kus n on väärtuste arv).

Seejärel võtke järgmised testitulemused:

1 10,25,50,75,90

Selle vahemiku keskmine on samuti 50 - aga ilmselgelt on meil siin kaks väga erinevat andmevahemikku.

Keskmine ei saa teile midagi öelda selle kohta, kui palju hinded on jaotatud. See ei ütle teile, kas kõik väärtused on kokku pandud nagu esimestes näidetes või laiali nagu teine. Erinevus võib aidata teil seda õppida.

Dispersiooni kasutatakse ka keerukamate statistiliste protseduuride baaspunktina.

Kuidas dispersiooni arvutatakse

Töötame läbi põhinäite ja arvutame dispersiooni käsitsi. Nii saate teada, mis toimub kulisside taga, kui hakkate Exceli variatsioonifunktsioone ellu viima.

Oletame, et meil on andmekogum, mis esindab kolme mängukaarti, 4, 6 ja 8.

Dispersiooni arvutamiseks toimige järgmiselt.

1) Arvutage keskmine

Esiteks arvutame keskmise. Me teame, et meie andmevahemik on 4, 6, 8, nii et keskmine on järgmine:

1 (6 + 4 + 8) / 3 = 6

Ma kinnitasin seda allpool Exceli keskmise funktsiooniga <>:

1 = KESKMINE (C4: C6)

2) Lahutage andmekogumi igast väärtusest keskmine

Järgmisena lahutame igast oma väärtusest keskmise.

Olen seda teinud järgmise valemiga:

1 = C4- $ H $ 4

Keskmine on salvestatud H4 -sse, nii et ma lihtsalt lahutan selle tabeli igast väärtusest. Dollarimärgid siin lihtsalt „lukustavad” selle lahtri viite H4 -le, nii et kui selle veerust alla kopeerin, jääb see samaks.

Tulemused:

Meil on:

123 4 - 6 = -26 - 6 = 08 - 6 = 2

Peame saama nende erinevuste keskmise keskmisest, kuid nende kolme väärtuse keskmine on null! Seega peame rõhutama erinevusi, mida me teeme nende ruutude abil.

3) ruudu erinevused

Lisame uue veeru ja ruudu D veeru numbrid:

1 = D4*D4

Olgu, see on parem. Nüüd, kui erinevused pole keskmiselt nullini, saame dispersiooni arvutada.

4) Arvutage ruutude erinevuste keskmine

Siin kohtame teehargnemist. Hälbe arvutamiseks on kaks võimalust ja see, mida kasutate, sõltub teie andmete tüübist.

  • Kui kasutate rahvastiku andmed, võtate keskmist lihtsalt normaalseks (summeerige väärtused ja jagage n -ga)
  • Kui kasutate näidisandmed, liidate väärtused kokku ja jagate n-1-ga

Rahvastikuandmed tähendavad, et teil on kõik vajalikud andmed olemas, näiteks kui soovite konkreetse kooli õpetajate keskmist vanust ja teil on selle kooli iga õpetaja vanuseandmed, on teil olemas andmed rahvastiku kohta.

Näidisandmed tähendavad, et teil pole kõiki andmeid, vaid lihtsalt suuremast elanikkonnast võetud proov. Nii et kui soovite kogu riigi õpetajate keskmist vanust ja teil on andmeid ainult ühe kooli õpetajate kohta, on teil näidisandmed.

Meie näites on meil andmed rahvastiku kohta. Meid huvitavad ainult meie kolm kaarti - see on elanikkond ja me pole neist proovi võtnud. Nii et saame lihtsalt ruutude erinevuste keskmise võtta tavalisel viisil:

1 = KESKMINE (E4: E8)

Seega on meie populatsiooni dispersioon 2,666.

Kui see oli prooviandmed (võib -olla oleksime need kolm kaarti suuremast komplektist välja võtnud), arvutaksime keskmise välja järgmiselt:

1 Proovi dispersioon = (4 + 0 + 4) / (3 - 1)

Või:

1 Proovi dispersioon = 8 /2 = 4

Miks jagada näidisandmetega n-1-ga, mitte ainult n?

Lühike vastus sellele küsimusele on "Sest see annab õige vastuse". Aga ma kujutan ette, et sa tahad natuke enamat! See on keeruline teema, nii et annan siin lühikese ülevaate.

Mõelge sellele nii: kui võtate populatsiooni andmete proovi, on need väärtused tavaliselt lähemale keskmisele proov kui need on keskmiselt elanikkond.

See tähendab, et kui jagate lihtsalt n -ga, alahindate rahvastiku variatsiooni veidi. N-1-ga jagamine parandab seda pisut.

Meie kolme kaardiga on meil hea koht selle teooria testimiseks. Kuna kaarte on ainult kolm, võime võtta vähe proove.

Võtame kahe kaardi näidised. Valime ühe kaardi, paneme selle tagasi, segame ja seejärel valime teise kaardi. See tähendab, et valida on üheksa kahe kaardi kombinatsiooni.

Ainult üheksa võimaliku valimi abil saame mõlema meetodi abil arvutada kõik võimalikud proovide dispersioonid (jagada n-ga ja jagada n-1-ga), võtta nende keskmine ja vaadata, milline neist annab meile õige vastuse.

Allolevas tabelis olen kõik välja toonud. Tabeli iga rida on erinev proov ja veerud B ja C näitavad kahte kaarti, mis valiti igas proovis. Siis olen lisanud veel kaks veergu: ühe, kus arvutasin selle kahe kaardi valimi dispersiooni, jagades n -ga, ja teise, kus jagasin n - 1 -ga.

Vaata:

Tabelist paremal olen näidanud veergude D ja E keskmisi.

Veeru D keskmine, kui jagada n -ga, annab meile dispersiooni 1,333.

Veeru E keskmine, kui jagada n-1, annab meile dispersiooni 2,666.

Meie eelmisest näitest teame juba, et populatsiooni dispersioon on 2,666. Nii et prooviandmete kasutamisel jagamine n-1-ga annab meile täpsemad hinnangud.

Exceli funktsioonid dispersiooni arvutamiseks

Nüüd, kui olete näinud näidet dispersiooni arvutamise kohta, liigume edasi Exceli funktsioonide juurde.

Siin on teil mitu võimalust:

  • P tagastab populatsiooni andmete dispersiooni (kasutades meetodit jagamine n -ga)
  • S tagastab prooviandmete dispersiooni (jagab n-1-ga)
  • VAR on vanem funktsioon, mis töötab täpselt samamoodi nagu VAR.S
  • VARA on sama mis VAR.S, ainult et see sisaldab tekstirakke ja loogilisi väärtusi
  • VARPA on sama mis VAR.P, ainult et see sisaldab tekstirakke ja loogilisi väärtusi

Käime need ükshaaval läbi.

Funktsioon Excel VAR.P

VAR.P arvutab populatsiooniandmete dispersiooni (kasutades jagun n meetodit). Kasutage seda järgmiselt:

1 = VAR.P (C4: C6)

Saate VAR.P -s määratleda ainult ühe argumendi: andmevahemiku, mille dispersiooni soovite arvutada. Meie puhul on need kaardi väärtused C4: C6 -s.

Nagu ülal näete, tagastab VAR.P meie kolme kaardi komplektiga 2.666. See on sama väärtus, mille me varem käsitsi arvutasime.

Pange tähele, et VAR.P ignoreerib täielikult teksti- või loogikaväärtusi (TRUE/FALSE) sisaldavaid lahtreid. Kui peate need lisama, kasutage selle asemel VARPA -d.

Funktsioon Excel VAR.S

VAR.S arvutab prooviandmete dispersiooni (jagades n-1-ga). Sa kasutad seda nii:

1 = VAR.S (C4: C6)

Jällegi on ainult üks argument - teie andmevahemik.

Sel juhul tagastab VAR.S 4. Saime sama näitaja 4. sammus, kui tegime ülaltoodud käsitsi arvutusi.

VAR.S ignoreerib täielikult teksti- või loogikaväärtusi (TRUE/FALSE) sisaldavaid lahtreid. Kui peate need lisama, kasutage selle asemel VARA -d.

Funktsioon Excel VAR

VAR on täielikult samaväärne VAR.S-iga: see arvutab prooviandmete variatsioonid (kasutades meetodit n-1). Selle kasutamiseks tehke järgmist.

1 = VAR (C4: C6)

VAR on ühilduvusfunktsioon. See tähendab, et Microsoft eemaldab selle funktsiooni Excelist. Hetkel on see veel kasutamiseks saadaval, kuid peaksite selle asemel kasutama VAR.S -i, et teie arvutustabelid jääksid ühilduvaks Exceli tulevaste versioonidega.

Funktsioon Excel VARA

VARA tagastab ka prooviandmete dispersiooni, kuid sellel on mõned olulised erinevused VAR ja VAR.S. Nimelt sisaldab see oma arvutuses loogilisi ja teksti väärtusi:

  • TRUE väärtused loetakse 1 -ks
  • VÄÄRAD väärtused loetakse 0 -ks
  • Tekstistringid loetakse 0 -ks

Kasutage seda järgmiselt.

1 = VARA (C4: C11)

Lisasime tabelisse veel viis rida: J, Q, K, TRUE ja FALSE. Veerg D näitab, kuidas VARA neid väärtusi tõlgendab.

Kuna meie tabelis on nüüd uus madalate väärtuste partii, on dispersioon suurenenud 10,268 -ni.

Funktsioon Excel VARPA

VARPA arvutab populatsiooni andmete dispersiooni. See sarnaneb VAR.P -ga, välja arvatud see, et see sisaldab arvutuses ka loogilisi väärtusi ja tekstistringe:

  • TRUE väärtused loetakse 1 -ks
  • VÄÄRAD väärtused loetakse 0 -ks
  • Tekstistringid loetakse 0 -ks

Sa kasutad seda nii:

1 = VARPA (C4: C12)

Lisasime tabelisse veel viis rida: J, Q, K, TRUE ja FALSE. Veerg D näitab, kuidas VARPA neid väärtusi tõlgendab.

Selle madalama väärtuste rühma andmetele lisamise tulemusena on dispersioon suurenenud 8,984 -ni.

VARIANCE funktsioon Google'i arvutustabelites

Funktsioon CORREL töötab Google'i arvutustabelites täpselt samamoodi nagu Excelis:

wave wave wave wave wave