1. IzglītībaMatikaStatistikaStatistika un histogrammas
Statistikas darba grāmata manekeniem ar tiešsaistes praksi, 2. izdevums

Autore Deborah J. Rumsey

Histogramma ir joslu diagramma, kas izveidota kvantitatīviem datiem. Tā kā dati ir skaitliski, jūs tos sadalāt grupās, neatstājot spraugas starp tām (tāpēc joslas ir savienotas). Y ass rāda katrā grupā ietilpstošo datu frekvences (skaitu) vai relatīvās frekvences (procentos).

Kā izveidot histogrammu

Lai izveidotu histogrammu, vispirms datus sadaliet saprātīgā skaitā vienāda garuma grupu. Datu kopā, kas ietilpst katrā grupā, palieliniet to vērtību skaitu (citiem vārdiem sakot, izveidojiet frekvences tabulu). Ja datu punkts nokrīt uz robežas, izlemiet, kurā grupā to ievietot, pārliecinoties, vai esat konsekvents (vienmēr ievietojiet to augstākajā no diviem vai vienmēr ievietojiet zemākajā no diviem). Veiciet joslu diagrammu, izmantojot grupas un to frekvences - frekvences histogrammu.

Sadalot frekvences ar kopējo izlases lielumu, iegūst procentuālo daudzumu, kas ietilpst katrā grupā. Tabula, kas parāda grupas un to procentus, ir relatīvā biežuma tabula. Atbilstošā histogramma ir relatīvās frekvences histogramma.

Histogrammu veidošanai var izmantot Minitab vai citu programmatūras pakotni, vai arī histogrammas var izgatavot ar rokām. Jebkurā gadījumā jūsu izvēlētais intervāla platums (ko datoru pakotnes sauc par tvertnēm) var atšķirties no attēliem, kas redzams attēlos, un tas ir lieliski, ja vien jūsu izskatās līdzīgs. Un tie tiks izmantoti, ja vien jūs neizmantojat neparasti mazu vai lielu joslu skaitu un ja jūsu stieņi ir vienāda platuma.

Katram intervālam varat izvēlēties arī dažādus sākuma / beigu punktus, un tas ir arī lieliski. Tikai pārliecinieties, ka viss ir skaidri marķēts, lai instruktors redzētu, ko jūs mēģināt darīt. Un esiet konsekvents attiecībā uz vērtībām, kas nonāk tieši pie robežas; vienmēr ielieciet tos apakšējā grupā vai vienmēr ielieciet augšējā grupā. Tomēr, ja jums ir izvēle, izveidojiet histogrammas, izmantojot tādu datoru paketi kā Minitab. Tas ievērojami atvieglo jūsu uzdevumu.

Tālāk ir sniegts divu histogrammu tipu veidošanas piemērs.

Pārbaužu rezultāti 30 skolēnu klasei ir parādīti nākamajā tabulā.

Frekvences histogrammas un relatīvās frekvences histogrammas izskatās vienādi; tie vienkārši tiek veikti, izmantojot dažādus mērogus uz Y ass.

Rezultātu datu frekvences histogramma parādīta nākamajā attēlā.

frekvences histogramma

Relatīvās frekvences var atrast, ņemot katru frekvenci un dalot ar 30 (kopējais parauga lielums). Relatīvās frekvences šīm trim grupām ir 8/30 = 0,27 vai 27%; 16/30 = 0,53 vai 53%; un 6/30 = attiecīgi 0,20 vai 20%.

Histogramma, kas balstīta uz relatīvajām frekvencēm, izskatās tāda pati kā histogramma (no tiem pašiem datiem). Vienīgā atšķirība ir etiķete uz Y ass.

Histogrammu izpratne

Histogramma sniedz jums vispārīgu informāciju par trim galvenajiem kvantitatīvo (skaitlisko) datu elementiem: formu, centru un izplatību.

Histogrammas formu parāda tās vispārējais raksts. Ir iespējami daudzi modeļi, un daži ir izplatīti, ieskaitot šādus:

  • Zvanu formas: Izskatās kā zvans - liels vienreizējs pa vidu un astes, kas noiet uz leju katrā pusē apmēram tādā pašā ātrumā. (A attēls) Labais šķībs: liela daļa datu tiek novirzīta pa kreisi, ar dažiem lielākiem novērojumiem novirzīta pa labi. (B attēls) Kreisais šķībs: liela daļa datu tiek novietota pa labi, un daži mazāki novērojumi ir vērsti pa kreisi. (C attēls) Vienveidīgs: visiem stieņiem ir līdzīgs augstums. (D attēls) Bimodāls: divas virsotnes, vai (e attēls) U veida: bimodāls ar divām virsotnēm apakšējā un augšējā galā, ar mazāk datu vidū. (Skat. 4-1. Attēlu (f attēls) Simetrisks: izskatās vienāds katrā pusē, kad sadalāt to pa vidu; zvanveida, vienveidīgas un U formas histogrammas ir visi simetrisko datu piemēri. (A, d un f attēli)
kopējie histogrammu paraugi

Histogrammas centru var apskatīt divos veidos. Viens ir punkts uz x ass, kur grafiks balansē, ņemot vērā datu faktiskās vērtības. Šo punktu sauc par vidējo, un jūs to varat atrast, atrodot līdzsvarošanas punktu (iedomājieties, ka dati ir uz teeter-totter). Otrs veids, kā apskatīt centru, ir līnijas atrašanās histogrammā, kur 50 procenti datu atrodas abās pusēs. Rinda tiek saukta par mediānu, un tā apzīmē datu kopas fizisko vidu. Iedomājieties histogrammu pārgriezt uz pusēm tā, lai puse laukuma būtu abās līnijas pusēs.

Izkliede attiecas uz attālumu starp datiem vai nu attiecībā pret otru, vai attiecībā pret kādu centrālo punktu. Viens neapstrādāts veids, kā izmērīt izplatību, ir atrast diapazonu vai attālumu starp lielāko vērtību un mazāko vērtību. Vēl viens veids ir meklēt vidējo attālumu no vidus, kas citādi pazīstams kā standarta novirze. Standarta novirzi ir grūti noteikt, aplūkojot tikai histogrammu, taču aptuvenu priekšstatu var iegūt, ja diapazonu dalāt ar 6. Ja stieni, kas atrodas tuvu vidum, šķiet ļoti augsti, tas nozīmē, ka lielākā daļa no vērtības ir tuvu vidējam, norādot nelielu standartnovirzi. Ja joslas šķiet īsas, iespējams, ka jums būs lielāka standarta novirze.

Varat veikt faktisko kopsavilkuma statistiku, lai aprēķinātu kvantitatīvos datus, bet histogramma var sniegt vispārīgu virzienu šo atskaites punktu atrašanai. Tāpat kā sektoru diagrammas un joslu diagrammas, ne visas histogrammas ir patiesas, pilnīgas un precīzas. Jums jāzina, kas jāmeklē, lai tos novērtētu.

Kā iztaisnot sašķiebtos datus ar histogrammām

Īpaši jānovērtē izkropļotās datu kopas, ņemot vērā to, kuru un kad statistikas dati ir vispiemērotākie. Jums arī jāzina, kā nepareizas statistikas izmantošana var sniegt maldinošas atbildes.

Varat saistīt vidējo un vidējo, lai uzzinātu par jūsu datu formu. Ja vidējais un vidējais rādītājs būs tuvu vienlīdzīgam, tiks izveidota aptuveni simetriska forma

Datos vidējo lielumu ietekmē novirzes, bet vidējā nav. Ja vidējais un vidējais rādītājs ir tuvu viens otram, dati nav sašķiebti un, iespējams, vienā vai otrā pusē nav noviržu. Tas nozīmē, ka dati izskatās aptuveni vienādi katrā vidus pusē, kas ir simetrisku datu definīcija (skatīt a, d vai f iepriekšējā attēlā).

Faktu, ka vidējais un vidējais tuvums norāda, ka dati ir aptuveni simetriski, var izmantot cita veida testa jautājumos. Pieņemsim, ka kāds vaicā, vai dati ir simetriski, un jums nav histogrammas, bet jums ir vidējais un vidējais. Salīdziniet abas vidējās un vidējās vērtības, un, ja tās ir tuvu, dati ir simetriski. Ja to nav, dati nav simetriski.

Kā pamanīt maldinošu histogrammu

Lasītājus var maldināt ar histogrammu tādā veidā, kas nav iespējams ar joslu diagrammu. Atcerieties, ka histogramma attiecas uz skaitliskiem datiem, nevis kategoriskiem datiem, kas nozīmē, ka jums ir jānosaka, kā vēlaties, lai skaitliskie dati, kas sadalīti grupās, tiktu parādīti uz horizontālās ass. Un tas, kā jūs nosakāt šīs grupas, var padarīt diagrammu ļoti atšķirīgu. Skatieties, lai redzētu histogrammas, kas lasītāju maldināšanai izmanto mērogu. Tāpat kā joslu diagrammās, atšķirības var pārspīlēt, izmantojot mazāku mērogu histogrammas vertikālajā asī, un atšķirības var mazināt, izmantojot lielāku skalu.