Histogrami – jedna slika govori više od tisuću golih brojki


Srijeda, 16 Ožujak 2011

*Lako je kad podataka ima malo, ali što kad se radi o desecima, stotinama ili čak tisućama brojki? *Prikaz histogramom omogućuje analizu i zaključke na čovjeku puno prirodniji način*

abc_interval_listopad_1011111.jpgIntuicija nije zamjena za informaciju. To je ujedno i jedini razlog zašto marljivo prikupljamo podatke, mjerimo, ispitujemo, ocjenjujemo. U proizvodnji je uobičajeno mjeriti dimenzije proizvoda i pojedinih njegovih dijelova, dužinu, širinu, visinu, težinu, gustoću, tvrdoću... No mjeriti se može i dužina trajanja pojedinih poziva u pozivnom centru, broj reklamacija u odnosu na dužinu ...

korištenja proizvoda, trajanje prikupljanja stavki s narudžbe u skladištu i slično.
Ali što s tim prikupljenim podacima, kako ih pretočiti u informaciju? Naime, ljudski mozak nije prilagoðen za sagledavanje velike količine podataka, pogotovo ako su oni brojčani. Gledamo u te brojke, u tablice i zapise i jednostavno ne vidimo ništa. Prikupljene podatke treba nekako razvrstati, obraditi i prikazati na način da iz njih možemo izvući zaključke. Lako je kad podataka ima malo, ali što kad se radi o desecima, stotinama ili čak tisućama brojki? U tom slučaju možete primijeniti alat koji se zove histogram.

                       Koraci u izradi histograma
Da ponovimo korake u izradi histograma:
- Prikupite podatke
- Podatke posložite po veličini od najmanjeg prema najvećem
- Odredite raspon, to jest razliku izmeðu najmanjeg i najvećeg podatka
- Odredite broj intervala
- Odredite širinu intervala
- Odredite početnu i krajnju vrijednost u svakom intervalu
- Prebrojite i upišite koliko podataka pripada kojem intervalu
- Grafički prikažite broj podataka u ovisnosti o intervalu

Histogram je vertikalni stupčasti dijagram koji oslikava raspodjelu grupe podataka, odnosno učestalost pojedinih vrijednosti. Pogonski dijagrami i kontrolne karte, o kojima ćemo takoðer uskoro govoriti u ovoj rubrici, prikazuju kretanje vrijednosti neke veličine u vremenu. Na primjer, mjerite debljinu prevlake srebra na uzorku iz serijske proizvodnje svakih 15 minuta i izmjerenu vrijednost unosite u dijagram na kojem je na horizontalnoj osi naznačeno vrijeme.
Histogram ne pokazuje ovisnost o vremenu. Histogram pokazuje učestalost pojavljivanja neke vrijednosti u odreðenoj grupi podataka.

                                                      Kako vladate procesom proizvodnje?
Da se je radilo, ne o rezultatima testa iz matematike, nego o izmjerenoj dužini nekog dijela koji ugraðujete u vaš proizvod na primjer, mogli biste u ovakav dijagram ucrtati nazivnu vrijednost te gornju i donju granicu tolerancije. Odmah bi se vidjelo kako vladate svojim procesom proizvodnje:
- koliki je raspon? – naravno, bolje je imati što uži raspon, to znači da dobro kontrolirate parametre procesa proizvodnje i dobivate predvidljiv rezultat
- prelazite li granice tolerancije? – svako ispadanje iz tolerancija predstavlja škart, što znači troškove
- grupiraju li vam se izmjerene vrijednosti, ne oko nazivne vrijednosti, što bi bilo dobro, nego teže prema nekoj od granica tolerancije? – ovo nije dobro, svaki poremećaj u procesu proizvodnje dovest će do škarta.

Zašto koristiti histogram i kako ga napraviti?
Zato što jedna slika govori više od tisuću riječi. Histogramom se grafički sumiraju velike količine brojčanih podataka iz čega se onda mogu izvući zaključci, a cijelu priču je puno lakše nekome prezentirati.
Dobivene vrijednosti mogu se usporediti s postavljenim granicama prihvatljivosti proizvoda, što onda govori o sposobnosti procesa i pomaže u donošenju odluka.
Kako napraviti histogram?
Kao i obično, najlakše ćemo objasniti na primjeru. Najprije morate imati podatke koje ste prikupili mjerenjima. Poslužit ćemo se primjerom koji svi razumijemo, znači iz škole.
Učenici su pisali inicijalni test iz matematike i rezultati su bili, kao i obično, šaroliki. Što profesor može iz toga zaključiti i kako će to prezentirati na roditeljskom sastanku ili nastavničkom vijeću? Recimo da u razredu ima 36 učenika, da su svi pisali taj test, a da je na testu bilo moguće postići do 50 bodova. Rezultati su redom kao u tablici 1.

 Tablica 1: Prvi korak u izradi histograma – moramo imati podatke

tablica_1_listopad_10.jpg

Sad treba odrediti raspon podataka. To se postiže sortiranjem podataka od najmanjeg prema najvećem. To je napravljeno i prikazano u tablici 2. U našem slučaju najmanji rezultat je 2 boda, a najveći 50 bodova.

 Tablica 2: Drugi korak je poredati podatke po veličini kako bismo odredili raspon

tablica_2_listopad_10.jpg

Još uvijek ne vidimo puno i teško ćemo nešto iz ovoga zaključiti. Zato ćemo sada ove podatke grupirati u intervale. Koliko intervala uzeti ovisi o tome koliko podataka imamo. Iskustveno pravilo je:

 podaci_listopad_10.jpg

U našem slučaju razvrstat ćemo ove podatke u 5 intervala. Sad treba odrediti širinu intervala. To se postiže tako da dijelimo raspon podataka s brojem intervala i zaokružujemo na prvi sljedeći cijeli broj:
raspon podataka/željeni broj intervala=X (zaokružiti na prvi sljedeći cijeli broj)

Za naš slučaj to izgleda ovako:
(50-2)/5=9,6 (zaokružujemo na 10)
Širina intervala će znači biti 10. Odredimo početnu i završnu vrijednost koju ćemo stavljati u pojedini interval. Zatim pobrojimo iz Tablice 2 koliko podataka pripada tom intervalu, kao što je to napravljeno u Tablici 3.

 Tablica 3: Granice pojedinih intervala i broj pripadajućih podataka u svakom intervalu

tablica_3_listopad_10.jpg

U pojedini interval stavljamo onaj podatak koji je veći ili jednak početnoj vrijednosti te manji od završne vrijednosti. Prikažemo li broj podataka u pojedinom intervalu grafički dobiti ćemo nešto kao na Slici 1.

abc_interval_listopad_10.jpg 

 Slika 1: Histogram rezultata inicijalnog testa iz matematike

Usporedite sad Tablicu 1 i ovo na Slici 1. S ovim na slici se već da nešto napraviti. Zaključci mogu na primjer biti – cijeli dijagram nije osno simetričan oko sredine, puno je više učenika slabo napisalo test, a ipak imamo i nekoliko dobrih rezultata, što znači da test nije bio u potpunosti neprimjeren predznanju učenika. Takoðer, nisu gotovo svi rezultati u intervalima broj 4 i 5, što bi značilo da je test ili prelagan, ili su svi učenici s jako dobrim predznanjem matematike, ili su jednostavno spretni u prepisivanju od onih iz intervala broj 5. I tako dalje.
Zanimljiva su i daljnja tumačenja histograma. Što ako imate sve podatke u nekoliko intervala, a u ostalima nema ničega, kao na slici 2? Pogledajte čime je mjerenje napravljeno, možda vam je potreban instrument veće osjetljivosti, da banaliziramo, možda umjesto centimetara morate mjeriti u milimetrima. 

                                      slika_2_listopad_10.jpg 


                                                      Slika 2: Nedostaju vrijednosti u nekim intervalima

Što ako vam se podaci snažno grupiraju oko dvije vrijednosti, kao na slici 3? Umjesto jednogrbe imate dvogrbu devu? To može značiti više stvari – imate pomak u procesu tijekom vremena, imate pomak u ureðaju kojim mjerite, a možda su podaci dobiveni mjerenjem na dva različita stroja. Samo na osnovi histograma ne može se dati jednoznačni odgovor, treba pogledati pogonske i kontrolne karte.

                                              slika_3_listopad_10.jpg 

                                                                   Slika 3: Bimodalna raspodjela

U svakom slučaju, prikaz histogramom omogućuje analizu i zaključke na čovjeku puno prirodniji način.
Korištenje histograma kao alata ima veze s jednim od osam načela kvalitete iz norme HRN EN ISO 9000 – „Odlučivanje na temelju činjenica”. Uz grafički prikazane podatke teško je osporiti neke zaključke.
Želim vam uspješno upravljanje kvalitetom u poslovnom, a svakako i u privatnom životu.

Olga Štajdohar Paðen,  listopad 2010.