Histogram – prosty wykres na skomplikowane zagadnienia

Co to jest histogram?

 

Histogram, to chyba najpopularniejszy wykres stosowany w analizie statystycznej, uważany za jedno z podstawowych narzędzi poprawy jakości.

 

Wykres ten pozwala na graficzne przedstawienie tzw. rozkładu badanej cechy w określonych przedziałach. Mówiąc prosto – histogram prezentuje krotność wystąpienia danych wartości (np. wieku, temperatury, wymiaru, wagi, zarobków, wykształcenia, etc.), w interesujących nas przedziałach (od … do …).

 

A wizualnie…

 

 

Wizualnie jest to prosty wykres słupkowy, gdzie na osi x zaznaczone są interesujące nas przedziały danych wielkości, a na osi y prezentowana jest krotność ich występowania. Wartości natomiast są zaznaczone w postaci przylegających do siebie słupków.

 

W tym konkretnym przykładzie analizowana jest częstotliwość występowania danej temperatury w badanym przedziale czasu. Okres, w jakim były zbierane dane, oraz sposób zbierania danych nie jest uwzględniony w tego typu wykresie. Taka informacja musi być jednak dodatkowo wzięta pod uwagę podczas interpretacji wyników, gdyż może mieć duże znaczenie w przypadku formułowania wniosków.

Na przykładzie od razu widać, że najczęściej notowano temperatury w przedziale 21-22 stopnie, najrzadziej zaś temperatury poniżej 20 i powyżej 24 stopni.

 

Jak należy interpretować pojedynczy „słupek”?

 

Posłużmy się ponownie przykładem z temperaturą…

 

 

W przedziale pomiędzy temperaturami 21, a 22 stopnie znajduje się 3 słupki. Oznacza to, że każdy słupek prezentuje wartość ok. 0,34 stopnia. Dokładniej mówiąc temperatura 21,34 stopnia, zaznaczona jako zielony słupek, notowana była 12 krotnie w badanym okresie czasu.

 

Jak przygotować histogram?

 

  • Zbierz wyniki

 

Najlepiej zebrać powyżej 50 wyników, wówczas mamy większą szansę na uchwycenie zmienności w całej badanej populacji.

Nie mniej ważne jest to, aby wartości zbierać losowo, a sam sposób kolekcjonowania wyników przebiegał tak samo w każdym przypadku. Dzięki temu będziemy mieć pewność, że możemy zestawić ze sobą na jednym wykresie wszystkie zebrane dane, które właściwie reprezentują rzeczywisty obraz sytuacji.

 

  • Ustal przedziały, w jakich  zaprezentujesz dane (tj. liczbę słupków)

 

Na początek najłatwiej określić wartość min i max na podstawie zebranych wyników. Dzięki temu wiemy również, jaki jest zakres danych.

 

Co do samej liczby przedziałów, która reprezentowana będzie przez poszczególne słupki na histogramie, nie jest to już takie proste. Możliwości obliczenia liczby przedziałów jest co najmniej kilka: dzielenie wg normy DIN 55302, normy E41.32.110N, jako pierwiastek z liczby wyników  zaokrąglony do najbliższej liczby całkowitej, etc.

 

Jeśli jednak nie piszemy pracy naukowej i wyniki naszej analizy mają służyć wyłączeni na wewnętrzne potrzeby organizacji, to możemy sami wyznaczyć interesujące nas przedziały wartości i na tej podstawie opracować histogram.

 

  • Określ częstotliwość występowania danych wartości w odniesieniu do wyznaczonych przedziałów

 

To nic innego, jak pogrupowanie wszystkich danych mieszczących się w poszczególnych przedziałach, a następnie zliczenie ile wartości jest w każdej grupie.

Na tej podstawie wygeneruj wykres kolumnowy. Otrzymany wykres to właśnie histogram.

 

Interpretacja histogramu – krzywa Gaussa, zmienność, kształt, ocena zdolności procesu

 

Na podstawie wygenerowanego histogramu można wyciągnąć wiele wniosków, wystarczy znać podstawy interpretacji tego wykresu.

 

Przykład:

Histogram 1:

 

 

Histogram 2:

 

 

Na histogramach 1 i 2 zaznaczono krzywą Gaussa (linia czerwona), czyli linię reprezentującą rozkład normalny badanej wielkości. Dzięki temu w sposób obrazowy można przeanalizować m.in. zmienność interesującej nas cechy.

 

Jeśli więc chodzi o stopień zmienności mierzonej średnicy [mm] w przykładzie to większy jest on w 2. przypadku . Świadczy o tym szerokość histogramu (porównaj szerokości krzywej Gaussa na histogramie 1 i 2).

 

Pierwszy przykład zawiera też interesujący element, a mianowicie jeden z punktów pomiaru znacznie odbiega od pozostałych. Analizując taki przypadek nie bierz tego pomiaru pod uwagę, gdyż stanowi on tzw. efekt specjalny, czyli pomiar, który może być obarczony błędem.

 

Kształt krzywej Gaussa też sporo mówi o procesie lub mierzonej przez nas wielkości. Im węższa krzywa, tym mniejsze odchylenie standardowe. W praktyce oznacza to, że mierzona wielkość , nawet w przypadku pewnych odchyleń, ma większą szansę na „zmieszczenie się” w granicach tolerancji danego procesu.

Na tej podstawie właśnie dokonuje się oceny zdolności procesu (Cp, Cpk). Dokładniej ten temat opiszę w artykule poświęconym 6 sigma.

 

 

Gdzie histogram znajduje zastosowanie? Zalety

 

Histogram sporządzony na podstawie interesujących nas danych dostarcza nam informacji z jakiego typu rozkładem statystycznym mamy do czynienia.

Ogromne zastosowanie znajduje w jakości. Na jego podstawie dokonuje się oceny zdolności procesu, planuje się eksperymenty, analizuje wpływ niektórych czynników na proces.

Zastosowanie histogramu i metod statystycznych jest ogromne i dotyczy też innych obszarów funkcjonowania organizacji, nie tylko produkcja i jakość. Decyzje biznesowe, podejmowane na podstawie rzetelnych danych i analiz statystycznych, przynoszą zwykle wymierne korzyści.

 

Histogram w HR:

 

  • Selekcja potencjalnych kandydatów
  • Ocena kompetencji pracowników
  • Pomiar efektywności: szkoleń, rekrutacji, systemów motywowania i premiowania, oceny pracowniczej i inicjatyw pracowniczych
  • Ocena kanałów komunikacji (formalnych, nieformalnych) w organizacji
  • Ewaluacja zmian w strukturach organizacyjnych

 

Histogram w IT:

 

  • Ocena wdrożenia nowego systemu
  • Analiza zgłoszeń Helpdesk
  • Pomiar efektywności procesów IT

 

Histogram w Sprzedaży:

 

  • Ocena satysfakcji klienta
  • Ewaluacja kompetencji sprzedażowych
  • Pomiar efektywności pracy działu sprzedaży
  • Ocena reklamacji, niezgodności

 

Jakie zatem korzyści biznesowe niesie ze sobą stosowanie histogramu?

 

Analizując histogram z nakreśloną krzywą Gaussa, możemy uzyskiwać istotne informacje na temat badanego zagadnienia. Wszelkie odstępstwa od kształtu rozkładu normalnego mogą sugerować, że:

  • w badaniu nie został uwzględniony jakiś istotny czynnik, przez co uzyskaliśmy zaburzone wyniki (przykładowo: zbadaliśmy efektywność zawodową tylko nowo zatrudnionych pracowników, a nie wszystkich)
  • badaliśmy specyficzną grupę, gdzie poziom interesującej nas cechy jest ponad przeciętny (np. inżynierowie cechują się wysokim poziomem analitycznego myślenia)

 

Zgodność rozkładu wyników z krzywą Gaussa sugeruje, że badana przez nas próbka jest reprezentatywna i właściwie przedstawia obraz całej populacji.Dzięki temu nasze działania mogą być „nakierowane w punkt”, dostosowane do potrzeb biznesowych organizacji.

 

Podsumowanie

 

Histogram i rozkład normalny zobrazowany za pomocą krzywej Gaussa odgrywa więc kluczową rolę w przypadku rozwiązywania problemów biznesowych za pomocą analiz statystycznych. Może stanowić wsparcie dla innych metod, jak np. DMAIC.

Wiedza, jaką otrzymujemy analizując histogram, jest niezwykle przydatna w codziennej praktyce biznesowej. Znając bowiem proste zasady jego interpretacji, możemy właściwie formułować pytania biznesowe, co z kolei przekłada się na trafniejszy dobór działań zmierzających do realizacji zakładanych celów biznesowych.

 

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *