Wykres Gaussa

Wykres Gaussa, zwany również jako wykres rozkładu normalnego służy do analizy danych związanej z prawdopodobieństwem. W dzisiejszym artykule omówię sposób tworzenia takiego wykresu, a także jak go analizować.

Zrozumienie wykresu

Za przykład posłuży nam zespół sprzedaży, którego wyniki możemy znaleźć w przykładowej bazie danych Adventure Works. Z pomocą wykresu rozkładu normalnego spróbujemy dokonać oceny pracowników. W tym wypadku indywidualna ocena pracownika będzie bazować na wyniku jaki prezentuje on na tle zespołu. Oznacza to, że nawet jeśli zespół składa się z samych asów sprzedaży to tylko kilku z nich zostanie ocenionych nisko, większość zostanie oceniona jako średni, oraz mniejszość otrzyma ocenę najwyższą.
Dlaczego chcemy wykorzystać właśnie ten wykres? Otóż pozwoli to nam na uczciwe porównanie całej grupy i wyłonienie grup najlepszych pracowników, gdzie wyniki sprzedaży zamienimy na percentyle, które posłużą potem do porównania. Do zrozumienia wykres potrzebujemy znać dwie miary: średnią oraz odchylenie standardowe. Odchylenie standardowe tłumaczy jak bardzo konkretne wartości ze zbioru danych odchylają się od średniej. W przypadku gdy nasz zestaw danych posiada normalny rozkład nasz wykres będzie posiadał następujące cechy:
  • środek wykresu będzie stanowiła średnia wartość (będzie to także najwyższy punkt na wykresie),
  • 68,2% danych będzie zawierać się w zasięgu (średnia – odchylenie standardowe od średniej + odchylenie standardowe)
  • 95,5% będzie znajdowało się w zasięgu (średnia – 2*odchylenie Standardowe od średniej + 2*odchylenie standardowe)
  • 99,7% danych będzie w zasięgu (średnia – 3*odchylenie standardowe od średniej + 3*odchylenie standardowe)

Tworzenie wykresu Gaussa

Posłużmy się kwartalnymi wynikami sprzedaży pracowników Adventure Works. Tabela przestawna (1) prezentuje wyniki sprzedaży pracowników w trzecim kwartale 2013 roku. Wykorzystując formułę SORT posortowałem pracowników według wartości sprzedaży od najwyższej w dół (2). Następnym krokiem było przeliczenie kolejno miar: średniej, odchylenia standardowego, percentyla 20, oraz percentyla 80 (3). Wartości percentyli zostały wyznaczone, aby znaleźć wartość, która stanowi 20% i 80% z podanego zbioru liczb. Następnie obliczyłem wartość normalnego rozkładu (4), która będzie stanowiła jedną z osi mojego wykresu. Ostatnim krokiem było utworzenie wykresu (5). Zaznacz zbiór SalesAmount i Distribution, a następnie wybierz wykres, znajdziesz go we wstążce Insert, w sekcji Charts i spośród wykresów punktowych (scatter) wybierz wykres punktowy z wygładzonymi liniami (scatter with smooth lines – 6). Na koniec pozostaje sformatować wykres do naszych potrzeb.
Zwróć uwagę, że jeśli masz niskie odchylenie standardowe, krzywa będzie bardzo wąska. Natomiast w przypadku wysokiego odchylenia standardowego krzywa będzie rozwlekła. Wykres tego typu możemy wykorzystać do oszacowania gdzie dana wartość sprzedaży leży na wykresie. Porównując w ten sposób pracowników jesteśmy w stanie wyłonić 20% najlepszych, 80% średnich i 20% najgorszych wyników sprzedaży i odpowiednio je zwizualizować.

Podsumowanie

W tym artykule odpowiedziałem na następujące pytania:
  • Co to jest wykres Gaussa (inaczej rozkładu normalnego)?
  • Jakie jest jego zastosowanie?
  • Jak utworzyć wykres Gaussa w Excelu?

Interesujący artykuł? Podaj dalej!