Wykres Gaussa
Wykres Gaussa, zwany również jako wykres rozkładu normalnego służy do analizy danych związanej z prawdopodobieństwem. W dzisiejszym artykule omówię sposób tworzenia takiego wykresu, a także jak go analizować.
Zrozumienie wykresu
Za przykład posłuży nam zespół sprzedaży, którego wyniki możemy znaleźć w przykładowej bazie danych Adventure Works. Z pomocą wykresu rozkładu normalnego spróbujemy dokonać oceny pracowników. W tym wypadku indywidualna ocena pracownika będzie bazować na wyniku jaki prezentuje on na tle zespołu. Oznacza to, że nawet jeśli zespół składa się z samych asów sprzedaży to tylko kilku z nich zostanie ocenionych nisko, większość zostanie oceniona jako średni, oraz mniejszość otrzyma ocenę najwyższą.

Dlaczego chcemy wykorzystać właśnie ten wykres? Otóż pozwoli to nam na uczciwe porównanie całej grupy i wyłonienie grup najlepszych pracowników, gdzie wyniki sprzedaży zamienimy na percentyle, które posłużą potem do porównania. Do zrozumienia wykres potrzebujemy znać dwie miary: średnią oraz odchylenie standardowe. Odchylenie standardowe tłumaczy jak bardzo konkretne wartości ze zbioru danych odchylają się od średniej. W przypadku gdy nasz zestaw danych posiada normalny rozkład nasz wykres będzie posiadał następujące cechy:
-
środek wykresu będzie stanowiła średnia wartość (będzie to także najwyższy punkt na wykresie),
-
68,2% danych będzie zawierać się w zasięgu (średnia – odchylenie standardowe od średniej + odchylenie standardowe)
-
95,5% będzie znajdowało się w zasięgu (średnia – 2*odchylenie Standardowe od średniej + 2*odchylenie standardowe)
-
99,7% danych będzie w zasięgu (średnia – 3*odchylenie standardowe od średniej + 3*odchylenie standardowe)

Tworzenie wykresu Gaussa
Posłużmy się kwartalnymi wynikami sprzedaży pracowników Adventure Works. Tabela przestawna (1) prezentuje wyniki sprzedaży pracowników w trzecim kwartale 2013 roku. Wykorzystując formułę SORT posortowałem pracowników według wartości sprzedaży od najwyższej w dół (2). Następnym krokiem było przeliczenie kolejno miar: średniej, odchylenia standardowego, percentyla 20, oraz percentyla 80 (3). Wartości percentyli zostały wyznaczone, aby znaleźć wartość, która stanowi 20% i 80% z podanego zbioru liczb. Następnie obliczyłem wartość normalnego rozkładu (4), która będzie stanowiła jedną z osi mojego wykresu. Ostatnim krokiem było utworzenie wykresu (5). Zaznacz zbiór SalesAmount i Distribution, a następnie wybierz wykres, znajdziesz go we wstążce Insert, w sekcji Charts i spośród wykresów punktowych (scatter) wybierz wykres punktowy z wygładzonymi liniami (scatter with smooth lines – 6). Na koniec pozostaje sformatować wykres do naszych potrzeb.

Zwróć uwagę, że jeśli masz niskie odchylenie standardowe, krzywa będzie bardzo wąska. Natomiast w przypadku wysokiego odchylenia standardowego krzywa będzie rozwlekła. Wykres tego typu możemy wykorzystać do oszacowania gdzie dana wartość sprzedaży leży na wykresie. Porównując w ten sposób pracowników jesteśmy w stanie wyłonić 20% najlepszych, 80% średnich i 20% najgorszych wyników sprzedaży i odpowiednio je zwizualizować.
Podsumowanie
W tym artykule odpowiedziałem na następujące pytania:
-
Co to jest wykres Gaussa (inaczej rozkładu normalnego)?
-
Jakie jest jego zastosowanie?
-
Jak utworzyć wykres Gaussa w Excelu?