Mediana to jedna z najprostszych miar statystycznych, która naprawdę pomaga szybko zrozumieć zbiór danych. Pokazuje wartość środkową po uporządkowaniu liczb, więc dobrze działa wtedy, gdy w danych pojawiają się skrajności albo nierówne rozkłady. W tym tekście pokazuję wzór na medianę, sposób liczenia dla danych nieparzystych i parzystych, pracę z tabelą liczebności oraz najczęstsze błędy, które psują wynik.
Kluczowe informacje w skrócie
- Najpierw zawsze uporządkuj dane rosnąco, bo bez tego mediana nie ma sensu.
- Przy nieparzystej liczbie elementów mediana to pojedyncza wartość ze środka.
- Przy parzystej liczbie elementów mediana jest średnią z dwóch środkowych wartości.
- Mediana jest mniej wrażliwa na wartości skrajne niż średnia arytmetyczna.
- W tabeli liczebności trzeba wyznaczyć pozycję środkową na podstawie liczebności skumulowanych.
Czym jest mediana i kiedy naprawdę się przydaje
Mediana, czyli wartość środkowa, dzieli uporządkowany zbiór na dwie części. W statystyce opisowej to także drugi kwartyl. Po jednej stronie zostaje połowa danych mniejszych lub równych medianie, po drugiej połowa większych lub równych.
Ja najczęściej polecam ją wtedy, gdy dane są nierówne albo mają pojedyncze wartości odstające, na przykład wynagrodzenia, ceny mieszkań, czas dojazdu czy wyniki sprawdzianu z jednym bardzo słabym albo bardzo dobrym wynikiem. W takich sytuacjach mediana bywa uczciwsza niż średnia, bo lepiej pokazuje typowy środek zbioru. Żeby policzyć ją bez pomyłki, trzeba jednak znać prosty schemat liczenia.
Wzór na medianę w najprostszej postaci
W szkolnych zadaniach wzór na medianę zapisuje się w zależności od liczby danych. Najpierw dane muszą być uporządkowane rosnąco, a dopiero potem odczytujemy wynik.
Jeśli liczba elementów jest nieparzysta, mediana to element środkowy:
Me = x(n+1)/2
Jeśli liczba elementów jest parzysta, mediana jest średnią dwóch środkowych wartości:
Me = (xn/2 + xn/2+1) / 2
W tym zapisie xi oznacza i-tą wartość po uporządkowaniu danych od najmniejszej do największej, a n to liczba wszystkich obserwacji. Na pierwszy rzut oka brzmi to technicznie, ale w praktyce sprowadza się do prostego odczytu pozycji. Jeśli chcesz, możesz potraktować ten zapis jak instrukcję: najpierw porządek, potem pozycja, na końcu obliczenie. Na przykład w zbiorze 2, 4, 6, 7, 9 mediana wynosi 6, a w zbiorze 1, 3, 6, 8 wynik to 4,5. Właśnie dlatego kolejnym krokiem jest spokojne liczenie na konkretnych danych.
Jak policzyć medianę krok po kroku
Najprościej uczę tego tak: nie skacz od razu do wyniku, tylko wykonaj te same cztery ruchy za każdym razem. Dzięki temu nawet dłuższy zestaw liczb nie powinien sprawić problemu.
- Zapisz wszystkie dane i uporządkuj je rosnąco.
- Policz, ile jest elementów w zbiorze.
- Sprawdź, czy liczba danych jest parzysta, czy nieparzysta.
- Odczytaj środkowy element albo wylicz średnią z dwóch środkowych elementów.
Przykład 1, liczba nieparzysta: dane 12, 5, 8, 9, 3. Po uporządkowaniu otrzymuję 3, 5, 8, 9, 12. Jest pięć liczb, więc środkowa wartość to trzecia pozycja. Mediana = 8.
Przykład 2, liczba parzysta: dane 7, 2, 10, 6, 1, 8. Po uporządkowaniu mam 1, 2, 6, 7, 8, 10. Dwie środkowe wartości to 6 i 7, więc liczę ich średnią: (6 + 7) / 2 = 6,5.
| Pozycja | Wartość |
|---|---|
| 1 | 1 |
| 2 | 2 |
| 3 | 6 |
| 4 | 7 |
| 5 | 8 |
| 6 | 10 |
To jest dokładnie ten moment, w którym wielu uczniów myli środkowe wartości z wynikiem końcowym. Jeśli liczba danych jest parzysta, nie wybierasz jednej z nich, tylko liczysz średnią arytmetyczną. Tę samą logikę stosuje się także wtedy, gdy dane zapisano w tabeli liczebności.
Mediana z tabeli liczebności i danych pogrupowanych
W tabelach liczebności nie zapisujesz wszystkich obserwacji osobno, tylko liczbę powtórzeń każdej wartości. Sama zasada mediany się nie zmienia, ale zamiast patrzeć na zwykłą listę, śledzisz kolejne pozycje w zbiorze. Liczebność skumulowana to narastająca suma liczebności, dzięki której łatwo sprawdzić, gdzie kończy się dany wariant.
Przykład: wyniki sprawdzianu z matematyki.
| Ocena | Liczba uczniów | Liczebność skumulowana |
|---|---|---|
| 1 | 2 | 2 |
| 2 | 3 | 5 |
| 3 | 7 | 12 |
| 4 | 6 | 18 |
| 5 | 4 | 22 |
| 6 | 2 | 24 |
Mamy łącznie 24 wyniki, więc mediana leży między 12. i 13. pozycją. Z liczebności skumulowanych widać, że 12. wynik to ocena 3, a 13. to ocena 4. Mediana = 3,5. To dobry przykład, bo pokazuje, że w tabeli liczebności nie liczymy „na oko”, tylko dokładnie śledzimy pozycje.
W danych pogrupowanych w przedziały, na przykład w przedziałach wzrostu lub dochodu, mediana bywa już wyznaczana szacunkowo, metodą interpolacji, czyli przez oszacowanie położenia mediany wewnątrz właściwego przedziału. Na poziomie szkolnym najważniejsze jest jednak zrozumienie logiki: najpierw odnajdujesz środek zbioru, potem dopiero odczytujesz lub przybliżasz wartość. Dzięki temu nie mylisz mediany z samym środkiem przedziału.
Mediana a średnia i dominanta pokazują różne rzeczy
Te trzy miary często pojawiają się obok siebie, ale każda odpowiada na inne pytanie. Średnia arytmetyczna opisuje przeciętną wartość wszystkich danych, mediana pokazuje środek uporządkowanego zbioru, a dominanta wskazuje najczęściej występującą wartość. Jeśli traktujesz je zamiennie, łatwo o błędny wniosek.
| Miara | Co pokazuje | Kiedy jest najpraktyczniejsza | Na co uważać |
|---|---|---|---|
| Średnia arytmetyczna | Przeciętny poziom danych | Gdy zbiór jest dość równy i bez skrajności | Silnie reaguje na bardzo duże lub bardzo małe wartości |
| Mediana | Wartość środkową | Gdy dane są skośne albo mają odstające obserwacje | Nie pokazuje, jak mocno rozrzucone są dane |
| Dominanta | Najczęstszą wartość | Gdy chcesz wiedzieć, co występuje najczęściej | Może nie istnieć albo może być ich kilka |
Najlepiej widać to na prostym zbiorze: 3, 4, 4, 5, 100. Średnia wynosi 23,2, ale mediana to 4. Gdybym opierał interpretację tylko na średniej, uznałbym zbiór za dużo wyższy niż jest w rzeczywistości. Właśnie dlatego mediana tak dobrze sprawdza się przy cenach, zarobkach i innych danych, w których pojedynczy wynik może mocno zniekształcić obraz. Znając różnice między miarami, łatwiej uniknąć prostych pomyłek.
Najczęstsze błędy, które psują wynik
W obliczeniach mediany błąd zwykle nie leży w samym wzorze, tylko w kolejności działań. Ja zawsze zaczynam od uporządkowania danych, bo większość pomyłek bierze się właśnie z pominięcia tego kroku.
- Liczenie mediany bez sortowania liczb rosnąco.
- Branie środkowej wartości z nieuporządkowanego zbioru.
- Przy parzystej liczbie danych wybieranie jednej z dwóch środkowych liczb zamiast ich średniej.
- Mylenie pozycji danych z ich wartościami, zwłaszcza w tabelach liczebności.
- Zaokrąglanie wyniku bez potrzeby, choć w zadaniu lepiej zostawić go dokładnie, na przykład jako 3,5 albo 11/2.
- Traktowanie mediany jak średniej arytmetycznej, czyli oczekiwanie, że zawsze opisze „przeciętny” poziom tak samo dobrze.
Jeśli pracujesz na większym zbiorze, pomyłka na początku potrafi przesunąć cały wynik o jedną lub więcej pozycji. Dlatego w zadaniach szkolnych opłaca się zapisywać każdy krok, nawet jeśli wydaje się banalny. To drobiazg, który oszczędza najwięcej punktów przy sprawdzianie. Na tym etapie ważniejsze od samego rachunku staje się już to, co ten wynik naprawdę mówi o zbiorze.
Jak czytać medianę, żeby nie wyciągać zbyt mocnych wniosków
Ja traktuję medianę jako szybki i odporny na skrajności punkt odniesienia. Jeśli chcesz pełniejszy obraz, dobrze jest spojrzeć jeszcze na kwartyle, czyli wartości dzielące zbiór na cztery równe części, albo na rozstęp międzykwartylowy, czyli różnicę między kwartylem trzecim i pierwszym. W praktyce mediana najlepiej działa wtedy, gdy chcesz opisać środek danych bez wpływu pojedynczych odchyleń.
Jeśli chcesz, mogę w kolejnym kroku przygotować też zestaw ćwiczeń z medianą, w tym zadania z tabelą liczebności i pełnymi rozwiązaniami, żeby przećwiczyć ten temat krok po kroku.