Как да изчислим медианата на клъстерните данни

Автор: Peter Berry
Дата На Създаване: 15 Август 2021
Дата На Актуализиране: 21 Ноември 2024
Anonim
Finding mean, median, and mode | Descriptive statistics | Probability and Statistics | Khan Academy
Видео: Finding mean, median, and mode | Descriptive statistics | Probability and Statistics | Khan Academy

Съдържание

Медианата е средата на набор от подредени данни. Например, множеството (2,4,7,9,10) има медиана от 7. Подредените данни се агрегират в категории, с точните подробности за всяка точка на загуба на данни. Следователно, точната медиана не може да бъде позната само от клъстерираните данни. Въпреки това, ако знаете броя на данните във всеки интервал, можете да определите кой е "средният обхват", тоест, какво съдържа точката, която е медиана. По-нататък можем да прецизираме средната оценка на точката по формула, въз основа на предположението, че точките от средните точки са равномерно разпределени.


инструкции

Ученето как да се изчисли медианата на група данни е проста задача (Hemera Technologies / AbleStock.com / Getty Images)
  1. Групирайте стойностите в интервали, ако те вече не са. Определете кой интервал трябва да съдържа средата.

    За дидактически цели, разгледайте набора от данни (1,2,4,5,6,7,7,7,9). Медианата тук е 6. Можете да групирате множеството в ширини, равни на 4, например. След това честотното им разпределение може да бъде, например: 1-4: 3 5-8: 5 9-12: 1 В не-обединените данни медианата е категорично в категория 5-8. Можете дори да кажете, че без да видите оригиналния набор от данни.

  2. Изчислете разликата в броя на точките за данни над средните и половината от общия брой точки за данни.

    Според споменатото това е равно на 9/2 - 3 = 1.5. Това изчисление изчислява колко далеч от средния обхват трябва да се намери медианата.


  3. Разделете се по броя на точките в средния диапазон.

    Продължавайки с примера, 1.5 / 5 = 0.3. Това дава съотношение на това колко далеч е средният обхват на медианата.

  4. Умножете получената стойност с ширината на средния диапазон.

    Продължавайки с примера, 0.3 x 4 = 1.2. Това преобразува съотношението в диапазона в действително увеличение на данните.

  5. Добавете горния резултат към стойността между средния и долния диапазон.

    Тъй като границата между средната и долната граница е 4.5, получаваме уравнението 4.5 + 1.2 = 5.7, което може да има резултат, закръглен до 6, правилният отговор.

съвети

  • Всъщност, горното изчисление е същото като във формулата "L + (n / 2 - c) / fxw", където L е числото между средния и следващия по-нисък интервал, n е общият брой на данните, c е общият брой точки под средния диапазон, f е броят на точките за данни в средния обхват, а w е ширината.