Indholdsfortegnelse:

Indeholder 5-talsoversigten outliers?
Indeholder 5-talsoversigten outliers?

Video: Indeholder 5-talsoversigten outliers?

Video: Indeholder 5-talsoversigten outliers?
Video: Coin flipping probability | Probability and Statistics | Khan Academy 2024, November
Anonim

Det Resumé af fem numre er en metode til at opsummere en fordeling af data. Det fem numre er minimumsværdien, den første kvartil(Q1) værdi, medianen, den tredje kvartil(Q3) værdi og maksimum. Dette er meget forskelligt fra resten af dataene. Det er en afvigende og skal fjernes.

Med hensyn til dette, hvad består en 5-tals oversigt af?

Fem- taloversigter A fem - nummeroversigt er især nyttig i deskriptive analyser eller under den foreløbige undersøgelse af et stort datasæt. EN resumé består af fem værdier: de mest ekstreme værdier i datasættet (maksimums- og minimumværdierne), de nedre og øvre kvartiler og medianen.

Og hvordan opdager du, om en ny observation er afvigende? Nogle af de mest populære metoder til afvigende påvisning er:

  1. Z-score eller ekstrem værdianalyse (parametrisk)
  2. Probabilistisk og statistisk modellering (parametrisk)
  3. Lineære regressionsmodeller (PCA, LMS)
  4. Nærhedsbaserede modeller (ikke-parametrisk)
  5. Informationsteoretiske modeller.

Heri, hvordan fortolker du interquartile range?

Fortolkning af resultater: Kvartiler og interkvartilområdet

  1. Percentiler er nyttige til at give et individs relative status i en gruppe.
  2. Medianen er 50. percentilen.
  3. Kvartiler opdeler dataene i fire grupper, der hver indeholder lige mange værdier.
  4. Forskellen mellem 75. og 25. percentil kaldes interkvartilområdet.

Hvad er 1,5 IQR-reglen?

Brug af interkvartilen Herske for at finde outliers Multiplicer interkvartilområdet ( IQR ) ved 1.5 (en konstant, der bruges til at skelne afvigere). Tilføje 1.5 x ( IQR ) til tredje kvartil. Ethvert tal, der er større end dette, er en formodet afviger. Trække fra 1.5 x ( IQR ) fra den første kvartil. Ethvert tal mindre end dette er en mistanke om afvigende værdi.

Anbefalede: