Правилото за интерквартирен обхват е полезно при откриване на присъствието на външни хора. Извънредните стойности са индивидуални стойности, които не попадат извън общия модел на набор от данни. Това определение е някак неясно и субективно, така че е полезно да има правило, което да се прилага, когато определяне дали дадена точка от данни е наистина извънземна - това е правилото за интерквартирен обхват влиза.
Всеки набор от данни може да бъде описан от него резюме с пет числа. Тези пет числа, които ви дават необходимата информация, за да намерите модели и външни форми, се състоят от (във възходящ ред):
Тези пет числа разказват на човек повече за неговите данни, отколкото разглеждането на числата наведнъж биха могли, или поне да направят това много по-лесно. Например, the диапазон, което е минималното изваждане от максимума, е един показател за това колко разпространени са данните в набор (забележете: диапазонът е силно чувствителен към външни хора - ако външният слой е също минимален или максимум, диапазонът няма да бъде точно представяне на широчината на данните комплект).
Обхватът би бил труден за екстраполиране в противен случай. Подобен на обхвата, но по-малко чувствителен към външните хора е интерквартилният диапазон. Най- интерквартирна гама се изчислява по почти същия начин като диапазона. Всичко, което трябва да откриете, е да извадите първия квантил от третия квартал:
Интерквартилният диапазон показва как се разпространяват данните за медианата. Той е по-малко чувствителен от обхвата на хората, които са извън границите и поради това може да бъде по-полезен.
Макар че често не се влияе много от тях, интерквартирният диапазон може да се използва за откриване на остатъци. Това става с помощта на тези стъпки:
Не забравяйте, че интерквартилното правило е само правило, което обикновено е, но не важи за всеки случай. Като цяло, винаги трябва да проследявате външния си анализ, като изучавате резултата в резултат, за да проверите дали имат смисъл. Всички потенциални външни резултати, получени чрез интерквартилния метод, трябва да бъдат изследвани в контекста на целия набор от данни.
Вижте правилото за интерквартирен обхват при работа с пример. Да предположим, че имате следния набор от данни: 1, 3, 4, 6, 7, 7, 8, 8, 10, 12, 17. Резюмето от пет числа за този набор от данни е минимум = 1, първо четвъртица = 4, медиана = 7, трета четирия = 10 и максимум = 17. Можете да погледнете данните и автоматично да кажете, че 17 е по-далеч, но какво казва правилото за интерквартирен обхват?
Сега умножете отговора си с 1,5, за да получите 1,5 x 6 = 9. Девет по-малко от първия четвърт е 4 - 9 = -5. Няма данни по-малко от това. Девет повече от третия квартал е 10 + 9 = 19. Няма данни по-големи от това. Въпреки че максималната стойност е пет повече от най-близката точка за данни, правилото за интерквартирен обхват показва, че вероятно не трябва да се счита за външен за този набор от данни.