Преди да продължим, важно е да разберем за какво говорим, когато говорим за емпирична връзка и да я съпоставим с теоретичните изследвания. Някои резултати в статистиката и други области на знанието могат да се извлекат от някои предишни твърдения теоретично. Започваме с това, което знаем, а след това използваме логиката, математиката и дедуктивни разсъждения и вижте къде ни води това. Резултатът е пряко следствие от други известни факти.
Контрастирането с теоретичното е емпиричният начин за придобиване на знания. Вместо да разсъждаваме от вече утвърдени принципи, можем да наблюдаваме света около нас. След това от тези наблюдения можем да формулираме обяснение на видяното. Голяма част от науката се прави по този начин. Експериментите ни дават емпирични данни. След това целта става формулиране на обяснение, което отговаря на всички данни.
В статистиката има връзка между средната, средната и режима, която се основава емпирично. Наблюденията на безброй набори от данни показват, че през повечето време разликата между средната и режима е три пъти разликата между средната и средната. Тази връзка във формула на уравнение е:
За да видите горната връзка с данните от реалния свят, нека разгледаме населението на щатите в САЩ през 2010 г. В милиони популациите са: Калифорния - 36,4, Тексас - 23,5, Ню Йорк - 19,3, Флорида - 18,1, Илинойс - 12,8, Пенсилвания - 12,4, Охайо - 11,5, Мичиган - 10,1, Джорджия - 9,4, Северна Каролина - 8,9, Ню Джърси - 8,7, Вирджиния - 7,6, Масачузетс - 6,4, Вашингтон - 6,4, Индиана - 6,3, Аризона - 6,2, Тенеси - 6,0, Мисури - 5.8, Мериленд - 5.6, Уисконсин - 5.6, Минесота - 5.2, Колорадо - 4.8, Алабама - 4.6, Южна Каролина - 4.3, Луизиана - 4.3, Кентъки - 4.2, Орегон - 3.7, Оклахома - 3.6, Кънектикът - 3.5, Айова - 3.0, Мисисипи - 2.9, Арканзас - 2.8, Канзас - 2.8, Юта - 2.6, Невада - 2.5, Ню Мексико - 2.0, Западна Вирджиния - 1.8, Небраска - 1.8, Айдахо - 1.5, Мейн - 1.3, Ню Хемпшир - 1.3, Хаваи - 1.3, Роуд Айлънд - 1.1, Монтана - .9, Делауеър - .9, Южна Дакота - .8, Аляска - .7, Северна Дакота - .6, Върмонт -. 6, Вайоминг - .5
Например, ако знаем, че имаме средна стойност 10, режим 4, каква е медианата на нашия набор от данни? Тъй като средно - режим = 3 (средно - средно), можем да кажем, че 10 - 4 = 3 (10 - медиана). По някаква алгебра виждаме, че 2 = (10 - медиана) и затова медианата на нашите данни е 8.
Както се вижда по-горе, горното не е точна връзка. Вместо това е добро правило, подобно на това на правило за обхват, което установява приблизителна връзка между стандартно отклонение и обхват. Средната, средната и режимът може да не се вписват точно в горната емпирична връзка, но има голям шанс тя да бъде разумно близка.