Microsoft Excel е полезен при извършване на основни изчисления в статистиката. Понякога е полезно да знаете всички функции, които са достъпни за работа с определена тема. Тук ще разгледаме функциите в Excel, които са свързани с t-разпределението на Student. Освен че прави директни изчисления с t-разпределението, Excel може да изчисли доверителни интервали и изпълнявайте тестове за хипотеза.
Функции относно Т-разпределението
В Excel има няколко функции, които работят директно с t-разпределението. Като се даде стойност по време на t-разпределението, следните функции връщат пропорцията на разпределението, която е в посочената опашка.
Пропорция в опашката също може да се интерпретира като вероятност. Тези опасни вероятности могат да бъдат използвани за p-стойности в тестовете за хипотеза.
- Функцията T.DIST връща лявата опашка на t-разпределението на Student. Тази функция може да се използва и за получаване на ш- стойност за всяка точка по кривата на плътност.
- Функцията T.DIST.RT връща дясната опашка на t-разпределението на Student.
- Функцията T.DIST.2T връща и двете опашки на t-разпределението на Student.
Всички тези функции имат подобни аргументи. Тези аргументи са, за да:
- Стойността х, което означава къде по протежение на х оста сме по дължината на разпределението
- Броят на степени на свобода.
- Функцията T.DIST има трети аргумент, който ни позволява да избираме между кумулативно разпределение (чрез въвеждане на 1) или не (чрез въвеждане на 0). Ако въведем 1, тази функция ще върне р-стойност. Ако въведем 0, тази функция ще върне ш-стойност на кривата на плътност за дадеността х.
Обратни функции
Всички функции T.DIST, T.DIST.RT и T.DIST.2T споделят общо свойство. Виждаме как всички тези функции започват със стойност по t-разпределението и след това връщат пропорция. Има случаи, когато бихме искали да обърнем този процес. Започваме с пропорция и искаме да знаем стойността на t, която съответства на тази пропорция. В този случай използваме съответната обратна функция в Excel.
- Функцията T.INV връща лявата опашка, обратна на Т-разпределението на Student.
- Функцията T.INV.2T връща двете опашки, обърнати на Т-разпределението на Student.
За всяка от тези функции има два аргумента. Първият е вероятността или пропорцията на разпределението. Второто е броят степени на свобода за конкретното разпределение, за което сме любопитни.
Пример за T.INV
Ще видим пример както за функциите T.INV, така и за T.INV.2T. Да предположим, че работим с t-разпределение с 12 степени на свобода. Ако искаме да знаем точката по разпределението, която представлява 10% от площта под кривата вляво от тази точка, тогава въвеждаме = T.INV (0.1,12) в празна клетка. Excel връща стойността -1.356.
Ако вместо това използваме функцията T.INV.2T, виждаме, че въвеждането = T.INV.2T (0.1,12) ще върне стойността 1.782. Това означава, че 10% от площта под графиката на функцията на разпределение е вляво от -1.782 и вдясно от 1.782.
Като цяло, от симетрията на t-разпределението, за вероятност P и степени на свобода д имаме T.INV.2T (P, д) = ABS (T.INV (P/2,д), където ABS е абсолютната стойност функция в Excel.
Интервали на увереност
Една от темите за инфекциозната статистика включва оценка на параметър на популацията. Тази оценка е под формата на доверителен интервал. Например оценката на средната популация е примерна средна стойност. Оценката също има грешка, която Excel ще изчисли. За тази граница на грешка трябва да използваме функцията CONFIDENCE.T.
В документацията на Excel се казва, че функцията CONFIDENCE.T се казва, че връща доверителния интервал, използвайки t-разпределението на Student. Тази функция връща границата на грешката. Аргументите за тази функция са в реда, в който те трябва да бъдат въведени:
- Алфа - това е ниво на значимост. Алфата също е 1 - C, където C означава нивото на доверие. Например, ако искаме 95% увереност, тогава трябва да въведем 0,05 за алфа.
- Стандартно отклонение - това е стандартно отклонение на извадката от нашия набор от данни.
- Размер на пробата
Формулата, която Excel използва за това изчисление, е:
M = t*с/ √н
Тук M е за марж, T* е критичната стойност, която съответства на нивото на увереност, с е стандартното отклонение на извадката и н е размерът на извадката.
Пример за интервал на увереност
Да предположим, че имаме обикновена произволна извадка от 16 бисквитки и ги претегляме. Откриваме, че средното им тегло е 3 грама със стандартно отклонение от 0,25 грама. Какъв е 90% доверителен интервал за средното тегло на всички бисквитки на тази марка?
Тук просто въвеждаме следното в празна клетка:
= CONFIDENCE.T (0.1,0.25,16)
Excel връща 0.109565647. Това е границата на грешката. Изваждаме и също добавяме това към нашата примерна средна стойност и затова интервалът ни на доверие е 2,89 грама до 3,11 грама.
Тестове на значимост
Excel също така ще извършва тестове на хипотези, които са свързани с t-разпределението. Функцията T.TEST връща р-стойност за няколко различни теста на значимост. Аргументите за функцията T.TEST са:
- Масив 1, който дава първия набор от примерни данни.
- Масив 2, който дава втория набор от примерни данни
- Опашки, в които можем да въведем 1 или 2.
- Тип - 1 означава сдвоен t-тест, 2 тест с две проби със същата дисперсия на популацията и 3 тест с две проби с различни вариации на популацията.