6 Сенімділік интервалдары және гипотезаны тексеру
Жоспар
- Сенiмдiк аралықтары
- Сенiмдiк аралықтары бар гипотезаны тексеру
- P-мәнi
- Бір және екi жақты гипотеза тесттерi
Орталық шектi теорема
- Егер \(X\) күту \(\mu\) және стандартты ауытқу \(\sigma\) болатын кездейсоқ айнымалы болса және бұл айнымалының \(n\) бақылаулары болса, онда үлгі орташасының таралуы
- \(\bar{X} \sim N(\textrm{ mean } = \mu, \textrm{ sd } = \frac{\sigma}{\sqrt{n}})\)
- Көптеген үлгі статистикасы қалыпты таралған.
- үлгі орташа мәні, \(\bar{X}\)
- үлгі пропорциялары, \(\bar{P}\)
- үлгі орташа мәндерінің айырмашылығы, \(\bar{X_1} - \bar{X_2}\)
- үлгі пропорцияларының айырмашылығы, \(\bar{P_1} - \bar{P_2}\)
Нүктелік бағалау және аралық бағалау
- Нүктелік бағалау - бұл жай ғана бір сан
- Мысалы, біз Астанадан келген 100 ер адамның салмағын өлшедік. Орташа салмағы 75 килограмм болды. 75 килограмм - Астанадағы барлық ер адамдардың орташа салмағының нүктелік бағалауы.
- Интервалдық бағалау, сіз болжағандай, мәндер аралығы.
- Мысалы, 75 килограммның орнына 75 +/- 5 килограммды алуға болады: [70, 80]
- Біздің аралықта нақты популяциялық орташа мәннің болуы қаншалықты ықтимал?
Орташа мәннен қашықтық
- Бізде стандартты қалыпты айнымалы бар, \(Z\sim N(0, 1)\)
- Орташа мәннен 1 стандартты ауытқу шегінде қанша бақылау бар.
\[ P(-1<Z<1) \approx 68.3\% \]
Орташа мәннен қашықтық
\(Z\sim N(0, 1)\) үшін орташа мәннен 2 стандартты ауытқу шегінде қанша бақылау бар?
\[ P(-2 < Z < 2) \approx 95.4\% \]
Орташа мәннен қашықтық
- 95% ықтималдықпен үлестірімнің центріне жету үшін қанша стандартты ауытқу «жүру» керек?
\[\begin{align*} P(-z < Z < z) = 95\% \\ 1 - P(Z > z \cup Z < -z ) = 95\% \\ 1 - P(Z > z) - P(Z < - z) = 95\% \\ 2*P(Z < - z) = 5\% \\ P(Z < - z) = 2.5\% \\ \end{align*}\]
- Мұны кодты пайдаланып есептеуге болады.
qnorm(0.025, mean = 0, sd = 1) %>% abs()[1] 1.959964
Мысал
Зерттеуші бос жұмыс орындарына 200 доллар тұратын жалған түйіндемелер жіберді.
Түйіндемелер бірдей, бірақ жартысы «ер», ал жартысы «әйел».
Ерлерге 23 рет, әйелдерге 8 рет қоңырау шалынды.
Біздің деректеріміз ерлердің әйелдерге қарағанда «шақыру» алу ықтималдығы жоғары екенін білдіре ме?
Шақырудың «ықтималдылығы» нені білдіреді? Бір түсіндірме - популяцияның үлесі: егер бізде барлық еңбекке қабілетті ерлер мен әйелдер туралы деректер болса,
Бізде екі үлгі пропорциясы бар. CLT арқасында біз олардың айырмашылығы қалыпты түрде бөлінгенін білеміз.
Стандартты қате \(3,5%\) деп есептейік
Яғни, біз “орташа” бойынша \(3,5%\)-қа ауытқып отырмыз
Нүктелік бағалау екі популяция арасындағы шынайы айырмашылыққа тең болуы екіталай. Бірақ аралықты алсақ ше?
Бізде не бар?
- Нүктелік бағалау: \(\Delta p= \hat{p}_{male} - \hat{p}_{female} = 15%\)
- Байланысты айнымалы қалыпты түрде таралған: \(\Delta P \sim N(\textrm{ true difference }, 3,5%)\)
- Біз не білеміз?
- Барлық нүктелік бағалаулардың 95%-ы шынайы орталықтан (true difference) 1,96 стандартты ауытқу шегінде болады
- Яғни, егер біз 15% ,96*3,5%$ аралығын құрсақ, онда 95% ықтималдықпен шынайы айырмашылық болады.
- \(\hat{p} = 15%, SE_{\hat{P}} = 3.5%\) - нүктелік бағалау және стандартты қате
- \(z^*_{95\%} = \textrm{ qnorm(0.025, 0, 1) %>% abs() } = 1.96\) - қашықтық
- 95% CI: \(\hat{p} \pm z^{*}\times SE = 15% \pm 1.96*3.5\% = (8.14, 21.86)\) - интервал
- Түсіндірме: Барлық бағалаулардың 95%-ы шын параметрден 1.96 стандартты ауытқу шегінде екенін білеміз
- \((8.14, 21.86)\) интервалында нақты айырмашылық бар екеніне 95% сенімдіміз
- Нәтижелерді былай жеткізе аламыз:
- Әйел мен ер адамды шақыру ықтималдығы арасындағы нақты айырмашылықты \(8.14%\) деп бағалаймыз 95% сенімділік деңгейінде \(21,86%\) дейін
Сенiмдiлiк аралығының жалпы формуласы
Популяцияның орташа мәнi үшiн сенiмдiлiк аралығы: iрiктеменiң орташа мәнiне плюс немесе минус қате шегi \[CI_{\alpha}: \bar{x} \pm z^*\times SE = \bar{x} \pm z^{*}\times \frac{\sigma}{\sqrt{n}}\]
\(\bar{x}, \sigma, n\) мәндері iрiктеменiң негiзiнде есептеледi
бiз тек \(z^{*}\) мәндерiн iрiктейміз. Әдетте, деңгейлер: \(90\%\), \(95\%\) немесе \(99\%\) болады.
| Сенiмдiлiк деңгейi | z-мағына |
|---|---|
| 90% | 1.645 |
| 95% | 1.96 |
| 99% | 2.576 |
7 Гипотезаны тексеру
Мысал
- Досыңыз спортшы студент-студенттердің басқа студенттерге қарағанда оқуда жақсы нәтиже көрсеткенін айтады делік.
- Сіз спортпен шұғылданатын 100 кездейсоқ студенттен сауалнама алып, олардың орташа GPA көрсеткіші 3,4 ұпай екенін анықтадыңыз.
- Алдыңғы зерттеулерден сіз Қазақстандағы орташа GPA көрсеткіші 3,3 ұпай, ал стандартты ауытқу көрсеткіші 0,3 ұпай екенін білесіз.
- Сіздің деректеріңіз спортпен шұғылданатын студенттердің оқуда орташа көрсеткіші жақсы екенін дәлелдей ме?
Формализм
- Енгізілген деректерді формальды етейік: кездейсоқ студенттің GPA көрсеткішін беретін \(X\) кездейсоқ айнымалысы бар. Оның таралуы белгісіз: \(X \sim Any(\mu, \sigma)\)
- Біз 100 кездейсоқ спортшы студент-студенттерді алып, олардың орташа GPA көрсеткішін есептейміз. Бұл тағы бір кездейсоқ айнымалы, оны \(\bar{X}\) деп белгілейміз. Орталық шекті теоремадан \(\bar{X} \sim N(\mu_{sport}, \frac{\sigma}{\sqrt{n}})\) екенін білеміз.
- \(\mu_{sport}\) - белгісіз, бірақ біз болжауға болады
- Мысалы, егер досымыз дұрыс айтса және “спортшылар” жақсы оқитын болса, олардың орташа бағасы ұлттық орташадан жоғары болуы керек.
- \(\mu_{sport} > 3.3\)
- Егер досымыз қателессе және “спортшылар” ұлттық орташадан жақсы болмаса, онда олардың орташа бағасы басқалардың орташа бағасымен бірдей болуы керек.
- \(\mu_{sport} = 3.3\)
- Қай тұжырымның сенімдірек екенін қалай тексеруге болады?
Гипотезалар
- Нөлдік гипотеза - \(H_{0}\) - айнымалылар арасында ешқандай байланыс жоқ (спорт GPA-да ешқандай рөл атқармайды).
- Мысалы, айыпталушы кінәлі ЕМЕС; студент-спортшылар жалпы студенттерге қарағанда академиялық тұрғыдан жақсы нәтиже көрсетпейді.
- Балама гипотеза - \(H_{A}\) - Айнымалылар арасында байланыс бар (спорттық қатысу GPA-ға әсер етеді).
- Айыпталушы кінәлі; студент-спортшылар жалпы студенттерге қарағанда академиялық тұрғыдан жақсы нәтиже көрсетеді.
Гипотезаны тексеру
- Гипотезалар бір-бірін жоққа шығаратын және жалпы алғанда толық болуы керек.
- Айыпталушы кінәлі емес (\(H_{0}\)) немесе кінәлі (\(H_{A}\)) - ортаңғы жол жоқ.
- Студент-спортшылар жалпы студенттерге қарағанда академиялық тұрғыдан жақсы нәтиже көрсетпейді (\(H_{0}\)) НЕМЕСЕ олар академиялық тұрғыдан жақсы нәтиже көрсетеді (\(H_{A}\))
- Негізгі идея: \(H_{0}\) әрқашан басқаша дәлелденгенге дейін шындық деп есептеледі (\(H_{A}\)).
- Мысалы, айыпталушы кінәсінің сенімді дәлелі болғанға дейін әрқашан әдепкі бойынша кінәлі емес (кінәсіздік презумпциясы).
- Студент-спортшылар жалпы студенттерге қарағанда жақсы нәтиже көрсетпейді, олардың жоғары өнімділігінің сенімді дәлелі болғанға дейін.
Гипотезаны тексеру: Тұжырымдамалық
- Деректерді талдау - бұл скептицизм: «дәлелдеу ауыртпалығы тұжырымдаманы жасаушыда».
- Нөлдік гипотеза байланыстардың болмауы туралы, яғни ол скептицизм. Жалпы идея - бізде сенімді дәлелдер болғанша бәріне (байланыстардың болуына) күмәндануымыз керек.
Гипотезаны қалай тексеруге болады?
- Нөлдік гипотезаның ақиқат екенін есептеңіз.
- Нөлдік гипотезаның ақиқат екенін ескере отырып, деректердің қаншалықты ықтимал екенін сұраңыз.
- Егер деректер екіталай болса, біз нөлдік гипотезаны балама пайдасына қабылдамаймыз.
- Егер деректер ықтимал болса, біз нөлдік гипотезаны қабылдамаймыз (яғни, біз қазіргі күйінде қаламыз).
Мысал
“Спортшыларға” оралайық. Бізде:
Үлгі орташасы: \(\bar{x} = 3.4\)
Стандартты ауытқу: \(\sigma = 0.3\)
Ал үлгі өлшемі: \(n = 100\)
Нөлдік гипотеза (\(H_0\)) дұрыс деп есептейік. Бұл нені білдіреді?
\(X_{sport}\) \(N(\mu_{sport} = 3.3, \sigma_{sport} = 0.3)\) үлестіріміне ие
Демек, 100 бақылаудың орташа мәні, \(\overline{X}_{sport} \sim N(3.3, SE = \frac{0.3}{10})\)
Енді осы шарт бойынша үлгі орташасын \(3.4\) немесе одан жоғары ( \(P(\overline{X}_{sport} \geq 3.4\)) ) бақылау ықтималдығы қандай екенін сұрайық.
P-мәні
- p-мәні - нөлдік гипотеза ақиқат болған жағдайда, “біздікі сияқты” деректерді бақылау ықтималдығы.
\[ P(\bar{X} > 3.4|H_{0} \textrm{ is TRUE}) \\ P(\bar{X} > 3.4)| H_{0}: \bar{X} \sim N(\mu = 3.3, SE = 0.03) \\ \]
- Бұл z-мәні \(3.33\)-тан үлкен жағдайға ұқсас
\[ z = \frac{\bar{x} - \mu}{SE} = \frac{3.4 - 3.3}{0.03} \approx 3.33 \\ P(Z > 3.33) \approx 0.0004\% \]
Графикалық түрде
Warning: Removed 60 rows containing missing values or values outside the scale range
(`geom_area()`).
Түсіндіру
- p-мәні - нөлдік гипотеза (\(H_{0}\)) дұрыс болған жағдайда «деректердің» ықтималдығы.
- Егер p-мәні белгілі бір маңыздылық деңгейінен (\(\alpha\)) аз болса, біздікі сияқты «деректерді» бақылау өте ықтимал емес деп айтамыз, сондықтан \(H_{0}\) қабылдамаймыз.
- Егер p-мәні \(\mathbf{\alpha}\)-тан үлкен болса, біздікі сияқты мәндерді бақылау өте ықтимал деп айтамыз, сондықтан \(H_{0}\) қабылдамаймыз.
Шешім қалай қабылданады
Warning: Removed 60 rows containing missing values or values outside the scale range
(`geom_area()`).
- Біздің p-мәніміз өте аз: бақыланатын үлгі орташасы «спортшылар» басқалар сияқты оқиды деп есептесек, өте ықтимал емес.
- Біз \(H_{0}\) қабылдамаймыз. Егер «спортшылар» бірдей болса, онда 100 студент үшін орташа мәннің 3,4 немесе одан жоғары болу ықтималдығы 0,04% құрайды.
- 3.3 гипотетикалық орташасы мен 3.4 үлгілік орташасы арасындағы айырмашылықты кездейсоқтыққа жатқызуға болмайды.
p-мәні және сенімділік аралығы
- “Спортшыларымызға” оралайық
- Бізде: \(\bar{x} = 3.4, \sigma = 0.3, n = 100\)
- Біз 95% сенімділік аралығын құра аламыз.
\[ \bar{x} \pm z^{*}_{95\%}\times\frac{\sigma}{\sqrt{n}} = 3.4 \pm 1.96\times\frac{0.3}{10} = \\ 3.4 \pm 1.96\times0.03\approx (3.34, 3.45) \]
p-мәні және сенімділік аралығы
Жарайды, бізде \((3.34, 3.45)\) аралығы бар. Ол бізге не айта алады?
Бұл студент-спортшылардың орташа академиялық көрсеткіштері жақсы деген гипотезаны растай ма?
\(H_{0}: \mu = 3.3\); \(H_{A}: \mu > 3.3\)
\(\mu = 3.3 \notin (3.34, 3.45) \implies H_{0} \textrm{ rejected }\)
Біздің сенімділік аралығымызда гипотезаланған орташа мән жоқ. Және ол тек 5% жағдайда ғана қате.
1- және 2-құйрықты тесттер
- Жоғарыдағы мысалда бізді “спортшылар орташа студенттерден жақсырақ” деген гипотеза қызықтырды: \(\mu_{sport} > \mu_{all}\).
- Бірақ егер біз жалпы сұрақ қойсақ ше: «Спортшылар кәдімгі студенттерге ұқсамайды»: \(\mu_{sport} \neq \mu_{all}\)
- Мұны екі сценарий ретінде көрсетуге болады: олар жақсырақ немесе нашар: \(\mu_{sport} > \mu_{all}\) немесе \(\mu_{sport} < \mu_{all}\)
- Мұндай гипотезаларды тексеру екі жақты тест деп аталады
- Екі жақты гипотеза үшін p-мәні әдетте бір жақты гипотезадан екі есе үлкен болады, себебі біз екі оқиғаның ықтималдықтарын («жақсырақ» және «нашар») қарастырамыз
Мысал
Жалпы мағынасы: \(\textrm{p-value} = P("Data"|\textrm{Null Hypothesis True})\)
Нөлдік гипотеза: \(\mu_{sport} = 3.3\)
Бір жақты балама гипотеза: \(\mu_{sport} > 3.3 \implies \textrm{p-value} = P(\overline{X} > 3.4|H_{0})\)
2 жақты балама гипотеза: \(\mu_{sport} \neq 3.3 \implies \textrm{p-value} = P(\overline{X} > 3.4 \textrm{ OR } \overline{X} < 3.2 | H_{0})\)
Үлгі орташасы үшін гипотезаны тексеру. Жалпы алгоритм
- Гипотезаларды көрсетіңіз
- \(H_{0}: \mu = \textrm{ null value }\)
- \(H_{A}: \mu < \textrm{ or } > \textrm{ or } \neq \textrm{ null value }\)
- Үлгі орташасын есептеңіз: \(\overline{x}\)
- \(H_{0}\) берілген үлестірімді анықтаңыз. Үлгі орташасы үшін z-мәнін есептейміз және біздікінен үлкен орташа мәнді байқау ықтималдығын анықтаймыз.
- \(z = \frac{\overline{x} - \mu_{0}}{SE_{0}}, SE_{0} = \frac{sd}{\sqrt{n}}, P(Z > |z||H_{0}) = p\_value\)
- p-мәнін маңыздылық деңгейімен салыстырыңыз
- Егер \(p\_value < \alpha\) болса, \(H_{0}\) қабылданбаса, деректер \(H_{A}\)-ға қатты қолдау көрсетеді
- Егер \(p\_value > \alpha\) болса, \(H_{0}\) қабылданбаса, деректер \(H_{A}\)-ға қатты қолдау көрсетпейді
Мысал
- Бір зерттеуші өзінің әріптестерінің қаншалықты оқығанын тексеруді шешті. Ол кездейсоқ $100 студенттерді сауалнамаға тартты, ал оқудың орташа уақыты аптасына \(10,3\) сағатты құрады. - Алдыңғы зерттеулерден студент Қазақстандағы орташа студент аптасына 9,8 сағат оқитынын, стандартты ауытқуы 2 сағат екенін біледі.
- Оқушының сыныптастары Қазақстандағы оқушыларға қарағанда орташа есеппен көбірек оқиды деген гипотезаны тексеріңіз. 0,01 маңыздылық деңгейін пайдаланыңыз.
\[ H_{0}: \mu_{uni} = 9.8 = \mu_{kz}\\ H_{A}: \mu_{uni} > 9.8 = \mu_{kz} \]
Мысал
\(H_{0}\) дұрыс делік, онда кездейсоқ сыныптас типтік оқушыдан еш айырмашылығы жоқ: \(X_{uni} \sim X_{kz} \sim N(\mu_{kz} = 9.8, \sigma_{kz} = 2)\)
Егер солай болса, онда мұндай 100 студенттің орташа саны \(\overline{X}_{uni} \sim N(\mu = 9.8, SE = \frac{sd}{\sqrt{n}} = \frac{2}{\sqrt{100}} = 0.2)\) ретінде бөлінеді
Біз \(\overline{X} = 10.3\) байқаймыз және бұл бақылаудың біздің күтуімізден қаншалықты алыс екенін есептей аламыз: \(z = \frac{10.3 - 9.8}{0.2} = 2.5\)
Енді ықтималдықтарды есептей аламыз: \(P(\overline{X} > 10.3|H_{0}: \overline{X} \sim N(\mu = 9.8, SE = 0.2)) = P(Z > 2.5|H_{0}) \approx 0.006 < \alpha = 0.01\)
\(p\_value < \alpha\), сондықтан \(H_{0}\) мәнін \(H_{A}\) мәніне ауыстырамыз.
1- және 2-құйрықты тесттер
- Жоғарыдағы мысалда біз 1-құйрықты тест жүргіздік: \(\mu_{uni} > \mu_{kz}\), бұл белгілі бір университеттегі студенттердің орташа есеппен Қазақстандағы студенттерге қарағанда көбірек оқитынын көрсетеді.
- Енді университеттегі студенттер Қазақстандағы студенттер сияқты жақсы оқымайтынын айтатын \(\mu_{uni} \neq \mu_{KZ}\) 2-құйрықты гипотезаны тексергіміз келеді делік.
2-құйрықты тест
\[ P(Z < -2.5 \textrm{ OR } Z > 2.5| H_{0} \textrm{ is true}) = \\ P(\overline{X} < 9.3 \textrm{ OR } \overline{X} > 10.3| H_{0} \textrm{ is true}) \\ \approx 2 \times 0.006 = 0.012 > 0.01 = \alpha \]
- Бұл жағдайда біз \(H_{0}\)-ты ҚАРСЫ АЛМАЙМЫЗ: деректер университет студенттерінің орташа есеппен \(99%\) сенімділік деңгейінде Қазақстандағы студенттерге қарағанда көбірек НЕМЕСЕ аз оқитынын нақты дәлелдемейді.
- Егер \(H_{0}\) дұрыс болса, онда үлгінің орташа мәні \(1,2%\) олардың күтуінен (үлестіру орталығынан) екі \(2,5\) стандартты ауытқу шегінде болар еді.
8 Басқа бағалаулар үшін статистикалық қорытынды
Кездейсоқ айнымалылар қалыпты таралған
- Үлгі орташа мәндері \(\overline{X} \sim N\)
- Үлгі орташа мәндері арасындағы айырмашылық \(\overline{X_1} - \overline{X_2} \sim N\)
- Үлгі пропорциясы \(\hat{P} \sim N\)
- Үлгі пропорциялары арасындағы айырмашылық \(\hat{P_1} - \hat{P_2} \sim N\)
Жалпы тәсіл
Қалыптыға жақын бағалаулар үшін сенімділік аралығы \[\textrm{нүктелік бағалау} \pm z^{*} \times SE\]
Гипотезаны тексеру \[z = \frac{\textrm{нүктелік бағалау - null}}{SE} \\ \textrm{p-мәні} = P(Z > z) \textrm{, егер 1 жақты гипотеза болса} \\ \textrm{p-мәні} = P(Z > z) + P(Z < z) \textrm{, егер 2 жақты болса гипотеза} \]
Стандартты қате
- Ең қиыны - стандартты қатені, \(SE\), табу, себебі ол бағалау түріне байланысты
- мысалы, үлгінің стандартты қателігі орташа: \(SE(\overline{X}) = \frac{\sigma}{\sqrt{N}}\)
- бірақ үлгі пропорциясы үшін: \(SE(\hat{P}) = \sqrt{\frac{p_0*(1-p_0)}{N}}\)
- Қазірше \(SE\) белгілі деп есептейміз.
Стандартты қате II
- Еске сала кетейік, стандартты қате - бұл үлгі статистикаңыздың стандартты ауытқуы (орташа мән, пропорция және т.б.)
- Айталық, сізде \(X \sim Any(\mu, \sigma)\) айнымалысы бар делік
- Сіз осы айнымалының \(n\) бақылауларын аласыз - бұл сіздің үлгіңіз.
- Содан кейін сіз үлгі үшін статистиканы есептейсіз, мысалы, орташа \(\overline{X}\)
- Үлгі статистикаңыздың стандартты ауытқуы стандартты қателік болып табылады.
Мысал
Сіздің ойыңызша, 2017 жылы Германия халқының қанша пайызы мигранттардан тұрды?
- 15%
- 20%
- 25%
Мысал
Дұрыс жауап
- БҰҰ-ның кейбір есебіне сәйкес 15%
Мысал
Енді біз кездейсоқ 400 оқушыдан сауалнама жүргіздік деп елестетіп көріңіз, олардың 150-і немесе 37,5%-ы дұрыс жауап берді. Үлгі үлесінің стандартты қателігі 2,4% құрайды. Бұл деректер студенттердің Германияны орташа есеппен, айталық, 0,01 маңыздылық деңгейіндегі тиын лақтырудан гөрі жақсы түсінетінін дәлелдей ме?
Кішкене математика (таңдау)
\(\hat{P}_n = \frac{Y}{n}\) - \(n\) сынақтарындағы «табыстар» үлесі
шынайы, бірақ белгісіз популяция үлесінің бағасы \(p_{true}\)
Гипотезаларды тексерген кезде, біз популяцияның шынайы үлесі қандай да бір гипотетикалық мәнге \(p_{true} = p_{0}\) тең деп есептейміз және бұл қаншалықты ықтимал екенін білгіміз келеді.
Табыстар саны биномдық айнымалы екенін көруге болады: \(Y \sim Bi(p_0, n)\), бұл \(E[Y] = p_{0}n\) және \(var(Y) = p_{0}(1-p_{0})n\) дегенді білдіреді.
Тағы математика (таңдау)
- \(\hat{P}_n\) \[ үлгі пропорциясының күтілетін мәні қандай? E[\hat{P}_n] = E\big[\frac{Y}{n}\big] = \frac{1}{n}E[Y]=\frac{p_0n}{n} = p_0 \]
- Дисперсия туралы не деуге болады? \[ var(\hat{P}_n) = var\big( \frac{Y}{n} \big) = \frac{1}{n^2}var(Y) = \frac{p_0(1-p_0)n}{n^2} = \frac{p_0(1-p_0)}{n} \]
(таңдау)
- \(\hat{P}_n\) \[ sd(\hat{P}_n) = \sqrt{\frac{p_{0}(1-p_{0})}{n}} стандартты қатесі \]
- Мен сізге мысалдағы стандартты қате \(2.4\%\) екенін айттым, бәрі сәйкес келеді \[ sd(\hat{P}_n) = \sqrt{\frac{0.33(1-0.33)}{400}} \approx 0.024 \]
Мысал
Мысалға оралайық, біз 400 кездейсоқ студенттен сауалнама алынды, оның 150-і немесе 37,5%-ы дұрыс жауап берді. Іріктеме үлесінің стандартты қателігі 2,4%-ды құрады. Бұл деректер студенттердің Германияны орташа есеппен, айталық, 0,01 маңыздылық деңгейіндегі тиын лақтырудан гөрі жақсы түсінетінін дәлелдей ме?
Шешімі
- Гипотезалар
\[ H_{0}: p_{uni} = 0.33 = p_{0} \\ H_{A}: p_{uni} > 0.33 = p_{0} \]
Нүктелік бағалау: \(\hat{p} = 0.375\)
z-статистикасын және p-мәнін есептеңіз
\[ z = \frac{\hat{p} - p_0}{SE} = \frac{0.375 - 0.333}{0.024} = \frac{0.042}{0.024} = 1.75 \\ \textrm{p-value} = P(Z > 1.75|H_0) \approx 0.04\% > 0.01 = \alpha \implies \textrm{ҚАБЫЛДАМАҢЫЗ } H_0 \]
pnorm(1.75, mean = 0, sd = 1, lower.tail = FALSE)[1] 0.04005916
Соңғы қадам
- Деректер орташа студенттің Германияны кездейсоқтықтан гөрі жақсы түсінетінін толық дәлелдемейді.
Енді R-де де солай.
prop.test()функциясы шын пропорцияның қандай да бір мәнге (сіз ұсынған мәнге) тең екендігі туралы гипотезаны тексереді.
test <- prop.test(150, n = 400, p = 0.33,
alternative = "greater",
conf.level = 0.99)
test
1-sample proportions test with continuity correction
data: 150 out of 400, null probability 0.33
X-squared = 3.4628, df = 1, p-value = 0.03138
alternative hypothesis: true p is greater than 0.33
99 percent confidence interval:
0.3195126 1.0000000
sample estimates:
p
0.375
test$p.value < 0.01[1] FALSE
- Біз не істейміз? Қабылданбаңыз!
Біз параметрлермен ойнай аламыз.
another_test <- prop.test(150, n = 400, p = 0.33,
alternative = "two.sided",
conf.level = 0.95)
another_test
1-sample proportions test with continuity correction
data: 150 out of 400, null probability 0.33
X-squared = 3.4628, df = 1, p-value = 0.06276
alternative hypothesis: true p is not equal to 0.33
95 percent confidence interval:
0.3277503 0.4246901
sample estimates:
p
0.375
Екі пропорция
- \(\hat{P}_1\) және \(\hat{P}_2\) - екі үлгі үшін екі пропорция, \(n_1, n_2\)
- \(\hat{P}_1 = 0.23\) және \(\hat{P}_2 = 0.08\)
- \(n_1 = 100\) және \(n_2 = 100\)
- \(\Delta \hat{P} = \hat{P}_1 - \hat{P}_2\) жаңа айнымалысын енгізіңіз
- Оның күтуін есептеңіз
\[ E[\Delta \hat{P}] = E[\hat{P}_1 - \hat{P}_2] = \]
\[ E[\hat{P}_1] - E[\hat{P}_2] = p_1 - p_2 \]
Дисперсия
\[\begin{align*} var(\Delta \hat{P}) = var(\hat{P}_1 - \hat{P}_2) = \\ var(\hat{P}_1) + var(\hat{P}_2) = \frac{p_1(1 - p_1)}{n_1} + \frac{p_2(1 - p_2)}{n_2} \\ sd(\Delta \hat{P}) = \sqrt{\frac{p_1(1 - p_1)}{n_1} + \frac{p_2(1 - p_2)}{n_2}} \end{align*}\]
Біріктірілген дисперсия
- Біздің нөлдік гипотезамыз \(H_0 болсын: \hat{P}_1 = \hat{P}_2\)
- \(H_0-мен бірдей нәрсе не: \Delta\hat{P} = 0\)
Бұл сондай-ақ \(p_1 = p_2\) дегенді білдіреді, бұл пропорциялардың екеуін де \(p_0\) деп белгілейік. Демек, \(\Delta \hat{P}\) дисперсиясы
\[\begin{align*} var(\Delta \hat{P}) = \frac{p_0(1-p_0)}{n_1} + \frac{p_0(1-p_0)}{n_2}\\ sd(\Delta \hat{P}) = SE = \sqrt{\frac{p_0(1-p_0)}{n_1} + \frac{p_0(1-p_0)}{n_2}} \\ \textrm{where } p_0 = \frac{n_1p_1 + n_2p_2}{n_1 + n_2} \end{align*}\]
Енді барлығын бірге
\[ H_0: \Delta\hat{P} = 0 \]
\[ H_A: \Delta\hat{P} \neq 0 \]
\[ \Delta\hat{P} \sim N(0, \sqrt{\frac{p_0(1-p_0)}{n_1} + \frac{p_0(1-p_0)}{n_2}}) \]
Санайық
\[\begin{align*} p_0 = \frac{p_1+p_2}{2} = \frac{0.23 + 0.08}{2} = 0.155 \\ sd(\Delta \hat{P}) = \sqrt{\frac{2(0.155)(1 - 0.155)}{100}} \approx 0.05 \\ z = \frac{0.15 - 0}{0.05} = 3 \\ P(Z > |3|) \approx 0.02 \end{align*}\]
Ал енді R-де
two_prop_test <-
prop.test(c(23, 8), c(100, 100))
two_prop_test
2-sample test for equality of proportions with continuity correction
data: c(23, 8) out of c(100, 100)
X-squared = 7.4823, df = 1, p-value = 0.006231
alternative hypothesis: two.sided
95 percent confidence interval:
0.0418647 0.2581353
sample estimates:
prop 1 prop 2
0.23 0.08
2-мысал
Бізде кездейсоқ таңдалған 5000 орта мектеп оқушысының үлгісі және олардың ҰБТ нәтижелері бар. Іріктемедегі 2465 ұлдың орташа бағасы 70,5%, ал қыздардың орташа бағасы 72,3% құрайды. Ұлдар мен қыздардың орташа мәндерінің айырмашылығының стандартты қателігі 0,9% құрайды. Бұл деректер қыздардың ҰБТ-да 0,05 маңыздылық деңгейінде ұлдарға қарағанда жақсы нәтиже көрсететініне сенімді дәлел бола ма?
2-мысал
- Гипотезалар
\[ H_{0}: \mu_{girls} = \mu_{boys} \]
\[ H_{A}: \mu_{girls} > \mu_{boys} \]
\[ \textrm{null value} = \mu_{girls} - \mu_{boys} = 0 \]
Нүктелік бағалау \[ \overline{x}_{girls} - \overline{x}_{boys} = 72.3 - 70.5 = 1.8 \]
z-статистикалық және p-мәні \[ z = \frac{1.8}{0.9} = 2 \\ \]
\[ \textrm{ p-мәні } = P(Z > 2|H_0) \approx 0.02 < \alpha = 0.05 \implies \textrm{бас тартамыз } H_0 \]
- Деректер ҰБТ-ның орташа ұпайы қыздардың ұлдарға қарағанда жоғары екенін сенімді түрде дәлелдейді.
Қателер
| Шындық\Шешім | Бас тартпаймыз \(H_{0}\) | бас тартамыз \(H_{0}\) |
|---|---|---|
| \(H_{0}\) шын | OK | I типті қате |
| \(H_{A}\) шын | II типті қате. | OK |
- I типті қате: \(H_{0}\) шын мәнінде дұрыс болған кезде \(H_{0}\) қабылданбайды. Жалған оң
- II типті қате: \(H_{A}\) шын болған кезде \(H_{0}\) қабылданбайды. Жалған теріс.
Мысалдар
- Сотта сіз қылмыс жасамадыңыз (\(H_0\)) немесе жасадыңыз (\(H_A\)).
- I типті қате: “Кінәсізді жазалаңыз”, \(H_{0}\) дұрыс, бірақ біз оны қате түрде жоққа шығарамыз: сіз ештеңе істемедіңіз, бірақ кінәлі деп танылдыңыз.
- II типті қате: “Құтылып кету”, \(H_{A}\) дұрыс, бірақ \(H_{0}\) қабылданбады: сіз қылмыс жасадыңыз, бірақ кінәсіз деп танылып, босатылдыңыз.
- II типті қатенің ықтималдығын қалай азайтуға болады? Және бұл I типті қатенің ықтималдығына қалай әсер етеді?
- II типті қатенің ықтималдығын азайту үшін біз көбірек адамдарды жазалауымыз керек. Біз тым қатал бола аламыз және қылмыстың кез келген белгісін жеткілікті дәлел ретінде қабылдай аламыз.
- Дегенмен, қаталдықты арттыру арқылы біз көбірек кінәсіз адамдарды жазалау қаупін тудырамыз, ал I типті қатенің ықтималдығы артады.
p-мәндері мен қателіктер қалай байланысты?
| Шындық\Шешім | Бас тартпаймыз \(H_{0}\) | Бас тартамыз \(H_{0}\) |
|---|---|---|
| \(H_{0}\) шын | \(1 - \alpha\) | I типті қате, \(\alpha\) |
| \(H_{A}\) шын | II типті қате, \(\beta\) | \(1 - \beta\) |
\(\alpha\) - маңыздылық деңгейі (significance level)
Сенiмдiлiк деңгейi = \(1 - \alpha\)