แนวทางที่เทียบเท่าในการตีความผลการทดสอบคือการสมมติว่าสมมติฐานว่างเป็นจริง เราสามารถคำนวณได้ว่ามีขนาดใหญ่เพียงใด ความน่าจะเป็นรับ ที- เกณฑ์เท่ากับหรือมากกว่ามูลค่าจริงที่เราคำนวณจากข้อมูลตัวอย่างที่มีอยู่ หากความน่าจะเป็นนี้น้อยกว่าระดับนัยสำคัญที่ยอมรับก่อนหน้านี้ (เช่น P< 0.05), мы вправе отклонить проверяемую нулевую гипотезу. Именно такой подход сегодня используется чаще всего: исследователи приводят в своих работах P-значение, которое легко рассчитывается при помощи статистических программ. Рассмотрим, как это можно сделать в системе R.
สมมติว่าเรามีข้อมูลเกี่ยวกับปริมาณพลังงานที่ได้รับจากอาหารในแต่ละวัน (กิโลจูล/วัน) ของผู้หญิง 11 คน (ตัวอย่างที่นำมาจากหนังสือ Altman D. G. (1981) สถิติเชิงปฏิบัติเพื่อการวิจัยทางการแพทย์, Chapman & Hall, London):
ค่าเฉลี่ยของการสังเกตทั้ง 11 ประการนี้คือ:
คำถาม: ค่าเฉลี่ยตัวอย่างนี้แตกต่างจากค่ามาตรฐานที่กำหนดไว้ที่ 7,725 กิโลจูล/วัน หรือไม่ ความแตกต่างระหว่างค่าตัวอย่างของเรากับมาตรฐานนี้ค่อนข้างมีนัยสำคัญ: 7725 - 6753.6 = 971.4 แต่ความแตกต่างนี้ใหญ่แค่ไหนในเชิงสถิติ? ตัวอย่างเดียวจะช่วยตอบคำถามนี้ ที-ทดสอบ. เช่นเดียวกับตัวเลือกอื่น ๆ ที-test การทดสอบ t หนึ่งตัวอย่างจะดำเนินการใน R โดยใช้ฟังก์ชัน t.test():
คำถาม: ค่าเฉลี่ยเหล่านี้แตกต่างกันทางสถิติหรือไม่ ลองตรวจสอบสมมุติฐานว่าใช้แล้วไม่มีความแตกต่างกัน ที-ทดสอบ:
แต่ในกรณีเช่นนี้ เราจะประเมินการมีอยู่ของผลกระทบจากการแทรกแซงทางสถิติได้อย่างไร โดยทั่วไป การทดสอบ t ของนักเรียนสามารถแสดงเป็น
วิธีนี้ช่วยให้คุณสามารถทดสอบสมมติฐานที่ว่าค่าเฉลี่ยของประชากรทั่วไปสองคนซึ่งนำมาเปรียบเทียบกัน ขึ้นอยู่กับการเลือกที่แตกต่างกัน ข้อสันนิษฐานของการพึ่งพาส่วนใหญ่มักหมายความว่าคุณลักษณะนั้นถูกวัดในกลุ่มตัวอย่างเดียวกันสองครั้ง เช่น ก่อนการแทรกแซงและหลังจากนั้น ในกรณีทั่วไป ตัวแทนแต่ละคนของตัวอย่างหนึ่งจะได้รับมอบหมายตัวแทนจากตัวอย่างอื่น (ซึ่งรวมกันเป็นคู่) เพื่อให้ชุดข้อมูลทั้งสองมีความสัมพันธ์เชิงบวกซึ่งกันและกัน ประเภทการพึ่งพาตัวอย่างที่อ่อนแอกว่า: ตัวอย่างที่ 1 - สามี, ตัวอย่างที่ 2 - ภรรยาของพวกเขา; ตัวอย่างที่ 1 - เด็กอายุ 1 ขวบ ตัวอย่างที่ 2 ประกอบด้วยเด็กแฝดในกลุ่มตัวอย่างที่ 1 เป็นต้น
สมมติฐานทางสถิติที่ทดสอบได้เช่นเดียวกับในกรณีก่อนหน้า H 0: ม 1 = ม 2(ค่าเฉลี่ยในตัวอย่างที่ 1 และ 2 เท่ากัน) หากถูกปฏิเสธ ก็จะยอมรับสมมติฐานทางเลือกนั้น ม.1มากกว่า (น้อยกว่า) ม.2.
สมมติฐานเบื้องต้นสำหรับการทดสอบทางสถิติ:
ตัวแทนแต่ละคนของกลุ่มตัวอย่างหนึ่งราย (จากประชากรทั่วไปรายหนึ่ง) มีความเกี่ยวข้องกับตัวแทนของกลุ่มตัวอย่างอีกรายหนึ่ง (จากประชากรทั่วไปรายอื่น)
ข้อมูลจากทั้งสองตัวอย่างมีความสัมพันธ์เชิงบวก (คู่แบบฟอร์ม)
การกระจายตัวของลักษณะที่ศึกษาในทั้งสองตัวอย่างเป็นไปตามกฎปกติ
โครงสร้างข้อมูลต้นทาง:คุณลักษณะที่ศึกษามีสองค่าสำหรับแต่ละวัตถุ (สำหรับแต่ละคู่)
ข้อจำกัด:การกระจายตัวของลักษณะในทั้งสองตัวอย่างไม่ควรแตกต่างจากปกติอย่างมีนัยสำคัญ ข้อมูลของการวัดสองครั้งที่สอดคล้องกับตัวอย่างหนึ่งและอีกตัวอย่างมีความสัมพันธ์เชิงบวก
ทางเลือก:การทดสอบ Wilcoxon T หากการกระจายตัวของตัวอย่างอย่างน้อยหนึ่งตัวอย่างแตกต่างอย่างมีนัยสำคัญจากปกติ การทดสอบ t-Student สำหรับตัวอย่างอิสระ - หากข้อมูลสำหรับสองตัวอย่างไม่มีความสัมพันธ์กันในทางบวก
สูตรสำหรับค่าเชิงประจักษ์ของการทดสอบของนักเรียนสะท้อนถึงความจริงที่ว่าหน่วยของการวิเคราะห์ความแตกต่างคือ ความแตกต่าง (กะ)ค่าแอตทริบิวต์สำหรับการสังเกตแต่ละคู่ ดังนั้น สำหรับค่าแอตทริบิวต์แต่ละคู่ N จะมีการคำนวณความแตกต่างก่อน d ผม = x 1 ผม - x 2 ผม.
โดยที่ M d คือผลต่างเฉลี่ยของค่า σ d - ส่วนเบี่ยงเบนมาตรฐานของความแตกต่าง
ตัวอย่างการคำนวณ:
สมมติว่าในระหว่างการทดสอบประสิทธิผลของการฝึกอบรม สมาชิกทั้ง 8 คนในกลุ่มถูกถามคำถามว่า “ความคิดเห็นของคุณตรงกับความคิดเห็นของกลุ่มบ่อยแค่ไหน” - สองครั้ง ก่อนและหลังการฝึก มีการใช้มาตราส่วน 10 คะแนนสำหรับการตอบกลับ: 1 - ไม่เคย, 5 - ครึ่งหนึ่งของเวลา, 10 - เสมอ ทดสอบสมมติฐานว่าผลจากการฝึกอบรม ความภาคภูมิใจในตนเองในความสอดคล้อง (ความปรารถนาที่จะเป็นเหมือนคนอื่นๆ ในกลุ่ม) ของผู้เข้าร่วมจะเพิ่มขึ้น (α = 0.05) มาสร้างตารางสำหรับการคำนวณขั้นกลางกัน (ตารางที่ 3)
ตารางที่ 3
ค่าเฉลี่ยเลขคณิตสำหรับผลต่าง M d = (-6)/8 = -0.75 ลบค่านี้ออกจากแต่ละ d (คอลัมน์สุดท้ายของตาราง)
สูตรสำหรับค่าเบี่ยงเบนมาตรฐานแตกต่างเฉพาะตรงที่ d ปรากฏในนั้นแทนที่จะเป็น X เราแทนที่ค่าที่จำเป็นทั้งหมด เราได้รับ:
σ ง = = 0.886
ขั้นตอนที่ 1 คำนวณค่าเชิงประจักษ์ของเกณฑ์โดยใช้สูตร (3): ผลต่างเฉลี่ย นพ= -0.75; ส่วนเบี่ยงเบนมาตรฐาน ซิ ง = 0,886; ที อี = 2,39; df = 7.
ขั้นตอนที่ 2 การใช้ตารางค่าวิกฤตของเกณฑ์ t-Student เราจะกำหนดระดับนัยสำคัญ p สำหรับ ดีเอฟ = 7 ค่าเชิงประจักษ์อยู่ระหว่างค่าวิกฤตสำหรับ ร= 0.05 และ พี — 0.01. เพราะฉะนั้น, ร< 0,05.
df | ร | ||
0,05 | 0,01 | 0,001 | |
2,365 | 3,499 | 5,408 |
ขั้นตอนที่ 3 เราทำการตัดสินใจทางสถิติและกำหนดข้อสรุป สมมติฐานทางสถิติของความเท่าเทียมกันของค่าเฉลี่ยถูกปฏิเสธ สรุป: ตัวบ่งชี้การประเมินตนเองของผู้เข้าร่วมหลังการฝึกอบรมเพิ่มขึ้นอย่างมีนัยสำคัญทางสถิติ (ที่ระดับนัยสำคัญ p< 0,05).
วิธีการแบบพาราเมตริกได้แก่ การเปรียบเทียบความแปรปรวนของสองตัวอย่างตามเกณฑ์เอฟ-ฟิชเชอร์. บางครั้งวิธีนี้นำไปสู่ข้อสรุปที่มีความหมายอันมีคุณค่า และในกรณีของการเปรียบเทียบวิธีการสำหรับตัวอย่างอิสระ การเปรียบเทียบความแปรปรวนก็คือ บังคับขั้นตอน.
เพื่อคำนวณ เอฟเอ็มคุณจำเป็นต้องค้นหาอัตราส่วนของความแปรปรวนของตัวอย่างทั้งสอง และค่าความแปรปรวนที่มากกว่านั้นอยู่ในตัวเศษ และค่าที่น้อยกว่านั้นอยู่ในตัวส่วน
การเปรียบเทียบความแปรปรวน- วิธีการนี้ช่วยให้คุณสามารถทดสอบสมมติฐานที่ว่าความแปรปรวนของประชากรทั่วไปทั้งสองกลุ่มที่ใช้ตัวอย่างที่เปรียบเทียบกันนั้นแตกต่างกัน ทดสอบสมมติฐานทางสถิติ H 0: σ 1 2 = σ 2 2 (ความแปรปรวนในตัวอย่างที่ 1 เท่ากับความแปรปรวนในตัวอย่างที่ 2) หากถูกปฏิเสธ จะยอมรับสมมติฐานทางเลือกว่าความแปรปรวนหนึ่งมากกว่าอีกสมมติฐานหนึ่ง
สมมติฐานเบื้องต้น: สุ่มตัวอย่างสองตัวอย่างจากประชากรที่แตกต่างกันโดยมีการกระจายลักษณะปกติที่กำลังศึกษา
โครงสร้างข้อมูลต้นทาง:ลักษณะที่กำลังศึกษาจะวัดเป็นวัตถุ (วิชา) ซึ่งแต่ละอย่างเป็นของหนึ่งในสองตัวอย่างที่ถูกเปรียบเทียบ
ข้อจำกัด:การกระจายตัวของลักษณะในทั้งสองตัวอย่างไม่มีความแตกต่างจากปกติอย่างมีนัยสำคัญ
วิธีการทางเลือก:การทดสอบของ Levene การใช้งานที่ไม่จำเป็นต้องตรวจสอบสมมติฐานของภาวะปกติ (ใช้ในโปรแกรม SPSS)
สูตรสำหรับค่าเชิงประจักษ์ของการทดสอบ F ของฟิชเชอร์:
(4)
โดยที่ σ 1 2 — การกระจายตัวขนาดใหญ่และ σ 2 2 - การกระจายตัวที่น้อยลง เนื่องจากไม่ทราบล่วงหน้าว่าการกระจายตัวใดจะมากกว่า ดังนั้นเพื่อกำหนดระดับ p ที่ใช้ ตารางค่าวิกฤตสำหรับทางเลือกที่ไม่ใช่ทิศทางถ้า F อี > F Kpสำหรับจำนวนองศาอิสระที่สอดคล้องกันแล้ว ร< 0,05 и статистическую гипотезу о равенстве дисперсий можно отклонить (для α = 0,05).
ตัวอย่างการคำนวณ:
เด็กๆ ได้รับโจทย์ปัญหาทางคณิตศาสตร์เป็นประจำ หลังจากนั้นนักเรียนครึ่งหนึ่งที่ได้รับการสุ่มเลือกจะได้รับแจ้งว่าพวกเขาสอบตก และคนอื่นๆ จะได้รับแจ้งในทางตรงกันข้าม จากนั้นเด็กแต่ละคนจะถูกถามว่าจะใช้เวลากี่วินาทีในการแก้ปัญหาที่คล้ายกัน ผู้ทดลองคำนวณความแตกต่างระหว่างเวลาที่เด็กโทรมาและผลลัพธ์ของงานที่เสร็จสมบูรณ์ (เป็นวินาที) คาดว่าข้อความแห่งความล้มเหลวจะทำให้ความนับถือตนเองของเด็กไม่เพียงพอ สมมติฐานที่ทดสอบ (ที่ระดับ α = 0.005) คือความแปรปรวนของความภาคภูมิใจในตนเองโดยรวมไม่ได้ขึ้นอยู่กับรายงานความสำเร็จหรือความล้มเหลว (H 0: σ 1 2 = σ 2 2)
ได้รับข้อมูลต่อไปนี้:
ขั้นตอนที่ 1 คำนวณค่าเชิงประจักษ์ของเกณฑ์และจำนวนองศาอิสระโดยใช้สูตร (4):
ขั้นตอนที่ 2 ตามตารางค่าวิกฤตของเกณฑ์ฟิชเชอร์ f ไม่ใช่ทิศทางทางเลือกอื่นที่เราพบคุณค่าที่สำคัญสำหรับ หมายเลข df= 11; df รู้= 11 อย่างไรก็ตาม มีเพียงค่าวิกฤตเท่านั้น หมายเลข df= 10 และ df รู้ = 12. ไม่สามารถรับระดับความอิสระจำนวนมากได้ ดังนั้นเราจึงใช้ค่าวิกฤต หมายเลข df= 10: สำหรับ ร= 0,05 เอฟ เคพี = 3.526; สำหรับ ร= 0,01 เอฟ เคพี = 5,418.
ขั้นตอนที่ 3 การตัดสินใจทางสถิติและข้อสรุปที่มีความหมาย เนื่องจากค่าเชิงประจักษ์เกินค่าวิกฤตสำหรับ ร= 0.01 (และมากกว่านั้นสำหรับ พี = 0.05) ในกรณีนี้ p< 0,01 и принимается альтернативная гипо-теза: дисперсия в группе 1 превышает дисперсию в группе 2 (หน้า< 0.01) ด้วยเหตุนี้ หลังจากข้อความเกี่ยวกับความล้มเหลว ความไม่เพียงพอของความภาคภูมิใจในตนเองจึงสูงกว่าข้อความเกี่ยวกับความสำเร็จ
เรื่องราว
เกณฑ์นี้ได้รับการพัฒนาโดย William Gossett เพื่อประเมินคุณภาพเบียร์ที่ Guinness ในส่วนที่เกี่ยวข้องกับพันธกรณีต่อบริษัทเกี่ยวกับการไม่เปิดเผยความลับทางการค้า (ฝ่ายบริหารของกินเนสส์พิจารณาการใช้เครื่องมือทางสถิติในการทำงานเช่นนี้) บทความของ Gosset ได้รับการตีพิมพ์ในปี 1908 ในวารสาร Biometrics โดยใช้นามแฝงว่า "Student"
ข้อกำหนดข้อมูล
หากต้องการใช้เกณฑ์นี้ ข้อมูลต้นฉบับจะต้องมีการแจกแจงแบบปกติ ในกรณีที่ใช้การทดสอบสองตัวอย่างกับตัวอย่างอิสระ จำเป็นต้องปฏิบัติตามเงื่อนไขความเท่าเทียมกันของความแปรปรวนด้วย อย่างไรก็ตาม มีทางเลือกอื่นนอกเหนือจากการทดสอบของนักเรียนสำหรับสถานการณ์ที่มีความแปรปรวนไม่เท่ากัน
การทดสอบทีสองตัวอย่างสำหรับตัวอย่างอิสระ
ในกรณีที่ขนาดตัวอย่างแตกต่างกันเล็กน้อย จะใช้สูตรที่เรียบง่ายสำหรับการคำนวณโดยประมาณ:
หากขนาดตัวอย่างแตกต่างกันอย่างมีนัยสำคัญ จะใช้สูตรที่ซับซ้อนและแม่นยำยิ่งขึ้น:
ที่ไหน ม 1 ,ม 2 - ค่าเฉลี่ยเลขคณิต, σ 1, σ 2 - ส่วนเบี่ยงเบนมาตรฐาน และ เอ็น 1 ,เอ็น 2 - ขนาดตัวอย่าง
การทดสอบทีสองตัวอย่างสำหรับตัวอย่างที่ต้องพึ่งพา
ในการคำนวณค่าเชิงประจักษ์ของการทดสอบทีในสถานการณ์ของการทดสอบสมมติฐานเกี่ยวกับความแตกต่างระหว่างสองตัวอย่างที่ต้องพึ่งพา (เช่น สองตัวอย่างของการทดสอบเดียวกันที่มีช่วงเวลา) จะใช้สูตรต่อไปนี้:
ที่ไหน ม งคือผลต่างค่าเฉลี่ยของค่า และ σ ง- ค่าเบี่ยงเบนมาตรฐานของความแตกต่าง
จำนวนองศาความเป็นอิสระคำนวณได้ดังนี้
การทดสอบทีหนึ่งตัวอย่าง
ใช้เพื่อทดสอบสมมติฐานเกี่ยวกับความแตกต่างระหว่างค่าเฉลี่ยและค่าที่ทราบ:
จำนวนองศาความเป็นอิสระคำนวณได้ดังนี้
อะนาล็อกแบบไม่มีพารามิเตอร์
การทดสอบแบบอะนาล็อกของการทดสอบสองตัวอย่างสำหรับตัวอย่างอิสระคือการทดสอบ Mann-Whitney U สำหรับสถานการณ์ที่มีตัวอย่างที่ต้องพึ่งพา อะนาล็อกคือการทดสอบสัญญาณและการทดสอบ Wilcoxon T
การคำนวณแบบทดสอบของนักเรียนโดยอัตโนมัติ
มูลนิธิวิกิมีเดีย
- 2010.
- กินเนสส์
อ่างเก็บน้ำธรณีเคมี
ดูว่า "Student's T-test" ในพจนานุกรมอื่น ๆ คืออะไร:การทดสอบ t-c ของนักเรียน - เกณฑ์นิสิตหรือตค. หรือการทดสอบ S. t เป็นเกณฑ์ทางสถิติสำหรับนัยสำคัญของความแตกต่างระหว่างค่าเฉลี่ยที่เปรียบเทียบ กำหนดโดยอัตราส่วนของความแตกต่างนี้ต่อข้อผิดพลาดของความแตกต่าง: สำหรับค่าของ t... ...
พันธุศาสตร์ พจนานุกรมสารานุกรมการทดสอบของนักเรียน
- การทดสอบของนักเรียนเป็นชื่อทั่วไปสำหรับชั้นเรียนของวิธีการทดสอบทางสถิติของสมมติฐาน (การทดสอบทางสถิติ) โดยอิงจากการเปรียบเทียบกับการแจกแจงของนักเรียน กรณีที่พบบ่อยที่สุดของการใช้การทดสอบ t เกี่ยวข้องกับการตรวจสอบความเท่าเทียมกัน... ... Wikipediaการทดสอบของนักเรียน - Stjūdento kriterijus statusas T sritis augalininkystė apibrėžtis Skirtumo tarp dviejų vidurkių patikimumo rodiklis, išreiškiamas skirtumo ir jo paklaidos santykiu. ทัศนคติ: engl. การทดสอบของนักเรียนมาตุภูมิ แบบทดสอบของนักเรียน...
- การทดสอบของนักเรียนเป็นชื่อทั่วไปสำหรับชั้นเรียนของวิธีการทดสอบทางสถิติของสมมติฐาน (การทดสอบทางสถิติ) โดยอิงจากการเปรียบเทียบกับการแจกแจงของนักเรียน กรณีที่พบบ่อยที่สุดของการใช้การทดสอบ t เกี่ยวข้องกับการตรวจสอบความเท่าเทียมกัน... ... WikipediaŽemės ūkio augalų selekcijos ir sėklininkystės terminų žodynas - การทดสอบทางสถิติซึ่งภายใต้สมมติฐานของสมมติฐานว่าง สถิติที่ใช้สอดคล้องกับการแจกแจงแบบ t (การกระจายตัวของนักเรียน) บันทึก. ตัวอย่างการใช้เกณฑ์นี้ 1. การตรวจสอบความเท่าเทียมกันของค่าเฉลี่ยของ... ...
พจนานุกรมสถิติสังคมวิทยาเกณฑ์นักเรียน - ตัวบ่งชี้ไบโอเมตริกซ์ของความน่าเชื่อถือของความแตกต่าง (td) ระหว่างค่าเฉลี่ยของสัตว์สองกลุ่มเมื่อเปรียบเทียบกัน (M1 และ M2) สำหรับลักษณะใด ๆ ความน่าเชื่อถือของความแตกต่างถูกกำหนดโดยสูตร: ค่า td ที่ได้จะถูกเปรียบเทียบกับ... ...
พจนานุกรมสถิติสังคมวิทยา- ประเมินความใกล้ชิดของค่าเฉลี่ยสองค่าจากมุมมองว่าจัดเป็นแบบสุ่มหรือไม่ (ที่ระดับนัยสำคัญที่กำหนด) โดยตอบคำถามว่าค่าเฉลี่ยแตกต่างกันอย่างมีนัยสำคัญทางสถิติจากกันหรือไม่)