การทดสอบ T ของนักเรียนสำหรับสูตรตัวอย่างอิสระ การแจกแจงการทดสอบทีของนักเรียนเพื่อทดสอบสมมติฐานเกี่ยวกับค่าเฉลี่ยและคำนวณช่วงความเชื่อมั่นใน MS Excel

แนวทางที่เทียบเท่าในการตีความผลการทดสอบคือการสมมติว่าสมมติฐานว่างเป็นจริง เราสามารถคำนวณได้ว่ามีขนาดใหญ่เพียงใด ความน่าจะเป็นรับ ที- เกณฑ์เท่ากับหรือมากกว่ามูลค่าจริงที่เราคำนวณจากข้อมูลตัวอย่างที่มีอยู่ หากความน่าจะเป็นนี้น้อยกว่าระดับนัยสำคัญที่ยอมรับก่อนหน้านี้ (เช่น P< 0.05), мы вправе отклонить проверяемую нулевую гипотезу. Именно такой подход сегодня используется чаще всего: исследователи приводят в своих работах P-значение, которое легко рассчитывается при помощи статистических программ. Рассмотрим, как это можно сделать в системе R.

สมมติว่าเรามีข้อมูลเกี่ยวกับปริมาณพลังงานที่ได้รับจากอาหารในแต่ละวัน (กิโลจูล/วัน) ของผู้หญิง 11 คน (ตัวอย่างที่นำมาจากหนังสือ Altman D. G. (1981) สถิติเชิงปฏิบัติเพื่อการวิจัยทางการแพทย์, Chapman & Hall, London):


ค่าเฉลี่ยของการสังเกตทั้ง 11 ประการนี้คือ:


คำถาม: ค่าเฉลี่ยตัวอย่างนี้แตกต่างจากค่ามาตรฐานที่กำหนดไว้ที่ 7,725 กิโลจูล/วัน หรือไม่ ความแตกต่างระหว่างค่าตัวอย่างของเรากับมาตรฐานนี้ค่อนข้างมีนัยสำคัญ: 7725 - 6753.6 = 971.4 แต่ความแตกต่างนี้ใหญ่แค่ไหนในเชิงสถิติ? ตัวอย่างเดียวจะช่วยตอบคำถามนี้ ที-ทดสอบ. เช่นเดียวกับตัวเลือกอื่น ๆ ที-test การทดสอบ t หนึ่งตัวอย่างจะดำเนินการใน R โดยใช้ฟังก์ชัน t.test():


คำถาม: ค่าเฉลี่ยเหล่านี้แตกต่างกันทางสถิติหรือไม่ ลองตรวจสอบสมมุติฐานว่าใช้แล้วไม่มีความแตกต่างกัน ที-ทดสอบ:

แต่ในกรณีเช่นนี้ เราจะประเมินการมีอยู่ของผลกระทบจากการแทรกแซงทางสถิติได้อย่างไร โดยทั่วไป การทดสอบ t ของนักเรียนสามารถแสดงเป็น

วิธีนี้ช่วยให้คุณสามารถทดสอบสมมติฐานที่ว่าค่าเฉลี่ยของประชากรทั่วไปสองคนซึ่งนำมาเปรียบเทียบกัน ขึ้นอยู่กับการเลือกที่แตกต่างกัน ข้อสันนิษฐานของการพึ่งพาส่วนใหญ่มักหมายความว่าคุณลักษณะนั้นถูกวัดในกลุ่มตัวอย่างเดียวกันสองครั้ง เช่น ก่อนการแทรกแซงและหลังจากนั้น ในกรณีทั่วไป ตัวแทนแต่ละคนของตัวอย่างหนึ่งจะได้รับมอบหมายตัวแทนจากตัวอย่างอื่น (ซึ่งรวมกันเป็นคู่) เพื่อให้ชุดข้อมูลทั้งสองมีความสัมพันธ์เชิงบวกซึ่งกันและกัน ประเภทการพึ่งพาตัวอย่างที่อ่อนแอกว่า: ตัวอย่างที่ 1 - สามี, ตัวอย่างที่ 2 - ภรรยาของพวกเขา; ตัวอย่างที่ 1 - เด็กอายุ 1 ขวบ ตัวอย่างที่ 2 ประกอบด้วยเด็กแฝดในกลุ่มตัวอย่างที่ 1 เป็นต้น

สมมติฐานทางสถิติที่ทดสอบได้เช่นเดียวกับในกรณีก่อนหน้า H 0: ม 1 = ม 2(ค่าเฉลี่ยในตัวอย่างที่ 1 และ 2 เท่ากัน) หากถูกปฏิเสธ ก็จะยอมรับสมมติฐานทางเลือกนั้น ม.1มากกว่า (น้อยกว่า) ม.2.

สมมติฐานเบื้องต้นสำหรับการทดสอบทางสถิติ:

ตัวแทนแต่ละคนของกลุ่มตัวอย่างหนึ่งราย (จากประชากรทั่วไปรายหนึ่ง) มีความเกี่ยวข้องกับตัวแทนของกลุ่มตัวอย่างอีกรายหนึ่ง (จากประชากรทั่วไปรายอื่น)

ข้อมูลจากทั้งสองตัวอย่างมีความสัมพันธ์เชิงบวก (คู่แบบฟอร์ม)

การกระจายตัวของลักษณะที่ศึกษาในทั้งสองตัวอย่างเป็นไปตามกฎปกติ

โครงสร้างข้อมูลต้นทาง:คุณลักษณะที่ศึกษามีสองค่าสำหรับแต่ละวัตถุ (สำหรับแต่ละคู่)

ข้อจำกัด:การกระจายตัวของลักษณะในทั้งสองตัวอย่างไม่ควรแตกต่างจากปกติอย่างมีนัยสำคัญ ข้อมูลของการวัดสองครั้งที่สอดคล้องกับตัวอย่างหนึ่งและอีกตัวอย่างมีความสัมพันธ์เชิงบวก

ทางเลือก:การทดสอบ Wilcoxon T หากการกระจายตัวของตัวอย่างอย่างน้อยหนึ่งตัวอย่างแตกต่างอย่างมีนัยสำคัญจากปกติ การทดสอบ t-Student สำหรับตัวอย่างอิสระ - หากข้อมูลสำหรับสองตัวอย่างไม่มีความสัมพันธ์กันในทางบวก

สูตรสำหรับค่าเชิงประจักษ์ของการทดสอบของนักเรียนสะท้อนถึงความจริงที่ว่าหน่วยของการวิเคราะห์ความแตกต่างคือ ความแตกต่าง (กะ)ค่าแอตทริบิวต์สำหรับการสังเกตแต่ละคู่ ดังนั้น สำหรับค่าแอตทริบิวต์แต่ละคู่ N จะมีการคำนวณความแตกต่างก่อน d ผม = x 1 ผม - x 2 ผม.

โดยที่ M d คือผลต่างเฉลี่ยของค่า σ d - ส่วนเบี่ยงเบนมาตรฐานของความแตกต่าง

ตัวอย่างการคำนวณ:

สมมติว่าในระหว่างการทดสอบประสิทธิผลของการฝึกอบรม สมาชิกทั้ง 8 คนในกลุ่มถูกถามคำถามว่า “ความคิดเห็นของคุณตรงกับความคิดเห็นของกลุ่มบ่อยแค่ไหน” - สองครั้ง ก่อนและหลังการฝึก มีการใช้มาตราส่วน 10 คะแนนสำหรับการตอบกลับ: 1 - ไม่เคย, 5 - ครึ่งหนึ่งของเวลา, 10 - เสมอ ทดสอบสมมติฐานว่าผลจากการฝึกอบรม ความภาคภูมิใจในตนเองในความสอดคล้อง (ความปรารถนาที่จะเป็นเหมือนคนอื่นๆ ในกลุ่ม) ของผู้เข้าร่วมจะเพิ่มขึ้น (α = 0.05) มาสร้างตารางสำหรับการคำนวณขั้นกลางกัน (ตารางที่ 3)


ตารางที่ 3

ค่าเฉลี่ยเลขคณิตสำหรับผลต่าง M d = (-6)/8 = -0.75 ลบค่านี้ออกจากแต่ละ d (คอลัมน์สุดท้ายของตาราง)

สูตรสำหรับค่าเบี่ยงเบนมาตรฐานแตกต่างเฉพาะตรงที่ d ปรากฏในนั้นแทนที่จะเป็น X เราแทนที่ค่าที่จำเป็นทั้งหมด เราได้รับ:

σ ง = = 0.886

ขั้นตอนที่ 1 คำนวณค่าเชิงประจักษ์ของเกณฑ์โดยใช้สูตร (3): ผลต่างเฉลี่ย นพ= -0.75; ส่วนเบี่ยงเบนมาตรฐาน ซิ ง = 0,886; ที อี = 2,39; df = 7.

ขั้นตอนที่ 2 การใช้ตารางค่าวิกฤตของเกณฑ์ t-Student เราจะกำหนดระดับนัยสำคัญ p สำหรับ ดีเอฟ = 7 ค่าเชิงประจักษ์อยู่ระหว่างค่าวิกฤตสำหรับ = 0.05 และ พี — 0.01. เพราะฉะนั้น, ร< 0,05.

df
0,05 0,01 0,001
2,365 3,499 5,408

ขั้นตอนที่ 3 เราทำการตัดสินใจทางสถิติและกำหนดข้อสรุป สมมติฐานทางสถิติของความเท่าเทียมกันของค่าเฉลี่ยถูกปฏิเสธ สรุป: ตัวบ่งชี้การประเมินตนเองของผู้เข้าร่วมหลังการฝึกอบรมเพิ่มขึ้นอย่างมีนัยสำคัญทางสถิติ (ที่ระดับนัยสำคัญ p< 0,05).

วิธีการแบบพาราเมตริกได้แก่ การเปรียบเทียบความแปรปรวนของสองตัวอย่างตามเกณฑ์เอฟ-ฟิชเชอร์. บางครั้งวิธีนี้นำไปสู่ข้อสรุปที่มีความหมายอันมีคุณค่า และในกรณีของการเปรียบเทียบวิธีการสำหรับตัวอย่างอิสระ การเปรียบเทียบความแปรปรวนก็คือ บังคับขั้นตอน.

เพื่อคำนวณ เอฟเอ็มคุณจำเป็นต้องค้นหาอัตราส่วนของความแปรปรวนของตัวอย่างทั้งสอง และค่าความแปรปรวนที่มากกว่านั้นอยู่ในตัวเศษ และค่าที่น้อยกว่านั้นอยู่ในตัวส่วน

การเปรียบเทียบความแปรปรวน- วิธีการนี้ช่วยให้คุณสามารถทดสอบสมมติฐานที่ว่าความแปรปรวนของประชากรทั่วไปทั้งสองกลุ่มที่ใช้ตัวอย่างที่เปรียบเทียบกันนั้นแตกต่างกัน ทดสอบสมมติฐานทางสถิติ H 0: σ 1 2 = σ 2 2 (ความแปรปรวนในตัวอย่างที่ 1 เท่ากับความแปรปรวนในตัวอย่างที่ 2) หากถูกปฏิเสธ จะยอมรับสมมติฐานทางเลือกว่าความแปรปรวนหนึ่งมากกว่าอีกสมมติฐานหนึ่ง

สมมติฐานเบื้องต้น: สุ่มตัวอย่างสองตัวอย่างจากประชากรที่แตกต่างกันโดยมีการกระจายลักษณะปกติที่กำลังศึกษา

โครงสร้างข้อมูลต้นทาง:ลักษณะที่กำลังศึกษาจะวัดเป็นวัตถุ (วิชา) ซึ่งแต่ละอย่างเป็นของหนึ่งในสองตัวอย่างที่ถูกเปรียบเทียบ

ข้อจำกัด:การกระจายตัวของลักษณะในทั้งสองตัวอย่างไม่มีความแตกต่างจากปกติอย่างมีนัยสำคัญ

วิธีการทางเลือก:การทดสอบของ Levene การใช้งานที่ไม่จำเป็นต้องตรวจสอบสมมติฐานของภาวะปกติ (ใช้ในโปรแกรม SPSS)

สูตรสำหรับค่าเชิงประจักษ์ของการทดสอบ F ของฟิชเชอร์:

(4)

โดยที่ σ 1 2 การกระจายตัวขนาดใหญ่และ σ 2 2 - การกระจายตัวที่น้อยลง เนื่องจากไม่ทราบล่วงหน้าว่าการกระจายตัวใดจะมากกว่า ดังนั้นเพื่อกำหนดระดับ p ที่ใช้ ตารางค่าวิกฤตสำหรับทางเลือกที่ไม่ใช่ทิศทางถ้า F อี > F Kpสำหรับจำนวนองศาอิสระที่สอดคล้องกันแล้ว < 0,05 и статистическую гипотезу о равенстве дисперсий можно отклонить (для α = 0,05).

ตัวอย่างการคำนวณ:

เด็กๆ ได้รับโจทย์ปัญหาทางคณิตศาสตร์เป็นประจำ หลังจากนั้นนักเรียนครึ่งหนึ่งที่ได้รับการสุ่มเลือกจะได้รับแจ้งว่าพวกเขาสอบตก และคนอื่นๆ จะได้รับแจ้งในทางตรงกันข้าม จากนั้นเด็กแต่ละคนจะถูกถามว่าจะใช้เวลากี่วินาทีในการแก้ปัญหาที่คล้ายกัน ผู้ทดลองคำนวณความแตกต่างระหว่างเวลาที่เด็กโทรมาและผลลัพธ์ของงานที่เสร็จสมบูรณ์ (เป็นวินาที) คาดว่าข้อความแห่งความล้มเหลวจะทำให้ความนับถือตนเองของเด็กไม่เพียงพอ สมมติฐานที่ทดสอบ (ที่ระดับ α = 0.005) คือความแปรปรวนของความภาคภูมิใจในตนเองโดยรวมไม่ได้ขึ้นอยู่กับรายงานความสำเร็จหรือความล้มเหลว (H 0: σ 1 2 = σ 2 2)

ได้รับข้อมูลต่อไปนี้:

ขั้นตอนที่ 1 คำนวณค่าเชิงประจักษ์ของเกณฑ์และจำนวนองศาอิสระโดยใช้สูตร (4):

ขั้นตอนที่ 2 ตามตารางค่าวิกฤตของเกณฑ์ฟิชเชอร์ f ไม่ใช่ทิศทางทางเลือกอื่นที่เราพบคุณค่าที่สำคัญสำหรับ หมายเลข df= 11; df รู้= 11 อย่างไรก็ตาม มีเพียงค่าวิกฤตเท่านั้น หมายเลข df= 10 และ df รู้ = 12. ไม่สามารถรับระดับความอิสระจำนวนมากได้ ดังนั้นเราจึงใช้ค่าวิกฤต หมายเลข df= 10: สำหรับ = 0,05 เอฟ เคพี = 3.526; สำหรับ = 0,01 เอฟ เคพี = 5,418.

ขั้นตอนที่ 3 การตัดสินใจทางสถิติและข้อสรุปที่มีความหมาย เนื่องจากค่าเชิงประจักษ์เกินค่าวิกฤตสำหรับ = 0.01 (และมากกว่านั้นสำหรับ พี = 0.05) ในกรณีนี้ p< 0,01 и принимается альтернативная гипо-теза: дисперсия в группе 1 превышает дисперсию в группе 2 (หน้า< 0.01) ด้วยเหตุนี้ หลังจากข้อความเกี่ยวกับความล้มเหลว ความไม่เพียงพอของความภาคภูมิใจในตนเองจึงสูงกว่าข้อความเกี่ยวกับความสำเร็จ

เรื่องราว

เกณฑ์นี้ได้รับการพัฒนาโดย William Gossett เพื่อประเมินคุณภาพเบียร์ที่ Guinness ในส่วนที่เกี่ยวข้องกับพันธกรณีต่อบริษัทเกี่ยวกับการไม่เปิดเผยความลับทางการค้า (ฝ่ายบริหารของกินเนสส์พิจารณาการใช้เครื่องมือทางสถิติในการทำงานเช่นนี้) บทความของ Gosset ได้รับการตีพิมพ์ในปี 1908 ในวารสาร Biometrics โดยใช้นามแฝงว่า "Student"

ข้อกำหนดข้อมูล

หากต้องการใช้เกณฑ์นี้ ข้อมูลต้นฉบับจะต้องมีการแจกแจงแบบปกติ ในกรณีที่ใช้การทดสอบสองตัวอย่างกับตัวอย่างอิสระ จำเป็นต้องปฏิบัติตามเงื่อนไขความเท่าเทียมกันของความแปรปรวนด้วย อย่างไรก็ตาม มีทางเลือกอื่นนอกเหนือจากการทดสอบของนักเรียนสำหรับสถานการณ์ที่มีความแปรปรวนไม่เท่ากัน

การทดสอบทีสองตัวอย่างสำหรับตัวอย่างอิสระ

ในกรณีที่ขนาดตัวอย่างแตกต่างกันเล็กน้อย จะใช้สูตรที่เรียบง่ายสำหรับการคำนวณโดยประมาณ:

หากขนาดตัวอย่างแตกต่างกันอย่างมีนัยสำคัญ จะใช้สูตรที่ซับซ้อนและแม่นยำยิ่งขึ้น:

ที่ไหน 1 , 2 - ค่าเฉลี่ยเลขคณิต, σ 1, σ 2 - ส่วนเบี่ยงเบนมาตรฐาน และ เอ็น 1 ,เอ็น 2 - ขนาดตัวอย่าง

การทดสอบทีสองตัวอย่างสำหรับตัวอย่างที่ต้องพึ่งพา

ในการคำนวณค่าเชิงประจักษ์ของการทดสอบทีในสถานการณ์ของการทดสอบสมมติฐานเกี่ยวกับความแตกต่างระหว่างสองตัวอย่างที่ต้องพึ่งพา (เช่น สองตัวอย่างของการทดสอบเดียวกันที่มีช่วงเวลา) จะใช้สูตรต่อไปนี้:

ที่ไหน คือผลต่างค่าเฉลี่ยของค่า และ σ - ค่าเบี่ยงเบนมาตรฐานของความแตกต่าง

จำนวนองศาความเป็นอิสระคำนวณได้ดังนี้

การทดสอบทีหนึ่งตัวอย่าง

ใช้เพื่อทดสอบสมมติฐานเกี่ยวกับความแตกต่างระหว่างค่าเฉลี่ยและค่าที่ทราบ:

จำนวนองศาความเป็นอิสระคำนวณได้ดังนี้

อะนาล็อกแบบไม่มีพารามิเตอร์

การทดสอบแบบอะนาล็อกของการทดสอบสองตัวอย่างสำหรับตัวอย่างอิสระคือการทดสอบ Mann-Whitney U สำหรับสถานการณ์ที่มีตัวอย่างที่ต้องพึ่งพา อะนาล็อกคือการทดสอบสัญญาณและการทดสอบ Wilcoxon T

การคำนวณแบบทดสอบของนักเรียนโดยอัตโนมัติ


มูลนิธิวิกิมีเดีย

  • 2010.
  • กินเนสส์

อ่างเก็บน้ำธรณีเคมี

    ดูว่า "Student's T-test" ในพจนานุกรมอื่น ๆ คืออะไร:การทดสอบ t-c ของนักเรียน - เกณฑ์นิสิตหรือตค. หรือการทดสอบ S. t เป็นเกณฑ์ทางสถิติสำหรับนัยสำคัญของความแตกต่างระหว่างค่าเฉลี่ยที่เปรียบเทียบ กำหนดโดยอัตราส่วนของความแตกต่างนี้ต่อข้อผิดพลาดของความแตกต่าง: สำหรับค่าของ t... ...

    พันธุศาสตร์ พจนานุกรมสารานุกรมการทดสอบของนักเรียน

    - การทดสอบของนักเรียนเป็นชื่อทั่วไปสำหรับชั้นเรียนของวิธีการทดสอบทางสถิติของสมมติฐาน (การทดสอบทางสถิติ) โดยอิงจากการเปรียบเทียบกับการแจกแจงของนักเรียน กรณีที่พบบ่อยที่สุดของการใช้การทดสอบ t เกี่ยวข้องกับการตรวจสอบความเท่าเทียมกัน... ... Wikipediaการทดสอบของนักเรียน - Stjūdento kriterijus statusas T sritis augalininkystė apibrėžtis Skirtumo tarp dviejų vidurkių patikimumo rodiklis, išreiškiamas skirtumo ir jo paklaidos santykiu. ทัศนคติ: engl. การทดสอบของนักเรียนมาตุภูมิ แบบทดสอบของนักเรียน...

    - การทดสอบของนักเรียนเป็นชื่อทั่วไปสำหรับชั้นเรียนของวิธีการทดสอบทางสถิติของสมมติฐาน (การทดสอบทางสถิติ) โดยอิงจากการเปรียบเทียบกับการแจกแจงของนักเรียน กรณีที่พบบ่อยที่สุดของการใช้การทดสอบ t เกี่ยวข้องกับการตรวจสอบความเท่าเทียมกัน... ... WikipediaŽemės ūkio augalų selekcijos ir sėklininkystės terminų žodynas - การทดสอบทางสถิติซึ่งภายใต้สมมติฐานของสมมติฐานว่าง สถิติที่ใช้สอดคล้องกับการแจกแจงแบบ t (การกระจายตัวของนักเรียน) บันทึก. ตัวอย่างการใช้เกณฑ์นี้ 1. การตรวจสอบความเท่าเทียมกันของค่าเฉลี่ยของ... ...

    พจนานุกรมสถิติสังคมวิทยาเกณฑ์นักเรียน - ตัวบ่งชี้ไบโอเมตริกซ์ของความน่าเชื่อถือของความแตกต่าง (td) ระหว่างค่าเฉลี่ยของสัตว์สองกลุ่มเมื่อเปรียบเทียบกัน (M1 และ M2) สำหรับลักษณะใด ๆ ความน่าเชื่อถือของความแตกต่างถูกกำหนดโดยสูตร: ค่า td ที่ได้จะถูกเปรียบเทียบกับ... ...

    พจนานุกรมสถิติสังคมวิทยา- ประเมินความใกล้ชิดของค่าเฉลี่ยสองค่าจากมุมมองว่าจัดเป็นแบบสุ่มหรือไม่ (ที่ระดับนัยสำคัญที่กำหนด) โดยตอบคำถามว่าค่าเฉลี่ยแตกต่างกันอย่างมีนัยสำคัญทางสถิติจากกันหรือไม่)