การกำหนดความสำคัญของผลลัพธ์ระหว่างกัน ความน่าเชื่อถือและนัยสำคัญทางสถิติ

ความน่าเชื่อถือทางสถิติถือเป็นสิ่งสำคัญในการฝึกคำนวณของ FCC ก่อนหน้านี้ก็มีข้อสังเกตจากที่เดียวกัน ประชากรสามารถเลือกได้หลายตัวอย่าง:

หากเลือกอย่างถูกต้องตัวบ่งชี้เฉลี่ยและตัวบ่งชี้ของประชากรทั่วไปจะแตกต่างกันเล็กน้อยจากขนาดของข้อผิดพลาดในการเป็นตัวแทนโดยคำนึงถึงความน่าเชื่อถือที่ยอมรับได้

หากเลือกจากประชากรที่แตกต่างกัน ความแตกต่างระหว่างพวกเขาจะกลายเป็นเรื่องสำคัญ สถิติเป็นเรื่องเกี่ยวกับการเปรียบเทียบตัวอย่าง

หากพวกเขาแตกต่างกันอย่างไม่มีนัยสำคัญ ไม่มีหลักการ ไม่มีนัยสำคัญ กล่าวคือ จริงๆ แล้วพวกเขาอยู่ในประชากรทั่วไปกลุ่มเดียวกัน ความแตกต่างระหว่างพวกเขาเรียกว่าไม่น่าเชื่อถือทางสถิติ

มีความน่าเชื่อถือทางสถิติ ความแตกต่างของกลุ่มตัวอย่างคือกลุ่มตัวอย่างที่แตกต่างกันอย่างมีนัยสำคัญและเป็นพื้นฐาน กล่าวคือ เป็นของกลุ่มประชากรทั่วไปที่แตกต่างกัน

ที่ FCC การประเมินนัยสำคัญทางสถิติของความแตกต่างของตัวอย่างหมายถึงการแก้เซต ปัญหาในทางปฏิบัติ- เช่น การแนะนำวิธีการสอน โปรแกรม ชุดแบบฝึกหัด แบบทดสอบใหม่ๆ การออกกำลังกายควบคุมมีความเกี่ยวข้องกับการทดสอบเชิงทดลอง ซึ่งควรแสดงให้เห็นว่ากลุ่มการทดสอบมีความแตกต่างจากกลุ่มควบคุมโดยพื้นฐาน จึงมีความพิเศษ วิธีการทางสถิติเรียกว่าเกณฑ์ที่มีนัยสำคัญทางสถิติ ซึ่งช่วยให้เราสามารถตรวจจับการมีอยู่หรือไม่มีความแตกต่างที่มีนัยสำคัญทางสถิติระหว่างตัวอย่างได้

เกณฑ์ทั้งหมดแบ่งออกเป็นสองกลุ่ม: แบบอิงพารามิเตอร์และแบบไม่มีพารามิเตอร์ เกณฑ์พาราเมตริกกำหนดให้ต้องมีกฎหมายการแจกแจงแบบปกติ เช่น นี่หมายถึงการกำหนดตัวบ่งชี้หลักของกฎหมายปกติ - ค่าเฉลี่ย ปริมาณเลขคณิตและค่าเบี่ยงเบนมาตรฐาน s เกณฑ์พาราเมตริกมีความแม่นยำและถูกต้องที่สุด การทดสอบแบบไม่อิงพารามิเตอร์จะขึ้นอยู่กับความแตกต่างอันดับ (ลำดับ) ระหว่างองค์ประกอบตัวอย่าง

ต่อไปนี้เป็นเกณฑ์หลักสำหรับนัยสำคัญทางสถิติที่ใช้ในการฝึก FCC: การทดสอบของนักเรียนและการทดสอบของฟิชเชอร์

การทดสอบของนักเรียนตั้งชื่อตามนักวิทยาศาสตร์ชาวอังกฤษ K. Gosset (นักเรียน - นามแฝง) ผู้ค้นพบ วิธีนี้- การทดสอบของนักเรียนเป็นแบบพาราเมตริกและใช้สำหรับการเปรียบเทียบ ตัวชี้วัดที่แน่นอนตัวอย่าง ตัวอย่างอาจมีขนาดแตกต่างกัน

การทดสอบของนักเรียน ถูกกำหนดเช่นนี้

1. ค้นหาแบบทดสอบ Student โดยใช้สูตรต่อไปนี้:


ค่าเฉลี่ยเลขคณิตของกลุ่มตัวอย่างที่เปรียบเทียบอยู่ที่ไหน เสื้อ 1, เสื้อ 2 - ข้อผิดพลาดของการเป็นตัวแทนที่ระบุบนพื้นฐานของตัวบ่งชี้ของกลุ่มตัวอย่างที่เปรียบเทียบ

2. การฝึกฝนที่ FCC แสดงให้เห็นว่าสำหรับงานกีฬาก็เพียงพอที่จะยอมรับความน่าเชื่อถือของบัญชี P = 0.95

ความน่าเชื่อถือในการนับ: P = 0.95 (a = 0.05) พร้อมจำนวนองศาอิสระ

k = n 1 + n 2 - 2 จากตารางในภาคผนวก 4 เราค้นหาค่าของค่าขีด จำกัด ของเกณฑ์ ( ทีกรัม).

3. ขึ้นอยู่กับคุณสมบัติของกฎการกระจายแบบปกติ เกณฑ์ของนักเรียนจะเปรียบเทียบ t และ t gr

เราได้ข้อสรุป:

ถ้า t t gr ความแตกต่างระหว่างตัวอย่างที่เปรียบเทียบนั้นมีนัยสำคัญทางสถิติ

หากไม่ได้หมายความว่าความแตกต่างนั้นไม่มีนัยสำคัญทางสถิติ

สำหรับนักวิจัยในสาขา FCS การประเมินนัยสำคัญทางสถิติเป็นขั้นตอนแรกในการแก้ปัญหาเฉพาะเจาะจง ไม่ว่าตัวอย่างที่เปรียบเทียบจะมีความแตกต่างกันโดยพื้นฐานหรือไม่ก็ตาม ขั้นตอนต่อไปคือการประเมินความแตกต่างนี้ด้วย จุดการสอนการมองเห็นซึ่งถูกกำหนดโดยเงื่อนไขของปัญหา

ลองพิจารณาการประยุกต์ใช้แบบทดสอบนักเรียนโดยใช้ตัวอย่างเฉพาะ

ตัวอย่างที่ 2.14 กลุ่มตัวอย่าง 18 คนได้รับการประเมินอัตราการเต้นของหัวใจ (bpm) ก่อน x i และหลัง ใช่แล้วอุ่นเครื่อง

ประเมินประสิทธิผลของการวอร์มอัพตามอัตราการเต้นของหัวใจ ข้อมูลเบื้องต้นและการคำนวณแสดงไว้ในตาราง 2.30 และ 2.31 น.

ตารางที่ 2.30

การประมวลผลตัวบ่งชี้อัตราการเต้นของหัวใจก่อนอบอุ่นร่างกาย


ข้อผิดพลาดของทั้งสองกลุ่มเกิดขึ้นพร้อมกันเนื่องจากขนาดตัวอย่างเท่ากัน (ศึกษากลุ่มเดียวกันที่ เงื่อนไขที่แตกต่างกัน) และค่าเฉลี่ย ส่วนเบี่ยงเบนมาตรฐานเท่ากับ s x = s y = 3 ครั้ง/นาที มาดูการกำหนดการทดสอบของนักเรียนกันดีกว่า:

เราตั้งค่าความน่าเชื่อถือของบัญชี: P = 0.95

จำนวนองศาอิสระ k 1 = n 1 + n 2 - 2 = 18 + 18-2 = 34 จากตารางในภาคผนวก 4 เราพบ ทีกรัม= 2,02.

การอนุมานทางสถิติ เนื่องจาก t = 11.62 และขอบเขต t gr = 2.02 จากนั้น 11.62 > 2.02 เช่น t > t gr ดังนั้นความแตกต่างระหว่างกลุ่มตัวอย่างจึงมีนัยสำคัญทางสถิติ

ข้อสรุปการสอน พบว่าในแง่ของอัตราการเต้นของหัวใจ ความแตกต่างระหว่างสถานะของกลุ่มก่อนและหลังการอบอุ่นร่างกายมีนัยสำคัญทางสถิติ กล่าวคือ สำคัญและเป็นพื้นฐาน ดังนั้น จากตัวบ่งชี้อัตราการเต้นของหัวใจ เราสามารถสรุปได้ว่าการวอร์มอัพมีประสิทธิผล

เกณฑ์ฟิชเชอร์เป็นพารามิเตอร์ ใช้ในการเปรียบเทียบอัตราการกระจายตัวของตัวอย่าง ซึ่งมักจะหมายถึงการเปรียบเทียบในแง่ของความเสถียรของประสิทธิภาพการกีฬาหรือความเสถียรของตัวบ่งชี้การทำงานและทางเทคนิคในทางปฏิบัติ วัฒนธรรมทางกายภาพและกีฬา ตัวอย่างอาจมีขนาดแตกต่างกัน

เกณฑ์ฟิชเชอร์ถูกกำหนดตามลำดับต่อไปนี้

1. ค้นหาเกณฑ์ฟิชเชอร์ F โดยใช้สูตร


โดยที่ คือความแปรปรวนของกลุ่มตัวอย่างที่เปรียบเทียบ

เงื่อนไขของเกณฑ์ฟิชเชอร์กำหนดไว้ในตัวเศษของสูตร เอฟ มีการกระจายตัวมากเช่น จำนวน F จะมากกว่าหนึ่งเสมอ

เราตั้งค่าความน่าเชื่อถือของการนับ: P = 0.95 - และกำหนดจำนวนองศาอิสระสำหรับทั้งสองตัวอย่าง: k 1 = n 1 - 1, k 2 = n 2 - 1

เมื่อใช้ตารางในภาคผนวก 4 เราจะค้นหาค่าขีดจำกัดของเกณฑ์ F กรัม.

การเปรียบเทียบเกณฑ์ F และ F กรัมช่วยให้เราสามารถสรุปได้:

ถ้า F > F gr ความแตกต่างระหว่างกลุ่มตัวอย่างจะมีนัยสำคัญทางสถิติ

ถ้า F< F гр, то различие между выборками статически недо­стоверно.

ลองยกตัวอย่างที่เฉพาะเจาะจง

ตัวอย่าง 2.15. มาวิเคราะห์ผู้เล่นแฮนด์บอลสองกลุ่ม: x ฉัน (หมายเลข 1= 16 คน) และ y (p 2 = 18 คน) นักกีฬากลุ่มเหล่านี้ได้รับการศึกษาเกี่ยวกับเวลาขึ้นเครื่องเมื่อขว้างลูกบอลเข้าประตู

ตัวบ่งชี้แรงผลักเป็นประเภทเดียวกันหรือไม่?

ข้อมูลเบื้องต้นและการคำนวณพื้นฐานแสดงไว้ในตาราง 2.32 และ 2.33

ตารางที่ 2.32

การประมวลผลตัวบ่งชี้การขับไล่ของผู้เล่นแฮนด์บอลกลุ่มแรก


ให้เรากำหนดเกณฑ์ฟิชเชอร์:





ตามข้อมูลที่นำเสนอในตารางภาคผนวก 6 เราพบ Fgr: Fgr = 2.4

ให้เราใส่ใจกับความจริงที่ว่าในตารางภาคผนวก 6 จำนวนระดับความเป็นอิสระของการกระจายทั้งที่มากขึ้นและน้อยกว่านั้นแสดงไว้เมื่อเข้าใกล้ จำนวนมากรุนแรงขึ้น ดังนั้นจำนวนองศาความเป็นอิสระของการกระจายตัวที่มากขึ้นตามลำดับนี้: 8, 9, 10, 11, 12, 14, 16, 20, 24 เป็นต้น และอันที่เล็กกว่า - 28, 29, 30, 40 , 50 ฯลฯ ง.

สิ่งนี้อธิบายได้จากข้อเท็จจริงที่ว่าเมื่อขนาดตัวอย่างเพิ่มขึ้น ความแตกต่างในการทดสอบ F จะลดลง และคุณสามารถใช้ค่าแบบตารางที่ใกล้เคียงกับข้อมูลต้นฉบับได้ ดังนั้น ในตัวอย่างนี้ไม่มี 2.15 =17 และเราสามารถใช้ค่าที่ใกล้เคียงที่สุดกับมัน k = 16 ซึ่งเราจะได้ Fgr = 2.4

การอนุมานทางสถิติ เนื่องจากการทดสอบของฟิชเชอร์ F= 2.5 > F= 2.4 ตัวอย่างจึงสามารถแยกแยะได้อย่างมีนัยสำคัญทางสถิติ

ข้อสรุปการสอน ค่าของเวลาออกตัวเมื่อโยนบอลเข้าประตูสำหรับผู้เล่นแฮนด์บอลของทั้งสองกลุ่มแตกต่างกันอย่างมีนัยสำคัญ กลุ่มเหล่านี้ควรได้รับการพิจารณาที่แตกต่างกัน

การวิจัยเพิ่มเติมควรเปิดเผยสาเหตุของความแตกต่างนี้

ตัวอย่าง 2.20.(เกี่ยวกับความน่าเชื่อถือทางสถิติของกลุ่มตัวอย่าง - คุณสมบัติของนักฟุตบอลจะดีขึ้นหรือไม่หากเวลาจากการให้สัญญาณในการเตะบอลในช่วงเริ่มต้นการฝึกคือ x i และในตอนท้าย y i

ข้อมูลเบื้องต้นและการคำนวณพื้นฐานแสดงไว้ในตาราง 2.40 และ 2.41

ตารางที่ 2.40

ตัวบ่งชี้เวลาในการประมวลผลจากการให้สัญญาณในการตีลูกบอลเมื่อเริ่มการฝึกซ้อม


ให้เราพิจารณาความแตกต่างระหว่างกลุ่มตัวบ่งชี้โดยใช้เกณฑ์ของนักเรียน:

ด้วยความน่าเชื่อถือ P = 0.95 และองศาอิสระ k = n 1 + n 2 - 2 = 22 + 22 - 2 = 42 โดยใช้ตารางในภาคผนวก 4 เราพบ ทีกรัม= 2.02. เนื่องจาก t = 8.3 > ทีกรัม= 2.02 - ความแตกต่างมีนัยสำคัญทางสถิติ

ให้เราพิจารณาความแตกต่างระหว่างกลุ่มตัวบ่งชี้โดยใช้เกณฑ์ของฟิชเชอร์:


ตามตารางในภาคผนวก 2 โดยมีความน่าเชื่อถือ P = 0.95 และองศาอิสระ k = 22-1 = 21 ค่า F gr = 21 เนื่องจาก F = 1.53< F гр = = 2,1, различие в рассеивании исходных данных статистически недостоверно.

การอนุมานทางสถิติ ตามค่าเฉลี่ยเลขคณิต ความแตกต่างระหว่างกลุ่มของตัวบ่งชี้มีนัยสำคัญทางสถิติ ในแง่ของการกระจายตัว (dispersion) ความแตกต่างระหว่างกลุ่มของตัวบ่งชี้นั้นไม่น่าเชื่อถือทางสถิติ

บทสรุปการสอนคุณสมบัติของนักฟุตบอลได้รับการปรับปรุงอย่างมีนัยสำคัญ แต่ควรให้ความสนใจกับความมั่นคงของคำให้การของเขา

การเตรียมงาน

ก่อนหน้านี้ งานห้องปฏิบัติการในระเบียบวินัย” มาตรวิทยาการกีฬา» ถึงนักเรียนทุกคน กลุ่มการศึกษามีความจำเป็นต้องจัดตั้งทีมงานจำนวน 3-4 คนในแต่ละกลุ่มเพื่อร่วมกันมอบหมายงานงานห้องปฏิบัติการทั้งหมดให้เสร็จสิ้น

ในการเตรียมงาน อ่านส่วนที่เกี่ยวข้องของวรรณกรรมที่แนะนำ (ดูหัวข้อที่ 6 ของข้อมูล คำแนะนำระเบียบวิธี) และบันทึกการบรรยาย ศึกษาส่วนที่ 1 และ 2 สำหรับงานในห้องปฏิบัติการนี้ ตลอดจนการมอบหมายงาน (ส่วนที่ 4)

เตรียมแบบฟอร์มรายงานบนกระดาษเขียนขนาด A4 มาตรฐาน และเติมวัสดุที่จำเป็นสำหรับการทำงาน

โดยในรายงานจะต้องมี :

หน้าแรกโดยระบุแผนก (UC และ TR) กลุ่มการศึกษา นามสกุล ชื่อจริง นามสกุลของนักศึกษา หมายเลขและชื่อผลงานห้องปฏิบัติการ วันที่ทำเสร็จ ตลอดจนนามสกุล วุฒิการศึกษาตำแหน่งทางวิชาการและตำแหน่งอาจารย์ที่รับเข้าทำงาน

วัตถุประสงค์ของงาน

สูตรด้วย ค่าตัวเลขอธิบายผลการคำนวณขั้นกลางและขั้นสุดท้าย

ตารางค่าที่วัดและคำนวณได้

วัสดุกราฟิกที่จำเป็นสำหรับงาน;

ข้อสรุปโดยย่อขึ้นอยู่กับผลลัพธ์ของแต่ละขั้นตอนของการมอบหมายงานและโดยทั่วไปเกี่ยวกับงานที่ทำ

กราฟและตารางทั้งหมดถูกวาดอย่างระมัดระวังโดยใช้เครื่องมือวาดภาพ สัญลักษณ์กราฟิกและตัวอักษรทั่วไปต้องเป็นไปตาม GOST อนุญาตให้จัดทำรายงานโดยใช้เทคโนโลยีคอมพิวเตอร์ได้

การมอบหมายงาน

ก่อนที่จะดำเนินการวัดทั้งหมด สมาชิกในทีมแต่ละคนจะต้องศึกษากฎการใช้งาน เกมกีฬาลูกดอกที่ให้ไว้ในภาคผนวก 7 ซึ่งจำเป็นสำหรับการดำเนินการวิจัยในขั้นตอนต่อไปนี้

ระยะที่ 1 ของการวิจัย“การศึกษาผลการตีเข้าเป้าของเกมกีฬาปาเป้าโดยสมาชิกแต่ละคนในทีมเพื่อความสอดคล้อง กฎหมายปกติการกระจายตามเกณฑ์ χ 2เพียร์สันและ เกณฑ์สามซิกม่า"

1. วัด (ทดสอบ) ความเร็ว (ส่วนตัว) ของคุณและการประสานงานของการกระทำ โดยปาลูกดอก 30-40 ครั้งไปที่เป้าหมายวงกลมในเกมกีฬาปาเป้า

2. ผลการวัด (การทดสอบ) x ฉัน(สวมแว่น) จัดเรียงตามแบบ ซีรีย์การเปลี่ยนแปลงและเข้าไปในตารางที่ 4.1 (คอลัมน์ , ทำทั้งหมด การคำนวณที่จำเป็นกรอกตารางที่จำเป็นและสรุปผลที่เหมาะสมเกี่ยวกับการปฏิบัติตามที่ได้รับ การกระจายเชิงประจักษ์กฎการกระจายแบบปกติ โดยการเปรียบเทียบกับการคำนวณ ตาราง และข้อสรุปที่คล้ายกันของตัวอย่าง 2.12 ซึ่งให้ไว้ในส่วนที่ 2 ของแนวทางเหล่านี้ในหน้า 7 -10

ตารางที่ 4.1

ความสอดคล้องของความเร็วและการประสานงานของการกระทำของอาสาสมัครกับกฎหมายการกระจายแบบปกติ

เลขที่ โค้งมน
ทั้งหมด

II – ขั้นตอนการวิจัย

“การประเมินตัวบ่งชี้เฉลี่ยของประชากรทั่วไปในการโจมตีเป้าหมายของเกมกีฬาปาเป้าของนักเรียนทุกคนในกลุ่มเรียนโดยพิจารณาจากผลการวัดของสมาชิกของทีมเดียว”

ประเมินตัวบ่งชี้เฉลี่ยของความเร็วและการประสานงานของการกระทำของนักเรียนทุกคนในกลุ่มการศึกษา (ตามรายชื่อกลุ่มการศึกษาในนิตยสารชั้นเรียน) ตามผลการตีเป้าหมายปาเป้าของสมาชิกในทีมทั้งหมดที่ได้รับในระยะแรก ของงานวิจัยในห้องปฏิบัติการนี้

1. บันทึกผลการวัดความเร็วและการประสานงานของการกระทำ เมื่อขว้างปาเป้าไปที่เป้าหมายวงกลมในเกมกีฬา ปาเป้าของสมาชิกทุกคนในทีมของคุณ (2 - 4 คน) ซึ่งเป็นตัวอย่างผลการวัดจากประชากรทั่วไป (ผลการวัดของนักเรียนทุกคนในกลุ่มเรียน - เช่น จำนวน 15 คน) โดยระบุในคอลัมน์ที่สองและสาม ตารางที่ 4.2

ตารางที่ 4.2

ตัวชี้วัดการประมวลผลความเร็วและการประสานงานของการกระทำ

สมาชิกกองพลน้อย

เลขที่
ทั้งหมด

ในตาราง 4.2 ภายใต้ ควรจะเข้าใจ , คะแนนเฉลี่ยที่ตรงกัน (ดูผลการคำนวณในตารางที่ 4.1) สมาชิกในทีมของคุณ ( , ได้รับในขั้นตอนแรกของการวิจัย ควรสังเกตว่า ตามกฎแล้ว ตาราง 4.2 ประกอบด้วยค่าเฉลี่ยที่คำนวณได้ของผลการวัดที่ได้รับโดยสมาชิกหนึ่งคนในทีมในขั้นตอนแรกของการวิจัย เนื่องจากความน่าจะเป็นที่จะผลการวัด สมาชิกต่างๆกลุ่มจะเล็กมาก แล้ว, ตามกฎแล้วค่าต่างๆ ในคอลัมน์ ตารางที่ 4.2 สำหรับแต่ละแถว - เท่ากับ 1 ในบรรทัด “ยอดรวม " คอลัมน์ " " ถูกเขียน จำนวนสมาชิกในทีมของคุณ

2. ทำการคำนวณที่จำเป็นทั้งหมดเพื่อกรอกตาราง 4.2 รวมถึงการคำนวณและข้อสรุปอื่น ๆ ที่คล้ายกับการคำนวณและข้อสรุปของตัวอย่าง 2.13 ที่ให้ไว้ในส่วนที่ 2 ของสิ่งนี้ การพัฒนาระเบียบวิธีในหน้า 13-14. ควรคำนึงถึงเมื่อคำนวณข้อผิดพลาดในการเป็นตัวแทน "ม" มีความจำเป็นต้องใช้สูตร 2.4 ที่ให้ไว้ในหน้า 13 ของการพัฒนาวิธีการนี้เนื่องจากกลุ่มตัวอย่างมีขนาดเล็ก (n และจำนวนองค์ประกอบของประชากรทั่วไป N เป็นที่รู้จักและเท่ากับจำนวนนักเรียนในกลุ่มการศึกษา ตามรายชื่อวารสารของกลุ่มศึกษา

III – ขั้นตอนการวิจัย

การประเมินประสิทธิผลของการวอร์มอัพตามตัวบ่งชี้ “ความเร็วและการประสานงานของการกระทำ” โดยสมาชิกในทีมแต่ละคนโดยใช้แบบทดสอบของนักเรียน

เพื่อประเมินประสิทธิผลของการวอร์มอัพสำหรับการขว้างลูกดอกไปยังเป้าหมายของเกมกีฬา "ปาเป้า" ซึ่งดำเนินการในขั้นตอนแรกของการวิจัยของงานในห้องปฏิบัติการนี้โดยสมาชิกแต่ละคนในทีมตามตัวบ่งชี้ "ความเร็วและ การประสานงานของการกระทำ" โดยใช้เกณฑ์ของนักเรียน - เกณฑ์พาราเมตริกสำหรับความน่าเชื่อถือทางสถิติของกฎการกระจายเชิงประจักษ์กับกฎการกระจายแบบปกติ

… ทั้งหมด

2. ความแตกต่าง และอาร์เอ็มเอส , ผลการวัดตัวบ่งชี้ “ความเร็วและการประสานงานของการกระทำ” ตามผลการวอร์มอัพ, กำหนดไว้ในตาราง 4.3 (ดูการคำนวณที่คล้ายกันที่ให้ไว้ทันทีหลังจากตาราง 2.30 ของตัวอย่าง 2.14 ในหน้า 16 ของการพัฒนาวิธีการนี้)

3. ทีมงานแต่ละคน วัด (ทดสอบ) ความเร็ว (ส่วนตัว) และการประสานงานของคุณหลังจากวอร์มอัพ

… ทั้งหมด

5. ทำการคำนวณโดยเฉลี่ย ความแตกต่าง และอาร์เอ็มเอส ,ผลการวัดของตัวบ่งชี้ "ความเร็วและการประสานงานของการกระทำ" หลังจากการอุ่นเครื่อง กำหนดไว้ในตาราง 4.4 เขียนผลการวัดโดยรวมตามผลการอุ่นเครื่อง (ดูการคำนวณที่คล้ายกันที่ให้ไว้ทันทีหลังจากตาราง 2.31 ของตัวอย่าง 2.14 ในหน้า 17 ของการพัฒนาวิธีการนี้)

6. ทำการคำนวณและข้อสรุปที่จำเป็นทั้งหมดคล้ายกับการคำนวณและข้อสรุปของตัวอย่างที่ 2.14 ที่ให้ไว้ในส่วนที่ 2 ของการพัฒนาวิธีการนี้ในหน้า 16-17 ควรคำนึงถึงเมื่อคำนวณข้อผิดพลาดในการเป็นตัวแทน "ม" จำเป็นต้องใช้สูตร 2.1 ที่ให้ไว้ในหน้า 12 ของการพัฒนาวิธีการนี้เนื่องจากตัวอย่างคือ n และจำนวนองค์ประกอบในประชากร N ( ไม่ทราบ

IV – ขั้นตอนการวิจัย

การประเมินความสม่ำเสมอ (ความมั่นคง) ของตัวบ่งชี้ "ความเร็วและการประสานงานของการกระทำ" ของสมาชิกในทีมสองคนโดยใช้เกณฑ์ฟิชเชอร์

ประเมินความสม่ำเสมอ (ความเสถียร) ของตัวบ่งชี้ "ความเร็วและการประสานงานของการกระทำ" ของสมาชิกในทีมสองคนโดยใช้เกณฑ์ฟิชเชอร์ตามผลการวัดที่ได้รับในขั้นตอนที่สามของการวิจัยในงานห้องปฏิบัติการนี้

ในการทำเช่นนี้คุณต้องทำสิ่งต่อไปนี้

การใช้ข้อมูลจากตาราง 4.3 และ 4.4 ผลลัพธ์ของการคำนวณความแปรปรวนจากตารางเหล่านี้ที่ได้รับในขั้นตอนที่สามของการวิจัยตลอดจนวิธีการคำนวณและการใช้เกณฑ์ฟิชเชอร์เพื่อประเมินความสม่ำเสมอ (ความเสถียร) การแสดงกีฬาให้ไว้ในตัวอย่างที่ 2.15 ในหน้า 18-19 ของการพัฒนาระเบียบวิธีวิจัยนี้ ให้สรุปผลทางสถิติและการสอนที่เหมาะสม

V – ขั้นตอนการวิจัย

การประเมินกลุ่มตัวบ่งชี้ “ความเร็วและการประสานงานของการกระทำ” ของสมาชิกในทีมหนึ่งคนก่อนและหลังการวอร์มอัพ

ในตารางผลลัพธ์การคำนวณทางสถิติในรายวิชาอนุปริญญาและวิทยานิพนธ์ปริญญาโทสาขาจิตวิทยาตัวบ่งชี้ "p" จะปรากฏอยู่เสมอ

เช่นตาม วัตถุประสงค์การวิจัยคำนวณความแตกต่างในระดับความหมายในชีวิตของเด็กชายและเด็กหญิงวัยรุ่น

ค่าเฉลี่ย

การทดสอบแมนน์-วิทนีย์ยู

ระดับนัยสำคัญทางสถิติ (p)

เด็กผู้ชาย (20 คน)

สาวๆ

(5 คน)

เป้าหมาย

28,9

35,2

17,5

0,027*

กระบวนการ

30,1

32,0

38,5

0,435

ผลลัพธ์

25,2

29,0

29,5

0,164

สถานที่ควบคุม - "ฉัน"

20,3

23,6

0,067

สถานที่แห่งการควบคุม - "ชีวิต"

30,4

33,8

27,5

0,126

ชีวิตที่มีความหมาย

98,9

111,2

0,103

* - ความแตกต่างมีนัยสำคัญทางสถิติ (หน้า0,05)

คอลัมน์ด้านขวาแสดงค่าของ "p" และด้วยค่าของมันเองที่ทำให้สามารถระบุได้ว่าความแตกต่างในความหมายของชีวิตในอนาคตระหว่างเด็กชายและเด็กหญิงนั้นมีความสำคัญหรือไม่ กฎนั้นง่าย:

  • หากระดับนัยสำคัญทางสถิติ “p” น้อยกว่าหรือเท่ากับ 0.05 เราจะสรุปได้ว่าความแตกต่างมีนัยสำคัญ ในตารางด้านล่าง ความแตกต่างระหว่างเด็กชายและเด็กหญิงมีความสำคัญเมื่อเทียบกับตัวบ่งชี้ “เป้าหมาย” ซึ่งก็คือความหมายของชีวิตในอนาคต สำหรับเด็กผู้หญิง ตัวบ่งชี้นี้สูงกว่าเด็กผู้ชายอย่างมีนัยสำคัญทางสถิติ
  • หากระดับนัยสำคัญทางสถิติ “p” มากกว่า 0.05 แสดงว่าความแตกต่างไม่มีนัยสำคัญ ในตารางด้านล่าง ความแตกต่างระหว่างเด็กชายและเด็กหญิงไม่มีนัยสำคัญสำหรับตัวบ่งชี้อื่นๆ ทั้งหมด ยกเว้นตัวบ่งชี้แรก

ระดับนัยสำคัญทางสถิติ “p” มาจากไหน?

มีการคำนวณระดับนัยสำคัญทางสถิติ โปรแกรมทางสถิติพร้อมทั้งการคำนวณ เกณฑ์ทางสถิติ- ในโปรแกรมเหล่านี้ คุณยังสามารถกำหนดขีดจำกัดวิกฤติสำหรับระดับนัยสำคัญทางสถิติได้ และตัวบ่งชี้ที่เกี่ยวข้องจะถูกเน้นโดยโปรแกรม

ตัวอย่างเช่น ในโปรแกรม STATISTICA เมื่อคำนวณความสัมพันธ์ คุณสามารถตั้งค่าขีดจำกัด "p" ได้ เช่น 0.05 และความสัมพันธ์ที่มีนัยสำคัญทางสถิติทั้งหมดจะถูกเน้นด้วยสีแดง

หากคำนวณเกณฑ์ทางสถิติด้วยตนเอง ระดับนัยสำคัญ "p" จะถูกกำหนดโดยการเปรียบเทียบค่าของเกณฑ์ผลลัพธ์กับค่าวิกฤต

ระดับนัยสำคัญทางสถิติ “p” แสดงระดับใด

การคำนวณทางสถิติทั้งหมดเป็นการประมาณการ ระดับของการประมาณนี้กำหนด "p" ระดับนัยสำคัญเขียนว่า ทศนิยมเช่น 0.023 หรือ 0.965 หากเราคูณตัวเลขนี้ด้วย 100 เราจะได้ตัวบ่งชี้ p เป็นเปอร์เซ็นต์: 2.3% และ 96.5% เปอร์เซ็นต์เหล่านี้สะท้อนถึงความน่าจะเป็นของสมมติฐานของเราเกี่ยวกับความสัมพันธ์ระหว่าง เช่น ความก้าวร้าวและความวิตกกังวลที่ไม่ถูกต้อง

นั่นคือ ค่าสัมประสิทธิ์สหสัมพันธ์ระหว่างความก้าวร้าวและความวิตกกังวลได้ 0.58 ที่ระดับนัยสำคัญทางสถิติ 0.05 หรือความน่าจะเป็นของข้อผิดพลาด 5% สิ่งนี้หมายความว่าอย่างไร?

ความสัมพันธ์ที่เราระบุหมายความว่าในกลุ่มตัวอย่างของเรามีการสังเกตรูปแบบต่อไปนี้ ยิ่งความก้าวร้าวสูงเท่าใด ความวิตกกังวลก็จะยิ่งสูงขึ้นเท่านั้น นั่นคือถ้าเราพาวัยรุ่นสองคนและคนหนึ่งมีความวิตกกังวลสูงกว่าอีกคนหนึ่ง เมื่อรู้ถึงความสัมพันธ์เชิงบวกแล้วเราสามารถพูดได้ว่าวัยรุ่นคนนี้ก็จะมีความก้าวร้าวมากขึ้นเช่นกัน แต่เนื่องจากทุกอย่างในสถิติเป็นเพียงการประมาณ ดังนั้นการระบุสิ่งนี้จึงยอมรับว่าเราอาจเข้าใจผิด และความน่าจะเป็นของข้อผิดพลาดคือ 5% นั่นคือเมื่อทำการเปรียบเทียบ 20 ครั้งในกลุ่มวัยรุ่นกลุ่มนี้ เราสามารถทำผิดพลาดได้เพียงครั้งเดียวในการทำนายระดับความก้าวร้าวโดยรู้ถึงความวิตกกังวล

นัยสำคัญทางสถิติระดับใดดีกว่า: 0.01 หรือ 0.05

ระดับนัยสำคัญทางสถิติสะท้อนถึงความน่าจะเป็นของข้อผิดพลาด ดังนั้นผลลัพธ์ที่ p=0.01 จึงแม่นยำมากกว่าที่ p=0.05

ใน การวิจัยทางจิตวิทยายอมรับสอง ระดับที่อนุญาตนัยสำคัญทางสถิติของผลลัพธ์:

p=0.01 - ผลลัพธ์มีความน่าเชื่อถือสูง การวิเคราะห์เปรียบเทียบหรือการวิเคราะห์ความสัมพันธ์

p=0.05 - ความแม่นยำเพียงพอ

ฉันหวังว่าบทความนี้จะช่วยให้คุณเขียนบทความจิตวิทยาได้ด้วยตัวเอง หากคุณต้องการความช่วยเหลือโปรดติดต่อเรา (งานจิตวิทยาทุกประเภท, การคำนวณทางสถิติ)

ก่อนที่จะรวบรวมและศึกษาข้อมูล นักจิตวิทยาเชิงทดลองมักจะตัดสินใจว่าข้อมูลจะถูกวิเคราะห์ทางสถิติอย่างไร บ่อยครั้งที่ผู้วิจัยกำหนดระดับนัยสำคัญไว้ดังนี้ ค่าสถิติสูงกว่า ( หรือต่ำกว่า) ซึ่งมีค่าที่ทำให้เราสามารถพิจารณาอิทธิพลของปัจจัยที่ไม่สุ่มได้ นักวิจัยมักจะเป็นตัวแทนของระดับนี้ในรูปแบบของการแสดงออกที่น่าจะเป็น

ในหลาย ๆ การทดลองทางจิตวิทยาก็สามารถแสดงเป็น " ระดับ 0.05" หรือ " ระดับ 0.01- ซึ่งหมายความว่าผลลัพธ์แบบสุ่มจะเกิดขึ้นตามความถี่เท่านั้น 0.05 (1 ครั้ง)หรือ 0.01 (1 ใน 100 ครั้ง)- ผลลัพธ์ การวิเคราะห์ทางสถิติข้อมูลที่ตรงตามเกณฑ์ที่กำหนดไว้ล่วงหน้า ( ไม่ว่าจะเป็น 0.05, 0.01 หรือ 0.001)ถูกอ้างถึงด้านล่างว่ามีนัยสำคัญทางสถิติ

ควรสังเกตว่าผลลัพธ์อาจไม่มีนัยสำคัญทางสถิติ แต่ยังคงเป็นที่สนใจอยู่บ้าง บ่อยครั้งโดยเฉพาะอย่างยิ่งในการศึกษาเบื้องต้นหรือการทดลองที่เกี่ยวข้องกับกลุ่มตัวอย่างจำนวนน้อยหรือมีข้อสังเกตจำนวนจำกัด ผลลัพธ์อาจไม่ถึงระดับนัยสำคัญทางสถิติ แต่แนะนำว่า การวิจัยเพิ่มเติมด้วยการควบคุมที่แม่นยำยิ่งขึ้นและ มากกว่าการสังเกตจะทำให้ได้รับความน่าเชื่อถือมากขึ้น ในเวลาเดียวกัน ผู้ทดลองจะต้องระมัดระวังอย่างมากในความปรารถนาที่จะเปลี่ยนแปลงเงื่อนไขการทดลองอย่างตั้งใจเพื่อที่จะบรรลุผลสำเร็จ ผลลัพธ์ที่ต้องการค่าใช้จ่ายใดๆ

ในอีกตัวอย่างหนึ่งของแผน 2x2 จิ ใช้วิชาสองประเภทและงานสองประเภทเพื่อศึกษาอิทธิพลของความรู้เฉพาะทางต่อการท่องจำข้อมูล

ในการวิจัยของเขา จิ ศึกษาการจำตัวเลขและตัวหมากรุก ( ตัวแปร ก) เด็ก ๆ บนเก้าอี้ RECARO ยังสปอร์ตและผู้ใหญ่ ( ตัวแปร B) กล่าวคือ ตามแผน 2x2 เด็กอายุ 10 ขวบและเก่งหมากรุก ในขณะที่ผู้ใหญ่ยังใหม่กับเกมนี้ ในภารกิจแรก คุณต้องจดจำตำแหน่งของชิ้นส่วนบนกระดาน เนื่องจากอาจเป็นในระหว่างเกมปกติ และเรียกคืนชิ้นส่วนนั้นหลังจากถอดชิ้นส่วนออกแล้ว อีกส่วนหนึ่งของงานนี้จำเป็นต้องจำชุดตัวเลขมาตรฐาน ดังที่มักทำเมื่อพิจารณา IQ

ปรากฎว่า ความรู้เฉพาะทางเช่นการเรียนเล่นหมากรุกทำให้จำข้อมูลที่เกี่ยวข้องกับสาขานี้ได้ง่ายขึ้น แต่มีผลเพียงเล็กน้อยต่อการจำตัวเลข ผู้ใหญ่ที่ไม่มีปัญญามากจนเกินไป เกมที่เก่าแก่ที่สุดจำตัวเลขได้น้อยลง แต่จำตัวเลขได้สำเร็จมากกว่า

ในข้อความของรายงาน จิ ให้การวิเคราะห์ทางสถิติที่ตรวจสอบผลลัพธ์ที่นำเสนอทางคณิตศาสตร์

การออกแบบ 2x2 เป็นการออกแบบแฟกทอเรียลที่ง่ายที่สุด การเพิ่มจำนวนปัจจัยหรือระดับของแต่ละปัจจัยจะเพิ่มความซับซ้อนของแผนเหล่านี้อย่างมาก

คุณสมบัติที่ต้องชำระเงินคุณลักษณะนัยสำคัญทางสถิติมีเฉพาะในแผนที่เลือกเท่านั้น ตรวจสอบว่าอยู่ใน.

คุณสามารถดูได้ว่าคำตอบที่ได้รับมีความแตกต่างที่มีนัยสำคัญทางสถิติหรือไม่ กลุ่มต่างๆผู้ตอบแบบสอบถาม หากต้องการใช้คุณลักษณะนัยสำคัญทางสถิติใน SurveyMonkey คุณต้อง:

  • เปิดใช้งานคุณลักษณะนัยสำคัญทางสถิติเมื่อเพิ่มกฎการเปรียบเทียบให้กับคำถามในแบบสำรวจของคุณ เลือกกลุ่มผู้ตอบแบบสอบถามเพื่อเปรียบเทียบเพื่อจัดเรียงผลการสำรวจเป็นกลุ่มเพื่อการเปรียบเทียบด้วยภาพ
  • ตรวจสอบตารางที่มีข้อมูลเกี่ยวกับคำถามในแบบสำรวจของคุณเพื่อระบุการมีอยู่ของข้อมูลทางสถิติ ความแตกต่างที่สำคัญในคำตอบที่ได้รับจาก กลุ่มต่างๆผู้ตอบแบบสอบถาม

ดูนัยสำคัญทางสถิติ

โดยทำตามขั้นตอนด้านล่าง คุณสามารถสร้างแบบสำรวจที่แสดงได้ นัยสำคัญทางสถิติ.

1. เพิ่มคำถามปลายปิดในแบบสำรวจของคุณ

เพื่อแสดงนัยสำคัญทางสถิติเมื่อวิเคราะห์ผลลัพธ์ คุณจะต้องใช้กฎการเปรียบเทียบกับคำถามใดๆ ในแบบสำรวจของคุณ

คุณสามารถใช้กฎการเปรียบเทียบและคำนวณนัยสำคัญทางสถิติในการตอบสนอง หากคุณใช้ข้อใดข้อหนึ่งต่อไปนี้ในการออกแบบแบบสำรวจของคุณ: ประเภทต่อไปนี้คำถาม:

จำเป็นต้องตรวจสอบให้แน่ใจว่าตัวเลือกคำตอบที่เสนอสามารถแบ่งออกเป็นกลุ่มได้ครบถ้วน ตัวเลือกการตอบสนองที่คุณเลือกสำหรับการเปรียบเทียบเมื่อคุณสร้างกฎการเปรียบเทียบจะถูกใช้เพื่อจัดระเบียบข้อมูลลงในครอสแท็บตลอดทั้งแบบสำรวจ

2. รวบรวมคำตอบ

เมื่อคุณทำแบบสำรวจเสร็จแล้ว ให้สร้างตัวรวบรวมเพื่อแจกจ่าย มีหลายวิธี

คุณต้องได้รับการตอบกลับอย่างน้อย 30 รายการสำหรับแต่ละตัวเลือกการตอบกลับที่คุณวางแผนจะใช้ในกฎการเปรียบเทียบเพื่อเปิดใช้งานและดูนัยสำคัญทางสถิติ

ตัวอย่างการสำรวจ

คุณต้องการค้นหาว่าผู้ชายพอใจกับผลิตภัณฑ์ของคุณมากกว่าผู้หญิงอย่างมีนัยสำคัญหรือไม่

  1. เพิ่มคำถามแบบเลือกตอบสองข้อในแบบสำรวจของคุณ:
    เพศของคุณคืออะไร? (ชาย, หญิง)
    คุณพอใจหรือไม่พอใจกับผลิตภัณฑ์ของเรา? (พอใจ, ไม่พอใจ)
  2. ตรวจสอบให้แน่ใจว่าผู้ตอบแบบสอบถามอย่างน้อย 30 รายเลือก "ชาย" สำหรับคำถามเรื่องเพศ และผู้ตอบแบบสอบถามอย่างน้อย 30 รายเลือก "หญิง" เป็นเพศ
  3. เพิ่มกฎการเปรียบเทียบให้กับคำถาม "คุณเพศอะไร" และเลือกทั้งสองตัวเลือกเป็นกลุ่มของคุณ
  4. ใช้ตารางข้อมูลด้านล่างแผนภูมิคำถาม "คุณพอใจหรือไม่พอใจกับผลิตภัณฑ์ของเรา" เพื่อดูว่าตัวเลือกการตอบสนองใดๆ แสดงความแตกต่างที่มีนัยสำคัญทางสถิติหรือไม่

ความแตกต่างที่มีนัยสำคัญทางสถิติคืออะไร?

ความแตกต่างที่มีนัยสำคัญทางสถิติหมายความว่าการวิเคราะห์ทางสถิติได้กำหนดว่ามีความแตกต่างที่มีนัยสำคัญระหว่างคำตอบของผู้ตอบแบบสอบถามกลุ่มหนึ่งและคำตอบของกลุ่มอื่น นัยสำคัญทางสถิติหมายความว่าตัวเลขที่ได้รับแตกต่างกันอย่างมีนัยสำคัญ ความรู้ดังกล่าวจะช่วยคุณในการวิเคราะห์ข้อมูลได้อย่างมาก อย่างไรก็ตาม คุณเป็นผู้กำหนดความสำคัญของผลลัพธ์ที่ได้รับ คุณเป็นผู้ตัดสินใจว่าจะตีความผลการสำรวจอย่างไร และควรดำเนินการอย่างไรโดยพิจารณาจากผลลัพธ์เหล่านั้น

ตัวอย่างเช่น คุณได้รับการร้องเรียนจากลูกค้าผู้หญิงมากกว่าลูกค้าผู้ชาย เราจะทราบได้อย่างไรว่าความแตกต่างดังกล่าวมีจริงหรือไม่ และจำเป็นต้องดำเนินการอย่างไร หนึ่งใน วิธีที่ดีในการตรวจสอบข้อสังเกตของคุณคือการสำรวจที่จะแสดงให้คุณเห็นว่าผู้ซื้อที่เป็นผู้ชายพอใจกับผลิตภัณฑ์ของคุณมากกว่าหรือไม่ โดยการใช้ สูตรทางสถิติฟังก์ชันนัยสำคัญทางสถิติที่เรานำเสนอจะช่วยให้คุณสามารถระบุได้ว่าผลิตภัณฑ์ของคุณดึงดูดผู้ชายมากกว่าผู้หญิงหรือไม่ ซึ่งจะทำให้คุณสามารถดำเนินการตามข้อเท็จจริงมากกว่าการคาดเดา

ความแตกต่างที่มีนัยสำคัญทางสถิติ

หากผลลัพธ์ของคุณถูกเน้นไว้ในตารางข้อมูล แสดงว่าผู้ตอบแบบสอบถามทั้งสองกลุ่มมีความแตกต่างกันอย่างมาก คำว่า “นัยสำคัญ” ไม่ได้หมายความว่าตัวเลขผลลัพธ์มีความสำคัญหรือนัยสำคัญใดๆ เฉพาะเจาะจง เพียงแต่ว่ามีความแตกต่างทางสถิติระหว่างตัวเลขเหล่านั้นเท่านั้น

ไม่มีความแตกต่างที่มีนัยสำคัญทางสถิติ

หากผลลัพธ์ของคุณไม่ได้ถูกเน้นในตารางข้อมูลที่เกี่ยวข้อง ก็หมายความว่าเป็นเช่นนั้น ความแตกต่างที่เป็นไปได้ในการเปรียบเทียบตัวเลขทั้งสองนั้น ไม่มีความแตกต่างทางสถิติระหว่างกัน

การตอบสนองที่ไม่มีความแตกต่างที่มีนัยสำคัญทางสถิติแสดงให้เห็นว่าไม่มีความแตกต่างที่มีนัยสำคัญระหว่างสองรายการที่ถูกเปรียบเทียบเมื่อพิจารณาจากขนาดตัวอย่างที่คุณใช้ แต่ไม่ได้หมายความว่ารายการเหล่านั้นไม่มีนัยสำคัญเสมอไป บางทีด้วยการเพิ่มขนาดตัวอย่าง คุณจะสามารถระบุความแตกต่างที่มีนัยสำคัญทางสถิติได้

ขนาดตัวอย่าง

หากคุณมีขนาดตัวอย่างที่น้อยมาก เฉพาะความแตกต่างที่มากระหว่างทั้งสองกลุ่มเท่านั้นที่จะมีความสำคัญ หากคุณมีขนาดตัวอย่างที่ใหญ่มาก ความแตกต่างทั้งเล็กและใหญ่จะถูกนับว่ามีนัยสำคัญ

อย่างไรก็ตาม การที่ตัวเลขสองตัวมีความแตกต่างกันทางสถิติไม่ได้หมายความว่าความแตกต่างระหว่างผลลัพธ์จะสร้างความแตกต่างให้กับคุณแต่อย่างใด ความสำคัญในทางปฏิบัติ- คุณจะต้องตัดสินใจด้วยตัวเองว่าความแตกต่างใดที่มีความหมายต่อแบบสำรวจของคุณ

การคำนวณนัยสำคัญทางสถิติ

เราคำนวณนัยสำคัญทางสถิติโดยใช้ระดับความเชื่อมั่น 95% มาตรฐาน ถ้าตัวเลือกคำตอบแสดงเป็นนัยสำคัญทางสถิติ หมายความว่าโดยบังเอิญเพียงอย่างเดียวหรือเนื่องจากข้อผิดพลาดในการสุ่มตัวอย่าง มีความน่าจะเป็นน้อยกว่า 5% ของความแตกต่างระหว่างสองกลุ่มที่เกิดขึ้น (มักแสดงเป็น: p<0,05).

ในการคำนวณความแตกต่างที่มีนัยสำคัญทางสถิติระหว่างกลุ่ม เราใช้สูตรต่อไปนี้:

พารามิเตอร์

คำอธิบาย

ก1เปอร์เซ็นต์ของผู้เข้าร่วมจากกลุ่มแรกที่ตอบคำถามด้วยวิธีใดวิธีหนึ่ง คูณด้วยขนาดกลุ่มตัวอย่างของกลุ่มนี้
ข1เปอร์เซ็นต์ของผู้เข้าร่วมจากกลุ่มที่สองที่ตอบคำถามด้วยวิธีใดวิธีหนึ่ง คูณด้วยขนาดกลุ่มตัวอย่างของกลุ่มนี้
สัดส่วนตัวอย่างรวม (p)การรวมกันของสองหุ้นจากทั้งสองกลุ่ม
ข้อผิดพลาดมาตรฐาน (SE)ตัวบ่งชี้ว่าหุ้นของคุณแตกต่างจากหุ้นจริงมากน้อยเพียงใด ค่าที่ต่ำกว่าหมายถึงเศษส่วนนั้นใกล้เคียงกับเศษส่วนจริง ค่าที่สูงกว่าหมายความว่าเศษส่วนนั้นแตกต่างจากเศษส่วนจริงอย่างมาก
สถิติการทดสอบ (t)สถิติการทดสอบ จำนวนค่าเบี่ยงเบนมาตรฐานซึ่งค่าที่กำหนดแตกต่างจากค่าเฉลี่ย
นัยสำคัญทางสถิติหากค่าสัมบูรณ์ของสถิติการทดสอบมากกว่า 1.96* ส่วนเบี่ยงเบนมาตรฐานจากค่าเฉลี่ย จะถือว่ามีความแตกต่างที่มีนัยสำคัญทางสถิติ

*1.96 คือค่าที่ใช้สำหรับระดับความเชื่อมั่น 95% เนื่องจาก 95% ของช่วงที่ฟังก์ชันการแจกแจงแบบ t ของนักเรียนจัดการอยู่ภายในค่าเบี่ยงเบนมาตรฐาน 1.96 ของค่าเฉลี่ย

ตัวอย่างการคำนวณ

จากตัวอย่างที่ใช้ข้างต้น มาดูกันว่าเปอร์เซ็นต์ของผู้ชายที่กล่าวว่าตนพอใจกับผลิตภัณฑ์ของคุณนั้นสูงกว่าเปอร์เซ็นต์ของผู้หญิงอย่างมีนัยสำคัญหรือไม่

สมมติว่าผู้ชาย 1,000 คนและผู้หญิง 1,000 คนมีส่วนร่วมในการสำรวจของคุณ และผลการสำรวจพบว่าผู้ชาย 70% และผู้หญิง 65% กล่าวว่าพวกเขาพอใจกับผลิตภัณฑ์ของคุณ ระดับ 70% สูงกว่าระดับ 65% อย่างมีนัยสำคัญหรือไม่

แทนที่ข้อมูลต่อไปนี้จากแบบสำรวจลงในสูตรที่กำหนด:

  • p1 (% ของผู้ชายพอใจกับผลิตภัณฑ์) = 0.7
  • p2 (% ของผู้หญิงที่พอใจกับผลิตภัณฑ์) = 0.65
  • n1 (จำนวนผู้ชายที่สำรวจ) = 1,000
  • n2 (จำนวนผู้หญิงที่สัมภาษณ์) = 1,000

เนื่องจากค่าสัมบูรณ์ของสถิติการทดสอบมากกว่า 1.96 หมายความว่าความแตกต่างระหว่างชายและหญิงมีนัยสำคัญ เมื่อเทียบกับผู้หญิง ผู้ชายมีแนวโน้มที่จะพอใจกับผลิตภัณฑ์ของคุณมากกว่า

ซ่อนนัยสำคัญทางสถิติ

วิธีซ่อนนัยสำคัญทางสถิติสำหรับทุกคำถาม

  1. คลิกลูกศรลงทางด้านขวาของกฎการเปรียบเทียบในแถบด้านข้างซ้าย
  2. เลือกรายการ แก้ไขกฎ.
  3. ปิดการใช้งานคุณสมบัติ แสดงนัยสำคัญทางสถิติโดยใช้สวิตช์
  4. คลิกปุ่ม นำมาใช้.

หากต้องการซ่อนนัยสำคัญทางสถิติสำหรับคำถามเดียว คุณต้อง:

  1. คลิกปุ่ม ปรับแต่งเหนือแผนภาพของปัญหานี้
  2. เปิดแท็บ ตัวเลือกการแสดงผล.
  3. ยกเลิกการเลือกช่องถัดจาก นัยสำคัญทางสถิติ.
  4. คลิกปุ่ม บันทึก.

ตัวเลือกการแสดงผลจะเปิดใช้งานโดยอัตโนมัติเมื่อเปิดใช้งานการแสดงนัยสำคัญทางสถิติ หากคุณล้างตัวเลือกการแสดงผลนี้ การแสดงนัยสำคัญทางสถิติจะถูกปิดใช้งานด้วย

เปิดคุณลักษณะนัยสำคัญทางสถิติเมื่อเพิ่มกฎการเปรียบเทียบให้กับคำถามในแบบสำรวจของคุณ ตรวจสอบตารางข้อมูลสำหรับคำถามในแบบสำรวจของคุณเพื่อดูว่าคำตอบที่ได้รับจากกลุ่มผู้ตอบแบบสอบถามแต่ละกลุ่มมีความแตกต่างกันอย่างมีนัยสำคัญทางสถิติหรือไม่

ระดับความสำคัญ - นี่คือความน่าจะเป็นที่เราถือว่าความแตกต่างมีนัยสำคัญ แต่จริงๆ แล้วมันเป็นแบบสุ่ม

เมื่อเราระบุว่าความแตกต่างมีนัยสำคัญที่ระดับนัยสำคัญ 5% หรือเมื่อใด < 0,05 แล้วเราหมายถึงความน่าจะเป็นที่ไม่น่าเชื่อถือคือ 0.05

เมื่อเราระบุว่าความแตกต่างมีนัยสำคัญที่ระดับนัยสำคัญ 1% หรือเมื่อใด < 0,01 แล้วเราหมายถึงความน่าจะเป็นที่ไม่น่าเชื่อถือคือ 0.01

หากเราแปลทั้งหมดนี้เป็นภาษาที่เป็นทางการมากขึ้น ระดับนัยสำคัญคือความน่าจะเป็นที่จะปฏิเสธสมมติฐานว่าง ทั้งที่มันเป็นเรื่องจริง

ข้อผิดพลาด,ประกอบด้วยอันที่หนึ่งสิ่งที่เราถูกปฏิเสธสมมติฐานว่างแม้ว่าจะถูกต้อง แต่ก็เรียกว่าข้อผิดพลาดประเภท 1(ดูตารางที่ 1)

โต๊ะ 1. สมมติฐานว่างและทางเลือกและเงื่อนไขการทดสอบที่เป็นไปได้

ความน่าจะเป็นของข้อผิดพลาดดังกล่าวมักจะแสดงเป็น α. โดยพื้นฐานแล้ว เราจะต้องระบุในวงเล็บไม่ใช่ p < 0.05 หรือหน้า < 0.01 และ α < 0.05 หรือ α < 0,01.

หากมีโอกาสผิดพลาดได้ α จากนั้นความน่าจะเป็นของการตัดสินใจที่ถูกต้อง: 1-α ยิ่ง α น้อยเท่าไร ความน่าจะเป็นในการตัดสินใจที่ถูกต้องก็จะยิ่งมากขึ้นเท่านั้น

ในอดีต ในด้านจิตวิทยา เป็นที่ยอมรับกันโดยทั่วไปว่าระดับต่ำสุดของนัยสำคัญทางสถิติคือระดับ 5% (p≤0.05): เพียงพอคือระดับ 1% (p≤0.01) และสูงสุดคือระดับ 0.1% ( p≤0.001) ดังนั้นตารางค่าวิกฤตมักจะมีค่าของเกณฑ์ที่สอดคล้องกับระดับนัยสำคัญทางสถิติp≤0.05และp≤0.01บางครั้ง - p≤0.001 สำหรับเกณฑ์บางอย่าง ตารางจะระบุระดับนัยสำคัญที่แน่นอนของค่าเชิงประจักษ์ที่แตกต่างกัน ตัวอย่างเช่น สำหรับ φ*=1.56 p=O.06

อย่างไรก็ตาม จนกว่าระดับนัยสำคัญทางสถิติจะถึง p=0.05 เราก็ยังไม่มีสิทธิ์ปฏิเสธสมมติฐานว่าง

เราจะปฏิบัติตามกฎต่อไปนี้ในการปฏิเสธสมมติฐานที่ไม่มีความแตกต่าง (Ho) และยอมรับสมมติฐานที่มีนัยสำคัญทางสถิติของความแตกต่าง (H 1)

กฎสำหรับการปฏิเสธ Ho และยอมรับ h1

หากค่าเชิงประจักษ์ของเกณฑ์เท่ากับหรือมากกว่าค่าวิกฤติที่สอดคล้องกับ p≤0.05 ดังนั้น H 0 จะถูกปฏิเสธ แต่เรายังไม่สามารถยอมรับ H 1 ได้อย่างแน่นอน

หากค่าเชิงประจักษ์ของเกณฑ์เท่ากับค่าวิกฤตที่สอดคล้องกับ p≤0.01 หรือเกินกว่านั้น H 0 จะถูกปฏิเสธและ H 1 จะถูกยอมรับ : ข้อยกเว้น

การทดสอบสัญญาณ G, การทดสอบ Wilcoxon T และการทดสอบ Mann-Whitney U ความสัมพันธ์แบบผกผันถูกสร้างขึ้นสำหรับพวกเขา

ข้าว. 4. ตัวอย่าง “แกนนัยสำคัญ” สำหรับเกณฑ์ Q ของ Rosenbaum

ค่าวิกฤตของเกณฑ์ถูกกำหนดเป็น Q o, o5 และ Q 0.01 ค่าเชิงประจักษ์ของเกณฑ์เป็น Q em มันถูกล้อมรอบด้วยวงรี

ทางด้านขวาของค่าวิกฤติ Q 0.01 จะขยาย "โซนสำคัญ" ซึ่งรวมถึงค่าเชิงประจักษ์ที่เกิน Q 0.01 และดังนั้นจึงมีนัยสำคัญอย่างแน่นอน

ทางด้านซ้ายของค่าวิกฤต Q 0.05 จะขยาย "โซนที่ไม่มีนัยสำคัญ" ซึ่งรวมถึงค่า Q เชิงประจักษ์ที่ต่ำกว่า Q 0.05 ดังนั้นจึงไม่มีนัยสำคัญอย่างแน่นอน เราเห็นสิ่งนั้น 0,05 =6; เราเห็นสิ่งนั้น 0,01 =9; เราเห็นสิ่งนั้น ถาม =8;

ค่าเชิงประจักษ์ของเกณฑ์จะอยู่ในภูมิภาคระหว่าง Q 0.05 ถึง Q 0.01 นี่คือโซนของ "ความไม่แน่นอน": เราสามารถปฏิเสธสมมติฐานเกี่ยวกับความไม่น่าเชื่อถือของความแตกต่าง (H 0) ได้แล้ว แต่เรายังไม่สามารถยอมรับสมมติฐานเกี่ยวกับความน่าเชื่อถือได้ (H 1)

อย่างไรก็ตาม ในทางปฏิบัติ ผู้วิจัยสามารถพิจารณาความแตกต่างที่ไม่อยู่ในขอบเขตที่ไม่มีนัยสำคัญได้อย่างน่าเชื่อถือ โดยประกาศว่าเชื่อถือได้ที่ p < 0.05 หรือโดยการระบุระดับนัยสำคัญที่แน่นอนของค่าเกณฑ์เชิงประจักษ์ที่ได้รับ เช่น p=0.02 การใช้ตารางมาตรฐานซึ่งอยู่ในหนังสือเรียนเกี่ยวกับวิธีการทางคณิตศาสตร์ทั้งหมดสามารถทำได้โดยสัมพันธ์กับเกณฑ์ Kruskal-Wallis H χ 2 ฟรีดแมน, แอลของเพจ, φของฟิชเชอร์ .

ระดับนัยสำคัญทางสถิติหรือค่าการทดสอบวิกฤต จะถูกกำหนดแตกต่างกันเมื่อทดสอบสมมติฐานทางสถิติแบบมีทิศทางและไม่ใช่แบบมีทิศทาง

เมื่อใช้สมมติฐานทางสถิติเชิงทิศทาง จะใช้การทดสอบแบบด้านเดียว เมื่อใช้สมมติฐานแบบไม่มีทิศทาง จะใช้การทดสอบแบบสองด้าน การทดสอบแบบสองด้านมีความเข้มงวดมากกว่า เนื่องจากเป็นการทดสอบความแตกต่างในทั้งสองทิศทาง ดังนั้นค่าเชิงประจักษ์ของการทดสอบที่ก่อนหน้านี้สอดคล้องกับระดับนัยสำคัญ p < 0.05 ตอนนี้สอดคล้องกับระดับ p เท่านั้น < 0,10.

เราจะไม่ต้องตัดสินใจเองทุกครั้งว่าจะใช้เกณฑ์ด้านเดียวหรือสองด้าน ตารางค่าวิกฤตของเกณฑ์จะถูกเลือกในลักษณะที่สมมติฐานเชิงทิศทางสอดคล้องกับเกณฑ์ด้านเดียวและสมมติฐานที่ไม่ใช่ทิศทางสอดคล้องกับเกณฑ์สองด้านและค่าที่กำหนดนั้นเป็นไปตามข้อกำหนดที่ นำไปใช้กับแต่ละคน ผู้วิจัยเพียงต้องแน่ใจว่าสมมติฐานของเขาตรงกันในความหมายและรูปแบบกับสมมติฐานที่เสนอไว้ในคำอธิบายของแต่ละเกณฑ์