สรุป สถิติ ตัวแปรสุ่ม และการแจกแจงความน่าจะเป็น ม.6 & แนวข้อสอบและเฉลย

สถิติ ม.6 สรุปเนื้อหา สูตรสำคัญ พร้อมแนวข้อสอบเข้ามหาวิทยาลัย

เลือกอ่านหัวข้อที่สนใจ คลิกเลย!

เลือกอ่านหัวข้อที่สนใจ คลิกเลย!

      สวัสดีครับ 😁 พี่เอ๋ – อ.วิเศษ กี่สุขพันธ์ แวะมาเจอกับน้อง ๆ พร้อมหยิบสรุปเนื้อหา สถิติ ม.6 มาฝากกันด้วย

      พี่ต้องบอกเลยว่าเนื้อหาคณิตศาสตร์ ม.ปลาย บทสถิติ ตัวแปรสุ่ม และการแจกแจงความน่าจะเป็นเบื้องต้น ถือเป็นบทที่ออกข้อสอบเยอะสุดในทุกปี อย่างในข้อสอบ A-Level คณิตศาสตร์ประยุกต์ 1 ปี 2567 ออกเรื่องสถิติมากถึง 4 ข้อ จากทั้งหมด 30 ข้อ โดยพี่ลิสต์หัวข้อที่ข้อสอบเข้ามหาวิทยาลัยในระบบ TCAS มักจะออกอยู่บ่อย ๆ มาให้แล้ว ดังนี้

  1. การอ่านค่าข้อมูลจากตารางและแผนภูมิแท่ง
  2. โจทย์แนววิเคราะห์ที่เกี่ยวข้องกับ ค่ากลาง 3 ตัว ได้แก่ ค่าเฉลี่ยเลขคณิต (µ) มัธยฐาน (Med) และฐานนิยม (Mode) โดยบางครั้งอาจจะมีพิสัย (การกระจาย) มาผสมอยู่ในโจทย์ด้วย
  3. โจทย์คำนวณการหาค่ากลาง (µ, Med, Mode) จากตารางแจกแจงความถี่ ซึ่งในข้อสอบปีหลัง ๆ จะเป็นตารางแจกแจงความถี่แบบไม่แบ่งเป็นอัตรภาคชั้น
  4. โจทย์คำนวณค่าเฉลี่ยเลขคณิตรวม หรือ ค่าเฉลี่ยเลขคณิตถ่วงน้ำหนัก
  5. โจทย์ที่เกี่ยวข้องกับสมบัติของค่ากลาง เช่น  \[\sum_{i=1}^{N}\ (x_{i}-\mu)^{2}  มีค่าน้อยที่สุด หรือ  \[\sum_{i=1}^{N}\ |X_{i} - Med|  มีค่าน้อยที่สุด เป็นต้น
  6. โจทย์วิเคราะห์หรือคำนวณ Qr , Pr หรือ IQR (บางครั้งเกี่ยวข้องกับค่ากลางด้วย โดยเฉพาะ Med)
  7. โจทย์เกี่ยวกับแผนภาพกล่อง และค่านอกเกณฑ์
  8. โจทย์เกี่ยวกับส่วนเบี่ยงเบนมาตรฐาน, พิสัยระหว่างควอไทล์ (IQR) หรือความแปรปรวน นิยมออกเกี่ยวกับค่าที่เปลี่ยนแปลงไป (หรือเท่าเดิม) เมื่อมีการบวก, ลบ, คูณ, หาร ข้อมูลด้วยค่าคงทึ่
  9. โจทย์เกี่ยวกับความแปรปรวน (ดูเรื่องความแปรปรวนรวมด้วย)
  10. โจทย์เกี่ยวกับการกระจายสัมพัทธ์ ซึ่งได้แก่ สัมประสิทธิ์การแปรผัน
  11. โจทย์เกี่ยวกับพื้นที่ใต้โค้งปกติกับค่า Z (ออกเกือบทุกปี)
  12. โจทย์ที่ถามค่าคาดหมายของตัวแปรสุ่ม X
  13. โจทย์ที่ถามความน่าจะเป็นของการแจกแจงแบบทวินาม

      ซึ่ง 13 หัวข้อนี้ เป็นเพียงแค่บางส่วนของแนวข้อสอบเข้ามหาวิทยาลัยที่นิยมออก ถ้าน้อง ๆ อยากจะกวาดคะแนนวิชาคณิตศาสตร์รัว ๆ ก็ต้องอ่านทวนบทสถิติ ม.6 ให้ครบทุกหัวข้อนะครับ

      คราวนี้ตามพี่มา เจาะลึกเนื้อหาบทสถิติ ตัวแปรสุ่ม และการแจกแจงความน่าจะเป็นเบื้องต้น ที่น้อง ๆ จะได้เรียนในวิชาคณิตศาสตร์ ม.6 กันต่อเลยดีกว่าครับ ว่าบทนี้มีหัวข้อและเนื้อหาสำคัญอะไรบ้าง …

สถิติ ม.6 : การวัดแนวโน้มเข้าสู่ส่วนกลาง

      พี่ขอเริ่มบทสถิติ เนื้อหาคณิตศาสตร์ ม.6 ด้วยหัวข้อ การวัดแนวโน้มเข้าสู่ส่วนกลาง ก่อนเลยครับ ในหัวข้อนี้มีสูตรสถิติสำคัญที่น้อง ๆ ควรทำความเข้าใจและจำให้ได้ดังนี้

ค่าเฉลี่ยเลขคณิต (\overline{\hbox{{#X}}})

      กรณีไม่แจกแจงความถี่

1. การคำนวณทั่วไป

สรุป สถิติ ม.6 - ค่าเฉลี่ยเลขคณิต (การคำนวณทั่วไป)

      กรณีข้อมูลระดับประชากร ค่าเฉลี่ยเลขคณิต นิยมเขียนแทนด้วย μ (มิว)

2. ค่าเฉลี่ยเลขคณิตรวม (\overline{\hbox{{#X}}}_c)

สรุป สถิติ ม.6 - ค่าเฉลี่ยเลขคณิต (ค่าเฉลี่ยเลขคณิตรวม)

      โดย N1 , N2 , N3 , … , Nk คือ จำนวนข้อมูลตั้งแต่กลุ่มที่ 1 จนถึงกลุ่มที่ k ซึ่งในสูตรนี้สามารถทอนเป็นอย่างต่ำได้

สรุป สถิติ ม.6 - ตัวอย่าง 1

3. ค่าเฉลี่ยเลขคณิตถ่วงน้ำหนัก (\overline{\hbox{{#X}}}_w)

สรุป สถิติ ม.6 - ค่าเฉลี่ยเลขคณิต (ค่าเฉลี่ยเลขคณิตถ่วงน้ำหนัก)

      โดย W1 , W2 , W3 , … , WN คือ น้ำหนักของข้อมูลตั้งแต่ตัวที่ 1 จนถึงตัวที่ N ซึ่งในสูตรนี้สามารถทอนเป็นอย่างต่ำได้

สรุป สถิติ ม.6 - ตัวอย่าง 2

4. สมบัติของ (\overline{\hbox{{#X}}})

ค่ามัธยฐาน (Med)

      กรณีไม่แจกแจงความถี่

1. การคำนวณทั่วไป

      เมื่อเรียงข้อมูลจากน้อยไปมากแล้ว

          ขั้นที่ 1  หาตำแหน่ง โดยตำแหน่งของ  Med  =  \frac{์N+1}{2}
          ขั้นที่ 2  Med  =  ค่าของข้อมูลในตำแหน่ง  \frac{์N+1}{2}  นั้น

2. สมบัติของ Med

ค่าฐานนิยม (Mode)

      กรณีไม่แจกแจงความถี่

Mode  =  ค่าของข้อมูลที่มีความถี่สูงสุด

ค่ากลางอื่น ๆ

1. ค่าเฉลี่ยเรขาคณิต (G.M.)

      กรณีไม่แจกแจงความถี่

สรุป สถิติ ม.6 - ค่าเฉลี่ยเรขาคณิต (G.M.)

2. ค่าเฉลี่ยฮาร์โมนิก (H.M.)

      กรณีไม่แจกแจงความถี่

สรุป สถิติ ม.6 - ค่าเฉลี่ยฮาร์โมนิก (H.M.)

3. ค่ากึ่งกลางพิสัย (Mid – range)

      กรณีไม่แจกแจงความถี่

สรุป สถิติ ม.6 - ค่ากึ่งกลางพิสัย (Mid - range)

การเลือกใช้ค่ากลาง

  1. \overline{\hbox{{#X}}} ใช้ได้ดี เมื่อข้อมูลเป็นข้อมูลเชิงปริมาณที่มีค่าใกล้เคียงกัน
  2. Med ใช้ได้ดี เมื่อข้อมูลเป็นข้อมูลเชิงปริมาณที่มีข้อมูลบางค่าสูงผิดปกติ หรือต่ำกว่าปกติ (ข้อมูลกระโดด)
  3. Mode ใช้ได้ดี กับข้อมูลเชิงคุณภาพ
  4. G.M. ใช้ได้ดี กับข้อมูลที่มีลักษณะเป็นลำดับเรขาคณิต
  5. H.M. ใช้ได้ดี กับข้อมูลที่เป็นอัตราส่วนเมื่อตัวเศษคงที่ เช่น อัตราเร็วที่ระยะทางคงที่

ตารางแจกแจงความถี่

สรุป สถิติ ม.6 - ตารางแจกแจงความถี่ (ตารางที่ 1)
สรุป สถิติ ม.6 - การสร้างตารางแจกแจงความถี่
สรุป สถิติ ม.6 - ตารางแจกแจงความถี่ (ตารางที่ 2)

1. หาค่า (\overline{\hbox{{#X}}})

      กรณีแจกแจงความถี่

      สูตรที่ 1

สรุป สถิติ ม.6 - ตารางแจกแจงความถี่ (หาค่า X : สูตรที่ 1)
  • fi  =  ความถี่ชั้นที่  i ; Xi  คือ จุดกลางของชั้นที่ i

      สูตรที่ 2

สรุป สถิติ ม.6 - ตารางแจกแจงความถี่ (หาค่า X : สูตรที่ 2)
  • a  =  จุดกึ่งกลางของชั้นที่กำหนดให้  d  =  0
  • di  =  ตัวเลขสมมติของชั้นที่ i โดยกำหนดให้ชั้นใดชั้นหนึ่ง (นิยมให้ชั้นที่มีความถี่สูงสุด) มี  d  =  0  และชั้นที่มีค่าข้อมูลน้อยลงให้  d  =  –1, –2, …  และชั้นที่มีค่าข้อมูลมากขึ้นให้  d  =  1, 2, …
  • I  =  ความกว้างชั้น (ซึ่งต้องเท่ากันทุกชั้นถ้าจะใช้สูตรที่ 2 นี้)

      Note  ปกติหากความกว้างของทุกชั้นเท่ากันหมด จะนิยมใช้สูตรที่ 2 เพราะคิดเลขน้อย แต่หากตารางมีความกว้างของแต่ละชั้นไม่เท่ากัน จะใช้สูตรที่ 2 ไม่ได้ ให้ใช้สูตรที่ 1 แทน

สรุป สถิติ ม.6 - ตัวอย่าง 3

      Note  การกำหนด ห.ร.ม. ของ a และ b เท่ากับ 1 คือ  \frac{์a}{b}  ต้องเป็นเศษส่วนอย่างต่ำ

2. หาค่า Med

      กรณีแจกแจงความถี่

      ขั้นที่ 1  หาตำแหน่งของ  Med  = \frac{์N}{2}
      ขั้นที่ 2  หาค่าของ Med ที่ตำแหน่ง  = \frac{์N}{2}
                   โดยหาอันตรภาคชั้นที่ Med อยู่ จะได้ชั้น Med
                   และ

สรุป สถิติ ม.6 - ตารางแจกแจงความถี่ (สูตรหาค่า Med)
  • L  =  ขอบล่างของชั้น Med
  • I  =  ความกว้างของชั้น Med
  • N  =  จำนวนข้อมูลทั้งหมด ( \frac{์N}{2}   =  ตำแหน่งของ Med)
  • ∑fL  =  ผลรวมความถี่ชั้นที่มีคะแนนต่ำกว่าชั้น Med
  • fMe  =  ความถี่ชั้น Med

      Trick  เมื่อตำแหน่งของ  Med  =  ความถี่สะสมของชั้นใด
                  ค่า  Med  =  ขอบบนของชั้นนั้น

สรุป สถิติ ม.6 - ตัวอย่าง 4

3. หาค่า Mode

      กรณีแจกแจงความถี่

            Mode จะอยู่ในชั้นที่มีความถี่สูงสุด

      สูตรที่ 1

            Mode  =  จุดกึ่งกลางของชั้น Mode (ชั้นที่มีความถี่สูงสุด)

      สูตรที่ 2

            Mode  =  L + I (\frac{์d∨1}{d∨1 + d∨2})

  • L   =  ขอบล่างของชั้น Mode
  • I    =  ความกว้างของชั้น Mode
  • d1  =  ผลต่างความถี่ระหว่างชั้น Mode กับชั้นที่คะแนนต่ำกว่า (หนังสือบางเล่มใช้ dL)
  • d2  =  ผลต่างความถี่ระหว่างชั้น Mode กับชั้นที่คะแนนสูงกว่า (หนังสือบางเล่มใช้ dU)

      Note

  1. โดยปกติ Mode จากสูตรที่ 1 และ สูตรที่ 2 มีค่าไม่เท่ากัน คำตอบจึงขึ้นอยู่กับว่า คนแต่งโจทย์ใช้สูตรใดในการคิดคำตอบ
  2. Mode อาจมีได้ 2 ตัว หากทั้ง 2 ตัวนั้นมีความถี่สูงสุดซึ่งเท่ากัน
  3. ทั้ง 2 สูตรจะใช้เมื่อ  I  เท่ากันทุกชั้น ถ้า  I  ไม่เท่าให้ใช้  \frac{์f}{I}  แทน  f

      เพิ่มเติม
      ค่ากลางอื่น ๆ กรณีข้อมูลแจกแจงความถี่

สรุป สถิติ ม.6 - ตารางแจกแจงความถี่ (ค่ากลางอื่น ๆ กรณีข้อมูลแจกแจงความถี่)

การวัดแนวโน้มเข้าสู่ส่วนกลาง อื่น ๆ

1. การแจกแจงความถี่โดยใช้กราฟ

      ฮีสโทแกรม คือ กราฟแท่ง โดยแกนแนวนอนแทนค่าของตัวแปร ความกว้างของแท่งแทนความกว้างของแต่ละชั้น แต่ถ้าความกว้างของแต่ละชั้นไม่เท่ากัน ความสูงแต่ละแท่งจะแทนด้วยอัตราส่วนของความถี่ต่อความกว้างของชั้นนั้น

สรุป สถิติ ม.6 - การแจกแจงความถี่โดยใช้กราฟ (ฮีสโทแกรม)

      รูปหลายเหลี่ยมของความถี่ คือ รูปหลายเหลี่ยมที่ได้จากการโยงจุดกึ่งกลางของแท่งมุมฉากของฮีสโทแกรมด้วยเส้นตรง

สรุป สถิติ ม.6 - การแจกแจงความถี่โดยใช้กราฟ (รูปหลายเหลี่ยมของความถี่)

      เส้นโค้งของความถี่ คือ เส้นโค้งที่ได้จากการปรับด้านของรูปหลายเหลี่ยมของความถี่ให้เรียบขึ้น

สรุป สถิติ ม.6 - การแจกแจงความถี่โดยใช้กราฟ (เส้นโค้งของความถี่)

      เส้นโค้งของความถี่สะสม คือ เส้นโค้งที่เกิดจากการเขียนกราฟระหว่างค่าของข้อมูลกับความถี่สะสมโดยโยงเชื่อมจุดต่าง ๆ ด้วยเส้นตรงแล้วปรับให้เป็นเส้นโค้งเรียบ

สรุป สถิติ ม.6 - การแจกแจงความถี่โดยใช้กราฟ (เส้นโค้งของความถี่สะสม)

2. แผนภาพต้นใบ

สรุป สถิติ ม.6 - ตัวอย่าง 5

      Note  ถ้าจะหา Med , Pr , Dr , Qr จากแผนภาพต้นใบ อย่าลืมเรียงใบก่อน จากน้อยไปมาก

สถิติ ม.6 : การวัดตำแหน่งข้อมูล

      หัวข้อต่อมาของบทสถิติ ม.6 ก็คือ การวัดตำแหน่งข้อมูล ครับ ซึ่งในหัวข้อนี้น้อง ๆ จะได้ทำความรู้จักกับ ควอไทล์, เดไซล์ และเปอร์เซ็นต์ไทล์ รวมทั้งสามารถหาตำแหน่งของข้อมูลได้

สรุป สถิติ ม.6 - ตัวอย่าง 6

หาควอไทล์ (Qr), เดไซล์ (Dr) และเปอร์เซ็นต์ไทล์ (Pr)

      กรณีไม่แจกแจงความถี่

      เมื่อเรียงข้อมูลแล้วจากน้อยไปมาก

      ขั้นที่ 1  หาตำแหน่งโดย
                   ตำแหน่ง  Qr  =  \frac{์r}{4} (N + 1)
                   ตำแหน่ง  Dr  =  \frac{์r}{10} (N + 1)
                   ตำแหน่ง  Pr  =  \frac{์r}{100} (N + 1)

      ขั้นที่ 2  หาค่าของข้อมูลในตำแหน่งนั้น

หา Qr, Dr, Pr จากตารางแจกแจงความถี่

      กรณีแจกแจงความถี่

      ขั้นที่ 1  หาตำแหน่งโดย

                   ตำแหน่ง  Qr  =  \frac{์r}{4} (N)
                   ตำแหน่ง  Dr  =  \frac{์r}{10} (N)
                   ตำแหน่ง  Pr  =  \frac{์r}{100} (N)

      ขั้นที่ 2  หาค่าของข้อมูลในตำแหน่งนั้น (จากขั้นที่ 1) โดยหาชั้นที่ตำแหน่งนั้นอยู่ก่อนแล้ว

สรุป สถิติ ม.6 - สูตรหา Qr, Dr, Pr จากตารางแจกแจงความถี่

      Note

  1. เมื่อตำแหน่ง  =  ความถี่สะสมของชั้นใด 
     Qr, Dr, Pr ที่ต้องการ  =  ขอบบนของชั้นนั้น
  2. P50  =  D5  =  Q2  =  Med

สถิติ ม.6 : การวัดการกระจาย

      สำหรับหัวข้อ การวัดการกระจาย ในบทสถิติ ม.6 นี้ น้อง ๆ จะได้เรียนรู้เรื่องการวัดการกระจายของข้อมูล ซึ่งแบ่งออกเป็น 2 วิธี คือ การกระจายสัมบูรณ์ และ การกระจายสัมพัทธ์ ครับ

การกระจายสัมบูรณ์

  1. พิสัย  =  XMax – XMin
  2. พิสัยระหว่างควอไทล์ (IQR)  =  Q3 – Q1
  3. ส่วนเบี่ยงเบนมาตรฐาน (S.D.)
สรุป สถิติ ม.6 - การวัดการกระจาย (การกระจายสัมบูรณ์)

ความแปรปรวน (S.D.2)

1. การคำนวณทั่วไป

สรุป สถิติ ม.6 - การวัดการกระจาย (ความแปรปรวน)

2. ความแปรปรวนรวม (SD\SD^2_c)

สรุป สถิติ ม.6 - การวัดการกระจาย (ความแปรปรวนรวม)

      เพิ่มเติม
      การหาการกระจายสัมบูรณ์จากตารางแจกแจงความถี่

                พิสัย  =  ขอบบนสูงสุด – ขอบล่างต่ำสุด
                IQR  =  Q3 – Q1

สรุป สถิติ ม.6 - การวัดการกระจาย (หาการกระจายสัมบูรณ์จากตารางแจกแจงความถี่)

      เมื่อ  Xi  =  จุดกึ่งกลางชั้นที่  i  และ  fi  =  ความถี่ชั้นที่ i

การกระจายสัมพัทธ์

สรุป สถิติ ม.6 - การวัดการกระจาย (การกระจายสัมพัทธ์)

การวัดการกระจาย อื่น ๆ

1. เส้นโค้งความถี่

สรุป สถิติ ม.6 - การวัดการกระจาย (เส้นโค้งความถี่)

      การเปรียบเทียบการกระจายจากเส้นโค้งความถี่ปกติ ในกรณีที่  \overline{\hbox{{#X}}}  เท่ากัน

  1. กระจายน้อย กราฟจะโด่งมาก (ดี)
  2. กระจายมาก กราฟจะโด่งน้อย หรือค่อนข้างแบน (ไม่ดี)
สรุป สถิติ ม.6 - การวัดการกระจาย (กราฟเส้นโค้งความถี่)

      เพิ่มเติม
      สำหรับข้อมูลที่มีการกระจายเป็นโค้งเกือบปกติ  |\overline{\hbox{{#X}}} – Mode|  =  3|\overline{\hbox{{#X}}} – Med|

2. แผนภาพกล่อง และค่านอกเกณฑ์

      แผนภาพกล่อง (Box plot หรือ Box and whisker plot) เป็นแผนภาพที่ใช้ในการนำเสนอ หรือวิเคราะห์การกระจายของข้อมูล โดยแผนภาพกล่องจะประกอบด้วย ค่าต่ำสุด, ค่าสูงสุด, ควอร์ไทล์ที่ 1 (Q1), ควอร์ไทล์ที่ 2 (Q2) และ ควอร์ไทล์ที่ 3 (Q3)

สรุป สถิติ ม.6 - แผนภาพกล่อง (Box plot)

      นอกจากนี้แผนภาพกล่องสามารถใช้ในการตรวจสอบว่ามีข้อมูลที่แตกต่างไปจากข้อมูลส่วนใหญ่หรือไม่ โดยจะเรียกข้อมูลดังกล่าวว่า ค่านอกเกณฑ์ (Outlier)

สรุป สถิติ ม.6 - ค่านอกเกณฑ์ (Outlier)

      ค่านอกเกณฑ์ (Outlier) คือ ค่าสุดโต่งของข้อมูล เป็นค่าที่สูงหรือต่ำผิดปกติของข้อมูล โดยทั่วไปเราจะให้ข้อมูลนั้นเป็นค่านอกเกณฑ์เมื่อ

              ข้อมูลมีค่าน้อยกว่า  Q1 – 1.5IQR  (Lower fence)

      หรือ  ข้อมูลมีค่ามากกว่า  Q3 + 1.5IQR  (Upper fence)

      โดย   IQR  =  Q3 – Q1

      สำคัญ!!
*    ค่านอกเกณฑ์อาจเป็นค่าจริงที่เกิดขึ้นตามธรรมชาติ หรืออาจเกิดจากความคลาดเคลื่อนจากการวัดหรือเก็บข้อมูลก็ได้

**  ในกรณีที่ข้อมูลไม่มีค่านอกเกณฑ์ :  แต่ละช่วงของแผนภาพกล่องจะมีจำนวนข้อมูลประมาณ 25% ของจำนวนข้อมูลทั้งหมด

      แต่ในกรณีที่ข้อมูลมีค่านอกเกณฑ์ : ข้อมูลที่อยู่ในช่วงหนวดของแผนภาพจะมีจำนวนข้อมูลไม่ถึง 25% ของจำนวนข้อมูลทั้งหมด

3. สมบัติต่าง ๆ ของการกระจาย และความแปรปรวนกับความสัมพันธ์เชิงเส้น

  1. ถ้านำ C บวกข้อมูลทุกตัว  “กระจายใหม่  =  กระจายเดิม”  เช่น  SDใหม่  =  SDเดิม

  2. ถ้านำ C คูณข้อมูลทุกตัว “กระจายใหม่  =  |c| ⋅ กระจายเดิม”  เช่น  SDใหม่  =  |c| ⋅ SDเดิม

  3. ถ้าข้อมูลชุด  x  และชุด  y  มีความสัมพันธ์กันโดย  yi  =  cxi + d (เชิงเส้น) จะได้ว่า
    3.1  \overline{\hbox{{#y}}}  =  c\overline{\hbox{{#x}}} + d , Medy  =  cMedx + d , Modey  =  cModex + d
    3.2  SDy  =  |c|SDx , IQRy  =  |c|IQRx
            และ      พิสัยy  =  |c| พิสัยx
                        IQRy  =  |c| IQRx
    3.3  SD\SD^2_y  =  c2SD\SD^2_x

4. THE 95% RULE

      กล่าวว่า “โดยทั่วไปไม่ว่าข้อมูลจะมีการกระจายในลักษณะใด จะมีข้อมูลอยู่ประมาณ 95% ของข้อมูลทั้งหมดอยู่ในช่วง ( \overline{\hbox{{#X}}} – 2 SD , \overline{\hbox{{#X}}} + 2 SD)”

สรุป สถิติ ม.6 - THE 95% RULE

สถิติ ม.6 : ค่ามาตรฐาน (Z)

      หัวข้อต่อมาของบทสถิติ ในเนื้อหาคณิตศาสตร์ ม.6 ที่พี่จะพาน้อง ๆ ไปดูกัน คือ ค่ามาตรฐาน (Z) ครับ โดยค่ามาตรฐานเป็นค่าที่ใช้เปรียบเทียบข้อมูลตั้งแต่ 2 ค่าขึ้นไป (ที่มาจากข้อมูลคนละชุด) ว่ามีความแตกต่างกันยังไง

การคำนวณทั่วไป

สรุป สถิติ ม.6 - ค่ามาตรฐาน (Z) (การคำนวณทั่วไป)

สมบัติของ Z

สรุป สถิติ ม.6 - สมบัติของ Z

Z กับพื้นที่ใต้โค้งปกติ

      ข้อควรรู้

                 1. พื้นที่ใต้เส้นโค้งทั้งหมดจะมีเท่ากับ 1 หรือ 100%

                 2. เส้นโค้งที่พิจารณาเป็นโค้งปกติ

สรุป สถิติ ม.6 - Z กับพื้นที่ใต้โค้งปกติ (1)

                 ดังนั้นจึงสมมาตรกับแกนกลาง (แนวดิ่ง) และแบ่งพื้นที่ออกเป็นข้างละ 0.5 (50%) ค่าตรงกลางนี้จะเท่ากับ  \overline{\hbox{{#X}}}  เท่ากับ  Med  เท่ากับ  Mode  และเมื่อนำค่าไปคำนวณ  Z  ได้  Z  =  0

                 3. พื้นที่ที่ระบุจากตาราง คือ พื้นที่ซึ่งวัดจากซ้ายสุด (Zmin) ไปถึงตำแหน่ง Z ใด ๆ เช่น

สรุป สถิติ ม.6 - Z กับพื้นที่ใต้โค้งปกติ (2)

                 4. เมื่อทราบพื้นที่ใต้โค้งทางด้านซ้ายของข้อมูล จะทำให้ทราบว่าข้อมูลนั้นตรงกับเปอร์เซ็นไทล์ที่เท่าใด เช่น

สรุป สถิติ ม.6 - Z กับพื้นที่ใต้โค้งปกติ (3)

      Note  จำนวนข้อมูลในพื้นที่แรเงานั้น หาได้จากการเอา  พ.ท.แรเงา  x  จำนวนข้อมูลทั้งหมด  เช่น ในกรณีถ้ามีจำนวนข้อมูลทั้งหมด 1,000 ตัว จะมีข้อมูลใน พ.ท.แรเงา ซึ่งมีค่า  Z  น้อยกว่า 0.97 อยู่ 0.834 x 1000  =  834 ตัวนั่นเอง 

ตัวแปรสุ่มและการแจกแจงความน่าจะเป็น ม.6

      สำหรับเนื้อหาคณิตศาสตร์ ม.ปลาย เรื่อง ตัวแปรสุ่มและการแจกแจงความน่าจะเป็น เป็นเนื้อหาที่ถูกเพิ่มเข้ามาในหลักสูตรใหม่ของ สสวท. (ฉบับปรับปรุงปี 2560) ที่น้อง ๆ จะได้เรียนกันตอน ม.6 เทอม 2 ซึ่งพี่สรุปหัวข้อสำคัญไว้ให้แล้ว ตามมาดูกันเลยครับ

ความหมายและชนิดของตัวแปรสุ่ม

นิยาม

      ตัวแปรสุ่ม (random variable) คือ ฟังก์ชันจากปริภูมิตัวอย่าง (sample space, S) ของการทดลองสุ่มไปยังเซตของจำนวนจริง เขียนแทนด้วย X หรือกล่าวง่าย ๆ ว่า ตัวแปรสุ่มเป็นฟังก์ชันซึ่งมีโดเมนเป็นแซมเปิลสเปซ และมีเรนจ์เป็นเซตของเลขจำนวนจริงที่กำหนดมาจากสมาชิกในแซมเปิลสเปซ โดยเซตของค่าต่าง ๆ ที่เป็นเรนจ์จะเรียกว่า range space เขียนแทนด้วย Rx และสมาชิกทุกตัวของเรนจ์จะเรียกว่า ค่าของตัวแปรสุ่ม เขียนแทนด้วย x

สรุป ตัวแปรสุ่มและการแจกแจงความน่าจะเป็น ม.6 - ตัวแปรสุ่ม (random variable)
สรุป ตัวแปรสุ่มและการแจกแจงความน่าจะเป็น ม.6 - ตัวอย่าง 1

รูปแบบของตัวแปรสุ่ม

      โดยทั่วไปตัวแปรสุ่มจะแบ่งได้ 2 ชนิด ตามลักษณะค่าที่เป็นไปได้ของตัวแปรสุ่มดังนี้

  1. ตัวแปรสุ่มไม่ต่อเนื่อง (discrete random variable) คือ ตัวแปรสุ่มที่ค่าที่เป็นไปได้ทั้งหมด เป็นเซตที่สามารถเขียนแบบแจกแจงสมาชิกได้ โดยอาจเป็นเซตจำกัดหรือเซตอนันต์ก็ได้
  2. ตัวแปรสุ่มต่อเนื่อง (continuous random variable) คือ ตัวแปรสุ่มที่ค่าที่เป็นไปได้ทั้งหมดเป็นช่วงที่เป็นสับเซตของ R

ความน่าจะเป็นของตัวแปรสุ่ม

      ถ้า A เป็นเหตุการณ์ในแซมเปิลสเปซ จะสามารถหาค่าความน่าจะเป็นของเหตุการณ์ A คือ ค่า P(A) ได้ และเมื่อเราให้ X เป็นตัวแปรสุ่มซึ่งกำหนดมาจากแซมเปิลสเปซดังกล่าว ผลลัพธ์ต่าง ๆ ในเหตุการณ์ A ก็ย่อมถูกกำหนดเป็นตัวเลข ดังนั้นค่าความน่าจะเป็นของตัวแปรสุ่มที่กำหนดเหตุการณ์ A ก็จะเท่ากับความน่าจะเป็นของเหตุการณ์ A จากตัวอย่างที่ 1 เมื่อ A คือ เหตุการณ์ที่เหรียญจะขึ้นหัว 2 อัน จะได้ว่า  A = {HHT, HTH, THH}  ซึ่งเป็นเหตุการณ์ที่  X = 2  จะเห็นว่า  P(A) = P(X = 2) = \frac{์3}{8}

      และเมื่อเรานำความน่าจะเป็นของการเกิดค่าแต่ละค่าที่เป็นไปได้ทั้งหมดของตัวแปรสุ่ม มาเขียนแสดงเพื่ออธิบายลักษณะของตัวแปรสุ่มจะเรียกว่า การแจกแจงความน่าจะเป็น (probability distribution) โดยอาจเขียนแสดงในรูปตารางหรือกราฟก็ได้ จากตัวอย่างที่ 1 ในการโยนเหรียญที่เที่ยงตรง 1 เหรียญ 3 ครั้ง เมื่อให้ตัวแปรสุ่ม  X = จำนวนเหรียญที่ขึ้นหัว  จะสามารถเขียนการแจกแจงความน่าจะเป็นได้ดังนี้

สรุป ตัวแปรสุ่มและการแจกแจงความน่าจะเป็น ม.6 - ความน่าจะเป็นของตัวแปรสุ่ม (เขียนเป็นตาราง)
สรุป ตัวแปรสุ่มและการแจกแจงความน่าจะเป็น ม.6 - ความน่าจะเป็นของตัวแปรสุ่ม (เขียนเป็นกราฟ)

การแจกแจงความน่าจะเป็นของตัวแปรสุ่ม (probability distribution)

      การแจกแจงความน่าจะเป็นของตัวแปรสุ่ม จะสามารถแบ่งได้ 2 ประเภท ดังนี้

  1. การแจกแจงความน่าจะเป็นของตัวแปรสุ่มไม่ต่อเนื่อง (discrete probability distribution)
  2. การแจกแจงความน่าจะเป็นของตัวแปรสุ่มต่อเนื่อง (continuous probability distribution)

นิยาม

      การแจกแจงความน่าจะเป็นของตัวแปรสุ่มไม่ต่อเนื่อง (discrete probability distribution)

      ถ้า X เป็นตัวแปรสุ่มแบบไม่ต่อเนื่องซึ่งมีค่าเป็น  x1, x2, x3 , … , xn  ฟังก์ชันซึ่งกำหนดโดย  f(xi) = P(X = xi)

      เมื่อ  i = 1, 2, 3,…, n  จะเรียกฟังก์ชันดังกล่าวว่าเป็น ฟังก์ชันของความน่าจะเป็น (probability function) โดย f(xi) มีสมบัติ 2 ข้อ คือ

สรุป ตัวแปรสุ่มและการแจกแจงความน่าจะเป็น ม.6 - การแจกแจงความน่าจะเป็นของตัวแปรสุ่ม (1)

      โดยทั่วไปเราจะเขียน  f(x) = P(X = x)  แทนที่จะเขียน  f(xi) = P(X = xi)

สรุป ตัวแปรสุ่มและการแจกแจงความน่าจะเป็น ม.6 - การแจกแจงความน่าจะเป็นของตัวแปรสุ่ม (2)

ค่าคาดหมายและส่วนเบี่ยงเบนมาตรฐานของตัวแปรสุ่ม

      ค่าคาดหมาย (expected value) คือ ผลของความน่าจะเป็นกับผลประโยชน์ที่เราจะได้รับเมื่อสิ่ง ๆ นั้นได้เกิดขึ้น หรือในทางสถิติศาสตร์ คือ ค่าเฉลี่ยถ่วงน้ำหนัก (weighted average) ของทุก ๆ ค่าที่เป็นไปได้ของตัวแปรสุ่ม เช่น จากตัวอย่างที่ 1 ในการโยนเหรียญที่เที่ยงตรง 1 เหรียญ 3 ครั้ง เมื่อให้ตัวแปรสุ่ม  X = จำนวนเหรียญที่ขึ้นหัว  จะสามารถเขียนการแจกแจงความน่าจะเป็นได้ดังนี้

      โดยความคาดหมายว่าเหรียญจะขึ้นหัวในการโยน 3 ครั้งจะมีค่าเท่ากับ

สรุป ตัวแปรสุ่มและการแจกแจงความน่าจะเป็น ม.6 - ค่าคาดหมาย (expected value) (1)

      หมายความว่าในการโยนเหรียญ 1 อัน 3 ครั้ง เหรียญจะขึ้นหัวโดยเฉลี่ย 1.5 ครั้ง

นิยาม

      ถ้า X เป็นตัวแปรสุ่มแบบไม่ต่อเนื่องที่มี  f(xi) = P(X = xi)  เป็นฟังก์ชันความน่าจะเป็นแล้ว

      ค่าคาดหมาย (expected value) ของ X เขียนแทนด้วย μx หรือ E(X) จะหาได้จาก

สรุป ตัวแปรสุ่มและการแจกแจงความน่าจะเป็น ม.6 - ค่าคาดหมาย (expected value) (2)

      เมื่อ n แทนจำนวนค่าที่เป็นไปได้ทั้งหมดของตัวแปรสุ่ม X

      และ  x1, x2, x3 , … , xn  แทนค่าที่เป็นไปได้ทั้งหมดของตัวแปรสุ่ม X

      โดยค่าคาดหมายของตัวแปรสุ่มอาจเรียกได้อีกอย่างว่า ค่าเฉลี่ย (mean) ของตัวแปรสุ่ม

สมบัติบางประการของค่าคาดหมายของตัวแปรสุ่ม

      กำหนดให้   X  และ  Y  แทนตัวแปรสุ่ม
                        u(X)  และ  v(X)  เป็นฟังก์ชันของตัวแปรสุ่ม X
                        a  และ  b  เป็นค่าคงตัว

สรุป ตัวแปรสุ่มและการแจกแจงความน่าจะเป็น ม.6 - สมบัติของค่าคาดหมายของตัวแปรสุ่ม

      นอกจากนี้เพื่ออธิบายถึง การกระจายของตัวแปรสุ่ม จึงได้นิยามส่วนเบี่ยงเบนมาตรฐานของตัวแปรสุ่มเพื่อใช้ในการวัดการกระจายของค่าที่เป็นไปได้ของตัวแปรสุ่มว่า มีความแตกต่างจากค่าคาดหมายมากหรือน้อยเพียงใด ดังบทนิยามต่อไปนี้

นิยาม

      ส่วนเบี่ยงเบนมาตรฐานของตัวแปรสุ่มไม่ต่อเนื่อง X เขียนแทนด้วย σx โดย

สรุป ตัวแปรสุ่มและการแจกแจงความน่าจะเป็น ม.6 - ส่วนเบี่ยงเบนมาตรฐานของตัวแปรสุ่มไม่ต่อเนื่อง X (1)

      เมื่อ n แทนจำนวนค่าที่เป็นไปได้ทั้งหมดของตัวแปรสุ่ม X

      และ  x1, x2, x3 , … , xn  แทนค่าที่เป็นไปได้ทั้งหมดของตัวแปรสุ่ม X

      และเรียก  {\sigma^2_{x}}  ว่า ความแปรปรวนของตัวแปรสุ่มไม่ต่อเนื่อง X และยังสามารถเขียนแทนด้วย Var(X) หรือ V(X) โดย

สรุป ตัวแปรสุ่มและการแจกแจงความน่าจะเป็น ม.6 - ส่วนเบี่ยงเบนมาตรฐานของตัวแปรสุ่มไม่ต่อเนื่อง X (2)

สมบัติบางประการของความแปรปรวน

      กำหนดให้  X แทนตัวแปรสุ่ม โดย a และ b เป็นค่าคงตัว

  1. Var(a) = 0
  2. Var(aX) = a2 Var(X)
  3. Var(aX + b) = a2 Var(X)

การแจกแจงเอกรูปไม่ต่อเนื่อง (discrete uniform distribution)

นิยาม

      ให้ X เป็นตัวแปรสุ่มไม่ต่อเนื่อง ถ้าค่าที่เป็นไปได้ทั้งหมดของ X คือ x1, x2, x3, … , xn

      และ  P(X = xi)  =  สำหรับทุก  i ∈ {1, 2, 3, …}  แล้วการแจกแจงความน่าจะเป็นของตัวแปรสุ่ม X จะเป็นการแจกแจงเอกรูปไม่ต่อเนื่อง (discrete uniform distribution)

      กล่าวโดยง่าย คือ การแจกแจงความน่าจะเป็นของตัวแปรสุ่ม X จะเป็นการแจกแจงเอกรูปไม่ต่อเนื่อง (discrete uniform distribution) ก็ต่อเมื่อการเกิดค่าแต่ละค่าที่เป็นไปได้ของตัวแปรสุ่มมีความน่าจะเป็นเท่ากัน และจะได้ว่า

สรุป ตัวแปรสุ่มและการแจกแจงความน่าจะเป็น ม.6 - การแจกแจงเอกรูปไม่ต่อเนื่อง (discrete uniform distribution)

การแจกแจงทวินาม (binomial distribution)

      การแจกแจงทวินาม (binomial distribution) คือ การแจกแจงความน่าจะเป็นของตัวแปรสุ่ม X ซึ่งก็คือจำนวนครั้งของการเกิดผลสำเร็จจากการทดลองสุ่ม n ครั้งที่เป็นอิสระต่อกัน (ผลที่ได้จากการทดลองสุ่มในครั้งก่อนหน้าไม่ส่งผลต่อการทดลองสุ่มในครั้งต่อ ๆ ไป) โดยแต่ละครั้งความน่าจะเป็นของความสำเร็จ คือ p ส่วนความน่าจะเป็นของความไม่สำเร็จ คือ 1 – p

      ถ้า X เป็นตัวแปรสุ่มทวินามแล้วจะเรียกการแจกแจงความน่าจะเป็นของ X ว่า การแจกแจงทวินาม

      เขียนแทนด้วยสัญลักษณ์ X ~ B(n, p) โดยจะเรียก n และ p ว่าพารามิเตอร์ของการแจกแจงทวินามและจะได้ว่า

      ฟังก์ชันความน่าจะเป็น คือ  f(x) = P(X = x) = (^n_x)px (1 – p)n – x  สำหรับทุก  x ∈ {0, 1, 2, 3, … , n}

      โดยค่าเฉลี่ยและความแปรปรวนของการแจกแจงทวินาม คือ  μx = np  และ  {\sigma^2_{x}} = np(1 – p)

สรุป ตัวแปรสุ่มและการแจกแจงความน่าจะเป็น ม.6 - การแจกแจงทวินาม (binomial distribution)

ตัวอย่างข้อสอบสอบเข้ามหาวิทยาลัย พร้อมเฉลย - วิชาคณิตศาสตร์

      ใครอ่านสรุปเนื้อหาคณิตศาสตร์ ม.6 บทสติ ตัวแปรสุ่ม และการแจกแจงความน่าจะเป็น ครบถ้วนทุกหัวข้อแล้ว ก็ได้เวลามาฝึกทำโจทย์กันบ้างแล้วครับ

      ตามที่พี่ได้บอกไปตอนต้นบทความแล้วว่า สถิติ ม.6 เป็นหัวข้อที่ออกสอบบ่อยในข้อสอบสอบเข้ามหาวิทยาลัยในระบบ TCAS พี่จึงรวบรวม ตัวอย่างข้อสอบสอบเข้ามหาวิทยาลัย วิชาคณิตศาสตร์ บทสติ ตัวแปรสุ่ม และการแจกแจงความน่าจะเป็น พร้อมเฉลยละเอียด มาแจกให้น้อง ๆ ได้เรียนรู้แนวโจทย์ ประเมินระดับความยาก – ง่ายของข้อสอบ และฝึกแก้โจทย์กัน ใครพร้อมแล้ว รีบตามพี่มาดูได้เลยครับ!!

• ข้อสอบสถิติ ตัวแปรสุ่ม และการแจกแจงความน่าจะเป็น พร้อมเฉลย [ข้อที่ 1]

ข้อสอบสถิติ ตัวแปรสุ่ม และการแจกแจงความน่าจะเป็น พร้อมเฉลย - ข้อที่ 1 (1)
ข้อสอบสถิติ ตัวแปรสุ่ม และการแจกแจงความน่าจะเป็น พร้อมเฉลย - ข้อที่ 1 (2)

• ข้อสอบสถิติ ตัวแปรสุ่ม และการแจกแจงความน่าจะเป็น พร้อมเฉลย [ข้อที่ 2]

ข้อสอบสถิติ ตัวแปรสุ่ม และการแจกแจงความน่าจะเป็น พร้อมเฉลย - ข้อที่ 2 (1)
ข้อสอบสถิติ ตัวแปรสุ่ม และการแจกแจงความน่าจะเป็น พร้อมเฉลย - ข้อที่ 2 (2)

• ข้อสอบสถิติ ตัวแปรสุ่ม และการแจกแจงความน่าจะเป็น พร้อมเฉลย [ข้อที่ 3]

ข้อสอบสถิติ ตัวแปรสุ่ม และการแจกแจงความน่าจะเป็น พร้อมเฉลย - ข้อที่ 3 (1)
ข้อสอบสถิติ ตัวแปรสุ่ม และการแจกแจงความน่าจะเป็น พร้อมเฉลย - ข้อที่ 3 (2)
ข้อสอบสถิติ ตัวแปรสุ่ม และการแจกแจงความน่าจะเป็น พร้อมเฉลย - ข้อที่ 3 (3)

• ข้อสอบสถิติ ตัวแปรสุ่ม และการแจกแจงความน่าจะเป็น [ข้อที่ 4 - 5]

ข้อสอบสถิติ ตัวแปรสุ่ม และการแจกแจงความน่าจะเป็น พร้อมเฉลย - โจทย์ข้อที่ 4 - 5

• ข้อสอบสถิติ ตัวแปรสุ่ม และการแจกแจงความน่าจะเป็น พร้อมเฉลย [ข้อที่ 4]

ข้อสอบสถิติ ตัวแปรสุ่ม และการแจกแจงความน่าจะเป็น พร้อมเฉลย - ข้อที่ 4 (1)

• ข้อสอบสถิติ ตัวแปรสุ่ม และการแจกแจงความน่าจะเป็น พร้อมเฉลย [ข้อที่ 5]

ข้อสอบสถิติ ตัวแปรสุ่ม และการแจกแจงความน่าจะเป็น พร้อมเฉลย - ข้อที่ 5 (1)
ข้อสอบสถิติ ตัวแปรสุ่ม และการแจกแจงความน่าจะเป็น พร้อมเฉลย - ข้อที่ 5 (2)

      จบกันไปแล้วนะครับ กับ สรุปเนื้อหาบทสถิติ ตัวแปรสุ่ม และการแจกแจงความน่าจะเป็น ม.6 ที่พี่อัดแน่นความรู้ให้น้อง ๆ แบบไม่มีกั๊ก ถึงแม้ว่าบทนี้จะเป็นคณิตศาสตร์บทใหญ่ เนื้อหาเยอะ ออกข้อสอบเยอะ แต่ระดับความยากของข้อสอบนั้นไม่ได้ยากมาก ถ้าน้อง ๆ เรียนด้วยความเข้าใจ จำสูตรได้ และฝึกทำโจทย์บ่อย ๆ ก็สามารถเก็บตุนคะแนนสอบทั้งในโรงเรียนและสนามสอบเข้ามหาวิทยาลัยได้อย่างแน่นอนครับ

      แต่สำหรับน้อง ๆ ม.ปลาย ที่เรียนบทนี้ไม่เข้าใจ หรืออยากติวเพิ่มความฟิตพิชิตเกรด 4 หรือเตรียมพร้อมสำหรับการสอบเข้ามหาวิทยาลัย พี่แนะนำให้สมัคร คอร์สคณิตศาสตร์ ม.ปลาย บทย่อย – สถิติฉบับสมบูรณ์, ตัวแปรสุ่ม และการแจกแจงความน่าจะเป็น เลย ในคอร์สนี้พี่สรุปเนื้อหาไว้อย่างกระชับ เข้าใจง่าย พร้อมพาฝึกฝนทำโจทย์หลากหลายแนว และเสริมเทคนิคทริกลัดแก้โจทย์ไว เพิ่มโอกาสทำคะแนน 🤩

      ใครอยากเก่งคณิต อยากได้โจทย์และเทคนิคดี ๆ จากพี่ ๆ ติวเตอร์ WE MATH รีบกดติดตามก่อนใครได้ที่ช่องทางด้านล่างนี้เลย!

Picture of อ.วิเศษ กี่สุขพันธ์ (พี่เอ๋)

อ.วิเศษ กี่สุขพันธ์ (พี่เอ๋)

ปริญญาตรี-โท วิศวกรรมศาสตร์ จุฬาลงกรณ์มหาวิทยาลัย
ประสบการณ์การสอน 24 ปี

บทความแนะนำ

Top
สอบถามรายละเอียดได้ที่นี่ค่ะ