สวัสดีครับ 😁 พี่เอ๋ – อ.วิเศษ กี่สุขพันธ์ แวะมาเจอกับน้อง ๆ พร้อมหยิบสรุปเนื้อหา สถิติ ม.6 มาฝากกันด้วย
พี่ต้องบอกเลยว่าเนื้อหาคณิตศาสตร์ ม.ปลาย บทสถิติ ตัวแปรสุ่ม และการแจกแจงความน่าจะเป็นเบื้องต้น ถือเป็นบทที่ออกข้อสอบเยอะสุดในทุกปี อย่างในข้อสอบ A-Level คณิตศาสตร์ประยุกต์ 1 ปี 2567 ออกเรื่องสถิติมากถึง 4 ข้อ จากทั้งหมด 30 ข้อ โดยพี่ลิสต์หัวข้อที่ข้อสอบเข้ามหาวิทยาลัยในระบบ TCAS มักจะออกอยู่บ่อย ๆ มาให้แล้ว ดังนี้
- การอ่านค่าข้อมูลจากตารางและแผนภูมิแท่ง
- โจทย์แนววิเคราะห์ที่เกี่ยวข้องกับ ค่ากลาง 3 ตัว ได้แก่ ค่าเฉลี่ยเลขคณิต (µ) มัธยฐาน (Med) และฐานนิยม (Mode) โดยบางครั้งอาจจะมีพิสัย (การกระจาย) มาผสมอยู่ในโจทย์ด้วย
- โจทย์คำนวณการหาค่ากลาง (µ, Med, Mode) จากตารางแจกแจงความถี่ ซึ่งในข้อสอบปีหลัง ๆ จะเป็นตารางแจกแจงความถี่แบบไม่แบ่งเป็นอัตรภาคชั้น
- โจทย์คำนวณค่าเฉลี่ยเลขคณิตรวม หรือ ค่าเฉลี่ยเลขคณิตถ่วงน้ำหนัก
- โจทย์ที่เกี่ยวข้องกับสมบัติของค่ากลาง เช่น
มีค่าน้อยที่สุด หรือ
มีค่าน้อยที่สุด เป็นต้น
- โจทย์วิเคราะห์หรือคำนวณ Qr , Pr หรือ IQR (บางครั้งเกี่ยวข้องกับค่ากลางด้วย โดยเฉพาะ Med)
- โจทย์เกี่ยวกับแผนภาพกล่อง และค่านอกเกณฑ์
- โจทย์เกี่ยวกับส่วนเบี่ยงเบนมาตรฐาน, พิสัยระหว่างควอไทล์ (IQR) หรือความแปรปรวน นิยมออกเกี่ยวกับค่าที่เปลี่ยนแปลงไป (หรือเท่าเดิม) เมื่อมีการบวก, ลบ, คูณ, หาร ข้อมูลด้วยค่าคงทึ่
- โจทย์เกี่ยวกับความแปรปรวน (ดูเรื่องความแปรปรวนรวมด้วย)
- โจทย์เกี่ยวกับการกระจายสัมพัทธ์ ซึ่งได้แก่ สัมประสิทธิ์การแปรผัน
- โจทย์เกี่ยวกับพื้นที่ใต้โค้งปกติกับค่า Z (ออกเกือบทุกปี)
- โจทย์ที่ถามค่าคาดหมายของตัวแปรสุ่ม X
- โจทย์ที่ถามความน่าจะเป็นของการแจกแจงแบบทวินาม
ซึ่ง 13 หัวข้อนี้ เป็นเพียงแค่บางส่วนของแนวข้อสอบเข้ามหาวิทยาลัยที่นิยมออก ถ้าน้อง ๆ อยากจะกวาดคะแนนวิชาคณิตศาสตร์รัว ๆ ก็ต้องอ่านทวนบทสถิติ ม.6 ให้ครบทุกหัวข้อนะครับ
คราวนี้ตามพี่มา เจาะลึกเนื้อหาบทสถิติ ตัวแปรสุ่ม และการแจกแจงความน่าจะเป็นเบื้องต้น ที่น้อง ๆ จะได้เรียนในวิชาคณิตศาสตร์ ม.6 กันต่อเลยดีกว่าครับ ว่าบทนี้มีหัวข้อและเนื้อหาสำคัญอะไรบ้าง …
สถิติ ม.6 : การวัดแนวโน้มเข้าสู่ส่วนกลาง
พี่ขอเริ่มบทสถิติ เนื้อหาคณิตศาสตร์ ม.6 ด้วยหัวข้อ การวัดแนวโน้มเข้าสู่ส่วนกลาง ก่อนเลยครับ ในหัวข้อนี้มีสูตรสถิติสำคัญที่น้อง ๆ ควรทำความเข้าใจและจำให้ได้ดังนี้
• ค่าเฉลี่ยเลขคณิต (
)
กรณีไม่แจกแจงความถี่
1. การคำนวณทั่วไป
กรณีข้อมูลระดับประชากร ค่าเฉลี่ยเลขคณิต นิยมเขียนแทนด้วย μ (มิว)
2. ค่าเฉลี่ยเลขคณิตรวม (
)
โดย N1 , N2 , N3 , … , Nk คือ จำนวนข้อมูลตั้งแต่กลุ่มที่ 1 จนถึงกลุ่มที่ k ซึ่งในสูตรนี้สามารถทอนเป็นอย่างต่ำได้
3. ค่าเฉลี่ยเลขคณิตถ่วงน้ำหนัก (
)
โดย W1 , W2 , W3 , … , WN คือ น้ำหนักของข้อมูลตั้งแต่ตัวที่ 1 จนถึงตัวที่ N ซึ่งในสูตรนี้สามารถทอนเป็นอย่างต่ำได้
4. สมบัติของ (
)
• ค่ามัธยฐาน (Med)
กรณีไม่แจกแจงความถี่
1. การคำนวณทั่วไป
เมื่อเรียงข้อมูลจากน้อยไปมากแล้ว
ขั้นที่ 1 หาตำแหน่ง โดยตำแหน่งของ Med =
ขั้นที่ 2 Med = ค่าของข้อมูลในตำแหน่ง นั้น
2. สมบัติของ Med
• ค่าฐานนิยม (Mode)
กรณีไม่แจกแจงความถี่
Mode = ค่าของข้อมูลที่มีความถี่สูงสุด
• ค่ากลางอื่น ๆ
1. ค่าเฉลี่ยเรขาคณิต (G.M.)
กรณีไม่แจกแจงความถี่
2. ค่าเฉลี่ยฮาร์โมนิก (H.M.)
กรณีไม่แจกแจงความถี่
3. ค่ากึ่งกลางพิสัย (Mid – range)
กรณีไม่แจกแจงความถี่
• การเลือกใช้ค่ากลาง
ใช้ได้ดี เมื่อข้อมูลเป็นข้อมูลเชิงปริมาณที่มีค่าใกล้เคียงกัน
- Med ใช้ได้ดี เมื่อข้อมูลเป็นข้อมูลเชิงปริมาณที่มีข้อมูลบางค่าสูงผิดปกติ หรือต่ำกว่าปกติ (ข้อมูลกระโดด)
- Mode ใช้ได้ดี กับข้อมูลเชิงคุณภาพ
- G.M. ใช้ได้ดี กับข้อมูลที่มีลักษณะเป็นลำดับเรขาคณิต
- H.M. ใช้ได้ดี กับข้อมูลที่เป็นอัตราส่วนเมื่อตัวเศษคงที่ เช่น อัตราเร็วที่ระยะทางคงที่
• ตารางแจกแจงความถี่
1. หาค่า (
)
กรณีแจกแจงความถี่
สูตรที่ 1
- fi = ความถี่ชั้นที่ i ; Xi คือ จุดกลางของชั้นที่ i
สูตรที่ 2
- a = จุดกึ่งกลางของชั้นที่กำหนดให้ d = 0
- di = ตัวเลขสมมติของชั้นที่ i โดยกำหนดให้ชั้นใดชั้นหนึ่ง (นิยมให้ชั้นที่มีความถี่สูงสุด) มี d = 0 และชั้นที่มีค่าข้อมูลน้อยลงให้ d = –1, –2, … และชั้นที่มีค่าข้อมูลมากขึ้นให้ d = 1, 2, …
- I = ความกว้างชั้น (ซึ่งต้องเท่ากันทุกชั้นถ้าจะใช้สูตรที่ 2 นี้)
Note ปกติหากความกว้างของทุกชั้นเท่ากันหมด จะนิยมใช้สูตรที่ 2 เพราะคิดเลขน้อย แต่หากตารางมีความกว้างของแต่ละชั้นไม่เท่ากัน จะใช้สูตรที่ 2 ไม่ได้ ให้ใช้สูตรที่ 1 แทน
Note การกำหนด ห.ร.ม. ของ a และ b เท่ากับ 1 คือ ต้องเป็นเศษส่วนอย่างต่ำ
2. หาค่า Med
กรณีแจกแจงความถี่
ขั้นที่ 1 หาตำแหน่งของ Med =
ขั้นที่ 2 หาค่าของ Med ที่ตำแหน่ง =
โดยหาอันตรภาคชั้นที่ Med อยู่ จะได้ชั้น Med
และ
- L = ขอบล่างของชั้น Med
- I = ความกว้างของชั้น Med
- N = จำนวนข้อมูลทั้งหมด (
= ตำแหน่งของ Med)
- ∑fL = ผลรวมความถี่ชั้นที่มีคะแนนต่ำกว่าชั้น Med
- fMe = ความถี่ชั้น Med
Trick เมื่อตำแหน่งของ Med = ความถี่สะสมของชั้นใด
ค่า Med = ขอบบนของชั้นนั้น
3. หาค่า Mode
กรณีแจกแจงความถี่
Mode จะอยู่ในชั้นที่มีความถี่สูงสุด
สูตรที่ 1
Mode = จุดกึ่งกลางของชั้น Mode (ชั้นที่มีความถี่สูงสุด)
สูตรที่ 2
Mode = L + I
- L = ขอบล่างของชั้น Mode
- I = ความกว้างของชั้น Mode
- d1 = ผลต่างความถี่ระหว่างชั้น Mode กับชั้นที่คะแนนต่ำกว่า (หนังสือบางเล่มใช้ dL)
- d2 = ผลต่างความถี่ระหว่างชั้น Mode กับชั้นที่คะแนนสูงกว่า (หนังสือบางเล่มใช้ dU)
Note
- โดยปกติ Mode จากสูตรที่ 1 และ สูตรที่ 2 มีค่าไม่เท่ากัน คำตอบจึงขึ้นอยู่กับว่า คนแต่งโจทย์ใช้สูตรใดในการคิดคำตอบ
- Mode อาจมีได้ 2 ตัว หากทั้ง 2 ตัวนั้นมีความถี่สูงสุดซึ่งเท่ากัน
- ทั้ง 2 สูตรจะใช้เมื่อ I เท่ากันทุกชั้น ถ้า I ไม่เท่าให้ใช้
แทน f
เพิ่มเติม
ค่ากลางอื่น ๆ กรณีข้อมูลแจกแจงความถี่
• การวัดแนวโน้มเข้าสู่ส่วนกลาง อื่น ๆ
1. การแจกแจงความถี่โดยใช้กราฟ
ฮีสโทแกรม คือ กราฟแท่ง โดยแกนแนวนอนแทนค่าของตัวแปร ความกว้างของแท่งแทนความกว้างของแต่ละชั้น แต่ถ้าความกว้างของแต่ละชั้นไม่เท่ากัน ความสูงแต่ละแท่งจะแทนด้วยอัตราส่วนของความถี่ต่อความกว้างของชั้นนั้น
รูปหลายเหลี่ยมของความถี่ คือ รูปหลายเหลี่ยมที่ได้จากการโยงจุดกึ่งกลางของแท่งมุมฉากของฮีสโทแกรมด้วยเส้นตรง
เส้นโค้งของความถี่ คือ เส้นโค้งที่ได้จากการปรับด้านของรูปหลายเหลี่ยมของความถี่ให้เรียบขึ้น
เส้นโค้งของความถี่สะสม คือ เส้นโค้งที่เกิดจากการเขียนกราฟระหว่างค่าของข้อมูลกับความถี่สะสมโดยโยงเชื่อมจุดต่าง ๆ ด้วยเส้นตรงแล้วปรับให้เป็นเส้นโค้งเรียบ
2. แผนภาพต้นใบ
Note ถ้าจะหา Med , Pr , Dr , Qr จากแผนภาพต้นใบ อย่าลืมเรียงใบก่อน จากน้อยไปมาก
สถิติ ม.6 : การวัดตำแหน่งข้อมูล
หัวข้อต่อมาของบทสถิติ ม.6 ก็คือ การวัดตำแหน่งข้อมูล ครับ ซึ่งในหัวข้อนี้น้อง ๆ จะได้ทำความรู้จักกับ ควอไทล์, เดไซล์ และเปอร์เซ็นต์ไทล์ รวมทั้งสามารถหาตำแหน่งของข้อมูลได้
• หาควอไทล์ (Qr), เดไซล์ (Dr) และเปอร์เซ็นต์ไทล์ (Pr)
กรณีไม่แจกแจงความถี่
เมื่อเรียงข้อมูลแล้วจากน้อยไปมาก
ขั้นที่ 1 หาตำแหน่งโดย
ตำแหน่ง Qr = (N + 1)
ตำแหน่ง Dr = (N + 1)
ตำแหน่ง Pr = (N + 1)
ขั้นที่ 2 หาค่าของข้อมูลในตำแหน่งนั้น
• หา Qr, Dr, Pr จากตารางแจกแจงความถี่
กรณีแจกแจงความถี่
ขั้นที่ 1 หาตำแหน่งโดย
ตำแหน่ง Qr = (N)
ตำแหน่ง Dr = (N)
ตำแหน่ง Pr = (N)
ขั้นที่ 2 หาค่าของข้อมูลในตำแหน่งนั้น (จากขั้นที่ 1) โดยหาชั้นที่ตำแหน่งนั้นอยู่ก่อนแล้ว
Note
- เมื่อตำแหน่ง = ความถี่สะสมของชั้นใด
Qr, Dr, Pr ที่ต้องการ = ขอบบนของชั้นนั้น - P50 = D5 = Q2 = Med
สถิติ ม.6 : การวัดการกระจาย
สำหรับหัวข้อ การวัดการกระจาย ในบทสถิติ ม.6 นี้ น้อง ๆ จะได้เรียนรู้เรื่องการวัดการกระจายของข้อมูล ซึ่งแบ่งออกเป็น 2 วิธี คือ การกระจายสัมบูรณ์ และ การกระจายสัมพัทธ์ ครับ
• การกระจายสัมบูรณ์
- พิสัย = XMax – XMin
- พิสัยระหว่างควอไทล์ (IQR) = Q3 – Q1
- ส่วนเบี่ยงเบนมาตรฐาน (S.D.)
• ความแปรปรวน (S.D.2)
1. การคำนวณทั่วไป
2. ความแปรปรวนรวม (
)
เพิ่มเติม
การหาการกระจายสัมบูรณ์จากตารางแจกแจงความถี่
พิสัย = ขอบบนสูงสุด – ขอบล่างต่ำสุด
IQR = Q3 – Q1
เมื่อ Xi = จุดกึ่งกลางชั้นที่ i และ fi = ความถี่ชั้นที่ i
• การกระจายสัมพัทธ์
• การวัดการกระจาย อื่น ๆ
1. เส้นโค้งความถี่
การเปรียบเทียบการกระจายจากเส้นโค้งความถี่ปกติ ในกรณีที่ เท่ากัน
- กระจายน้อย กราฟจะโด่งมาก (ดี)
- กระจายมาก กราฟจะโด่งน้อย หรือค่อนข้างแบน (ไม่ดี)
เพิ่มเติม
สำหรับข้อมูลที่มีการกระจายเป็นโค้งเกือบปกติ | – Mode| = 3|
– Med|
2. แผนภาพกล่อง และค่านอกเกณฑ์
แผนภาพกล่อง (Box plot หรือ Box and whisker plot) เป็นแผนภาพที่ใช้ในการนำเสนอ หรือวิเคราะห์การกระจายของข้อมูล โดยแผนภาพกล่องจะประกอบด้วย ค่าต่ำสุด, ค่าสูงสุด, ควอร์ไทล์ที่ 1 (Q1), ควอร์ไทล์ที่ 2 (Q2) และ ควอร์ไทล์ที่ 3 (Q3)
นอกจากนี้แผนภาพกล่องสามารถใช้ในการตรวจสอบว่ามีข้อมูลที่แตกต่างไปจากข้อมูลส่วนใหญ่หรือไม่ โดยจะเรียกข้อมูลดังกล่าวว่า ค่านอกเกณฑ์ (Outlier)
ค่านอกเกณฑ์ (Outlier) คือ ค่าสุดโต่งของข้อมูล เป็นค่าที่สูงหรือต่ำผิดปกติของข้อมูล โดยทั่วไปเราจะให้ข้อมูลนั้นเป็นค่านอกเกณฑ์เมื่อ
ข้อมูลมีค่าน้อยกว่า Q1 – 1.5IQR (Lower fence)
หรือ ข้อมูลมีค่ามากกว่า Q3 + 1.5IQR (Upper fence)
โดย IQR = Q3 – Q1
สำคัญ!!
* ค่านอกเกณฑ์อาจเป็นค่าจริงที่เกิดขึ้นตามธรรมชาติ หรืออาจเกิดจากความคลาดเคลื่อนจากการวัดหรือเก็บข้อมูลก็ได้
** ในกรณีที่ข้อมูลไม่มีค่านอกเกณฑ์ : แต่ละช่วงของแผนภาพกล่องจะมีจำนวนข้อมูลประมาณ 25% ของจำนวนข้อมูลทั้งหมด
แต่ในกรณีที่ข้อมูลมีค่านอกเกณฑ์ : ข้อมูลที่อยู่ในช่วงหนวดของแผนภาพจะมีจำนวนข้อมูลไม่ถึง 25% ของจำนวนข้อมูลทั้งหมด
3. สมบัติต่าง ๆ ของการกระจาย และความแปรปรวนกับความสัมพันธ์เชิงเส้น
- ถ้านำ C บวกข้อมูลทุกตัว “กระจายใหม่ = กระจายเดิม” เช่น SDใหม่ = SDเดิม
- ถ้านำ C คูณข้อมูลทุกตัว “กระจายใหม่ = |c| ⋅ กระจายเดิม” เช่น SDใหม่ = |c| ⋅ SDเดิม
- ถ้าข้อมูลชุด x และชุด y มีความสัมพันธ์กันโดย yi = cxi + d (เชิงเส้น) จะได้ว่า
3.1= c
+ d , Medy = cMedx + d , Modey = cModex + d
3.2 SDy = |c|SDx , IQRy = |c|IQRx
และ พิสัยy = |c| พิสัยx
IQRy = |c| IQRx
3.3 SD= c2SD
4. THE 95% RULE
กล่าวว่า “โดยทั่วไปไม่ว่าข้อมูลจะมีการกระจายในลักษณะใด จะมีข้อมูลอยู่ประมาณ 95% ของข้อมูลทั้งหมดอยู่ในช่วง ( – 2 SD ,
+ 2 SD)”
สถิติ ม.6 : ค่ามาตรฐาน (Z)
หัวข้อต่อมาของบทสถิติ ในเนื้อหาคณิตศาสตร์ ม.6 ที่พี่จะพาน้อง ๆ ไปดูกัน คือ ค่ามาตรฐาน (Z) ครับ โดยค่ามาตรฐานเป็นค่าที่ใช้เปรียบเทียบข้อมูลตั้งแต่ 2 ค่าขึ้นไป (ที่มาจากข้อมูลคนละชุด) ว่ามีความแตกต่างกันยังไง
• การคำนวณทั่วไป
• สมบัติของ Z
• Z กับพื้นที่ใต้โค้งปกติ
ข้อควรรู้
1. พื้นที่ใต้เส้นโค้งทั้งหมดจะมีเท่ากับ 1 หรือ 100%
2. เส้นโค้งที่พิจารณาเป็นโค้งปกติ
ดังนั้นจึงสมมาตรกับแกนกลาง (แนวดิ่ง) และแบ่งพื้นที่ออกเป็นข้างละ 0.5 (50%) ค่าตรงกลางนี้จะเท่ากับ เท่ากับ Med เท่ากับ Mode และเมื่อนำค่าไปคำนวณ Z ได้ Z = 0
3. พื้นที่ที่ระบุจากตาราง คือ พื้นที่ซึ่งวัดจากซ้ายสุด (Zmin) ไปถึงตำแหน่ง Z ใด ๆ เช่น
4. เมื่อทราบพื้นที่ใต้โค้งทางด้านซ้ายของข้อมูล จะทำให้ทราบว่าข้อมูลนั้นตรงกับเปอร์เซ็นไทล์ที่เท่าใด เช่น
Note จำนวนข้อมูลในพื้นที่แรเงานั้น หาได้จากการเอา พ.ท.แรเงา x จำนวนข้อมูลทั้งหมด เช่น ในกรณีถ้ามีจำนวนข้อมูลทั้งหมด 1,000 ตัว จะมีข้อมูลใน พ.ท.แรเงา ซึ่งมีค่า Z น้อยกว่า 0.97 อยู่ 0.834 x 1000 = 834 ตัวนั่นเอง
ตัวแปรสุ่มและการแจกแจงความน่าจะเป็น ม.6
สำหรับเนื้อหาคณิตศาสตร์ ม.ปลาย เรื่อง ตัวแปรสุ่มและการแจกแจงความน่าจะเป็น เป็นเนื้อหาที่ถูกเพิ่มเข้ามาในหลักสูตรใหม่ของ สสวท. (ฉบับปรับปรุงปี 2560) ที่น้อง ๆ จะได้เรียนกันตอน ม.6 เทอม 2 ซึ่งพี่สรุปหัวข้อสำคัญไว้ให้แล้ว ตามมาดูกันเลยครับ
• ความหมายและชนิดของตัวแปรสุ่ม
นิยาม
ตัวแปรสุ่ม (random variable) คือ ฟังก์ชันจากปริภูมิตัวอย่าง (sample space, S) ของการทดลองสุ่มไปยังเซตของจำนวนจริง เขียนแทนด้วย X หรือกล่าวง่าย ๆ ว่า ตัวแปรสุ่มเป็นฟังก์ชันซึ่งมีโดเมนเป็นแซมเปิลสเปซ และมีเรนจ์เป็นเซตของเลขจำนวนจริงที่กำหนดมาจากสมาชิกในแซมเปิลสเปซ โดยเซตของค่าต่าง ๆ ที่เป็นเรนจ์จะเรียกว่า range space เขียนแทนด้วย Rx และสมาชิกทุกตัวของเรนจ์จะเรียกว่า ค่าของตัวแปรสุ่ม เขียนแทนด้วย x
• รูปแบบของตัวแปรสุ่ม
โดยทั่วไปตัวแปรสุ่มจะแบ่งได้ 2 ชนิด ตามลักษณะค่าที่เป็นไปได้ของตัวแปรสุ่มดังนี้
- ตัวแปรสุ่มไม่ต่อเนื่อง (discrete random variable) คือ ตัวแปรสุ่มที่ค่าที่เป็นไปได้ทั้งหมด เป็นเซตที่สามารถเขียนแบบแจกแจงสมาชิกได้ โดยอาจเป็นเซตจำกัดหรือเซตอนันต์ก็ได้
- ตัวแปรสุ่มต่อเนื่อง (continuous random variable) คือ ตัวแปรสุ่มที่ค่าที่เป็นไปได้ทั้งหมดเป็นช่วงที่เป็นสับเซตของ R
• ความน่าจะเป็นของตัวแปรสุ่ม
ถ้า A เป็นเหตุการณ์ในแซมเปิลสเปซ จะสามารถหาค่าความน่าจะเป็นของเหตุการณ์ A คือ ค่า P(A) ได้ และเมื่อเราให้ X เป็นตัวแปรสุ่มซึ่งกำหนดมาจากแซมเปิลสเปซดังกล่าว ผลลัพธ์ต่าง ๆ ในเหตุการณ์ A ก็ย่อมถูกกำหนดเป็นตัวเลข ดังนั้นค่าความน่าจะเป็นของตัวแปรสุ่มที่กำหนดเหตุการณ์ A ก็จะเท่ากับความน่าจะเป็นของเหตุการณ์ A จากตัวอย่างที่ 1 เมื่อ A คือ เหตุการณ์ที่เหรียญจะขึ้นหัว 2 อัน จะได้ว่า A = {HHT, HTH, THH} ซึ่งเป็นเหตุการณ์ที่ X = 2 จะเห็นว่า P(A) = P(X = 2) =
และเมื่อเรานำความน่าจะเป็นของการเกิดค่าแต่ละค่าที่เป็นไปได้ทั้งหมดของตัวแปรสุ่ม มาเขียนแสดงเพื่ออธิบายลักษณะของตัวแปรสุ่มจะเรียกว่า การแจกแจงความน่าจะเป็น (probability distribution) โดยอาจเขียนแสดงในรูปตารางหรือกราฟก็ได้ จากตัวอย่างที่ 1 ในการโยนเหรียญที่เที่ยงตรง 1 เหรียญ 3 ครั้ง เมื่อให้ตัวแปรสุ่ม X = จำนวนเหรียญที่ขึ้นหัว จะสามารถเขียนการแจกแจงความน่าจะเป็นได้ดังนี้
• การแจกแจงความน่าจะเป็นของตัวแปรสุ่ม (probability distribution)
การแจกแจงความน่าจะเป็นของตัวแปรสุ่ม จะสามารถแบ่งได้ 2 ประเภท ดังนี้
- การแจกแจงความน่าจะเป็นของตัวแปรสุ่มไม่ต่อเนื่อง (discrete probability distribution)
- การแจกแจงความน่าจะเป็นของตัวแปรสุ่มต่อเนื่อง (continuous probability distribution)
นิยาม
การแจกแจงความน่าจะเป็นของตัวแปรสุ่มไม่ต่อเนื่อง (discrete probability distribution)
ถ้า X เป็นตัวแปรสุ่มแบบไม่ต่อเนื่องซึ่งมีค่าเป็น x1, x2, x3 , … , xn ฟังก์ชันซึ่งกำหนดโดย f(xi) = P(X = xi)
เมื่อ i = 1, 2, 3,…, n จะเรียกฟังก์ชันดังกล่าวว่าเป็น ฟังก์ชันของความน่าจะเป็น (probability function) โดย f(xi) มีสมบัติ 2 ข้อ คือ
โดยทั่วไปเราจะเขียน f(x) = P(X = x) แทนที่จะเขียน f(xi) = P(X = xi)
• ค่าคาดหมายและส่วนเบี่ยงเบนมาตรฐานของตัวแปรสุ่ม
ค่าคาดหมาย (expected value) คือ ผลของความน่าจะเป็นกับผลประโยชน์ที่เราจะได้รับเมื่อสิ่ง ๆ นั้นได้เกิดขึ้น หรือในทางสถิติศาสตร์ คือ ค่าเฉลี่ยถ่วงน้ำหนัก (weighted average) ของทุก ๆ ค่าที่เป็นไปได้ของตัวแปรสุ่ม เช่น จากตัวอย่างที่ 1 ในการโยนเหรียญที่เที่ยงตรง 1 เหรียญ 3 ครั้ง เมื่อให้ตัวแปรสุ่ม X = จำนวนเหรียญที่ขึ้นหัว จะสามารถเขียนการแจกแจงความน่าจะเป็นได้ดังนี้
โดยความคาดหมายว่าเหรียญจะขึ้นหัวในการโยน 3 ครั้งจะมีค่าเท่ากับ
หมายความว่าในการโยนเหรียญ 1 อัน 3 ครั้ง เหรียญจะขึ้นหัวโดยเฉลี่ย 1.5 ครั้ง
นิยาม
ถ้า X เป็นตัวแปรสุ่มแบบไม่ต่อเนื่องที่มี f(xi) = P(X = xi) เป็นฟังก์ชันความน่าจะเป็นแล้ว
ค่าคาดหมาย (expected value) ของ X เขียนแทนด้วย μx หรือ E(X) จะหาได้จาก
เมื่อ n แทนจำนวนค่าที่เป็นไปได้ทั้งหมดของตัวแปรสุ่ม X
และ x1, x2, x3 , … , xn แทนค่าที่เป็นไปได้ทั้งหมดของตัวแปรสุ่ม X
โดยค่าคาดหมายของตัวแปรสุ่มอาจเรียกได้อีกอย่างว่า ค่าเฉลี่ย (mean) ของตัวแปรสุ่ม
• สมบัติบางประการของค่าคาดหมายของตัวแปรสุ่ม
กำหนดให้ X และ Y แทนตัวแปรสุ่ม
u(X) และ v(X) เป็นฟังก์ชันของตัวแปรสุ่ม X
a และ b เป็นค่าคงตัว
นอกจากนี้เพื่ออธิบายถึง การกระจายของตัวแปรสุ่ม จึงได้นิยามส่วนเบี่ยงเบนมาตรฐานของตัวแปรสุ่มเพื่อใช้ในการวัดการกระจายของค่าที่เป็นไปได้ของตัวแปรสุ่มว่า มีความแตกต่างจากค่าคาดหมายมากหรือน้อยเพียงใด ดังบทนิยามต่อไปนี้
นิยาม
ส่วนเบี่ยงเบนมาตรฐานของตัวแปรสุ่มไม่ต่อเนื่อง X เขียนแทนด้วย σx โดย
เมื่อ n แทนจำนวนค่าที่เป็นไปได้ทั้งหมดของตัวแปรสุ่ม X
และ x1, x2, x3 , … , xn แทนค่าที่เป็นไปได้ทั้งหมดของตัวแปรสุ่ม X
และเรียก ว่า ความแปรปรวนของตัวแปรสุ่มไม่ต่อเนื่อง X และยังสามารถเขียนแทนด้วย Var(X) หรือ V(X) โดย
• สมบัติบางประการของความแปรปรวน
กำหนดให้ X แทนตัวแปรสุ่ม โดย a และ b เป็นค่าคงตัว
- Var(a) = 0
- Var(aX) = a2 Var(X)
- Var(aX + b) = a2 Var(X)
• การแจกแจงเอกรูปไม่ต่อเนื่อง (discrete uniform distribution)
นิยาม
ให้ X เป็นตัวแปรสุ่มไม่ต่อเนื่อง ถ้าค่าที่เป็นไปได้ทั้งหมดของ X คือ x1, x2, x3, … , xn
และ P(X = xi) = สำหรับทุก i ∈ {1, 2, 3, …} แล้วการแจกแจงความน่าจะเป็นของตัวแปรสุ่ม X จะเป็นการแจกแจงเอกรูปไม่ต่อเนื่อง (discrete uniform distribution)
กล่าวโดยง่าย คือ การแจกแจงความน่าจะเป็นของตัวแปรสุ่ม X จะเป็นการแจกแจงเอกรูปไม่ต่อเนื่อง (discrete uniform distribution) ก็ต่อเมื่อการเกิดค่าแต่ละค่าที่เป็นไปได้ของตัวแปรสุ่มมีความน่าจะเป็นเท่ากัน และจะได้ว่า
• การแจกแจงทวินาม (binomial distribution)
การแจกแจงทวินาม (binomial distribution) คือ การแจกแจงความน่าจะเป็นของตัวแปรสุ่ม X ซึ่งก็คือจำนวนครั้งของการเกิดผลสำเร็จจากการทดลองสุ่ม n ครั้งที่เป็นอิสระต่อกัน (ผลที่ได้จากการทดลองสุ่มในครั้งก่อนหน้าไม่ส่งผลต่อการทดลองสุ่มในครั้งต่อ ๆ ไป) โดยแต่ละครั้งความน่าจะเป็นของความสำเร็จ คือ p ส่วนความน่าจะเป็นของความไม่สำเร็จ คือ 1 – p
ถ้า X เป็นตัวแปรสุ่มทวินามแล้วจะเรียกการแจกแจงความน่าจะเป็นของ X ว่า การแจกแจงทวินาม
เขียนแทนด้วยสัญลักษณ์ X ~ B(n, p) โดยจะเรียก n และ p ว่าพารามิเตอร์ของการแจกแจงทวินามและจะได้ว่า
ฟังก์ชันความน่าจะเป็น คือ f(x) = P(X = x) = px (1 – p)n – x สำหรับทุก x ∈ {0, 1, 2, 3, … , n}
โดยค่าเฉลี่ยและความแปรปรวนของการแจกแจงทวินาม คือ μx = np และ = np(1 – p)
ตัวอย่างข้อสอบสอบเข้ามหาวิทยาลัย พร้อมเฉลย - วิชาคณิตศาสตร์
ใครอ่านสรุปเนื้อหาคณิตศาสตร์ ม.6 บทสติ ตัวแปรสุ่ม และการแจกแจงความน่าจะเป็น ครบถ้วนทุกหัวข้อแล้ว ก็ได้เวลามาฝึกทำโจทย์กันบ้างแล้วครับ
ตามที่พี่ได้บอกไปตอนต้นบทความแล้วว่า สถิติ ม.6 เป็นหัวข้อที่ออกสอบบ่อยในข้อสอบสอบเข้ามหาวิทยาลัยในระบบ TCAS พี่จึงรวบรวม ตัวอย่างข้อสอบสอบเข้ามหาวิทยาลัย วิชาคณิตศาสตร์ บทสติ ตัวแปรสุ่ม และการแจกแจงความน่าจะเป็น พร้อมเฉลยละเอียด มาแจกให้น้อง ๆ ได้เรียนรู้แนวโจทย์ ประเมินระดับความยาก – ง่ายของข้อสอบ และฝึกแก้โจทย์กัน ใครพร้อมแล้ว รีบตามพี่มาดูได้เลยครับ!!
• ข้อสอบสถิติ ตัวแปรสุ่ม และการแจกแจงความน่าจะเป็น พร้อมเฉลย [ข้อที่ 1]
• ข้อสอบสถิติ ตัวแปรสุ่ม และการแจกแจงความน่าจะเป็น พร้อมเฉลย [ข้อที่ 2]
• ข้อสอบสถิติ ตัวแปรสุ่ม และการแจกแจงความน่าจะเป็น พร้อมเฉลย [ข้อที่ 3]
• ข้อสอบสถิติ ตัวแปรสุ่ม และการแจกแจงความน่าจะเป็น [ข้อที่ 4 - 5]
• ข้อสอบสถิติ ตัวแปรสุ่ม และการแจกแจงความน่าจะเป็น พร้อมเฉลย [ข้อที่ 4]
• ข้อสอบสถิติ ตัวแปรสุ่ม และการแจกแจงความน่าจะเป็น พร้อมเฉลย [ข้อที่ 5]
จบกันไปแล้วนะครับ กับ สรุปเนื้อหาบทสถิติ ตัวแปรสุ่ม และการแจกแจงความน่าจะเป็น ม.6 ที่พี่อัดแน่นความรู้ให้น้อง ๆ แบบไม่มีกั๊ก ถึงแม้ว่าบทนี้จะเป็นคณิตศาสตร์บทใหญ่ เนื้อหาเยอะ ออกข้อสอบเยอะ แต่ระดับความยากของข้อสอบนั้นไม่ได้ยากมาก ถ้าน้อง ๆ เรียนด้วยความเข้าใจ จำสูตรได้ และฝึกทำโจทย์บ่อย ๆ ก็สามารถเก็บตุนคะแนนสอบทั้งในโรงเรียนและสนามสอบเข้ามหาวิทยาลัยได้อย่างแน่นอนครับ
แต่สำหรับน้อง ๆ ม.ปลาย ที่เรียนบทนี้ไม่เข้าใจ หรืออยากติวเพิ่มความฟิตพิชิตเกรด 4 หรือเตรียมพร้อมสำหรับการสอบเข้ามหาวิทยาลัย พี่แนะนำให้สมัคร คอร์สคณิตศาสตร์ ม.ปลาย บทย่อย – สถิติฉบับสมบูรณ์, ตัวแปรสุ่ม และการแจกแจงความน่าจะเป็น เลย ในคอร์สนี้พี่สรุปเนื้อหาไว้อย่างกระชับ เข้าใจง่าย พร้อมพาฝึกฝนทำโจทย์หลากหลายแนว และเสริมเทคนิคทริกลัดแก้โจทย์ไว เพิ่มโอกาสทำคะแนน 🤩
ใครอยากเก่งคณิต อยากได้โจทย์และเทคนิคดี ๆ จากพี่ ๆ ติวเตอร์ WE MATH รีบกดติดตามก่อนใครได้ที่ช่องทางด้านล่างนี้เลย!
- Facebook Page : WE BY THE BRAIN
- Instagram : webythebrain
- Youtube : WE BY THE BRAIN
- Tiktok : คณิต เดอะเบรน
- Lemon8 : คณิต เดอะเบรน
อ.วิเศษ กี่สุขพันธ์ (พี่เอ๋)
ปริญญาตรี-โท วิศวกรรมศาสตร์ จุฬาลงกรณ์มหาวิทยาลัย
ประสบการณ์การสอน 24 ปี