ความน่าจะเป็นเบื้องต้นสำหรับเขียนโปรแกรม บทที่ ๘: ความหนาแน่นของความน่าจะเป็นของค่าแบบต่อเนื่อง

เขียนเมื่อ 2020/07/25 19:12

แก้ไขล่าสุด 2021/09/28 16:42

ต่อจาก บทที่ ๗

ในบทนี้จะเข้าสู่เรื่องของความน่าจะเป็นของปริมาณที่เป็นค่าต่อเนื่อง ซึ่งเป็นเนื้อหาที่มีความเป็นนามธรรมเข้าใจยากกว่าปริมาณที่เป็นค่าไม่ต่อเนื่องดังในบทที่ผ่านมา

อะไรคือต่อเนื่องกับไม่ต่อเนื่อง

ในบทที่ผ่านมาเป็นการพูดถึงปริมาณที่นับได้แน่นอน มีจุดชัดเจนว่าจะมีค่าเท่าใดได้บ้าง และพิจารณาแค่ค่าที่มีอยู่และความเป็นไปได้ของค่านั้น เช่นแต้มลูกเต๋า จำนวนไอเท็มที่ดร็อปได้

ปริมาณแบบนั้นเรียกว่าเป็นค่าไม่ต่อเนื่อง (离散, discrete)

ค่าไม่ต่อเนื่องมีจำนวนแน่นอน ส่วนใหญ่จะเป็นจำนวนเต็ม แต่ก็ไม่จำเป็น เช่นถ้าพูดถึงคะแนนสอบซึ่งมีการให้ 0.5 ด้วย แบบนั้นคะแนนสอบก็ถือเป็นค่าไม่ต่อเนื่องได้

แต่ปริมาณทั่วไปหลายสิ่งที่พบในธรรมชาติไม่ได้เป็นเช่นนั้น เช่นเวลา (วินาที) น้ำหนัก (กก.) ส่วนสูง (ซม.) ระยะทาง (กม.) ฯลฯ ค่าอาจเป็นเท่าไหร่ก็ได้ ไม่มีค่าที่เรียกว่าพอดีเป๊ะเท่านั้นจริงๆ

เช่นถ้าบอกว่าหนัก 50 กิโลกรัม ปกติแล้วก็ไม่ได้หมายความว่าหนัก 50 เป๊ะ แค่หนักประมาณเท่านั้น ถ้าไปวัดให้ละเอียดอาจจะเป็น 50.01234567 มีทศนิยมค่าเล็กๆซึ่งถูกปักทิ้งอยู่อีกมากมายไม่สิ้นสุด

ปริมาณแบบนี้เรียกว่าเป็นค่าต่อเนื่อง (连续, continuous)

อาจนึกภาพประมาณนี้

นอกจากนี้แล้ว ตัวค่าความน่าจะเป็นเองก็ถือเป็นปริมาณต่อเนื่องเช่นกัน เพราะมีค่าเท่าไหร่ก็ได้ตั้งแต่ 0 ถึง 1 และเรื่องของ "ความน่าจะเป็นของความน่าจะเป็น" ก็เป็นเนื้อหาสำคัญอย่างหนึ่งที่น่ากล่าวถึงเช่นกัน

เมื่อมาคิดเรื่องของความน่าจะเป็นสำหรับค่าต่อเนื่อง จะมีวิธีคิดที่ต่าไปต่างค่าแบบไม่ต่อเนื่อง แม้ส่วนใหญ่จะเทียบเคียงกันได้ แต่มักจะยากกว่า เป็นนามธรรมมากกว่า ต้องใช้จินตนาการเพิ่มเติมมากกว่า

ฟังก์ชันความหนาแน่นของความน่าจะเป็น

เมื่อพูดถึงเรื่องความน่าจะเป็นของค่าต่อเนื่อง ประเด็นน่าสนใจที่มักจะพูดถึงก็คือการที่ค่าความน่าจะเป็นของจุดใดๆจะเป็น 0 เสมอ

สาเหตุเนื่องจากว่าค่าต่อเนื่องไม่มีค่าใดๆที่เป็นค่าเป๊ะๆ ดังนั้นถ้าคิดจะหาค่าความน่าจะเป็นของค่าใดค่าหนึ่งที่แน่นอน ก็ย่อมจะได้ 0 เสมอ

$\begin{align} P(น้ำหนัก\;50\;กก.) = 0 \\ P(สูง\;160\;ซม.) = 0 \end{align}$

แต่ความน่าจะเป็นเป็นสิ่งที่ต้องรวมกันหมดแล้วได้ 1 ถ้ามีแต่ 0 บวกกันแล้วจะกลายเป็น 1 ได้อย่างไร? นี่เป็นความจริงอย่างหนึ่งที่ชวนให้สับสน แต่โลกนี้ก็เต็มไปด้วยอะไรที่เหนือสามัญสำนึกแบบนี้อยู่มากมายจริงๆ

เมื่อค่าไม่ได้เป็นจุดๆที่ไม่ต่อเนื่องที่จะแยกได้ชัดแบบนี้จึงไม่มีความหมายอะไรที่จะหาความน่าจะเป็นของค่านั้นพอดี แต่จะพิจารณาเป็นช่วงๆแทน เช่น P(50 กก. ≤ น้ำหนัก ≤ 55 กก.) หรือ P(160 ซม. ≤ สูง ≤ 165 ซม.) แบบนี้จึงจะมีค่า

เมื่อพูดถึงการแจกแจงความน่าจะเป็นของค่าแบบต่อเนื่อง ความน่าจะเป็นในแต่ละช่วงมักจะคำนวณโดยพิจารณาจากฟังก์ชันความหนาแน่นของความน่าจะเป็น (概率密度函数, probability density function) ซึ่งเป็นตัวบอกว่าในบริเวณนั้นมีความน่าจะเป็นเท่าใด

ให้ f_X(x) เป็นฟังก์ชันความหนาแน่นของความน่าจะเป็น จะได้ว่าความน่าจะเป็นในช่วงระหว่าง a ถึง b เป็นปริพันธ์จำกัดเขต (definite integral) ในช่วง a ถึง b

$\begin{align} P(a < X < b) = \int_a^b f_X(x) dx \end{align}$

หากวาดกราฟของ f_X(x) แล้ว ความน่าจะเป็นภายในช่วงก็จะเท่ากับพื้นที่ใต้กราฟในช่วงนั้น

ความน่าจะเป็นรวมทั้งหมดต้องได้ 1 ดังนั้นผลรวมของพื้นที่ไต้กราฟทั้งหมดตั้งแต่ -∞ ไปจนถึง ∞ ก็จะต้องเป็น 1 เสมอ

$\begin{align} P(-\infty < X < \infty) = \int_{-\infty}^{\infty} f_X(x) dx = 1 \end{align}$

การแจกแจงเอกรูปต่อเนื่อง

เพื่อเป็นตัวอย่างวิธีการใช้ฟังก์ชันการแจกแจงความหนาแน่นเพื่อคำนวณความน่าจะเป็น เริ่มจากขอยกตัวอย่างรูปแบบการแจกแจงความหนาแน่นความน่าจะเป็นที่เข้าใจง่ายที่สุด นั่นก็คือ การแจกแจงเอกรูปต่อเนื่อง (连续型均勻分布, continuous uniform distribution)

คำว่า "เอกรูป" อาจฟังดูไม่คุ้น แต่ก็แปลได้ตรงตัว "เอก" คือ 1 "รูป" ก็คือรูป จึงหมายถึงเป็นการแจงที่มีอยู่รูปแบบเดียวตลอดทั้งหมดในขอบเขตช่วงหนึ่ง

ถ้าฟังก์ชัน f_X แจกแจงแบบเอกรูปต่อเนื่อง จะได้ว่า

$\begin{align} f_X(x) = \left\{\begin{matrix} \frac{1}{b-a} & เมื่อ\;a \le x \le b \\ 0 & ที่อื่น \end{matrix}\right. \end{align}$

ที่มีตัวหาร b-a อยู่ก็เพื่อให้พื้นที่ใต้กราฟรวมได้เท่ากับ 1

เมื่อวาดกราฟก็จะออกมาเป็นลักษณะที่ราบสูงแบบนี้

โดยทั่วไปการแจกแจงจะอยู่แค่ในช่วงใดช่วงหนึ่งที่แน่นอนเท่านั้น เพราะพื้นที่ใต้กราฟต้องรวมแล้วได้ค่าจำกัดเท่ากับ 1 ดังนั้นความสูงของที่ราบก็จะแปรผกผันกับความกว้างของที่ราบ

ในที่นี้ใช้เครื่องหมายน้อยกว่าหรือเท่ากับ (≤) ก็จริง แต่จริงๆจะใช้น้อยกว่า (<) ก็ไม่ต่างกัน เพราะไม่มีค่าที่จุดนั้นพอดีอยู่แล้ว

การแจกแจงแบบนี้พบได้ในชีวิตประจำวันในหลายกรณีด้วย ยกตัวอย่างเช่น ลองนึกถึงรูเล็ต (roulette) อุปกรณ์พนันที่โยนบอลลงไปในวงกลม ดูว่าบอลตกช่องไหน

เพียงแต่ว่ารูเล็ตโดยทั่วไปจะมีการแบ่งเป็นช่องชัดเจน เช่นในรูปนี้เป็นตัวเลขตั้งแต่ 0 ถึง 36 ซึ่งถ้าเป็นแบบนี้ก็ถือเป็นการแจกแจงเอกรูปเหมือนกัน แต่ค่าเป็นค่าไม่ต่อเนื่องจึงกลายเป็นการแจกแจงเอกรูปแบบไม่ต่อเนื่อง (离散型均匀分布, discrete uniform distribution)

ดังนั้นให้นึกถึงรูเล็ตที่ไม่มีช่องกั้น เช่นสมมุติว่าเอาบอลไปโยนลงในหมวกแบบที่ผีดิบจีน เจียงซือ (僵尸jiāng shī) ชอบใส่ ก็ได้

เจียงซือ! (ที่มาของภาพ)

เมื่อโยนบอลลงไปในหมวกของเจียงซือ บอลจะไปตกอยู่ตรงตำแหน่งมุมเท่าไหร่ก็มีโอกาสพอๆกัน ดังนั้นการแจกแจงความน่าจะเป็นจึงได้เป็น

$\begin{align} f_X(x) = \left\{\begin{matrix} \frac{1}{360} & เมื่อ\;0 \le x \le 360 \\ 0 & ที่อื่น \end{matrix}\right. \end{align}$

ในไพธอนมีฟังก์ชัน uniform() ในมอดูล random เอาไว้ใช้สุ่มค่าต่อเนื่องโดยมีความน่าจะเป็นสม่ำเสมอภายในช่วงที่ต้องการได้

สมมุติว่าโยนบอล 100 ครั้ง จากนั้นแสดงผลด้วย matplotlib ดู

import matplotlib.pyplot as plt
import random
  
mum = []
for i in range(100):
    # สุ่มมุมตั้งแต่ 0 ถึง 360
    mum += [random.uniform(0,360)]

# วาดกราฟ
plt.xlim(-10,370) # กำหนดขอบเขตแกน x
plt.yticks([]) # ไม่ต้องแสดงแกน y
for i in range(100):
    # วาดเส้นตามตำแหน่งที่สุ่มได้
    plt.axvline(mum[i],alpha=0.2)
plt.show()

จะได้กราฟแบบนี้ออกมา ซึ่งมีการกระจายของค่าอย่างสม่ำเสมอในช่วง 0 ถึง 360 อาจมีบางส่วนหนาแน่นบ้างเพราะมีความไม่แน่นอน แต่โดยรวมแล้วกระจายสม่ำเสมอ

ค่าคาดหมาย

เช่นเดียวกับในกรณีของค่าไม่ต่อเนื่อง ค่าคาดหมายเป็นคุณสมบัติอย่างหนึ่งที่สำคัญสำหรับการแจกแจงของค่าแบบต่อเนื่องเช่นกัน

ค่าคาดหมายของตัวแปรสุ่มที่เป็นค่าต่อเนื่องคำนวณได้จากปริพันธ์ของค่าตั้งแต่ -∞ ถึง ∞ คูณด้วยฟังก์ชันความหนาแน่น

$\begin{align} E(X) = \int_{-\infty}^{\infty} xf_X(x)dx \end{align}$

โดยภาพรวมแล้วก็คล้ายๆกับกรณีค่าไม่ต่อเนื่อง แต่เปลี่ยนจากผลรวม (Σ) เป็นปริพันธ์ (∫)

ตัวอย่างเช่น สมมุติว่ามีฟังก์ชันความหนาแน่นความน่าจะเป็นเป็นแบบเอกรูปดังนี้

$\begin{align} f_X(x) = \left\{\begin{matrix} 0.2 & เมื่อ\;0 \le x \le 5 \\ 0 & ที่อื่น \end{matrix}\right. \end{align}$

ค่าคาดหมายคำนวณได้ว่า

$\begin{align} E(X) &= \int_{0}^{5} 0.2 xdx \\ &= 2.5 \end{align}$

สำหรับฟังก์ชันเอกรูปแบบนี้แน่นอนว่าค่าคาดหมายก็คือที่ใจกลางที่ราบสูง

ส่วนค่าคาดหมายของ g(X) ซึ่งเป็นฟังก์ชันของ X ก็สามารถคำนวณจากฟังก์ชันความหนาแน่นความน่าจะเป็นของ X ได้โดย

$\begin{align} E(g(X)) = \int_{-\infty}^{\infty} g(x) f_X(x)dx \end{align}$

ตัวอย่าง สมมุติว่าฟังก์ชันความหนาแน่นความน่าจะเป็นเป็นดังนี้

$\begin{align} f_X(x) = \left\{\begin{matrix} 0.25 & เมื่อ\;2 \le x \le 6 \\ 0 & ที่อื่น \end{matrix}\right. \end{align}$

หากต้องการคำนวณค่าคาดหมายของ X² จะได้ว่า

$\begin{align} E(X^2) = \int_{2}^{6} 0.25 x^2dx = \left.\frac{0.25x^3}{3}\right|_{2}^{6} = \frac{52}{3} \end{align}$

ความแปรปรวนและส่วนเบี่ยงเบนมาตรฐาน

ความแปรปรวนและส่วนเบี่ยงเบนมาตรฐานมีวิธีคิดที่เหมือนกับกรณีค่าไม่ต่อเนื่อง นั่นคือ

$\begin{align} Ｖ(X) = E[(X-E(X))^2] \\ \sigma(X) = \sqrt{V(X)} \end{align}$

เพียงแต่เวลาคำนวณจะใช้การหาปริพันธ์

ตัวอย่าง มีฟังก์ชันการแจกแจงความหนาแน่นดังนี้

$\begin{align} f_X(x) = \left\{\begin{matrix} 0.1 & เมื่อ\;4 \le x \le 14 \\ 0 & ที่อื่น \end{matrix}\right. \end{align}$

เริ่มจากคำนวณหาค่าคาดหมาย E(X)

$\begin{align} E(X) = \int_{4}^{14} 0.1 xdx = 9 \end{align}$

คำนวณความแปรปรวนและส่วนเบี่ยงเบนมาตรฐาน

$\begin{align} V(X) &= \int_{-\infty}^{\infty}(X-E(X))^2f_X(x)dx \\ &= \int_{4}^{14}(X-9)^2 \times 0.1 dx \\ &= 0.1\int_{4}^{14}(X^2-18X+81)dx \\ &= 25/3 \\ \sigma(X) = \sqrt{V(X)} &= \sqrt{25/3} \approx 2.9 \end{align}$

ฟังก์ชันแจกแจงความหนาแน่นสะสม

ปริมาณอีกอย่างที่มักใช้อธิบายการแจกแจงความหนาแน่นของค่าต่อเนื่องก็คือ ฟังก์ชันแจกแจงสะสม (累积分布函数, cumulative distribution function) ซึ่งเป็นค่าที่ได้จากการหาปริพันธ์ของฟังก์ชันแจกแจงความน่าจะเป็นตั้งแต่ -∞ ไปจนถึงค่านั้น

ฟังก์ชันแจกแจงสะสม F_X ที่ตำแหน่ง a คำนวณได้โดย

$\begin{align} F_X(a) = \int_{-\infty}^a f_X(x)dx \end{align}$

ในขณะที่ฟังก์ชันความหนาแน่นความน่าจะเป็นมักใช้เป็น f เล็ก ฟังก์ชันแจกแจงสะสมจะใช้ F ใหญ่

ค่า F_X(a) แสดงถึงความน่าจะเป็นรวมของค่าตั้งแต่ -∞ จนถึง a

$\begin{align} F_X(a) = P(X \le a) \end{align}$

ดังนั้น

$\begin{align} F_X(-\infty) = 0 \\ F_X(\infty) = 1 \end{align}$

และความน่าจะเป็นของช่วงตั้งแต่ a ถึง b ก็คือ

$\begin{align} F_X(b)-F_X(a) = P(a \le X \le b) \end{align}$

ตัวอย่างเช่น ให้

$\begin{align} f_X(x) = \left\{\begin{matrix} 1/6 & เมื่อ\;1 \le x \le 7 \\ 0 & ที่อื่น \end{matrix}\right. \end{align}$

ดังนั้นจะได้ว่า

$\begin{align} F_X(a) &= \int_{-\infty}^a f_X(x)dx \\ &= \left\{\begin{matrix} 0 &\;เมื่อ&\;a<1 \\ \int_{1}^a \frac{1}{6}dx = \frac{x-1}{6} &\;เมื่อ&\;1 \le a \le 7 \\ 1 &\;เมื่อ&\;a>7 \end{matrix}\right. \end{align}$

การหาฟังก์ชันความหนาแน่นของความน่าจะเป็นจากฟังก์ชันแจกแจงความหนาแน่นสะสม

เมื่อ F_X เป็นปริพันธ์ของ f_X ดังนั้น f_X ก็เป็นอนุพันธ์ของ F_X

$\begin{align} f_X(x) = \frac{dF_X(x)}{dx} \end{align}$

ดังนั้นเมื่อรู้ฟังก์ชันแจกแจงความหนาแน่นสะสม ก็เอามาหาอนุพันธ์เพื่อจะหาฟังก์ชันความหนาแน่นของความน่าจะเป็นได้

ตัวอย่างเช่น ถ้าฟังก์ชันแจกแจงความหนาแน่นสะสมเป็นแบบนี้

$\begin{align} F_X(x) = \left\{\begin{matrix} 0 & เมื่อ&\;x < 0 \\ \left(\frac{x}{8}\right)^2 & เมื่อ&\;0 \le x \le 8 \\ 1 & เมื่อ&\;x > 8 \end{matrix}\right. \end{align}$

จะได้ว่าฟังก์ชันความหนาแน่นของความน่าเป็นคือ

$\begin{align} f_X(X) &= \frac{dF_X(x)}{dx} \\ &= \left\{\begin{matrix} 0 & เมื่อ&\;x < 0 \\ \frac{x}{32} & เมื่อ&\;0 \le x \le 8 \\ 0 & เมื่อ&\;x > 8 \end{matrix}\right. \end{align}$

หากวาดกราฟดูก็จะได้แบบนี้

บทถัดไป >> บทที่ ๙

-----------------------------------------

囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧

ดูสถิติของหน้านี้

หมวดหมู่

-- คณิตศาสตร์ >> ความน่าจะเป็น
-- คอมพิวเตอร์ >> เขียนโปรแกรม >> python

ไม่อนุญาตให้นำเนื้อหาของบทความไปลงที่อื่นโดยไม่ได้ขออนุญาตโดยเด็ดขาด หากต้องการนำบางส่วนไปลงสามารถทำได้โดยต้องไม่ใช่การก๊อปแปะแต่ให้เปลี่ยนคำพูดเป็นของตัวเอง หรือไม่ก็เขียนในลักษณะการยกข้อความอ้างอิง และไม่ว่ากรณีไหนก็ตาม ต้องให้เครดิตพร้อมใส่ลิงก์ของทุกบทความที่มีการใช้เนื้อหาเสมอ

1月	2月	3月	4月
5月	6月	7月	8月
9月	10月	11月	12月

1月	2月	3月	4月
5月	6月	7月	8月
9月	10月	11月	12月

1月	2月	3月	4月
5月	6月	7月	8月
9月	10月	11月	12月

1月	2月	3月	4月
5月	6月	7月	8月
9月	10月	11月	12月

1月	2月	3月	4月
5月	6月	7月	8月
9月	10月	11月	12月

φυβλαςのβλογ
บล็อกของ phyblas

-----------------------------------------

囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧

หมวดหมู่

~ เกี่ยวกับเรา ~

สารบัญ

บทความแบ่งตามหมวด

ค้นหาบทความ

บทความล่าสุด

บทความแนะนำ

บทความแต่ละเดือน

2026年

2025年

2024年

2023年

2022年

ค้นบทความเก่ากว่านั้น

ไทย

日本語

中文

φυβλαςのβλογบล็อกของ phyblas

-----------------------------------------

囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧

หมวดหมู่

~ เกี่ยวกับเรา ~

สารบัญ

บทความแบ่งตามหมวด

ค้นหาบทความ

บทความล่าสุด

บทความแนะนำ

บทความแต่ละเดือน

2026年

2025年

2024年

2023年

2022年

ค้นบทความเก่ากว่านั้น

ไทย

日本語

中文

φυβλαςのβλογ
บล็อกของ phyblas

　 ค้นหาบทความ

　 บทความล่าสุด

　 บทความแนะนำ