ตัวแปรสุ่ม x มีการแจกแจง กฎการกระจายความน่าจะเป็นแบบปกติ

ตัวแปรสุ่มตัวแปรเรียกว่าตัวแปรซึ่งเป็นผลมาจากการทดสอบแต่ละครั้ง รับค่าที่ไม่รู้จักก่อนหน้านี้ ขึ้นอยู่กับเหตุผลที่สุ่ม ตัวแปรสุ่มแสดงด้วยอักษรละตินตัวพิมพ์ใหญ่: $X,\ Y,\ Z,\ \dots $ ตามประเภทของตัวแปรสุ่ม ตัวแปรสุ่มสามารถเป็น ไม่ต่อเนื่องและ อย่างต่อเนื่อง.

ตัวแปรสุ่มแบบไม่ต่อเนื่อง- นี่คือตัวแปรสุ่มที่มีค่านับได้ไม่เกินนั่นคือมีขอบเขตหรือนับได้ โดยการนับเราหมายถึงคุณค่านั้น ตัวแปรสุ่มสามารถนับเลขได้

ตัวอย่างที่ 1 - นี่คือตัวอย่างของตัวแปรสุ่มแบบไม่ต่อเนื่อง:

a) จำนวนครั้งที่ยิงโดนเป้าหมายด้วยการยิง $n$ ค่าที่เป็นไปได้คือ $0,\ 1,\ \dots ,\ n$

b) จำนวนตราสัญลักษณ์ที่ดรอปเมื่อโยนเหรียญ ค่าที่เป็นไปได้คือ $0,\ 1,\ \dots ,\ n$

c) จำนวนเรือที่มาถึงบนเรือ (ชุดค่าที่นับได้)

d) จำนวนสายที่มาถึง PBX (ชุดค่าที่นับได้)

1. กฎการกระจายความน่าจะเป็นของตัวแปรสุ่มแบบไม่ต่อเนื่อง

ตัวแปรสุ่มแบบแยกส่วน $X$ สามารถรับค่า $x_1,\dots ,\ x_n$ ด้วยความน่าจะเป็น $p\left(x_1\right),\ \dots ,\ p\left(x_n\right)$ เรียกว่าความสอดคล้องระหว่างค่าเหล่านี้และความน่าจะเป็น กฎการกระจายตัวของตัวแปรสุ่มแบบไม่ต่อเนื่อง- ตามกฎแล้ว การติดต่อนี้จะถูกระบุโดยใช้ตาราง บรรทัดแรกระบุค่า $x_1,\dots ,\ x_n$ และบรรทัดที่สองมีความน่าจะเป็น $p_1,\dots ,\ p_n$ ที่สอดคล้องกับ ค่าเหล่านี้

$\begin(array)(|c|c|)
\hline
X_i & x_1 & x_2 & \จุด & x_n \\
\hline
p_i & p_1 & p_2 & \จุด & p_n \\
\hline
\end(อาร์เรย์)$

ตัวอย่างที่ 2 - ให้ตัวแปรสุ่ม $X$ เป็นจำนวนคะแนนที่ทอยได้เมื่อทอยลูกเต๋า ตัวแปรสุ่มดังกล่าว $X$ สามารถใช้ค่าต่อไปนี้: $1,\ 2,\ 3,\ 4,\ 5,\ 6$ ความน่าจะเป็นของค่าเหล่านี้ทั้งหมดจะเท่ากับ $1/6$ จากนั้นกฎของการแจกแจงความน่าจะเป็นของตัวแปรสุ่ม $X$:

$\begin(array)(|c|c|)
\hline
1 & 2 & 3 & 4 & 5 & 6 \\
\hline

\hline
\end(อาร์เรย์)$

ความคิดเห็น- เนื่องจากในกฎการกระจายของตัวแปรสุ่มแบบแยก $X$ เหตุการณ์ $1,\ 2,\ \dots ,\ 6$ ก่อให้เกิดกลุ่มเหตุการณ์ที่สมบูรณ์ ดังนั้นผลรวมของความน่าจะเป็นจะต้องเท่ากับ 1 นั่นคือ $ \sum(p_i)=1$.

2. ความคาดหวังทางคณิตศาสตร์ของตัวแปรสุ่มแบบไม่ต่อเนื่อง

ความคาดหวังของตัวแปรสุ่มกำหนดความหมาย "ศูนย์กลาง" ของมัน สำหรับตัวแปรสุ่มแบบแยกส่วน ความคาดหวังทางคณิตศาสตร์จะถูกคำนวณเป็นผลรวมของผลิตภัณฑ์ของค่า $x_1,\dots ,\ x_n$ และความน่าจะเป็น $p_1,\dots ,\ p_n$ ที่สอดคล้องกับค่าเหล่านี้ นั่นคือ : $M\left(X\right)=\sum ^n_(i=1)(p_ix_i)$. ในวรรณคดีอังกฤษ มีการใช้สัญลักษณ์อื่น $E\left(X\right)$

คุณสมบัติ ความคาดหวังทางคณิตศาสตร์ $M\ซ้าย(X\ขวา)$:

  1. $M\left(X\right)$ อยู่ระหว่างค่าที่เล็กที่สุดและ ค่าสูงสุดตัวแปรสุ่ม $X$
  2. ความคาดหวังทางคณิตศาสตร์ของค่าคงที่จะเท่ากับค่าคงที่ของตัวมันเอง กล่าวคือ $M\left(C\right)=C$.
  3. ค่าคงที่สามารถนำออกจากเครื่องหมายของความคาดหวังทางคณิตศาสตร์ได้: $M\left(CX\right)=CM\left(X\right)$
  4. ความคาดหวังทางคณิตศาสตร์ของผลรวมของตัวแปรสุ่มจะเท่ากับผลรวมของความคาดหวังทางคณิตศาสตร์: $M\left(X+Y\right)=M\left(X\right)+M\left(Y\right)$
  5. ความคาดหวังทางคณิตศาสตร์ของผลิตภัณฑ์ของตัวแปรสุ่มอิสระจะเท่ากับผลคูณของความคาดหวังทางคณิตศาสตร์: $M\left(XY\right)=M\left(X\right)M\left(Y\right)$

ตัวอย่างที่ 3 - ลองค้นหาความคาดหวังทางคณิตศาสตร์ของตัวแปรสุ่ม $X$ จากตัวอย่าง $2$

$$M\left(X\right)=\sum^n_(i=1)(p_ix_i)=1\cdot ((1)\over (6))+2\cdot ((1)\over (6) )+3\cdot ((1)\over (6))+4\cdot ((1)\over (6))+5\cdot ((1)\over (6))+6\cdot ((1 )\โอเวอร์ (6))=3.5.$$

เราจะสังเกตได้ว่า $M\left(X\right)$ อยู่ระหว่างค่าที่น้อยที่สุด ($1$) และค่าที่ใหญ่ที่สุด ($6$) ของตัวแปรสุ่ม $X$

ตัวอย่างที่ 4 - เป็นที่ทราบกันว่าความคาดหวังทางคณิตศาสตร์ของตัวแปรสุ่ม $X$ เท่ากับ $M\left(X\right)=2$ ค้นหาความคาดหวังทางคณิตศาสตร์ของตัวแปรสุ่ม $3X+5$

จากคุณสมบัติข้างต้น เราจะได้ $M\left(3X+5\right)=M\left(3X\right)+M\left(5\right)=3M\left(X\right)+5=3\ cdot 2 +5=11$.

ตัวอย่างที่ 5 - เป็นที่ทราบกันว่าความคาดหวังทางคณิตศาสตร์ของตัวแปรสุ่ม $X$ เท่ากับ $M\left(X\right)=4$ ค้นหาความคาดหวังทางคณิตศาสตร์ของตัวแปรสุ่ม $2X-9$

จากคุณสมบัติข้างต้น เราจะได้ $M\left(2X-9\right)=M\left(2X\right)-M\left(9\right)=2M\left(X\right)-9=2\ cdot 4 -9=-1$.

3. การกระจายตัวของตัวแปรสุ่มแบบไม่ต่อเนื่อง

ค่าที่เป็นไปได้ของตัวแปรสุ่มที่มีความคาดหวังทางคณิตศาสตร์เท่ากันสามารถกระจายออกไปตามค่าเฉลี่ยที่แตกต่างกันได้ เช่น ในกลุ่มนักเรียนสองกลุ่ม เกรดเฉลี่ยสำหรับการสอบตามทฤษฎีความน่าจะเป็นมีค่าเท่ากับ 4 แต่ในกลุ่มหนึ่งทุกคนกลับกลายเป็นนักเรียนที่ดีและในอีกกลุ่ม - มีเพียงนักเรียน C และนักเรียนที่ดีเยี่ยม ดังนั้นจึงจำเป็นต้องมีคุณลักษณะเชิงตัวเลขของตัวแปรสุ่มที่จะแสดงการแพร่กระจายของค่าของตัวแปรสุ่มรอบความคาดหวังทางคณิตศาสตร์ ลักษณะนี้คือการกระจายตัว

ความแปรปรวนของตัวแปรสุ่มแบบไม่ต่อเนื่อง$X$ เท่ากับ:

$$D\left(X\right)=\sum^n_(i=1)(p_i(\left(x_i-M\left(X\right)\right))^2).\ $$

ในวรรณคดีอังกฤษ ใช้สัญลักษณ์ $V\left(X\right),\ Var\left(X\right)$ บ่อยครั้งที่ความแปรปรวน $D\left(X\right)$ คำนวณโดยใช้สูตร $D\left(X\right)=\sum^n_(i=1)(p_ix^2_i)-(\left(M\ ซ้าย(X \right)\right))^2$.

คุณสมบัติการกระจายตัว$D\ซ้าย(X\ขวา)$:

  1. ความแปรปรวนจะมากกว่าหรือเท่ากับศูนย์เสมอ เช่น $D\ซ้าย(X\ขวา)\ge 0$.
  2. ความแปรปรวนของค่าคงที่เป็นศูนย์ เช่น $D\ซ้าย(C\ขวา)=0$.
  3. ตัวประกอบคงที่สามารถนำออกจากเครื่องหมายการกระจายตัวได้ โดยมีเงื่อนไขว่าเป็นกำลังสอง เช่น $D\left(CX\right)=C^2D\left(X\right)$.
  4. ความแปรปรวนของผลรวมของตัวแปรสุ่มอิสระเท่ากับผลรวมของความแปรปรวน กล่าวคือ $D\left(X+Y\right)=D\left(X\right)+D\left(Y\right)$.
  5. ความแปรปรวนของความแตกต่างระหว่างตัวแปรสุ่มอิสระเท่ากับผลรวมของความแปรปรวน กล่าวคือ $D\left(X-Y\right)=D\left(X\right)+D\left(Y\right)$.

ตัวอย่างที่ 6 - ลองคำนวณความแปรปรวนของตัวแปรสุ่ม $X$ จากตัวอย่าง $2$

$$D\left(X\right)=\sum^n_(i=1)(p_i(\left(x_i-M\left(X\right)\right))^2)=((1)\over (6))\cdot (\left(1-3.5\right))^2+((1)\over (6))\cdot (\left(2-3.5\right))^2+ \dots +( (1)\over (6))\cdot (\left(6-3.5\right))^2=((35)\over (12))\ประมาณ 2.92.$$

ตัวอย่างที่ 7 - เป็นที่ทราบกันว่าความแปรปรวนของตัวแปรสุ่ม $X$ เท่ากับ $D\left(X\right)=2$ ค้นหาความแปรปรวนของตัวแปรสุ่ม $4X+1$

จากคุณสมบัติข้างต้น เราจะพบว่า $D\left(4X+1\right)=D\left(4X\right)+D\left(1\right)=4^2D\left(X\right)+0= 16D\ ซ้าย(X\right)=16\cdot 2=32$.

ตัวอย่างที่ 8 - เป็นที่ทราบกันว่าความแปรปรวนของตัวแปรสุ่ม $X$ เท่ากับ $D\left(X\right)=3$ ค้นหาความแปรปรวนของตัวแปรสุ่ม $3-2X$

จากคุณสมบัติข้างต้น เราจะพบว่า $D\left(3-2X\right)=D\left(3\right)+D\left(2X\right)=0+2^2D\left(X\right)= 4D\ ซ้าย(X\right)=4\cdot 3=12$.

4. ฟังก์ชันการกระจายของตัวแปรสุ่มแบบไม่ต่อเนื่อง

วิธีการแสดงตัวแปรสุ่มแบบไม่ต่อเนื่องในรูปแบบของอนุกรมการแจกแจงไม่ใช่วิธีเดียว และที่สำคัญที่สุด ไม่เป็นสากล เนื่องจากไม่สามารถระบุตัวแปรสุ่มต่อเนื่องโดยใช้อนุกรมการแจกแจงได้ มีอีกวิธีหนึ่งในการแสดงตัวแปรสุ่ม - ฟังก์ชันการแจกแจง

ฟังก์ชันการกระจายตัวแปรสุ่ม $X$ เรียกว่าฟังก์ชัน $F\left(x\right)$ ซึ่งกำหนดความน่าจะเป็นที่ตัวแปรสุ่ม $X$ จะได้รับค่าน้อยกว่าค่าคงที่บางค่า $x$ นั่นคือ $F\ ซ้าย(x\right )=P\left(X< x\right)$

คุณสมบัติของฟังก์ชันการกระจาย:

  1. $0\le F\ซ้าย(x\right)\le 1$.
  2. ความน่าจะเป็นที่ตัวแปรสุ่ม $X$ จะนำค่าจากช่วงเวลา $\left(\alpha ;\ \beta \right)$ เท่ากับความแตกต่างระหว่างค่าของฟังก์ชันการแจกแจงที่ส่วนท้ายของค่านี้ ช่วงเวลา: $P\left(\alpha< X < \beta \right)=F\left(\beta \right)-F\left(\alpha \right)$
  3. $F\left(x\right)$ - ไม่ลดลง
  4. $(\mathop(lim)_(x\to -\infty ) F\left(x\right)=0\ ),\ (\mathop(lim)_(x\to +\infty ) F\left(x \right)=1\ )$.

ตัวอย่างที่ 9 - ให้เราค้นหาฟังก์ชันการแจกแจง $F\left(x\right)$ สำหรับกฎการแจกแจงของตัวแปรสุ่มแยก $X$ จากตัวอย่าง $2$

$\begin(array)(|c|c|)
\hline
1 & 2 & 3 & 4 & 5 & 6 \\
\hline
1/6 & 1/6 & 1/6 & 1/6 & 1/6 & 1/6 \\
\hline
\end(อาร์เรย์)$

ถ้า $x\le 1$ เห็นได้ชัดว่า $F\left(x\right)=0$ (รวมถึงสำหรับ $x=1$ $F\left(1\right)=P\left(X< 1\right)=0$).

ถ้า $1< x\le 2$, то $F\left(x\right)=P\left(X=1\right)=1/6$.

ถ้า 2 ดอลลาร์< x\le 3$, то $F\left(x\right)=P\left(X=1\right)+P\left(X=2\right)=1/6+1/6=1/3$.

ถ้า $3< x\le 4$, то $F\left(x\right)=P\left(X=1\right)+P\left(X=2\right)+P\left(X=3\right)=1/6+1/6+1/6=1/2$.

ถ้า $4< x\le 5$, то $F\left(X\right)=P\left(X=1\right)+P\left(X=2\right)+P\left(X=3\right)+P\left(X=4\right)=1/6+1/6+1/6+1/6=2/3$.

ถ้า $5< x\le 6$, то $F\left(x\right)=P\left(X=1\right)+P\left(X=2\right)+P\left(X=3\right)+P\left(X=4\right)+P\left(X=5\right)=1/6+1/6+1/6+1/6+1/6=5/6$.

ถ้า $x > 6$ แล้ว $F\left(x\right)=P\left(X=1\right)+P\left(X=2\right)+P\left(X=3\right) +P\left(X=4\right)+P\left(X=5\right)+P\left(X=6\right)=1/6+1/6+1/6+1/6+ 1/6+1/6=1$.

ดังนั้น $F(x)=\left\(\begin(matrix)
0,\ ที่\ x\le 1,\\
1/6,ที่\ 1< x\le 2,\\
1/3,\ ที่\ 2< x\le 3,\\
1/2,ที่\ 3< x\le 4,\\
2/3,\ ที่\ 4< x\le 5,\\
5/6,\ ที่\ 4< x\le 5,\\
1,\ สำหรับ\ x > 6.
\end(เมทริกซ์)\right.$

กฎการแจกแจงสำหรับตัวแปรสุ่มแบบไม่ต่อเนื่องที่พบมากที่สุดคือกฎการแจกแจงแบบทวินาม การแจกแจงแบบทวินามเกิดขึ้นภายใต้เงื่อนไขต่อไปนี้ ให้ตัวแปรสุ่มเป็นจำนวนเหตุการณ์ที่เกิดขึ้นในการทดลองอิสระ ความน่าจะเป็นที่จะเกิดขึ้นในแต่ละการทดลองเท่ากับ ตัวแปรสุ่มนี้เป็นตัวแปรสุ่มแบบไม่ต่อเนื่อง โดยค่าที่เป็นไปได้คือ ความน่าจะเป็นที่ตัวแปรสุ่มจะได้รับค่านั้นคำนวณโดยใช้สูตรเบอร์นูลลี:

คำนิยาม 15.กฎการกระจายของตัวแปรสุ่มแบบไม่ต่อเนื่องเรียกว่ากฎการแจกแจงแบบทวินามหากความน่าจะเป็นของค่าของตัวแปรสุ่มคำนวณโดยใช้สูตรเบอร์นูลลี ซีรี่ส์การจัดจำหน่ายจะมีลักษณะดังนี้:

ให้เราตรวจสอบให้แน่ใจว่าผลรวมของความน่าจะเป็นของค่าต่าง ๆ ของตัวแปรสุ่มเท่ากับ 1 อันที่จริง

เนื่องจากการคำนวณเหล่านี้ทำให้เกิดสูตรทวินามของนิวตัน ดังนั้นกฎการกระจายจึงเรียกว่าทวินาม หากตัวแปรสุ่มมีการแจกแจงแบบทวินาม จะพบคุณลักษณะเชิงตัวเลขโดยใช้สูตร:

(42) (43)

ตัวอย่างที่ 15มีชิ้นส่วนจำนวน 50 ชิ้น ความน่าจะเป็นของข้อบกพร่องสำหรับส่วนหนึ่ง ให้ตัวแปรสุ่มคือจำนวนชิ้นส่วนที่ชำรุดในชุดที่กำหนด ค้นหาค่าคาดหวังทางคณิตศาสตร์ ความแปรปรวน และส่วนเบี่ยงเบนมาตรฐานของตัวแปรสุ่มที่กำหนด สารละลาย.ตัวแปรสุ่มมีการแจกแจงแบบทวินาม เนื่องจากความน่าจะเป็นที่จะรับค่านั้นคำนวณโดยใช้สูตรเบอร์นูลลี จากนั้นหาค่าคาดหวังทางคณิตศาสตร์ได้ตามสูตร (41) คือ ; เราค้นหาการกระจายตัวโดยใช้สูตร (42): . แล้วค่าเบี่ยงเบนมาตรฐานจะเท่ากับ คำถาม.ซื้อลอตเตอรี 200 ใบ ความน่าจะเป็นที่จะชนะหนึ่งใบคือ 0.01 ดังนั้นจำนวนสลากลอตเตอรีโดยเฉลี่ยที่เงินรางวัลจะตกคือ: ก) 10; ข) 2; ค) 20; ง) 1.

กฎหมายการกระจายปัวซง

เมื่อแก้ปัญหาในทางปฏิบัติหลายอย่าง เราจะต้องจัดการกับตัวแปรสุ่มที่ไม่ต่อเนื่องซึ่งเป็นไปตามกฎการแจกแจงแบบปัวซอง ตัวอย่างทั่วไปของตัวแปรสุ่มที่มีการแจกแจงแบบปัวซอง ได้แก่ จำนวนการโทรที่ชุมสายโทรศัพท์ในช่วงเวลาหนึ่ง จำนวนความล้มเหลวของอุปกรณ์ที่ซับซ้อนในแต่ละครั้ง หากรู้ว่าความล้มเหลวนั้นไม่ขึ้นอยู่กับกันและกัน และโดยเฉลี่ยแล้วจะมีความล้มเหลวต่อหน่วยเวลา ชุดการแจกจ่ายจะมีรูปแบบดังนี้

นั่นคือความน่าจะเป็นที่ตัวแปรสุ่มจะได้รับค่านั้นคำนวณโดยใช้สูตรปัวซอง ดังนั้นกฎนี้จึงเรียกว่ากฎการกระจายปัวซอง ตัวแปรสุ่มที่แจกแจงตามกฎของปัวซองมีลักษณะเป็นตัวเลขดังต่อไปนี้

การแจกแจงแบบปัวซองขึ้นอยู่กับพารามิเตอร์ตัวหนึ่ง ซึ่งเป็นค่าคาดหวังทางคณิตศาสตร์ของตัวแปรสุ่ม รูปที่ 14 แสดง มุมมองทั่วไปรูปหลายเหลี่ยมของการแจกแจงปัวซองสำหรับค่าต่างๆ ของพารามิเตอร์

การแจกแจงแบบปัวซองสามารถใช้เป็นค่าประมาณในกรณีที่การแจกแจงที่แน่นอนของตัวแปรสุ่มคือการแจกแจงแบบทวินาม จำนวนการทดลองมีมาก และความน่าจะเป็นของเหตุการณ์ที่เกิดขึ้นในแต่ละการทดลองมีน้อย ดังนั้น กฎการกระจายแบบปัวซอง เรียกว่ากฎแห่งเหตุการณ์ที่หายาก และหากความคาดหวังทางคณิตศาสตร์แตกต่างเพียงเล็กน้อยจากความแปรปรวน นั่นคือ เมื่อ ในเรื่องนี้การกระจายปัวซองมีการใช้งานที่แตกต่างกันจำนวนมาก ตัวอย่างที่ 16โรงงานส่งสินค้าคุณภาพดีจำนวน 500 รายการไปที่ฐาน ความน่าจะเป็นที่สินค้าจะเสียหายระหว่างการขนส่งคือ 0.002 ค้นหาความคาดหวังทางคณิตศาสตร์ของจำนวนชิ้นส่วนที่เสียหายระหว่างการขนส่ง สารละลาย.ตัวแปรสุ่มมีการแจกแจงแบบปัวซอง ดังนั้น คำถาม.ความน่าจะเป็นที่สัญลักษณ์จะบิดเบี้ยวเมื่อส่งข้อความคือ 0.004 เพื่อให้จำนวนสัญลักษณ์ที่เสียหายโดยเฉลี่ยเท่ากับ 4 จะต้องส่งสัญลักษณ์ 100 ตัว

ฟังก์ชันการแจกแจงของตัวแปรสุ่ม X คือฟังก์ชัน F(x) ซึ่งแสดงถึงความน่าจะเป็นที่ตัวแปรสุ่ม X จะได้รับค่า x แต่ละตัว, x เล็กกว่า

ตัวอย่างที่ 2.5 กำหนดชุดการแจกแจงของตัวแปรสุ่ม

ค้นหาและอธิบายฟังก์ชันการแจกแจงแบบกราฟิก สารละลาย. ตามคำนิยาม

F(jc) = 0 ที่ เอ็กซ์เอ็กซ์

ฉ(x) = 0.4 + 0.1 = 0.5 ที่ 4 F(x) = 0.5 + 0.5 = 1 ที่ 4 F(x) = 0.5 + 0.5 = 1 ที่ เอ็กซ์ > 5.

ดังนั้น (ดูรูปที่ 2.1):


คุณสมบัติของฟังก์ชันการแจกแจง:

1. ฟังก์ชันการแจกแจงของตัวแปรสุ่มเป็นฟังก์ชันที่ไม่เป็นลบระหว่างศูนย์ถึงหนึ่ง:

2. ฟังก์ชันการกระจายของตัวแปรสุ่มเป็นฟังก์ชันที่ไม่ลดลงบนแกนตัวเลขทั้งหมด เช่น ที่ เอ็กซ์ 2 >x

3. ที่ลบอนันต์ ฟังก์ชันการแจกแจงจะเท่ากับศูนย์ ที่บวกอนันต์จะเท่ากับ 1 นั่นคือ

4. ความน่าจะเป็นที่จะชนตัวแปรสุ่ม เอ็กซ์ในช่วงเวลาเท่ากับอินทิกรัลหนึ่งของความหนาแน่นของความน่าจะเป็นตั้งแต่ ถึง (ดูรูปที่ 2.2) เช่น


ข้าว. 2.2

3. ฟังก์ชันการแจกแจงของตัวแปรสุ่มต่อเนื่อง (ดูรูปที่ 2.3) สามารถแสดงผ่านความหนาแน่นของความน่าจะเป็นตามสูตร:

ฉ(x)=เจพี(*)*. (2.10)

4. อินทิกรัลที่ไม่เหมาะสมในขีดจำกัดอนันต์ของความหนาแน่นของความน่าจะเป็นของตัวแปรสุ่มต่อเนื่องมีค่าเท่ากับ 1:

คุณสมบัติทางเรขาคณิต / และ 4 ความหนาแน่นของความน่าจะเป็นหมายความว่ากราฟของมันคือ เส้นโค้งการกระจาย - อยู่ไม่ต่ำกว่าแกน x, และพื้นที่รวมของรูป, ล้อมรอบด้วยเส้นโค้งการกระจายและแกน x, เท่ากับหนึ่ง

สำหรับตัวแปรสุ่มต่อเนื่อง เอ็กซ์ความคาดหวังทางคณิตศาสตร์ เอ็ม(เอ็กซ์)และความแปรปรวน ง(เอ็กซ์)ถูกกำหนดโดยสูตร:

(ถ้าอินทิกรัลมาบรรจบกันอย่างแน่นอน) หรือ

(ถ้าอินทิกรัลข้างต้นมาบรรจบกัน)

นอกจากคุณลักษณะเชิงตัวเลขที่ระบุไว้ข้างต้นแล้ว แนวคิดเรื่องควอนไทล์และจุดเปอร์เซ็นต์ยังใช้เพื่ออธิบายตัวแปรสุ่มอีกด้วย

ระดับควอนไทล์ q(หรือ q-quantile) คือค่าดังกล่าวเอ็กซ์คิวตัวแปรสุ่ม, ซึ่งฟังก์ชันการแจกแจงของมันรับค่าไป, เท่ากับ q,เช่น.

  • 100จุด q%-ou คือควอนไทล์ X~ q
  • - ตัวอย่างที่ 2.8

จากข้อมูลในตัวอย่างที่ 2.6 ให้ค้นหาควอไทล์ xqj และจุดตัวแปรสุ่ม 30% เอ็กซ์

สารละลาย. ตามคำจำกัดความ (2.16) F(xo t3)= 0.3 เช่น

~ย~ = 0.3 ควอนไทล์มาจากไหน? x 0 3 = 0.6 จุดตัวแปรสุ่ม 30% เอ็กซ์หรือควอนไทล์ X)_o,z = เอ็กซ์โอจ" พบในทำนองเดียวกันจากสมการ ^ = 0.7 โดยที่ *,= 1.4 -

ในบรรดาคุณสมบัติเชิงตัวเลขของตัวแปรสุ่มมีอยู่ อักษรย่อวี* และ ศูนย์กลางพี* ช่วงเวลาของลำดับที่ kกำหนดสำหรับตัวแปรสุ่มแบบไม่ต่อเนื่องและต่อเนื่องโดยสูตร:


คำจำกัดความ 3เอ็กซ์มี กฎการกระจายตัวแบบปกติ (กฎของเกาส์)หากความหนาแน่นของการกระจายมีรูปแบบ:

ที่ไหน ม = ม(เอ็กซ์), σ 2 = ง(เอ็กซ์), σ > 0 .

เรียกว่าเส้นโค้งการแจกแจงแบบปกติ เส้นโค้งปกติหรือเกาส์เซียน(รูปที่ 6.7)

เส้นโค้งปกติมีความสมมาตรเกี่ยวกับเส้นตรง x = มมีค่าสูงสุด ณ จุดนั้น x = ม, เท่ากัน .

ฟังก์ชันการแจกแจงของตัวแปรสุ่ม X ซึ่งแจกแจงตามกฎปกติ จะแสดงผ่านฟังก์ชันลาปลาซ Ф( เอ็กซ์) ตามสูตร:

ฉ( x) – ฟังก์ชันลาปลาซ

ความคิดเห็นฟังก์ชัน Ф( เอ็กซ์) เป็นเลขคี่ (Ф(- เอ็กซ์) = -ฉ( เอ็กซ์)) นอกจากนี้ เมื่อใด เอ็กซ์> 5 ถือได้ว่าเป็น Ф( เอ็กซ์) ≈ 1/2.

ตารางค่าของฟังก์ชัน Ф( เอ็กซ์) ระบุไว้ในภาคผนวก (ตาราง P 2.2)

กราฟฟังก์ชันการกระจาย เอฟ(x) แสดงไว้ในรูปที่ 6.8.

ความน่าจะเป็นที่ตัวแปรสุ่ม X จะใช้ค่าที่อยู่ในช่วงเวลา ( ก;ข) คำนวณโดยสูตร:

(ก< เอ็กซ์ < b ) = .

ความน่าจะเป็นที่ค่าสัมบูรณ์ของการเบี่ยงเบนของตัวแปรสุ่มจากความคาดหวังทางคณิตศาสตร์จะน้อยกว่า จำนวนบวกδ คำนวณโดยใช้สูตร:

(| เอ็กซ์ - ม| .

โดยเฉพาะเมื่อ =0 ความเท่าเทียมกันเป็นจริง:

(| เอ็กซ์ | .

“กฎสามซิกมา”

ถ้าเป็นตัวแปรสุ่ม เอ็กซ์มีกฎการแจกแจงแบบปกติพร้อมพารามิเตอร์ และ σ เกือบจะแน่นอนว่าค่าของมันอยู่ในช่วงเวลา ( 3σ; + 3σ) เนื่องจาก (| เอ็กซ์ - ม| = 0,9973.

ปัญหา 6.3ตัวแปรสุ่ม เอ็กซ์มีการแจกแจงตามปกติโดยมีค่าคาดหวังทางคณิตศาสตร์เท่ากับ 32 และความแปรปรวนเท่ากับ 16 ค้นหา: ก) ความหนาแน่นของการแจกแจงความน่าจะเป็น (x- X จะนำค่าจากช่วงเวลา (28;38)

สารละลาย:ตามเงื่อนไข = 32, σ 2 = 16 ดังนั้น σ = 4 ดังนั้น

ก)

b) ลองใช้สูตร:

(ก< เอ็กซ์ )= .

การทดแทน = 28, = 38, = 32, σ= 4 เราได้

(28< เอ็กซ์ < 38)= ฉ(1.5) ฉ(1)

ตามตารางค่าฟังก์ชัน Φ( เอ็กซ์) เราพบว่า Ф(1,5) = 0.4332, Ф(1) = 0.3413

ดังนั้น ความน่าจะเป็นที่ต้องการ:

(28

งาน

6.1. ตัวแปรสุ่ม เอ็กซ์กระจายอย่างสม่ำเสมอในช่วงเวลา (-3;5) หา:

ก) ความหนาแน่นของการกระจาย (x);

b) ฟังก์ชั่นการกระจาย เอฟ(x);

c) ลักษณะเชิงตัวเลข

ง) ความน่าจะเป็น (4<เอ็กซ์<6).

6.2. ตัวแปรสุ่ม เอ็กซ์กระจายอย่างสม่ำเสมอในแต่ละส่วน หา:

ก) ความหนาแน่นของการกระจาย (x);

b) ฟังก์ชั่นการกระจาย เอฟ(x);

c) ลักษณะเชิงตัวเลข

ง) ความน่าจะเป็น (3≤เอ็กซ์≤6).

6.3. มีไฟจราจรอัตโนมัติบนทางหลวง โดยเปิดไฟเขียว 2 นาที สีเหลือง 3 วินาที สีแดง 30 วินาที เป็นต้น รถยนต์แล่นไปตามทางหลวงในช่วงเวลาสุ่ม จงหาความน่าจะเป็นที่รถจะผ่านสัญญาณไฟจราจรโดยไม่หยุด


6.4. รถไฟใต้ดินวิ่งเป็นประจำทุกๆ 2 นาที ผู้โดยสารเข้าสู่ชานชาลาในเวลาสุ่ม ความน่าจะเป็นที่ผู้โดยสารต้องรอรถไฟนานกว่า 50 วินาทีเป็นเท่าใด ค้นหาความคาดหวังทางคณิตศาสตร์ของตัวแปรสุ่ม เอ็กซ์- เวลารอรถไฟ

6.5. ค้นหาความแปรปรวนและส่วนเบี่ยงเบนมาตรฐานของการแจกแจงแบบเอ็กซ์โปเนนเชียลที่กำหนดโดยฟังก์ชันการแจกแจง:

6.6. ตัวแปรสุ่มต่อเนื่อง เอ็กซ์กำหนดโดยความหนาแน่นของการแจกแจงความน่าจะเป็น:

ก) ตั้งชื่อกฎการกระจายของตัวแปรสุ่มที่กำลังพิจารณา

b) ค้นหาฟังก์ชันการแจกแจง เอฟ(x) และคุณลักษณะเชิงตัวเลขของตัวแปรสุ่ม เอ็กซ์.

6.7. ตัวแปรสุ่ม เอ็กซ์กระจายตามกฎเอ็กซ์โปเนนเชียลที่ระบุโดยความหนาแน่นของการแจกแจงความน่าจะเป็น:

เอ็กซ์จะนำค่าจากช่วงเวลา (2.5;5)

6.8. ตัวแปรสุ่มต่อเนื่อง เอ็กซ์กระจายตามกฎเลขชี้กำลังที่ระบุโดยฟังก์ชันการแจกแจง:

ค้นหาความน่าจะเป็นที่เป็นผลจากการทดสอบ เอ็กซ์จะนำค่าจากส่วนนั้น

6.9. ค่าคาดหวังและค่าเบี่ยงเบนมาตรฐานของตัวแปรสุ่มแบบกระจายปกติคือ 8 และ 2 ตามลำดับ ค้นหา:

ก) ความหนาแน่น การแจกแจงฉ(x);

b) ความน่าจะเป็นที่เกิดจากการทดสอบ เอ็กซ์จะนำค่าจากช่วงเวลา (10;14)

6.10. ตัวแปรสุ่ม เอ็กซ์กระจายตามปกติโดยมีค่าคาดหวังทางคณิตศาสตร์ 3.5 และความแปรปรวน 0.04 หา:

ก) ความหนาแน่นของการกระจาย (x);

b) ความน่าจะเป็นที่เกิดจากการทดสอบ เอ็กซ์จะนำค่าจากส่วนนั้น

6.11. ตัวแปรสุ่ม เอ็กซ์ปกติจะแจกกับ (เอ็กซ์) = 0 และ ดี(เอ็กซ์)= 1. เหตุการณ์ใด: | เอ็กซ์|≤0.6 หรือ | เอ็กซ์|≥0.6มีแนวโน้มมากขึ้นใช่ไหม?

6.12. ตัวแปรสุ่ม เอ็กซ์ปกติจะแจกกับ (เอ็กซ์) = 0 และ ดี(เอ็กซ์)= 1. จากช่วงเวลาใด (-0.5; -0.1) หรือ (1; 2) มีแนวโน้มที่จะรับค่าระหว่างการทดสอบหนึ่งครั้งมากกว่าหรือไม่

6.13. ราคาปัจจุบันต่อหุ้นสามารถจำลองได้โดยใช้การแจกแจงแบบปกติด้วย (เอ็กซ์)= 10 วัน หน่วย และ σ( เอ็กซ์) = 0.3 เด็น หน่วย หา:

ก) ความน่าจะเป็นที่ราคาหุ้นปัจจุบันจะอยู่ที่ 9.8 Den หน่วย สูงสุด 10.4 วัน หน่วย;

b) ใช้ "กฎสามซิกมา" ค้นหาขอบเขตที่ราคาหุ้นปัจจุบันจะเป็น

6.14. ชั่งน้ำหนักสารโดยไม่มีข้อผิดพลาดอย่างเป็นระบบ ข้อผิดพลาดในการชั่งน้ำหนักแบบสุ่มจะขึ้นอยู่กับกฎปกติโดยมีค่าเบี่ยงเบนมาตรฐาน σ= 5g ค้นหาความน่าจะเป็นที่ในการทดลองอิสระสี่ครั้ง ข้อผิดพลาดในการชั่งน้ำหนักสามครั้งจะไม่เกิน 3 กรัมในค่าสัมบูรณ์

6.15. ตัวแปรสุ่ม เอ็กซ์ปกติจะแจกกับ (เอ็กซ์)= 12.6. ความน่าจะเป็นที่ตัวแปรสุ่มจะตกอยู่ในช่วง (11.4; 13.8) คือ 0.6826 ค้นหาค่าเบี่ยงเบนมาตรฐาน σ

6.16. ตัวแปรสุ่ม เอ็กซ์ปกติจะแจกกับ (เอ็กซ์) = 12 และ ดี(เอ็กซ์) = 36 ค้นหาช่วงเวลาที่ด้วยความน่าจะเป็น 0.9973 ตัวแปรสุ่มจะลดลงอันเป็นผลมาจากการทดสอบ เอ็กซ์.

6.17. ชิ้นส่วนที่ผลิตโดยเครื่องจักรอัตโนมัติถือว่ามีข้อบกพร่องหากเบี่ยงเบน เอ็กซ์พารามิเตอร์ที่ควบคุมนั้นเกินค่าที่กำหนด 2 หน่วยการวัด สันนิษฐานว่าเป็นตัวแปรสุ่ม เอ็กซ์ปกติจะแจกกับ (เอ็กซ์) = 0 และ σ( เอ็กซ์) = 0.7 เครื่องจักรผลิตชิ้นส่วนที่ชำรุดกี่เปอร์เซ็นต์?

3.18. พารามิเตอร์ เอ็กซ์ชิ้นส่วนต่างๆ มีการกระจายตามปกติโดยมีค่าคาดหวังทางคณิตศาสตร์เท่ากับ 2 เท่ากับค่าที่ระบุและค่าเบี่ยงเบนมาตรฐานเท่ากับ 0.014 จงหาความน่าจะเป็นที่ส่วนเบี่ยงเบน เอ็กซ์ของมูลค่าระบุจะต้องไม่เกิน 1% ของมูลค่าระบุ

คำตอบ

วี) (เอ็กซ์)=1, ดี(เอ็กซ์)=16/3, σ( เอ็กซ์)= 4/ , ง)1/8.



วี) (เอ็กซ์)=4,5, ดี(เอ็กซ์) =2 , σ ( เอ็กซ์)= , ง)3/5.


6.3. 40/51.

6.4. 7/12, (เอ็กซ์)=1.


6.5. ดี(เอ็กซ์) = 1/64, σ ( เอ็กซ์)=1/8

6.6. (เอ็กซ์)=1 , ดี(เอ็กซ์) =2 , σ ( เอ็กซ์)= 1 .


6.7. พี(2.5<เอ็กซ์<5)= -1 -2 ≈0,2325 6.8. ป(2≤ เอ็กซ์≤5)=0,252.


ข) (10 < เอ็กซ์ < 14) ≈ 0,1574.

ข) (3,1 ≤ เอ็กซ์ ≤ 3,7) ≈ 0,8185.


6.11. |x|≥0,6.

6.12. (-0,5; -0,1).


6.13. ก) P(9.8 ≤ X ≤ 10.4) data 0.6562 6.14. 0,111.

ข) (9.1; 10.9)


6.15. ซิ = 1.2

6.16. (-6; 30).

6.17. 0,4 %.

1.2.4. ตัวแปรสุ่มและการแจกแจงของตัวแปรสุ่ม

การแจกแจงตัวแปรสุ่มและฟังก์ชันการแจกแจง- การแจกแจงของตัวแปรสุ่มเชิงตัวเลขคือฟังก์ชันที่กำหนดความน่าจะเป็นที่ตัวแปรสุ่มจะใช้ค่าที่กำหนดหรืออยู่ในช่วงที่กำหนดโดยเฉพาะ

ประการแรกคือถ้าตัวแปรสุ่มรับค่าจำนวนจำกัด จากนั้นการแจกแจงจะได้รับจากฟังก์ชัน ป(X = x)การกำหนดให้กับแต่ละค่าที่เป็นไปได้ เอ็กซ์ตัวแปรสุ่ม เอ็กซ์ความน่าจะเป็นนั้น เอ็กซ์ = x.

ประการที่สองคือถ้าตัวแปรสุ่มรับค่าจำนวนอนันต์ สิ่งนี้เป็นไปได้ก็ต่อเมื่อปริภูมิความน่าจะเป็นที่กำหนดตัวแปรสุ่มนั้นประกอบด้วยเหตุการณ์พื้นฐานจำนวนอนันต์ จากนั้นการแจกแจงจะได้มาจากเซตของความน่าจะเป็น ป(ก < เอ็กซ์ สำหรับคู่ตัวเลขทั้งหมด ก, ขเช่นนั้น - การกระจายสามารถระบุได้โดยใช้สิ่งที่เรียกว่า ฟังก์ชันการกระจาย F(x) = P(X กำหนดความเป็นจริงทั้งหมด เอ็กซ์ความน่าจะเป็นที่ตัวแปรสุ่ม เอ็กซ์รับค่าน้อยกว่า เอ็กซ์- มันชัดเจนว่า

ป(ก < เอ็กซ์

ความสัมพันธ์นี้แสดงให้เห็นว่าการแจกแจงทั้งสองสามารถคำนวณได้จากฟังก์ชันการแจกแจง และในทางกลับกัน ฟังก์ชันการแจกแจงสามารถคำนวณได้จากการแจกแจง

ใช้ในความน่าจะเป็น วิธีการทางสถิติการตัดสินใจและอื่น ๆ การวิจัยประยุกต์ฟังก์ชันการกระจายเป็นแบบแยกหรือต่อเนื่อง หรือรวมกัน

ฟังก์ชันการแจกแจงแบบแยกส่วนสอดคล้องกับตัวแปรสุ่มแบบแยกซึ่งรับค่าหรือค่าจำนวนจำกัดจากชุดที่องค์ประกอบสามารถกำหนดหมายเลขด้วยจำนวนธรรมชาติได้ (ชุดดังกล่าวเรียกว่านับได้ในทางคณิตศาสตร์) กราฟของพวกเขาดูเหมือนบันไดขั้นบันได (รูปที่ 1)

ตัวอย่างที่ 1ตัวเลข เอ็กซ์สินค้าที่มีข้อบกพร่องในชุดจะใช้ค่า 0 ด้วยความน่าจะเป็น 0.3 ค่า 1 ด้วยความน่าจะเป็น 0.4 ค่า 2 ด้วยความน่าจะเป็น 0.2 และค่า 3 ด้วยความน่าจะเป็น 0.1 กราฟฟังก์ชันการกระจายของตัวแปรสุ่ม เอ็กซ์แสดงในรูปที่ 1

รูปที่ 1. กราฟแสดงฟังก์ชันการกระจายจำนวนสินค้าที่มีข้อบกพร่อง

ฟังก์ชันการกระจายแบบต่อเนื่องไม่มีการข้าม พวกเขาเพิ่มขึ้นแบบซ้ำซากจำเจเมื่ออาร์กิวเมนต์เพิ่มขึ้น - จาก 0 เป็น 1 ที่ ตัวแปรสุ่มที่มีฟังก์ชันการแจกแจงต่อเนื่องเรียกว่าตัวแปรต่อเนื่อง

ฟังก์ชันการแจกแจงต่อเนื่องที่ใช้ในวิธีการตัดสินใจทางสถิติความน่าจะเป็นมีอนุพันธ์ อนุพันธ์อันดับหนึ่ง ฉ(x)ฟังก์ชั่นการกระจาย ฉ(x)เรียกว่าความหนาแน่นของความน่าจะเป็น

เมื่อใช้ความหนาแน่นของความน่าจะเป็น คุณสามารถกำหนดฟังก์ชันการแจกแจงได้:

สำหรับฟังก์ชันการกระจายใดๆ

คุณสมบัติที่ระบุไว้ของฟังก์ชันการแจกแจงจะใช้อย่างต่อเนื่องในวิธีการตัดสินใจความน่าจะเป็นและทางสถิติ โดยเฉพาะอย่างยิ่ง ความเท่าเทียมกันสุดท้ายแสดงถึงรูปแบบเฉพาะของค่าคงที่ในสูตรสำหรับความหนาแน่นของความน่าจะเป็นที่พิจารณาด้านล่าง

ตัวอย่างที่ 2มักใช้ฟังก์ชันการกระจายต่อไปนี้:

(1)

ที่ไหน และ – ตัวเลขบางตัว - มาหาความหนาแน่นของความน่าจะเป็นของฟังก์ชันการแจกแจงนี้:

( ณ จุด x = กและ x = ขอนุพันธ์ของฟังก์ชัน ฉ(x)ไม่มีอยู่)

ตัวแปรสุ่มที่มีฟังก์ชันการกระจาย (1) เรียกว่า “กระจายสม่ำเสมอในช่วงเวลา [ ก; ข]».

ฟังก์ชันการกระจายแบบผสมจะเกิดขึ้น โดยเฉพาะอย่างยิ่ง เมื่อการสังเกตหยุดที่จุดใดจุดหนึ่ง ตัวอย่างเช่น เมื่อวิเคราะห์ข้อมูลทางสถิติที่ได้จากการใช้แผนการทดสอบความน่าเชื่อถือที่จัดให้มีการยกเลิกการทดสอบหลังจากช่วงระยะเวลาหนึ่ง หรือเมื่อวิเคราะห์ข้อมูลเกี่ยวกับผลิตภัณฑ์ทางเทคนิคที่ต้องซ่อมแซมตามการรับประกัน

ตัวอย่างที่ 3ตัวอย่างเช่น สมมติว่าอายุการใช้งานของหลอดไฟเป็นตัวแปรสุ่มพร้อมกับฟังก์ชันการกระจาย ฉ(ท)และทำการทดสอบจนกว่าหลอดไฟจะเสียถ้าเกิดขึ้นภายในเวลาไม่ถึง 100 ชั่วโมงนับแต่เริ่มการทดสอบ หรือจนกว่า เสื้อ 0= 100 ชม. อนุญาต ก(ที)– ฟังก์ชันการกระจายเวลาการทำงานของหลอดไฟในสภาพดีระหว่างการทดสอบนี้ แล้ว

การทำงาน ก(ที)มีการกระโดดถึงจุดหนึ่ง เสื้อ 0เนื่องจากตัวแปรสุ่มที่สอดคล้องกันรับค่า เสื้อ 0ด้วยความน่าจะเป็น 1- ฉ(เสื้อ 0)> 0.

ลักษณะของตัวแปรสุ่มในวิธีการตัดสินใจทางสถิติความน่าจะเป็น มีการใช้คุณลักษณะจำนวนหนึ่งของตัวแปรสุ่ม ซึ่งแสดงผ่านฟังก์ชันการแจกแจงและความหนาแน่นของความน่าจะเป็น

เมื่ออธิบายความแตกต่างของรายได้ เมื่อค้นหาขีดจำกัดความเชื่อมั่นสำหรับพารามิเตอร์ของการแจกแจงของตัวแปรสุ่ม และในกรณีอื่นๆ จำนวนมาก จะใช้แนวคิดเช่น "ลำดับควอนไทล์" " โดยที่ 0< พี < 1 (обозначается เอ็กซ์พี- สั่งซื้อควอนไทล์ – ค่าของตัวแปรสุ่มที่ฟังก์ชันการแจกแจงรับค่า หรือมี “การกระโดด” จากค่าที่น้อยกว่า ให้มีค่ามากขึ้น (รูปที่ 2) อาจเกิดขึ้นได้ว่าเงื่อนไขนี้เป็นไปตามค่า x ทั้งหมดที่อยู่ในช่วงเวลานี้ (เช่น ฟังก์ชันการแจกแจงคงที่ในช่วงเวลานี้และเท่ากับ - จากนั้นแต่ละค่าดังกล่าวจะเรียกว่า "ปริมาณการสั่งซื้อ" - สำหรับฟังก์ชันการแจกแจงแบบต่อเนื่อง ตามกฎแล้วจะมีควอไทล์เดียว เอ็กซ์พีคำสั่ง (รูปที่ 2) และ

ฉ(x พี) = พี. (2)

รูปที่ 2. ความหมายของควอนไทล์ เอ็กซ์พีคำสั่ง .

ตัวอย่างที่ 4มาหาควอไทล์กันดีกว่า เอ็กซ์พีคำสั่ง สำหรับฟังก์ชันการกระจาย ฉ(x)จาก (1)

เวลา 0< พี < 1 квантиль เอ็กซ์พีหาได้จากสมการ

เหล่านั้น. เอ็กซ์พี = ก + พี(ข – ก) = ก( 1- น) +bp- ที่ พี= 0 ใดๆ x < เป็นปริมาณของการสั่งซื้อ พี= 0. ปริมาณการสั่งซื้อ พี= 1 คือตัวเลขใดๆ x > .

สำหรับ การกระจายแบบไม่ต่อเนื่องตามกฎแล้วไม่มีอยู่จริง เอ็กซ์พี, สมการที่น่าพอใจ (2) แม่นยำยิ่งขึ้นหากได้รับการกระจายของตัวแปรสุ่มในตารางที่ 1 โดยที่ x1< x 2 < … < x k แล้วความเท่าเทียมกัน (2) ถือเป็นสมการเทียบกับ เอ็กซ์พีมีวิธีแก้ปัญหาเฉพาะสำหรับ เคค่านิยม พีกล่าวคือ

พี = พี 1 ,

พี = พี 1 + พี 2 ,

พี = พี 1 + พี 2 + พี 3 ,

พี = พี 1 + พี 2 + …+ บ่ายโมง, 3 < < เค,

พี = พี 1 + พี 2 + … + พีเค.

ตารางที่ 1.

การกระจายตัวของตัวแปรสุ่มแบบไม่ต่อเนื่อง

สำหรับผู้ที่อยู่ในรายการ เคค่าความน่าจะเป็น พีสารละลาย เอ็กซ์พีสมการ (2) ไม่ซ้ำกัน กล่าวคือ

ฉ(x) = หน้า 1 + หน้า 2 + … + หน้า ม

สำหรับทุกคน เอ็กซ์เช่นนั้น x ม< x < x ม+1 .เหล่านั้น. เอ็กซ์พี –หมายเลขใดๆ จากช่วงเวลา (x ม.; x ม.+1 ].สำหรับคนอื่นๆ จากช่วงเวลา (0;1) ซึ่งไม่รวมอยู่ในรายการ (3) จะมี "การกระโดด" จากค่าที่น้อยกว่า ให้มีค่ามากขึ้น - กล่าวคือถ้า

พี 1 + พี 2 + … + พี ม

ที่ x พี = x ม.+1.

คุณสมบัติที่พิจารณาของการแจกแจงแบบไม่ต่อเนื่องทำให้เกิดปัญหาอย่างมากเมื่อทำการจัดตารางและใช้การแจกแจงดังกล่าวเนื่องจากเป็นไปไม่ได้ที่จะรักษาค่าตัวเลขทั่วไปของลักษณะการแจกแจงอย่างแม่นยำ โดยเฉพาะอย่างยิ่งสิ่งนี้เป็นจริงสำหรับค่าวิกฤตและระดับนัยสำคัญของการทดสอบทางสถิติแบบไม่อิงพารามิเตอร์ (ดูด้านล่าง) เนื่องจากการแจกแจงสถิติของการทดสอบเหล่านี้ไม่ต่อเนื่องกัน

ลำดับเชิงปริมาณมีความสำคัญอย่างยิ่งในสถิติ = ½. เรียกว่า ค่ามัธยฐาน (ตัวแปรสุ่ม) เอ็กซ์หรือฟังก์ชันการกระจายของมัน เอฟ(เอ็กซ์))และถูกกำหนดไว้ ฉัน(เอ็กซ์)ในเรขาคณิต มีแนวคิดเรื่อง "ค่ามัธยฐาน" ซึ่งเป็นเส้นตรงที่ลากผ่านจุดยอดของรูปสามเหลี่ยมและแบ่งด้านตรงข้ามออกเป็นสองส่วน ในสถิติทางคณิตศาสตร์ ค่ามัธยฐานจะแบ่งครึ่งหนึ่งไม่ใช่ด้านข้างของสามเหลี่ยม แต่เป็นการแจกแจงของตัวแปรสุ่ม: ความเท่าเทียมกัน ฉ(x 0.5)= 0.5 หมายถึง ความน่าจะเป็นที่จะไปทางซ้าย x0.5และความน่าจะเป็นที่จะไปทางขวา x0.5(หรือโดยตรงที่ x0.5) เท่ากันและเท่ากับ ½ นั่นคือ

(เอ็กซ์ < x 0,5) = (เอ็กซ์ > x 0.5) = ½

ค่ามัธยฐานหมายถึง "ศูนย์กลาง" ของการแจกแจง จากมุมมองของหนึ่งในแนวคิดสมัยใหม่ - ทฤษฎีของขั้นตอนทางสถิติที่เสถียร - ค่ามัธยฐานเป็นคุณลักษณะที่ดีกว่าของตัวแปรสุ่มมากกว่าที่คาดหวังทางคณิตศาสตร์ เมื่อประมวลผลผลการวัดในระดับลำดับ (ดูบทเกี่ยวกับทฤษฎีการวัด) สามารถใช้ค่ามัธยฐานได้ แต่ความคาดหวังทางคณิตศาสตร์ไม่สามารถใช้ได้

คุณลักษณะของตัวแปรสุ่ม เช่น โหมด มีความหมายที่ชัดเจน - ค่า (หรือค่า) ของตัวแปรสุ่มที่สอดคล้องกับค่าสูงสุดเฉพาะของความหนาแน่นของความน่าจะเป็นสำหรับตัวแปรสุ่มแบบต่อเนื่อง หรือค่าสูงสุดเฉพาะของความน่าจะเป็นสำหรับตัวแปรสุ่มแบบแยกส่วน .

ถ้า x 0– โหมดของตัวแปรสุ่มที่มีความหนาแน่น ฉ(x)จากนั้น ดังที่ทราบจากแคลคูลัสเชิงอนุพันธ์ .

ตัวแปรสุ่มสามารถมีได้หลายโหมด ดังนั้นสำหรับการกระจายสม่ำเสมอ (1) แต่ละจุด เอ็กซ์เช่นนั้น ก< x < b คือแฟชั่น

อย่างไรก็ตาม นี่เป็นข้อยกเว้น ตัวแปรสุ่มส่วนใหญ่ที่ใช้ในวิธีทางสถิติความน่าจะเป็นในการตัดสินใจและการวิจัยประยุกต์อื่นๆ มีรูปแบบเดียว ตัวแปรสุ่ม ความหนาแน่น การแจกแจงที่มีโหมดเดียวเรียกว่า ยูนิโมดัล เอ็กซ์ความคาดหวังทางคณิตศาสตร์ เอ็ม(เอ็กซ์)ความคาดหวังทางคณิตศาสตร์สำหรับตัวแปรสุ่มแบบแยกส่วนที่มีค่าจำนวนจำกัดจะกล่าวถึงในบท “เหตุการณ์และความน่าจะเป็น” สำหรับตัวแปรสุ่มต่อเนื่อง

ตอบสนองความเท่าเทียมกัน

ซึ่งเป็นความคล้ายคลึงของสูตร (5) จากข้อความที่ 2 ของบท “เหตุการณ์และความน่าจะเป็น”ตัวอย่างที่ 5 เอ็กซ์ความคาดหวังของตัวแปรสุ่มแบบกระจายสม่ำเสมอ

เท่ากับ

ความคิดเห็นสำหรับตัวแปรสุ่มที่พิจารณาในบทนี้ คุณสมบัติทั้งหมดของความคาดหวังและความแปรปรวนทางคณิตศาสตร์ที่พิจารณาก่อนหน้านี้สำหรับตัวแปรสุ่มแบบไม่ต่อเนื่องที่มีค่าจำนวนจำกัดจะเป็นจริง อย่างไรก็ตาม เราไม่ได้ให้ข้อพิสูจน์เกี่ยวกับคุณสมบัติเหล่านี้ เนื่องจากคุณสมบัติเหล่านี้ต้องมีการลงลึกในรายละเอียดปลีกย่อยทางคณิตศาสตร์ ซึ่งไม่จำเป็นสำหรับการทำความเข้าใจและการประยุกต์ใช้วิธีการตัดสินใจทางสถิติความน่าจะเป็นและสถิติที่เหมาะสม

ลักษณะเฉพาะทั้งสามประการ ได้แก่ ความคาดหวังทางคณิตศาสตร์ ค่ามัธยฐาน โหมด อธิบายถึง "จุดศูนย์กลาง" ของการแจกแจงความน่าจะเป็น แนวคิดของ "ศูนย์กลาง" สามารถกำหนดได้หลายวิธี - จึงมีคุณลักษณะที่แตกต่างกันสามประการ อย่างไรก็ตาม สำหรับคลาสของการแจกแจงที่สำคัญ—แบบสมมาตรเดียว—ทั้งสามลักษณะจะเหมือนกัน

ความหนาแน่นของการกระจาย ฉ(x)– ความหนาแน่นของการแจกแจงแบบสมมาตร ถ้ามีตัวเลข x 0เช่นนั้น

. (3)

ความเท่าเทียมกัน (3) หมายความว่ากราฟของฟังก์ชัน ย = ฉ(x)สมมาตรเกี่ยวกับเส้นแนวตั้งที่ลากผ่านจุดศูนย์กลางสมมาตร เอ็กซ์ = เอ็กซ์ 0 . จาก (3) เป็นไปตามที่ฟังก์ชันการแจกแจงแบบสมมาตรเป็นไปตามความสัมพันธ์

(4)

สำหรับการแจกแจงแบบสมมาตรด้วยโหมดเดียว ค่าคาดหวังทางคณิตศาสตร์ ค่ามัธยฐาน และโหมดจะตรงกันและเท่ากัน x 0.

กรณีที่สำคัญที่สุดคือสมมาตรประมาณ 0 เช่น x 0= 0 จากนั้น (3) และ (4) จึงเท่ากัน

(6)

ตามลำดับ ความสัมพันธ์ข้างต้นแสดงให้เห็นว่าไม่จำเป็นต้องจัดตารางการแจกแจงแบบสมมาตรสำหรับทุกคน เอ็กซ์ก็เพียงพอที่จะมีโต๊ะที่ x > x 0.

ขอให้เราสังเกตคุณสมบัติอีกอย่างหนึ่งของการแจกแจงแบบสมมาตร ซึ่งใช้อย่างต่อเนื่องในวิธีการตัดสินใจทางสถิติความน่าจะเป็นและการวิจัยประยุกต์อื่นๆ สำหรับฟังก์ชันการกระจายต่อเนื่อง

ป(|X| < ก) = พี(-ก < เอ็กซ์ < ก) = F(ก) – F(-a)

ที่ไหน เอฟ– ฟังก์ชันการกระจายของตัวแปรสุ่ม เอ็กซ์- ถ้าฟังก์ชันการกระจาย เอฟมีความสมมาตรประมาณ 0 นั่นคือ สูตร (6) ก็ใช้ได้สำหรับมันแล้ว

ป(|X| < ก) = 2F(ก) – 1.

มักใช้รูปแบบอื่นของข้อความที่เป็นปัญหา: ถ้า

.

ถ้า และ เป็นปริมาณของลำดับ และตามลำดับ (ดู (2)) ของฟังก์ชันการแจกแจงแบบสมมาตรประมาณ 0 จากนั้นจาก (6) จะเป็นไปตามนั้น

จากลักษณะของตำแหน่ง - ความคาดหวังทางคณิตศาสตร์, ค่ามัธยฐาน, โหมด - มาดูคุณสมบัติของการแพร่กระจายของตัวแปรสุ่มกัน เอ็กซ์: ความแปรปรวน ส่วนเบี่ยงเบนมาตรฐาน และสัมประสิทธิ์ของการแปรผัน โวลต์- คำจำกัดความและคุณสมบัติของการกระจายตัวของตัวแปรสุ่มแบบไม่ต่อเนื่องได้ถูกกล่าวถึงในบทที่แล้ว สำหรับตัวแปรสุ่มต่อเนื่อง

ค่าเบี่ยงเบนมาตรฐานคือค่าที่ไม่เป็นลบของรากที่สองของความแปรปรวน:

ค่าสัมประสิทธิ์ของการแปรผันคืออัตราส่วนของค่าเบี่ยงเบนมาตรฐานต่อค่าคาดหวังทางคณิตศาสตร์:

ค่าสัมประสิทธิ์ของการแปรผันจะใช้เมื่อ เอ็ม(เอ็กซ์)> 0. วัดค่าสเปรดในหน่วยสัมพัทธ์ ในขณะที่ค่าเบี่ยงเบนมาตรฐานอยู่ในหน่วยสัมบูรณ์

ตัวอย่างที่ 6สำหรับตัวแปรสุ่มแบบกระจายสม่ำเสมอ เอ็กซ์ลองหาการกระจายตัว ส่วนเบี่ยงเบนมาตรฐาน และสัมประสิทธิ์ของการแปรผัน ความแปรปรวนคือ:

การเปลี่ยนตัวแปรทำให้สามารถเขียนได้:

ที่ไหน = ()/ 2. ดังนั้น ค่าเบี่ยงเบนมาตรฐานจึงเท่ากับ และค่าสัมประสิทธิ์ของการแปรผันคือ:

สำหรับตัวแปรสุ่มแต่ละตัว เอ็กซ์กำหนดปริมาณอีกสามปริมาณ - อยู่ตรงกลาง ทำให้เป็นมาตรฐาน วีและมอบให้ คุณ- ตัวแปรสุ่มแบบตั้งศูนย์กลาง คือความแตกต่างระหว่างตัวแปรสุ่มที่กำหนด เอ็กซ์และความคาดหวังทางคณิตศาสตร์ของมัน ม(เอ็กซ์)เหล่านั้น. = X – ม(X)ความคาดหวังของตัวแปรสุ่มที่มีศูนย์กลาง เท่ากับ 0 และความแปรปรวนคือความแปรปรวนของตัวแปรสุ่มที่กำหนด: ม() = 0, ดี() = ดี(เอ็กซ์). ฟังก์ชันการกระจาย เอฟ วาย(x) ตัวแปรสุ่มแบบกึ่งกลาง ที่เกี่ยวข้องกับฟังก์ชันการกระจาย เอฟ(x) ตัวแปรสุ่มดั้งเดิม เอ็กซ์อัตราส่วน:

เอฟ วาย(x) = เอฟ(x + (เอ็กซ์)).

ความหนาแน่นของตัวแปรสุ่มเหล่านี้มีความเท่าเทียมกันดังต่อไปนี้:

(x) = (x + (เอ็กซ์)).

ตัวแปรสุ่มที่ทำให้เป็นมาตรฐาน วีคืออัตราส่วนของตัวแปรสุ่มที่กำหนด เอ็กซ์ถึงค่าเบี่ยงเบนมาตรฐาน เช่น - ความคาดหวังและความแปรปรวนของตัวแปรสุ่มที่ทำให้เป็นมาตรฐาน วีแสดงออกผ่านลักษณะเฉพาะ เอ็กซ์ดังนั้น:

,

ที่ไหน โวลต์– สัมประสิทธิ์การแปรผันของตัวแปรสุ่มดั้งเดิม เอ็กซ์- สำหรับฟังก์ชันการกระจาย เอฟ วี(x) และความหนาแน่น ฉ วี(x) ตัวแปรสุ่มที่ทำให้เป็นมาตรฐาน วีเรามี:

ที่ไหน เอฟ(x) – ฟังก์ชันการกระจายของตัวแปรสุ่มดั้งเดิม เอ็กซ์, ก (x) – ความหนาแน่นของความน่าจะเป็น

ตัวแปรสุ่มลดลง คุณเป็นตัวแปรสุ่มแบบกึ่งกลางและแบบมาตรฐาน:

.

สำหรับตัวแปรสุ่มที่กำหนด

ตัวแปรสุ่มที่ทำให้เป็นมาตรฐาน ศูนย์กลาง และลดลงจะถูกใช้อย่างต่อเนื่องทั้งในการศึกษาเชิงทฤษฎีและในอัลกอริธึม ผลิตภัณฑ์ซอฟต์แวร์ เอกสารด้านกฎระเบียบ เทคนิค และการเรียนการสอน โดยเฉพาะเพราะความเท่าเทียมกัน ทำให้สามารถลดความซับซ้อนของเหตุผลของวิธีการ การกำหนดทฤษฎีบทและสูตรการคำนวณ

มีการใช้การแปลงตัวแปรสุ่มและตัวแปรทั่วไป ถ้าอย่างนั้น = ขวาน + , ที่ไหน และ – ตัวเลขบางส่วนแล้ว

ตัวอย่างที่ 7ถ้าอย่างนั้น คือตัวแปรสุ่มรีดิวซ์ และสูตร (8) เปลี่ยนเป็นสูตร (7)

โดยมีตัวแปรสุ่มแต่ละตัว เอ็กซ์คุณสามารถเชื่อมโยงตัวแปรสุ่มได้หลายตัว กำหนดโดยสูตร = ขวาน + ที่แตกต่างกัน > 0 และ . ชุดนี้มีชื่อว่า ครอบครัวที่เปลี่ยนขนาดสร้างโดยตัวแปรสุ่ม เอ็กซ์- ฟังก์ชันการกระจาย เอฟ วาย(x) ประกอบด้วยกลุ่มการแจกแจงแบบเลื่อนขนาดที่สร้างขึ้นโดยฟังก์ชันการแจกแจง เอฟ(x). แทน = ขวาน + มักใช้การบันทึก

ตัวเลข กับเรียกว่าพารามิเตอร์ shift และตัวเลข - พารามิเตอร์มาตราส่วน สูตร (9) แสดงว่า เอ็กซ์– ผลลัพธ์ของการวัดปริมาณหนึ่ง – เข้าสู่ คุณ– ผลลัพธ์ของการวัดปริมาณเท่ากันหากจุดเริ่มต้นของการวัดถูกย้ายไปยังจุด กับแล้วใช้หน่วยวัดใหม่เข้า ใหญ่กว่าอันเก่าหลายเท่า

สำหรับตระกูลสเกลกะ (9) การกระจายของ X เรียกว่ามาตรฐาน ในวิธีการทางสถิติความน่าจะเป็นในการตัดสินใจและการวิจัยประยุกต์อื่นๆ จะใช้การแจกแจงแบบปกติมาตรฐาน การแจกแจงแบบ Weibull-Gnedenko แบบมาตรฐาน การแจกแจงแกมมามาตรฐาน ฯลฯ (ดูด้านล่าง)

การแปลงตัวแปรสุ่มแบบอื่นๆ ก็ใช้เช่นกัน ตัวอย่างเช่น สำหรับตัวแปรสุ่มเชิงบวก เอ็กซ์กำลังพิจารณา = บันทึก เอ็กซ์ที่ไหนแอลจี เอ็กซ์– ลอการิทึมทศนิยมของตัวเลข เอ็กซ์- ห่วงโซ่แห่งความเท่าเทียมกัน

ปี (x) = P(แอลจี เอ็กซ์< x) = P(X < 10x) = ฉ( 10เอ็กซ์)

เชื่อมต่อฟังก์ชันการกระจาย เอ็กซ์และ .

เมื่อประมวลผลข้อมูล จะใช้คุณลักษณะต่อไปนี้ของตัวแปรสุ่ม เอ็กซ์เป็นช่วงเวลาแห่งการสั่งซื้อ ถาม, เช่น. ความคาดหวังทางคณิตศาสตร์ของตัวแปรสุ่ม เอ็กซ์คิว, ถาม= 1, 2, ... ดังนั้น ความคาดหวังทางคณิตศาสตร์ก็คือโมเมนต์ของลำดับ 1 สำหรับตัวแปรสุ่มแบบไม่ต่อเนื่อง โมเมนต์ของลำดับ ถามสามารถคำนวณได้เป็น

สำหรับตัวแปรสุ่มต่อเนื่อง

ช่วงเวลาแห่งการสั่งซื้อ ถามเรียกอีกอย่างว่าช่วงเวลาเริ่มต้นของการสั่งซื้อ ถาม, ตรงกันข้ามกับลักษณะที่เกี่ยวข้อง - ช่วงเวลาสำคัญของการสั่งซื้อ ถาม, กำหนดโดยสูตร

ดังนั้นการกระจายตัวจึงเป็นช่วงเวลาสำคัญของลำดับที่ 2

การแจกแจงแบบปกติและทฤษฎีบทขีดจำกัดกลางในวิธีการตัดสินใจทางสถิติความน่าจะเป็น เรามักพูดถึงการแจกแจงแบบปกติ บางครั้งพวกเขาพยายามใช้มันเพื่อสร้างแบบจำลองการกระจายข้อมูลเริ่มต้น (ความพยายามเหล่านี้ไม่ได้มีเหตุผลเสมอไป - ดูด้านล่าง) ที่สำคัญกว่านั้นวิธีการประมวลผลข้อมูลหลายวิธีนั้นขึ้นอยู่กับความจริงที่ว่าค่าที่คำนวณได้นั้นมีการกระจายที่ใกล้เคียงกับปกติ

อนุญาต เอ็กซ์ 1 , เอ็กซ์ 2 ,…, เอ็กซ์ เอ็น (เอ็กซ์ ฉัน) = และความแปรปรวน ดี(เอ็กซ์ ฉัน) = , ฉัน = 1, 2,…, n,... ดังนี้จากผลของบทที่แล้ว

พิจารณาตัวแปรสุ่มรีดิวซ์ คุณสำหรับจำนวนเงิน กล่าวคือ

ดังต่อไปนี้จากสูตร (7) (คุณ) = 0, ดี(คุณ) = 1.

(สำหรับเงื่อนไขที่กระจายเหมือนกัน) อนุญาต เอ็กซ์ 1 , เอ็กซ์ 2 ,…, เอ็กซ์ เอ็น, … – ตัวแปรสุ่มที่แจกแจงอย่างเป็นอิสระเหมือนกันพร้อมความคาดหวังทางคณิตศาสตร์ (เอ็กซ์ ฉัน) = และความแปรปรวน ดี(เอ็กซ์ ฉัน) = , ฉัน = 1, 2,…, n,... ดังนั้นสำหรับ x ใดๆ จะมีขีดจำกัด

ที่ไหน ฉ(x)– ฟังก์ชันของการแจกแจงแบบปกติมาตรฐาน

ข้อมูลเพิ่มเติมเกี่ยวกับคุณลักษณะนี้ ฉ(x) –ด้านล่าง (อ่านว่า “phi จาก x” เพราะ เอฟ- อักษรกรีกตัวพิมพ์ใหญ่ "phi")

ทฤษฎีบทขีดจำกัดกลาง (CLT) ได้ชื่อมาเนื่องจากเป็นผลทางคณิตศาสตร์ส่วนกลางที่ใช้กันมากที่สุดของทฤษฎีความน่าจะเป็นและสถิติทางคณิตศาสตร์ ประวัติความเป็นมาของ CLT ใช้เวลาประมาณ 200 ปี - ตั้งแต่ปี 1730 เมื่อนักคณิตศาสตร์ชาวอังกฤษ A. Moivre (1667-1754) ตีพิมพ์ผลลัพธ์แรกที่เกี่ยวข้องกับ CLT (ดูด้านล่างเกี่ยวกับทฤษฎีบท Moivre-Laplace) จนถึงช่วงทศวรรษที่ 20 และ 30 ศตวรรษที่ 20 เมื่อ Finn J.W. Lindeberg, ชาวฝรั่งเศส Paul Levy (2429-2514), ยูโกสลาเวีย V. Feller (2449-2513), รัสเซีย A.Ya. Khinchin (1894-1959) และนักวิทยาศาสตร์คนอื่นๆ ได้รับเงื่อนไขที่จำเป็นและเพียงพอสำหรับความถูกต้องของทฤษฎีบทขีดจำกัดกลางแบบคลาสสิก

การพัฒนาหัวข้อที่อยู่ระหว่างการพิจารณาไม่ได้หยุดอยู่แค่นั้น - พวกเขาศึกษาตัวแปรสุ่มที่ไม่มีการกระจายตัวเช่น เหล่านั้นเพื่อใคร

(นักวิชาการ B.V. Gnedenko และคนอื่น ๆ ) สถานการณ์เมื่อมีการสรุปตัวแปรสุ่ม (องค์ประกอบสุ่มที่แม่นยำยิ่งขึ้น) ที่มีลักษณะที่ซับซ้อนมากกว่าตัวเลข (นักวิชาการ Yu.V. Prokhorov, A.A. Borovkov และผู้ร่วมงาน) ฯลฯ .d.

ฟังก์ชันการกระจาย ฉ(x)มอบให้ด้วยความเท่าเทียมกัน

,

โดยที่ความหนาแน่นของการแจกแจงแบบปกติมาตรฐานซึ่งมีการแสดงออกค่อนข้างซับซ้อน:

.

โดยที่ =3.1415925… เป็นตัวเลขที่รู้จักในเรขาคณิต ซึ่งเท่ากับอัตราส่วนของเส้นรอบวงต่อเส้นผ่านศูนย์กลาง = 2.718281828... - ฐานของลอการิทึมธรรมชาติ (โปรดจำตัวเลขนี้ โปรดทราบว่า 1828 เป็นปีเกิดของนักเขียน L.N. Tolstoy) ดังที่ทราบจากการวิเคราะห์ทางคณิตศาสตร์

เมื่อประมวลผลผลการสังเกต ฟังก์ชันการแจกแจงแบบปกติจะไม่คำนวณโดยใช้สูตรที่กำหนด แต่พบได้โดยใช้ตารางพิเศษหรือโปรแกรมคอมพิวเตอร์ "ตารางสถิติทางคณิตศาสตร์" ที่ดีที่สุดในรัสเซียรวบรวมโดยสมาชิกของ USSR Academy of Sciences L.N. Bolshev และ N.V. Smirnov

รูปแบบของความหนาแน่นของการแจกแจงแบบปกติมาตรฐานเป็นไปตามทฤษฎีทางคณิตศาสตร์ ซึ่งเราไม่สามารถพิจารณาได้ในที่นี้ เช่นเดียวกับการพิสูจน์ของ CLT

เพื่อเป็นตัวอย่าง เรามีตารางเล็กๆ ของฟังก์ชันการแจกแจง ฉ(x)(ตารางที่ 2) และปริมาณของมัน (ตารางที่ 3) การทำงาน ฉ(x)สมมาตรประมาณ 0 ซึ่งสะท้อนอยู่ในตารางที่ 2-3

ตารางที่ 2.

ฟังก์ชันการแจกแจงแบบปกติมาตรฐาน

ถ้าเป็นตัวแปรสุ่ม เอ็กซ์มีฟังก์ชั่นการกระจาย ฉ(x)ที่ เอ็ม(เอ็กซ์) = 0, ดี(เอ็กซ์) = 1 ข้อความนี้ได้รับการพิสูจน์แล้วในทฤษฎีความน่าจะเป็นโดยพิจารณาจากรูปแบบของความหนาแน่นของความน่าจะเป็น ซึ่งสอดคล้องกับข้อความที่คล้ายกันสำหรับคุณลักษณะของตัวแปรสุ่มแบบรีดิวซ์ คุณซึ่งค่อนข้างเป็นธรรมชาติ เนื่องจาก CLT ระบุว่าฟังก์ชันการแจกแจงมีจำนวนเพิ่มขึ้นไม่จำกัด คุณมีแนวโน้มที่จะใช้ฟังก์ชันการแจกแจงแบบปกติมาตรฐาน ฉ(x)และเพื่ออะไรก็ตาม เอ็กซ์.

ตารางที่ 3.

ปริมาณของการแจกแจงแบบปกติมาตรฐาน

สั่งซื้อควอนไทล์

สั่งซื้อควอนไทล์

ให้เราแนะนำแนวคิดเกี่ยวกับตระกูลของการแจกแจงแบบปกติ ตามคำนิยาม การแจกแจงแบบปกติคือการแจกแจงของตัวแปรสุ่ม เอ็กซ์ซึ่งการกระจายตัวของตัวแปรสุ่มแบบรีดิวซ์คือ ฉ(x)ดังต่อไปนี้จากคุณสมบัติทั่วไปของตระกูลการแจกแจงแบบเลื่อนระดับ (ดูด้านบน) การแจกแจงแบบปกติคือการแจกแจงของตัวแปรสุ่ม

ที่ไหน เอ็กซ์– ตัวแปรสุ่มพร้อมการแจกแจง เอฟ(เอ็กซ์)และ = (), = ดี(). การแจกแจงแบบปกติพร้อมพารามิเตอร์การเปลี่ยนแปลง และมักจะระบุขนาดไว้ เอ็น(, ) (บางครั้งใช้สัญกรณ์ เอ็น(, ) ).

ดังต่อไปนี้จาก (8) ความหนาแน่นของความน่าจะเป็นของการแจกแจงแบบปกติ เอ็น(, ) มี

การแจกแจงแบบปกติก่อให้เกิดตระกูลการเปลี่ยนขนาด ในกรณีนี้ พารามิเตอร์มาตราส่วนคือ = 1/ และพารามิเตอร์ shift = - / .

สำหรับโมเมนต์กลางของการแจกแจงแบบปกติลำดับที่สามและสี่ ความเท่าเทียมกันต่อไปนี้ใช้ได้:

ความเท่าเทียมกันเหล่านี้เป็นพื้นฐานของวิธีการดั้งเดิมในการตรวจสอบว่าการสังเกตเป็นไปตามการแจกแจงแบบปกติ ปัจจุบันมักแนะนำให้ทดสอบภาวะปกติโดยใช้เกณฑ์ ชาปิโร - วิลก้า ปัญหาของการทดสอบภาวะปกติมีดังต่อไปนี้

ถ้าเป็นตัวแปรสุ่ม เอ็กซ์ 1และ เอ็กซ์ 2มีฟังก์ชั่นการกระจาย เอ็น( 1 , 1) และ เอ็น( 2 , 2) ตามนั้น เอ็กซ์ 1+ เอ็กซ์ 2มีการกระจาย ดังนั้นหากตัวแปรสุ่ม เอ็กซ์ 1 , เอ็กซ์ 2 ,…, เอ็กซ์ เอ็น เอ็น(, ) แล้วค่าเฉลี่ยเลขคณิตของพวกเขา

มีการกระจาย เอ็น(, ) - คุณสมบัติของการแจกแจงแบบปกติเหล่านี้ถูกนำมาใช้อย่างต่อเนื่องในวิธีการตัดสินใจเชิงความน่าจะเป็นและทางสถิติต่างๆ โดยเฉพาะอย่างยิ่งในการควบคุมทางสถิติของกระบวนการทางเทคโนโลยีและในการควบคุมการยอมรับทางสถิติตามเกณฑ์เชิงปริมาณ

เมื่อใช้การแจกแจงแบบปกติ การแจกแจงสามแบบถูกกำหนดไว้ซึ่งปัจจุบันมักใช้ในการประมวลผลข้อมูลทางสถิติ

การแจกแจง (ไค - สแควร์) – การแจกแจงของตัวแปรสุ่ม

ตัวแปรสุ่มอยู่ที่ไหน เอ็กซ์ 1 , เอ็กซ์ 2 ,…, เอ็กซ์ เอ็นเป็นอิสระและมีการกระจายตัวเหมือนกัน เอ็น(0,1) ในกรณีนี้จำนวนเทอมคือ nเรียกว่า “จำนวนองศาอิสระ” ของการแจกแจงแบบไคสแควร์

การกระจาย ที t ของนักเรียนคือการแจกแจงของตัวแปรสุ่ม

ตัวแปรสุ่มอยู่ที่ไหน คุณและ เอ็กซ์เป็นอิสระ, คุณมีการแจกแจงแบบปกติมาตรฐาน เอ็น(0.1) และ เอ็กซ์– การกระจายไค – กำลังสอง c nระดับความเป็นอิสระ ในเวลาเดียวกัน nเรียกว่า “จำนวนองศาอิสระ” ของการแจกแจงนักศึกษา การจำหน่ายนี้เปิดตัวในปี 1908 โดยนักสถิติชาวอังกฤษ W. Gosset ซึ่งทำงานในโรงงานเบียร์แห่งหนึ่ง

โรงงานแห่งนี้ใช้วิธีการความน่าจะเป็นและสถิติในการตัดสินใจทางเศรษฐกิจและทางเทคนิค ดังนั้นฝ่ายบริหารจึงห้ามไม่ให้ V. Gosset เผยแพร่บทความทางวิทยาศาสตร์ภายใต้ชื่อของเขาเอง ด้วยวิธีนี้ ความลับทางการค้าและ "ความรู้" ในรูปแบบของวิธีการความน่าจะเป็นและสถิติที่พัฒนาโดย V. Gosset ได้รับการปกป้อง อย่างไรก็ตามเขาได้มีโอกาสตีพิมพ์โดยใช้นามแฝงว่า "นักศึกษา" ประวัติความเป็นมาของ Gosset-Student แสดงให้เห็นว่าเป็นเวลากว่าร้อยปีที่ผู้จัดการในสหราชอาณาจักรตระหนักถึงประสิทธิภาพทางเศรษฐกิจที่มากขึ้นของวิธีการตัดสินใจเชิงสถิติความน่าจะเป็น

ตัวแปรสุ่มอยู่ที่ไหน เอ็กซ์ 1และ เอ็กซ์ 2การแจกแจงแบบฟิชเชอร์คือการแจกแจงของตัวแปรสุ่ม เค 1 และ เค 2 มีความเป็นอิสระและมีการแจกแจงแบบไคสแควร์ด้วยจำนวนดีกรีอิสระ (เค 1 , เค 2 ) ตามลำดับ ขณะเดียวกันทั้งคู่ เค 1 – คู่ “องศาอิสระ” ของการแจกแจงแบบฟิชเชอร์ กล่าวคือ เค 2 คือจำนวนองศาอิสระของตัวเศษ และ

– จำนวนดีกรีอิสระของตัวส่วน การแจกแจงของตัวแปรสุ่ม F ได้รับการตั้งชื่อตามนักสถิติชาวอังกฤษผู้ยิ่งใหญ่ อาร์. ฟิชเชอร์ (พ.ศ. 2433-2505) ซึ่งใช้ตัวแปรสุ่มนี้ในงานของเขาอย่างแข็งขัน

นิพจน์สำหรับฟังก์ชันการแจกแจงไคสแควร์ ฟังก์ชันการแจกแจงแบบ Student และ Fisher ความหนาแน่นและคุณลักษณะ ตลอดจนตารางสามารถพบได้ในเอกสารเฉพาะทาง (ดูตัวอย่าง)

ดังที่ได้กล่าวไปแล้ว การแจกแจงแบบปกติมักใช้ในแบบจำลองความน่าจะเป็นในด้านต่างๆ ที่นำไปใช้ อะไรคือสาเหตุของการแจกแจงตระกูลสองพารามิเตอร์นี้ที่แพร่หลายมาก?มันถูกชี้แจงโดยทฤษฎีบทต่อไปนี้ เอ็กซ์ 1 , เอ็กซ์ 2 ,…, เอ็กซ์ เอ็นทฤษฎีบทขีดจำกัดกลาง ม(เอ็กซ์ 1 (สำหรับข้อกำหนดที่มีการกระจายต่างกัน) อนุญาตเอ็กซ์ 2 ,… - ตัวแปรสุ่มอิสระพร้อมความคาดหวังทางคณิตศาสตร์เอ็กซ์), ม( ดี(เอ็กซ์ 1 ), ดี(เอ็กซ์ 2 ),…, ดี(เอ็กซ์),…, ม(

n), ... และความแปรปรวน คุณ,

น) ... ตามลำดับ อนุญาต เอ็กซ์.

จากนั้น หากเงื่อนไขบางประการถูกต้อง ให้มั่นใจว่าการมีส่วนร่วมของข้อกำหนดใด ๆ ใน

สำหรับใครก็ตาม นอกจากนี้, เช่น. นอกจากนี้แล้วการกระจายตัวของผลการวัด (การสังเกต) ก็ใกล้เคียงกับปกติ

บางครั้งเชื่อกันว่าเพื่อให้การกระจายตัวเป็นปกติก็เพียงพอแล้วที่ผลการวัด (การสังเกต) เอ็กซ์เกิดขึ้นภายใต้อิทธิพลของหลายสาเหตุ ซึ่งแต่ละเหตุผลก็มีผลกระทบเพียงเล็กน้อย นี่เป็นสิ่งที่ผิด สิ่งที่สำคัญคือสาเหตุเหล่านี้ทำงานอย่างไร ถ้าเสริมแล้ว เอ็กซ์มีการกระจายตัวแบบปกติโดยประมาณ ถ้า คูณ(เช่น การกระทำของแต่ละสาเหตุจะถูกคูณและไม่บวก) จากนั้นจึงเป็นการกระจาย เอ็กซ์ใกล้ไม่ปกติ แต่เป็นสิ่งที่เรียกว่า ลอการิทึมปกติเช่น ไม่ เอ็กซ์และบันทึก X มีการแจกแจงแบบปกติโดยประมาณ เอ็กซ์หากไม่มีเหตุผลที่จะเชื่อว่าหนึ่งในสองกลไกในการสร้างผลลัพธ์สุดท้ายนั้นอยู่ที่ทำงาน (หรือกลไกอื่น ๆ ที่กำหนดไว้อย่างดี) จากนั้นจึงเกี่ยวกับการกระจาย

ไม่มีอะไรแน่นอนสามารถพูดได้

จากที่กล่าวมาข้างต้นว่าตามกฎแล้วไม่สามารถกำหนดความเป็นปกติของผลการวัด (การสังเกต) จากการพิจารณาทั่วไปได้ ดังนั้น ควรตรวจสอบโดยใช้เกณฑ์ทางสถิติ หรือใช้วิธีการทางสถิติแบบไม่อิงพารามิเตอร์ซึ่งไม่ได้ขึ้นอยู่กับสมมติฐานเกี่ยวกับการเป็นสมาชิกของฟังก์ชันการกระจายของผลการวัด (การสังเกต) ไปยังตระกูลพาราเมตริกหนึ่งหรืออีกตระกูลหนึ่งการแจกแจงแบบต่อเนื่องที่ใช้ในการตัดสินใจเชิงความน่าจะเป็นและเชิงสถิติ

นอกเหนือจากตระกูลการแจกแจงแบบปกติที่เลื่อนระดับแล้ว ยังมีการใช้ตระกูลการแจกแจงอื่น ๆ อีกจำนวนหนึ่ง เช่น การแจกแจงแบบ lognormal, เอ็กซ์โปเนนเชียล, Weibull-Gnedenko, การแจกแจงแกมมา เอ็กซ์มาดูครอบครัวเหล่านี้กันดีกว่า = บันทึก เอ็กซ์ตัวแปรสุ่ม มีการแจกแจงแบบ lognormal หากเป็นตัวแปรสุ่มมีการกระจายตัวแบบปกติ แล้ว เอ็กซ์ = 2,3026…ซี เอ็น( 1 = บันทึกมีการแจกแจงแบบปกติด้วย เอ็กซ์,σ 1) เอ็กซ์ที่ไหน ln

- ลอการิทึมธรรมชาติ เอ็กซ์ = เอ็กซ์ 1 เอ็กซ์ 2 เอ็กซ์ เอ็น- ความหนาแน่นของการแจกแจงแบบลอจิคัลคือ: เอ็กซ์ ฉัน, ฉัน = 1, 2,…, nจากทฤษฎีบทขีดจำกัดกลางเป็นไปตามที่ผลิตภัณฑ์ n ตัวแปรสุ่มบวกอิสระ

มีแบบจำลองความน่าจะเป็นอื่นๆ ที่นำไปสู่กฎลอจิกนอร์มอล

ตัวอย่างคลาสสิกของแบบจำลองดังกล่าวได้รับจาก A.N. Kolmogorov ซึ่งจากระบบสมมุติฐานทางกายภาพได้สรุปว่าขนาดของอนุภาคเมื่อบดแร่ถ่านหิน ฯลฯ ในโรงสีลูกกลมมีการแจกแจงแบบลอจิกนอร์มอล เอ็กซ์เรามาดูการแจกแจงอีกตระกูลหนึ่งซึ่งใช้กันอย่างแพร่หลายในวิธีการตัดสินใจทางสถิติความน่าจะเป็นและการวิจัยประยุกต์อื่น ๆ - ตระกูลของการแจกแจงแบบเอ็กซ์โปเนนเชียล เริ่มจากแบบจำลองความน่าจะเป็นที่นำไปสู่การแจกแจงดังกล่าว หากต้องการทำสิ่งนี้ ให้พิจารณา "กระแสของเหตุการณ์" เช่น ลำดับเหตุการณ์ที่เกิดขึ้นต่อเนื่องกัน ณ จุดใดจุดหนึ่ง ตัวอย่างได้แก่: ลำดับการโทรที่ชุมสายโทรศัพท์; การไหลของความล้มเหลวของอุปกรณ์ในห่วงโซ่เทคโนโลยี การไหลของความล้มเหลวของผลิตภัณฑ์ในระหว่างการทดสอบผลิตภัณฑ์ กระแสคำขอของลูกค้าไปยังสาขาของธนาคาร กระแสของผู้ซื้อที่สมัครสินค้าและบริการ ฯลฯ ในทฤษฎีเรื่องการไหลของเหตุการณ์ ทฤษฎีบทที่คล้ายกับทฤษฎีบทขีดจำกัดจุดศูนย์กลางนั้นใช้ได้ แต่มันไม่เกี่ยวกับผลรวมของตัวแปรสุ่ม แต่เกี่ยวกับผลรวมของกระแสเหตุการณ์ เราพิจารณาการไหลรวมที่ประกอบด้วยการไหลอิสระจำนวนมาก ซึ่งไม่มีการไหลใดที่มีอิทธิพลเหนือการไหลทั้งหมด ตัวอย่างเช่น กระแสการโทรเข้าสู่การแลกเปลี่ยนทางโทรศัพท์ประกอบด้วยกระแสการโทรอิสระจำนวนมากที่มีต้นกำเนิดจากสมาชิกแต่ละราย ได้รับการพิสูจน์แล้วว่าในกรณีที่ลักษณะของการไหลไม่ขึ้นอยู่กับเวลา การไหลทั้งหมดจะถูกอธิบายอย่างสมบูรณ์ด้วยตัวเลขเดียว - ความเข้มของการไหล สำหรับการไหลรวม ให้พิจารณาตัวแปรสุ่ม

(10)

- ระยะเวลาระหว่างเหตุการณ์ต่อเนื่องกัน ฟังก์ชันการกระจายมีรูปแบบ การแจกแจงนี้เรียกว่าการแจกแจงแบบเอ็กซ์โปเนนเชียลเพราะว่า สูตร (10) เกี่ยวข้องกับฟังก์ชันเลขชี้กำลัง x กับ- ค่า 1/แล คือพารามิเตอร์มาตราส่วน บางครั้งก็มีการแนะนำพารามิเตอร์ shift ด้วย การแจกแจงของตัวแปรสุ่มเรียกว่าเลขชี้กำลังเอ็กซ์ + ส เอ็กซ์ซึ่งจะมีการกระจายสินค้า

การแจกแจงแบบเอ็กซ์โปเนนเชียลเป็นกรณีพิเศษของสิ่งที่เรียกว่า การแจกแจงแบบ Weibull - Gnedenko ตั้งชื่อตามชื่อของวิศวกร V. Weibull ซึ่งแนะนำการแจกแจงเหล่านี้ในการฝึกวิเคราะห์ผลลัพธ์ของการทดสอบความล้า และนักคณิตศาสตร์ B.V. Gnedenko (1912-1995) ซึ่งได้รับการแจกแจงดังกล่าวเป็นการจำกัดการแจกแจงเมื่อศึกษาค่าสูงสุด ของผลการทดสอบ อนุญาต เอ็กซ์- ตัวแปรสุ่มที่แสดงลักษณะระยะเวลาการดำเนินงานของผลิตภัณฑ์ ระบบที่ซับซ้อน องค์ประกอบ (เช่น ทรัพยากร เวลาการดำเนินงานไปสู่สภาวะที่จำกัด ฯลฯ) ระยะเวลาการดำเนินงานขององค์กร หรือชีวิตของสิ่งมีชีวิต เป็นต้น ความรุนแรงของความล้มเหลวมีบทบาทสำคัญ

(11)

ที่ไหน เอฟ(x) และ (x) - ฟังก์ชันการกระจายและความหนาแน่นของตัวแปรสุ่ม เอ็กซ์.

ให้เราอธิบายพฤติกรรมทั่วไปของอัตราความล้มเหลว ช่วงเวลาทั้งหมดสามารถแบ่งออกเป็นสามช่วง ประการแรกคือฟังก์ชั่น แล(x)มีค่าสูงและมีแนวโน้มที่จะลดลงอย่างชัดเจน (ส่วนใหญ่มักจะลดลงแบบน่าเบื่อ) สิ่งนี้สามารถอธิบายได้จากการมีอยู่ในชุดของหน่วยผลิตภัณฑ์ที่มีปัญหาซึ่งมีข้อบกพร่องที่ชัดเจนและซ่อนเร้น ซึ่งนำไปสู่ความล้มเหลวที่ค่อนข้างรวดเร็วของหน่วยผลิตภัณฑ์เหล่านี้ ช่วงแรกเรียกว่า “ระยะบุก” (หรือ “ระยะบุก”) โดยปกติระยะเวลาการรับประกันจะครอบคลุมถึงนี้

จากนั้นถึงช่วงของการทำงานปกติซึ่งมีอัตราความล้มเหลวคงที่โดยประมาณและค่อนข้างต่ำ ลักษณะของความล้มเหลวในช่วงเวลานี้เกิดขึ้นอย่างกะทันหัน (อุบัติเหตุ ข้อผิดพลาดของเจ้าหน้าที่ปฏิบัติงาน ฯลฯ) และไม่ขึ้นอยู่กับระยะเวลาการทำงานของหน่วยผลิตภัณฑ์

ในที่สุดช่วงสุดท้ายของการทำงานคือช่วงอายุและการสึกหรอ ลักษณะของความล้มเหลวในช่วงเวลานี้คือการเปลี่ยนแปลงทางกายภาพ ทางกล และทางเคมีของวัสดุที่ไม่สามารถย้อนกลับได้ ซึ่งนำไปสู่การเสื่อมถอยของคุณภาพของหน่วยผลิตภัณฑ์และความล้มเหลวขั้นสุดท้าย

แต่ละช่วงเวลามีประเภทของฟังก์ชันของตัวเอง แล(x)- ให้เราพิจารณาระดับของการพึ่งพาอำนาจ

แล(x) = แล 0ขxข -1 , (12)

ที่ไหน λ 0 > 0 และ > 0 - พารามิเตอร์ตัวเลขบางตัว ค่านิยม < 1, = 0 และ > 1 สอดคล้องกับประเภทของอัตราความล้มเหลวในช่วงระยะเวลาของการรันอิน การทำงานปกติ และการเสื่อมสภาพ ตามลำดับ

ความสัมพันธ์ (11) ในอัตราความล้มเหลวที่กำหนด แล(x)- สมการเชิงอนุพันธ์ของฟังก์ชัน เอฟ(x). จากทฤษฎีสมการเชิงอนุพันธ์จึงเป็นไปตามนั้น

(13)

เมื่อแทน (12) ลงใน (13) เราจะได้สิ่งนั้น

(14)

การแจกแจงที่กำหนดโดยสูตร (14) เรียกว่าการแจกแจงแบบ Weibull - Gnedenko เนื่องจาก

จากสูตร (14) จึงเป็นไปตามปริมาณ ที่กำหนดโดยสูตร (15) คือพารามิเตอร์มาตราส่วน เอฟ(x - บางครั้งก็มีการแนะนำพารามิเตอร์ shift เช่น ฟังก์ชันการแจกแจง Weibull-Gnedenko เรียกว่า เอฟ(x), ที่ไหน .

) กำหนดโดยสูตร (14) สำหรับบาง แล 0 และ

(16)

ที่ไหน ความหนาแน่นของการกระจาย Weibull-Gnedenko มีรูปแบบ > 0 - พารามิเตอร์สเกล กับ> 0 - พารามิเตอร์แบบฟอร์ม - พารามิเตอร์กะ ในกรณีนี้คือพารามิเตอร์ λ จากสูตร (16) เชื่อมโยงกับพารามิเตอร์

0 จากสูตร (14) ตามความสัมพันธ์ที่ระบุในสูตร (15) = 1.

การแจกแจงแบบเลขชี้กำลังเป็นกรณีพิเศษมากของการแจกแจงแบบ Weibull-Gnedenko ซึ่งสอดคล้องกับค่าของพารามิเตอร์รูปร่าง เอ็กซ์ 1 , เอ็กซ์ 2 ,…, เอ็กซ์ เอ็นการแจกแจงแบบ Weibull-Gnedenko ยังใช้ในการสร้างแบบจำลองความน่าจะเป็นของสถานการณ์ ซึ่งพฤติกรรมของวัตถุถูกกำหนดโดย "จุดอ่อนที่สุด" มีความคล้ายคลึงกับโซ่ซึ่งความปลอดภัยจะถูกกำหนดโดยลิงค์ที่มีความแข็งแรงน้อยที่สุด กล่าวอีกนัยหนึ่งให้

- ตัวแปรสุ่มที่กระจายอย่างอิสระเหมือนกันเอ็กซ์(1) =นาที(), X 1, X 2,…, Xnเอ็กซ์(เอ็น) =สูงสุด().

X 1, X 2,…, Xn เอ็กซ์(1) และ เอ็กซ์(n) ในปัญหาที่นำไปใช้หลายประการ ปัญหาเหล่านี้มีบทบาทสำคัญ เอ็กซ์(1) และ เอ็กซ์(n) โดยเฉพาะอย่างยิ่งเมื่อศึกษาค่าสูงสุดที่เป็นไปได้ ("บันทึก") ของค่าบางค่า เช่น การจ่ายเงินประกันหรือการสูญเสียเนื่องจากความเสี่ยงทางการค้า เมื่อศึกษาขีดจำกัดความยืดหยุ่นและความทนทานของเหล็ก คุณลักษณะความน่าเชื่อถือจำนวนหนึ่ง เป็นต้น . แสดงว่าสำหรับการแจกแจงขนาดใหญ่ เอ็กซ์(1) และ เอ็กซ์(n) ตามกฎแล้ว มีการอธิบายไว้อย่างดีโดยการแจกแจงแบบ Weibull-Gnedenko การมีส่วนร่วมขั้นพื้นฐานในการศึกษาการแจกแจง

สนับสนุนโดยนักคณิตศาสตร์ชาวโซเวียต B.V. Gnedenko ผลงานของ V. Weibull, E. Gumbel, V.B. ทุ่มเทให้กับการใช้ผลลัพธ์ที่ได้รับในด้านเศรษฐศาสตร์ การจัดการ เทคโนโลยี และสาขาอื่นๆ เนฟโซโรวา, E.M. กุดเลฟ และผู้เชี่ยวชาญอื่นๆ อีกมากมาย เคมาดูตระกูลของการแจกแจงแกมมากันดีกว่า มีการใช้กันอย่างแพร่หลายในด้านเศรษฐศาสตร์และการจัดการ ทฤษฎีและการปฏิบัติเกี่ยวกับความน่าเชื่อถือและการทดสอบ ในสาขาเทคโนโลยีต่างๆ อุตุนิยมวิทยา ฯลฯ โดยเฉพาะอย่างยิ่ง ในหลาย ๆ สถานการณ์ การกระจายแกมม่าขึ้นอยู่กับปริมาณ เช่น อายุการใช้งานรวมของผลิตภัณฑ์ ความยาวของสายโซ่ของอนุภาคฝุ่นที่เป็นสื่อกระแสไฟฟ้า เวลาที่ผลิตภัณฑ์ถึงสภาวะจำกัดระหว่างการกัดกร่อน เวลาในการทำงานถึง เค- การปฏิเสธครั้งที่

= 1, 2, … ฯลฯ อายุขัยของผู้ป่วยโรคเรื้อรังและเวลาในการบรรลุผลบางอย่างระหว่างการรักษาในบางกรณีมีการกระจายแกมมา การกระจายนี้เพียงพอที่สุดสำหรับการอธิบายความต้องการในรูปแบบทางเศรษฐกิจและคณิตศาสตร์ของการจัดการสินค้าคงคลัง (โลจิสติกส์)

(17)

ความหนาแน่นของความน่าจะเป็นในสูตร (17) ถูกกำหนดโดยพารามิเตอร์สามตัว , , , ที่ไหน >0, >0. ในเวลาเดียวกัน เป็นพารามิเตอร์แบบฟอร์ม - พารามิเตอร์มาตราส่วนและ กับ- พารามิเตอร์กะ ปัจจัย 1/Γ(ก)กำลังทำให้เป็นมาตรฐาน มันถูกแนะนำให้รู้จักกับ

ที่นี่ Γ(ก)- หนึ่งในฟังก์ชันพิเศษที่ใช้ในคณิตศาสตร์ที่เรียกว่า "ฟังก์ชันแกมมา" หลังจากนั้นจึงตั้งชื่อการแจกแจงตามสูตร (17)

คงที่ สูตร (17) ระบุตระกูลการแจกแจงแบบเลื่อนขนาดซึ่งเกิดจากการแจกแจงแบบมีความหนาแน่น

(18)

การกระจายตัวของรูปแบบ (18) เรียกว่าการแจกแจงแกมมามาตรฐาน ได้มาจากสูตร (17) ณ = 1 และ กับ= 0.

กรณีพิเศษของการแจกแจงแกมมาสำหรับ = 1 เป็นการแจกแจงแบบเอ็กซ์โปเนนเชียล (ด้วย แล = 1/- ด้วยความเป็นธรรมชาติ และ กับการแจกแจงแกมมา =0 เรียกว่าการแจกแจงแบบ Erlang จากผลงานของนักวิทยาศาสตร์ชาวเดนมาร์ก K.A. Erlang (พ.ศ. 2421-2472) พนักงานของ บริษัท โทรศัพท์โคเปนเฮเกนซึ่งศึกษาในปี พ.ศ. 2451-2465 การทำงานของเครือข่ายโทรศัพท์ การพัฒนาทฤษฎีคิวเริ่มขึ้น ทฤษฎีนี้เกี่ยวข้องกับการสร้างแบบจำลองความน่าจะเป็นและทางสถิติของระบบซึ่งมีการให้บริการคำขอต่างๆ เพื่อการตัดสินใจที่เหมาะสมที่สุด การแจกแจง Erlang ถูกใช้ในพื้นที่แอปพลิเคชันเดียวกันกับที่ใช้การแจกแจงแบบเอ็กซ์โปเนนเชียล ขึ้นอยู่กับสิ่งต่อไปนี้ข้อเท็จจริงทางคณิตศาสตร์ กับ: ผลรวมของตัวแปรสุ่มอิสระ k ซึ่งกระจายแบบเอกซ์โปเนนเชียลด้วยพารามิเตอร์เดียวกัน แล และ มีการกระจายแกมมาพร้อมพารามิเตอร์รูปร่างเคก = , พารามิเตอร์มาตราส่วน = 1/แล และพารามิเตอร์ชิฟต์- ที่ กับเคซี

ถ้าเป็นตัวแปรสุ่ม เอ็กซ์= 0 เราได้รับการแจกแจง Erlang มีการแจกแจงแกมมาพร้อมพารามิเตอร์รูปร่าง = 2 เช่นนั้น = 1 และ กับ- จำนวนเต็ม เอ็กซ์= 0 จากนั้น 2 มีการแจกแจงแบบไคสแควร์ด้วย

นอกเหนือจากตระกูลการแจกแจงแบบปกติที่เลื่อนระดับแล้ว ยังมีการใช้ตระกูลการแจกแจงอื่น ๆ อีกจำนวนหนึ่ง เช่น การแจกแจงแบบ lognormal, เอ็กซ์โปเนนเชียล, Weibull-Gnedenko, การแจกแจงแกมมา เอ็กซ์ระดับความเป็นอิสระ

ด้วยการแจกแจงแบบ gvmma มีลักษณะดังต่อไปนี้: ความคาดหวังม(เอ็กซ์) = + ,

เกี่ยวกับ ดี(เอ็กซ์) = σ 2 = ม(เอ็กซ์) = 2 ,

ความแปรปรวน

ค่าสัมประสิทธิ์ของการแปรผัน

ความไม่สมมาตร

ส่วนเกิน

น) ... ตามลำดับ อนุญาต การแจกแจงแบบปกติถือเป็นกรณีที่รุนแรงของการแจกแจงแกมมา ถ้าให้เจาะจงกว่านั้น ให้ Z เป็นตัวแปรสุ่มที่มีการแจกแจงแกมมามาตรฐานตามสูตร (18) แล้ว เอ็กซ์จำนวนจริง ฉ(x), ที่ไหน เอ็น(0,1).

- ฟังก์ชั่นการแจกแจงแบบปกติมาตรฐาน

ในการวิจัยประยุกต์ ยังใช้ตระกูลการแจกแจงแบบพาราเมตริกอื่นๆ อีกด้วย ซึ่งระบบที่มีชื่อเสียงที่สุดคือระบบเส้นโค้ง Pearson, ซีรีส์ Edgeworth และ Charlier พวกเขาไม่ได้พิจารณาที่นี่ ไม่ต่อเนื่องที่ใช้กันมากที่สุดคือสามตระกูลของการแจกแจงแบบไม่ต่อเนื่อง - ทวินาม, ไฮเปอร์จีโอเมตริกและปัวซองรวมถึงตระกูลอื่น ๆ - เรขาคณิต, ทวินามลบ, พหุนาม, ไฮเปอร์เรขาคณิตเชิงลบ ฯลฯ

ดังที่ได้กล่าวไปแล้ว การแจกแจงแบบทวินามเกิดขึ้นในการทดลองอิสระ ซึ่งในแต่ละการทดลองมีความน่าจะเป็น เหตุการณ์ปรากฏขึ้น - ถ้าจำนวนการทดลองทั้งหมด nที่กำหนดแล้วจำนวนการทดสอบ ซึ่งเหตุการณ์ดังกล่าวก็ปรากฏขึ้น มีการกระจายตัวแบบทวินาม สำหรับ การแจกแจงแบบทวินามความน่าจะเป็นที่จะได้รับการยอมรับเป็นตัวแปรสุ่ม ค่านิยม ถูกกำหนดโดยสูตร

จำนวนชุดค่าผสมของ nองค์ประกอบโดย รู้จักจากศาสตร์เชิงผสม สำหรับทุกคน ยกเว้น 0, 1, 2, …, nเรามี (= )= 0. การแจกแจงแบบทวินามที่มีขนาดตัวอย่างคงที่ nถูกระบุโดยพารามิเตอร์ พี, เช่น. การแจกแจงแบบทวินามเป็นตระกูลที่มีพารามิเตอร์เดียว ใช้ในการวิเคราะห์ข้อมูลจากการศึกษาตัวอย่าง โดยเฉพาะอย่างยิ่งในการศึกษาความชอบของผู้บริโภค การควบคุมการเลือกคุณภาพผลิตภัณฑ์ตามแผนการควบคุมขั้นตอนเดียว เมื่อทดสอบประชากรของบุคคลในสาขาประชากรศาสตร์ สังคมวิทยา การแพทย์ ชีววิทยา ฯลฯ .

ถ้า 1 และ 2 - ตัวแปรสุ่มทวินามอิสระที่มีพารามิเตอร์เดียวกัน พี 0 พิจารณาจากตัวอย่างที่มีปริมาตร n 1 และ n 2 ตามนั้น 1 + 2 - ตัวแปรสุ่มทวินามที่มีการแจกแจง (19) ด้วย = พี 0 และ n = n 1 + n 2 - หมายเหตุนี้ขยายขอบเขตการใช้งานของการแจกแจงแบบทวินามโดยอนุญาตให้นำผลลัพธ์ของการทดสอบหลายกลุ่มมารวมกันเมื่อมีเหตุผลที่เชื่อได้ว่าพารามิเตอร์เดียวกันนั้นสอดคล้องกับกลุ่มเหล่านี้ทั้งหมด

คุณลักษณะของการแจกแจงแบบทวินามถูกคำนวณก่อนหน้านี้:

() = n.p., ดี() = n.p.( 1- พี).

ในส่วน "เหตุการณ์และความน่าจะเป็น" กฎของจำนวนมากได้รับการพิสูจน์แล้วสำหรับตัวแปรสุ่มแบบทวินาม:

สำหรับใครก็ตาม เมื่อใช้ทฤษฎีบทขีดจำกัดจุดศูนย์กลาง กฎของจำนวนมากสามารถปรับปรุงได้โดยการระบุจำนวน / nแตกต่างจาก .

ทฤษฎีบทเดอมัวฟวร์-ลาปลาซสำหรับตัวเลขใดๆ a และ , < เรามี

ที่ไหน เอฟ(เอ็กซ์) เป็นฟังก์ชันของการแจกแจงแบบปกติมาตรฐานที่มีค่าคาดหวังทางคณิตศาสตร์เป็น 0 และความแปรปรวน 1

เพื่อพิสูจน์มัน ก็เพียงพอแล้วที่จะใช้การเป็นตัวแทน ในรูปแบบของผลรวมของตัวแปรสุ่มอิสระที่สอดคล้องกับผลลัพธ์ของการทดสอบแต่ละรายการ สูตรสำหรับ () และ ดี() และทฤษฎีบทขีดจำกัดจุดศูนย์กลาง

ทฤษฎีบทนี้มีไว้สำหรับกรณีนี้ = ½ ได้รับการพิสูจน์โดยนักคณิตศาสตร์ชาวอังกฤษ A. Moivre (1667-1754) ในปี 1730 ในสูตรข้างต้น ได้รับการพิสูจน์ในปี 1810 โดยนักคณิตศาสตร์ชาวฝรั่งเศส Pierre Simon Laplace (1749 - 1827)

การกระจายแบบไฮเปอร์เรขาคณิตเกิดขึ้นระหว่างการควบคุมแบบเลือกชุดของวัตถุที่มีปริมาตร N ตามเกณฑ์ทางเลือก แต่ละอ็อบเจ็กต์ที่ถูกควบคุมจะถูกจัดประเภทว่ามีแอ็ตทริบิวต์ หรือไม่มีลักษณะเช่นนี้ การแจกแจงแบบไฮเปอร์เรขาคณิตมีตัวแปรสุ่ม , เท่ากับจำนวนวัตถุที่มีลักษณะเฉพาะ ในตัวอย่างปริมาตรแบบสุ่ม n, ที่ไหน n< เอ็น- เช่น ตัวเลข หน่วยของผลิตภัณฑ์ที่มีข้อบกพร่องในตัวอย่างปริมาตรแบบสุ่ม nจากปริมาณแบทช์ เอ็นมีการกระจายแบบไฮเปอร์เรขาคณิตถ้า n< เอ็น. อีกตัวอย่างหนึ่งคือลอตเตอรี ให้สัญญาณ ตั๋วเป็นสัญลักษณ์ของ "การเป็นผู้ชนะ" ให้นับจำนวนตั๋วทั้งหมด เอ็น, และบุคคลบางคนได้รับมา nของพวกเขา จำนวนตั๋วที่ชนะสำหรับบุคคลนี้มีการกระจายแบบไฮเปอร์เรขาคณิต

สำหรับการแจกแจงแบบไฮเปอร์เรขาคณิต ความน่าจะเป็นที่ตัวแปรสุ่ม Y ยอมรับค่า y จะมีรูปแบบ

(20)

ที่ไหน ดี– จำนวนวัตถุที่มีคุณสมบัติ ในชุดปริมาตรที่พิจารณา เอ็น- ในเวลาเดียวกัน รับค่าจากสูงสุด (0, n - (เอ็น - ดี)) ถึงนาที( n, ดี) สิ่งอื่นๆ ความน่าจะเป็นในสูตร (20) เท่ากับ 0 ดังนั้นการแจกแจงแบบไฮเปอร์เรขาคณิตจึงถูกกำหนดโดยพารามิเตอร์สามตัว - ปริมาตร ประชากร เอ็น, จำนวนวัตถุ ดีอยู่ในนั้นโดยมีลักษณะเฉพาะนั้น และขนาดตัวอย่าง n.

การสุ่มตัวอย่างด้วยปริมาตรแบบสุ่มอย่างง่าย nจากปริมาตรรวม เอ็นคือตัวอย่างที่ได้จากการสุ่มเลือกชุดใดชุดหนึ่ง nวัตถุมีความน่าจะเป็นเท่ากันในการเลือก วิธีการสุ่มเลือกตัวอย่างของผู้ตอบแบบสอบถาม (ผู้ให้สัมภาษณ์) หรือหน่วยของสินค้าเป็นชิ้นจะกล่าวถึงในเอกสารคำแนะนำ วิธีการ และข้อบังคับ หนึ่งในวิธีการเลือกคือ: วัตถุจะถูกเลือกจากอีกวัตถุหนึ่ง และในแต่ละขั้นตอน แต่ละวัตถุที่เหลืออยู่ในชุดจะมีโอกาสถูกเลือกเท่ากัน ในวรรณกรรม คำว่า "ตัวอย่างสุ่ม" และ "ตัวอย่างสุ่มโดยไม่มีการส่งคืน" ยังใช้สำหรับประเภทของตัวอย่างที่อยู่ระหว่างการพิจารณาด้วย

เนื่องจากปริมาณประชากร (ชุด) เอ็นและตัวอย่าง nโดยทั่วไปจะทราบอยู่แล้ว ดังนั้นพารามิเตอร์ของการแจกแจงแบบไฮเปอร์เรขาคณิตที่จะประมาณก็คือ ดี- ในวิธีทางสถิติของการจัดการคุณภาพผลิตภัณฑ์ ดี– โดยปกติคือจำนวนหน่วยที่ชำรุดในชุด ดี/ เอ็นลักษณะการกระจายก็น่าสนใจเช่นกัน

– ระดับของข้อบกพร่อง

สำหรับการกระจายแบบไฮเปอร์เรขาคณิต เอ็น>10 nตัวประกอบสุดท้ายในนิพจน์สำหรับความแปรปรวนมีค่าใกล้เคียงกับ 1 if พี = ดี/ เอ็น, จากนั้นนิพจน์สำหรับความคาดหวังทางคณิตศาสตร์และความแปรปรวนของการแจกแจงแบบไฮเปอร์จีโอเมตริกจะกลายเป็นนิพจน์สำหรับความคาดหวังทางคณิตศาสตร์และความแปรปรวนของการแจกแจงแบบทวินาม นี่ไม่ใช่เรื่องบังเอิญ ก็สามารถแสดงได้ว่า

ที่ เอ็น>10 n, ที่ไหน พี = ดี/ เอ็น. อัตราส่วนจำกัดถูกต้อง

และความสัมพันธ์อันจำกัดนี้สามารถใช้ได้เมื่อใด เอ็น>10 n.

การแจกแจงแบบไม่ต่อเนื่องแบบที่สามที่ใช้กันอย่างแพร่หลายคือการแจกแจงแบบปัวซง

,

ตัวแปรสุ่ม Y มีการแจกแจงปัวซองถ้า (= )= โดยที่ แล คือพารามิเตอร์การแจกแจงปัวซอง และ 0 สำหรับคนอื่นๆ ทั้งหมด

() = λ, ดี() = λ.

(สำหรับ y=0 กำหนดให้เป็น 0! =1) สำหรับการกระจายปัวซอง การแจกแจงนี้ตั้งชื่อตามนักคณิตศาสตร์ชาวฝรั่งเศส เอส. ดี. ปัวซอง (ค.ศ. 1781-1840) ซึ่งได้รับการกระจายครั้งแรกในปี ค.ศ. 1837 การแจกแจงแบบปัวซองเป็นกรณีที่จำกัดของการแจกแจงแบบทวินาม เมื่อความน่าจะเป็น nการดำเนินกิจกรรมมีขนาดเล็กแต่มีจำนวนการทดสอบ n.p.เยี่ยมยอดและ

= แล. แม่นยำยิ่งขึ้น ความสัมพันธ์ขีดจำกัดนั้นถูกต้อง

ดังนั้นการกระจายปัวซอง (ในคำศัพท์เก่า "กฎการกระจาย") จึงมักถูกเรียกว่า "กฎของเหตุการณ์ที่หายาก" ทีการแจกแจงแบบปัวซองมีต้นกำเนิดมาจากทฤษฎีการไหลของเหตุการณ์ (ดูด้านบน) ได้รับการพิสูจน์แล้วว่าสำหรับการไหลที่ง่ายที่สุดที่มีความเข้มข้นคงที่ Λ จำนวนเหตุการณ์ (การโทร) ที่เกิดขึ้นในช่วงเวลานั้น ทีมีการแจกแจงแบบปัวซองพร้อมพารามิเตอร์ แล = Λ ที- ดังนั้นความน่าจะเป็นนั้นในช่วงเวลานั้น - Λ ไม่มีเหตุการณ์ใดเกิดขึ้นเท่ากับที

, เช่น. ฟังก์ชันการกระจายของความยาวของช่วงเวลาระหว่างเหตุการณ์เป็นแบบเลขชี้กำลัง

การแจกแจงแบบปัวซองใช้เมื่อวิเคราะห์ผลการสำรวจการตลาดตัวอย่างผู้บริโภคโดยคำนวณลักษณะการปฏิบัติงานของแผนควบคุมการยอมรับทางสถิติในกรณีที่มีค่าน้อยของระดับการยอมรับข้อบกพร่องเพื่ออธิบายจำนวนการแยกย่อยของข้อบกพร่องที่ควบคุมทางสถิติ กระบวนการทางเทคโนโลยีต่อหน่วยเวลา จำนวน “ข้อกำหนดในการให้บริการ” ที่ได้รับต่อหน่วยเวลาในระบบคิว รูปแบบสถิติอุบัติเหตุและโรคหายาก เป็นต้น คำอธิบายของกลุ่มพารามิเตอร์อื่นๆ ของการแจกแจงแบบแยกส่วนและความเป็นไปได้การใช้งานจริง


ได้รับการพิจารณาในวรรณคดี

ในบางกรณี ตัวอย่างเช่น เมื่อศึกษาราคา ปริมาณผลผลิต หรือเวลารวมระหว่างความล้มเหลวในปัญหาความน่าเชื่อถือ ฟังก์ชันการแจกแจงจะคงที่ในบางช่วงเวลาที่ค่าของตัวแปรสุ่มที่ศึกษาไม่สามารถตกได้
บทความที่เกี่ยวข้อง

2024 liveps.ru การบ้านและปัญหาสำเร็จรูปในวิชาเคมีและชีววิทยา