您现在的位置:首页 > 数学 >

概率论第七章参数估计2区间估计_图文


第三节 区间估计

譬如,在估计湖中鱼数的问题中,若 我们根据一个实际样本,得到鱼数 N 的极 大似然估计为1000条.
实际上,N的真值可能大于1000条, 也可能小于1000 条. 若我们能给出一个区间,在此区间 内我们合理地相信 N 的真值位于其中. 这 样对鱼数的估计就有把握多了.

也就是说,我们希望确定一个区间,使我 们能以比较高的可靠程度相信它包含真参 数值. 湖中鱼数的真值
[ ]

这里所说的“可靠程度”是用概率来度量的, 称为置信概率,置信度或置信水平.
习惯上把置信水平记作 很小的正数. ,这里 是一个

区间估计要求根据样本给出未知参数的范围, 并保证真参数以指定的较大概率属于这个范围。

一. 置信区间与置信度 定义:设总体 含一待估参数
找出两个统计量 使得: 称区间 为该区间的置信度 是一个随机区间;

对于样本

为 的置信区间, 区间

给出该区间 含真值 的可靠度。 表示该区间不包含真值 的 可能性。

即置信度为 1 ? ? ? 95%.这时重复 例如 若? ? 5%, 抽样 100次, 则在得到的100个区间中包含 ? 真值 的有95个左右, 不包含 ? 真值的有5个左右。 通常, 采用95%的置信度, 有时也取99% 或 90%.

具体的计算方法 ⑴ 由样本 X 1 , X 2 ,

, X n 寻找一个样本函数

g ( X 1 , X 2 , , X n ;? ),其中只含有一个未知参数θ
⑵ 对于给定的置信水平 1 ? ? ,找 a , b 使得

⑵ 对于给定的置信水平 1 ? ? ,找 a , b 使得

P{a ? g ( X 1 , X 2 , , X n ;? ) ? b} ? 1 ? ?
⑶ 由 a ? g ( X1, X 2 , 不等式 ? ( X 1 ,

, X n ;? ) ? b 解出等价的

, X n ) ? ? ? ? ( X1, , X n )

[? ( X 1 , , X n ),? ( X 1, , X n )] 是θ的置信度为
1 ? ? 的置信区间。

二 、正态总体均值与方差的区间估计 设 X 1 ,?, X n为总体X ~ N ( ? , ? 2 ) 的一个样本

置信度 1 ? ?下,来确定 ? 的置信区间[? ,? ]
⑴ 已知方差 ? ,估计均值μ
2
n 1 2 设已知方差 ? 2 ? ? 0 ,且 X ? ? X i 是 ? 的 n i ?1 一个无偏点估计,



X ?? ~ N (0 , 1) ?0 / n

且 对于给定的置信度 查正态分布表,找出

临界值

使得:
通常我们取对称

由此可找出无穷多组 区间 使:

由上 点的定义式,

查正态分布表

找出

得:

推得,随机区间:

所以μ的置信水平为1-α的置信区间为

[X ?

?
n

z? / 2 , X ?

?
n

z? / 2 ] 简记为 [ X ?

?
n

z? / 2 ]

例 若取 ? ? 0.05 ,1 ? ? ? 0.95 , ? ? 1, n ? 16 查表得 z? / 2 ? z0.025 ? 1.96 ,若由一个样本 值算得样本均值的观察值 x ? 5.20 则得到一个置信度为0.95的μ的置信区间

(5.20 ? 0.49) ? (4.71, 5.69)

注: μ的置信水平1-α的置信区间不唯一。
上例中同样给定 ? ? 0.05 ,可以取标准正态分 布上α分位点-Z0.04和Z0.01,则也有
P{ X ?
0.04 0.01

?
n

z0.01 ? ? ? X ?

?
n

z0.04 } ? 0.95

? z0.04

z0.01

则μ的置信度为0.95的置信区间为
[X ?

?

n

z0.01 , X ?

?

n

z0.04 ]

2? 但对称时的区间长度 L ? z? / 2 最短。194页 n

例 1: 已知幼儿身高服从正态分布,现从5~6岁的幼 儿中随机地抽查了9人,其高度分别为:115, 120 131, 115, 109, 115, 115, 105, 110 cm; 假设标准差 置信度为95%; 试求总体均值 的置信区间

解:已知

由样本值算得:

查正态分布表得

由此得置信区间:

例 2: 从一批零件中随机抽取16个, 测得长度(单 位:厘米) 为 2.14, 2.10, 2.13, 2.15, 2.13, 2.12, 2.13, 2.10, 2.15, 2.12, 2.14, 2.10, 2.13, 2.11, 2.14, 2.11设 零件长度 求总体均值 的置信水 平为 0.90 的置信区间。 查表得 解:
所以 的置信水平为0.90的 置信区间为 即:

问需要抽取容量为多 大的样本,才能使 的置信水平为0.95 的置信区间 的长度不大于 0.49 ? 解: 设需要抽取容量为 的样本, 其样本均值为 于是 查表得

设总体 例 3:

的置信水平为0.95的置信区间为
该区间长度 要使

只要





⑵ 方差 ? 未知,估计均值μ
2

X ?? t? ~ t ( n ? 1) S/ n X ?? P{?t? / 2 ? ? t? / 2 } ? 1 ? ? S/ n
所以μ的置信水平为1-α的置信区间为

S S [X ? t? / 2 , X ? t? / 2 ] n n S 简记为 [ X ? t? / 2 (n ? 1)] n

用仪器测量温度, 重复测量7次, 测得温度分 例 4: 别为:115, 120, 131, 115, 109, 115, 115cm; 设温度 在置信度为95%时, 试求温度的真 值所在范围。 解:设 是温度的真值, 是测量值

已知

由样本值算得:
查表 t0.025 (6) ? 2.447

得区间:

对某种型号飞机的飞行速度进行15次试验, 测 例 5: 得最大飞行速度(单位: 米/秒)为 422.2, 417.2, 425.6 420.3, 425.8, 423.1, 418.7, 438.3, 434.0, 412.3, 431.5 413.5, 441.3, 423.0, 428.2, 根据长期经验, 可以认为 最大飞行速度服从正态分布. 求飞机最大飞行速度

的期望值的置信水平为 0.95 的置信区间。 解: 以
表示该飞机的最大飞行速度, 则



查表得 由于总体方差 的置信区间为:
未知, 因此 的置信水平为0.95

即:

3) 方差的区间估计 设 为总体 是 并且样本函数: 由于 分布无对称性 的一个样本 的无偏估计

即:



分布表的构造
? /2 ? /2

? 2 ? (n ? 1)
1? 2

2 ?? / 2 ( n ? 1)



置信区间:

标准差σ的一个置信水平为 1 ? ? 的置信区间

? 2 ? (n ? 1) S , ? ? 2? (n ? 1) 2 ?

? (n ? 1) S ? 2 ? 1?? (n ? 1) ? 2 ?
2

注意:在密度函数不对称时,如 ? 2分布和F 分布,
习惯上仍取和对称类似的分位点,但其置信区间 的长度并不最短。

在某班级中, 随机抽取25名同学测量其身高, 例 6: 算得平均身高为170cm,标准差为12cm. 假设所测 身高近似服从正态分布, 求该班学生平均身高 和身高标准差 的0.95置信区间。 解:设身高 由题设得

(1)

的0.95置信区间为

即: (2) 的0.95置信区间为

即: 所以 的0.95置信区间为

设某机床加工的零件长度 今抽查 例 7: 16个零件,测得长度(单位:mm)如下: 12.15, 12.12, 12.01, 12.08, 12.09, 12.16, 12.03, 12.01, 12.06, 12.13, 12.07, 12.11, 12.08, 12.01, 12.03, 12.06, 在置信度为95%时,试求总体方差 的置信区间 解: 已知 查







由此得置信区间:

三 、两个正态总体均值与方差的区间估计
设 X1,

, X n1 为总体 X ~ N ( ?1 ,? 12 )的一个样本

2 Y1 , , Yn2 为总体Y ~ N ( ?2 ,? 2 )的一个样本, X与Y

相互独立。

⒈ ?1 ? ? 2 的置信区间 ⑴ ? , ? 均为已知 ,且 X ? Y 是 ?1 ? ? 2 的
2 1 2 2

一个无偏估计, 因为X与Y 相互独立,所以

X ? Y ~ N ( ?1 ? ? 2 ,
X ? Y ? ( ?1 ? ? 2 )

?

2 1

n1

?

?

2 2

n2

)

?

2 1

n1 n2 所以 ?1 ? ? 2 的置信水平为1-α的置信区间为

?

?

2 2

~ N (0,1)

( X ? Y ? z? / 2

?

2 1

n1

?

?

2 2

n2

)



2 ? 12 ? ? 2 ? ? 2 未知

X ? Y ? ( ?1 ? ? 2 ) ~ t (n1 ? n2 ? 2) 1 1 S? ? n1 n2

(n1 ? 1) S ? (n2 ? 1) S S? ? n1 ? n2 ? 2 所以 ?1 ? ? 2 的置信水平为1-α的置信区间为
2 2 1 2 2

( X ? Y ? t? / 2 (n1 ? n2 ? 2) S?

1 1 ? ) n1 n2



? /?
2 1
2 1 2 2

2 2

的置信区间 ( ?1 , ?2未知)

S /? ~ F (n1 ? 1, n2 ? 1) S /? 2 2 S1 / ? 1 P{F ? (n1 ? 1, n2 ? 1) ? 2 2 ? F? / 2 (n1 ? 1, n2 ? 1)} ? 1 ? ? 1? S2 / ? 2 2
2 1 2 2

所以

? /?
2 1

2 2 的置信水平为1-α的置信区间为

2 ? S12 ? 1 S1 1 , 2 ? 2 ? ? S2 F? / 2 (n1 ? 1, n2 ? 1) S2 F1?? / 2 (n1 ? 1, n2 ? 1) ?

本章知识小结
1.重点:矩估计、最大似然估计、无偏性、有 效性、单个正态总体参数的区间估计

2. 难点:最大似然估计

作业 210页 14、15、18 19、20

四. (0 ? 1) 分布参数的区间估计 若总体 X 的分布律

f {x; p} = p x (1- p)1- x

(0 ? p ? 1) x = 0,1
2

其中 p 为未知参数,则 m = p, s = p(1- p) 设 由中心极限定理 为总体 的一个大样本

?

n

X i - np

i= 1

np (1- p )

=

n X - np : N (0,1) np(1- p)

(近似)

禳 镲 n X - np 镲 P睚 - za 2 < < za 镲 np(1- p) 镲 铪

2

? 1 a

整理

n X - np - za 2 < < za np(1- p)
2 a 2 2 2 a 2

2

(n + z ) p - (2nX + z ) p + nX < 0
从中解得 X 的范围

2

五、单侧置信区间
上述置信区间中置信限都是双侧的,但对于 有些实际问题,人们关心的只是参数在一个方向 的界限.
例如对于设备、元件的使用寿命来说,平均寿 命过长没什么问题,过短就有问题了.

这时,可将置信上限取为+∞ ,而只着眼于置信下限,这样 求得的置信区间叫单侧置信区 间.

于是引入单侧置信区间和置信限的定义:
设 是 一个待估参数,给定 若由样本X1,X2,…Xn确定的统计量 满足

则称区间 是 的置信水平为 的 单侧置信区间. 称为单侧置信下限.

又若统计量

满足

则称区间 是 的置信水平为 单侧置信区间. 称为单侧置信上限.



例8 从一批灯泡中随机抽取5只作寿命试 验,测得寿命X(单位:小时)如下: 1050,1100,1120,1250,1280 设灯泡寿命服从正态分布. 求灯泡寿命均 值 的置信水平为0.95的单侧置信下限.
解: 的点估计取为样本均值

由于方差 未知, 选取统计量为

对给定的置信水平 使 即

,确定分位数

于是得到 信区间为

的置信水平为

的单侧置

即 的置信水平为

的单侧置信下限为

将样本值代入得 的置信水平为0.95的单侧置信下限是 1065小时

例9 为估计制造某种产品所需要的单件平均工时 (单位:小时),现制造5件,记录每件所需工时如下

10.5 11.0

11.2 12.5 12.8

假设制造单位产品所需工时 试求平均工时的置信水平为0.95的单侧置信上限.

解 由于

,其中

未知,因此

对于给定的

,由

分布的 分位点的定义,存在 ,使得



, 所以





的单侧置信区间为

单侧置信上限为

, 经计算得 ,由 得

可得单侧置信上限

因此, 加工这种产品的平均工时 不超过12.55小时的可靠程度是95%.

练习:一生产线生产的产品成箱包装,每箱的重量 是随机的。假设每箱平均重50千克,标准差为 5千克。若用最大载重量为5吨的汽车承运,试 利用中心极限定理说明每辆车最多可以装多少箱, 才能保障不超载的概率大于0.977? (?(2)=0.977,其中?( x)是标准正态分布函数)

解:X i是装运的第i箱的重量(千克),n是所求 箱数。由条件可以把X 1 , X 2 , , X n视为独立同分 ? Xn 布随机变量,而n箱的总重量Tn ? X 1 ? X 2 ? 是独立同分布随机变量之和。

由条件知E( X i ) ? 50, D( X i ) ? 5; E (Tn ) ? 50n, D(Tn ) ? 5 n
由中心极限定理, Tn 近似服从正态分布N (50n, 25n),

箱数n决定于条件
Tn ? 50n 5000 ? 50n P{Tn ? 5000} ? P{ ? } 5 n 5 n 1000 ? 10n ? ?( ) ? 0.977 ? ?(2) n

1000 ? 10n ? 2, n ? 98.0199 n 最多装98箱。

2.设随机变量( X, Y)的概率密度为 ?1, y ? x, 0 ? x ? 1 f ( x, y ) ? ? ?0, 其它。 求: (1) f X ( x), fY ( x);(2) E ( X ), E (Y ), D( X ), D(Y ); (3)Cov( X , Y )

解:(1)0 ? x ? 1,f X ( x) ? ? 1dy ? 2 x
?x

x

?2 x,0 ? x ? 1 ? f X ( x) ? ? ? 0, 其它

0 ? y ? 1,fY ( y) ? ? 1dx ? 1 ? y
y

1

-1 ? y ? 0,fY ( y) ? ? 1dx ? 1 ? y
?y

1

?1 ? y , ?1 ? y ? 1 ? fY ( y ) ? ? 0, 其它 ?

2 解:(2)E ( X ) ? ? x 2 xdx ? , 0 3 1 1 2 2 E ( X ) ? ? x 2 xdx ? , 0 2
1

E (Y ) ? ? (1 ? y )dy ? 0,
?1
1

1

1 E (Y ) ? 2 ? y (1 ? y )dy ? . 0 6 2 1 ?2? 1 1 ? D( X ) ? ? ? ? ? , D(Y ) ? . 2 ? 3 ? 18 6
2 2

E ( XY ) ? ? dx ? xydy ? 0
0 ?x

1

x

Cov( X , Y ) ? E ( XY ) ? E ( X ) E (Y ) ? 0

3.设 X 为取值于(a, b)的连续型随机变量,证明: (b ? a) (1)a ? E ( X ) ? b;(2) D( X ) ? 4 解: (1)因为在(a, b)内,f ( x) ? 0,
b
b a
2

E ( X ) ? ? xf ( x)dx ? a ? f ( x)dx ? a ?1 ? a, a
E ( X ) ? ? xf ( x)dx ? b ? f ( x)dx ? b ?1 ? b,
a a b b

所以a ? E ( X ) ? b

(2)由a ? X ? b, b?a b?a b?a b?a ? ?X? ?b? = , 2 2 2 2

b?a ? ?b?a ? ? 即 ?X ? ? ?? ? 2 ? ? 2 ? ?

2

2

2 2 ?? ? b?a? ?b?a? ? E ?? X ? ? ??? ? 2 ? ? ? ?? ? ? 2 ?

于是 D( X ) ? E{[ X ? E( X )] }
2

b?a b?a ? 2? ? E ?{[ X ? ]?[ ? E ( X )]} ? 2 2 ? ?

2 2 ?? ? b?a? ?b ? a ? ? E ?? X ? ? E ( X )? ? ??? 2 2 ? ? ? ? ? ? ? ? 2 2 ?? ? b?a? (b ? a ) ? E ?? X ? ? ?? 2 ? ? 4 ? ?? ?



热文推荐
友情链接: 简历 面试求职范文 职业规划 自我管理 社交礼仪 76242百科