概率与统计小结(共8篇)
概率部分
1、全概率公式与贝叶斯公式 全概率公式:
P(A)P(A|B1)P(B1)P(A|B2)P(B2)P(A|Bn)P(Bn)
其中B1,B2,,Bn是空间S的一个划分。贝叶斯公式:P(Bi|A)P(Bi)P(A|Bi)P(B)P(A|B)jjj1n
其中B1,B2,,Bn是空间S的一个划分。
2、互不相容与互不相关
A,B互不相容AB,P(AB)0
事件A,B互相独立P(AB)P(A)(B);两者没有必然联系
3、几种常见随机变量概率密度与分布律:两点分布,二项分布,泊松分布,均匀分布,二项分布,指数分布,正态分布。
X~b(1,p),即二点分布,则分布律为P{xk}pk(1p)1k,k0,1.kkX~b(n,p),即二项分布,则分布律为P{xk}Cnp(1p)nk,k0,1,...,n.X~(),即泊松分布,则分布律为P{xk}kek!,k0,1,......1,x(a,b)X~U(a,b),即均匀分布,则概率密度为f(x)ba.0,其它x1e,x0X~E(),即指数分布,则概率密度为f(x).0,其它X~N(,2),即正态分布,则则概率密度为f(x)
12ex22,x.连续性随机变量X分布函数性质:(i)F()1,F()0,(ii)分布函数连续 对连续性随机变量X,已知概率密度f(x),则分布函数为F(x)已知分布函数为F(x),则概率密度f(x)F(x).对连续性随机变量X,已知概率密度f(x), 区间概率P{xL}
4、连续函数随机变量函数的概率密度
设连续随机变量X的概率密度为fX(x),Yg(X)也是连续型随机变量,求Y的概率密度 求法
(i)利用以下结论计算:如果函数g(x)处处可导,且恒有g(x)0(或g(x)0),则Y概率密度为:
xf(t)dt;
f(x)dx
LfX[h(y)]|h(y)|,y fY(y)0,其他g(),g()}.其中,h(y)是g(x)的反函数,且有min{g(),g()},max{(ii)利用分布函数计算:先求yg(x)值域,再在该值域求Y的分布函数
F(y)P{Yy}P{g(X)y}P{XB}则有fY(y)F(y).常用求导公式
(y)xBfX(x)dx
fY(y)F(y)(y)f(x)dxf((y))(y)f((y))(y)
5、二维随机变量分布律
对于二维连续性随机变量(X,Y),其联合概率密度为f(x,y),其联合分布函数为F(x,y), 则F(x,y)xyf(u,v)dvdu,概率密度性质:(i)f(x,y)0,(ii)
f(u,v)dvdu1
已知概率密度f(x,y),求区域概率有P{(x,y)D}边缘分布函数为FX(x)边缘概率密度为fX(x)f(x,y)dydx,Dyxf(u,v)dvdu,FX(y)f(u,v)dudv,f(x,y)dy,fY(y)f(x,y)dx.条件分布函数为FX|Y(x|y)xyf(x,v)f(u,y)du,FY|X(y|x)dv,fY(y)fX(x)条件概率密度为fX|Y(x|y)f(x,y)f(x,y),fY|X(y|x).fY(y)fX(x)对于离散情形,设联合分布律为P{Xxi,Yyj}pij 边缘概率密度为P{Xxi}pj1ijpi.,P{Yyj}pijp.j
i1条件概率密度为P{Yyj|Xxi}
6、二维随机变量函数的分布
pijpi.,P{Xxi|Yyj}pijp.j
设二维随机变量(X,Y)概率密度为f(x,y),分布函数为F(x,y)(i)Z=X+Y, 则Z的概率密度为
fZ(z)f(zy,y)dyf(x,zx)dx
fX(zy)fY(y)dyfX(x)fY(zx)dx
当X,Y相互独立时,fZ(z)(ii)M=max{X,Y}与N=min{X,Y} 当X,Y相互独立时,FM(z)FX(z)FY(z),FN(z)1(1FX(z))(1FY(z))
7、数学期望
(i)求法:连续随机变量X概率密度为f(x),则E(X)xf(x)dx;若Yg(X), 则E(Y)g(x)f(x)dx.离散随机变量分布律为P{xxk}pk,则E(X)xk1kpk;若Yg(X), 则E(X)g(xk)pk.k1若有二维的随机变量(X,Y),其联合概率密度为f(x,y),若Yg(X,Y), 则E(Y)g(x,y)f(x,y)dydx.(ii)性质:E(C)C,E(CX)CE(X),E(XY)E(X)E(Y)
E(k1X1k2X2knXn)k1E(X1)k2E(X2)knE(Xn)X,Y相互独立,则有E(XY)E(X)E(Y).8、方差
定义:D(X)E[XE(X)]2,标准差(均方差):D(X).计算:D(X)E(X2)[E(X)]2
性质:D(C)0,D(XC)D(X),D(CX)C2D(X).D(XY)D(X)D(Y)2E[(XEX)(YEY)].常见分布的数学期望和方差:两点分布:E(X)p,D(X)p(1p).X~b(n,p),即二项分布,则E(X)np,D(X)np(1p).X~(),即泊松分布,则E(X),D(X).ab(ba)2,D(X).X~U(a,b),即均匀分布,则E(X)212X~E(),即指数分布,则E(X),D(X)2.X~N(,2),即正态分布,则E(X),D(X)2.9、协方差与相关系数
定义:协方差: Cov(X,Y)E{[XE(X)][YE(Y)]}E(XY)E(X)E(Y).相关系数:XYCov(X,Y)D(X)D(Y).则有Cov(X,Y)XYD(X)D(Y).性质:Cov(X,Y)Cov(Y,X),Cov(X,X)D(X),Cov(X,a)0
Cov(aX,bY)abCov(X,Y),Cov(X1X2,Y)Cov(X1,Y)Cov(X2,Y)
D(XY)D(X)D(Y)2Cov(X,Y)
如果X,Y相互独立,则有D(XY)D(X)D(Y)
|XY|1,且|XY|1a,b,使P{YabX}1.10、独立与不相关关系
XY0X,Y不相关Cov(X,Y)0E(X,Y)E(X)E(Y)X,Y相互独立F(x,y)F(x)F(y)f(x)f(y)E(X,Y)E(X)E(Y)
F为分布函数,而f为概率密度
一般情况下,X,Y相互独立X,Y不相关,但反之不成立;
2特殊情况,当(X,Y)~N(1,2;12,2;)时,X,Y相互独立X,Y不相关
2并且此时E(X)1,E(Y)2;D(X)12,D(Y)2;XY,Cov(X,Y)12.11、切比雪夫(Chebyshev)不等式:设随机变量X的期望与方差为E(X),D(X)2,则对任意正数0,有
P{|XE(X)|}D(X)22, 即P{|X|}2.D(X)进一步有:P{|XE(X)|}1
12、两个中心极限定理
22,即P{|X|}12.定理1(独立同分布的中心极限定理)设随机变量X1,X2,,Xn,相互独立,服从同一分布,有相同的数学期望和方差:E(Xk),D(Xk)20,k1,2,,则
当n充分大时,YnXk1nkE(Xk)k1nnXi1nkn~~~~~~~~D(Xk)k1n近似N(0,1).定理2(棣莫弗-拉普拉斯定理)设随机变量n,n1,2服从参数为n,p(0p1)的二项分布,则当n充分大时,nnpnp(1p)~~~~~~~~近似N(0,1)
统计部分
1、常用统计量
设X为总体,X1,X2,Xn是来自总体X的样本,定义
1n样本平均值:XXi,ni1n1n12样本方差:S(XiX)(Xi2nX2),n1i1n1i12样本标准差(均方差):S1n(XiX)2 n1i11nk样本k阶矩:AkXi,k1,2,
ni
12、常用正态总体相关的统计量(1)2分布
定义:设Xi~N(0,1),i1,2,n,则性质(i)可加性:设X~222X~(n),特别Xi2~2(1).ii1n2(n1),Y~2(n2),则XY~2(n1n2).(ii)设X~(n),则EXn,D(X)2n.(iii)特例:设Xi~N(,),则(2)t 分布
定义:设X~N(0,1),Y~(n), 且X,Y相互独立,则统计量t性质
(i)概率密度为偶函数,关于y轴对称;当n趋于无穷大,该统计量趋于标准的正态分布;(ii)对于分位点有:t1(n)t(n).(3)F分布 定义:设U~212(Xi1ni)2~(n).XY/n~t(n).(n1),V~(n2), 且U,V相互独立,则统计量F1.F(n2,n1)Un1~F(n1,n2).Vn2性质(i)对于分位点有:F1(n1,n2)
3、正态总体样本均值与样本方差分布
单个总体情形:设X为总体,且服从X~N(,),X1,X2,Xn是来自总体X的样本,X,S分别是样本均值与样本方差,有以下结论: 22D(X)2,E(S2)D(X)2, 而且有(i)E(X)E(X),D(X)nnCXii1ni~N(Cii,Ci2i2).i1i1nn(ii)X~N(,2n), 即
X/n~N(0,1);且
12(Xi1niX)2(n1)S22~2(n1)
两个正态总体情形:设X1,X2,Xn1是来自X~N(1,12)的样本,Y1,Y2,Yn2是来22自Y~N(2,2为两样本方差,)的样本, 且两样本相互独立,X,Y为两样本均值,S12,S2则有
(i)XY~N(12,12n122n2).2(ii)当1222时,XY(12)Sw11n1n2~t(n1n22),2(n11)S12(n21)S2 Swn1n222S12/S2(iii)2~F(n11,n21)21/24.点估计(1)矩估计法
设概率密度f(x;1,2,k)或分布律P{Xx}p(x;1,2,k)中含1,2,k个参数需要估计。
(i)求总体前k阶矩
1E(X)1(1,2,,k)22E(X)2(1,2,,k)E(Xk)(,,)k12kk(ii)由以上方程解得
11(1,2,,k)(,,,)2212k kk(1,2,k)(iii)以样本i阶矩Ai代替i,i1,2,,n 即得估计量ii(A1,A2,Ak).(2)最大似然估计
定义:给定一组样本观测值(x1,x2,xn),使该观测值概率取最大的参数值为所求参数估计值。
两种求法:I 直接用最大似然法估计计算
(i)写出似然函数 连续情形:L()f(xi;),离散情形:L()p(xi;)
i1i1nn(ii)求使似然函数取最大值的参数
两种方法:取对数,求导数,令导数为0解出估计值;若求导不行,则用直接分析法(iii)由上写出估计值,再表示出估计量 II 利用不变性计算
若求函数uu()的最大似然估计,其中u是单调函数,可先求最大似然估计,然后利用不变性知u()是u()的最大似然估计。5.估计量评价标准
无偏性:是的估计量,如果E(), 则是的无偏估计量;
ˆˆˆ更有效; 有效性:1,2是的无偏估计量,如果D(1)D(2),则1较2一致性:是的估计量,当样本容量趋于无穷大,依概率收敛于.6.置信区间 基本的重要概念:
置信水平:是参数落在置信区间(,)的概率,即P()1,,两统计量
1为置信水平。分别为双则置信下限与置信上限,例如置信水平为95%,则10.95.置信区间几种情形: 单个总体情形
当已知,的置信区间,枢轴量Z2X/n~N(0,1)
双侧置信区间:(XnZ),双则置信上、下限:X2nZ,X2nZ.2单侧置信区间:(XnZ,),(,XnZ)单侧置信上、下限:XnZ,XnZ.当未知,的置信区间,枢轴量t2XS/n~t(n1)
双侧置信区间:(XSnt(n1)),2双则置信上、下限:XSnt(n1),X2Snt(n1).2单侧置信区间:(XSnt(n1),),(,XSnSnSnt(n1))
单侧置信上、下限:Xt(n1),Xt(n1)
当未知,的置信区间,枢轴量22(n1)S22~2(n1)
(n1)S2(n1)S2(n1)S2(n1)S2双侧置信区间:(,),双则置信上、下限:,(n1)(n1)(n1)(n1)212122(n1)S2(n1)S2单侧置信区间:(0,),(,)
1(n1)(n1)(n1)S2(n1)S2单侧置信上、下限:.,1(n1)(n1)两个总体情形:
2S12/S2当1,2未知,/的置信区间,枢轴量F2~F(n11,n21)21/22122S12S121双侧置信区间:(2,2S1F(n11,n21)S2F211),(n11,n21)2S12双则置信上、下限:2S2F1S1211,2,(n11,n21)S2F(n11,n21)22S12S1211单侧置信区间:(0,2),(2,).F(n1,n1)F(n1,n1)S211S2122S12S1211单侧置信上、下限:2,2.S2F1(n11,n21)S2F(n11,n21)在求解置信区间时,先分清总体属于那种情况,然后写出置信区间,再代数值。7.假设检验
假设检验的基本原理:小概率事件在一次观测实验中几乎不可能发生
显著性水平:小概率事件发生的概率,也是拒绝域对应事件概率,显著性水平越大,拒绝域越大。
两类错误:对原假设H0,备择假设H1,第一类错误H1不真,接受H1,第二类错误H0不真,接受H0,为减少两类错误,需增加样本容量。
假设检验的基本步骤:(i)提出假设;(ii)选取检验统计量;(iii)确定拒绝域;(iv)计算观测值(v)并作出拒绝与接收原假设判断
P值检验:计算p值,与显著性水平比较,p值小于拒绝原假设,否则就接收原假设;p值计算方法是将观测值作为拒绝域临界点,代入拒绝域事件计算其概率。假设检验的情形:
自然界和人类社会中,存在着大量的随机现象. 最普通的例子是掷硬币和摸奖,对这些偶然现象的研究, 就是对概率的研究. 有趣的是, 这样一门重要的数学分支,竟然起源于对赌博问题的研究.
分 赌 注 问 题
欧洲中世纪末期,赌博盛行,而且赌法复杂,赌注大.
1654年, 一位朋友向法国数学家帕斯卡请教如何合理分配赌注的问题. 问题是,在一次赌博中,事先约定各押赌注32个金币,并以先赢了3分为胜. 两赌徒在甲赢2分,乙赢1分的情况下,赌博因故中断,那么64个金币的赌注应该如何分配才合理呢? 乙认为,根据现在赢的比例2∶1,他应该得1/3;甲不同意,认为即使下次乙再赢1次,他也稳得其中的一半,而再下一次大家都有一半希望赢,他至少可分得3/4.
帕斯卡对此很感兴趣,并写信告诉好友数学家费马,他们之间便开始频繁通信,展开有关概率和组合数学的研究.
赌 博 中 的 计 算
1655年 ,荷兰数学家惠更斯 (1629-1695)恰好也在巴黎 ,他了解了帕斯卡与费马研究的问题, 也饶有兴趣地参加了他们的讨论. 讨论的结果由惠更斯总结, 写成《论赌博中的计算》一书,于1657年出版,这是目前已知的最早发表概率的著作. 书中解决了许多赌博中可能出现的有趣的实际问题,引进了“数学期望”概念,证明了:如果p是一个人获得赌金a的概率,q是他获得赌金b的概率, 则他可以希望获得的赌金数为ap+bq.
统计的诞生
统计学是一门既古老又崭新的科学. 说它古老,是因为它已有300年的历史,它走过了人类历史的农业经济时代、工业经济时代,又走进了知识经济时代. 说它崭新,因为它虽然已产生了300年,但仍在快速发展. 今天,它拥有了更多更新的统计方法和手段,有了更多的研究对象和更广泛的应用领域,显示出更加重要的作用和更广阔的发展前景.
英 国 60 年 的 统 计
英国在16世纪加入了西欧的大航海时代,不久就在世界各地设置了殖民地、附属国或通商国,世界上很多国家的物资都运到了伦敦, 那是英国的鼎盛时代. 但与此同时, 世界各地的传染病也被带到了伦敦. 伦敦教会每周会发布一次“死亡公报”,商人约翰·格朗特以此为资料,在1662年发表了《关于死亡公报的自然和政治观察》的论著. 书中分析了60年来伦敦居民死亡的原因及人口变动的关系,首次提出通过大量观察,可以发现新生儿性别比例具有稳定性和可以探讨不同死因的比例等人口规律,并且第一次编制了“生命表”,对死亡率与人口寿命作了分析,从而引起了普遍的关注.
德 国 的 国 势 统 计 学
德国由于新旧基督教的对立,宗教战争达到了最大规模. 长达30年的战争把国家一分为二,并且,由于有他国的介入, 德国的人口和经济都遭遇了巨大的减少和损失. 为了恢复国家的建设,经济学家海尔曼·康令对国家的综合情况进行量化整理, 汇集编制了《国势学》.统计学(statistics)一词就是从国家(state)引申而来的,因此也可以叫做“国势统计学”.
布 丰 投 针 实 验
把一根质量均匀的小棒向一个画了一些平行线的平面上随意地扔几千下, 就能得到有六个准确数字的圆周率π的近似值,你相信吗? 肯定有很多人不相信. 事实上,确实有这样的数学实验.
1777年的一天 ,法国博物学家C·布丰伯爵的家里宾客满堂, 他们是应主人的邀请来观看一次奇特的实验的.
年已古稀的布丰拿出一张纸来,纸上预先画好了一条条等距离的平行线. 他又拿出一大把准备好的小针,这些小针都是平行线间距离的一半. 布丰先生宣布:“请诸位把这些小针一根一根地往纸上扔吧! 不过,请大家务必把针与纸上的线相交的次数告诉我. ”
客人们遵照主人的意愿,加入了实验的行列. 一把小针扔完了,把它们捡起来再扔,布丰则把小针与平行线相交的次数记了下来. 实验进行了将近一个小时才结束. 随后布丰先生高声宣布:“先生们,我这里记录了诸位刚才的投针结果,共投针2212次,其中与平行线相交的有704次. 总数2212与相交数704的比值为3.142. ”大家异常惊奇,这投针的比例怎么会与圆周率如此接近呢? 布丰解释说:“这就是概率的原理,因为针长恰好是平行线间距的一半,那针与线相交的概率为0.318, 它的倒数就近似于圆周率. ”
著 名 的 布 丰 公 式
为此复习中我们要有如下对策:(1)重视基础知识的理解和掌握,弄清一些基本概念,如:等可能性事件、互斥事件、独立事件,随机事件的分布列、期望、方差,抽样方法等. (2)把握基本题型、基本思想,本部分内容的题型主要有三种,一是各种概率的计算;二是随机变量的分布列、期望等的运算及其应用;三是抽样方法和总体分布的估计. (3)注意解题步骤规范性的训练,特别是概率应用题的解答.
例1 甲、乙两袋装有大小相同的红球和白球,甲袋装有2个红球,2个白球;乙袋装有2个红球,[n]个白球. 在甲、乙两袋中各任取2个球.
(1)若[n=3],求取到的4个球全是红球的概率;
(2)若取到的4个球中至少有2个红球的概率为[34],求[n].
解 (1)记“取到的4个球全是红球”为事件[A]. [P(A)=C22C24⋅C22C25=16⋅110=160.]
(2)记“取到的4个球至多有1个红球”为事件[B],“取到的4个球只有1个红球”为事件[B1],“取到的4个球全是白球”为事件[B2]. 由题意,得
[P(B)=1-34=14.] [P(B1)=C12⋅C12C24⋅C2nC2n+2+C22C24⋅C12⋅C1nC2n+2][=2n23(n+2)(n+1);]
[P(B2)=C22C24⋅C2nC2n+2][=n(n-1)6(n+2)(n+1);]
所以[P(B)=P(B1)+P(B2)]
[=2n23(n+2)(n+1)+n(n-1)6(n+2)(n+1)][=14],
化简,得[7n2-11n-6=0,]解得[n=2],或[n=-37](舍去),故[n=2].
点评 本题属于古典概率,已知概率的结果,利用方程的思想逆求出[n]是该题的关键.
例2 某中学举办“上海世博会”知识宣传活动,现场的“抽卡有奖游戏”特别引人注目,游戏规则是:盒子中装有8张形状大小相同的精美卡片,卡片上分别印有“世博会吉祥物海宝”或“世博会会徽”,要求4人一组参加游戏,参加游戏的4人从盒子中轮流抽取卡片,一次抽2张,抽取后不放回,直到4人中某人一次抽到2张“世博会吉祥物海宝”卡才能获奖,当某人获奖或者盒中卡片抽完时游戏终止.
(1)游戏开始之前,一位高中生问:“盒子中有几张‘世博会会徽’卡?”主持人说:“若从盒中任抽2张卡片不都是‘世博会会徽’卡的概率为[2528.]”请你回答:有几张“世博会会徽”卡呢?
(2)在(1)的条件下,甲、乙、丙、丁4人参加游戏,约定甲、乙、丙、丁依次抽取. 用随机变量[ξ]表示游戏终止时总共抽取的次数(注意,一次抽取的是两张卡片),求[ξ]的分布列和数学期望.
解 (1)设盒子中有“会徽卡”[n]张,依题意有,[1-C2nC28=2528],解得[n=3],即盒中有“会徽卡”3张.
(2)因为[ξ]表示游戏终止时,所有人共抽取卡片的次数,所以[ξ]的所有可能取值为1,2,3,4.
[P(ξ=1)=C25C28=514;]
[P(ξ=2)=C23C28⋅C25C26+C13⋅C15C28⋅C24C26=27;]
[P(ξ=3)=C23C28⋅C11⋅C15C26⋅C24C24+C13⋅C15C28⋅C22C26⋅C24C24]
[+C13⋅C15C28⋅C12⋅C14C26⋅C23C24=314];
[P(ξ=4)=C13⋅C15C28⋅C12⋅C14C26⋅C11⋅C13C24⋅C22C22=17.]
随机变量[ξ]的分布列为:
[[ξ]&1&2&3&4&[P]&[514]&[27]&[314]&[17]&]
[∴ξ]的数学期望为
[Eξ=1×514+2×27+3×314+4×17=57.]
点评 求离散型随机变量的期望与方差,首先应明确随机变量的分布列,若分布列中的概率值是待定常数,应先求出这些待定常数后,再求其期望与方差. 对求离散型随机变量的期望和方差的应用问题,首先应仔细地分析题意,当概率分布不是一些熟知的类型时,应全面地剖析各个随机变量所包含的各种事件,并准确判断各事件的相互关系,从而求出各随机变量相应的概率.
例3 已知某地每单位面积菜地年平均使用氮肥量xkg与每单位面积蔬菜年平均产量yt之间的关系有如下数据:
[年份&1985&1986&1987&1988&1989&1990&1991&1992&x(kg)&70&74&80&78&85&92&90&95&y(t)&5.1&6.0&6.8&7.8&9.0&10.2&10.0&12.0&]
[年份&1993&1994&1995&1996&1997&1998&1999&x(kg)&92&108&115&123&130&138&145&y(t)&11.5&11.0&11.8&12.2&12.5&12.8&13.0&]
(1)求x与y之间的相关系数,并检验是否线性相关;(2)若线性相关,求蔬菜产量y与使用氮肥量之间的回归直线方程,并估计每单位面积施肥150kg时,每单位面积蔬菜的年平均产量.
解 (1)列出下表,并用科学计算器进行有关计算:
[i&1&2&3&4&5&6&7&8&9&10&11&12&13&14&15&[xi]&70&74&80&78&85&92&90&95&92&108&115&123&130&138&145&[yi]&5.1&6.0&6.8&7.8&9.0&10.2&10.0&12.0&11.5&11.0&11.8&12.2&12.5&12.8&13.0&[xiyi]&357&444&544&608.4&765&938.4&900&1140&1058&1188&1357&1500.6&1625&1766.4&1885&]
[x=151515=101],[y=151.715=10.11],
[i=115x2i=161125],[i=115y2i=1628.55],
[i=115xiyi=16076.8.]故蔬菜产量与放用氮肥量的相关系数
[r=16076.8-15×101×10.11(161125-15×1012)(1628.55-15×10.112)≈0.8643.]由于[n=15],故自由度为15-2=13. 由相关系数检验的临界值表查出与显著水平0. 05及自由度13相关系数临界值[r0.05=0.514],则[r>r0.05],从而说明蔬菜产量与氮肥量之间存在着线性相关关系.
(2)设所求的回归直线方程为[y=bx+a],则[b=i=115xiyi-15xyi=115x2i-15x2=16076.8-15×101×10.11161125-15×1012≈0.0937,]
[a=y-bx=10.11-0.0937×101≈0.6463],
∴回归直线方程为
[y=0.0937x+0.6463.]
当[x=150]时,[y=14.701(t)].
点评 1. 根据公式[r=i=1nxiyi-nxy(i=1nx2i-nx2)(i=1ny2i-ny2)]计算[r]的值,检验所得结果:如果[|r|≤r0.05],那么可以认为[y]与[x]之间的线性相关关系不显著,从而接受统计假设. 如果[|r|>r0.05],表明一个发生的概率不到5%的事件在一次试验中竟发生了. 这个小概率事件的发生使我们有理由认为[y]与[x]之间不具有线性相关关系的假设是不成立的,拒绝这一统计假设也就表明可以认为[y]与[x]之间具有线性相关关系. 2. 求解两个变量的相关系数及它们的回归直线方程的计算量较大,需要细心、谨慎地计算. 如果会使用含统计的科学计算器,能简单得到[i=1nxi],[i=1nyi],[i=1nx2i],[i=1ny2i],[i=1nxiyi]这些量,也就无需有制表这一步,直接算出结果就行了. 另外,利用计算机中有关应用程序也可以对这些数据进行处理.
例4 为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量,产品数量的分组区间为[45,55),[55,65),[65,75),[75,85),[85,95],由此得到频率分布直方图如图,则这20名工人中一天生产该产品数量在[55,75)的人数是 .
[频率/组距][产品数量][45 55 65 75 85 95][0.040
0.035
0.030
0.025
0.020
0.015
0.010
0.005
0]
解析 20×(0.040×10+0.025×10)=13.
点评 此考点在高考中常常是结合一些实际问题考查频率分布表与频率分布直方图,同时考查识图、用图的能力. 主要题型:(1)根据表或图中数据求解限制条件下的个体频数与频率、参数等相关的数据;(2)频率分布表与频率分布表或直方图的完善. 解答此类问题主要有三条途径:①利用所有分组对应的频率之和为1;②利用公式:频率=条形图的面积=纵坐标×横坐标,或利用公式频数=样本容量×频率;③利用频率分布图中相关数据.
专题训练七
一、选择题
1. 对有线性相关关系的两个变量建立的回归直线方程[y=bx+a]中,回归系数[b]( )
A. 可以小于0 B. 大于0
C. 能等于0 D. 只能小于0
2. 两个正态分布N(μ1,σ12)(σ1>0)和N(μ2,σ22)(σ2>0)的密度函数图象如图,则有( )
A. μ1<μ2,σ1<σ2 B. μ1<μ2,σ1>σ2
C. μ1>μ2,σ1<σ2 D. μ1>μ2,σ1>σ2
[0.5 1.0][-1.0 -0.5][1.6
1.2
0.8
0.4]
3. 同时抛掷5枚均匀的硬币80次,设5枚硬币正好出现2枚正面向上,3枚反面向上的次数为[ξ],则[ξ]的数学期望是( )
A. 20B. 25
C. 30D. 40
4. 已知一组数据[x1]、[x2]、[x3]、[x4]、[x5]的平均数是[x]= 2,方差是[13],那么另一组数据3[x1]-2、3[x2]-2、3[x3]-2、3[x4]-2、3[x5]-2的平均数和方差分别为( )
A. 2,[13] B. 2,1
C. 4,[13] D. 4,3
5. 某人5次上班途中所花的时间(单位:分钟)分别为[x、y]、10、11、9. 已知这组数据的平均数为10,方差为2,则[|x-y|]的值为( )
A. 1 B. 2 C. 3 D. 4
6. 为了调查某产品的销售情况,销售部门从下属的92家销售连锁店中抽取30家了解情况. 若用系统抽样法,则抽样间隔和随机剔除的个体数分别为( )
A. 3,2 B. 2,3 C. 2,30 D. 30,2
7. 某同学同时掷两颗骰子,得到点数分别为[a、b,]则椭圆[x2a2+y2b2=1]的离心率[e>32]的概率是( )
A. [118] B. [536] C. [16] D. [13]
8. 有4条线段,长度分别为1、3、5、7,从这四条线段中任取三条,则所取三条线段能构成一个三角形的概率是( )
A. [14] B. [13] C. [12] D. [15]
9. 某年度大学学科能力测验有12万名学生参加,各学科成绩采用15级分,数学学科能力测验成绩分布图如图. 数学成绩级分高于11分的考生(最接近的)人数是( ).
[级分 ] [14
12
10
8
6
4
2][0 1 2 3 4 5 6 7 8 9][10 11 12 13 14 15][人数百分比]
A. 4000人 B. 10000人
C. 15000人 D. 20000人
10. 将4个不相同的小球放入编号为1、2、3的3个盒子中,当某个盒子中球的个数等于该盒子的编号时称为一个和谐盒,则恰有两个和谐盒的概率为( )
A. [281] B. [481] C. [1281] D. [1681]
二、填空题
11. 某中学有1000人参加并且高考数学成绩近似地服从正态分布[N100,102],求此校数学成绩在120分以上的考生人数 (Φ(2)≈0.977).
12. 在[1,2,⋯,2006]中随机选取三个数,能构成递增等差数列的概率是 .
13. 给出下列关系:①正方形的边长与面积之间的关系;②某化妆品的销售量与广告宣传费之间的关系;③人的身高与视力之间的关系;④雾天的能见度与交通事故的发生率之间的关系;⑤学生与其学号之间的关系. 其中具有相关关系的是 .
14. 在集合M={0,1,2,3}的所有非空子集中任取一个集合,恰满足条件“对任意[x∈A],则[1x∈A]”的集合的概率是 .
15. 由于电脑故障,使得随机变量[X]的分布列中部分数据丢失(以“[x,y]”代替),其表如下:
[X&1&2&3&4&5&6&P&0.20&0.10&0.x5&0.10&0.1y&0.20&]
则丢失的两个数据依次为 .
三、解答题
16. 将数字1、2、3、4任意排成一列,如果数字[k]恰好出现在第[k]个位置上,则称之为一个巧合数,求巧合数的数学期望.
17. 假设关于某设备的使用年限[x]和所支出的维修费用[y](万元),有如下的统计数据[(xi,yi)][(i=1、2、3、4、5)],由资料知[y]对[x]呈线性相关,并且统计的五组数据的平均值分别为[x=4],[y=5.4],若用五组数据得到的线性回归方程[y=bx+a]去估计,使用8年的维修费用比使用7年的维修费用多1.1万元. (1)求回归直线方程;(2)估计使用年限为10年时,维修费用是多少?
18. 某公司招聘员工,指定三门考试课程,有两种考试方案. 方案一:考试三门课程,至少有两门及格为考试通过;方案二:在三门课程中,随机选取两门,这两门都及格为考试通过.
假设某应聘者对三门指定课程考试及格的概率分别是[a、b、c],且三门课程考试是否及格相互之间没有影响.
(1)分别求该应聘者用方案一和方案二时考试通过的概率;
(2)试比较该应聘者在上述两种方案下考试通过的概率的大小. (说明理由)
19. 有同一型号的汽车100辆,为了解这种汽车每耗油1L所行路程的情况,现从中随机抽出10辆在同一条件下进行耗油1L所行路程试验,得到如下样本数据(单位:km)13.7,12.7,14.4,13.8,13.3,12.5,13.5,13.6,13.1,13.4,并分组如下:
[分组&频数&频率&[[12.45,12.95)]&&&[[12.95,13.45)]&&&[[13.45,13.95)]&&&[[13.95,14.45)]&&&合计&10&10&]
(1)完成上面频率分布表;(2)根据上表在给定坐标系中画出频率分布直方图,并根据样本估计总体数据落在[[12.95,13.95)]中的概率;(3)根据样本,对总体的平均值进行估计.
20. 一项“过关游戏”规定:在第[n]关要抛掷一颗骰子[n]次,如果这[n]次抛掷所出现的点数之和大于[2n],则算过关. 问:(1)某人在这项游戏中最多能过几关?(2)他连过前三关的概率是多少?(注:骰子是一个在各面上分别有1、2、3、4、5、6点数的均匀正方体. 抛掷骰子落地静止后,向上一面的点数为出现的点数. )
一般说来,分类是为了使事物具有秩序,分类是为了更深入地了解总体。进行统计则是要根据数量上的结果做出决策,指导行动。总之,不能为分类而分类,为统计而统计。
教材中这几个案例我觉得目的不明确:
1、统计“换了几颗牙”作为主题引入,很有新意。但是统计出来做什么用呢?换得早好?快好?目的性不够明确;
2、让学生统计穿的鞋子的尺码,学生了解也没有用处。这只有班级为每人订购一双鞋子时才需要。卖鞋的老板可能也需要;
3、有些情景设计的目标不妥当。例如设计学校借书的种类,结果是喜欢“漫画”的多,喜欢“文学”的最少,于是建议图书馆多卖一些“漫画书”。这就不大妥当。不喜欢文学书,恐怕需要多作介绍宣传,而不一定是少买。
二、关于分类的判断
一堆东西可以从不同的角度分类,即分类的判断可以很多。但是,要循序渐进,先是一个判断,然后是两个判断,逐步培养。
一堆几何图形,可以按颜色分,形状分、大小分,一步步来,不要一下子就用3个判断分类。对一年级学生问:“你还可以怎样分?”问题太宽泛了.
分类不是单独的知识点,把分类当知识点展开,会增加学生的负担。分类作为一种数学思想方法,蕴含在数学情景决策之中。随着知识内容的加深,分类的难度会增加。
分类的种类可以很多,而许多分类是没有价值的。例如,在一堆几何图形中,我可以分为两类:一类是“红三角形”,一类是“非红三角形”,我们需要这样的分类?再如,一批东西中吃的穿的都有,其中有一只冰淇淋。然后,我分类,一类是冷的,一类是不冷的,这样分类有意思吗?虽然分得并不错。
分类不是分得越多越好,分类贵在分得“好”,即有价值,能够帮助决策。有需要才分类,不是分得越多越好。看见对象就要分类,无目的地分一通,只会把事情搞乱。无目的地追求各种分类,是误导。
三、关于收集数据
现在强调联系学生的日常生活,教材要求学生做许多调查,收集数据。但是出现的问题也不少。例如:统计班级同学的睡眠时间,学生自己并不知道每天的准确睡眠时间。
四、关于“可能性”认识
现在的中低年级教材,不断地重复“必然、可能、不可能”的判断,往往是原地踏步。
学习“分数”之后,对古典概率可以进行简单的认识和计算。此时概率才能定量分析,体现数学的价值。
一般可能性的认识,不教也会。华东师范法学数学系李俊调查:20世纪的中国小学课程里没有概率,但是和其他有概率内容的国家相比,学生对可能性的认识大体相同。
结合《概率论与数理统计》课程的特点,探讨了在课堂教学过程中加强与统计实验相结合的.可行性,及其设计思想、效果和目标定位,并从一定角度总结了统计实验寓于课堂教学几种方法和途径,以期激发学生学习兴趣,培养其素质和应用能力,让课堂教学“回归”到实践中.
作 者:顾光同 张香云 徐光辉 作者单位:浙江林学院,理学院,杭州,311300 刊 名:统计与决策 PKU CSSCI英文刊名:STATISTICS AND DECISION 年,卷(期): “”(21) 分类号:O21 G642 关键词:课堂教学 随机现象 概率统计 统计实验
【教学目标】:
1、计算和分析材料中的数据
2、用树状图、列表法计算简单事件的概率 【教学重点】:用树状图、列表法计算简单事件的概率 【教学难点】:用树状图、列表法计算简单事件的概率 【教学过程】:
一、知识点回顾:
1、描述数据常用的统计图:、、2、方差公式:
2、一般的,在一次实验中,可能出现的结果有n种,并且它们发生的可能性,事件A包含其中的m种结果,那么事件A发生的概率为P(A)=
二、典型例题:
中招考点:条形统计图、扇形统计图分析、计算数据
1、学习成为商城人的时尚,义乌市新图书馆的启用,吸引了大批读者.有关部门统计了2011年10月至2012年3月期间到市图书馆的读者的职业分布情况,统计图如下:
(1)在统计的这段时间内,共有 万人到市图书馆阅读,其中商人所占百分比是,并将条形统计图补充完整
(2)若今年4月到市图书馆的读者共28000名,估计其中约有多少名职工?
中招考点:用树状图、列表法计算简单事件的概率
2、为了解学生的艺术特长发展情况,某校音乐组决定围绕“在舞蹈、乐器、声乐、戏曲、其它活动项目中,你最喜欢哪一项活动(每人只限一项)”的问题,在全校范围内随机抽取部分学生进行问卷调查,并将调查结果绘制成如下两幅不完整的统计图.
请你根据统计图解答下列问题:
(1)在这次调查中一共抽查了 名学生,其中,喜欢“舞蹈”活动项目的人数占抽查总人数的百分比为,喜欢“戏曲”活动项目的人数是 人;
(2)若在“舞蹈、乐器、声乐、戏曲”活动项目任选两项设立课外兴趣小组,请用列表或画树状图的方法求恰好选中“舞蹈、声乐”这两项活动的概率.
中招考点:用树状图、列表法计算简单事件的概率
3、西宁市教育局自实施新课程改革后,学生的自主学习、合作交流能力有很大提高.张老师为了了解所教班级学生自主学习、合作交流的具体情况,对本班部分学生进行了为期半个月的跟踪调查,将调查结果分成四类,A:特别好;B:好;C:一般;D:较差;并将调查结果绘制成以下不完整的统计图,请你根据统计图解答下列问题:
(1)本次调查中,张老师一共调查了 名同学;(2)将上面的条形统计图补充完整;
(3)为了共同进步,张老师想从被调查的A类和D类学生分别选取一位同学进行“一帮一”互助学习,请用列表法或画树形图的方法列出所有等可能的结果,并求出所选两位同学恰好是一位男同学和一位女同学的概率.
三、当堂检测:
1、中招考点:方差公式:说明与检测P78第3题
2、中招考点:求简单事件的概率:说明与检测P79第6、7题
3、中招考点:分析、计算统计图中的数据:说明与检测P81第13题
四、延伸拓展:
1、高中招生指标到校是我市中考招生制度改革的一项重要措施.某初级中学对该校近四年指标到校保送生人数进行了统计,制成了如下两幅不完整的统计图:
(1)该校近四年保送生人数的极差是 .请将折线统计图补充完整;
(2)该校2009年指标到校保送生中只有1位女同学,学校打算从中随机选出2位同学了解他们进人高中阶段的学习情况.请用列表法或画树状图的方法,求出所选两位同学恰好是1位男同学和1位女同学的概率.
五、课后作业
概率统计是一种数学方法, 它主要研究的是自然界中的随机现象的规律。概率统计通常被人们称为数理统计。为了使学生对概率统计有一个更加深刻的理解, 可以利用信息技术向学生演示掷硬币模拟试验。首先要确定投币次数, 然后利用计算机进行掷硬币演示试验, 最后统计硬币出现正面、反面的次数, 并总结规律。学生可以从演示实验中了解事件发生的频率和事件所具有的波动性和稳定性。
2. 信息科学
信息科学既研究信息运动规律, 又研究信息应用方法。它是一门综合性能非常强的学科, 主要包含信息论、控制论、计算机理论、人工智能理论和系统论, 其中, 信息论、控制论和系统论在信息科学中占有主要地位。
信息科学的快速发展, 提高了人类接收信息和处理信息的能力, 实质上就是人们对世界有了更深一层的认识。这不单单是信息科学的出发点, 也是信息科学的最终目标。其实, 信息科学的发展不单单促进了信息产业的发展, 也促进了国民经济的增长和生产效率的提高。
3.概率统计和信息科学的整合
3.1概率统计和信息科学整合的概述
我们可以从三个方面来了解概率统计和信息科学的整合:第一方面, 在信息化的背景下, 可以利用网络和多媒体进行概率统计的详解;第二方面, 将概率统计的内容进行信息化的处理, 使其成为对学生非常有用的学习资源;第三方面, 利用信息技术改变学生学习的方式, 让学生从被动式的学习状态转变为主动式的学习状态, 从书桌上的学习转变为实践性、体验性的学习。
概率统计和信息科学的整合是一种双向性的整合, 也就是说, 概率统计和信息科学在整合中各取所需, 概率统计加以信息技术既创新了教学模式, 又开发并促进了科学技术的发展。
3.2概率统计和信息科学整合的必要性
概率统计和信息科学整合是当前不可抗拒的一股潮流, 这样的整合势在必行。信息技术与概率统计的结合更利于人们对概率统计的学习, 对信息技术的掌握。在概率统计学科中加入信息科学, 更有助于学生采取个性化的学习形式, 从而最大限度的体现并满足学生们的学习愿望。将信息科学技术融入到概率统计中, 是一种新型的学习方式, 这既是一种教学改革, 又发展了学生的创新精神, 提高了学生的实践能力。
3.3概率统计与信息科学的注意事项
将概率统计与信息科学有机整合起来, 学生们不单单要了解概率统计的相关知识, 还要学会使用计算机, 熟练的应用相关的计算机软件。只有这样, 学生们才能真正的学以致用, 将概率统计应用到实际的问题当中去。
在实际教学中, 应把重点放在概率统计方法的阐述和计算机的应用上, 就是既要结合数据和实例讲解概率统计的概念、特点和应用场合;又要讲解计算机的使用方法。例如, 可以利用软件演示方差分析、回归分析的计算过程。计算机软件SPSS在概率统计方面, 被应用的频率是非常高的, 因为它的统计功能较为强大。
3.4概率统计与信息科学整合的策略
首先要在思想与方法的层面上, 将概率统计与信息科学整合。这种深层次的整合可以使教师的教学能力获得快速的进展, 并且取得更好的教学效果。概率统计与信息科学的整合不单单局限于解决教学问题, 整合的真正目地是使学生们掌握学习方法, 让学生养成一种自主、探究的学习精神, 让学生们在信息科学的支持下, 用所学的知识与思想, 去解决实际中的问题, 也就是人们常说的学以致用。若想将概率统计与信息科学真正的有效结合起来, 老师的想法是非常重要的。教师不单单要了解信息科学, 还要从心底认同这种将概率统计与信息科学整合的教学模式。这样, 教师才能了解概率统计与信息科学整合的真正意义所在, 从而将信息科学技术掌握的更加熟练, 将概率统计理解的更加透彻, 将概率统计与信息科学的结合点看的更加清晰, 使自己的教学方法和教学思想更加完善。
其次, 是根据不同的内容选择不同的信息科学媒体。将概率统计与信息科学结合, 是为了使教学过程更加优化, 使教学效果更加理想。选择哪种信息科学媒体更加合理, 利用哪种信息媒体能最大限度的激发学生们的学习兴趣, 所有的这些, 都要以概率统计的内容作为选择教学媒体的出发点, 并根据学生的需要来确定最终使用的信息科学媒体。如果所选择的媒体, 与教学内容不搭, 不单不能够提升教学质量, 还会使教学过程变得更加繁琐冗杂。当教学内容属于静态类的时候, 可以选择视频来丰富教学内容;当教学内容拥有较强的连续性时, 在教学的过程中可以穿插几段录像;当教学内容较为复杂、抽象、并且变化性很强的时候, 可以选择多媒体课件来展示教学内容; 当学生进行研究性的学习时, 可以选择网络作为自己的学习助手
4.结语
概率统计在数学教学中占有重要的位置, 并且人们在解决实际问题时会经常使用到概率统计;而信息科学随着社会的发展, 科技的进步, 也越发的被大家重视。将概率统计和信息科学有机整合, 是一种必然的趋势, 它不单单可以优化教学课程, 还可以发挥学生们的创造性以及学习的主动性。像这种概率统计和信息科学的结合, 使我国的教学取得了更大的进展, 也为社会培养了更多的人才。
摘要:概率统计是一个具有规律性和统计性的学科, 在理工科专业里占有非常重要的位置。如今, 信息技术在飞速发展, 自然而然, 信息科学也就变得非常重要, 它改变了人们的教育方式、学习方式和思维方式。概率统计与信息科学给人们的学习和生活带来了很大的影响, 本研究就将针对概率统计和信息科学这一主题进行解析, 使读者对与概率统计与信息科学有关的内容有一个更加全面深刻的了解。
关键词:概率统计,信息科学,浅析
参考文献
[1]曾祥霖, 张绍文.论信息技术与课程整合的内涵层次和基础[J].5电化教学研究, 2006;l:50
①市场上某种食品的某种添加剂的含量是否符合国家标准;
②检测某地区空气质量;
③调查全市中学生一天的学习时间.
A. ①② B. ①③ C. ②③ D. ①②③
2. 今年我市有近4万名考生参加中考,为了了解这些考生的数学成绩,从中抽取1 000名考生的数学成绩进行统计分析,以下说法正确的是( ).
A. 这1 000名考生是总体的一个样本 B. 近4万名考生是总体
C. 每位考生的数学成绩是个体 D. 1 000名学生是样本容量
3. 有甲、乙两个箱子,其中甲箱内有98颗球,分别标记号码1~98,且号码为不重复的整数,乙箱内没有球. 已知小育从甲箱内拿出49颗球放入乙箱后,乙箱内球的号码的中位数为40. 若此时甲箱内有a颗球的号码小于40,有b颗球的号码大于40,则关于a,b的值,下列正确的是( ).
A. a=16 B. a=24 C. b=24 D. b=34
4. 某次射击训练中,一小组的成绩如表所示:已知该小组的平均成绩为8环,那么成绩为9环的人数是______.
5. “服务他人,提升自我”,七一学校积极开展志愿者服务活动,来自九年级的5名同学(3男2女)成立了“交通秩序维护”小分队,若从该小分队中任选两名同学进行交通秩序维护,则恰好是一男一女的概率是______.
6. 跳远运动员李刚对训练效果进行测试,6次跳远的成绩如下:7.6,7.8,7.7,7.8,8.0,
7. 在读书月活动中,学校准备购买一批课外读物. 为使课外读物满足同学们的需求,学校就“我最喜爱的课外读物”从文学、艺术、科普和其他四个类别进行了抽样调查(每位同学只选一类),如图是根据调查结果绘制的两幅不完整的统计图.
请你根据统计图提供的信息,解答下列问题:
(1) 本次调查中,一共调查了______名同学;
(2) 条形统计图中,m=______,n=______;
(3) 扇形统计图中,艺术类读物所在扇形的圆心角是______度;
(4) 学校计划购买课外读物6 000册,请根据样本数据,估计学校购买其他类读物多少册比较合理?
8. 为了从甲、乙两名选手中选拔一个参加射击比赛,现对他们进行一次测验,两个人在相同条件下各射靶10次,为了比较两人的成绩,制作了如下统计图表:
(1) 请补全上述图表;(请直接在表中填空和补全折线图)
(2) 如果规定成绩较稳定者胜出,你认为谁应胜出?说明你的理由;
(3) 如果希望(2)中的另一名选手胜出,根据图表中的信息,应该制定怎样的评判规则?为什么?
参考答案
7. (1) 200 (2) 40,60 (3) 72 (4) 900册
8. (1) 甲射击成绩的中位数:7,方差:4;乙射击成绩的平均数:7,中位数:7.5,方差:5.4;甲第8次命中环数为9环;
(2) 由甲的方差小于乙的方差,甲比较稳定,故甲胜出;
(3) 如果希望乙胜出,应该制定的评判规则为:平均成绩高的胜出;如果平均成绩相同,则随着比赛的进行,发挥越来越好者或命中满环(10环)次数多者胜出. 因为甲、乙的平均成绩相同,乙只有第5次射击比第4次射击少命中1环,且命中1次10环,而甲第2次比第1次、第4次比第3次、第5次比第4次命中环数都低,且命中10环的次数为0次,即随着比赛的进行,有可能乙的射击成绩越来越好.
【概率与统计小结】推荐阅读:
第四章统计与概率教案09-20
三年级数学上册《统计与概率》教学反思09-26
考研数学概率论与数理统计指导10-20
哈工大概率论与数理统计学习心得06-25
2024概率论与数理统计A考试大纲07-28
统计学的概率05-28
概率口诀【考研】09-07
土木概率论文10-06
概率知识10-25