初中“用频率估计概率”的教学解析,本文主要内容关键词为:概率论文,频率论文,初中论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
前一段时间我们听了两节初中数学的教学研讨课,其内容是“用频率估计概率”。同一个内容由两位不同的老师上。这两堂课,在课后引起了老师们的激烈争论,有关于教学本身的,也有关于教学内容的。我们认为教师对教学内容的理解到位与否,是上好课的先决条件,否则一切无从谈起。下面我们就这部分教学内容谈谈我们的一点想法。
一、教学内容的解析
该节课的教学目标是使学生了解用频率估计概率的必要性和合理性。
掷硬币或掷骰子的随机试验只能起到让学生直观感受用频率估计概率的合理性的作用,但不能让学生理解其必要性。因为在讲这节课之前,学生已经会用列举法计算该类随机事件发生的概率,通过试验学生可以观察到掷硬币出现正面的频率大体稳定在0.5附近。如果让学生求抛掷一枚硬币出现正面的概率,很少会有学生采用一次次掷硬币的办法,所以在老师复习完用列举法计算掷一枚硬币出现正面的概率和掷一枚骰子向上的点数是1的概率后,老师提问:“你还有没有其他的方法获得抛掷一枚质地均匀的硬币一次正面向上的概率吗?”课堂上出现了鸦雀无声的现象。
如何让学生理解用频率估计概率的必要性呢?老师在课堂上播放了NBA中火箭队vs奇才队的比赛片段,在姚明罚球出手一刹那,画面停止,老师提问“姚明罚进的概率有多大?”这段教学设计的比较好,该问题既是学生感兴趣的问题,又易于说明用频率估计概率的必要性,遗憾的是课堂上老师没有解释求姚明罚球命中率的意义。姚明罚球的命中率是客观存在的,如果知道该值的大小对对方球员是否有必要犯规是有帮助的。如果该值小,姚明罚球得分的可能性小,在他可能进球的情况下对方球员就可以考虑犯规,否则犯规就会得不偿失。在此基础上,再过渡到如何求命中率的问题就显得比较自然。多数学生了解现实中是通过统计历史的罚球记录来得到罚球的命中率的,即用频率近似概率的方法。
一个随机事件发生的概率是客观存在的,但通常我们并不知道该概率值是多少。在现实生活中,如果我们知道一个随机事件发生的可能性的大小,即该事件发生的概率,这对我们做决策是有帮助的,所以我们要想办法知道它。概率的统计定义给出了一种方法,它告诉我们可以用频率估计概率,即用频率近似概率。
二、用频率估计概率的正确理解
人民教育出版社出版的《义务教育课程标准实验教科书·数学(九年级上册)》对“用频率估计概率”的相关描述为“一般地,在大量重复试验中,如果事件A发生的频率m/n会稳定在某个常数p附近,那么事件A发生的概率P(A)=p。”“只要试验的次数n足够大,频率m/n就可以作为概率p的估计值。”
对此内容的理解,听课中和课下与老师交流中发现了一些问题。
问题1 有的老师认为只有大量试验的频率才能作为概率的估计。比如,课堂上老师出了这样一道题“小明投篮5次,命中4次,他说一次投中的概率为5分之4对吗?”老师给出的答案是“试验次数太少,不能估计概率”。教材中所说的“只要试验次数n足够大,频率m/n就可以作为概率p的估计值。”课下老师们问“试验次数多少是足够大呀?100次以上还是1000次以上?”正确的理解是频率总可以作为概率的估计,试验次数的多少只是影响估计的精度,在不同的实际问题中,对估计精度的要求不同,再加上试验条件的限制(比如破坏性的试验,不能试验次数太多)等,所以说“试验次数n足够大”随实际问题而定。估计精度和试验次数的关系我们在后面解释。
问题2 有的老师把“用频率估计概率”错误地表述为“用频率的稳定值估计概率”或“频率的稳定值是概率的估计”等。事实上,频率的稳定值就是概率,但仅从试验中我们无法知道频率的稳定值具体是多少。比如,在课堂上老师让学生分组做掷硬币的试验,得到的统计结果如表1。
表1 掷硬币试验的统计表
你能说明频率的稳定值是0.5而不是0.51吗?统计中是用频率估计概率,而不是用频率的稳定值估计概率。如果我们事先不知道掷硬币出现正面的概率为0.5,由上面的试验结果,只能用频率0.515作为出现正面的概率的估计值。又比如,从一定高度落下的图钉,钉帽着地的概率是不知道,我们只能用试验得到的频率来估计概率。
问题3 听课时发现老师如下的错误表述“频率不准确”“试验次数少频率不准确”“随着试验次数的增加频率越来越接近概率”等。频率随试验结果而改变,没有准确与不准确的问题。试验结果确定了,频率就定了。试验次数的多少会影响用频率估计概率的误差,即估计的精度。因为频率是随机变量,它随试验的不同而改变,试验次数的增加不能绝对保证频率越来越接近概率。比如,在上面的掷硬币的统计表中,300次试验的频率为0.523,而250次试验的频率为0.500,0.523并不比0.500更接近正面向上的概率0.5。
三、教师困惑的问题
问题1 试验次数多少比较合适?
若p=0.5,试验次数n=100,此时,则有
,即大约有95%的把握保证频率和概率的偏差小于0.1。若精度再提高1位,试验次数要提高100倍,即10000次试验,大约有95%的把握保证频率和概率的偏差小于0.01。
若p=0.1,试验次数n=100,此时,则有
,即大约有95%的把握保证频率和概率的偏差小于0.06。而10000次试验,大约有95%的把握保证频率和概率的偏差小于0.006。
一般地,当我们希望大约有95%的把握保证频率和概率的偏差在d之内,则试验次数至少取次。由此可以体会试验次数和估计精度的关系,也明白了数学家为什么要做几万次掷硬币的试验。
问题2 把频率再平均是否正确?
在教学研讨中,有的老师提出“学生在做目标检测题中,有的学生把统计表中的频率再求平均来估计概率,这是否正确?”这个问题是一个很好的问题,说明学生具有创造性,而不是完全照搬教师讲授的方法,如果学生能解释为什么要这样做就更好了,这个问题也体现了统计学与数学的不同。统计学的目的是更好的解决实际问题,不能说出这样做是否一定正确,但可以分析这样做是否合理,是否比用表中最后的频率估计概率更好。统计方法的选择依赖你要解决的实际问题及你收集数据的方法。两个估计量均为同一个参数的无偏估计,在统计中方差小的估计量更好。假设为了估计事件A发生的概率p做了大量的试验,得到的统计结果如表2。
表2 事件A发生的频率表
记,把频率再平均通常有以下两种方法。
加权平均的方法
直接取平均的方法
现在有三个估计量可以用来估计事件A发生的概率p,且它们都是p的无偏估计,分两种情况来讨论它们中哪个估计量最好,即方差最小。
情况1 表中各列试验是独立做的。在统计上已经证明用加权平均的方法得到的是最好的,即
和
成立。
就是用独立重复做n次试验的频率估计概率。比如,对上面掷硬币的表1,如果表中第2列的50次试验,第3列的100次试验,…,第8列的350次试验与第9列的400次试验是独立做的,那么用试验次数对各列频率作加权平均的值估计概率的方法就比只用第9列的频率好,原因是各列频率加权平均的值相当于1800次独立重复试验的频率,显然比仅用400次独立重复试验的频率估计概率的方法好。
当时,
。比如,对上面掷硬币的表1,如果各列试验是独立做的,那么
,
,满足上面的不等式,即用各列频率直接取平均的值估计概率的方法也比仅用最后一列的频率好。
情况2 表中各列试验不是独立做的,而是累计的结果。此时应有。在统计上已经证明
是最好的,即
和
成立,用上面两种对各列频率再平均的值估计概率的方法都不如直接用最后一列的频率好。比如,如果表1中第2列的50次试验是第1小组做的,第3列的100次试验是第1小组和第2小组合计的结果,…,第9列的400次试验是所有8个小组合计的结果,那么用最后一列的频率估计概率的方法在三个估计量中是最好的。
四、教学重点的解析
这节课的重点是让学生了解用频率估计概率的必要性和合理性,同时还要注意培养学生的统计思维。既要解释随机性又要解释规律性,在有实际背景问题中得到概率的估计值,并解释这个结果对决策的作用。比如,频率随每次试验改变,即使试验次数相同,频率也可能是不同的,即使同一个人再重复做相同的试验得到的频率也可能是不同的,但多次试验时频率具有一定的稳定性。