统计学教学中关于不确定性的思考
不确定性是统计学的研究对象。为了让学生更好地理解不确定性,本文主要从现实世界中不确定的普遍性,不确定现象背后的规律性,以及如何根据数据来推断规律几个方面来讨论不确定性。可以让学生更好地理解统计思想,培养统计思维,提高学生的统计修养。
不确定性是统计学的研究对象。统计的任务就是处理数据,研究数据背后的规律,这个规律究竟是什么,应该如何刻画,其实困扰过很多人。而概率论彻底解决了这个困难:把观测到的数据视作样本值,而把数据背后的规律看成是“总体分布”,并用服从这个总体分布的某随机变量来表示该总体。从“数据”上升到“统计模型”,这是人类思想史上的一大跨越。统计学提供了一种将数据模型化处理的观点和方法。当今统计学的一个重大任务就是将庞大的数据进行压缩和降维,使之进入到现代计算机能够处理的范围之内。
1.现实世界中不确定的普遍性
现实世界中存在巨大的不确定性,实际上,在每个人的一生中,上大学,结婚,投资以及处理每天工作中,我们都面临很多不确定性,都必须做出各种决策。比如,明天会不会下雨,出门要不要带伞?不确定性的产生是由于缺乏足够的信息或缺乏足够的知识去利用有效的信息。通常,需要我们了解自然界和人类行为中的不确定性,在利用自己和他人的经验做出决策时,能使风险最小化。所以,学好统计学对学生来说具有深远的意义。
统计是一门解决不确定问题的方法和策略,凡是确定性的问题,用统计去解释完全是庸人自扰。对于一个命题“所有的男人都是人”,这是一个确定性的问题,自然不属于统计学研究的范畴;“所有的男人都是女人”,这是一个伪命题,解决这种问题没有意义。而只有当问题是一些人是男人,一些人是女人的时候,统计学才能发挥作用,统计方法可以为决策提供信息。比如说抽样中显示男女的比例为1.3:1,男女之间数量的差异太大了,这就要引起警惕了。出现这种情况的原因,可能是因为总体中男女比重的失衡,或者抽样的有偏性。
2.现实世界中不确定现象背后的规律性
统计学所用到的技术或思路完全和科学研究一致,或者说统计学正是随着科学研究的进展而诞生的,科学的研究需要统计学给出一个较为准确的判断思路。科学研究的主要目的是为了描述、解释、控制和预测人与万事万物发展变化的规律,但任何一个事物的发展变化,除了必然性之外,必然隐藏着一些偶然性。
统计最关心的是数据背后的规律,这个规律究竟是什么。比如,从总体来说,我国公民的预期寿命是非常稳定的。而且女性的预期寿命也稳定地比男性高几年,这就是规律性。一个人可能活过这个寿命,也可能活不到这个年龄,这是随机的。但是总体来说,预期寿命的稳定性,却说明了随机之中有规律性。这种规律就是统计规律。
又比如掷骰子,只要没有人在骰子上做手脚,你得到任何点的概率都应该是六分之一。这反映了掷骰子的规律性。但掷出骰子之后所得到的结果还只可能是六个数目之一。这体现了随机性。如果你掷1000次骰子,那么,大约有六分之一的可能会得到6;这也说明随机结果也具有规律,而且有可能通过试验等方法来推测其规律。
3.基于不确定性的统计推断
统计离不开数据。数据传达什么信息,为了特定的目的我们如何利用数据呢?为此,我们必须知道在解决一个给定的问题时,从观测的数据中可以获得怎样的信息,可以获得多少信息。数据本身不是问题的答案,但是我们以什么样的程度来圆满回答问题,以及在一个特定的答案中含有多大程度的不确定性,或者财答案的信赖程度有多大,这些问题的考虑来说,数据是基本的资料。人们需要对所有观测的数据进行处理,以便确定所能解决的不确定性程度。统计分析的目的是从观测得到的数据中提取所有的信息。当信息逐渐增多时,不确定性逐渐减少到一个可接受的最低水平。
比如顾客是否喜欢某种饮品?事先不易猜测顾客喜欢与否的概率。在问了1000人之后,可能有364人说喜欢,而480人说不喜欢,其余的人可能不回答,或说不知道,或从来没有喝过这种饮料。当然,它仅仅反映了1000个被问到的人的观点;但这对于估计整个消费群体的观点还是有用的。从该数据可以估计喜欢该饮料的人占大约0.364左右。
统计学是一门十分实用的科学。可以看出,我们以什么样的程度来圆满回答问题,以及在一个特定的答案中含有多大程度的不确定性,或者对答案的信赖程度有多大这些问题的考虑来说,数据是基本的资料。人们需要对所有观测的数据进行处理,以便确定所能解决的不确定程度。
作者:曾惠芳 来源:科学大众·教师版 2015年10期
下一篇:统计学课程实验教学的探索