对数据分析概念的理解与调查--以七年级学生为例_数据分析论文

数据分析观念的认识及调查分析——以七年级学生为例,本文主要内容关键词为:为例论文,七年级论文,观念论文,数据论文,学生论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

      一、问题提出

      《义务教育数学课程标准(2011年版)》(以下简称《课标》)中指出:“在数学课程中,应当注重发展学生的数感、符号意识、空间观念、几何直观、数据分析观念、运算能力、推理能力和模型思想.”[1]美国《时代》杂志曾预测21世纪的十大热门职业之一——“数据”矿工就是能从如山般堆积的数据资料中筛选出金子般的信息.数学分析领域是日本教育技术学的十大领域之一.在生活、工作和学习中处处都有大量的数据,但数据并不等于信息,真正有用的信息是隐藏在这些数据之后的关于数据的整体特征的描述及对其发展趋势的预测.可以说,信息对每个人都是平等的,差别在于是否能从大量繁杂的数据中提炼出有用信息,从而更好地理解世界,抓住机遇.从数据中挖掘信息靠的就是对数据的分析.运用数据进行推断的思考方法,是现代社会一种普遍适用且强有力的思维方式,是信息时代每一个公民基本素养的一部分.义务教育阶段应该帮助学生形成尊重事实、用数据说话的态度,了解随机现象,形成科学的世界观与方法论.数据分析观念是统计意识的核心,而统计意识又是数学应用意识的重要内容之一.因此,探讨数据分析观念对于义务教育阶段的数学教育具有重要意义.

      二、数据分析观念的认识

      (一)数据

      数据是载荷或记录信息的按一定规则排列组合的物理符号,可以是数字、文字、图象或计算机代码.数据也称观测值,是实验、测量、观察、调查等的结果,常以数量的形式给出.对信息的了解始于对数据的了解,对信息的获取始于对数据背景的解读,即“数据+背景=信息”.义务教育阶段的数据主要是以数量形式呈现的,是有实际背景的,是随机的.

      (二)数据分析

      数据分析的基础是数据的“不确定性”,及数据的随机性.数据分析的目的是把隐没在一大堆看来杂乱无章的数据信息中的信息集中、萃取和提炼出来,以找出所研究对象的内在规律.在实用中,数据分析可帮助人们做出判断,以便采取适当行动.数据分析是组织有目的地收集数据、分析数据,使之成为信息的过程.

      最初的数据可能杂乱无章,看不出规律,这时可作探索性分析,即通过作图、列表、用各种形式的方程拟合,在数据中发现一些新的特征,计算某些特征量等手段探索规律的可能形式.换句话说,即探索往什么方向和用什么方法去寻找和揭示隐含在数据中的规律性.然后在探索性分析的基础上提出一类或几类可能的模型,然后通过进一步的分析,从中挑选一定的模型进行分析、作图.从图象上还可以简便求出实验需要的某些结果(如直线的斜率和截距等),读出没有进行观测的对应点(内插法),或在一定条件下从图象的延伸部分读到测量范围以外的对应点(外推法).此外,还可以把某些复杂的函数关系,通过一定的变换用直线来表示.最后根据对数据的分析,推断可能的结论.

      数据分析过程的主要活动由明确信息需求、收集数据、分析数据、评价并改进数据分析的有效性组成.第一,明确信息需求就是根据决策和过程控制的要求,明确需要什么样的数据及数据收集的渠道、方式、方法等.这是确保数据分析有效性的首要条件,可为收集数据、分析数据提供清晰的目标.第二,收集数据.需要对收集数据的内容、时间、地点、渠道、方法进行策划,然后在实施收集.要注意防止数据丢失和虚假数据.有目的收集数据是确保数据分析过程有效的基础.第三,分析数据.分析数据是将收集的数据通过加工、整理和分析、使其转化为信息.要根据背景来选择合适的方法表达数据.“合适”是指最能反映客观事实的方法,而没有所谓的唯一方法,对的与错的方法,只能说好的与不够好的方法.比如有的数据适合用平均数刻画,有的数据适合中位数、众数刻画.义务教育阶段主要是对数据进行整理,包括排序(找出最大的最小的)、分组,还可以用统计图来表示,用统计量来刻画数据(平均数、中位数等).第四,反思数据分析过程.通过对以下问题的分析,反思数据分析结论有效性:(1)收集数据的目的是否明确,收集到的数据是否真实和充分.(2)数据分析方法是否合理,是否能反映实背景.(3)提供决策的信息是否充分、可信,是否存在因信息不足、不准确、滞后而导致决策失误的问题.

      (三)数据分析观念

      “观念”是内隐的,不与具体的知识技能相对应,而是实际的活动中表现出来的一种意识和潜在能力.史宁中教授认为:核心词不是指具体的知识点,甚至不是指具体的知识本身,而是概括很多知识的共性所反映出来的思想和思维方式.“数据分析观念”不能等同于计算、作图等简单技能,而是一种需要学生在亲身经历从数集收集、整理、分析及推断活动后,在思想上的一种总结,一种对数据分析的认识和用数据分析问题的觉悟,是学生在长期的生活和统计活动实践中形成的对用数据来分析推断结论解决问题的总体的综合认识.

      《课标》指出:“数据分析观念包括:了解在现实生活中有许多问题应当先做调查研究,收集数据,通过分析做出判断,体会数据中蕴含着信息;了解对于同样的数据可以有多种分析的方法,需要根据问题的背景选择合适的方法;通过数据分析体验随机性,一方面对于同样的事情每次收集到的数据可能不同,另一方面只要有足够的数据就可以从中发现规律.数据分析是统计的核心.”[1]数据分析观念是义务教育阶段学生最基本的数学能力之一,与运算能力、数感、符号意识、空间观念、几何直观并列.

      数据分析观念的内涵:(1)要有数据观念,即首先是相信数据分析能够帮助解决很多实际问题;其次遇到问题的时候,能够想到去调查研究、收集、整理和分析数据以帮助解决问题;再次愿意用数据.例如要解决一班同学是否比二班同学高的问题.(2)要体会数据是蕴含着信息的,知道信息来自于对数据背景的解读.例如公交车儿童购票线由1.1米提高到1.2米,蕴含着现在儿童平均身高较以前有很大的增长.(3)知道数据整理、分析的方法多种多样,并且这些方法无所谓的对与错,只有好方法与不够好的方法之分.好方法的主要判别标准就是能否更充分的反映客观事实,解决实际问题.例如今年与去年夏天热吗?是温度的平均数来刻画,还是用众数来刻画呢?(4)知道用来分析的数据的随机性质.一方面每次收集到的数据可能不同,即每个数据是不确定的.另一方面,大量的随机数据聚集在一起又呈现出某种稳定性,从而可以从中探寻规律.例如正常情况下,人每天掉的头发数目是不确定的,但经过一长段时间内掉发数目总是稳定在某个范围内,据此可推断正常的掉发不会成为秃子.(5)知道数据分析推断而得的结论具有或然性.实际上是据数据分析推断结论是由许多个别来推断一般,可以认为是一种归纳推理,是不完全可靠的.但是它为推断、预测提供了一定程度上的可靠性.例如某地区从未有过连续30天不下雨的历史,今天就是第30天,由此推断明天一定会下雨.这个结论就不完全可靠.

      数据分析观念是具有缄默知识的一些特性.(1)情景性.数据分析观念获得总是与和数据有关的问题或任务情景联系在一起的,是对与数据有关的特殊问题或任务情景的一种直觉综合或把握.因此,数据分析观念作用的发挥是与这种特殊问题或任务情景的“再现”或“类比”分不开的.(2)非批判性.数据分析观念是学生亲身经历统计活动的全过程,通过身体的感官或理性的直觉而获得的,因此不能够通过理性过程加以批判和反思.(3)层次性.数据分析观念并非只有一种形态,根据其能够被意识和表达的程度可以划分为不同的层次.第一学段,主要是学生对数据蕴含着信息的一种体验;第二学段,要求进一步认识到数据中蕴含着信息,发展数据分析观念;第三学段,要求了解利用数据可以进行统计推断,发展建立数据分析观念.

      三、调查分析

      对七年级学生数据分析观念现状的调查,采用问卷与课堂听课、访谈相结合的方式.基于以上数据分析观念的分析,在查阅文献基础上编制初始问卷,并经专家指点、教师访谈和小范围预测进行修改和完善,最后正式确定“七年级学生数据分析观念的调查问卷”.以达州市市内部分七年级学生共计427人作为研究对象,采用问卷与访谈的方法,将定量与定性研究相结合.2012年9月,在达州市4所中学进行问卷调查,共发放问卷427份,回收427份,有效卷418份,有效回收率98%.问卷回收后,采用SPSS 13.0软件对数据进行统计处理.

      (一)七年级学生的数据观念

      七年级学生的数据观念的统计情况见表1.

      

      从表1可以看出,学生对数据能帮助解决现实生活问题的看法,选择“非常认同”的学生有33.8%,选择“基本认同”的有65.7%.因此,可以认为七年级学生基本都认为数据分析能够解决现实生活中的实际问题.对于“是否愿意用数据”的问题,选择“首先想到用数据”的只有20.2%,选择“没有其他方法时,会”的达到了55.6%.这表明,超过一半的学生有其他选择是都不愿意用数据,1/5的学生首选用数据,1/5的学生持无所谓的态度,不知道数据解决问题有何优越性.对于“用数据就解决实际问题的实践”这一问题,选择“经常”的学生只有9.6%,选择“偶尔有过”的学生有61.1%.这表明只有不足1/10的学生经常在实践中用数据解决问题,大部分学生都很少有过这样大的实践经历.在与学生访谈中了解到,有的学生(特别是数学后进生)认为:数据的运算结果才可能回答问题;看见数字就头疼,没想过或不想用数学(据)解决问题.可见,七年级学生不是很愿意与数据亲近,有其他选择时,一般不会用数据,用数据的实践经历更少.

      (二)七年级学生对数据蕴含信息的看法

      七年级学生对数据蕴含信息的看法的统计情况见表2.

      

      从表2可以看出,对“统计数据蕴含信息”观点的看法,选择“非常认同”的学生占43.4%,选择“基本认同”的学生占54.6%.这说明七年级学生几乎都能认识到数据蕴含信息.但是当问及“统计中的数据与代数中数据是否有区别”时,只有28.3%的选择“统计中的数据有实际背景意义”,42.4%的学生认为只是“有的问题中有区别”.这表明七年级学生大部分没有认识到统计数据与代数中数据的最大区别.对“根据市场普通蔬菜的平均价格(如每斤5万元),就基本能推断月收入1500万元的家庭高低状况”,16.7%的学生选择“高”,40.9%的学生选择“一般”,34.8%的学生选择“低”.访谈中了解到:大部分学生认为经过运算后的数据更能表达信息;数(据)都是用来计算的;平均数就是所有数的和除以数的个数.这表明七年级的学生对数据蕴含信息的理解是不清晰、不深刻的.

      (三)七年级学生对数据分析的方法的看法

      七年级学生对数据分析的方法的看法统计情况见表3.

      

      从表3可以看出,认为解决问题时对同一组数据的分析的方法有“多种”的学生占87.9%,但是其中58.6%学生认为“有最好的”数据分析方法,只有29.3%的学生认为数据分析的方法“有多种,只有更好的”.对用不同的方法对同一组数据分析的结果,选择“可能不同”的占41.4%,选择“一定相同”的学生占24.7%,选择“一定不同”的学生占15.7%.访谈中,有的学生认为不管用什么方法,结果相同才表示正确;有的学生认为方法不同,结果肯定是不同的,即使相同肯定是特殊情况.当问“今年与去年夏天,哪一年更凉爽,你最想用哪个量来判断”,选择“平均数”的有31.8%,选择“方差”的有16.2%,选择“众数”的学生有19.2%,选择“最高温度”的学生有32.8%.这表明大部分七年级学生能够认识到数据分析的方法有多种,但对多种方法之间的关系不是很清楚.学生认为多种方法分析数据的结果一定相同或一定不同,这也表明七年级学生用代数中的判断思维方式在做判断,对数据分析的方法还没有很好的认识,对方法的鉴赏力更弱.在访谈中,认为“平均数”好的学生的理由是电视上、报纸上、班级之间的成绩比较等等都是有平均数,认为“方差”好的学生的理由是方差更精确.

      (四)七年级学生对统计数据随机性看法

      七年级学生对统计数据随机性看法的统计情况见表4.

      

      从表4可以看出,有46.5%的学生认为统计数据是确定的,只有34.3%的学生认为统计数据具有随机性.当甲弄丢了收集好的数据,他马上重新收集数据做分析判断,对甲的做法有40.4%的学生选择“完全赞同”,33.4%的学生选择“基本赞同”.“如果用于分析的数据具有随机性,能探求到数据中的规律吗”,25.3%的学生选择“可以”,28.8%的学生选择“数据量够多就可以”,23.2%的学生选择“肯定不行”.这表明近1/2的学生认为统计数据是确定的,但超过七成的学生赞成数据丢了,重新收集再做分析判断.近1/2的学生不能肯定从具有随机性的数据中探求到规律.访谈中,学生对数据随机性的认识是问题最大的.即使是问卷中选择“赞同”的学生也表示不是很明白数据具有随机性是什么意思,认为很矛盾,数据都摆在那儿了,为什么又是随机的,还是不一定的.老师也表示学生对数据随机性的认识问题最大.有的老师很坦诚的说:“我自己对数据的随机性的认识也不是很深刻,上课时也不知道怎样让学生明白.”可见七年级学生对数据随机性的认识呈现出矛盾性,基本上没有理解统计数据的主要特征.

      (五)七年级学生对数据分析得出的结论的看法

      七年级学生对数据分析得出的结论的看法的统计情况见表5.

      

      从表5可以看出,52.0%的学生认为用统计数据分析得出的结论是“可靠的”,只有36.4%的学生选择“不是很可靠”.当问及“据统计达县、万源、大竹的人均寿命是68岁,由此可推断达州市的人均寿命很可能是68岁,你是否赞同”时,有14.1%的学生非常赞同,56.5%的学生认为“基本赞同”.“某校某班模拟高考测试成绩全部上线,该校的招生广告说该校的升学率达到100%,问你会选择该校读书吗”,11.6%的学生选择“会”,48.5%的学生选择“可能会”,34.8%的学生选择“不会”.访谈中,有的学生认为,如果数据不具有随机性,各种方法计算的结果相同的话,这样推出的结论就是可靠的;有的学生认为不同的方法得出的结果,不能比较它们的可靠性;这表明大部分七年级学生不能理解数据分析推断得的结论具有的或然性.

      对开放题的解题情况:某班需要推荐一名学生参加比赛,有3位候选学生,你最想推荐谁去参赛,最主要的理由是什么?3位候选学生的成绩如下:

      

      选择“甲”的学生有39.9%,选择“乙”的学生有6.6%,选择“丙”的学生有53.5%.可见,学生主要趋向于甲与丙之间做选择.推荐甲的学生中,最主要的理由是“每次都及格了”的学生有11.4%,有41.8%的学生认为甲“最稳定”,但没有说明如何判断的,有21.5%的学生通过计算平均数,认为甲的“平均数最高”,最应该推荐甲参赛,有19.0%的学生推荐甲参赛的最主要原因是甲成绩好,总分高.推荐丙的学生中,2.8%的学生依据的最主要原因是“第五次丙的成绩比甲、乙都高”,84.0%的学生认为“丙一直处于上升趋势”.在访谈中了解到推荐甲的大部分学生认为甲每次的成绩都是及格了的,平均分最高,由此推断甲成绩起伏不大,是最稳定的,推荐甲参赛时比较保险的.推荐丙的学生中大部分认为丙虽然第一次成绩最差,但第五次成绩最好,进步是最大的,并且一直是在上升,没有跌过,由此判断以后丙的成绩会更好,推荐丙参赛最能获胜.也有部分学生认为参考的成绩次数太少,不足以判断谁更适合参赛.也有部分学生认为他们三人差不多,派谁参赛都可以.这表明,七年级的学生面对数据时,分析的标准不同,通过数据分析做出适当决策的能力较差.

      四、教学建议

      《课标》总目标中:“经历在实际问题中收集和处理数据、利用数据分析问题、获取信息的过程,掌握统计与概率的基础知识和基本技能;体会统计方法的意义,发展数据分析观念,感受随机想象.”[1]数据分析观念是精神层面的东西,是愿意用数据分析问题的一种倾向、潜在能力.由波兰尼的缄默知识理论[2]可知,它的建立很大程度上依赖于“感悟”,需要较长时间的理解和实践.对统计认知以数据分析观念为灵魂[3].根据调查分析及教学实践,提出以下几点教学建议.

      (一)注重数据来源及问题的设计

      针对学生的数据观念情况:55.6%的学生一般都不愿意用数据解决问题,大部分学生不太愿意与数据亲近,用数据的时间经历很少.建议在教学中设计好的案例和问题.案例的选择原则是学生看得见、体会得到、遇到过的现实问题.问题的设计原则:第一,用数据解决具有优越性,有理有据;第二,必须用数据才能解决.学生现有的数学经验,是学生学习数学的基础,是教师组织数学教学的逻辑起点[4].数学教学首先应该注意数学对象的实际背景,让学生体会、经历“从许多自然现象和社会现象中抽象出数量上或结构上的数学概念、数学规律和数学理论”的过程[5].数学教师的知识可分为显性和缄默知识,而数学教师的缄默知识只是存于内心的,个体化的[6].教学设计时要注重学生多样化的早期经验和数学经验,同时要考虑教师自己的实际,要教师自己能把握的.如可以考虑涉及学生的良好习惯、对亲情友情的关注、对世界老人儿童生存状况的关注、科技发展、环境保护等.

      (二)开展数学活动并体会数据的意义

      学生对数据蕴含信息的理解不清晰、不深刻,42.4%的学生认为统计数据与代数中的数据只在有的问题中有区别.建议开展数学活动,体会数据的意义.设计一组数据,它们来自不同的统计背景,让学生体验同一组数据蕴含的信息可能不同,进一步说明来自不同问题中的数据在代数上来说是没有区别的.比如,在统计全班学生对水果的喜爱时,苹果与橘子的统计数据可能是相同.

      (三)自己制定标准并提高数据分析方法的鉴赏力

      在学生对数据分析方法的看法中,58.6%的学生认为有最好的统计方法,大部分学生认为不管什么方法,结果相同才表示是正确的.建议教学过程中多让学生体验自己制定标准或原则的过程,如依据什么原则制定解决方案,依据什么标准收集数据、分析数据等,提高统计方法的鉴赏力,体验按不同标准进行的数据分析都能解决问题,但解决问题的满意程度不同.如教学过程中鼓励学生自己制定标准,对事物或数据进行分类,感受分类与分类标准的关系,按不同的标准或原则分类对数据分析的结果显示的信息可以帮助人们对事物的认识.

      (四)利用数学实验并展现数据的随机性

      学生对统计数据随机性的认识情况是最差的:只有34.3%的学生认为统计数据具有随机性,但也说不清楚数据随机性是什么.在课堂教学中,教师对数据随机性的教学也是最薄弱的,甚至有教师让学生记住“随机性就是不确定的”.数据的随机性主要有两方面的涵义:一方面对于同样的事情每次收集到的数据可能不同;另一方面只要有足够的数据就可能从中发现规律.一个普通的“数据”,可能背后隐藏着一种随机现象[7].“数学量的第二特征是确定性”[8]是数学教师一致认同的,而对数据的随机性的理解存在不同程度上的认知差异,对于相关的教学设计、教学过程中的引导存在较大困惑.建议利用数学实验,展现数据的随机性.教师多读统计方面的书,多看相关的统计案例分析,加宽加深理解.数学实验紧贴学生实际,如设计上学时间的测量,脉搏的测量等活动,可通过表格、折线图、趋势图等,感受随机现象的变化趋势,体会数据随机性的含义.

      (五)引导对数据分析的结论的认识

      52.0%的学生认为统计数据分析的结论是可靠的,很多学生认为数据不具随机性的话,结论就可靠.可见学生主要是从可靠与不可靠对统计结论进行二分法判别.建议教师引导学生认识数据分析的结论.通过学生生活实际中的问题,引导学生认识到数据分析的结论的或然性,不是非此即彼的关系.有的数据分析方法得到的结论基于局部特征和规律推而广之的判断不可能完全可信.如对天气预报结论的认识.

标签:;  ;  ;  ;  ;  

对数据分析概念的理解与调查--以七年级学生为例_数据分析论文
下载Doc文档

猜你喜欢