快捷搜索:  汽车  科技

数字的神奇秘密第八集(数字也会讲故事2)

数字的神奇秘密第八集(数字也会讲故事2)▎张怀予:我同意,除此以外,好像还要收集腰围、胸围吧。▎李卉如:怀予,我们是不是应该要求每个班先去收集自己班级里每个同学的身高呀?▎潘老师:很好,其实数据分析在我们生活当中还有很多的运用呢。同学们有没有兴趣了解一下数据分析的基本步骤呢?▎李卉如:有兴趣!潘老师,之前我们统计班长候选人的票数很简单,只要数清楚每个候选人得到了多少票,最高票是谁就可以了。您还有别的例子吗?▎潘老师:一般来说,数据分析会经历“收集、整理、描述和分析”这样的一个过程。我们今天要通过一个稍微复杂一点的例子,一起来了解下这个过程。假设,你们学校决定给全校1000名同学做冬季校服,校服的厂商和样式都已经确定好了,但是具体做多大尺码、每个尺码要做多少套还知道。现在这项工作由你们俩来负责,你们会怎么做呢?你们可以先试着讨论一下步骤。

特别声明:本文为新华网客户端新媒体平台“新华号”账号作者上传并发布,仅代表作者观点,不代表新华号的立场及观点。新华号仅提供信息发布平台。

潘老师:同学们,我们在之前的节目中学习了数据和数据分析,你们还记得么?

李卉如:潘老师,我记得。那期节目后我知道了不光数字是数据,声音、图像等等也能是数据。

张怀予:潘老师,我学习到了数据在经过分析后,得到的信息能够帮助我们做决定。

数字的神奇秘密第八集(数字也会讲故事2)(1)

潘老师:很好,其实数据分析在我们生活当中还有很多的运用呢。同学们有没有兴趣了解一下数据分析的基本步骤呢?

李卉如:有兴趣!潘老师,之前我们统计班长候选人的票数很简单,只要数清楚每个候选人得到了多少票,最高票是谁就可以了。您还有别的例子吗?

潘老师:一般来说,数据分析会经历“收集、整理、描述和分析”这样的一个过程。我们今天要通过一个稍微复杂一点的例子,一起来了解下这个过程。假设,你们学校决定给全校1000名同学做冬季校服,校服的厂商和样式都已经确定好了,但是具体做多大尺码、每个尺码要做多少套还知道。现在这项工作由你们俩来负责,你们会怎么做呢?你们可以先试着讨论一下步骤。

李卉如:怀予,我们是不是应该要求每个班先去收集自己班级里每个同学的身高呀?

张怀予:我同意,除此以外,好像还要收集腰围、胸围吧。

李卉如:对了,是不是还需要知道同学们的性别呢?

潘老师:是的,通常是需要的,因为校服可能会分男生、女生不同的款,即使是同款的,相同身高的男女同学,肩宽和胸围也可能会差很多。另外,还要同时记录好同学们的名字,这样便于校服做好以后准确的发放。

数字的神奇秘密第八集(数字也会讲故事2)(2)

李卉如:好的,所以我们现在要收集每位同学的姓名、性别、身高、肩宽和胸围的数据,接下来我们应该做些什么呢?

潘老师:两位同学,到这里你们讨论完成的就是“数据收集”的工作,接下来要整理数据了。假如你们拿到了所有班级的数据,可以先分别看看有没有记录不清楚或者错误的地方,如果有,就要再对个别情况核实。

张怀予:潘老师,我们怎么知道数据是不是错误呢?

潘老师:例如,有个同学的身高记录特别高,比别人高了很多。那他究竟是真的长得特别高,还是填写数据的时候写错了呢?如果数据错了,最后就可能导致他拿到的校服不合身。

张怀予:哦,所以我们要把一些看起来有问题的数据先挑出来,确认一下,然后就可以把所有的数据汇集到一起了吧。

李卉如:汇总的时候我们可以把男生、女生的数据分开放。

潘老师:没错,以上的这些工作都是对数据的整理。

张怀予:潘老师,有了全校学生的数据,那我们是不是就能确定校服的尺寸了?

潘老师:嗯,我还想提醒你们一点,如果我们只做几套校服,也许可以按照每个人的身材做出非常合身的衣服。但是现在我们要给全校做1000套校服,如果还是按照每个人的数据一套一套地制作,那这个工作量就太大了,价格会更高,也不够经济实惠。我建议大家先确定一个范围,在这个身高范围内的同学都可以穿同一个尺码的校服。

李卉如:那假设最高的同学身高1米5,最矮的同学身高1米2,那范围就是从1米2到1米5(120厘米到150厘米)。

张怀予:我们可以每隔10cm设置一个身高段,统计120cm以下多少人,120cm-130cm多少人,以及每个身高段里男生和女生的数量。

李卉如:还要参考这个身高范围里,同学肩宽和胸围的数据呢。如果有些偏胖或者特别瘦的同学,好像也要单独制作 或者直接给大一码或者小一码。

数字的神奇秘密第八集(数字也会讲故事2)(3)

潘老师:非常好,大家考虑的都很细致。现在你们做的这些工作是对数据的描述,我们也可以说是在描述出数据的“分布特征”

张怀予:那我们就可以统计出来每一个身高段里的尺码是怎样的,需要做多少套了!

潘老师:可以是可以,但是我们再进一步想一想,要不要结合一些背景信息呢?比如,假如从数据中发现5年级和6年级的同学的平均身高相差很多,说明在这两个年龄段大家身体长得很快。所以考虑到预算和校服未来可以穿多久,我们是否需要将校服做的大一号?这一步相当于挖掘了数据背后的信息,也就是对数据的分析。有的时候,数据的描述和分析是结合在一起进行的。

李卉如:潘老师,我们是不是还可以请校服厂商来帮我们把把关?

潘老师:没错,因为他们是最有经验的。实际生活中我们完全可以把前面整理过的数据交给他们,他们会对数据进行处理,制定出尺码范围,然后给每一个同学匹配到相对合适的尺码。不过,今天两位也亲身体会了这个过程。

张怀予:潘老师,在最终确定了尺码和件数后,我们是不是就完成了数据分析的整个流程?那这些数据我们之后就不需要了吧?

潘老师:不一定哦。虽然我们会为了某个特定的目的收集数据,但是这些数据也是可以再次被利用起来的。例如,我们可以根据已有的数据,估算半年后夏季校服可能适合的尺码。这就是使用数据进行预测了。

张怀予:谢谢潘老师,通过这个例子我对数据从收集到分析的过程有了更多的了解。

潘老师:除了校服数据,我们再讲一个图像数据的分析吧,看看步骤是不是也差不多。大家知不知道东北虎?

李卉如:潘老师,我在动物园看过。

张怀予:我没见过真的,不过在电视上也看过。

潘老师:东北虎是现存体重最大的猫科食肉动物,目前只生活在中国的东北还有跟东北接壤的俄罗斯远东地区。一只东北虎的活动范围在400-500平方公里,相当于5-7万个标准足球场那么大。在那么大的区域里,我们要怎样才能找到甚至观察一只东北虎呢?又如何在更广阔的范围里发现更多的老虎呢?

数字的神奇秘密第八集(数字也会讲故事2)(4)

关于这个问题,我请教过东北虎保护的专家。专家说,这其实也是一个数据采集分析的过程。首先,动物保护人员把老虎可能生活的地区,划成一个个差不多面积的网格,然后在每个网格里安装一台红外相机。一旦有老虎从相机前经过,相机就会自动拍照。因为每个老虎身上的斑纹都是独一无二的,就跟人的指纹一样。

科学家就会把所拍到的老虎照片作为图像数据放在一起比对分析,通过它们身上的斑纹,就可以鉴定出区域里总共有多少只不同的老虎。再加上每只老虎的斑纹图像、它被拍摄到的时间、地点不同,这样就逐渐的给每只老虎建立起一个档案。

张怀予:那有多少个老虎的档案,就等于有多少只老虎了?

潘老师:虽然我们没法保证每只老虎都从红外相机前经过,但是科学家通过选择在老虎更喜欢的路线上,安装更多红外相机,以及全年不间断的监测等等措施,尽可能的提高了采集数据的准确性,减少老虎被遗漏的情况。

张怀予:潘老师,这样每次拍到东北虎,科学家就可以对比之前的数据,判断是不是新的老虎了对吧?

潘老师:对啊,就算不是新的老虎,我们也可以记录它最新出现的时间和地点等。比如说,我们通过数据能确定一只老虎的活动范围,再通过分析,是不是就可以判断哪些区域更适于老虎生活呢?这样我们能开辟更多类似的区域,保护数量稀少的东北虎了。

数字的神奇秘密第八集(数字也会讲故事2)(5)

李卉如:听起来真的很有趣,原来数据还可以帮助我们保护野生动物。

潘老师:是的。今天我们通过两个案例简单了解了数据分析的流程。关于数据分析,其实还有很多不同的类型,不同的分析方法和分析工具,我们在一期节目中没法全部解释清楚。以后同学们会有更多的机会慢慢接触和学习的。现在我们所能做的就是留意身边的数据,从身边的事情入手,不断尝试收集数据获取信息。从不惧怕数据,到学会“亲近”和喜欢数据,再合理地运用和分析数据。这样,希望数据就可以成为我们每个人的好帮手!

数字的神奇秘密第八集(数字也会讲故事2)(6)

来源:新华号 真爱梦想

猜您喜欢: