数字困惑,统计是如何影响我们的生活的?( 三 )


可见 , 在进行调查的时辰 , 只要把许可的误差规模充实放大 , 就能有足够的把握说 , 我们的调查成果是准确的 。 前面我们列举的用户和调查数字都太小了 , 所以要把误差规模放大 , 才会有足够的把握 。 在这个例子中 , 只要把几个数字稍微调大一点 , 误差规模就会大大缩小 , 而把握反而会提高 。 例如 , 当用户数变为20 , 此中有3家收看该节目 , 真实收视率为15% , 电视台调查数为10家时 , 就会有79%的机遇 , 收视率在10%?20%之间 。 真正的电视台用户一般都在数十万以上 , 只要调查30个以上的用户 , 就可以有99%甚至更高的把握 , 把调查误差节制在足够切确的规模内 。 我们完全可以相信调查的成果 , 而用不着给所有的用户打德律风 。
这种只对一部门客户进行的调查叫抽样调查 。 抽样调查很是的有效 , 要知道大片的丛林里有几多棵树 , 只需选择几个小块的区域进行调查 , 算出平均密度再乘上总面积 , 而不消去摸遍每一个山头;要知道灯胆的平均利用寿命 , 只要拿少量灯胆进行试验 , 而不消把所有的灯都用到坏;在大型养鸡场里 , 要知道明天有几多母鸡会下蛋 , 也只用遴选几十只验一验就够了 , 而不消去摸每只鸡的屁股 。 抽样调查能给我们的糊口带来很大的便利 。
保险公司也不必去统计每小我的真实寿命 , 它只要抽样调查 , 一样可以获得对劲的数据 。 看上去 , 抽样调查真是个脚踏两船的好方式 。
不外 , 别欢快得太早 。
导致破产的预言
抽样调查的成果不是绝对准确的 , 即使有99.9%的把握 , 仍然有0.1%的不测会超出误差许可的规模 , 那是不成避免的 , 是可以许可的正常错误 。 然而 , 有些抽样调查却会发生非正常的错误 。
1936年美国总统选举起头了 , 大部门人都认为现任总统罗斯福——平易近本家儿党的候选人——将会胜利 , 可是有个杂志《文学文摘》却不觉得然 , 因为他们邮寄出1000万份调盘问卷 , 收回了此中的240万份 , 调查成果显示 , 共和党人兰登将会以绝对优势胜出 。
1000万的调查样本 , 这么大规模的问卷调查 , 足以让人相信 , 罗斯福的总统政治生活生计竣事了 。 但成果却出乎杂志社的预料 , 罗斯福顺遂被选美国总统 , 后来当作为二次大战时带领宿世界人平易近抗击法西斯的三巨子之一 。 因为错误的展望 , 读者对这本杂志发生了严重的信赖危机 , 大选竣事仅仅几个月 , 《文学文摘》就破产了 。
《文学文摘》的问题出在哪里呢?本来 , 他们是按德律风簿上的地址寄出的调盘问卷 。 固然今天德律风早已经进入了千家万户 , 但在20宿世纪30年月的美国 , 方才履历过一场庞大的经济危机 , 掉业人数高达900万(而那时美国总生齿还不足1亿) , 大部门人的工资只有危机以前1/3的程度 , 只有一部门相对敷裕的家庭用得起德律风这种“高科技产物” 。 德律风只有富人才有 , 富人大多撑持共和党人兰登 , 这就是《文学文摘》调查成果的来历 。 而那时美国贫民大多撑持罗斯福 , 在人数上 , 贫民比富人多得多 , 因为在选举上每个公平易近都有1票 , 复杂的贫民数目造当作了此次抽样调查成果的庞大的误差 。
这是汗青上很是有名的抽样统计掉败的案例 , 它申明抽样调查的当作败 , 有时不在于调查数据量的几多 , 而在于是否能做到完全随机地抽取样本 。 仍是那次总统选举 , 别的有一小我盖洛普 , 他只是在大街上随机找了2万人进行调查 , 就获得了准确的成果——罗斯福将获胜 。
所以 , 即使抽样调查 , 也不克不及抓起德律风就做 , 仍是起首要考虑一下 , 获取的样本必需是一个周全的群体 。

猜你喜欢