【高考特辑】2014年高考作文预测靠谱吗?

很多中学老师认为高考题目是可以预测的 , 他们声称自己能感觉到出题的趋势 , 并且在考前帮着学生押题 。 我上学的时候总觉得押题是个不靠谱的事 , 难道出题的人没有自由意志吗?事实是 , 我们都没有自由意志 。

【高考特辑】2014年高考作文预测靠谱吗?



百度最近出了个新东西 , “百度预测” , 目前提供针对世界杯、城市、景点和高考四大项目的预测 。
【高考特辑】2014年高考作文预测靠谱吗?



尤其在高考方面 , 百度通过数据分析认为[1]2014年高考作文题目将会出现在“时间的馈赠”、“生命的多彩”等六个领域之中 , 并且给出了各领域命中的精确概率 。 直接告诉你高考作文题是什么当然不可能 , 但是有了这个范围 , 学生们需要准备的话题就从无限多变成有限多了 。 百度说这个预测是“基于海量作文范文和搜索数据” 。 各领域下列举的作文题目关键词 , 比如“时间的馈赠”中的关键词包括“记忆”、“未来”、“成长”、“忘记”等 , 都是中学生作文的常用词 。
【高考特辑】2014年高考作文预测靠谱吗?



也就是说 , 百度用数据分析预测出来的高考作文题 , 都是最常见的作文题 , 都是俗套 。 换句话说 , 用数据分析搞预测的隐含假设是未来事件会继续落入最近流行的俗套 。
可是高考出题的人有必要尊重俗套吗?难道出《让未来记住今天》或者《守住心灵的那扇门》这种俗不可耐的题目不是可耻的吗?在回答这个问题之前我们先研究一个更大的问题:到底什么样的东西是可预测的 , 什么样的东西是不可预测的 。
最近几年美国出了一位预测牛人 , Nate Silver 。 美国人很喜欢体育数据 , 有些棒球杂志上更是连篇累牍全是各种细致的数据 。 Silver基于统计模型 , 自己搞了个软件来通过分析职业棒球的数据去预测各个球员未来的表现 。 结果他的预测结果超越了所有最有经验的球探 。 不但如此 , 他的政治预测成绩更令人瞠目结舌 。 2008年大选 , 对各州总统选举结果 , 50个州Silver预测对了49个;对35个参议员席位 , Silver全部命中 。 更关键的是 , 他的预测跟政治专家的预测相差极大——事实证明听专家的远远不如听数据分析的 。 Silver 2012年出了本书 , The Signal and the Noise(《信号与噪声》) , 谈预测的学问 。
Silver在书里说 , 你别看我预测水平高 , 其实我预测的东西是容易预测的 。 比如说棒球 , 我们都知道这个比赛相当沉闷外行看着感觉一点都不热闹 。 棒球的特点恰恰是运动员具有相当的独立性 。 一个球员的水平是什么样就是什么样 , 他对球队的贡献非常稳定 , 并不怎么依赖队友的发挥和对手的表现 , 场上的随机因素也比较少 。 相对而言足球就不是这样 , 一个球员水平再高也得依赖队友、教练和对手 , 甚至包括裁判 , 有时候一着不慎满盘皆输 。
关键在于 , 像棒球这样的简单系统 , 里面没有连锁反应 。 我们都听过一个笑话说拿破仑之所以在滑铁卢战败是因为他穿了紧身裤 。 紧身裤导致拿破仑得了痔疮 。 痔疮导致他在战斗的关键时刻未能居中指挥……这就是连锁反应 。 连锁反应通常是正反馈的过程 , 每一环带来的破坏都可能比上一环更大 , 而且都可能直接激发下一环 。 对预测者来说更麻烦的是这种反应充满偶然 , 大多数情况下反应不了几环就会终止 , 有时候却可能导致大麻烦 。
简单的系统容易预测 , 因为一个个体哪怕出点预测范围以外的波动 , 对整个系统也不会有大影响 。 而如果一个系统中包含各种正反馈机制 , 它就是不好预测的复杂系统 , 一个个体的小波动就有可能通过连锁反应层层放大出现蝴蝶效应 。 比如现代金融体制就是一个复杂系统 。 地产下跌可能会导致人们还不起房贷 , 房贷还不上会导致银行受不了 , 银行一收紧信贷其它行业又受不了 , 最后可能就是大规模的金融危机 。 Silver说 , 那些信用评级机构 , 给这个评个AAA , 给那个评个AA+ , 这些所谓评级都是根据市场“正常”情况下的数据分析而来 , 可是一旦发生连锁反应 , 市场就不正常了 , 你的那些数据就根本没用!复杂系统 , 是可能出“黑天鹅”的系统 。

猜你喜欢