摘 要: | 大数据的出现给国际政治预测带来了新的希望,但大数据并非无所不能。其成功预测的前提是事件具备起码的稳定性和连续性。作为一个过程,大数据预测大致包括数据准备、分析建模和模型应用与反馈三个阶段。数据准备主要由数据获取和数据预处理两个环节组成。对于数据获取而言,研究者既面临着出于保护个人隐私和国家安全的需要所施加的规范约束,又要努力克服数据资源的结构性缺陷所造成的现实约束。数据预处理则涉及通过数据挖掘技术从原始数据中提取特定数据的特征工程和旨在提高信噪比的数据降噪。在分析建模阶段,研究者设置的算法和模型会显著地影响到预测的效果。在模型应用和反馈阶段,研究者首先使用模型进行预测,然后根据预测结果来检验、评估和调试模型,其中事件背景条件和对象运行轨迹的变化是影响预测准确度的重要因素。从经验上看,上述诸条件满足得越多,预测准确率越高。本文按照大数据预测的工作流程,归纳并分析了国际政治事件预测实践中各个环节所面临的约束条件。文章创新之处在于较为深入地探讨了因果关系在大数据预测中的作用:它不仅是建模的基础,而且深刻地影响到预测的整个过程。
|