对青年的计算文本“远读”——数字时代基于降维的整体认识论 |
| |
引用本文: | 梁玉成,马昱堃.对青年的计算文本“远读”——数字时代基于降维的整体认识论[J].青年探索,2022(3):20-34. |
| |
作者姓名: | 梁玉成 马昱堃 |
| |
作者单位: | 中山大学社会学与人类学学院 |
| |
基金项目: | 国家社会科学基金重大项目“基于大型调查数据基础上中国城镇社区结构异质性及其基层治理研究”(项目编号:15ZDB172)的阶段性成果; |
| |
摘 要: | 社会数字化转型过程中,越来越多的青年通过互联网社交媒体发表观点、表达情感、与他人建立社会关系,这使得青年的活动场域与交往形式发生了根本转型,靠传统的青年研究方法难以从宏观视角分析青年群体的行动与观念演化。本文引申数字人文中的“远读”概念,提出对青年的计算文本分析研究范式。本文将文本的信息分为词义、词性、关系和情境,并简要介绍了量化这些信息的分析方法,将这些方法的应用路径分为编码与分类、情感分析、降维分析、主题抽取、分化与极化以及文化测量,它们与青年研究领域还有很大的结合空间。通过“远读”计算中的降维思想,研究者能从整体视角找出大量文本之间的潜在结构,进而获得对青年的“整体事实”的理解。在这一范式的应用中,需要注意文本数据代表性、分析方法适用性以及数据收集的伦理问题,而纳入音视频及图像的“富文本”分析会是将来社会科学研究的发展方向。“远读”与“近读”相结合能够促进我们对青年群体的理解。
|
关 键 词: | 青年研究 文本分析 远读 整体事实 计算社会学 |
|