基于GRU-Glove算法的文本分类方法 |
| |
引用本文: | 阿音嘎,顾悦.基于GRU-Glove算法的文本分类方法[J].警察技术,2022(5):49-53. |
| |
作者姓名: | 阿音嘎 顾悦 |
| |
作者单位: | 公安部第一研究所 |
| |
摘 要: | 利用自然语言处理技术分析案情信息已成为公安部门打击网络犯罪的重要手段之一。在使用自然语言处理技术办理网络犯罪案件过程中,采用文本分类方法对相关案情信息进行筛选和归类处理,是案件处置流程中的重要环节。但随着各类网络新词与日俱增,现有文本分类方法中的分词手段无法及时对新型词汇进行正确分词处理,导致此类方法对含新型词汇文本分类效率较低,为公安部门实时分析案情信息工作、打击网络犯罪带来了一定的挑战。对此,提出了一种基于GRU-Glove算法的文本分类方法。首先,基于门控循环单元神经网络(GRU)的长序列建模优势,在文本信息分词阶段,利用GRU对文本信息进行中文分词,提高了复杂文本信息分词质量;其次,引入全局向量模型(Glove)建立GRU-Glove算法,对GRU的分词结果进行修正,进一步提升了对含有新型词汇复杂文本的分词质量;最后,利用GRU-Glove算法和GRU网络构建文本分类方法,并在文本分词和文本分类任务上进行实验。实验结果表明,该方法能够对含有新型词汇的复杂案情信息进行有效分类,有效提高网络犯罪案件研判效率。
|
关 键 词: | 自然语言处理技术 文本分类方法 网络犯罪 门控循环单元神经网络 全局向量模型 |
|
|