基于卷积神经网络的说话人识别方法 |
| |
作者姓名: | 楚宪腾 王华朋 杨海涛 林暖辉 |
| |
作者单位: | 中国刑事警察学院,广州市刑事科学技术研究所 |
| |
基金项目: | 司法部司法鉴定重点实验室开放课题;国家重点研发计划;广州市科技计划项目;辽宁网络安全执法协同创新中心 |
| |
摘 要: | 为进一步提高说话人识别的准确率,提出一种新的基于卷积神经网络的说话人识别方法。利用卷积神经网络强大的处理图像能力可有效提高说话人识别的准确率。卷积神经网络相对于其他网络结构简单,训练时间较短且准确率较高。该方法首先对语音信号进行了预处理,包括重采样、分帧、加窗等操作,然后提取梅尔频率倒谱系数,之后送入卷积神经网络进行训练。通过LibriSpeech标准库和中文数据库测试表明,本算法识别率达到95%,可有效进行说话人识别。
|
关 键 词: | 卷积神经网络 说话人识别 梅尔频率倒谱系数 |
本文献已被 万方数据 等数据库收录! |
| 点击此处可从《警察技术》浏览原始摘要信息 |
|
点击此处可从《警察技术》下载全文 |
|