共查询到17条相似文献,搜索用时 136 毫秒
1.
通过介绍两起利用非语音信息最终辅助确认了说话人的司法话者识别检验案件,发现在说话人识别中,当待检语音无法满足语图比对条件时,充分利用非语音信息所揭示出的个体特性将有助于解决话者识别问题。得出了当待检语音条件不充分时,依靠非语音信息来辅助进行话者识别的方法。 相似文献
2.
为了警示近年来我国司法话者识别领域中出现的一些崇外、盲目追求快速与省事的苗头,结合话者自动识别系统的研究、应用状况,从语音的共性与个性、话者识别结果的相对性与绝对性出发,通过分析比对话者自动识别与语音识别所用的特征参数及实现过程,辨证分析了制约话者自动识别系统准确率的根本原因。指出了话者自动识别系统尚无法达到人们对其的期望,以及适合于司法诉讼领域的话者自动识别系统的发展方向。 相似文献
3.
4.
5.
6.
7.
目的探究语音情感分析系统(Layered Voice Analysis,LVA)在不同情况下的表现,并通过分析数据找出影响系统识别率的因素。方法设置两种不同场景对20名研究对象进行提问,并录音。通过LVA语音系统对语音样本进行分析,使用SPSS统计软件对系统生成的参数进行统计分析。结果在未告知研究对象实验真相的情况下LVA语音系统平均识别率为91.75%,要远高于研究对象在知情情况下的识别率。在询问过程中,当未涉及敏感问题时,随着时间的推移研究对象的心理压力逐渐减小。结论LVA语音系统具有良好的情感分析和识别能力,可为司法工作提供参考。 相似文献
8.
汉语普通话是声调语言,不同话者在基频水平和声调变化规律方面存在差异。本文利用常规软件分析不同话者的基频数据变化规律,经过归一化和多次曲线拟合后,形成具有明显形态特征的音高模式曲线。通过比对分析音高模式曲线的形态和模式参数差异,可以帮助实现话者鉴别的目的 。 相似文献
9.
Zhang Cuiling Philip Rose 《法律与医学杂志》2008,(3)
法庭话者识别技术引入我国已有二十多年,目前该技术已经广泛应用于各类刑事和民事案件中。纵观世界各国的法庭证据评价体系,除了DNA证据以外,其他证据检验鉴定结论的表述通常有三种:同一认定、否定排除和倾向性意见。简单肯定和否定的结论存在很大的弊端,即过高估计了证据的力度,因而有时可能会造成错案。鉴于此,国外一些学者提出在鉴定结论的表述和价值评判上引入基于贝叶斯理论的"似然率"方法。本文结合目前的法庭话者鉴别方法,重点介绍基于贝叶斯理论下的"似然率"理论体系,并阐明该方法的优越性、局限性以及一些亟待解决的问题。 相似文献
10.
基于似然率方法的语音证据评价 总被引:2,自引:0,他引:2
法庭话者识别技术引入我国已有二十多年,目前该技术已经广泛应用于各类刑事和民事案件中,纵观世界各国的法庭证据评价体系,除了DNA证据以外,其他证据检验鉴定结论的表述通常有三种:同一认定、否定排除和倾向性意见。简单肯定和否定的结论存在很大的弊端.即过高估计了证据的力度,因而有时可能会造成错案。鉴于此,国外一些学者提出在鉴定结论的表述和价值评判上引入基于贝叶斯理论的“似然率”方法。本文结合目前的法庭话者鉴别方法。重点介绍基于贝叶斯理论下的“似然率”理论体系.并阐明该方法的优越性、局限性以及一些亟待解决的问题。 相似文献
11.
In this paper a newly developed Forensic Automatic Speaker Recognition System (FASRS) was introduced and the effect of 10 types of voice disguises that are common in forensic casework on the performance of this system was studied. In this study 10 types of disguised voices and normal voices from 20 male college students were used as test samples. Each disguised voice was compared with all normal voices in the database to make speaker identification and speaker verification. The result of speaker recognition is summarized and the influence of voice disguises on the FASRS is evaluated. 相似文献
12.
本文对法庭语音学进行了研究综述,主要介绍了该学科的核心内容:说话人鉴定。在实际办案中,当未找到嫌疑人,只有犯罪分子的检材语音时,可以使用说话人画像/说话人分类技术。若没有犯罪分子的录音证据时,可以让受害人和证人进行说话人的听觉辨认。具体的辨认形式有两种:对熟人辨认和对陌生人辨认,在对陌生人辨认时可以采用语音辨认的方法进行。当检材语音和样本语音都齐备的时候,法庭语音分析专家就可以对二者进行比对检验了。目前语音比对分析涉及到的问题和领域有:基于贝叶斯方法的法庭推理和似然比计算、共振峰频率的测量应用、非解析感知与样例理论、法庭说话人自动识别以及不同方法的综合应用等。 相似文献
13.
本文对法庭语音学进行了研究综述,主要介绍了该学科的核心内容:说话人鉴定。在实际办案中,当未找到嫌疑人,只有犯罪分子的检材语音时,可以使用说话人画像/说话人分类技术。若没有犯罪分子的录音证据时,可以让受害人和证人进行说话人的听觉辨认。具体的辨认形式有两种:对熟人辨认和对陌生人辨认,在对陌生人辨认时可以采用语音辨认的方法进行。当检材语音和样本语音都齐备的时候,法庭语音分析专家就可以对二者进行比对检验了。目前语音比对分析涉及到的问题和领域有:基于贝叶斯方法的法庭推理和似然比计算、共振峰频率的测量应用、非解析感知与样例理论、法庭说话人自动识别以及不同方法的综合应用等。 相似文献
14.
本文针对目前国内外讨论比较热烈的声纹鉴定意见表述问题进行了评述.首先介绍了实践中正在使用的听觉分析法、声谱比对分析法、声学分析法、听觉-声学分析法和说话人自动识别五种鉴定方法,指出了各种方法的优缺点;然后对现存的二元判决、可能性等级、似然比和英国立场声明四种鉴定意见表述形式进行了介绍和评析,通过分析发现,上述四种意见表述形式都存在一定的问题,实践中选择何种形式表述鉴定意见要综合考虑其科学性、逻辑性、现实性和可行性等多种价值选项;最后认为解决该问题的根本方法是各相关领域的专家应加强在鉴定方法上的合作性的基础研究. 相似文献
15.
16.
In forensic voice comparison, deep learning has become widely popular recently. It is mainly used to learn speaker representations, called embeddings or embedding vectors. Speaker embeddings are often trained using corpora mostly containing widely spoken languages. Thus, language dependency is an important factor in automatic forensic voice comparison, especially when the target language is linguistically very different from that the model is trained on. In the case of a low-resource language, developing a corpus for forensic purposes containing enough speakers to train deep learning models is costly. This study aims to investigate whether a model pre-trained on multilingual (mostly English) corpus can be used on a target low-resource language (here, Hungarian), not represented by the model. Often multiple samples are not available from the offender (unknown speaker). Samples are therefore compared pairwise with and without speaker enrollment for suspect (known) speakers. Two corpora are used that were developed especially for forensic purposes and a third that is meant for traditional speaker verification. Speaker embedding vectors are extracted by the x-vector and ECAPA-TDNN techniques. Speaker verification was evaluated in the likelihood-ratio framework. A comparison is made between the language combinations (modeling, LR calibration, and evaluation). The results were evaluated by Cllrmin and EER metrics. It was found that the model pre-trained on a different language but on a corpus with a significant number of speakers can be used on samples with language mismatch. Sample duration and speaking style also seem to affect the performance. 相似文献