CN113707148A - 语音识别准确率的确定方法、装置、设备以及介质 - Google Patents

语音识别准确率的确定方法、装置、设备以及介质 Download PDF

Info

Publication number
CN113707148A
CN113707148A CN202110905043.4A CN202110905043A CN113707148A CN 113707148 A CN113707148 A CN 113707148A CN 202110905043 A CN202110905043 A CN 202110905043A CN 113707148 A CN113707148 A CN 113707148A
Authority
CN
China
Prior art keywords
text
similarity
voice text
determining
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110905043.4A
Other languages
English (en)
Other versions
CN113707148B (zh
Inventor
吕言言
周叶林
白翠琴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
China Mobile Hangzhou Information Technology Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
China Mobile Hangzhou Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd, China Mobile Hangzhou Information Technology Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN202110905043.4A priority Critical patent/CN113707148B/zh
Publication of CN113707148A publication Critical patent/CN113707148A/zh
Application granted granted Critical
Publication of CN113707148B publication Critical patent/CN113707148B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/01Assessment or evaluation of speech recognition systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种语音识别准确率的确定方法、装置、设备以及计算机可读存储介质,所述方法包括:获取对语音信号进行语音识别得到的目标语音文本;确定所述目标语音文本与所述语音信号的预设参考语音文本的第一相似度,所述第一相似度由所述目标语音文本的每一行字符串与所述参考语音文本的每一行字符串相似度得到;确定所述目标语音文本与所述参考语音文本的第二相似度,所述第二相似度由所述目标语音文本的分词与所述参考语音文本的分词的相似度得到;根据所述第一相似度以及所述第二相似度确定所述目标语音文本的识别准确率。本发明准确确定了语音识别的准确率。

Description

语音识别准确率的确定方法、装置、设备以及介质
技术领域
本发明涉及计算机技术领域,尤其涉及一种语音识别准确率的确定方法、装置、设备以及计算机可读存储介质。
背景技术
随着信息化建设全面开展,人工智能越来越受到了全社会的普遍关注,其中,语音识别技术得到快速发展,语音识别是人机交互的入口,与生活关联比较密切的语音识别技术的应用也越来越多,比如智能音箱、手机等各种智能设备。然而,语音识别可能存在不准确的情况,现有技术中,通过识别文本中关键词相同的频率来判断当前文本与标准文本的相似度,进而确定语音识别的准确度,但是该方法不能正确理解词的语音语义信息,导致同音词同义词的识别错误,使得准确度的判断不准确。
发明内容
本发明的主要目的在于提供一种语音识别准确率的确定方法、装置、设备以及计算机可读存储介质,旨在解决语音识别准确度判断不准确的问题。
为实现上述目的,本发明提供的一种语音识别准确率的确定方法,所述语音识别准确率的确定方法包括以下步骤:
获取对语音信号进行语音识别得到的目标语音文本;
确定所述目标语音文本与所述语音信号的预设参考语音文本的第一相似度,所述第一相似度由所述目标语音文本的每一行字符串与所述参考语音文本的每一行字符串相似度得到;
确定所述目标语音文本与所述参考语音文本的第二相似度,所述第二相似度由所述目标语音文本的分词与所述参考语音文本的分词的相似度得到;
根据所述第一相似度以及所述第二相似度确定所述目标语音文本的识别准确率。
在一实施例中,所述确定所述目标语音文本与与所述语音信号的预设参考语音文本的第一相似度的步骤之前,还包括:
根据所述目标语音文本得到第一语音文本,当所述目标语音文本区分人物角色时,所述第一语音文本包括划分人物角色并去除标点的目标语音文本,去除人物角色和标点的目标语音文本,以及去除人物角色和标点并将文字转换为拼音的目标语音文本,当所述目标语音文本未区分人物角色时,所述第一语音文本包括仅去除标点的目标语音文本,以及仅去除标点的语音文本并将文字转换为拼音的目标语音文本;
根据预设参考语音文本得到第二语音文本,当所述参考语音文本区分人物角色时,所述第二语音文本包括划分人物角色并去除标点的参考语音文本,去除人物角色和标点的参考语音文本,以及去除人物角色和标点并将文字转换为拼音的参考语音文本,当所述参考语音文本未区分人物角色时,所述第二语音文本包括仅去除标点的参考语音文本以及仅去除标点的语音文本并将文字转换为拼音的参考语音文本;
所述确定所述目标语音文本与所述语音信号的预设参考语音文本的第一相似度的步骤包括:
确定所述第一语音文本与所述第二语音文本的第一相似度;
所述确定所述目标语音文本与所述参考语音文本的第二相似度的步骤包括:
确定所述第一语音文本与所述第二语音文本的第二相似度。
在一实施例中,所述确定所述第一语音文本与所述第二语音文本的第一相似度的步骤包括:
在所述第二语音文本中确定所述第一语音文本中的各个语音文本对应的语音文本;
分别确定所述第一语音文本中的各个语音文本与对应的第二语音文本中的各个语音文本的相似度;
对各个所述相似度进行加权平均以得到所述第一相似度。
在一实施例中,所述分别确定所述第一语音文本中的各个语音文本与对应的第二语音文本中的各个语音文本的相似度的步骤包括:
确定所述第一语音文本中的语音文本的每一行字符串与对应的所述第二语音文本的语音文本的每一行字符串的相似值;
在所述相似值大于预设阈值时,将所述相似值作为所述第一语音文本中的语音文本对应的行的相似值,并停止确定所述相似值;
在所述相似值小于或者等于预设阈值时,确定所述第一语音文本中的语音文本对应的行的字符串与对应的所述第二语音文本中的语音文本的下一行字符串的相似值,若所述第一语音文本中的语音文本对应的行的字符串与对应的所述第二语音文本的语音文本的每一行的相似值均小于或者等于预设阈值,则确定所述第一语音文本中的语音文本对应的行的下一行字符串与对应的所述第二语音文本中的语音文本的每一行字符串的相似值,直至所述第一语音文本的所有字符串均已确定相似值,根据每行字符串对应的相似值确定所述第一语音文本中的语音文本与所述第二语音文本的语音文本的相似度。
在一实施例中,所述确定所述第一语音文本中的语音文本的每一行字符串与对应的所述第二语音文本的语音文本的每一行字符串的相似值的步骤包括:
根据预设算法确定所述第一语音文本中的语音文本的每一行字符串与对应的所述第二语音文本中的语音文本的每一行字符串中的相似字符串,确定最长的相似字符串的数量;
确定第一语音文本中的语音文本的每一行字符串与对应的所述第二语音文本中的语音文本的每一行字符串中最长字符串的字符串长度;
确定第一语音文本中的语音文本的每一行字符串的行数与对应的所述第二语音文本中的语音文本的每一行字符串的行数的行数最小值;
根据所述最长的相似字符串的数量、所述最长字符串的字符串长度以及所述行数最小值确定所述相似值。
在一实施例中,所述确定所述第一语音文本与所述第二语音文本的第二相似度的步骤包括:
将所述第一语音文本分为多个第一分词,以及将所述第二语音文本分为多个第二分词;
分别确定所述第一分词以及所述第二分词的哈希值;
根据所述哈希值确定所述第一分词以及所述第二分词的海明距离;
根据所述海明距离确定所述第一语音文本与第二语音文本的所述第二相似度。
在一实施例中,所述根据所述第一相似度以及所述第二相似度确定所述目标语音文本的准确率的步骤包括:
根据所述目标语音文本的文本行数以及字符串平均字数确定所述第二相似度的权重值,所述字符串平均字数为所述目标语音文本中各行字符串的字数的平均值;
根据所述第二相似度的权重值确定所述第一相似度的权重值;
根据所述第一相似度、所述第二相似度以及对应的所述权重值确定所述目标语音文本的准确率。
为实现上述目的,本发明还提供一种语音识别准确率的确定装置,所述语音识别准确率的确定装置包括:
获取模块,用于获取对语音信号进行语音识别得到的目标语音文本;
第一确定模块,用于确定所述目标语音文本与所述语音信号的预设参考语音文本的第一相似度,所述第一相似度由所述目标语音文本的每一行字符串与所述参考语音文本的每一行字符串相似度得到;
第二确定模块,用于确定所述目标语音文本与所述参考语音文本的第二相似度,所述第二相似度由所述目标语音文本的分词与所述参考语音文本的分词的相似度得到;
计算模块,用于根据所述第一相似度以及所述第二相似度确定所述目标语音文本的识别准确率。
为实现上述目的,本发明还提供一种语音识别准确率的确定设备,所述语音识别准确率的确定设备包括存储器、处理器以及存储在所述存储器并可在所述处理器上执行的语音识别准确率的确定程序,所述语音识别准确率的确定程序被所述处理器执行时实现如上所述的语音识别准确率的确定方法的各个步骤。
为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质存储有语音识别准确率的确定程序,所述语音识别准确率的确定程序被处理器执行时实现如上所述的语音识别准确率的确定方法的各个步骤。
本发明提供的一种语音识别准确率的确定方法、装置、设备以及计算机可读存储介质,获取对语音信号进行语音识别得到的目标语音文本,确定目标语音文本与语音信号的预设参考语音文本的第一相似度,确定目标语音文本与参考语音文本的第二相似度,根据第一相似度以及第二相似度确定目标语音文本的识别准确率。通过确定目标语音文本与参考语音文本之间的第一相似度以及第二相似度,根据第一相似度和第二相似度准确计算出目标语音文本与参考语音文本的相似度,准确确定了语音识别的识别准确率。
附图说明
图1为本发明实施例涉及的语音识别准确率的确定设备的硬件结构示意图;
图2为本发明语音识别准确率的确定方法的第一实施例的流程示意图;
图3为本发明语音识别准确率的确定方法的第二实施例的流程示意图;
图4为本发明语音识别准确率的确定方法的第三实施例的步骤S21的细化流程示意图;
图5为本发明语音识别准确率的确定方法的第四实施例的步骤S31的细化流程示意图;
图6为本发明语音识别准确率的确定装置的逻辑结构示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明实施例的主要解决方案是:获取对语音信号进行语音识别得到的目标语音文本,确定目标语音文本与语音信号的预设参考语音文本的第一相似度,确定目标语音文本与参考语音文本的第二相似度,根据第一相似度以及第二相似度确定目标语音文本的识别准确率。
通过确定目标语音文本与参考语音文本之间的第一相似度以及第二相似度,根据第一相似度和第二相似度准确计算出目标语音文本与参考语音文本的相似度,准确确定了语音识别的识别准确率。
作为一种实现方案,语音识别准确率的确定设备可以如图1所示。
本发明实施例方案涉及的是语音识别准确率的确定设备,语音识别准确率的确定设备包括:处理器101,例如CPU,存储器102,通信总线103。其中,通信总线103用于实现这些组件之间的连接通信。
存储器102可以是高速RAM存储器,也可以是稳定的存储器(non-volatilememory),例如磁盘存储器。如图1所示,作为一种计算机可读存储介质的存储器102中可以包括语音识别准确率的确定程序;而处理器101可以用于调用存储器102中存储的语音识别准确率的确定程序,并执行以下操作:
获取对语音信号进行语音识别得到的目标语音文本;
确定所述目标语音文本与所述语音信号的预设参考语音文本的第一相似度,所述第一相似度由所述目标语音文本的每一行字符串与所述参考语音文本的每一行字符串相似度得到;
确定所述目标语音文本与所述参考语音文本的第二相似度,所述第二相似度由所述目标语音文本的分词与所述参考语音文本的分词的相似度得到;
根据所述第一相似度以及所述第二相似度确定所述目标语音文本的识别准确率。
在一实施例中,处理器101可以用于调用存储器102中存储的语音识别准确率的确定程序,并执行以下操作:
根据所述目标语音文本得到第一语音文本,当所述目标语音文本区分人物角色时,所述第一语音文本包括划分人物角色并去除标点的目标语音文本,去除人物角色和标点的目标语音文本,以及去除人物角色和标点并将文字转换为拼音的目标语音文本,当所述目标语音文本未区分人物角色时,所述第一语音文本包括仅去除标点的目标语音文本,以及仅去除标点的语音文本并将文字转换为拼音的目标语音文本;
根据预设参考语音文本得到第二语音文本,当所述参考语音文本区分人物角色时,所述第二语音文本包括划分人物角色并去除标点的参考语音文本,去除人物角色和标点的参考语音文本,以及去除人物角色和标点并将文字转换为拼音的参考语音文本,当所述参考语音文本未区分人物角色时,所述第二语音文本包括仅去除标点的参考语音文本以及仅去除标点的语音文本并将文字转换为拼音的参考语音文本;
确定所述第一语音文本与所述第二语音文本的第一相似度;
确定所述第一语音文本与所述第二语音文本的第二相似度。
在一实施例中,处理器101可以用于调用存储器102中存储的语音识别准确率的确定程序,并执行以下操作:
在所述第二语音文本中确定所述第一语音文本中的各个语音文本对应的语音文本;
分别确定所述第一语音文本中的各个语音文本与对应的第二语音文本中的各个语音文本的相似度;
对各个所述相似度进行加权平均以得到所述第一相似度。
在一实施例中,处理器101可以用于调用存储器102中存储的语音识别准确率的确定程序,并执行以下操作:
确定所述第一语音文本中的语音文本的每一行字符串与对应的所述第二语音文本的语音文本的每一行字符串的相似值;
在所述相似值大于预设阈值时,将所述相似值作为所述第一语音文本中的语音文本对应的行的相似值,并停止确定所述相似值;
在所述相似值小于或者等于预设阈值时,确定所述第一语音文本中的语音文本对应的行的字符串与对应的所述第二语音文本中的语音文本的下一行字符串的相似值,若所述第一语音文本中的语音文本对应的行的字符串与对应的所述第二语音文本的语音文本的每一行的相似值均小于或者等于预设阈值,则确定所述第一语音文本中的语音文本对应的行的下一行字符串与对应的所述第二语音文本中的语音文本的每一行字符串的相似值,直至所述第一语音文本的所有字符串均已确定相似值,根据每行字符串对应的相似值确定所述第一语音文本中的语音文本与所述第二语音文本的语音文本的相似度。
在一实施例中,处理器101可以用于调用存储器102中存储的语音识别准确率的确定程序,并执行以下操作:
根据预设算法确定所述第一语音文本中的语音文本的每一行字符串与对应的所述第二语音文本中的语音文本的每一行字符串中的相似字符串,确定最长的相似字符串的数量;
确定第一语音文本中的语音文本的每一行字符串与对应的所述第二语音文本中的语音文本的每一行字符串中最长字符串的字符串长度;
确定第一语音文本中的语音文本的每一行字符串的行数与对应的所述第二语音文本中的语音文本的每一行字符串的行数的行数最小值;
根据所述最长的相似字符串的数量、所述最长字符串的字符串长度以及所述行数最小值确定所述相似值。
在一实施例中,处理器101可以用于调用存储器102中存储的语音识别准确率的确定程序,并执行以下操作:
将所述第一语音文本分为多个第一分词,以及将所述第二语音文本分为多个第二分词;
分别确定所述第一分词以及所述第二分词的哈希值;
根据所述哈希值确定所述第一分词以及所述第二分词的海明距离;
根据所述海明距离确定所述第一语音文本与第二语音文本的所述第二相似度。
在一实施例中,处理器101可以用于调用存储器102中存储的语音识别准确率的确定程序,并执行以下操作:
根据所述目标语音文本的文本行数以及字符串平均字数确定所述第二相似度的权重值,所述字符串平均字数为所述目标语音文本中各行字符串的字数的平均值;
根据所述第二相似度的权重值确定所述第一相似度的权重值;
根据所述第一相似度、所述第二相似度以及对应的所述权重值确定所述目标语音文本的准确率。
基于上述语音识别准确率的确定设备的硬件构架,提出本发明语音识别准确率的确定方法的实施例。
参照图2,图2为本发明语音识别准确率的确定方法的第一实施例,所述语音识别准确率的确定方法包括以下步骤:
步骤S10,获取对语音信号进行语音识别得到的目标语音文本。
具体的,目标语音样本是通过语音识别设备对语音信号进行语音识别得到的文字文本,目标语音样本可以是分角色的语音文本,例如客服与用户的对话语音的语音文本,也可以是不分角色的语音文本,例如诗歌或散文等语音文本。
步骤S20,确定所述目标语音文本与所述语音信号的预设参考语音文本的第一相似度,所述第一相似度由所述目标语音文本的每一行字符串与所述参考语音文本的每一行字符串相似度得到。
具体的,预设参考语音文本为语音信号对应的答案文本,示例性的,语音信号的预设参考语音文本为“今天的天气真好啊”,而对语音信号进行语音识别得到的目标语音文本可能是“今天天气好”。确定目标语音文本与语音信号的预设参考语音文本的第一相似度,第一相似度由目标语音文本的每一行字符串与参考语音文本的每一行字符串相似度得到。
步骤S30,确定所述目标语音文本与所述参考语音文本的第二相似度,所述第二相似度由所述目标语音文本的分词与所述参考语音文本的分词的相似度得到。
具体的,确定目标语音文本与参考语音文本的第二相似度,第二相似度由目标语音文本的分词与参考语音文本的分词的相似度得到。
步骤S40,根据所述第一相似度以及所述第二相似度确定所述目标语音文本的识别准确率。
具体的,根据第一相似度以及第二相似度确定目标语音文本的识别准确率。可以是根据第一相似度以及第二相似度的和值确定目标语音文本的识别准确率,也可以是根据第一相似度以及第二相似度的加权平均值确定目标语音文本的识别准确率。
根据目标语音文本的文本行数以及字符串平均字数确定第二相似度的权重值,其中,字符串平均字数为目标语音文本中各行字符串的字数的平均值,如下公式所示:
Figure BDA0003198887810000101
其中,λ为第二相似度的权重值,μ表示目标语音文本的文本行数,ν表示目标语音文本中各行字符串的字数的平均值。示例性的,a可以为0.2,b可以为0.8。
根据第二相似度的权重值确定第一相似度的权重值,如下公式所示:
ω=1-λ;
根据第一相似度、第二相似度以及对应的权重值确定目标语音文本的准确率,如下公式所示:
similarDegree=ω×similarLCS+λ×similarHash;
其中,similarDegree为目标语音文本的准确率,similarLCS为第一相似度,ω为第一相似度的权重值,similarHash为第二相似度,λ为第二相似度的权重值。
在本实施例的技术方案中,获取对语音信号进行语音识别得到的目标语音文本,确定目标语音文本与语音信号的预设参考语音文本的第一相似度,确定目标语音文本与参考语音文本的第二相似度,根据第一相似度以及第二相似度确定目标语音文本的识别准确率。通过确定目标语音文本与参考语音文本之间的第一相似度以及第二相似度,根据第一相似度和第二相似度准确计算出目标语音文本与参考语音文本的相似度,准确确定了目标语音文本的识别准确率。
参照图3,图3为本发明语音识别准确率的确定方法的第二实施例,基于第一实施例,所述步骤S20之前,还包括:
步骤S50,根据所述目标语音文本得到第一语音文本,当所述目标语音文本区分人物角色时,所述第一语音文本包括划分人物角色并去除标点的目标语音文本,去除人物角色和标点的目标语音文本,以及去除人物角色和标点并将文字转换为拼音的目标语音文本,当所述目标语音文本未区分人物角色时,所述第一语音文本包括仅去除标点的目标语音文本,以及仅去除标点的语音文本并将文字转换为拼音的目标语音文本;
步骤S60,根据预设参考语音文本得到第二语音文本,当所述参考语音文本区分人物角色时,所述第二语音文本包括划分人物角色并去除标点的参考语音文本,去除人物角色和标点的参考语音文本,以及去除人物角色和标点并将文字转换为拼音的参考语音文本,当所述参考语音文本未区分人物角色时,所述第二语音文本包括仅去除标点的参考语音文本以及仅去除标点的语音文本并将文字转换为拼音的参考语音文本;
所述步骤S20包括:步骤S21,确定所述第一语音文本与所述第二语音文本的第一相似度;
所述步骤S30包括:步骤S31,确定所述第一语音文本与所述第二语音文本的第二相似度。
具体的,根据目标语音文本得到第一语音文本,当目标语音文本区分人物角色时,示例性的,目标语音文本为“用户:退订会员,客服:退订方式如下”,划分人物角色并去除标点的目标语音文本为“用户退订会员客服退订方式如下”;去除人物角色和标点的目标语音文本为“退订会员退订方式如下”;去除人物角色和标点并将文字转换为拼音的目标语音文本为“tuidinghuiyuantuidingfangshiruxia”。
当目标语音文本未区分人物角色时,示例性的,如小说或者诗歌等文本,目标语音文本为“晓看天色,暮看云”,仅去除标点的目标语音文本为“晓看天色暮看云”;仅去除标点的语音文本并将文字转换为拼音的目标语音文本为“xiaokantiansemukanyun”。
根据预设参考语音文本得到第二语音文本,当参考语音文本区分人物角色时,示例性的,参考语音文本为“用户:订阅会员,客服:订阅方式如下”,划分人物角色并去除标点的参考语音文本为“用户订阅会员客服订阅方式如下”;去除人物角色和标点的参考语音文本为“订阅会员订阅方式如下”;去除人物角色和标点并将文字转换为拼音的参考语音文本为“dingyuehuiyuandingyuefangshiruxia”。
当参考语音文本未区分人物角色时,示例性的,如小说或者诗歌等文本,参考语音文本为“桃之夭夭,灼灼其华”,仅去除标点的参考语音文本为“桃之夭夭灼灼其华”;仅去除标点的语音文本并将文字转换为拼音的参考语音文本为“taozhiyaoyaozhuozhuoqihua”。
确定第一语音文本的各个语音文本与对应的第二语音文本各个语音文本的第一相似度,确定第一语音文本的各个语音文本与第二语音文本的各个语音文本的第二相似度。
在本实施例的技术方案中,获取对语音信号进行语音识别得到的目标语音文本,根据目标语音文本得到第一语音文本,根据预设参考语音文本得到第二语音文本,确定所述第一语音文本与所述第二语音文本的第一相似度,确定所述第一语音文本与所述第二语音文本的第二相似度,根据第一相似度以及第二相似度确定目标语音文本的识别准确率。通过对目标语音文本以及参考语音文本的预处理,考虑了不同的人物角色或者不同的语言环境,准确确定了目标语音文本的识别准确率。
参照图4,图4为本发明语音识别准确率的确定方法的第三实施例,基于第二实施例,所述步骤S21包括:
步骤S211,在所述第二语音文本中确定所述第一语音文本中的各个语音文本对应的语音文本;
步骤S212,分别确定所述第一语音文本中的各个语音文本与对应的第二语音文本中的各个语音文本的相似度;
步骤S213,对各个所述相似度进行加权平均以得到所述第一相似度。
具体的,在第二语音文本中确定第一语音文本中的各个语音文本对应的语音文本,示例性的,第一语音文本中的划分人物角色并去除标点的目标语音文本,对应的是第二语音文本中划分人物角色并去除标点的参考语音文本;第一语音文本中的去除人物角色和标点的目标语音文本,对应的是第二语音文本为去除人物角色和标点的参考语音文本。
分别确定所述第一语音文本中的各个语音文本与对应的第二语音文本中的各个语音文本的相似度,可以是对第一语音文本各个语音文本以及对应的第二语音文本中的各个语音文本逐行进行相似度的计算,最后将每行相似度的平均值作为第一语音文本的各个语音文本与对应的第二语音文本中的各个语音文本的相似度。
对各个相似度进行加权平均以得到第一相似度,当所述目标语音文本区分人物角色时,第一语音文本中的划分人物角色并去除标点的目标语音文本与第二语音文本中划分人物角色并去除标点的参考语音文本的第一相似度值为similarLCSA,第一语音文本中的去除人物角色和标点的目标语音文本与第二语音文本中的去除人物角色和标点的参考语音文本的第一相似度为similarLCSB,以及第一语音文本中的去除人物角色和标点并将文字转换为拼音的目标语音文本与第二语音文本中的去除人物角色和标点并将文字转换为拼音的参考语音文本的第一相似度为similarLCSC,第一语音文本与第二语音文本的第一相似度如下公式所示:
similarLCS=ε*similarLCSA+δ*similarLCSB+η*similarLCSC
其中,similarLCS为第一语音文本与第二语音文本的第一相似度,ε、δ以及η为第一语音文本中的语音文本与对应的第二语音文本中的语音文本的权重值。示例性的,ε=0.3,δ=0.4,η=0.3。
对各个相似度进行加权平均以得到第一相似度,当所述目标语音文本未区分人物角色时,第一语音文本中的仅去除标点的目标语音文本与第二语音文本中仅去除标点的参考语音文本的第一相似度值为similarLCSD,第一语音文本中的仅去除标点的语音文本并将文字转换为拼音的目标语音文本与第二语音文本中的仅去除标点的语音文本并将文字转换为拼音的参考语音文本的第一相似度为similarLCSE,第一语音文本与第二语音文本的第一相似度如下公式所示:
similarLCS=ε*similarLCSD+δ*similarLCSE
其中,similarLCS为第一语音文本与第二语音文本的第一相似度,ε和δ以为第一语音文本中的语音文本与对应的第二语音文本中的语音文本的权重值。示例性的,ε=0.4,δ=0.6。
分别确定所述第一语音文本中的各个语音文本与对应的第二语音文本中的各个语音文本的相似度,也可以是确定第一语音文本中的语音文本的每一行字符串与对应的第二语音文本的语音文本的每一行字符串的相似值;在确定第一语音文本中的语音文本的第i行字符串与对应的第二语音文本的语音文本的每一行字符串的相似值时,当相似值大于预设阈值时,将相似值作为第一语音文本中的语音文本第i行的相似值,并停止确定相似值;在相似值小于或者等于预设阈值时,确定第一语音文本中的语音文本第i行的字符串与对应的第二语音文本中的语音文本的下一行字符串的相似值。在第i行字符串与对应的第二语音文本的每一行字符串的相似值均小于或者等于预设阈值时,丢弃第i行字符串的所有相似值,并确定第一语音文本中的语音文本第i+1行字符串与对应的第二语音文本中的语音文本的每一行字符串的相似值,直至第一语音文本的所有字符串均已确定过相似值。根据每行字符串对应的相似值的平均值或者加权平均值确定第一语音文本中的语音文本与第二语音文本的语音文本的相似度。
确定第一语音文本中的语音文本的每一行字符串与对应的所述第二语音文本的语音文本的每一行字符串的相似值,可以根据第一语音文本中的语音文本的每一行字符串与对应的所述第二语音文本的语音文本的每一行字符串的相似字符串的数量计算相似值。
确定第一语音文本中的语音文本的每一行字符串与对应的所述第二语音文本的语音文本的每一行字符串的相似值,也可以根据预设算法确定第一语音文本中的语音文本的每一行字符串与对应的第二语音文本中的语音文本的每一行字符串中的相似字符串,确定最长的相似字符串的数量;确定第一语音文本中的语音文本的每一行字符串与对应的第二语音文本中的语音文本的每一行字符串中最长字符串的字符串长度;确定第一语音文本中的语音文本的每一行字符串的行数与对应的第二语音文本中的语音文本的每一行字符串的行数的行数最小值;根据最长的相似字符串的数量、最长字符串的字符串长度以及行数最小值确定相似值。示例性的,如下公式所示:
Figure BDA0003198887810000141
其中,similarLCS1为第一语音文本中的语音文本的每一行字符串与对应的所述第二语音文本的语音文本的每一行字符串的相似值,将第一语音文本的语音文本按行存储于列表List<String>A=[a1,a2,...,an],n为第一语音文本的语音文本的总行数,将对应的第二语音文本的语音文本按行存储于列表List<String>B=[b1,b2,...,bm],m为第二语音文本的语音文本的总行数,LCSlongest表示字符串ai和bj中的最长的相似字符串的数量,
Figure BDA0003198887810000151
表示字符串ai和bj中最长字符串的字符串长度,smaller<i,j>表示取i和j中行数最小值,1≤i≤n,1≤j≤m。
在本实施例的技术方案中,在第二语音文本中确定第一语音文本中的各个语音文本对应的语音文本,分别确定第一语音文本中的各个语音文本与对应的第二语音文本中的各个语音文本的相似度,对各个相似度进行加权平均以得到第一相似度。通过确定目标语音文本与参考语音文本的第一相似度,准确确定了目标语音文本的识别准确率。
参照图5,图5为本发明语音识别准确率的确定方法的第四实施例,基于第二实施例,所述步骤S31包括:
步骤S311,将所述第一语音文本分为多个第一分词,以及将所述第二语音文本分为多个第二分词;
步骤S312,分别确定所述第一分词以及所述第二分词的哈希值;
步骤S313,根据所述哈希值确定所述第一分词以及所述第二分词的海明距离;
步骤S313,根据所述海明距离确定所述目标语音文本与预设参考语音文本的所述第二相似度。
具体的,可以采用正向最大匹配算法等算法将第一语音文本分为多个第一分词,以及将所述第二语音文本分为多个第二分词;
分别确定第一分词以及第二分词的哈希值,示例性的,使用MD5(Message DigestAlgorithm 5,消息摘要算法第五版)哈希算法计算哈希值,将第一分词存储在数组Array[pc1,pc2,...,pcn],将第二分词存储在数据Array[pc1,pc2,...,pcm]中。对数组Array[pc1,pc2,...,pcn]和数组Array[pc1,pc2,...,pcm]进行降维处理,将降维后的数据以字符串形式分别保存为StringDocpcn和StringDocpcm;根据哈希值确定第一分词以及第二分词的海明距离,示例性的,
Figure BDA0003198887810000152
其中,Hd-Docpc表示第一分词与第二分词之间的海明距离,StringDocpcn表示第一分词对应的数组,StringDocpcm表示第二分词对应的数组。
根据海明距离确定第一语音文本与第二语音文本的第二相似度。示例性的,如下公式所示:
Figure BDA0003198887810000161
其中,similarHash为第一语音文本与第二语音文本的第二相似度,Hd-Docpc表示第一分词与第二分词之间的海明距离,哈希值是通过128位MD5哈希算法计算得到,因此为规范相似度采用128这个值对海明距离进行处理得到第二相似度。
在本实施例的技术方案中,将第一语音文本分为多个第一分词,以及将第二语音文本分为多个第二分词;分别确定第一分词以及第二分词的哈希值,根据哈希值确定第一分词以及第二分词的海明距离;根据海明距离确定第一语音文本与第二语音文本的第二相似度。通过确定目标语音文本与参考语音文本的第二相似度,准确确定了目标语音文本的识别准确率。
参照图6,本发明还提供一种语音识别准确率的确定装置,所述语音识别准确率的确定装置包括:
获取模块100,用于获取对语音信号进行语音识别得到的目标语音文本;
第一确定模块200,用于确定所述目标语音文本与所述语音信号的预设参考语音文本的第一相似度,所述第一相似度由所述目标语音文本的每一行字符串与所述参考语音文本的每一行字符串相似度得到;
第二确定模块300,用于确定所述目标语音文本与所述参考语音文本的第二相似度,所述第二相似度由所述目标语音文本的分词与所述参考语音文本的分词的相似度得到;
计算模块400,用于根据所述第一相似度以及所述第二相似度确定所述目标语音文本的识别准确率。
在一实施例中,在确定所述目标语音文本与与所述语音信号的预设参考语音文本的第一相似度之前,所述获取模块100具体用于:
根据所述目标语音文本得到第一语音文本,当所述目标语音文本区分人物角色时,所述第一语音文本包括划分人物角色并去除标点的目标语音文本,去除人物角色和标点的目标语音文本,以及去除人物角色和标点并将文字转换为拼音的目标语音文本,当所述目标语音文本未区分人物角色时,所述第一语音文本包括仅去除标点的目标语音文本,以及仅去除标点的语音文本并将文字转换为拼音的目标语音文本;
根据预设参考语音文本得到第二语音文本,当所述参考语音文本区分人物角色时,所述第二语音文本包括划分人物角色并去除标点的参考语音文本,去除人物角色和标点的参考语音文本,以及去除人物角色和标点并将文字转换为拼音的参考语音文本,当所述参考语音文本未区分人物角色时,所述第二语音文本包括仅去除标点的参考语音文本以及仅去除标点的语音文本并将文字转换为拼音的参考语音文本;
在确定所述目标语音文本与所述语音信号的预设参考语音文本的第一相似度方面,所述第一确定模块200具体用于:
确定所述第一语音文本与所述第二语音文本的第一相似度;
在确定所述目标语音文本与所述参考语音文本的第二相似度方面,所述第二确定模块300具体用于:
确定所述第一语音文本与所述第二语音文本的第二相似度。
在一实施例中,在确定所述第一语音文本与所述第二语音文本的第一相似度方面,所述第一确定模块200具体用于:
在所述第二语音文本中确定所述第一语音文本中的各个语音文本对应的语音文本;
分别确定所述第一语音文本中的各个语音文本与对应的第二语音文本中的各个语音文本的相似度;
对各个所述相似度进行加权平均以得到所述第一相似度。
在一实施例中,在分别确定所述第一语音文本中的各个语音文本与对应的第二语音文本中的各个语音文本的相似度方面,所述第一确定模块200具体用于:
确定所述第一语音文本中的语音文本的每一行字符串与对应的所述第二语音文本的语音文本的每一行字符串的相似值;
在所述相似值大于预设阈值时,将所述相似值作为所述第一语音文本中的语音文本对应的行的相似值,并停止确定所述相似值;
在所述相似值小于或者等于预设阈值时,确定所述第一语音文本中的语音文本对应的行的字符串与对应的所述第二语音文本中的语音文本的下一行字符串的相似值,若所述第一语音文本中的语音文本对应的行的字符串与对应的所述第二语音文本的语音文本的每一行的相似值均小于或者等于预设阈值,则确定所述第一语音文本中的语音文本对应的行的下一行字符串与对应的所述第二语音文本中的语音文本的每一行字符串的相似值,直至所述第一语音文本的所有字符串均已确定相似值,根据每行字符串对应的相似值确定所述第一语音文本中的语音文本与所述第二语音文本的语音文本的相似度。
在一实施例中,在确定所述第一语音文本中的语音文本的每一行字符串与对应的所述第二语音文本的语音文本的每一行字符串的相似值方面,所述第一确定模块200具体用于:
根据预设算法确定所述第一语音文本中的语音文本的每一行字符串与对应的所述第二语音文本中的语音文本的每一行字符串中的相似字符串,确定最长的相似字符串的数量;
确定第一语音文本中的语音文本的每一行字符串与对应的所述第二语音文本中的语音文本的每一行字符串中最长字符串的字符串长度;
确定第一语音文本中的语音文本的每一行字符串的行数与对应的所述第二语音文本中的语音文本的每一行字符串的行数的行数最小值;
根据所述最长的相似字符串的数量、所述最长字符串的字符串长度以及所述行数最小值确定所述相似值。
在一实施例中,在确定所述第一语音文本与所述第二语音文本的第二相似度方面,所述第二确定模块300具体用于:
将所述第一语音文本分为多个第一分词,以及将所述第二语音文本分为多个第二分词;
分别确定所述第一分词以及所述第二分词的哈希值;
根据所述哈希值确定所述第一分词以及所述第二分词的海明距离;
根据所述海明距离确定所述第一语音文本与第二语音文本的所述第二相似度。
在一实施例中,在根据所述第一相似度以及所述第二相似度确定所述目标语音文本的准确率方面,所述计算模块400具体用于:
根据所述目标语音文本的文本行数以及字符串平均字数确定所述第二相似度的权重值,所述字符串平均字数为所述目标语音文本中各行字符串的字数的平均值;
根据所述第二相似度的权重值确定所述第一相似度的权重值;
根据所述第一相似度、所述第二相似度以及对应的所述权重值确定所述目标语音文本的准确率。
本发明还提供一种语音识别准确率的确定设备,所述语音识别准确率的确定设备包括存储器、处理器以及存储在所述存储器并可在所述处理器上执行的语音识别准确率的确定程序,所述语音识别准确率的确定程序被所述处理器执行时实现如上实施例所述的语音识别准确率的确定方法的各个步骤。
本发明还提供一种计算机可读存储介质,所述计算机可读存储介质存储有语音识别准确率的确定程序,所述语音识别准确率的确定程序被处理器执行时实现如上实施例所述的语音识别准确率的确定方法的各个步骤。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、系统、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、系统、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、系统、物品或者装置中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例系统可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个计算机可读存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,停车管理设备,空调器,或者网络设备等)执行本发明各个实施例所述的系统。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种语音识别准确率的确定方法,其特征在于,所述语音识别准确率的确定方法包括:
获取对语音信号进行语音识别得到的目标语音文本;
确定所述目标语音文本与所述语音信号的预设参考语音文本的第一相似度,所述第一相似度由所述目标语音文本的每一行字符串与所述参考语音文本的每一行字符串相似度得到;
确定所述目标语音文本与所述参考语音文本的第二相似度,所述第二相似度由所述目标语音文本的分词与所述参考语音文本的分词的相似度得到;
根据所述第一相似度以及所述第二相似度确定所述目标语音文本的识别准确率。
2.如权利要求1所述的语音识别准确率的确定方法,其特征在于,所述确定所述目标语音文本与与所述语音信号的预设参考语音文本的第一相似度的步骤之前,还包括:
根据所述目标语音文本得到第一语音文本,当所述目标语音文本区分人物角色时,所述第一语音文本包括划分人物角色并去除标点的目标语音文本,去除人物角色和标点的目标语音文本,以及去除人物角色和标点并将文字转换为拼音的目标语音文本,当所述目标语音文本未区分人物角色时,所述第一语音文本包括仅去除标点的目标语音文本,以及仅去除标点的语音文本并将文字转换为拼音的目标语音文本;
根据预设参考语音文本得到第二语音文本,当所述参考语音文本区分人物角色时,所述第二语音文本包括划分人物角色并去除标点的参考语音文本,去除人物角色和标点的参考语音文本,以及去除人物角色和标点并将文字转换为拼音的参考语音文本,当所述参考语音文本未区分人物角色时,所述第二语音文本包括仅去除标点的参考语音文本以及仅去除标点的语音文本并将文字转换为拼音的参考语音文本;
所述确定所述目标语音文本与所述语音信号的预设参考语音文本的第一相似度的步骤包括:
确定所述第一语音文本与所述第二语音文本的第一相似度;
所述确定所述目标语音文本与所述参考语音文本的第二相似度的步骤包括:
确定所述第一语音文本与所述第二语音文本的第二相似度。
3.如权利要求2所述的语音识别准确率的确定方法,其特征在于,所述确定所述第一语音文本与所述第二语音文本的第一相似度的步骤包括:
在所述第二语音文本中确定所述第一语音文本中的各个语音文本对应的语音文本;
分别确定所述第一语音文本中的各个语音文本与对应的第二语音文本中的各个语音文本的相似度;
对各个所述相似度进行加权平均以得到所述第一相似度。
4.如权利要求3所述的语音识别准确率的确定方法,其特征在于,所述分别确定所述第一语音文本中的各个语音文本与对应的第二语音文本中的各个语音文本的相似度的步骤包括:
确定所述第一语音文本中的语音文本的每一行字符串与对应的所述第二语音文本的语音文本的每一行字符串的相似值;
在所述相似值大于预设阈值时,将所述相似值作为所述第一语音文本中的语音文本对应的行的相似值,并停止确定所述相似值;
在所述相似值小于或者等于预设阈值时,确定所述第一语音文本中的语音文本对应的行的字符串与对应的所述第二语音文本中的语音文本的下一行字符串的相似值,若所述第一语音文本中的语音文本对应的行的字符串与对应的所述第二语音文本的语音文本的每一行的相似值均小于或者等于预设阈值,则确定所述第一语音文本中的语音文本对应的行的下一行字符串与对应的所述第二语音文本中的语音文本的每一行字符串的相似值,直至所述第一语音文本的所有字符串均已确定相似值,根据每行字符串对应的相似值确定所述第一语音文本中的语音文本与所述第二语音文本的语音文本的相似度。
5.如权利要求4所述的语音识别准确率的确定方法,其特征在于,所述确定所述第一语音文本中的语音文本的每一行字符串与对应的所述第二语音文本的语音文本的每一行字符串的相似值的步骤包括:
根据预设算法确定所述第一语音文本中的语音文本的每一行字符串与对应的所述第二语音文本中的语音文本的每一行字符串中的相似字符串,确定最长的相似字符串的数量;
确定第一语音文本中的语音文本的每一行字符串与对应的所述第二语音文本中的语音文本的每一行字符串中最长字符串的字符串长度;
确定第一语音文本中的语音文本的每一行字符串的行数与对应的所述第二语音文本中的语音文本的每一行字符串的行数的行数最小值;
根据所述最长的相似字符串的数量、所述最长字符串的字符串长度以及所述行数最小值确定所述相似值。
6.如权利要求2所述的语音识别准确率的确定方法,其特征在于,所述确定所述第一语音文本与所述第二语音文本的第二相似度的步骤包括:
将所述第一语音文本分为多个第一分词,以及将所述第二语音文本分为多个第二分词;
分别确定所述第一分词以及所述第二分词的哈希值;
根据所述哈希值确定所述第一分词以及所述第二分词的海明距离;
根据所述海明距离确定所述第一语音文本与第二语音文本的所述第二相似度。
7.如权利要求1所述的语音识别准确率的确定方法,其特征在于,所述根据所述第一相似度以及所述第二相似度确定所述目标语音文本的准确率的步骤包括:
根据所述目标语音文本的文本行数以及字符串平均字数确定所述第二相似度的权重值,所述字符串平均字数为所述目标语音文本中各行字符串的字数的平均值;
根据所述第二相似度的权重值确定所述第一相似度的权重值;
根据所述第一相似度、所述第二相似度以及对应的所述权重值确定所述目标语音文本的准确率。
8.一种语音识别准确率的确定装置,其特征在于,所述语音识别准确率的确定装置包括:
获取模块,用于获取对语音信号进行语音识别得到的目标语音文本;
第一确定模块,用于确定所述目标语音文本与所述语音信号的预设参考语音文本的第一相似度,所述第一相似度由所述目标语音文本的每一行字符串与所述参考语音文本的每一行字符串相似度得到;
第二确定模块,用于确定所述目标语音文本与所述参考语音文本的第二相似度,所述第二相似度由所述目标语音文本的分词与所述参考语音文本的分词的相似度得到;
计算模块,用于根据所述第一相似度以及所述第二相似度确定所述目标语音文本的识别准确率。
9.一种语音识别准确率的确定设备,其特征在于,所述语音识别准确率的确定设备包括存储器、处理器以及存储在所述存储器并可在所述处理器上执行的语音识别准确率的确定程序,所述语音识别准确率的确定程序被所述处理器执行时实现如权利要求1-7任一项所述的语音识别准确率的确定方法的各个步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有语音识别准确率的确定程序,所述语音识别准确率的确定程序被处理器执行时实现如权利要求1-7任一项所述的语音识别准确率的确定方法的各个步骤。
CN202110905043.4A 2021-08-05 2021-08-05 语音识别准确率的确定方法、装置、设备以及介质 Active CN113707148B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110905043.4A CN113707148B (zh) 2021-08-05 2021-08-05 语音识别准确率的确定方法、装置、设备以及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110905043.4A CN113707148B (zh) 2021-08-05 2021-08-05 语音识别准确率的确定方法、装置、设备以及介质

Publications (2)

Publication Number Publication Date
CN113707148A true CN113707148A (zh) 2021-11-26
CN113707148B CN113707148B (zh) 2024-04-19

Family

ID=78651830

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110905043.4A Active CN113707148B (zh) 2021-08-05 2021-08-05 语音识别准确率的确定方法、装置、设备以及介质

Country Status (1)

Country Link
CN (1) CN113707148B (zh)

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140095160A1 (en) * 2012-09-29 2014-04-03 International Business Machines Corporation Correcting text with voice processing
JP2016206487A (ja) * 2015-04-24 2016-12-08 日本電信電話株式会社 音声認識結果整形装置、方法及びプログラム
CN106356053A (zh) * 2016-08-09 2017-01-25 北京金山安全软件有限公司 语音输入法的识别准确率测试方法、装置和电子设备
JP2018049165A (ja) * 2016-09-21 2018-03-29 トヨタテクニカルディベロップメント株式会社 補正装置、補正方法及び補正プログラム
JP2018163342A (ja) * 2017-03-24 2018-10-18 株式会社Nttドコモ 音声認識結果比較システム
CN110069784A (zh) * 2019-05-05 2019-07-30 广东电网有限责任公司 一种语音质检评分方法、装置、终端及可存储介质
CN110164448A (zh) * 2019-04-09 2019-08-23 北京梧桐车联科技有限责任公司 语音处理方法及装置、存储介质、语音处理系统
CN110782892A (zh) * 2019-10-25 2020-02-11 四川长虹电器股份有限公司 语音文本纠错方法
JP2020056982A (ja) * 2018-09-30 2020-04-09 アイフライテック カンパニー,リミテッド 音声評価方法、装置、機器及び読み取り可能な記憶媒体
US20200160850A1 (en) * 2018-11-21 2020-05-21 Industrial Technology Research Institute Speech recognition system, speech recognition method and computer program product
US20210158823A1 (en) * 2019-11-21 2021-05-27 Baidu Online Network Technology (Beijing) Co., Ltd. Method, apparatus, and medium for processing speech signal

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140095160A1 (en) * 2012-09-29 2014-04-03 International Business Machines Corporation Correcting text with voice processing
JP2016206487A (ja) * 2015-04-24 2016-12-08 日本電信電話株式会社 音声認識結果整形装置、方法及びプログラム
CN106356053A (zh) * 2016-08-09 2017-01-25 北京金山安全软件有限公司 语音输入法的识别准确率测试方法、装置和电子设备
JP2018049165A (ja) * 2016-09-21 2018-03-29 トヨタテクニカルディベロップメント株式会社 補正装置、補正方法及び補正プログラム
JP2018163342A (ja) * 2017-03-24 2018-10-18 株式会社Nttドコモ 音声認識結果比較システム
JP2020056982A (ja) * 2018-09-30 2020-04-09 アイフライテック カンパニー,リミテッド 音声評価方法、装置、機器及び読み取り可能な記憶媒体
US20200160850A1 (en) * 2018-11-21 2020-05-21 Industrial Technology Research Institute Speech recognition system, speech recognition method and computer program product
CN111292740A (zh) * 2018-11-21 2020-06-16 财团法人工业技术研究院 语音辨识系统及其方法、与电脑程序产品
CN110164448A (zh) * 2019-04-09 2019-08-23 北京梧桐车联科技有限责任公司 语音处理方法及装置、存储介质、语音处理系统
CN110069784A (zh) * 2019-05-05 2019-07-30 广东电网有限责任公司 一种语音质检评分方法、装置、终端及可存储介质
CN110782892A (zh) * 2019-10-25 2020-02-11 四川长虹电器股份有限公司 语音文本纠错方法
US20210158823A1 (en) * 2019-11-21 2021-05-27 Baidu Online Network Technology (Beijing) Co., Ltd. Method, apparatus, and medium for processing speech signal

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
MICHAEL LEVIT等: "END-TO-END SPEECH RECOGNITION ACCURACY METRIC FOR VOICE-SEARCH TASKS", IEEE *
苏立伟等: "95598电力客服智能质检系统问题语音检出方法研究", 微型电脑应用, vol. 35, no. 8, pages 98 - 100 *
黄贤英;李沁东;刘英涛;: "结合词性的短文本相似度算法及其在文本分类中的应用", 电讯技术, no. 01 *
黄贤英;李沁东;刘英涛;: "结合词性的短文本相似度算法及其在文本分类中的应用", 电讯技术, no. 01, 28 January 2017 (2017-01-28) *

Also Published As

Publication number Publication date
CN113707148B (zh) 2024-04-19

Similar Documents

Publication Publication Date Title
CN109635273B (zh) 文本关键词提取方法、装置、设备及存储介质
CN107341143B (zh) 一种句子连贯性判断方法及装置和电子设备
CN110070853B (zh) 一种语音识别转化方法及系统
CN110083832B (zh) 文章转载关系的识别方法、装置、设备及可读存储介质
CN112214576B (zh) 舆情分析方法、装置、终端设备及计算机可读存储介质
CN111046660B (zh) 一种识别文本专业术语的方法及装置
CN110633475A (zh) 基于计算机场景的自然语言理解方法、装置、系统和存储介质
CN113836938A (zh) 文本相似度的计算方法及装置、存储介质、电子装置
CN111177375A (zh) 一种电子文档分类方法及装置
CN113434682A (zh) 文本情感分析方法、电子装置及存储介质
US10331789B2 (en) Semantic analysis apparatus, method, and non-transitory computer readable storage medium thereof
CN113657098B (zh) 文本纠错方法、装置、设备及存储介质
CN115312033A (zh) 基于人工智能的语音情感识别方法、装置、设备及介质
CN115858776B (zh) 一种变体文本分类识别方法、系统、存储介质和电子设备
CN111400340A (zh) 一种自然语言处理方法、装置、计算机设备和存储介质
CN111209373A (zh) 基于自然语义的敏感文本识别方法和装置
CN115796141A (zh) 文本数据增强方法和装置、电子设备、存储介质
CN113095073B (zh) 语料标签生成方法、装置、计算机设备和存储介质
CN113707148A (zh) 语音识别准确率的确定方法、装置、设备以及介质
CN115357697A (zh) 数据处理方法、装置、终端设备以及存储介质
CN114974310A (zh) 基于人工智能的情感识别方法、装置、计算机设备及介质
CN113515587A (zh) 一种标的物信息提取方法、装置、计算机设备及存储介质
CN111382247A (zh) 一种内容推送优化方法、内容推送优化装置及电子设备
CN117235137B (zh) 一种基于向量数据库的职业信息查询方法及装置
CN114091456B (zh) 一种引文内容智能定位方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant