CN109918619B - 一种基于基础字典标注的发音标注方法和装置 - Google Patents

一种基于基础字典标注的发音标注方法和装置 Download PDF

Info

Publication number
CN109918619B
CN109918619B CN201910012153.0A CN201910012153A CN109918619B CN 109918619 B CN109918619 B CN 109918619B CN 201910012153 A CN201910012153 A CN 201910012153A CN 109918619 B CN109918619 B CN 109918619B
Authority
CN
China
Prior art keywords
pinyin
labels
dictionary
words
pronunciation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910012153.0A
Other languages
English (en)
Other versions
CN109918619A (zh
Inventor
肖玉宾
喻红
杨承勇
敬大彦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN201910012153.0A priority Critical patent/CN109918619B/zh
Publication of CN109918619A publication Critical patent/CN109918619A/zh
Application granted granted Critical
Publication of CN109918619B publication Critical patent/CN109918619B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Machine Translation (AREA)
  • Electrically Operated Instructional Devices (AREA)

Abstract

本发明实施例提供了一种基于基础字典标注的发音标注方法和装置。本发明涉及人工智能技术领域,该方法包括:获取多个汉字单字和每个汉字单字对应的拼音标注;将每个汉字单字和每个汉字单字对应的拼音标注关联存储在第一字典;获取多个拼音标注和每个拼音标注对应的训练发音标注;将多个拼音标注中的每个拼音标注和每个拼音标注对应的训练发音标注关联存储在第二字典;根据第一字典和第二字典确定第三字典;获取用户输入的待标注词汇;基于待标注词汇从第三字典中查询训练发音标注;将查询得到的训练发音标注作为待标注词汇的训练发音标注。因此,本发明实施例提供的技术方案能够解决现有技术中人工对语音识别字典进行标注效率低的问题。

Description

一种基于基础字典标注的发音标注方法和装置
【技术领域】
本发明涉及人工智能技术领域,尤其涉及一种基于基础字典标注的发音标注方法和装置。
【背景技术】
目前语音识别字典中语音识别方法是人工对语料中词汇和单字的发音进行标注,具体的步骤:首先,人工对词汇、单字进行拼音标注,其次,人工再将词汇对应的拼音标注和单字对应的拼音标注分别进行发音标注,人工对语音识别字典进行标注存在效率低的问题。
【发明内容】
有鉴于此,本发明实施例提供了一种基于基础字典标注的发音标注方法和装置,用以解决现有技术人工对语音识别字典进行标注效率低的问题。
一方面,本发明实施例提供了一种基于基础字典标注的发音标注方法,所述方法包括:获取多个汉字单字和所述多个汉字单字中每个汉字单字对应的拼音标注;将所述多个汉字单字中的每个汉字单字和所述每个汉字单字对应的拼音标注关联存储在第一字典;获取多个拼音标注和所述多个拼音标注中每个拼音标注对应的训练发音标注;将所述多个拼音标注中的每个拼音标注和所述每个拼音标注对应的训练发音标注关联存储在第二字典;根据所述第一字典和所述第二字典确定第三字典,所述第三字典用于关联存储所述汉字单字和所述训练发音标注;获取用户输入的待标注词汇;基于所述待标注词汇从所述第三字典中查询训练发音标注;将查询得到的训练发音标注作为所述待标注词汇的训练发音标注。
进一步地,在所述将所述多个拼音标注中的每个拼音标注和所述每个拼音标注对应的训练发音标注关联存储在第二字典之后,所述方法还包括:接收标注方式更改指令,所述标注方式更改指令用于指示更改所述第二字典中的训练发音标注;根据所述标注方式更改指令更改所述第二字典中的训练发音标注。
进一步地,所述基于所述待标注词汇从所述第三字典中查询训练发音标注,包括:将所述待标注词汇分割成多个单字;确定所述多个单字中的多音字的拼音标注;确定所述多音字的拼音标注对应的训练发音标注;在所述第三字典中查询所述多个单字中除多音字外的每个单字的训练发音标注;将所述多个单字的训练发音标注按照预设分隔符进行拼接,得到所述待标注词汇的训练发音标注。
进一步地,所述确定所述多个单字中的多音字的拼音标注,包括:将所述待标注词汇分割成的多个单字与第四字典中存储的多音字进行比较,得到所述待标注词汇中的多音字;从所述待标注词汇中提取目标词语,所述目标词语为包含所述多音字的词语;在所述第四字典中查找所述目标词语中包含的多音字的拼音标注,将查找到的拼音标注作为所述多音字在所述待标注词汇中的拼音标注,其中,所述第四字典是通过下列步骤建立的:获取多个多音字;确定所述多个多音字中每个多音字的所有拼音标注和每个拼音标注对应的词语;将所述多个多音字中每个多音字、所述每个多音字的所有拼音标注和所述每个拼音标注对应的词语关联存储在所述第四字典。
进一步地,所述获取用户输入的待标注词汇,包括:接收所述用户输入的语音信息;使用语音识别的方法识别所述语音信息,得到所述待标注词汇。
一方面,本发明实施例提供了一种基于基础字典标注的发音标注装置,所述装置包括:第一获取单元,用于获取多个汉字单字和所述多个汉字单字中每个汉字单字对应的拼音标注;第一存储单元,用于将所述多个汉字单字中的每个汉字单字和所述每个汉字单字对应的拼音标注关联存储在第一字典;第二获取单元,用于获取多个拼音标注和所述多个拼音标注中每个拼音标注对应的训练发音标注;第二存储单元,用于将所述多个拼音标注中的每个拼音标注和所述每个拼音标注对应的训练发音标注关联存储在第二字典;第一确定单元,用于根据所述第一字典和所述第二字典确定第三字典,所述第三字典用于关联存储所述汉字单字和所述训练发音标注;第三获取单元,用于获取用户输入的待标注词汇;第一查询单元,用于基于所述待标注词汇从所述第三字典中查询训练发音标注;第二确定单元,用于将查询得到的训练发音标注作为所述待标注词汇的训练发音标注。
进一步地,所述装置还包括:第一接收单元,用于在所述第二存储单元将所述多个拼音标注中的每个拼音标注和所述每个拼音标注对应的训练发音标注关联存储在第二字典之后,接收标注方式更改指令,所述标注方式更改指令用于指示更改所述第二字典中的训练发音标注;更改单元,用于根据所述标注方式更改指令更改所述第二字典中的训练发音标注。
进一步地,所述第一查询单元包括:分割模块,用于将所述待标注词汇分割成多个单字;第一确定模块,用于确定所述多个单字中的多音字的拼音标注;第二确定模块,用于确定所述多音字的拼音标注对应的训练发音标注;第一查询模块,用于在所述第三字典中查询所述多个单字中除多音字外的每个单字的训练发音标注;第三确定模块,用于将所述多个单字的训练发音标注按照预设分隔符进行拼接,得到所述待标注词汇的训练发音标注。
进一步地,所述第一确定模块包括:第四确定模块,用于将所述待标注词汇分割成的多个单字与第四字典中存储的多音字进行比较,得到所述待标注词汇中的多音字;提取模块,用于从所述待标注词汇中提取目标词语,所述目标词语为包含所述多音字的词语;查找模块,用于在所述第四字典中查找所述目标词语中包含的多音字的拼音标注,将查找到的拼音标注作为所述多音字在所述待标注词汇中的拼音标注,其中,所述第四字典是通过下列步骤建立的:获取多个多音字;确定多个多音字中每个多音字的所有拼音标注和每个拼音标注对应的词语;将多个多音字中每个多音字、每个多音字的所有拼音标注和每个拼音标注对应的词语关联存储在所述第四字典。
进一步地,所述第三获取单元包括:接收模块,用于接收所述用户输入的语音信息;第六确定模块,用于使用语音识别的方法识别所述语音信息,得到所述待标注词汇。
一方面,本发明实施例提供了一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行上述的基于基础字典标注的发音标注方法。
一方面,本发明实施例提供了一种计算机设备,包括存储器和处理器,所述存储器用于存储包括程序指令的信息,所述处理器用于控制程序指令的执行,所述程序指令被处理器加载并执行时实现上述的基于基础字典标注的发音标注方法的步骤。
本发明实施例中,获取多个汉字单字和多个汉字单字中每个汉字单字对应的拼音标注;将多个汉字单字中的每个汉字单字和每个汉字单字对应的拼音标注关联存储在第一字典;获取多个拼音标注和多个拼音标注中每个拼音标注对应的训练发音标注;将多个拼音标注中的每个拼音标注和每个拼音标注对应的训练发音标注关联存储在第二字典;根据第一字典和第二字典确定第三字典,第三字典用于关联存储汉字单字和训练发音标注;获取用户输入的待标注词汇;基于待标注词汇从第三字典中查询训练发音标注;将查询得到的训练发音标注作为待标注词汇的训练发音标注,标注过程不需要人工参与,避免了现有技术中人工对语音识别字典进行标注效率低的问题,提高了标注效率。
【附图说明】
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
图1是根据本发明实施例一种可选的基于基础字典标注的发音标注方法的流程图;
图2是根据本发明实施例一种可选的基于基础字典标注的发音标注装置的示意图;
图3是本发明实施例提供的一种可选的计算机设备的示意图。
【具体实施方式】
为了更好的理解本发明的技术方案,下面结合附图对本发明实施例进行详细描述。
应当明确,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。
应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
图1是根据本发明实施例一种可选的基于基础字典标注的发音标注方法的流程图,如图1所示,该方法包括:
步骤S102,获取多个汉字单字和多个汉字单字中每个汉字单字对应的拼音标注。
步骤S104,将多个汉字单字中的每个汉字单字和每个汉字单字对应的拼音标注关联存储在第一字典。
步骤S106,获取多个拼音标注和多个拼音标注中每个拼音标注对应的训练发音标注。
步骤S108,将多个拼音标注中的每个拼音标注和每个拼音标注对应的训练发音标注关联存储在第二字典。
步骤S110,根据第一字典和第二字典确定第三字典,第三字典用于关联存储汉字单字和训练发音标注。
步骤S112,获取用户输入的待标注词汇。
步骤S114,基于待标注词汇从第三字典中查询训练发音标注。
步骤S116,将查询得到的训练发音标注作为待标注词汇的训练发音标注。
具体地,在根据拼音标注确定其对应的训练发音标注的过程中,拼音标注的声调用下标体现,下标的形式可根据需要设置,可以设置为字母形式的下标,也可以设置为数字形式的下标,例如,拼音标注ā的训练发音标注为aa或者a1,拼音标注á的训练发音标注为ab或者a2,拼音标注ǎ的训练发音标注为ac或者a3,拼音标注à的训练发音标注为ad或者a4,其中,训练发音标注aa、训练发音标注ab、训练发音标注ac、训练发音标注ad采用的是字母形式的下标;训练发音标注a1、训练发音标注a2、训练发音标注a3、训练发音标注a4采用的是数字形式的下标。
将汉字单字和汉字单字对应的拼音标注关联存储在第一字典,例如,将汉字单字“啊”和拼音标注“ā”关联存储在第一字典。
将拼音标注和拼音标注对应的训练发音标注关联存储在第二字典,例如,将拼音标注“ā”和训练发音标注“aa”关联存储在第二字典,或者,将拼音标注“ā”和训练发音标注“a1”关联存储在第二字典。
本发明实施例中,获取多个汉字单字和多个汉字单字中每个汉字单字对应的拼音标注;将多个汉字单字中的每个汉字单字和每个汉字单字对应的拼音标注关联存储在第一字典;获取多个拼音标注和多个拼音标注中每个拼音标注对应的训练发音标注;将多个拼音标注中的每个拼音标注和每个拼音标注对应的训练发音标注关联存储在第二字典;根据第一字典和第二字典确定第三字典,第三字典用于关联存储汉字单字和训练发音标注;获取用户输入的待标注词汇;基于待标注词汇从第三字典中查询训练发音标注;将查询得到的训练发音标注作为待标注词汇的训练发音标注,标注过程不需要人工参与,避免了现有技术中人工对语音识别字典进行标注效率低的问题,提高了标注效率。
可选地,在将多个拼音标注中的每个拼音标注和每个拼音标注对应的训练发音标注关联存储在第二字典之后,方法还包括:接收标注方式更改指令,标注方式更改指令用于指示更改第二字典中的训练发音标注;根据标注方式更改指令更改第二字典中的训练发音标注。
训练发音标注方式可以根据实际情况进行设置,当需要更改训练发音标注方式时,可根据标注方式更改指令的指示进行修改,例如,拼音标注ǎ和训练发音标注ac关联存储在第二字典,接收标注方式更改指令之后,根据标注方式更改指令更改第二字典中的训练发音标注,将训练发音标注ac更改为a3,更改后,拼音标注ǎ和训练发音标注a3关联存储在第二字典。
可选地,基于待标注词汇从第三字典中查询训练发音标注,包括:将待标注词汇分割成多个单字;确定多个单字中的多音字的拼音标注;确定多音字的拼音标注对应的训练发音标注;在第三字典中查询多个单字中除多音字外的每个单字的训练发音标注;将多个单字的训练发音标注按照预设分隔符进行拼接,得到待标注词汇的训练发音标注。
将多个单字的训练发音标注进行拼接时用到的预设分隔符可以根据用户习惯自定义,可以为空格或者逗号等。例如,待标注词汇为“你好”,单字“你”的训练发音标注为“ni3”,单字“好”的训练发音标注为“hao3”,则待标注词汇“你好”的训练发音标注为“ni3hao3”,或者“ni3,hao3”。通过用户设置分隔符,可以快速适配特定的标注。再例如,待标注词汇为“夜来风雨声”,将待标注词汇“夜来风雨声”进行切分后,得到五个单字“夜”、“来”、“风”、“雨”、“声”,在第三字典中查找这五个单字分别对应的训练发音标注,得到“ye4”、“lai2”、“feng1”、“yu3”、“sheng1”,将得到的五个单字的训练发音标注“ye4”、“lai2”、“feng1”、“yu3”、“sheng1”按照预设分隔符(逗号)进行拼接,即可得到待标注词汇“夜来风雨声”的训练发音标注“ye4,lai2,feng1,yu3,sheng1”。
因在第三字典中存储的是单字与训练发音标注,因此确定待标注词汇的训练发音标注之前,需要将待标注词汇切分成多个单字;因汉字中存在多音字,所以在根据第三字典查询多个单字的训练发音标注之前,需要查找多个单字中的多音字,并确定多音字的拼音标注;在确定多音字的拼音标注之后,在第二字典中查找多音字的拼音标注对应的训练发音标注;在第三字典中查询多个单字中除多音字外的每个单字的训练发音标注;将查找的多个单字的训练发音标注进行拼接,得到待标注词汇的训练发音标注。
例如,待标注词汇为“春眠不觉晓”,将待标注词汇“春眠不觉晓”进行切分后,得到五个单字“春”、“眠”、“不”、“觉”、“晓”。因单字“觉”为多音字,有两个发音分别是“jué”和“jiào”,确定在待标注词汇“春眠不觉晓”中“觉”的拼音标注为“jué”之后,在第二字典中查找拼音标注“jué”对应的训练发音标注为“jue2”。在第三字典中查找除多音字“觉”之外的单字“春”、“眠”、“不”、“晓”对应的训练发音标注分别为“chun1”、“mian2”、“bu4”、“xiao3”,将得到的五个单字的训练发音标注“chun1”、“mian2”、“bu4”、“jue2”、“xiao3”按照预设分隔符(逗号)进行拼接,即可得到待标注词汇“春眠不觉晓”的训练发音标注“chun1,mian2,bu4,jue2,xiao3”。
可选地,确定多个单字中的多音字的拼音标注,具体可以为以下步骤:将待标注词汇分割成的多个单字与第四字典中存储的多音字进行比较,得到待标注词汇中的多音字;从待标注词汇中提取目标词语,目标词语为包含多音字的词语;在第四字典中查找目标词语中包含的多音字的拼音标注,将查找到的拼音标注作为多音字在待标注词汇中的拼音标注,其中,第四字典是通过下列步骤建立的:获取多个多音字;确定多个多音字中每个多音字的所有拼音标注和每个拼音标注对应的词语;将多个多音字中每个多音字、每个多音字的所有拼音标注和每个拼音标注对应的词语关联存储在第四字典。
建立第四字典的过程如下:收集多音字,并将多音字、多音字对应的拼音标注和每个拼音标注所涉及的词语三者的关联关系存储在第四字典,例如,多音字“阿”,对应的拼音标注为“ā”和“ē”,拼音标注“ā”对应的词语为“阿罗汉”、“阿姨”,拼音标注“ē”对应的词语为“阿附”、“阿胶”,则第四字典存储的是“阿”、“ā”和“阿罗汉”、“阿姨”的关联关系,以及“阿”、“ē”和“阿附”、“阿胶”的关联关系。
在确定多个单字中的多音字的拼音标注时,查询多个单字中的每个单字是否存在于第四字典中,如果在第四字典中查询到某个单字的存在,则表示该单字为多音字;在待标注词汇中提取该单字对应的目标词语,将目标词语与第四字典中该多音字对应的词汇进行比较,得到目标词语对应的拼音标注,即可确定该多音字对应的拼音标注。
例如,待标注词汇为“赵阿姨”,根据待标注词汇得到三个单字,分别为单字“赵”、单字“阿”、单字“姨”,首先需要判断这三个单字中是否存在多音字,判断一个单字是否为多音字的方法是:在第四字典中进行查询,如果查到该单字,则确定该单字为多音字;如果查不到,则确定该单字为单音字。分别在第四字典中查询是否存在单字“赵”、单字“阿”、单字“姨”,查询的结果为第四字典中存在单字“阿”,不存在单字“赵”、单字“姨”,则可以知道,单字“赵”、单字“姨”均为单音字,单字“阿”为多音字。确定单字“阿”在待标注词汇“赵阿姨”中的拼音标注的方法为:在待标注词汇“赵阿姨”中提取单字“阿”对应的目标词语为“阿姨”,根据第四字典存储的“阿”、“ā”和“阿罗汉”、“阿姨”的关联关系,以及“阿”、“ē”和“阿附”、“阿胶”的关联关系,可知,“阿”在词语“阿姨”中的拼音标注为“ā”,则确定待标注词汇“赵阿姨”中的多音字“阿”的拼音标注为“ā”。
作为一种可选的实施方式,第四字典中也可以存储多音字、多音字的拼音标注、多音字拼音标注对应的多音字的语义之间的关联关系,例如,多音字“薄”,“薄”的拼音标注为“báo”、“bó”、“bò”;拼音标注“báo”对应“薄”的语义为:1、扁平物体上下两面之间的距离小,2、淡,3、(感情)冷淡,4、不肥沃;拼音标注“bó”对应“薄”的语义为:1、微,少,弱,2、不厚道,不庄重,3、看不起,慢待,4、迫近,靠近;拼音标注“bò”对应“薄”的语义为:[薄荷]多年生草本植物。则第四字典存储为:{多音字“薄”、拼音标注“báo”、语义“1、扁平物体上下两面之间的距离小,2、淡,3、(感情)冷淡,4、不肥沃;”},{多音字“薄”、拼音标注“bó”、语义“1、微,少,弱,2、不厚道,不庄重,3、看不起,慢待,4、迫近,靠近;”},{多音字“薄”、拼音标注“bò”、语义“[薄荷]多年生草本植物”};因多音字的每一个拼音标注对应的词语很多,如果在第四字典中存储多音字对应的所有词汇,占用的存储空间太大,而且搜集的过程中成本也较大,但是每一个拼音标注对应多音字的语义是有限的,搜集过程简单方便,提高了标注效率。
在确定待标注词汇中多音字的拼音标注时,提取待标注词汇中多音字对应的目标词语之后,采用语义分析技术确定目标词语对应的拼音标注,例如,待标注词汇中多音字“薄”对应的目标词语为“日薄西山”,目标词语“日薄西山”的语义为“太阳快要落山”,经过语义分析确定目标词语“日薄西山”中的多音字“薄”的语义为“迫近”,对应的拼音标注为“bó”,则确定待标注词汇中多音字“薄”的拼音标注为“bó”。
可选地,获取用户输入的待标注词汇,包括:接收用户输入的语音信息;使用语音识别的方法识别语音信息,得到待标注词汇。
语音识别的方式可以为:⑴根据隐式马尔科夫模型进行语音识别。⑵以知识为基础进行语音识别。在进行语音识别的时候,除了识别声学信息外,更多地利用各种语言知识,诸如构词、句法、语义、对话背景方面等的知识来帮助进一步对语音作出识别和理解。⑶根据人工神经网络进行语音识别,例如,采用基于反向传播算法(BP算法)的多层感知网络。
图2是根据本发明实施例一种可选的基于基础字典标注的发音标注装置的示意图,该装置用于执行上述基于基础字典标注的发音标注方法,如图2所示,该装置包括:第一获取单元10、第一存储单元20、第二获取单元30、第二存储单元40、第一确定单元50、第三获取单元60、第一查询单元70、第二确定单元80。
第一获取单元10,用于获取多个汉字单字和多个汉字单字中每个汉字单字对应的拼音标注。
第一存储单元20,用于将多个汉字单字中的每个汉字单字和每个汉字单字对应的拼音标注关联存储在第一字典。
第二获取单元30,用于获取多个拼音标注和多个拼音标注中每个拼音标注对应的训练发音标注。
第二存储单元40,用于将多个拼音标注中的每个拼音标注和每个拼音标注对应的训练发音标注关联存储在第二字典。
第一确定单元50,用于根据第一字典和第二字典确定第三字典,第三字典用于关联存储汉字单字和训练发音标注。
第三获取单元60,用于获取用户输入的待标注词汇。
第一查询单元70,用于基于待标注词汇从第三字典中查询训练发音标注。
第二确定单元80,用于将查询得到的训练发音标注作为待标注词汇的训练发音标注。
具体地,在根据拼音标注确定其对应的训练发音标注的过程中,拼音标注的声调用下标体现,下标形式可自行设置,可以用字母,也可以用数字,例如,拼音标注ā的训练发音标注为aa或者a1,拼音标注á的训练发音标注为ab或者a2,拼音标注ǎ的训练发音标注为ac或者a3,拼音标注à的训练发音标注为ad或者a4。
将汉字单字和拼音标注对应存储在第一字典,例如,将汉字单字“啊”和拼音标注“ā”对应存储在第一字典。
将拼音标注和训练发音标注对应存储在第二字典,例如,将拼音标注“ā”和训练发音标注“aa”对应存储在第二字典,或者,将拼音标注“ā”和训练发音标注“a1”对应存储在第二字典。
本发明实施例中,获取多个汉字单字和多个汉字单字中每个汉字单字对应的拼音标注;将多个汉字单字中的每个汉字单字和每个汉字单字对应的拼音标注关联存储在第一字典;获取多个拼音标注和多个拼音标注中每个拼音标注对应的训练发音标注;将多个拼音标注中的每个拼音标注和每个拼音标注对应的训练发音标注关联存储在第二字典;根据第一字典和第二字典确定第三字典,第三字典用于关联存储汉字单字和训练发音标注;获取用户输入的待标注词汇;基于待标注词汇从第三字典中查询训练发音标注;将查询得到的训练发音标注作为待标注词汇的训练发音标注,标注过程不需要人工参与,避免了现有技术中人工对语音识别字典进行标注效率低的问题,提高了标注效率。
可选地,装置还包括:第一接收单元、更改单元。第一接收单元,用于在第二存储单元40将多个拼音标注中的每个拼音标注和每个拼音标注对应的训练发音标注关联存储在第二字典之后,接收标注方式更改指令,标注方式更改指令用于指示更改第二字典中的训练发音标注。更改单元,用于根据标注方式更改指令更改第二字典中的训练发音标注。
可选地,第一查询单元70包括:分割模块、第一确定模块、第二确定模块、第一查询模块、第三确定模块。分割模块,用于将待标注词汇分割成多个单字。第一确定模块,用于确定多个单字中的多音字的拼音标注。第二确定模块,用于确定多音字的拼音标注对应的训练发音标注。第一查询模块,用于在第三字典中查询多个单字中除多音字外的每个单字的训练发音标注。第三确定模块,用于将多个单字的训练发音标注按照预设分隔符进行拼接,得到待标注词汇的训练发音标注。
可选地,第一确定模块包括:第四确定模块、提取模块、查找模块。第四确定模块,用于将待标注词汇分割成的多个单字与第四字典中存储的多音字进行比较,得到待标注词汇中的多音字。提取模块,用于从待标注词汇中提取目标词语,目标词语为包含多音字的词语。查找模块,用于在第四字典中查找目标词语中包含的多音字的拼音标注,将查找到的拼音标注作为多音字在待标注词汇中的拼音标注。其中,第四字典是通过下列步骤建立的:获取多个多音字;确定多个多音字中每个多音字的所有拼音标注和每个拼音标注对应的词语;将多个多音字中每个多音字、每个多音字的所有拼音标注和每个拼音标注对应的词语关联存储在第四字典。
可选地,第三获取单元60包括:接收模块、第六确定模块。接收模块,用于接收用户输入的语音信息。第六确定模块,用于使用语音识别的方法识别语音信息,得到待标注词汇。
一方面,本发明实施例提供了一种存储介质,存储介质包括存储的程序,其中,在程序运行时控制存储介质所在设备执行以下步骤:获取多个汉字单字和多个汉字单字中每个汉字单字对应的拼音标注;将多个汉字单字中的每个汉字单字和每个汉字单字对应的拼音标注关联存储在第一字典;获取多个拼音标注和多个拼音标注中每个拼音标注对应的训练发音标注;将多个拼音标注中的每个拼音标注和每个拼音标注对应的训练发音标注关联存储在第二字典;根据第一字典和第二字典确定第三字典,第三字典用于关联存储汉字单字和训练发音标注;获取用户输入的待标注词汇;基于待标注词汇从第三字典中查询训练发音标注;将查询得到的训练发音标注作为待标注词汇的训练发音标注。
可选地,在程序运行时控制存储介质所在设备还执行以下步骤:在将多个拼音标注中的每个拼音标注和每个拼音标注对应的训练发音标注关联存储在第二字典之后,接收标注方式更改指令,标注方式更改指令用于指示更改第二字典中的训练发音标注;根据标注方式更改指令更改第二字典中的训练发音标注。
可选地,在程序运行时控制存储介质所在设备还执行以下步骤:将待标注词汇分割成多个单字;确定多个单字中的多音字的拼音标注;确定多音字的拼音标注对应的训练发音标注;在第三字典中查询多个单字中除多音字外的每个单字的训练发音标注;将多个单字的训练发音标注按照预设分隔符进行拼接,得到待标注词汇的训练发音标注。
可选地,在程序运行时控制存储介质所在设备还执行以下步骤:将待标注词汇分割成的多个单字与第四字典中存储的多音字进行比较,得到待标注词汇中的多音字;从待标注词汇中提取目标词语,目标词语为包含多音字的词语;在第四字典中查找目标词语中包含的多音字的拼音标注,其中,第四字典是通过下列步骤建立的:获取多个多音字;确定多个多音字中每个多音字的所有拼音标注和每个拼音标注对应的词语;将多个多音字中每个多音字、每个多音字的所有拼音标注和每个拼音标注对应的词语关联存储在第四字典。
可选地,在程序运行时控制存储介质所在设备还执行以下步骤:接收用户输入的语音信息;使用语音识别的方法识别语音信息,得到待标注词汇。
一方面,本发明实施例提供了一种计算机设备,包括存储器和处理器,存储器用于存储包括程序指令的信息,处理器用于控制程序指令的执行,程序指令被处理器加载并执行时实现以下步骤:获取多个汉字单字和多个汉字单字中每个汉字单字对应的拼音标注;将多个汉字单字中的每个汉字单字和每个汉字单字对应的拼音标注关联存储在第一字典;获取多个拼音标注和多个拼音标注中每个拼音标注对应的训练发音标注;将多个拼音标注中的每个拼音标注和每个拼音标注对应的训练发音标注关联存储在第二字典;根据第一字典和第二字典确定第三字典,第三字典用于关联存储汉字单字和训练发音标注;获取用户输入的待标注词汇;基于待标注词汇从第三字典中查询训练发音标注;将查询得到的训练发音标注作为待标注词汇的训练发音标注。
可选地,程序指令被处理器加载并执行时还实现以下步骤:在将多个拼音标注中的每个拼音标注和每个拼音标注对应的训练发音标注关联存储在第二字典之后,接收标注方式更改指令,标注方式更改指令用于指示更改第二字典中的训练发音标注;根据标注方式更改指令更改第二字典中的训练发音标注。
可选地,程序指令被处理器加载并执行时还实现以下步骤:将待标注词汇分割成多个单字;确定多个单字中的多音字的拼音标注;确定多音字的拼音标注对应的训练发音标注;在第三字典中查询多个单字中除多音字外的每个单字的训练发音标注;将多个单字的训练发音标注按照预设分隔符进行拼接,得到待标注词汇的训练发音标注。
可选地,程序指令被处理器加载并执行时还实现以下步骤:将待标注词汇分割成的多个单字与第四字典中存储的多音字进行比较,得到待标注词汇中的多音字;从待标注词汇中提取目标词语,目标词语为包含多音字的词语;在第四字典中查找目标词语中包含的多音字的拼音标注,其中,第四字典是通过下列步骤建立的:获取多个多音字;确定多个多音字中每个多音字的所有拼音标注和每个拼音标注对应的词语;将多个多音字中每个多音字、每个多音字的所有拼音标注和每个拼音标注对应的词语关联存储在第四字典。
可选地,程序指令被处理器加载并执行时还实现以下步骤:接收用户输入的语音信息;使用语音识别的方法识别语音信息,得到待标注词汇。
图3是本发明实施例提供的一种计算机设备的示意图。如图3所示,该实施例的计算机设备50包括:处理器51、存储器52以及存储在存储器52中并可在处理器51上运行的计算机程序53,该计算机程序53被处理器51执行时实现实施例中的基于基础字典标注的发音标注方法,为避免重复,此处不一一赘述。或者,该计算机程序被处理器51执行时实现实施例中基于基础字典标注的发音标注装置中各模型/单元的功能,为避免重复,此处不一一赘述。
计算机设备50可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。计算机设备可包括,但不仅限于,处理器51、存储器52。本领域技术人员可以理解,图3仅仅是计算机设备50的示例,并不构成对计算机设备50的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如计算机设备还可以包括输入输出设备、网络接入设备、总线等。
所称处理器51可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器52可以是计算机设备50的内部存储单元,例如计算机设备50的硬盘或内存。存储器52也可以是计算机设备50的外部存储设备,例如计算机设备50上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,存储器52还可以既包括计算机设备50的内部存储单元也包括外部存储设备。存储器52用于存储计算机程序以及计算机设备所需的其他程序和数据。存储器52还可以用于暂时地存储已经输出或者将要输出的数据。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机装置(可以是个人计算机,服务器,或者网络装置等)或处理器(Processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

Claims (8)

1.一种基于基础字典标注的发音标注方法,其特征在于,所述方法包括:
获取多个汉字单字和所述多个汉字单字中每个汉字单字对应的拼音标注;
将所述多个汉字单字中的每个汉字单字和所述每个汉字单字对应的拼音标注关联存储在第一字典;
获取多个拼音标注和所述多个拼音标注中每个拼音标注对应的训练发音标注;
将所述多个拼音标注中的每个拼音标注和所述每个拼音标注对应的训练发音标注关联存储在第二字典;
根据所述第一字典和所述第二字典确定第三字典,所述第三字典用于关联存储所述汉字单字和所述训练发音标注;
获取用户输入的待标注词汇;
基于所述待标注词汇从所述第三字典中查询训练发音标注;
将查询得到的训练发音标注作为所述待标注词汇的训练发音标注;
所述基于所述待标注词汇从所述第三字典中查询训练发音标注,包括:
将所述待标注词汇分割成多个单字;
确定所述多个单字中的多音字的拼音标注;
确定所述多音字的拼音标注对应的训练发音标注;
在所述第三字典中查询所述多个单字中除多音字外的每个单字的训练发音标注;
将所述多个单字的训练发音标注按照预设分隔符进行拼接,得到所述待标注词汇的训练发音标注;
所述确定所述多个单字中的多音字的拼音标注,包括:
将所述待标注词汇分割成的多个单字与第四字典中存储的多音字进行比较,得到所述待标注词汇中的多音字;
从所述待标注词汇中提取目标词语,所述目标词语为包含所述多音字的词语;
在所述第四字典中查找所述目标词语中包含的多音字的拼音标注,将查找到的拼音标注作为所述多音字在所述待标注词汇中的拼音标注,
其中,所述第四字典是通过下列步骤建立的:
获取多个多音字;
确定所述多个多音字中每个多音字的所有拼音标注和每个拼音标注对应的词语;
将所述多个多音字中每个多音字、所述每个多音字的所有拼音标注和所述每个拼音标注对应的词语关联存储在所述第四字典。
2.根据权利要求1所述的方法,其特征在于,在所述将所述多个拼音标注中的每个拼音标注和所述每个拼音标注对应的训练发音标注关联存储在第二字典之后,所述方法还包括:
接收标注方式更改指令,所述标注方式更改指令用于指示更改所述第二字典中的训练发音标注;
根据所述标注方式更改指令更改所述第二字典中的训练发音标注。
3.根据权利要求1或2所述的方法,其特征在于,所述获取用户输入的待标注词汇,包括:
接收所述用户输入的语音信息;
使用语音识别的方法识别所述语音信息,得到所述待标注词汇。
4.一种基于基础字典标注的发音标注装置,其特征在于,应用于如权利要求1所述的方法,所述装置包括:
第一获取单元,用于获取多个汉字单字和所述多个汉字单字中每个汉字单字对应的拼音标注;
第一存储单元,用于将所述多个汉字单字中的每个汉字单字和所述每个汉字单字对应的拼音标注关联存储在第一字典;
第二获取单元,用于获取多个拼音标注和所述多个拼音标注中每个拼音标注对应的训练发音标注;
第二存储单元,用于将所述多个拼音标注中的每个拼音标注和所述每个拼音标注对应的训练发音标注关联存储在第二字典;
第一确定单元,用于根据所述第一字典和所述第二字典确定第三字典,所述第三字典用于关联存储所述汉字单字和所述训练发音标注;
第三获取单元,用于获取用户输入的待标注词汇;
第一查询单元,用于基于所述待标注词汇从所述第三字典中查询训练发音标注;
第二确定单元,用于将查询得到的训练发音标注作为所述待标注词汇的训练发音标注。
5.根据权利要求4所述的装置,其特征在于,所述装置还包括:
第一接收单元,用于在所述第二存储单元将所述多个拼音标注中的每个拼音标注和所述每个拼音标注对应的训练发音标注关联存储在第二字典之后,接收标注方式更改指令,所述标注方式更改指令用于指示更改所述第二字典中的训练发音标注;
更改单元,用于根据所述标注方式更改指令更改所述第二字典中的训练发音标注。
6.根据权利要求4所述的装置,其特征在于,所述第一查询单元包括:
分割模块,用于将所述待标注词汇分割成多个单字;
第一确定模块,用于确定所述多个单字中的多音字的拼音标注;
第二确定模块,用于确定所述多音字的拼音标注对应的训练发音标注;
第一查询模块,用于在所述第三字典中查询所述多个单字中除多音字外的每个单字的训练发音标注;
第三确定模块,用于将所述多个单字的训练发音标注按照预设分隔符进行拼接,得到所述待标注词汇的训练发音标注。
7.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行权利要求1至3中任意一项所述的基于基础字典标注的发音标注方法。
8.一种计算机设备,包括存储器和处理器,所述存储器用于存储包括程序指令的信息,所述处理器用于控制程序指令的执行,其特征在于:所述程序指令被处理器加载并执行时实现权利要求1至3任意一项所述的基于基础字典标注的发音标注方法的步骤。
CN201910012153.0A 2019-01-07 2019-01-07 一种基于基础字典标注的发音标注方法和装置 Active CN109918619B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910012153.0A CN109918619B (zh) 2019-01-07 2019-01-07 一种基于基础字典标注的发音标注方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910012153.0A CN109918619B (zh) 2019-01-07 2019-01-07 一种基于基础字典标注的发音标注方法和装置

Publications (2)

Publication Number Publication Date
CN109918619A CN109918619A (zh) 2019-06-21
CN109918619B true CN109918619B (zh) 2024-04-26

Family

ID=66960172

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910012153.0A Active CN109918619B (zh) 2019-01-07 2019-01-07 一种基于基础字典标注的发音标注方法和装置

Country Status (1)

Country Link
CN (1) CN109918619B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110619112B (zh) * 2019-08-08 2024-03-05 北京金山安全软件有限公司 用于汉字的读音标注方法、装置、电子设备及存储介质
CN111143528B (zh) * 2019-12-20 2023-05-26 云知声智能科技股份有限公司 多音字词汇的标注方法及装置
CN111354339B (zh) * 2020-03-05 2023-11-03 深圳前海微众银行股份有限公司 词汇音素表构建方法、装置、设备及存储介质
CN112861487A (zh) * 2020-11-30 2021-05-28 新绎健康科技有限公司 一种用于对汉字五音进行标注的方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1421803A (zh) * 2001-11-30 2003-06-04 英业达股份有限公司 可处理多音字的拼音/注音转换系统及方法
US7430503B1 (en) * 2004-08-24 2008-09-30 The United States Of America As Represented By The Director, National Security Agency Method of combining corpora to achieve consistency in phonetic labeling
CN105096935A (zh) * 2014-05-06 2015-11-25 阿里巴巴集团控股有限公司 一种语音输入方法、装置和系统
CN105225659A (zh) * 2015-09-10 2016-01-06 中国航空无线电电子研究所 一种指令式语音控制发音词典辅助生成方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1421803A (zh) * 2001-11-30 2003-06-04 英业达股份有限公司 可处理多音字的拼音/注音转换系统及方法
US7430503B1 (en) * 2004-08-24 2008-09-30 The United States Of America As Represented By The Director, National Security Agency Method of combining corpora to achieve consistency in phonetic labeling
CN105096935A (zh) * 2014-05-06 2015-11-25 阿里巴巴集团控股有限公司 一种语音输入方法、装置和系统
CN105225659A (zh) * 2015-09-10 2016-01-06 中国航空无线电电子研究所 一种指令式语音控制发音词典辅助生成方法

Also Published As

Publication number Publication date
CN109918619A (zh) 2019-06-21

Similar Documents

Publication Publication Date Title
CN109918619B (zh) 一种基于基础字典标注的发音标注方法和装置
CN108829894B (zh) 口语词识别和语义识别方法及其装置
US10403282B2 (en) Method and apparatus for providing voice service
CN106571140B (zh) 一种基于语音语义的电器智能控制方法及系统
CN103456297B (zh) 一种语音识别匹配的方法和设备
CN108733778B (zh) 对象的行业类型识别方法和装置
CN108829893A (zh) 确定视频标签的方法、装置、存储介质和终端设备
CN101447185B (zh) 一种基于内容的音频快速分类方法
CN112784696B (zh) 基于图像识别的唇语识别方法、装置、设备及存储介质
CN111125354A (zh) 文本分类方法及装置
US11398228B2 (en) Voice recognition method, device and server
CN111104498A (zh) 一种任务型对话系统中的语义理解方法
US20080294433A1 (en) Automatic Text-Speech Mapping Tool
CN111401071A (zh) 模型的训练方法、装置、计算机设备和可读存储介质
CN108388553B (zh) 对话消除歧义的方法、电子设备及面向厨房的对话系统
JP2016536652A (ja) モバイル機器におけるリアルタイム音声評価システム及び方法
CN112699686B (zh) 基于任务型对话系统的语义理解方法、装置、设备及介质
CN107507619A (zh) 语音转换方法、装置、电子设备及可读存储介质
CN111737990B (zh) 一种词槽填充方法、装置、设备及存储介质
CN110633475A (zh) 基于计算机场景的自然语言理解方法、装置、系统和存储介质
CN110246496A (zh) 语音识别方法、系统、计算机设备及储存介质
WO2022267454A1 (zh) 分析文本的方法、装置、设备及存储介质
CN112818680A (zh) 语料的处理方法、装置、电子设备及计算机可读存储介质
CN112395392A (zh) 一种意图识别方法及装置、可读存储介质
CN110503956B (zh) 语音识别方法、装置、介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant