CN113806479A - 文本注音的方法、装置、电子设备及存储介质 - Google Patents
文本注音的方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN113806479A CN113806479A CN202111028262.5A CN202111028262A CN113806479A CN 113806479 A CN113806479 A CN 113806479A CN 202111028262 A CN202111028262 A CN 202111028262A CN 113806479 A CN113806479 A CN 113806479A
- Authority
- CN
- China
- Prior art keywords
- pronunciation
- text
- target
- annotated
- acquiring
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 56
- 238000013518 transcription Methods 0.000 claims description 14
- 230000035897 transcription Effects 0.000 claims description 14
- 230000011218 segmentation Effects 0.000 claims description 9
- 238000012545 processing Methods 0.000 abstract description 7
- 230000006870 function Effects 0.000 description 10
- 238000002372 labelling Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 235000001674 Agaricus brunnescens Nutrition 0.000 description 1
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 1
- 229910052791 calcium Inorganic materials 0.000 description 1
- 239000011575 calcium Substances 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000001747 pupil Anatomy 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/242—Dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Document Processing Apparatus (AREA)
Abstract
本申请公开了一种文本注音的方法、装置、电子设备及存储介质,涉及数据处理技术领域。该方法包括:获取待注音文本及与所述待注音文本发音关联的目标文本;获取与所述待注音文本对应的第一发音,并获取与所述目标文本对应的第二发音;基于所述第一发音以及所述第二发音获取目标发音;将所述目标发音作为所述待注音文本的发音。本方法实现了能够根据与待注音文本对应的第一发音、以及与待注音文本发音关联的目标文本对应的第二发音共同确定待注音文本的发音,从而可以减少与待注音文本不相关的歧义发音出现,提升用户使用体验。
Description
技术领域
本申请涉及数据处理技术领域,更具体地,涉及一种文本注音的方法、装置、电子设备及存储介质。
背景技术
目前的语音识别系统大多通过发音词典来给每个待识别的词汇添加发音,例如,可以通过发音词典使用拼音注音的方式对每个词汇进行发音标注;或者可以通过对每个待识别的词汇进行分词,然后从预先存储的发音词典中查找每个分词对应的发音,再将不同的发音拼接在一起,然而,该种方式容易引入多余的发音,产生歧义。
发明内容
本申请提出了一种文本注音的方法、装置、电子设备及存储介质,以改善上述问题。
第一方面,本申请实施例提供了一种文本注音的方法,所述方法包括:获取待注音文本及与所述待注音文本发音关联的目标文本;获取与所述待注音文本对应的第一发音,并获取与所述目标文本对应的第二发音;基于所述第一发音以及所述第二发音获取目标发音;将所述目标发音作为所述待注音文本的发音。
第二方面,本申请实施例提供了一种文本注音装置,所述装置包括:文本获取模块,用于获取待注音文本及与所述待注音文本发音关联的目标文本;发音获取模块,用于获取与所述待注音文本对应的第一发音,并获取与所述目标文本对应的第二发音;目标发音获取模块,用于基于所述第一发音以及所述第二发音获取目标发音;注音模块,用于将所述目标发音作为所述待注音文本的发音。
第三方面,本申请实施例提供了一种电子设备,包括:一个或多个处理器;存储器;一个或多个应用程序,其中所述一个或多个应用程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个应用程序配置用于执行上述第一方面提供的文本注音的方法。
第四方面,本申请实施例提供了一种计算机可读取存储介质,所述计算机可读取存储介质中存储有程序代码,所述程序代码可被处理器调用执行上述第一方面提供的文本注音的方法。
本申请提供的一种文本注音的方法、装置、电子设备及存储介质,通过获取待注音文本及与所述待注音文本发音关联的目标文本,继而获取与所述待注音文本对应的第一发音,并获取与所述目标文本对应的第二发音,再基于所述第一发音以及所述第二发音获取目标发音,然后将所述目标发音作为所述待注音文本的发音。从而通过上述方式实现了能够根据与待注音文本对应的第一发音、以及与待注音文本发音关联的目标文本对应的第二发音共同确定待注音文本的发音,从而可以减少与待注音文本不相关的歧义发音出现,提升用户使用体验。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了本申请一实施例提供的一种文本注音的方法的流程图。
图2示出了本申请另一实施例提供的一种文本注音的方法的流程图。
图3示出了本申请又一实施例提供的一种文本注音的方法的流程图。
图4示出了本申请实施例提供的一种文本注音装置的结构框图。
图5示出了本申请实施例提供的一种电子设备的结构框图。
图6示出了本申请实施例的用于保存或者携带实现根据本申请实施例的文本注音的方法的程序代码的存储单元。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。
现代语音识别系统大多通过发音词典来给每个待识别的词汇添加发音,例如,可以通过发音词典使用拼音注音的方式对每个词汇进行发音标注(包括拼音以及音调的标注),但通过这种方式标注时需要在不同的输入法之间来回切换,标注过程较为繁琐;或者可以通过对每个待识别的词汇进行分词,然后从预先存储的基础发音词典中查找每个分词对应的发音,再将不同的发音拼接在一起,然而,该种方式容易引入多余的发音,产生歧义。
发明人经过长期的研究发现,可以通过获取待注音文本及与所述待注音文本发音关联的目标文本,继而获取与所述待注音文本对应的第一发音,并获取与所述目标文本对应的第二发音,再基于所述第一发音以及所述第二发音获取目标发音,然后将所述目标发音作为所述待注音文本的发音。从而通过上述方式实现了能够根据与待注音文本对应的第一发音、以及与待注音文本发音关联的目标文本对应的第二发音共同确定待注音文本的发音,从而可以减少与待注音文本不相关的歧义发音出现,提升用户使用体验。
因此,为了改善上述问题,发明人提出了本申请提供的可以根据与待注音文本对应的第一发音、以及与待注音文本发音关联的目标文本对应的第二发音共同确定待注音文本的发音,从而可以减少与待注音文本不相关的歧义发音出现,提升用户使用体验的文本注音的方法、装置、电子设备及存储介质。
下面将结合附图具体描述本申请的各实施例。
请参阅图1,示出了本申请一实施例提供的一种文本注音的方法的流程图,本实施例提供一种文本注音的方法,可应用于电子设备,其中,本实施例中的电子设备可以为手机、平板电脑等具备网络连接功能的移动通信设备,具体设备类型可以不作限定。该方法包括:
步骤S110:获取待注音文本及与所述待注音文本发音关联的目标文本。
本实施例中,待注音文本表征需要进行发音注音的文本,例如,待注音文本可以为需要进行拼音注音的文本。其中,待注音文本可以包括语句或者词汇等,例如,待注音文本可以为“小学生喜欢玩泥巴”,或者,待注音文本可以为“稀泥”。可选的,待注音文本可以为中文文本(例如中文词汇)、英文文本或者其他任何语言/语种的文本,具体语言/语种可以不做限定,本申请实施例以待注音文本为中文文本为例进行说明。
其中,与待注音文本发音关联的目标文本可以理解为发音与待注音文本的发音相同的文本,或者可以理解为与待注音文本具有相似发音的文本,其中,具有相似发音的文本可以理解为具有相同声母和韵母但是声调可以存在差异的文本。需要说明的是,这里的具有相似发音指的是目标文本具有与待注音文本的发音相似的发音,并且该相似的发音表征目标文本的发音与待注音文本的发音的声母以及韵母相同而读音可以有差异,例如,待发音文本为“姑娘”,那么目标文本可以为“姑嬢”而不会为“菇凉”。作为一种方式,可以在获取待注音文本时,提示用户输入与待注音文本的发音相同的文本,或提示用户输入与待注音文本具有相似发音的文本,则可以获取用户输入的与待注音文本的发音关联的目标文本。例如,若待注音文本为“何平”,那么获取到的提示用户输入的目标文本可以为“和平”,若待注音文本为“井盖”,那么获取到的提示用户输入的目标文本可以为“井钙”。
需要说明的是,对于一些字而言,其可能是多音字,那么在确定与包括(包含)多音字的待注音文本发音关联的目标文本时,该目标文本为除所述多音字以外的文本(即该目标文本不包括待注音文本的多音字)。例如,多音字“和”包括的发音有:he2、he4、hu2、huo4以及huo2(其中,数字表示声/音调),对于包含多音字“和”的文本“和平”而言,平的发音为ping2,文本“和平”包括的发音有:he2ping2、he4ping2、hu2ping2、huo4ping2以及huo2ping2(其中,数字表示声/音调),在确定与文本“和平”的发音关联的目标文本时,该目标文本可以为“河平”,而不为“和瓶”。
作为一种方式,电子设备可以配置具备文本注音功能的应用程序,该应用程序存储有最新的常用文本的发音库,该应用程序配置有文本输入框,用户可以通过该输入框输入需要进行发音注音的文本,那么在这种方式下,电子设备可以将输入至该输入框的文本识别为待注音文本。可选的,该应用程序具备语言识别功能与语言翻译功能,若检测到用户输入了文本至输入框,且没有其他语言翻译功能对应的操作时,电子设备可以自动的为该文本标注其对应语言的发音,以便用户可以快速的获取该文本的准确发音,同时,通过自动的为该文本标注发音,避免了用户手动标注发音时需要在不同的输入法之间来回的切换的问题。
步骤S120:获取与所述待注音文本对应的第一发音,并获取与所述目标文本对应的第二发音。
在获取了待注音文本以及目标文本之后,若常用文本的发音库中不包括与待注音文本对应的发音、以及不包括与目标文本对应的发音,那么,作为一种方式,可以对待注音文本进行分词,得到至少两个第一分词,以及对目标文本进行分词,得到至少两个第二分词。其中,与待注音文本对应的发音表征待注音文本中的每个字的拼音搭配在一起的发音组合,类似的,与目标文本对应的发音表征目标文本中的每个字的拼音搭配在一起的发音组合。以待注音文本为“和平”为例,其中,“和”字的拼音包括“he2、he4、hu2、huo4以及huo2(其中,数字表示声/音调)”,而“平”字的拼音包括ping2,那么与待注音文本“和平”对应的发音包括“he2ping2、he4ping2、hu2ping2、huo4ping2以及huo2ping2(其中,数字表示声/音调)”。然后分别获取与至少两个第一分词对应的第一注音集合,以及获取与至少两个第二分词对应的第二注音集合,其中,第一注音集合由所述至少两个第一分词分别对应的拼音组成,所述第二注音集合由所述至少两个第二分词分别对应的拼音组成。则可以将第一注音集合作为与待注音文本对应的第一发音,将第二注音集合作为与目标文本对应的第二发音。
需要说明的是,本实施方式中对待注音文本进行分词可以包括将待注音文本分成各个独立的字,或者可以包括将待注音文本分成词语以及单个字;同理,对目标文本进行分词可以包括将目标文本分成各个独立的字,或者可以包括将目标文本分成词语以及单个字。
例如,在一个具体的应用场景中,假设待注音文本为“何平”,与待注音文本关联的目标文本为“和平”,若常用文本的发音库中不包括直接与“何平”以及“和平”对应的发音,那么可以将“何平”分词为“何”与“平”(此时即分词为各个独立的字),将“和平”分词为“和”与“平”(此时即分词为各个独立的字),获取到与“何”对应的注音包括he2、he1以及he4(其中,数字表示声调,例如,1表示一声,2表示二声,4表示四声),获取到与“平”对应的注音包括ping2,那么可以得到由分词“何”以及分词“平”组成的第一注音集合包括{he2 ping2;he1 ping2;he4 ping2},即与待注音文本对应的第一发音包括{he2 ping2;he1 ping2;he4ping2}。同理,可以获取到与“和”对应的注音包括he2、he4、hu2、huo4以及huo2,获取到与“平”对应的注音包括ping2,那么可以得到由分词“和”以及分词“平”组成的第二注音集合包括{he2 ping2;he4 ping2;hu2 ping2;huo4 ping2;huo2 ping2},即与目标文本对应的第二发音包括{he2 ping2;he4 ping2;hu2 ping2;huo4 ping2;huo2 ping2}。
本实施方式中,在将待注音文本分成词语以及单个字的情况下,常用的文本库中可以包括该分词后的词语对应的发音,而可以不包括该分词后的单个字对应的发音,其中,可以先查询常用的文本库中是否包括待注音文本中可能会出现的词语的发音。可选的,若查询到常用的文本库中不包括待注音文本中可能会出现的词语的发音,那么可以直接将待注音文本分词为各个独立的字,而若查询到常用的文本库中包括待注音文本中可能会出现的词语的发音,在这种方式下,可以获取与该单个字的发音近似的发音,进而根据该近似的发音以及该分词后的词语对应的发音获取该待注音文本的发音。
例如,在一个具体的应用场景中,假设待注音文本为“搅稀泥”,作为一种实现方式,在对该注音文本进行分词时,可以先查询常用的文本库中是否包括词语“搅稀”和/或“稀泥”的发音,可选的,若查询出常用的文本库中不包括词语“搅稀”和/或“稀泥”的发音,那么可以将待注音文本“搅稀泥”直接分词为各个独立的字,即分词为“搅”、“稀”以及“泥”;若查询出常用的文本库中包括不词语“搅稀”的发音而包括词语“稀泥”的发音时,那么可以将其分词为词语“稀泥”以及单个字“搅”。其中,若获取到词典中存储的与“稀泥”对应的发音为“xi1ni2(其中,数字表示声调)”,获取到与“搅”的近似发音的常用字为“脚”,“脚”的发音为“jiao3”(其中,数字表示声调),那么可以得到所述单个字“搅”的发音为“jiao3”,那么与待注音文本“搅稀泥”对应的发音为“jiao3xi1ni2(其中,数字表示声调)”。
可选的,本实施方式可以从预设发音词典中获取与至少两个第一分词对应的第一注音集合,以及获取与至少两个第二分词对应的第二注音集合;或者可以从网络上获取与至少两个第一分词对应的第一注音集合,以及获取与至少两个第二分词对应的第二注音集合;或者可以从预设发音词典以及网络上获取与至少两个第一分词对应的第一注音集合,以及获取与至少两个第二分词对应的第二注音集合,第一注音集合以及第二注音集合的具体来源可以不作限定。
步骤S130:基于所述第一发音以及所述第二发音获取目标发音。
在获取了与待注音文本对应的第一发音,以及获取了与目标文本对应的第二发音的情况下,可以基于第一发音以及第二发音获取目标发音,目标发音表征第一发音以及第二发音共同包括的发音。例如,在上述示例中,可以基于第一发音{he2 ping2;he1 ping2;he4 ping2}以及第二发音{he2 ping2;he4 ping2;hu2 ping2;huo4ping2;huo2 ping2}获取目标发音“he2 ping2”。
步骤S140:将所述目标发音作为所述待注音文本的发音。
在上述示例中,可以将“he2 ping2”作为待注音文本的发音,通过基于待注音文本的发音结果以及与待注音文本关联的目标文本的发音结果,共同确定待注音文本的发音,一方面可以实现准确的确定待注音文本的发音,另一方面可以避免因直接确定待注音文本的发音而引入的歧义发音。
本实施例提供的文本注音的方法,通过获取待注音文本及与所述待注音文本发音关联的目标文本,继而获取与所述待注音文本对应的第一发音,并获取与所述目标文本对应的第二发音,再基于所述第一发音以及所述第二发音获取目标发音,然后将所述目标发音作为所述待注音文本的发音。从而通过上述方式实现了能够根据与待注音文本对应的第一发音、以及与待注音文本发音关联的目标文本对应的第二发音共同确定待注音文本的发音,从而可以减少与待注音文本不相关的歧义发音出现,提升用户使用体验。
请参阅图2,示出了本申请另一实施例提供的一种文本注音的方法的流程图,本实施例提供一种文本注音的方法,可应用于电子设备,该方法包括:
步骤S210:获取待注音文本及与所述待注音文本发音关联的目标文本。
步骤S220:从预设发音词典获取与所述待注音文本对应的第一发音,从预设发音词典或网络上获取与所述目标文本对应的第二发音。
作为一种方式,若常用文本的发音库(这里可以理解为预设发音词典)中包括与待注音文本对应的发音、以及包括与目标文本对应的发音,那么可以从预设发音词典中获取与待注音文本对应的第一发音,以及从预设发音词典中获取与目标文本对应的第二发音。
作为另外一种方式,若常用的文本的发音库(这里可以理解为预设发音词典)中包括与待注音文本对应的发音、但不包括与目标文本对应的发音,那么可以从预设发音词典中获取与待注音文本对应的第一发音,从网络上获取与目标文本对应的第二发音,从而可以确保即便是预设发音词典中不包括与目标文本对应的发音,也能找出与目标文本对应的发音,进而可以确保找出正确的待注音文本的发音,提升用户使用体验。
步骤S230:将所述第一发音以及所述第二发音中内容相同的发音获取作为目标发音。
其中,参照前述实施例的相关描述,第一发音可以包括一个或者多个发音,第二发音也可以包括一个或者多个发音,作为一种方式,可以将第一发音以及第二发音中内容相同的发音获取作为目标发音,其中,内容相同表示注音与音调均相同。例如,对于前述实施例中的第一发音{he2 ping2;he1 ping2;he4 ping2}以及第二发音{he2 ping2;he4ping2;hu2 ping2;huo4 ping2;huo2 ping2},可以得到目标发音为“he2 ping2”。
步骤S240:若所述目标发音的数量为多个,将多个目标发音中使用频率高于指定频率对应的发音作为所述待注音文本的发音。
在一种实现方式中,若基于第一发音以及第二发音获取得到目标发音的数量为多个,为了便于用户可以从多个目标发音中准确的确定待注音文本的当前发音,可以将多个目标发音中使用频率高于指定频率(具体数值可以不作限定,例如可以为10次/周,200次/月等数值)对应的发音作为待注音文本的发音,以便于可以根据目标发音的使用频率确定待注音文本的发音。其中,电子设备可以记录每一文本的注音被使用的频率。
在另一种实现方式中,若基于第一发音以及第二发音获取得到目标发音的数量为多个,可以将多个目标发音中最近一次使用的发音作为待注音文本的发音,其中最近一次使用过的发音可能是用户经常使用的发音,以便于可以根据用户的使用习惯确定待注音文本的发音。
本实施例提供的文本注音的方法,通过获取待注音文本及与所述待注音文本发音关联的目标文本,继而从预设发音词典获取与所述待注音文本对应的第一发音,从预设发音词典或网络上获取与所述目标文本对应的第二发音,再将所述第一发音以及所述第二发音中内容相同的发音获取作为目标发音,然后若所述目标发音的数量为多个,将多个目标发音中使用频率高于指定频率对应的发音作为所述待注音文本的发音。从而通过上述方式实现了能够根据与待注音文本对应的第一发音、以及与待注音文本发音关联的目标文本对应的第二发音共同确定待注音文本的发音,从而可以减少与待注音文本不相关的歧义发音出现,提升用户使用体验。
请参阅图3,示出了本申请又一实施例提供的一种文本注音的方法的流程图,本实施例提供一种文本注音的方法,可应用于电子设备,该方法包括:
步骤S310:获取待注音文本及与所述待注音文本发音关联的目标文本。
步骤S320:从预设发音词典获取与所述待注音文本对应的第一发音,从预设发音词典或网络上获取与所述目标文本对应的第二发音。
步骤S330:将所述第一发音以及所述第二发音中内容相同的发音获取作为目标发音。
步骤S340:若所述目标发音的数量为多个,获取所述待注音文本对应的语境。
其中,若目标发音的数量为多个,可以获取待注音文本对应的语境,以便于根据待注音文本的语境确定待注音文本的发音,可选的,不同的语境对应的发音不同。本实施方式中,可以通过对待注音文本的语义内容进行分析的方式获取待注音文本对应的语境,具体的,在确定目标发音的数量为多个的时候,可以显示与不同目标发音的待注音文本各自对应的语句,其中,待注音文本在不同的语句中的语境不同,不同的语句中的待注音文本的发音不同,并提示用户选择与待注音文本当前要表达的语境最符合的语句,进而将待注音文本在该选择的语句中的语境作为所述待注音文本对应的语境。
例如,若待注音文本为“何平”,其中,“何”对应的注音包括he2(例如,当“何”字为疑问代词、副词以及姓氏时)、he1(古同“呵”,表示谴责)以及he4(古同“荷”,担),则可以显示包括待注音文本“何(he2)平(ping2)”的语句1,显示包括待注音文本“何(he1)平(ping2)”的语句2,以及显示包括待注音文本“何(he4)平(ping2)”的语句3,并提示用户选择与待注音文本“何平”当前要表达的语境最符合的语句,例如,若用户选择了语句1,那么可以将待注音文本在语句1中的语境作为待注音文本对应的语境,若用户选择了语句2,那么可以将待注音文本在语句2中的语境作为待注音文本对应的语境。
步骤S350:将多个目标发音中与所述语境对应的发音作为所述待注音文本的发音。
在上述示例中,若用户选择了语句1,那么可以将待注音文本“何平”在语句1中的发音“he2ping2”作为待注音文本“何平”最终的发音,而若用户选择的语句2,那么可以将待注音文本“何平”在语句2中的发音“he1ping2”作为待注音文本“何平”最终的发音。
本实施例提供的文本注音的方法,通过获取待注音文本及与所述待注音文本发音关联的目标文本,继而从预设发音词典获取与所述待注音文本对应的第一发音,从预设词典或网络上获取与所述目标文本对应的第二发音,再将所述第一发音以及所述第二发音中内容相同的发音获取作为目标发音,若所述目标发音的数量为多个,获取所述待注音文本对应的语境,然后将多个目标发音中与所述语境对应的发音作为所述待注音文本的发音。从而通过上述方式实现了能够根据与待注音文本对应的第一发音、以及与待注音文本发音关联的目标文本对应的第二发音共同确定待注音文本的发音,从而可以减少与待注音文本不相关的歧义发音出现,提升用户使用体验。
请参阅图4,为本申请实施例提供的一种文本注音装置的结构框图,本实施例提供一种文本注音装置400,可以运行于电子设备,所述装置400包括:文本获取模块410、发音获取模块420、目标发音获取模块430以及注音模块440:
文本获取模块410,用于获取待注音文本及与所述待注音文本发音关联的目标文本。
发音获取模块420,用于获取与所述待注音文本对应的第一发音,并获取与所述目标文本对应的第二发音。
作为一种方式,发音获取模块420具体可以用于对所述待注音文本进行分词,得到至少两个第一分词;获取与所述至少两个第一分词对应的第一注音集合,所述第一注音集合由所述至少两个第一分词分别对应的拼音组成;将所述第一注音集合作为与所述待注音文本对应的第一发音;以及发音获取模块420具体可以用于对所述目标文本进行分词,得到至少两个第二分词;获取与所述至少两个第二分词对应的第二注音集合,所述第二注音集合由所述至少两个第二分词分别对应的拼音组成;将所述第二注音集合作为与所述目标文本对应的第二发音。
其中,所述获取与所述至少两个第一分词对应的第一注音集合,包括:从预设发音词典或网络上获取与所述至少两个第一分词对应的第一注音集合。
作为另外一种方式,发音获取模块420具体可以用于从预设发音词典获取与所述待注音文本对应的第一发音,从预设词典或网络上获取与所述目标文本对应的第二发音。
目标发音获取模块430,用于基于所述第一发音以及所述第二发音获取目标发音。
作为一种方式,目标发音获取模块430可以用于将所述第一发音以及所述第二发音中内容相同的发音获取作为目标发音。
注音模块440,用于将所述目标发音作为所述待注音文本的发音。
在一种实现方式中,注音模块440可以用于若所述目标发音的数量为多个,将多个目标发音中使用频率高于指定频率对应的发音作为所述待注音文本的发音。
在另一种实现方式中,注音模块440可以用于若所述目标发音的数量为多个,获取所述待注音文本对应的语境;将多个目标发音中与所述语境对应的发音作为所述待注音文本的发音。
本实施例提供的文本注音的装置,通过获取待注音文本及与所述待注音文本发音关联的目标文本,继而获取与所述待注音文本对应的第一发音,并获取与所述目标文本对应的第二发音,再基于所述第一发音以及所述第二发音获取目标发音,然后将所述目标发音作为所述待注音文本的发音。从而通过上述方式实现了能够根据与待注音文本对应的第一发音、以及与待注音文本发音关联的目标文本对应的第二发音共同确定待注音文本的发音,从而可以减少与待注音文本不相关的歧义发音出现,提升用户使用体验。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述装置和模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,模块相互之间的耦合可以是电性,机械或其它形式的耦合。
另外,在本申请各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。
请参阅图5,基于上述的文本注音的方法及装置,本申请实施例还提供了一种可以执行前述文本注音的方法的电子设备100。电子设备100包括存储器102以及相互耦合的一个或多个(图中仅示出一个)处理器104,存储器102以及处理器104之间通信线路连接。存储器102中存储有可以执行前述实施例中内容的程序,而处理器104可以执行存储器102中存储的程序。
其中,处理器104可以包括一个或者多个处理核。处理器104利用各种接口和线路连接整个电子设备100内的各个部分,通过运行或执行存储在存储器102内的指令、程序、代码集或指令集,以及调用存储在存储器102内的数据,执行电子设备100的各种功能和处理数据。可选地,处理器104可以采用数字信号处理(Digital Signal Processing,DSP)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、可编程逻辑阵列(ProgrammableLogic Array,PLA)中的至少一种硬件形式来实现。处理器104可集成中央处理器(CentralProcessing Unit,CPU)、图像处理器(Graphics Processing Unit,GPU)和调制解调器等中的一种或几种的组合。其中,CPU主要处理操作系统、用户界面和应用程序等;GPU用于负责显示内容的渲染和绘制;调制解调器用于处理无线通信。可以理解的是,上述调制解调器也可以不集成到处理器104中,单独通过一块通信芯片进行实现。
存储器102可以包括随机存储器(Random Access Memory,RAM),也可以包括只读存储器(Read-Only Memory)。存储器102可用于存储指令、程序、代码、代码集或指令集。存储器102可包括存储程序区和存储数据区,其中,存储程序区可存储用于实现操作系统的指令、用于实现至少一个功能的指令(比如触控功能、声音播放功能、图像播放功能等)、用于实现前述各个实施例的指令等。存储数据区还可以存储电子设备100在使用中所创建的数据(比如电话本、音视频数据、聊天记录数据)等。
请参考图6,其示出了本申请实施例提供的一种计算机可读存储介质的结构框图。该计算机可读介质500中存储有程序代码,所述程序代码可被处理器调用执行上述方法实施例中所描述的方法。
计算机可读存储介质500可以是诸如闪存、EEPROM(电可擦除可编程只读存储器)、EPROM、硬盘或者ROM之类的电子存储器。可选地,计算机可读存储介质500包括非易失性计算机可读介质(non-transitory computer-readable storage medium)。计算机可读存储介质500具有执行上述方法中的任何方法步骤的程序代码510的存储空间。这些程序代码可以从一个或者多个计算机程序产品中读出或者写入到这一个或者多个计算机程序产品中。程序代码510可以例如以适当形式进行压缩。
综上所述,本申请实施例提供的一种文本注音的方法、装置、电子设备及存储介质,通过获取待注音文本及与所述待注音文本发音关联的目标文本,继而获取与所述待注音文本对应的第一发音,并获取与所述目标文本对应的第二发音,再基于所述第一发音以及所述第二发音获取目标发音,然后将所述目标发音作为所述待注音文本的发音。从而通过上述方式实现了能够根据与待注音文本对应的第一发音、以及与待注音文本发音关联的目标文本对应的第二发音共同确定待注音文本的发音,从而可以减少与待注音文本不相关的歧义发音出现,提升用户使用体验。
最后应说明的是:以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不驱使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。
Claims (10)
1.一种文本注音的方法,其特征在于,所述方法包括:
获取待注音文本及与所述待注音文本发音关联的目标文本;
获取与所述待注音文本对应的第一发音,并获取与所述目标文本对应的第二发音;
基于所述第一发音以及所述第二发音获取目标发音;
将所述目标发音作为所述待注音文本的发音。
2.根据权利要求1所述的方法,其特征在于,所述获取与所述待注音文本对应的第一发音,并获取与所述目标文本对应的第二发音,包括:
对所述待注音文本进行分词,得到至少两个第一分词;
获取与所述至少两个第一分词对应的第一注音集合,所述第一注音集合由所述至少两个第一分词分别对应的拼音组成;
将所述第一注音集合作为与所述待注音文本对应的第一发音;
对所述目标文本进行分词,得到至少两个第二分词;
获取与所述至少两个第二分词对应的第二注音集合,所述第二注音集合由所述至少两个第二分词分别对应的拼音组成;
将所述第二注音集合作为与所述目标文本对应的第二发音。
3.根据权利要求2所述的方法,其特征在于,所述获取与所述至少两个第一分词对应的第一注音集合,包括:
从预设发音词典或网络上获取与所述至少两个第一分词对应的第一注音集合。
4.根据权利要求1所述的方法,其特征在于,所述获取与所述待注音文本对应的第一发音,并获取与所述目标文本对应的第二发音,包括:
从预设发音词典获取与所述待注音文本对应的第一发音,从预设发音词典或网络上获取与所述目标文本对应的第二发音。
5.根据权利要求1所述的方法,其特征在于,所述基于所述第一发音以及所述第二发音获取目标发音,包括:
将所述第一发音以及所述第二发音中内容相同的发音获取作为所述目标发音。
6.根据权利要求1-5任一项所述的方法,其特征在于,所述将所述目标发音作为所述待注音文本的发音,包括:
若所述目标发音的数量为多个,将多个目标发音中使用频率高于指定频率对应的发音作为所述待注音文本的发音。
7.根据权利要求1-5任一项所述的方法,其特征在于,所述将所述目标发音作为所述待注音文本的发音,包括:
若所述目标发音的数量为多个,获取所述待注音文本对应的语境;
将多个目标发音中与所述语境对应的发音作为所述待注音文本的发音。
8.一种文本注音的装置,其特征在于,所述装置包括:
文本获取模块,用于获取待注音文本及与所述待注音文本发音关联的目标文本;
发音获取模块,用于获取与所述待注音文本对应的第一发音,并获取与所述目标文本对应的第二发音;
目标发音获取模块,用于基于所述第一发音以及所述第二发音获取目标发音;
注音模块,用于将所述目标发音作为所述待注音文本的发音。
9.一种电子设备,其特征在于,包括一个或多个处理器以及存储器;
一个或多个程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序配置用于执行权利要求1-7任一所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有程序代码,其中,在所述程序代码被处理器运行时执行权利要求1-7任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111028262.5A CN113806479A (zh) | 2021-09-02 | 2021-09-02 | 文本注音的方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111028262.5A CN113806479A (zh) | 2021-09-02 | 2021-09-02 | 文本注音的方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113806479A true CN113806479A (zh) | 2021-12-17 |
Family
ID=78894643
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111028262.5A Pending CN113806479A (zh) | 2021-09-02 | 2021-09-02 | 文本注音的方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113806479A (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104317505A (zh) * | 2014-10-12 | 2015-01-28 | 渤海大学 | 一种汉语拼音的输出系统及方法 |
CN109977361A (zh) * | 2019-03-01 | 2019-07-05 | 广州多益网络股份有限公司 | 一种基于相似词的汉语拼音标注方法、装置及存储介质 |
CN112530402A (zh) * | 2020-11-30 | 2021-03-19 | 深圳市优必选科技股份有限公司 | 一种语音合成方法、语音合成装置及智能设备 |
CN112818089A (zh) * | 2021-02-23 | 2021-05-18 | 掌阅科技股份有限公司 | 文本注音方法、电子设备及存储介质 |
CN113157852A (zh) * | 2021-04-26 | 2021-07-23 | 深圳市优必选科技股份有限公司 | 语音处理的方法、系统、电子设备及存储介质 |
-
2021
- 2021-09-02 CN CN202111028262.5A patent/CN113806479A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104317505A (zh) * | 2014-10-12 | 2015-01-28 | 渤海大学 | 一种汉语拼音的输出系统及方法 |
CN109977361A (zh) * | 2019-03-01 | 2019-07-05 | 广州多益网络股份有限公司 | 一种基于相似词的汉语拼音标注方法、装置及存储介质 |
CN112530402A (zh) * | 2020-11-30 | 2021-03-19 | 深圳市优必选科技股份有限公司 | 一种语音合成方法、语音合成装置及智能设备 |
CN112818089A (zh) * | 2021-02-23 | 2021-05-18 | 掌阅科技股份有限公司 | 文本注音方法、电子设备及存储介质 |
CN113157852A (zh) * | 2021-04-26 | 2021-07-23 | 深圳市优必选科技股份有限公司 | 语音处理的方法、系统、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10832654B2 (en) | Recognizing accented speech | |
CN105917327B (zh) | 用于将文本输入到电子设备中的系统和方法 | |
CN107729313B (zh) | 基于深度神经网络的多音字读音的判别方法和装置 | |
JP5901001B1 (ja) | 音響言語モデルトレーニングのための方法およびデバイス | |
US11176141B2 (en) | Preserving emotion of user input | |
CN109616096B (zh) | 多语种语音解码图的构建方法、装置、服务器和介质 | |
WO2016149688A1 (en) | Systems and methods for structured stem and suffix language models | |
US20160055763A1 (en) | Electronic apparatus, pronunciation learning support method, and program storage medium | |
JP2015094848A (ja) | 情報処理装置、情報処理方法、およびプログラム | |
CN109684638B (zh) | 分句方法及其装置、电子设备、计算机可读存储介质 | |
TW201606750A (zh) | 使用外國字文法的語音辨識 | |
CN113225612A (zh) | 字幕生成方法、装置、计算机可读存储介质及电子设备 | |
CN109582775B (zh) | 信息录入方法、装置、计算机设备及存储介质 | |
CN112559725A (zh) | 文本匹配方法、装置、终端和存储介质 | |
JP5701327B2 (ja) | 音声認識装置、音声認識方法、およびプログラム | |
CN112527967A (zh) | 文本匹配方法、装置、终端和存储介质 | |
CN116229935A (zh) | 语音合成方法、装置、电子设备及计算机可读介质 | |
CN113806479A (zh) | 文本注音的方法、装置、电子设备及存储介质 | |
CN111368553B (zh) | 智能词云图数据处理方法、装置、设备及存储介质 | |
CN110428668B (zh) | 一种数据提取方法、装置、计算机系统及可读存储介质 | |
JP2019095603A (ja) | 情報生成プログラム、単語抽出プログラム、情報処理装置、情報生成方法及び単語抽出方法 | |
CN113486672A (zh) | 多音字消歧方法及电子设备和计算机可读存储介质 | |
JP2008243076A (ja) | 翻訳装置、方法及びプログラム | |
KR101777141B1 (ko) | 한글 입력 키보드를 이용한 훈민정음 기반 중국어 및 외국어 입력 장치 및 방법 | |
JP3958908B2 (ja) | 書き起こしテキスト自動生成装置、音声認識装置および記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |