CN104142909A - 一种汉字注音方法及装置 - Google Patents
一种汉字注音方法及装置 Download PDFInfo
- Publication number
- CN104142909A CN104142909A CN201410190961.3A CN201410190961A CN104142909A CN 104142909 A CN104142909 A CN 104142909A CN 201410190961 A CN201410190961 A CN 201410190961A CN 104142909 A CN104142909 A CN 104142909A
- Authority
- CN
- China
- Prior art keywords
- pronunciation
- field
- probable value
- multitone
- pronunciations
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 27
- 230000011218 segmentation Effects 0.000 claims description 30
- 230000000694 effects Effects 0.000 abstract description 17
- 230000003203 everyday effect Effects 0.000 description 18
- 230000014509 gene expression Effects 0.000 description 18
- 238000004891 communication Methods 0.000 description 4
- 239000000463 material Substances 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000000712 assembly Effects 0.000 description 1
- 238000000429 assembly Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/169—Annotation, e.g. comment data or footnotes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/126—Character encoding
- G06F40/129—Handling non-Latin characters, e.g. kana-to-kanji conversion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/253—Grammatical analysis; Style critique
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Human Computer Interaction (AREA)
- Machine Translation (AREA)
Abstract
本发明实施例公开一种汉字注音方法及装置,其中方法包括如下步骤:当对所输入的文本中的多音字段进行注音时,获取所述多音字段的至少两种读音;对所述至少两种读音中每种读音进行概率预测,并生成预测结果;根据预测结果确定所述多音字段的当前读音。可以实现对多音字词进行准确注音,提升阅读文本的效率及效果。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种汉字注音方法及装置。
背景技术
随着汉字的广泛运用,对于汉语学习者来说,在阅读汉字文本的过程中经常遇到一些字段不会读,特别是对于一些多音字段,因此往往在阅读中遇到障碍,尽管可以通过查字典来获得多音字段的读音,但需要花费较长的时间,并且由于字典概括的范围较大,用户难以把握多音字段的最准确的读法,降低了阅读文本的效率及效果,进而影响汉语学习的效果。
发明内容
本发明实施例提供一种汉字注音方法及装置,可以实现对多音字词进行准确注音,提升阅读文本的效率及效果。
为了解决上述技术问题,本发明实施例第一方面提供了一种汉字注音方法,可包括:
当对所输入的文本中的多音字段进行注音时,获取所述多音字段的至少两种读音;
对所述至少两种读音中每种读音进行概率预测,并生成预测结果;
根据预测结果确定所述多音字段的当前读音。
本发明实施例第二方面提供了一种汉字注音装置,可包括:
读音获取模块,用于当对所输入文本中的多音字段进行注音时,获取所述多音字段的至少两种读音;
预测模块,用于对所述至少两种读音中每种读音进行概率预测,并生成预测结果;
读音确定模块,用于根据预测结果确定所述多音字段的当前读音。
在本发明实施例中,当对所输入的文本中的多音字段进行注音时,对多音字段的至少两种读音中每种读音进行概率预测,并根据预测结果确定多音字段的当前读音,实现了对多音字段的准确注音,提升阅读文本的效率及效果,进而提升了汉语学习的效果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种汉字注音方法的流程示意图;
图2是本发明实施例提供的另一种汉字注音方法的流程示意图;
图3是本发明实施例提供的一种汉字注音装置的结构示意图;
图4是本发明实施例提供的另一种汉字注音装置的结构示意图;
图5是本发明实施例提供的预测模块的结构示意图;
图6是本发明实施例提供的结果生成单元的结构示意图;
图7是本发明实施例提供的又一种汉字注音装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供的汉字注音方法可以应用于对阅读文本中的多音字段进行注音的场景,例如:当汉字注音装置接收到输入的文本,且当对所输入的文本中的多音字段进行注音时,所述汉字注音装置获取所述多音字段的至少两种读音,对所述至少两种读音中每种读音进行概率预测,并生成预测结果,所述汉字注音装置根据预测结果确定所述多音字段的当前读音的场景等。通过对多音字段的至少两种读音中每种读音进行概率预测,实现了对多音字段的准确注音,提升阅读文本的效率及效果。
本发明实施例涉及的汉字注音装置可以包括:计算机、平板电脑、智能手机、笔记本电脑、掌上电脑以及移动互联网设备(MID)等终端设备,所述文本可以为一篇文章、一段文字内容、一个句子、一个词语或一个汉字;所述多音字段可以为所述文本中的多音汉字或多音词语。
下面将结合附图1和附图2,对本发明实施例提供的汉字注音方法进行详细介绍。
请参见图1,为本发明实施例提供了一种汉字注音方法的流程示意图。如图1所示,本发明实施例的所述方法包括以下步骤S101-步骤S103。
S101,当对所输入的文本中的多音字段进行注音时,获取所述多音字段的至少两种读音;
具体的,用户可以将待注音的文本输入至汉字注音装置,输入的方式可以通过复制粘贴该文本,或者通过扫描设备扫描该文本等,所述汉字注音装置获取用户所述文本,当所述汉字注音装置对所述文本中的多音字段进行注音时,所述汉字注音装置获取所述多音字段的至少两种读音。
需要说明的是,在对所输入的文本中的多音字段进行注音之前,所述汉字注音装置需要对所述文本进行分词处理,例如:假设所述文本为“可以带你去长长见识”,所述汉字注音装置优选的可以根据词性对所述文本进行分词处理,分词处理后的所述文本为“可以/带/你/去/长长/见识”。
所述汉字注音装置可以获取分词处理后所述文本中的字段和所述字段的读音属性信息,所述读音属性信息包括读音种数和默认读音。可以理解的是,所述汉字注音装置中预先建立了包含所有字段读音的字典以及常用词语的词典,对于只有一种读音的汉字,直接在字典中建立汉字与读音的对应关系,将该读音作为该汉字的默认读音,而对于多音汉字,则将使用频率最高的读音作为多音汉字的默认读音;而词典的设置与字典的设置相同,对于只有一种读音的词语,在词典中建立词语与读音的对应关系,将该读音作为该词语的默认读音,而对于多音词语,则将使用频率最高的读音作为多音词语的默认读音,例如:多音词语“长长”,其读音有三种,分别是“chang2chang2、zhang3chang2、zhang3zhang3”,其中,拼音后的数字表示声调(以下均统一采用此种格式),由于“chang2chang2”使用的频率最高,因此将“chang2chang2”作为“长长”的默认读音;对于一些固定词语,例如:“曝”有两种读音,而在“一曝十寒”中的读音是唯一的,并且“一曝十寒”属于成语,可以被认为是常用词语,因此还可以建立常用词语的词典,并部分确定多音字在常用词语中的读音。
因此,依据上述分词处理后的所述文本“可以/带/你/去/长长/见识”为例,则获取所述文本中所述字段的读音属性信息如下(字段/词性/读音种数/默认读音):
可以/adv/1/ke3yi3;
带/v/1/dai4;
你/pron/1/ni3;
去/v/1/qu4;
长长/v/3/chang2chang2;
见识/n/1/jian4shi3;
其中,所述读音属性信息还可以包括每个字段的词性,通过词性配合字段本身进行读音种数和默认读音的查找,可以进一步提高注音的准确性。需要说明的是,假设词典中没有记载“可以”这个字段,则所述汉字注音装置可以在字典中分别查询“可”和“以”的读音属性信息。
进一步的,当所述读音种数大于一时,所述汉字注音装置确定所述字段为多音字段,并获取所述多音字段的至少两种读音;
当所述读音种数等于一时,所述汉字注音装置将所述默认读音确定为所述字段的当前读音。
S102,对所述至少两种读音中每种读音进行概率预测,并生成预测结果;
具体的,当所述汉字注音装置获取了所述多音字段的至少两种读音后,所述汉字注音装置分别获取所述至少两种读音中每种读音的概率值,并根据所述每种读音的概率值的数值大小生成预测结果。
进一步的,所述汉字注音装置预先存储有包含特定的多音字段的训练语料,采用条件随机场(Conditional Random Fields,CRF)训练算法获取所述特定的多音字段中每一个多音字段的CRF模型,所述CRF模型为所述汉字注音装置通过分析训练语料中的语言特征(例如:前一个词、后一个词、词性、句首、句末以及其他特定的词语或句子结构等),所建立的模型。所述汉字注音装置可以根据预存的训练语料获取所述多音字段的CRF模型,并通过分析所述多音字段在所述文本中的字段特征(例如:前一个词、后一个词、词性、句首、句末以及其他特定的词语或句子结构等),获取所述至少两种读音中每种读音的概率值,并获取所述每种读音的概率值中第一概率值与第二概率值的差值,当所述差值大于预设阈值时,确定所述第一概率值对应的读音为优先级最高的读音;当所述差值小于或等于所述预设阈值时,确定所述默认读音为优先级最高的读音。其中,所述第一概率值为所述每种读音的概率值中数值最大的概率值,所述第二概率值为所述每种读音的概率值中数值次大的概率值,所述预设阈值为根据人为经验所设置。
参照上述举例,所述多音字段为“长长”,其读音有三种,分别是“chang2chang2、zhang3chang2、zhang3zhang3”,通过分析所获取的对应的概率值为0.2、0.1、0.7,则第一概率值为0.7,第二概率值为0.2,假设预设阈值为0.1,由于所述第一概率值与所述第二概率值的差值为0.5,大于所述预设阈值,因此将所述第一概率值对应的读音,即“zhang3zhang3”确定为优先级最高的读音。
S103,根据预测结果确定所述多音字段的当前读音;
具体的,所述汉字注音装置将所述优先级最高的读音确定为所述多音字段的当前读音。
进一步的,所述汉字注音装置对所述文本及所述文本中的字段对应的当前注音进行输出,参照上述举例,输出的结果为“可以带你去长长见识(ke3yi3dai4ni3qu4zhang3zhang3jian4shi2)”。并可以将输出的结果转换为语音输出。
在本发明实施例中,当对所输入的文本中的多音字段进行注音时,对多音字段的至少两种读音中每种读音进行概率预测,并根据预测结果确定多音字段的当前读音,实现了对多音字段的准确注音;通过词性配合字段本身进行读音种数和默认读音的查找,可以进一步提高注音的准确性,提升阅读文本的效率及效果,进而提升了汉语学习的效果。
请参见图2,为本发明实施例提供了另一种汉字注音方法的流程示意图。如图2所示,本发明实施例的所述方法包括以下步骤S201-步骤S207。
S201,对所输入的文本进行分词处理,并获取分词处理后所述文本中的字段和所述字段的读音属性信息,所述读音属性信息包括读音种数和默认读音;
具体的,用户可以将待注音的文本输入至所述汉字注音装置,输入的方式可以通过复制粘贴该文本,或者通过扫描设备扫描该文本等,汉字注音装置需要对所述文本进行分词处理,例如:假设所述文本为“可以带你去长长见识”,所述汉字注音装置优选的可以根据词性对所述文本进行分词处理,分词处理后的所述文本为“可以/带/你/去/长长/见识”。
所述汉字注音装置可以获取分词处理后所述文本中的字段和所述字段的读音属性信息,所述读音属性信息包括读音种数和默认读音。可以理解的是,所述汉字注音装置中预先建立了包含所有字段读音的字典以及常用词语的词典,对于只有一种读音的汉字,直接在字典中建立汉字与读音的对应关系,将该读音作为该汉字的默认读音,而对于多音汉字,则将使用频率最高的读音作为多音汉字的默认读音;而词典的设置与字典的设置相同,对于只有一种读音的词语,在词典中建立词语与读音的对应关系,将该读音作为该词语的默认读音,而对于多音词语,则将使用频率最高的读音作为多音词语的默认读音,例如:多音词语“长长”,其读音有三种,分别是“chang2chang2、zhang3chang2、zhang3zhang3”,其中,拼音后的数字表示声调(以下均统一采用此种格式),由于“chang2chang2”使用的频率最高,因此将“chang2chang2”作为“长长”的默认读音;对于一些固定词语,例如:“曝”有两种读音,而在“一曝十寒”中的读音是唯一的,并且“一曝十寒”属于成语,可以被认为是常用词语,因此还可以建立常用词语的词典,并部分确定多音字在常用词语中的读音。
因此,依据上述分词处理后的所述文本“可以/带/你/去/长长/见识”为例,则获取所述文本中所述字段的读音属性信息如下(字段/词性/读音种数/默认读音):
可以/adv/1/ke3yi3;
带/v/1/dai4;
你/pron/1/ni3;
去/v/1/qu4;
长长/v/3/chang2chang2;
见识/n/1/jian4shi3;
其中,所述读音属性信息还可以包括每个字段的词性,通过词性配合字段本身进行读音种数和默认读音的查找,可以进一步提高注音的准确性。需要说明的是,假设词典中没有记载“可以”这个字段,则所述汉字注音装置可以在字典中分别查询“可”和“以”的读音属性信息。
S202,当所述读音种数等于一时,将所述默认读音确定为所述字段的当前读音;
具体的,当所述读音种数等于一时,所述汉字注音装置将所述默认读音确定为所述字段的当前读音。
S203,当所述读音种数大于一时,确定所述字段为多音字段;
具体的,当所述读音种数大于一时,所述汉字注音装置确定所述字段为多音字段,并获取所述多音字段的至少两种读音;
S204,当对所输入的文本中的多音字段进行注音时,获取所述多音字段的至少两种读音;
具体的,所述汉字注音装置获取用户所述文本,当所述汉字注音装置对所述文本中的多音字段进行注音时,所述汉字注音装置获取所述多音字段的至少两种读音。
S205,获取所述至少两种读音中每种读音的概率值;
具体的,当所述汉字注音装置获取了所述多音字段的至少两种读音后,所述汉字注音装置分别获取所述至少两种读音中每种读音的概率值。
进一步的,所述汉字注音装置预先存储有包含特定的多音字段的训练语料,采用CRF训练算法获取所述特定的多音字段中每一个多音字段的CRF模型,所述CRF模型为所述汉字注音装置通过分析训练语料中的语言特征(例如:前一个词、后一个词、词性、句首、句末以及其他特定的词语或句子结构等),所建立的模型。所述汉字注音装置可以根据预存的训练语料获取所述多音字段的CRF模型,并通过分析所述多音字段在所述文本中的字段特征(例如:前一个词、后一个词、词性、句首、句末以及其他特定的词语或句子结构等),获取所述至少两种读音中每种读音的概率值。
S206,根据所述每种读音的概率值的数值大小生成预测结果;
具体的,所述汉字注音装置根据所述每种读音的概率值的数值大小生成预测结果。进一步的,所述汉字注音装置获取所述每种读音的概率值中第一概率值与第二概率值的差值,当所述差值大于预设阈值时,确定所述第一概率值对应的读音为优先级最高的读音;当所述差值小于或等于所述预设阈值时,确定所述默认读音为优先级最高的读音。其中,所述第一概率值为所述每种读音的概率值中数值最大的概率值,所述第二概率值为所述每种读音的概率值中数值次大的概率值,所述预设阈值为根据人为经验所设置。
参照上述举例,所述多音字段为“长长”,其读音有三种,分别是“chang2chang2、zhang3chang2、zhang3zhang3”,通过分析所获取的对应的概率值为0.2、0.1、0.7,则第一概率值为0.7,第二概率值为0.2,假设预设阈值为0.1,由于所述第一概率值与所述第二概率值的差值为0.5,大于所述预设阈值,因此将所述第一概率值对应的读音,即“zhang3zhang3”确定为优先级最高的读音。
S207,根据预测结果确定所述多音字段的当前读音。
其中,本发明实施例的步骤S207可以参见图1所示实施例的步骤S103,在此不进行赘述。
在本发明实施例中,当对所输入的文本中的多音字段进行注音时,对多音字段的至少两种读音中每种读音进行概率预测,并根据预测结果确定多音字段的当前读音,实现了对多音字段的准确注音;通过词性配合字段本身进行读音种数和默认读音的查找,且通过预先建立了包含所有字段读音的字典、常用词语的词典以及预存的训练语料相结合,可以进一步提高注音的准确性,提升阅读文本的效率及效果,进而提升了汉语学习的效果。
下面将结合附图3-附图6,对本发明实施例提供的汉字注音装置进行详细介绍。需要说明的是,附图3-附图6所示的汉字注音装置,用于执行本发明图1和图2所示实施例的方法,为了便于说明,仅示出了与本发明实施例相关的部分,具体技术细节未揭示的,请参照本发明图1和图2所示的实施例。
请参见图3,为本发明实施例提供了一种汉字注音装置的结构示意图。如图3所示,本发明实施例的所述汉字注音装置1可以包括:读音获取模块11、预测模块12和第一读音确定模块13。
读音获取模块11,用于当对所输入的文本中的多音字段进行注音时,获取所述多音字段的至少两种读音;
具体实现中,用户可以将待注音的文本输入至所述汉字注音装置1,输入的方式可以通过复制粘贴该文本,或者通过扫描设备扫描该文本等,所述汉字注音装置1获取用户所述文本,当所述汉字注音装置对所述文本中的多音字段进行注音时,所述读音获取模块11获取所述多音字段的至少两种读音。
需要说明的是,在对所输入的文本中的多音字段进行注音之前,所述汉字注音装置1需要对所述文本进行分词处理,例如:假设所述文本为“可以带你去长长见识”,所述汉字注音装置1优选的可以根据词性对所述文本进行分词处理,分词处理后的所述文本为“可以/带/你/去/长长/见识”。
所述汉字注音装置1可以获取分词处理后所述文本中的字段和所述字段的读音属性信息,所述读音属性信息包括读音种数和默认读音。可以理解的是,所述汉字注音装置1中预先建立了包含所有字段读音的字典以及常用词语的词典,对于只有一种读音的汉字,直接在字典中建立汉字与读音的对应关系,将该读音作为该汉字的默认读音,而对于多音汉字,则将使用频率最高的读音作为多音汉字的默认读音;而词典的设置与字典的设置相同,对于只有一种读音的词语,在词典中建立词语与读音的对应关系,将该读音作为该词语的默认读音,而对于多音词语,则将使用频率最高的读音作为多音词语的默认读音,例如:多音词语“长长”,其读音有三种,分别是“chang2chang2、zhang3chang2、zhang3zhang3”,其中,拼音后的数字表示声调(以下均统一采用此种格式),由于“chang2chang2”使用的频率最高,因此将“chang2chang2”作为“长长”的默认读音;对于一些固定词语,例如:“曝”有两种读音,而在“一曝十寒”中的读音是唯一的,并且“一曝十寒”属于成语,可以被认为是常用词语,因此还可以建立常用词语的词典,并部分确定多音字在常用词语中的读音。
因此,依据上述分词处理后的所述文本“可以/带/你/去/长长/见识”为例,则获取所述文本中所述字段的读音属性信息如下(字段/词性/读音种数/默认读音):
可以/adv/1/ke3yi3;
带/v/1/dai4;
你/pron/1/ni3;
去/v/1/qu4;
长长/v/3/chang2chang2;
见识/n/1/jian4shi3;
其中,所述读音属性信息还可以包括每个字段的词性,通过词性配合字段本身进行读音种数和默认读音的查找,可以进一步提高注音的准确性。需要说明的是,假设词典中没有记载“可以”这个字段,则所述汉字注音装置1可以在字典中分别查询“可”和“以”的读音属性信息。
进一步的,当所述读音种数大于一时,所述汉字注音装置1确定所述字段为多音字段,并通知所述读音获取模块11获取所述多音字段的至少两种读音;
当所述读音种数等于一时,所述汉字注音装置1将所述默认读音确定为所述字段的当前读音。
预测模块12,用于对所述至少两种读音中每种读音进行概率预测,并生成预测结果;
具体实现中,当所述读音获取模块11获取了所述多音字段的至少两种读音后,所述预测模块12分别获取所述至少两种读音中每种读音的概率值,并根据所述每种读音的概率值的数值大小生成预测结果。
进一步的,所述汉字注音装置1预先存储有包含特定的多音字段的训练语料,采用CRF训练算法获取所述特定的多音字段中每一个多音字段的CRF模型,所述CRF模型为所述汉字注音装置1通过分析训练语料中的语言特征(例如:前一个词、后一个词、词性、句首、句末以及其他特定的词语或句子结构等),所建立的模型。所述预测模块12可以根据预存的训练语料获取所述多音字段的CRF模型,并通过分析所述多音字段在所述文本中的字段特征(例如:前一个词、后一个词、词性、句首、句末以及其他特定的词语或句子结构等),获取所述至少两种读音中每种读音的概率值,并获取所述每种读音的概率值中第一概率值与第二概率值的差值,当所述差值大于预设阈值时,确定所述第一概率值对应的读音为优先级最高的读音;当所述差值小于或等于所述预设阈值时,确定所述默认读音为优先级最高的读音。其中,所述第一概率值为所述每种读音的概率值中数值最大的概率值,所述第二概率值为所述每种读音的概率值中数值次大的概率值,所述预设阈值为根据人为经验所设置。
参照上述举例,所述多音字段为“长长”,其读音有三种,分别是“chang2chang2、zhang3chang2、zhang3zhang3”,通过分析所获取的对应的概率值为0.2、0.1、0.7,则第一概率值为0.7,第二概率值为0.2,假设预设阈值为0.1,由于所述第一概率值与所述第二概率值的差值为0.5,大于所述预设阈值,因此将所述第一概率值对应的读音,即“zhang3zhang3”确定为优先级最高的读音。
第一读音确定模块13,用于根据预测结果确定所述多音字段的当前读音。
具体实现中,所述第一读音确定模块13将所述优先级最高的读音确定为所述多音字段的当前读音。
进一步的,所述汉字注音装置1对所述文本及所述文本中的字段对应的当前注音进行输出,参照上述举例,输出的结果为“可以带你去长长见识(ke3 yi3dai4 ni3 qu4 zhang3 zhang3 jian4 shi2)”。并可以将输出的结果转换为语音输出。
在本发明实施例中,当对所输入的文本中的多音字段进行注音时,对多音字段的至少两种读音中每种读音进行概率预测,并根据预测结果确定多音字段的当前读音,实现了对多音字段的准确注音;通过词性配合字段本身进行读音种数和默认读音的查找,可以进一步提高注音的准确性,提升阅读文本的效率及效果,进而提升了汉语学习的效果。
请参见图4,为本发明实施例提供了另一种汉字注音装置的结构示意图。如图4所示,本发明实施例所述的汉字注音装置1可以包括:读音获取模块11、预测模块12、第一读音确定模块13、信息获取模块14、通知模块15和第二读音确定模块16;其中,第一读音确定模块13的结构可以参见图3所示实施例的具体描述,在此不进行赘述。
信息获取模块14,用于对所输入的文本进行分词处理,并获取分词处理后所述文本中的字段和所述字段的读音属性信息,所述读音属性信息包括读音种数和默认读音;
具体实现中,用户可以将待注音的文本输入至所述汉字注音装置1,输入的方式可以通过复制粘贴该文本,或者通过扫描设备扫描该文本等,所述信息获取模块14需要对所述文本进行分词处理,例如:假设所述文本为“可以带你去长长见识”,所述信息获取模块14优选的可以根据词性对所述文本进行分词处理,分词处理后的所述文本为“可以/带/你/去/长长/见识”。
所述信息获取模块14可以获取分词处理后所述文本中的字段和所述字段的读音属性信息,所述读音属性信息包括读音种数和默认读音。可以理解的是,所述汉字注音装置1中预先建立了包含所有字段读音的字典以及常用词语的词典,对于只有一种读音的汉字,直接在字典中建立汉字与读音的对应关系,将该读音作为该汉字的默认读音,而对于多音汉字,则将使用频率最高的读音作为多音汉字的默认读音;而词典的设置与字典的设置相同,对于只有一种读音的词语,在词典中建立词语与读音的对应关系,将该读音作为该词语的默认读音,而对于多音词语,则将使用频率最高的读音作为多音词语的默认读音,例如:多音词语“长长”,其读音有三种,分别是“chang2chang2、zhang3chang2、zhang3zhang3”,其中,拼音后的数字表示声调(以下均统一采用此种格式),由于“chang2chang2”使用的频率最高,因此将“chang2 chang2”作为“长长”的默认读音;对于一些固定词语,例如:“曝”有两种读音,而在“一曝十寒”中的读音是唯一的,并且“一曝十寒”属于成语,可以被认为是常用词语,因此还可以建立常用词语的词典,并部分确定多音字在常用词语中的读音。
因此,依据上述分词处理后的所述文本“可以/带/你/去/长长/见识”为例,则获取所述文本中所述字段的读音属性信息如下(字段/词性/读音种数/默认读音):
可以/adv/1/ke3yi3;
带/v/1/dai4;
你/pron/1/ni3;
去/v/1/qu4;
长长/v/3/chang2chang2;
见识/n/1/jian4shi3;
其中,所述读音属性信息还可以包括每个字段的词性,通过词性配合字段本身进行读音种数和默认读音的查找,可以进一步提高注音的准确性。需要说明的是,假设词典中没有记载“可以”这个字段,则所述信息获取模块14可以在字典中分别查询“可”和“以”的读音属性信息。
通知模块15,用于当所述读音种数大于一时,确定所述字段为多音字段,并通知所述读音获取模块11执行获取所述多音字段的至少两种读音的步骤;
具体实现中,当所述读音种数大于一时,所述通知模块15确定所述字段为多音字段,并通知所述读音获取模块11获取所述多音字段的至少两种读音;
第二读音确定模块16,用于当所述读音种数等于一时,将所述默认读音确定为所述字段的当前读音;
具体实现中,当所述读音种数等于一时,所述第二读音确定模块16将所述默认读音确定为所述字段的当前读音。
读音获取模块11,用于当对所输入的文本中的多音字段进行注音时,获取所述多音字段的至少两种读音;
具体实现中,所述汉字注音装置1获取用户所述文本,当所述汉字注音装置1对所述文本中的多音字段进行注音时,所述读音获取模块11获取所述多音字段的至少两种读音。
预测模块12,用于对所述至少两种读音中每种读音进行概率预测,并生成预测结果;
具体实现中,当所述读音获取模块11获取了所述多音字段的至少两种读音后,所述预测模块12分别获取所述至少两种读音中每种读音的概率值,并根据所述每种读音的概率值的数值大小生成预测结果。
具体的,请一并参见图5,为本发明实施例提供了预测模块的结构示意图。如图5所示,所述预测模块12可以包括:
概率获取单元121,用于获取所述至少两种读音中每种读音的概率值;
具体实现中,当所述读音获取模块11获取了所述多音字段的至少两种读音后,所述概率获取单元121分别获取所述至少两种读音中每种读音的概率值。
进一步的,所述汉字注音装置1预先存储有包含特定的多音字段的训练语料,采用CRF训练算法获取所述特定的多音字段中每一个多音字段的CRF模型,所述CRF模型为所述汉字注音装置1通过分析训练语料中的语言特征(例如:前一个词、后一个词、词性、句首、句末以及其他特定的词语或句子结构等),所建立的模型。所述汉字注音装置1可以根据预存的训练语料获取所述多音字段的CRF模型,并通过分析所述多音字段在所述文本中的字段特征(例如:前一个词、后一个词、词性、句首、句末以及其他特定的词语或句子结构等),获取所述至少两种读音中每种读音的概率值。
结果生成单元122,用于根据所述每种读音的概率值的数值大小生成预测结果;
具体实现中,所述结果生成单元122根据所述每种读音的概率值的数值大小生成预测结果。进一步的,所述结果生成单元122获取所述每种读音的概率值中第一概率值与第二概率值的差值,当所述差值大于预设阈值时,确定所述第一概率值对应的读音为优先级最高的读音;当所述差值小于或等于所述预设阈值时,确定所述默认读音为优先级最高的读音。其中,所述第一概率值为所述每种读音的概率值中数值最大的概率值,所述第二概率值为所述每种读音的概率值中数值次大的概率值,所述预设阈值为根据人为经验所设置。
参照上述举例,所述多音字段为“长长”,其读音有三种,分别是“chang2chang2、zhang3chang2、zhang3zhang3”,通过分析所获取的对应的概率值为0.2、0.1、0.7,则第一概率值为0.7,第二概率值为0.2,假设预设阈值为0.1,由于所述第一概率值与所述第二概率值的差值为0.5,大于所述预设阈值,因此将所述第一概率值对应的读音,即“zhang3zhang3”确定为优先级最高的读音。
具体的,请一并参见图6,为本发明实施例提供了结果生成单元的结构示意图。如图6所示,所述结果生成单元122可以包括:
差值获取子单元1221,用于获取所述每种读音的概率值中第一概率值与第二概率值的差值;
第一确定子单元1222,用于当所述差值大于预设阈值时,确定所述第一概率值对应的读音为优先级最高的读音;
第二确定子单元1223,用于当所述差值小于或等于所述预设阈值时,确定所述默认读音为优先级最高的读音;
具体实现中,所述差值获取子单元1221获取所述每种读音的概率值中第一概率值与第二概率值的差值,当所述差值大于预设阈值时,所述第一确定子单元1222确定所述第一概率值对应的读音为优先级最高的读音;当所述差值小于或等于所述预设阈值时,所述第二确定子单元1223确定所述默认读音为优先级最高的读音。其中,所述第一概率值为所述每种读音的概率值中数值最大的概率值,所述第二概率值为所述每种读音的概率值中数值次大的概率值,所述预设阈值为根据人为经验所设置。
参照上述举例,所述多音字段为“长长”,其读音有三种,分别是“chang2chang2、zhang3chang2、zhang3zhang3”,通过分析所获取的对应的概率值为0.2、0.1、0.7,则第一概率值为0.7,第二概率值为0.2,假设预设阈值为0.1,由于所述第一概率值与所述第二概率值的差值为0.5,大于所述预设阈值,因此将所述第一概率值对应的读音,即“zhang3zhang3”确定为优先级最高的读音。
在本发明实施例中,当对所输入的文本中的多音字段进行注音时,对多音字段的至少两种读音中每种读音进行概率预测,并根据预测结果确定多音字段的当前读音,实现了对多音字段的准确注音;通过词性配合字段本身进行读音种数和默认读音的查找,且通过预先建立了包含所有字段读音的字典、常用词语的词典以及预存的训练语料相结合,可以进一步提高注音的准确性,提升阅读文本的效率及效果,进而提升了汉语学习的效果。
请参见图7,为本发明实施例提供了又一种汉字注音装置的结构示意图。如图7所示,所述汉字注音装置1000可以包括:至少一个处理器1001,例如CPU,至少一个网络接口1004,用户接口1003,存储器1005,至少一个通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。其中,用户接口1003可以包括显示屏(Display)、键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。存储器1005可选的还可以是至少一个位于远离前述处理器1001的存储装置。如图7所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及汉字注音应用程序。
在图7所示的更新发布服务器1000中,用户接口1003主要用于为用户提供输入的接口,获取用户输出的数据;而处理器1001可以用于调用存储器1005中存储的汉字注音应用程序,并具体执行以下步骤:
当对所输入的文本中的多音字段进行注音时,获取所述多音字段的至少两种读音;
对所述至少两种读音中每种读音进行概率预测,并生成预测结果;
根据预测结果确定所述多音字段的当前读音。
在一个实施例中,所述处理器1001在执行当对所输入的文本中的多音字段进行注音之前,还执行以下步骤:
对所输入的文本进行分词处理,并获取分词处理后所述文本中的字段和所述字段的读音属性信息,所述读音属性信息包括读音种数和默认读音;
当所述读音种数大于一时,确定所述字段为多音字段,并执行获取所述多音字段的至少两种读音的步骤;
当所述读音种数等于一时,将所述默认读音确定为所述字段的当前读音。
在一个实施例中,所述处理器1001在执行对所述至少两种读音中每种读音进行概率预测,并生成预测结果时,具体执行以下步骤:
获取所述至少两种读音中每种读音的概率值;
根据所述每种读音的概率值的数值大小生成预测结果。
在一个实施例中,所述处理器在执行获取所述至少两种读音中每种读音的概率值时,具体执行以下步骤:
根据预存的训练语料以及分析所述多音字段在所述文本中的字段特征,获取所述至少两种读音中每种读音的概率值。
在一个实施例中,所述处理器1001在执行根据所述每种读音的概率值的数值大小生成预测结果时,具体执行以下步骤:
获取所述每种读音的概率值中第一概率值与第二概率值的差值;
当所述差值大于预设阈值时,确定所述第一概率值对应的读音为优先级最高的读音;
当所述差值小于或等于所述预设阈值时,确定所述默认读音为优先级最高的读音;
其中,所述第一概率值为所述每种读音的概率值中数值最大的概率值,所述第二概率值为所述每种读音的概率值中数值次大的概率值。
在一个实施例中,所述处理器1001在执行根据预测结果确定所述多音字段的当前读音时,具体执行以下步骤:
将所述优先级最高的读音确定为所述多音字段的当前读音。
在本发明实施例中,当对所输入的文本中的多音字段进行注音时,对多音字段的至少两种读音中每种读音进行概率预测,并根据预测结果确定多音字段的当前读音,实现了对多音字段的准确注音,提升阅读文本的效率及效果,进而提升了汉语学习的效果。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random Access Memory,RAM)等。
以上所揭露的仅为本发明较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。
Claims (12)
1.一种汉字注音方法,其特征在于,包括:
当对所输入的文本中的多音字段进行注音时,获取所述多音字段的至少两种读音;
对所述至少两种读音中每种读音进行概率预测,并生成预测结果;
根据预测结果确定所述多音字段的当前读音。
2.根据权利要求1所述的方法,其特征在于,所述当对所输入的文本中的多音字段进行注音之前,还包括:
对所输入的文本进行分词处理,并获取分词处理后所述文本中的字段和所述字段的读音属性信息,所述读音属性信息包括读音种数和默认读音;
当所述读音种数大于一时,确定所述字段为多音字段,并执行获取所述多音字段的至少两种读音的步骤;
当所述读音种数等于一时,将所述默认读音确定为所述字段的当前读音。
3.根据权利要求2所述的方法,其特征在于,所述对所述至少两种读音中每种读音进行概率预测,并生成预测结果,包括:
获取所述至少两种读音中每种读音的概率值;
根据所述每种读音的概率值的数值大小生成预测结果。
4.根据权利要求3所述的方法,其特征在于,所述获取所述至少两种读音中每种读音的概率值,包括:
根据预存的训练语料以及分析所述多音字段在所述文本中的字段特征,获取所述至少两种读音中每种读音的概率值。
5.根据权利要求3所述的方法,其特征在于,所述根据所述每种读音的概率值的数值大小生成预测结果,包括:
获取所述每种读音的概率值中第一概率值与第二概率值的差值;
当所述差值大于预设阈值时,确定所述第一概率值对应的读音为优先级最高的读音;
当所述差值小于或等于所述预设阈值时,确定所述默认读音为优先级最高的读音;
其中,所述第一概率值为所述每种读音的概率值中数值最大的概率值,所述第二概率值为所述每种读音的概率值中数值次大的概率值。
6.根据权利要求5所述的方法,其特征在于,所述根据预测结果确定所述多音字段的当前读音,包括:
将所述优先级最高的读音确定为所述多音字段的当前读音。
7.一种汉字注音装置,其特征在于,包括:
读音获取模块,用于当对所输入的文本中的多音字段进行注音时,获取所述多音字段的至少两种读音;
预测模块,用于对所述至少两种读音中每种读音进行概率预测,并生成预测结果;
第一读音确定模块,用于根据预测结果确定所述多音字段的当前读音。
8.根据权利要求7所述的装置,其特征在于,还包括:
信息获取模块,用于对所输入的文本进行分词处理,并获取分词处理后所述文本中的字段和所述字段的读音属性信息,所述读音属性信息包括读音种数和默认读音;
通知模块,用于当所述读音种数大于一时,确定所述字段为多音字段,并通知所述读音获取模块执行获取所述多音字段的至少两种读音的步骤;
第二读音确定模块,用于当所述读音种数等于一时,将所述默认读音确定为所述字段的当前读音。
9.根据权利要求8所述的装置,其特征在于,所述预测模块包括:
概率获取单元,用于获取所述至少两种读音中每种读音的概率值;
结果生成单元,用于根据所述每种读音的概率值的数值大小生成预测结果。
10.根据权利要求9所述的装置,其特征在于,所述概率获取单元具体用于根据预存的训练语料以及分析所述多音字段在所述文本中的字段特征,获取所述至少两种读音中每种读音的概率值。
11.根据权利要求9所述的装置,其特征在于,所述结果生成单元包括:
差值获取子单元,用于获取所述每种读音的概率值中第一概率值与第二概率值的差值;
第一确定子单元,用于当所述差值大于预设阈值时,确定所述第一概率值对应的读音为优先级最高的读音;
第二确定子单元,用于当所述差值小于或等于所述预设阈值时,确定所述默认读音为优先级最高的读音;
其中,所述第一概率值为所述每种读音的概率值中数值最大的概率值,所述第二概率值为所述每种读音的概率值中数值次大的概率值。
12.根据权利要求11所述的装置,其特征在于,所述第一读音确定模块具体用于将所述优先级最高的读音确定为所述多音字段的当前读音。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410190961.3A CN104142909B (zh) | 2014-05-07 | 2014-05-07 | 一种汉字注音方法及装置 |
PCT/CN2015/075835 WO2015169134A1 (en) | 2014-05-07 | 2015-04-03 | Method and apparatus for phonetically annotating text |
US15/191,309 US10114809B2 (en) | 2014-05-07 | 2016-06-23 | Method and apparatus for phonetically annotating text |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410190961.3A CN104142909B (zh) | 2014-05-07 | 2014-05-07 | 一种汉字注音方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104142909A true CN104142909A (zh) | 2014-11-12 |
CN104142909B CN104142909B (zh) | 2016-04-27 |
Family
ID=51852085
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410190961.3A Active CN104142909B (zh) | 2014-05-07 | 2014-05-07 | 一种汉字注音方法及装置 |
Country Status (3)
Country | Link |
---|---|
US (1) | US10114809B2 (zh) |
CN (1) | CN104142909B (zh) |
WO (1) | WO2015169134A1 (zh) |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015169134A1 (en) * | 2014-05-07 | 2015-11-12 | Tencent Technology (Shenzhen) Company Limited | Method and apparatus for phonetically annotating text |
CN105095156A (zh) * | 2015-07-20 | 2015-11-25 | 百度在线网络技术(北京)有限公司 | 用于数据标注的模型生成、数据标注方法和装置 |
CN106570001A (zh) * | 2016-10-24 | 2017-04-19 | 广州酷狗计算机科技有限公司 | 一种音译文字的方法及装置 |
CN108416055A (zh) * | 2018-03-20 | 2018-08-17 | 北京三快在线科技有限公司 | 建立拼音数据库的方法、装置、电子设备及存储介质 |
CN108763521A (zh) * | 2018-05-25 | 2018-11-06 | 腾讯音乐娱乐科技(深圳)有限公司 | 存储歌词注音的方法和装置 |
CN109739369A (zh) * | 2019-01-03 | 2019-05-10 | 上海中畅信息科技有限公司 | 一种多音字汉字转拼音全拼的方法 |
CN110277085A (zh) * | 2019-06-25 | 2019-09-24 | 腾讯科技(深圳)有限公司 | 确定多音字发音的方法及装置 |
CN110600004A (zh) * | 2019-09-09 | 2019-12-20 | 腾讯科技(深圳)有限公司 | 一种语音合成播放方法、装置和存储介质 |
CN110738305A (zh) * | 2019-08-27 | 2020-01-31 | 深圳市跨越新科技有限公司 | 一种物流运单地址解析的方法和系统 |
CN111078898A (zh) * | 2019-12-27 | 2020-04-28 | 出门问问信息科技有限公司 | 一种多音字标注方法、装置以及计算机可读存储介质 |
CN111145724A (zh) * | 2019-12-31 | 2020-05-12 | 出门问问信息科技有限公司 | 一种多音字标注方法、装置以及计算机可读存储介质 |
CN111798834A (zh) * | 2020-07-03 | 2020-10-20 | 北京字节跳动网络技术有限公司 | 多音字的识别方法、装置、可读介质和电子设备 |
CN111857362A (zh) * | 2019-04-30 | 2020-10-30 | 阿尔派株式会社 | 文字输入方法及文字输入装置 |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109145282B (zh) * | 2017-06-16 | 2023-11-07 | 贵州小爱机器人科技有限公司 | 断句模型训练方法、断句方法、装置及计算机设备 |
CN108763441B (zh) * | 2018-05-25 | 2022-05-17 | 腾讯音乐娱乐科技(深圳)有限公司 | 生成歌词、显示歌词的方法、装置、电子设备及存储介质 |
CN108877765A (zh) * | 2018-05-31 | 2018-11-23 | 百度在线网络技术(北京)有限公司 | 语音拼接合成的处理方法及装置、计算机设备及可读介质 |
US10923105B2 (en) * | 2018-10-14 | 2021-02-16 | Microsoft Technology Licensing, Llc | Conversion of text-to-speech pronunciation outputs to hyperarticulated vowels |
CN112989821B (zh) * | 2021-04-13 | 2021-08-13 | 北京世纪好未来教育科技有限公司 | 多音字的注音方法及计算机存储介质 |
US11941345B2 (en) * | 2021-10-26 | 2024-03-26 | Grammarly, Inc. | Voice instructed machine authoring of electronic documents |
CN115273809A (zh) * | 2022-06-22 | 2022-11-01 | 北京市商汤科技开发有限公司 | 多音字读音预测网络的训练方法、语音生成方法及装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101271687A (zh) * | 2007-03-20 | 2008-09-24 | 株式会社东芝 | 字音转换预测以及语音合成的方法和装置 |
CN101324884A (zh) * | 2008-07-29 | 2008-12-17 | 无敌科技(西安)有限公司 | 一种多音字发音方法 |
CN102651217A (zh) * | 2011-02-25 | 2012-08-29 | 株式会社东芝 | 用于合成语音的方法、设备以及用于语音合成的声学模型训练方法 |
CN103365925A (zh) * | 2012-04-09 | 2013-10-23 | 高德软件有限公司 | 获取多音字拼音、基于拼音检索的方法及其相应装置 |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5212730A (en) * | 1991-07-01 | 1993-05-18 | Texas Instruments Incorporated | Voice recognition of proper names using text-derived recognition models |
US5873111A (en) * | 1996-05-10 | 1999-02-16 | Apple Computer, Inc. | Method and system for collation in a processing system of a variety of distinct sets of information |
US6128632A (en) * | 1997-03-06 | 2000-10-03 | Apple Computer, Inc. | Methods for applying rubi annotation characters over base text characters |
CN100392640C (zh) * | 1997-04-15 | 2008-06-04 | 英业达股份有限公司 | 读音符号自动标注的方法 |
WO2005027093A1 (en) * | 2003-09-11 | 2005-03-24 | Voice Signal Technologies, Inc. | Generation of an alternative pronunciation |
KR100679044B1 (ko) * | 2005-03-07 | 2007-02-06 | 삼성전자주식회사 | 사용자 적응형 음성 인식 방법 및 장치 |
GB2458238B (en) * | 2006-11-30 | 2011-03-23 | Nat Inst Of Advanced Ind Scien | Web site system for voice data search |
CN101202041B (zh) * | 2006-12-13 | 2011-01-05 | 富士通株式会社 | 一种汉语韵律词组词方法及装置 |
US20080154600A1 (en) * | 2006-12-21 | 2008-06-26 | Nokia Corporation | System, Method, Apparatus and Computer Program Product for Providing Dynamic Vocabulary Prediction for Speech Recognition |
TW200926142A (en) * | 2007-12-12 | 2009-06-16 | Inst Information Industry | A construction method of English recognition variation pronunciation models |
WO2009078256A1 (ja) * | 2007-12-18 | 2009-06-25 | Nec Corporation | 発音変動規則抽出装置、発音変動規則抽出方法、および発音変動規則抽出用プログラム |
CN102567296B (zh) * | 2011-01-04 | 2016-03-30 | 中国移动通信有限公司 | 一种汉字信息的处理方法及汉字信息的处理装置 |
US9251854B2 (en) * | 2011-02-18 | 2016-02-02 | Google Inc. | Facial detection, recognition and bookmarking in videos |
US8706472B2 (en) * | 2011-08-11 | 2014-04-22 | Apple Inc. | Method for disambiguating multiple readings in language conversion |
US20130110511A1 (en) * | 2011-10-31 | 2013-05-02 | Telcordia Technologies, Inc. | System, Method and Program for Customized Voice Communication |
US9343068B2 (en) * | 2013-09-16 | 2016-05-17 | Qualcomm Incorporated | Method and apparatus for controlling access to applications having different security levels |
CN104142909B (zh) * | 2014-05-07 | 2016-04-27 | 腾讯科技(深圳)有限公司 | 一种汉字注音方法及装置 |
-
2014
- 2014-05-07 CN CN201410190961.3A patent/CN104142909B/zh active Active
-
2015
- 2015-04-03 WO PCT/CN2015/075835 patent/WO2015169134A1/en active Application Filing
-
2016
- 2016-06-23 US US15/191,309 patent/US10114809B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101271687A (zh) * | 2007-03-20 | 2008-09-24 | 株式会社东芝 | 字音转换预测以及语音合成的方法和装置 |
CN101324884A (zh) * | 2008-07-29 | 2008-12-17 | 无敌科技(西安)有限公司 | 一种多音字发音方法 |
CN102651217A (zh) * | 2011-02-25 | 2012-08-29 | 株式会社东芝 | 用于合成语音的方法、设备以及用于语音合成的声学模型训练方法 |
CN103365925A (zh) * | 2012-04-09 | 2013-10-23 | 高德软件有限公司 | 获取多音字拼音、基于拼音检索的方法及其相应装置 |
Cited By (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10114809B2 (en) | 2014-05-07 | 2018-10-30 | Tencent Technology (Shenzhen) Company Limited | Method and apparatus for phonetically annotating text |
WO2015169134A1 (en) * | 2014-05-07 | 2015-11-12 | Tencent Technology (Shenzhen) Company Limited | Method and apparatus for phonetically annotating text |
CN105095156A (zh) * | 2015-07-20 | 2015-11-25 | 百度在线网络技术(北京)有限公司 | 用于数据标注的模型生成、数据标注方法和装置 |
CN106570001A (zh) * | 2016-10-24 | 2017-04-19 | 广州酷狗计算机科技有限公司 | 一种音译文字的方法及装置 |
CN106570001B (zh) * | 2016-10-24 | 2018-10-23 | 广州酷狗计算机科技有限公司 | 一种音译文字的方法及装置 |
CN108416055B (zh) * | 2018-03-20 | 2021-05-25 | 北京三快在线科技有限公司 | 建立拼音数据库的方法、装置、电子设备及存储介质 |
CN108416055A (zh) * | 2018-03-20 | 2018-08-17 | 北京三快在线科技有限公司 | 建立拼音数据库的方法、装置、电子设备及存储介质 |
CN108763521A (zh) * | 2018-05-25 | 2018-11-06 | 腾讯音乐娱乐科技(深圳)有限公司 | 存储歌词注音的方法和装置 |
CN108763521B (zh) * | 2018-05-25 | 2022-02-25 | 腾讯音乐娱乐科技(深圳)有限公司 | 存储歌词注音的方法和装置 |
CN109739369A (zh) * | 2019-01-03 | 2019-05-10 | 上海中畅信息科技有限公司 | 一种多音字汉字转拼音全拼的方法 |
CN111857362A (zh) * | 2019-04-30 | 2020-10-30 | 阿尔派株式会社 | 文字输入方法及文字输入装置 |
CN110277085A (zh) * | 2019-06-25 | 2019-09-24 | 腾讯科技(深圳)有限公司 | 确定多音字发音的方法及装置 |
CN110277085B (zh) * | 2019-06-25 | 2021-08-24 | 腾讯科技(深圳)有限公司 | 确定多音字发音的方法及装置 |
CN110738305A (zh) * | 2019-08-27 | 2020-01-31 | 深圳市跨越新科技有限公司 | 一种物流运单地址解析的方法和系统 |
CN110600004A (zh) * | 2019-09-09 | 2019-12-20 | 腾讯科技(深圳)有限公司 | 一种语音合成播放方法、装置和存储介质 |
CN111078898A (zh) * | 2019-12-27 | 2020-04-28 | 出门问问信息科技有限公司 | 一种多音字标注方法、装置以及计算机可读存储介质 |
CN111078898B (zh) * | 2019-12-27 | 2023-08-08 | 出门问问创新科技有限公司 | 一种多音字标注方法、装置以及计算机可读存储介质 |
CN111145724A (zh) * | 2019-12-31 | 2020-05-12 | 出门问问信息科技有限公司 | 一种多音字标注方法、装置以及计算机可读存储介质 |
CN111145724B (zh) * | 2019-12-31 | 2022-08-19 | 出门问问信息科技有限公司 | 一种多音字标注方法、装置以及计算机可读存储介质 |
CN111798834A (zh) * | 2020-07-03 | 2020-10-20 | 北京字节跳动网络技术有限公司 | 多音字的识别方法、装置、可读介质和电子设备 |
Also Published As
Publication number | Publication date |
---|---|
US20160306783A1 (en) | 2016-10-20 |
WO2015169134A1 (en) | 2015-11-12 |
CN104142909B (zh) | 2016-04-27 |
US10114809B2 (en) | 2018-10-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104142909B (zh) | 一种汉字注音方法及装置 | |
JP5901001B1 (ja) | 音響言語モデルトレーニングのための方法およびデバイス | |
CN110349564B (zh) | 一种跨语言语音识别方法和装置 | |
CN108345672A (zh) | 智能应答方法、电子装置及存储介质 | |
CN103268313B (zh) | 一种自然语言的语义解析方法及装置 | |
WO2020108063A1 (zh) | 特征词的确定方法、装置和服务器 | |
CN108717853B (zh) | 一种人机语音交互方法、装置及存储介质 | |
CN112507706B (zh) | 知识预训练模型的训练方法、装置和电子设备 | |
TWI509432B (zh) | 電子設備及其自然語言分析方法 | |
US20220238098A1 (en) | Voice recognition method and device | |
CN111312233A (zh) | 一种语音数据的识别方法、装置及系统 | |
CN105320641B (zh) | 一种文本校验方法及用户终端 | |
CN112559725A (zh) | 文本匹配方法、装置、终端和存储介质 | |
CN112151021A (zh) | 语言模型的训练方法、语音识别方法、装置及电子设备 | |
WO2020095655A1 (ja) | 選定装置および選定方法 | |
CN114783405B (zh) | 一种语音合成方法、装置、电子设备及存储介质 | |
CN114299955B (zh) | 语音交互的方法、装置、电子设备及存储介质 | |
CN114171016B (zh) | 语音交互的方法、装置、电子设备及存储介质 | |
CN114758649A (zh) | 一种语音识别方法、装置、设备和介质 | |
CN112632999A (zh) | 命名实体识别模型获取及命名实体识别方法、装置及介质 | |
CN110728137A (zh) | 用于分词的方法和装置 | |
CN113705206B (zh) | 情感预测模型的训练方法、装置、设备及存储介质 | |
CN114492456B (zh) | 文本生成方法、模型的训练方法、装置、电子设备及介质 | |
CN115859999B (zh) | 意图识别方法、装置、电子设备及存储介质 | |
CN115965018B (zh) | 信息生成模型的训练方法、信息生成方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |