CN101482867A - 一种自动为汉字添加拼音的方法及装置 - Google Patents

一种自动为汉字添加拼音的方法及装置 Download PDF

Info

Publication number
CN101482867A
CN101482867A CNA2008100558313A CN200810055831A CN101482867A CN 101482867 A CN101482867 A CN 101482867A CN A2008100558313 A CNA2008100558313 A CN A2008100558313A CN 200810055831 A CN200810055831 A CN 200810055831A CN 101482867 A CN101482867 A CN 101482867A
Authority
CN
China
Prior art keywords
chinese character
phonetic
speech
dictionary
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2008100558313A
Other languages
English (en)
Other versions
CN101482867B (zh
Inventor
王铭宇
王全鹏
杨春
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
New Founder Holdings Development Co ltd
Beijing Founder Electronics Co Ltd
Original Assignee
Peking University Founder Group Co Ltd
Beijing Founder Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University Founder Group Co Ltd, Beijing Founder Electronics Co Ltd filed Critical Peking University Founder Group Co Ltd
Priority to CN2008100558313A priority Critical patent/CN101482867B/zh
Publication of CN101482867A publication Critical patent/CN101482867A/zh
Application granted granted Critical
Publication of CN101482867B publication Critical patent/CN101482867B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

本发明公开了一种自动为汉字添加拼音的方法及装置,用以解决现有技术中存在的为汉字自动添加拼音的工作效率低,准确性差的问题。本发明提供的自动为汉字添加拼音的方法包括:将用户选定的需要添加拼音的汉字与预先设置的词库中的词进行词匹配操作,将匹配成功的所述词库中的词的拼音添加给相应的需要添加拼音的汉字;当所述词匹配操作失败时,将所述词匹配失败的汉字与预先设置的字库中的字进行字匹配操作,将匹配成功的所述字库中的字的拼音添加给相应的需要添加拼音的汉字。本发明用于为汉字自动添加拼音,提高添加拼音的准确性及工作效率。

Description

一种自动为汉字添加拼音的方法及装置
技术领域
本发明涉及印刷排版技术领域,尤其涉及一种自动为汉字添加拼音的方法及装置。
背景技术
由于汉字中存在大量的多音字,怎样确定整篇文档中的多音字的拼音是一个很困难的问题。因此,在当前各种排版或者文档处理软件中,很少具有可以直接给整段或整篇文章进行大数据量地添加拼音的功能。现有技术中常见的添加拼音方式主要有以下两种:
基于字和词级别的添加拼音方式。但是,由于汉字多音字的存在,往往还需要用户进行选择以确定该字的拼音。
基于段和篇级别的添加拼音方式。但是,由于确定多音字拼音所采用的方法运算的复杂性,一般添加拼音的效率很低,并且不是完全自动匹配,遇到多音字的情况需要用户进行选择或校正。
综上所述,现有技术一般都需要基于中文分词后查找词库的方法来完成自动为汉字添加拼音,这种方法需要有分词字典和拼音库的支持,其复杂的匹配运算过程对于大量汉字加拼音的情况效率很低,不适于整篇文章等大量数据的加拼音操作。如果不分词,则准确率太差,需要进行大量的手动校正。因此,现有技术为汉字添加拼音的排版工作效率低,并且浪费人力。
发明内容
本发明实施例提供了一种自动为汉字添加拼音的方法及装置,用以解决现有技术中存在的为汉字自动添加拼音的工作效率低,准确性差的问题。
本发明实施例提供的自动为汉字添加拼音的方法包括:
将用户选定的需要添加拼音的汉字与预先设置的词库中的词进行词匹配操作,将匹配成功的所述词库中的词的拼音添加给相应的需要添加拼音的汉字;
当所述词匹配操作失败时,将所述词匹配失败的汉字与预先设置的字库中的字进行字匹配操作,将匹配成功的所述字库中的字的拼音添加给相应的需要添加拼音的汉字。
本发明实施例提供的自动为汉字添加拼音的装置包括:
第一匹配单元,用于将用户选定的需要添加拼音的汉字与预先设置的词库中的词进行词匹配操作,将匹配成功的所述词库中的词的拼音添加给相应的需要添加拼音的汉字;
第二匹配单元,用于当所述词匹配操作失败时,将所述词匹配失败的汉字与预先设置的字库中的字进行字匹配操作,将匹配成功的所述字库中的字的拼音添加给相应的需要添加拼音的汉字。
本发明实施例,将用户选定的需要添加拼音的汉字分别与预先设置的词库中的词进行词匹配操作,将匹配成功的所述词库中的词的拼音添加给相应的需要添加拼音的汉字;当所述词匹配操作失败时,将所述词匹配失败的汉字与预先设置的字库中的字进行字匹配操作,将匹配成功的所述字库中的字的拼音添加给相应的需要添加拼音的汉字。通过该技术方案,实现了自动为用户选定的文字添加拼音的操作,在保证准确性的前提下,避免了现有技术由于需要进行分词而带来的复杂运算问题,提高了自动添加拼音的工作效率。
附图说明
图1为本发明实施例提供的自动为汉字添加拼音的总体方法流程示意图;
图2为用户选定的需要添加拼音的文档示意图;
图3为本发明实施例提供的为汉字数组中的汉字添加拼音的具体流程示意图;
图4为采用本发明实施例提供的方法为用户选定的文字添加拼音后的效果示意图;
图5为用户选定的若干段落的示意图;
图6为采用本发明实施例提供的方法为用户选定的若干段落添加拼音后的效果示意图。
具体实施方式
本发明实施例,提供了一种自动为汉字添加拼音的方法及装置。对于选定的需要添加拼音的文字中每两个相邻的非汉字字符之间的汉字,通过将其分别与预先设置的词库中的词或字库中的字进行匹配,以得到需要添加的拼音,从而在不进行分词的情况下达到与分词后再加拼音同样的准确率,提高为汉字添加拼音的效率。
下面结合附图,说明本发明的具体实施方式。
参见图1,本发明实施例提供的自动为汉字添加拼音的方法包括:
S101、在文字小样部分,提供给每个汉字设置拼音的入口。将拼音作为汉字的辅助部分,如果该汉字没有或者不需要添加拼音,则该辅助存储部分为空。当用户使用自动为汉字添加拼音的功能时,读取字符的指针从被选定的文字部分的第一个字符开始,依次读取字符。
例如,参见图2,用户选定的文档部分为“2007年的新年钟声已经敲响。在这辞旧迎新的美好时刻”,则指针从数字字符“2”开始读取字符,直到最后一个字符“刻”。
S102、将连续的两个非汉字字符之间的汉字添加到汉字数组中。
具体地,判断读取到的字符是否是汉字字符,如果是,则将汉字字符收集到汉字数组中;否则,此次收集结束,对汉字数组执行步骤S103。
S103、判断汉字数组中没有加拼音的汉字个数,如果不为零,则将汉字数组中第一个还没有加拼音的汉字到最后一个汉字作为是一个词语,从第一个还没有加拼音的汉字开始,逐个在预先设置的词库或字库中进行匹配,将匹配到的字的拼音添加给汉字数组中的相应汉字;若为零,则继续读取下一个字符,重新收集一组汉字到汉字数组中。
例如,参见图2,先将汉字“年的新年钟声已经敲响”收集到了汉字数组中,并对“年的新年钟声已经敲响”分别添加拼音。然后利用“在这辞旧迎新的美好时刻”去更新汉字数组中收集的“年的新年钟声已经敲响”,并对“在这辞旧迎新的美好时刻”分别添加拼音。
预先设置的词库中,包括组成各个词的汉字所对应拼音。
较佳地,可以根据需要设置多个优先级不同的词库,例如,将用户经常用到的词及其相应的拼音设置为第一优先级词库,将其他普通词及其相应的拼音设置为第二优先级词库。先从第一优先级词库开始匹配,如果没有匹配上,再对第二优先级词库中的词进行匹配。
在进行词匹配操作时,包括完全匹配和部分匹配两种情况。所述完全匹配,就是说汉字数组中的连续的多个汉字所组成的词,与词库中存储的某一个词完全匹配。所述部分匹配,是指汉字数组中的连续的多个汉字所组成的词,与词库中存储的某一个词只匹配上了一部分。例如,词库中存储的词有“新年快乐”,汉字数组中的连续的两个汉字为“新年”,下一个汉字不是“快”,所以,只与“新年快乐”中的两个字匹配上了,此时从词库中读取“新年快乐”中的“新年”两个字的拼音,分别添加给汉字数组中的“新年”。
完全匹配和部分匹配都认为词匹配操作是成功的。如果在词库中没有匹配成功时,则对预先设置的字库中的字进行匹配。
预先设置的字库中,包括各个汉字的拼音,并且,按照使用的频率,为多音字设置了具有不同优先级的多个拼音,可以在为汉字选择拼音的时候,选择优先级最高的拼音,作为该汉字的拼音。
参见图3,本发明实施例中,步骤S103为汉字数组中的汉字添加拼音的具体操作包括以下步骤:
S301、计算当前能和词库中的词匹配上的汉字数组中的连续的多个汉字的数目,本发明实施例中称之为最大匹配汉字个数。
较佳地,先计算第一优先级词库中的最大匹配汉字个数,如果小于或等于1,说明在第一优先级词库中没有完全匹配或部分匹配的词,需要检索第二优先级词库,计算相应的最大匹配汉字个数,如果还是小于或等于1,说明在第二优先级词库中也没有完全匹配或部分匹配的词,需要进一步在字库中进行匹配。
S302、判断最大匹配汉字个数是否大于1,如果是,则执行步骤S303;否则,执行步骤S304。
S303、从词库中读取词匹配操作成功的词的拼音,结合汉字数组中匹配上的各个汉字的编码以及该汉字在汉字数组中的索引位置,添加相应的拼音给汉字数组中的相应汉字。
S304、从字库中读取字匹配操作成功的汉字的拼音添加给汉字数组中的相应汉字。
较佳地,步骤S303具体包括:
第一步:根据最大匹配汉字个数,查找第一优先级词库,将匹配上的词所对应的汉字的拼音添加给汉字数组中的相应汉字。
第二步:当在第一优先级词库中没有查找到相应的词时,即此次最多在第一优先级词库中匹配成功了汉字数组中的一个汉字,或者一个汉字都匹配不上时,则根据最大匹配汉字个数,查找第二优先级词库,将匹配上的词所对应的汉字的拼音添加给汉字数组中的相应汉字。
步骤S304如果在字库中也匹配失败,即没有找到相应汉字,则此汉字不加拼音。
如果被匹配上的汉字不是汉字数组中的最后一个汉字,则从汉字数组中匹配上的汉字的下一个汉字开始继续执行步骤S301,即继续从第一优先级词库开始进行匹配。如此循环,直到对汉字数组中的汉字添加拼音完成时,清除汉字数组中的汉字,并继续收集下两个连续的非汉字字符之间的汉字,重复上述匹配及添加拼音的操作。
例如,参见图2,首先被收集到汉字数组中的汉字为“年的新年钟声已经敲响”,则从第一个汉字“年”开始从词组中匹配,“年”被匹配上了,例如词组中有“年轻”,但是,在对下一个汉字“的”进行匹配时,却匹配不上,因为词库中没有“年的”,所以“年”和“的”这两个汉字都要在字库中进行匹配,并取得相应拼音。后续的“新年”、“钟声”、“已经”和“敲响”均可以在词库中匹配上,则均从词库中取得相应的拼音。对汉字数组中的所有汉字进行的匹配和添加拼音的操作结束后,继续读取下一字符,将“在这辞旧迎新的美好时刻”收集到汉字数组中,并以此更新汉字数组中的汉字。继续对汉字“在这辞旧迎新的美好时刻”进行上述匹配和添加拼音的操作。参见图4,为采用本发明实施例提供的方法实现的为汉字自动添加拼音的效果示意图。当然,采用本发明实施例提供的方法也可以实现为用户选定的若干段落的文档添加拼音。例如,图5为用户选定的需要添加拼音的段落的示意图。参见图6,为采用本发明实施例提供的方法实现的为用户选定的若干段落添加拼音的效果示意图。
由于字词间具有一定的搭配规律,也就是短语语法关系,因此,较佳地,步骤S304中,当从字库中取出多音字的拼音对汉字数组中的单个字添加拼音时,需要进行语境分析,依据词性判断它和前后词条的搭配关系,以排除不具有搭配关系的字音。该分析是建立在汉字字词语法关系的数字描述基础上的。例如,字或者词具有搭配关系,则认为存在搭配关系R;否则,认为不具有搭配关系。
假设可以构成搭配关系的两个字或词分别为A和B,它们的搭配关系为R,则描述短语=[A][B]的关系为R。
预先设定各种词性的表示方式:名词N;动词V;形容词A;数词M;量词Q;代词R;副词D;介词P;连词C;助词H;语气词T;拟声词L。
字词间的短语语法关系一般包括:名词短语NP;动词短语VP;形容词短语AP;副词短语DP;介词短语PP。
则根据汉语语法规律,短语语法关系R可被描述为以下一种短语:
1、名词短语:
NP=[N];
NP=[NP][NP];
NP=[AP][NP];
NP=[NP][C][NP];
NP=[NP]的[NP];
NP=[VP]的[NP];
NP=[PP]的[NP]。
2、动词短语:
VP=[V];
VP=[DP][VP];
VP=[VP][C][VP]。
3、形容词短语:
AP=[A]|[M]|[Q]|[R];
AP=[AP][AP];
AP=[DP][AP];
AP=[AP][C][AP]。
4、副词短语:
DP=[D]地;
DP=[DP][DP]。
5、介词短语:
PP=[P];
PP=[P][NP]。
由于经过词库匹配后,从字库中取多音字拼音的情况已经很少,因此在对多音字进行匹配的过程中,结合字或词的词性,依据以上汉语语法规则,对多音字的拼音进行条件推理,可以准确地取得多音字的合适拼音。而对于非多音字,直接读取它的拼音即可。
因此,较佳地,词库中除了存储词的拼音外,还存储了相应的词性;同时,字库中除了存储字的拼音外,也存储了相应的词性。
步骤S303中,从词库中读取相应拼音添加给相应的汉字的同时,记录匹配上的由汉字数组中连续的多个汉字组成的词的词性,因为这个词的前一个和/或后一个字有可能是多音字,需要进一步通过前后词的词性和短语搭配关系来校验该多音字的拼音。
步骤S304中,对于多音字,结合前后词的词性,按照前述的短语语法规则来确定合适的拼音。例如:“简单地陈述”是一个副词短语,在词库中读取“简单”两个字的拼音添加给汉字数组中的“简单”的同时,记录它的词性为形容词或者副词,那么,在字库中为它后面的字“地”读取拼音时,能得到有“de”(助词或者连词)和“di”(名词)两个拼音,但是,根据语法规则只有副词短语和形容词短语是形容词或者副词加助词或者连词构成时,取“de”音,因此,此处取“地”的拼音为“de”。
如果前一个词组和当前的多音字构成短语搭配关系,就按照构成的短语类型来判定多音字的相应拼音。如果某多音字前面无词或者前面的词不和它构成短语关系,那么同理可以通过它的后一个词语校验它的拼音。如果一个多音字和它前面的词语依据短语语法规则能构成多种短语,那么结合它后面的词语来完成判定。从而采用本发明实施例提供的方法为汉字添加拼音时,可以在不分词的情况下达到分词同样的效果,在保证准确率的前提下高效地匹配当前汉字字符的相应拼音。
综上所述,本发明采用的方法,通过在不同的优先级词库中进行匹配的操作,利用词库中已经存在的整个词或者词的一部分不断将汉字数组中所保存的一个句子拆分成词,因而,本发明将分词和匹配两个过程一次完成。另外,基于词匹配操作添加拼音时,如果匹配上的词中含有多音字,则采用词匹配方法可以保证为该多音字添加拼音的准确率。因此,本发明在保证准确率的前提下,实现的自动为汉字添加拼音的操作具有省时、省力、高效的优点。并且,本发明可以自动地为大数据量的汉字添加拼音,在不进行分词的情况下达到与分词后再加拼音同样的准确率。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (10)

1、一种自动为汉字添加拼音的方法,其特征在于,该方法包括:
将用户选定的需要添加拼音的汉字与预先设置的词库中的词进行词匹配操作,将匹配成功的所述词库中的词的拼音添加给相应的需要添加拼音的汉字;
当所述词匹配操作失败时,将所述词匹配失败的汉字与预先设置的字库中的字进行字匹配操作,将匹配成功的所述字库中的字的拼音添加给相应的需要添加拼音的汉字。
2、根据权利要求1所述的方法,其特征在于,进行所述词匹配操作的步骤之前,该方法还包括:
分别将用户选定的需要添加拼音的文字中每两个相邻的非汉字字符之间的汉字收集到汉字数组中;
当所述汉字数组中连续的多个汉字与所述词库中的同一个词完全匹配或部分匹配时,确认所述词匹配操作成功。
3、根据权利要求2所述的方法,其特征在于,所述词库包括第一优先级词库和第二优先级词库;
所述词匹配操作的步骤包括:
判断所述汉字数组中连续的多个汉字与所述第一优先级词库中的同一个词是否完全匹配或部分匹配,如果是,则确认所述词匹配操作成功;否则,
判断所述汉字数组中连续的多个汉字与所述第二优先级词库中的同一个词是否完全匹配或部分匹配,如果是,则确认所述词匹配操作成功;否则,确认所述词匹配操作失败。
4、根据权利要求2所述的方法,其特征在于,所述将匹配成功的所述词库中的词的拼音添加给相应的需要添加拼音的汉字的步骤包括:
根据所述汉字数组中匹配成功的连续的各个汉字的编码及该汉字在所述汉字数组中的索引位置,从所述词库中读取匹配成功的词中的相应汉字的拼音,并添加给所述汉字数组中的相应汉字。
5、根据权利要求1所述的方法,其特征在于,预先设置与词库中的各个词相对应的词性;
所述将匹配成功的所述词库中的词的拼音添加给相应的需要添加拼音的汉字的步骤之后,该方法还包括:
记录所述汉字数组中由所述连续的多个汉字组成的词的词性。
6、根据权利要求5所述的方法,其特征在于,当所述字匹配操作成功,并且,所述字库中匹配成功的汉字为多音字时,所述将匹配成功的所述字库中的字的拼音添加给相应的需要添加拼音的汉字的步骤包括:
根据所述需要添加拼音的汉字的前一个词的词性,以及匹配成功的所述字库中的所述多音字的各个拼音及其对应的词性,确定需要读取的所述多音字的拼音,并将该拼音添加给所述需要添加拼音的汉字。
7、根据权利要求6所述的方法,其特征在于,为所述需要添加拼音的汉字添加拼音后,该方法还包括:根据该汉字的后一个词的词性,校正该汉字的拼音。
8、根据权利要求5所述的方法,其特征在于,预先为所述字库中的多音字设置具有不同优先级的拼音;
当所述字匹配操作成功,并且,所述字库中匹配成功的汉字为多音字时,将匹配成功的多音字所对应的具有最高优先级的拼音添加给所述需要添加拼音的汉字。
9、根据权利要求8所述的方法,其特征在于,在对所述需要添加拼音的汉字添加拼音后,该方法还包括:
根据所述需要添加拼音的汉字的后一个词的词性,以及该汉字的词性,对该汉字的拼音进行校正。
10、一种自动为汉字添加拼音的装置,其特征在于,该装置包括:
第一匹配单元,用于将用户选定的需要添加拼音的汉字与预先设置的词库中的词进行词匹配操作,将匹配成功的所述词库中的词的拼音添加给相应的需要添加拼音的汉字;
第二匹配单元,用于当所述词匹配操作失败时,将所述词匹配失败的汉字与预先设置的字库中的字进行字匹配操作,将匹配成功的所述字库中的字的拼音添加给相应的需要添加拼音的汉字。
CN2008100558313A 2008-01-09 2008-01-09 一种自动为汉字添加拼音的方法及装置 Expired - Fee Related CN101482867B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2008100558313A CN101482867B (zh) 2008-01-09 2008-01-09 一种自动为汉字添加拼音的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2008100558313A CN101482867B (zh) 2008-01-09 2008-01-09 一种自动为汉字添加拼音的方法及装置

Publications (2)

Publication Number Publication Date
CN101482867A true CN101482867A (zh) 2009-07-15
CN101482867B CN101482867B (zh) 2012-07-04

Family

ID=40879983

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2008100558313A Expired - Fee Related CN101482867B (zh) 2008-01-09 2008-01-09 一种自动为汉字添加拼音的方法及装置

Country Status (1)

Country Link
CN (1) CN101482867B (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101923580A (zh) * 2010-09-09 2010-12-22 北京开心人信息技术有限公司 一种基于多词表的关键词快速匹配的方法与系统
CN102982019A (zh) * 2012-11-26 2013-03-20 百度国际科技(深圳)有限公司 输入法语料注音方法、生成评测语料的方法及电子装置
CN105487684A (zh) * 2014-09-28 2016-04-13 北大方正集团有限公司 拼音汉字字符的输出方法和拼音汉字字符的输出装置
CN106407225A (zh) * 2015-08-03 2017-02-15 北大方正集团有限公司 一种显示拼音的方法及装置
CN108763441A (zh) * 2018-05-25 2018-11-06 腾讯音乐娱乐科技(深圳)有限公司 生成歌词、显示歌词的方法、装置、电子设备及存储介质
CN109213893A (zh) * 2018-07-27 2019-01-15 阿里巴巴集团控股有限公司 一种基于读音的词语显示方法和装置
CN109241502A (zh) * 2018-08-24 2019-01-18 浪潮软件集团有限公司 一种基于Java的准确提取词语拼音的方法
CN109739369A (zh) * 2019-01-03 2019-05-10 上海中畅信息科技有限公司 一种多音字汉字转拼音全拼的方法
CN109977361A (zh) * 2019-03-01 2019-07-05 广州多益网络股份有限公司 一种基于相似词的汉语拼音标注方法、装置及存储介质
CN110083711A (zh) * 2019-05-13 2019-08-02 成都启英泰伦科技有限公司 一种汉字拼音转换方法及转换系统
CN112101025A (zh) * 2020-11-13 2020-12-18 北京世纪好未来教育科技有限公司 拼音标注方法、装置、电子设备及存储介质

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1052960A (zh) * 1989-12-23 1991-07-10 方晖 华语自动分词注音新技术
CN100392640C (zh) * 1997-04-15 2008-06-04 英业达股份有限公司 读音符号自动标注的方法

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101923580A (zh) * 2010-09-09 2010-12-22 北京开心人信息技术有限公司 一种基于多词表的关键词快速匹配的方法与系统
CN102982019A (zh) * 2012-11-26 2013-03-20 百度国际科技(深圳)有限公司 输入法语料注音方法、生成评测语料的方法及电子装置
CN102982019B (zh) * 2012-11-26 2019-01-15 百度国际科技(深圳)有限公司 输入法语料注音方法、生成评测语料的方法及电子装置
CN105487684A (zh) * 2014-09-28 2016-04-13 北大方正集团有限公司 拼音汉字字符的输出方法和拼音汉字字符的输出装置
CN105487684B (zh) * 2014-09-28 2018-03-23 北大方正集团有限公司 拼音汉字字符的输出方法和拼音汉字字符的输出装置
CN106407225A (zh) * 2015-08-03 2017-02-15 北大方正集团有限公司 一种显示拼音的方法及装置
CN108763441B (zh) * 2018-05-25 2022-05-17 腾讯音乐娱乐科技(深圳)有限公司 生成歌词、显示歌词的方法、装置、电子设备及存储介质
CN108763441A (zh) * 2018-05-25 2018-11-06 腾讯音乐娱乐科技(深圳)有限公司 生成歌词、显示歌词的方法、装置、电子设备及存储介质
CN109213893A (zh) * 2018-07-27 2019-01-15 阿里巴巴集团控股有限公司 一种基于读音的词语显示方法和装置
CN109241502A (zh) * 2018-08-24 2019-01-18 浪潮软件集团有限公司 一种基于Java的准确提取词语拼音的方法
CN109739369A (zh) * 2019-01-03 2019-05-10 上海中畅信息科技有限公司 一种多音字汉字转拼音全拼的方法
CN109977361A (zh) * 2019-03-01 2019-07-05 广州多益网络股份有限公司 一种基于相似词的汉语拼音标注方法、装置及存储介质
CN110083711A (zh) * 2019-05-13 2019-08-02 成都启英泰伦科技有限公司 一种汉字拼音转换方法及转换系统
CN112101025A (zh) * 2020-11-13 2020-12-18 北京世纪好未来教育科技有限公司 拼音标注方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN101482867B (zh) 2012-07-04

Similar Documents

Publication Publication Date Title
CN101482867B (zh) 一种自动为汉字添加拼音的方法及装置
Och Statistical machine translation: From single word models to alignment templates
KR102268875B1 (ko) 전자 장치에 텍스트를 입력하는 시스템 및 방법
WO2017084506A1 (zh) 搜索查询词纠错方法和装置
US6349282B1 (en) Compound words in speech recognition systems
CN102591857B (zh) 一种平行语料资源获取方法及系统
EP1875462A2 (en) Method and system for generating spelling suggestions
WO2012039686A1 (en) Methods and systems for automated text correction
CN103853813A (zh) 外语文章写作辅助装置、方法及程序
White et al. Perceptron reranking for CCG realization
CN114462424B (zh) 一种文章段落分析注释方法、系统、可读介质及设备
Vilar et al. Jane: an advanced freely available hierarchical machine translation toolkit
US8041556B2 (en) Chinese to english translation tool
Carter et al. Syntactic discriminative language model rerankers for statistical machine translation
US20160154790A1 (en) Natural language processing method
Roark et al. Finite-state chart constraints for reduced complexity context-free parsing pipelines
KR20120045906A (ko) 코퍼스 오류 교정 장치 및 그 방법
KR101694179B1 (ko) 모음 제거 기반 인덱스 생성 방법 및 장치
JP2006004366A (ja) 機械翻訳システム及びそのためのコンピュータプログラム
Smith et al. The importance of the lexicon in tagging biological text
Sproat et al. Applications of lexicographic semirings to problems in speech and language processing
Köprü An efficient part-of-speech tagger for arabic
Vilar et al. On lm heuristics for the cube growing algorithm
Strassel et al. Data acquisition and linguistic resources
Kaeshammer Hierarchical machine translation with discontinuous phrases

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20220620

Address after: 3007, Hengqin international financial center building, No. 58, Huajin street, Hengqin new area, Zhuhai, Guangdong 519031

Patentee after: New founder holdings development Co.,Ltd.

Patentee after: BEIJING FOUNDER ELECTRONICS Co.,Ltd.

Address before: 100871, Haidian District Fangzheng Road, Beijing, Zhongguancun Fangzheng building, 298, 513

Patentee before: PEKING UNIVERSITY FOUNDER GROUP Co.,Ltd.

Patentee before: BEIJING FOUNDER ELECTRONICS Co.,Ltd.

CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120704