CN102375817A - 一种获取自造词的方法及装置 - Google Patents

一种获取自造词的方法及装置 Download PDF

Info

Publication number
CN102375817A
CN102375817A CN201010250418XA CN201010250418A CN102375817A CN 102375817 A CN102375817 A CN 102375817A CN 201010250418X A CN201010250418X A CN 201010250418XA CN 201010250418 A CN201010250418 A CN 201010250418A CN 102375817 A CN102375817 A CN 102375817A
Authority
CN
China
Prior art keywords
self
user
speech
word creation
interface
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201010250418XA
Other languages
English (en)
Inventor
张会鹏
潘伟彬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Shiji Guangsu Information Technology Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201010250418XA priority Critical patent/CN102375817A/zh
Publication of CN102375817A publication Critical patent/CN102375817A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

本发明提供了一种获取自造词的方法及装置,包括拷贝需要添加的自造词,根据需要添加的自造词,选择打开造词工具的用户词界面或自定义短语界面;按照打开的造词工具的用户词界面或自定义短语界面,将自造词添加进用户词库中或自定义短语列表中。通过本发明方法,方便、快捷地获取了自造词,并选择性地自动添加进了用户词库或自定义短语库。

Description

一种获取自造词的方法及装置
技术领域
本发明涉及输入法中的自造词技术,尤指一种获取自造词的方法及装置。
背景技术
为了将汉字输入到电子设备,就会使用到中文输入软件。目前,中文输入软件可分为键盘输入和非键盘输入两大类,其中,基于键盘的中文输入软件是比较成熟、使用最广的。中文输入软件是运行于操作系统上的一个工具软件,是用于将键盘输入的编码或其它非键盘输入的媒体数据转换成汉字输入的软件。具体地,
键盘中文输入软件是利用键盘,根据一定的编码规则来输入汉字的一种方法。
英文字母只有26个,它们对应着键盘上的26个字母,所以,对于英文而言是不存在什么输入软件的,直接输入英文字母就可以。汉字的字数有几万个,为了向电子设备如电脑、手机等输入汉字,必须首先对汉字进行编码,并将这些编码与键盘上的键关联起来,以便通过键盘输入某个汉字的编码,然后再根据编码转换成汉字。
目前,汉字编码方案已有数百种,其中在电脑上已经运行的就有几十种。作为一种图形文字,汉字是由字的音、形、义来共同表达的,汉字输入的编码方法,基本上都是采用将音、形、义与特定的键相联系,再根据不同汉字进行组合来完成汉字的输入的。
非键盘中文输入软件包括手写输入软件、语音输入软件、光学字符识别(OCR)输入软件等。其中,
手写输入软件是一种笔式环境下的手写中文识别输入软件,符合中国人用笔写字的习惯,只要在手写板上按平常的习惯写字,电脑就能将其识别显示出来。手写输入软件需要配套的硬件手写板,在配套的手写板上用笔(可以是任何类型的硬笔)来书写录入汉字,不仅方便、快捷,而且错字率也比较低。用鼠标在指定区域内也可以写出字来,然后使用手写软件转换成汉字。
语音输入软件是通过话筒输入声音,然后通过软件将输入的声音信息转换成文字。虽然语音输入软件使用起来很方便,但错字率仍然比较高,特别是一些未经训练的专业名词以及生僻字。语音输入法在硬件方面要求电脑必须配备能进行正常录音的声卡,然后调试好麦克风,才可以对着麦克风用普通话语音进行文字录入。如果普通话口音不标准,利用语音训练程序进行一段时间的训练后,也可以通过讲话来实现文字输入。
OCR技术要求将要输入的文稿通过扫描仪转化为图形才能识别,因此,扫描仪是必须的,而且原稿的印刷质量越高,识别的准确率就越高,一般最好是印刷体的文字,比如图书、杂志等。如果原稿的纸张较薄,那么有可能在扫描时纸张背面的图形、文字也透射过来,干扰最后的识别效果。
用户词和自定义短语,是中文输入法中非常重要的两种候选词类型,是自造词,基本上大多数的主流输入法都有。其中,
用户词是在用户使用输入法的输入过程中,由输入法软件自动记录到文件的个人习惯的词库,比如,输入一个在输入法的核心词库中不存在的词,用户需要通过逐个选择更小单位的词的方式组合成要输入的词,这样,这个词会自动记录到用户词库中,用户词库中也会记录输入该词的次数、时间等属性信息。
自定义短语是用户可以在一个设置界面进行添加、删除、编辑等管理操作的。用户词自定义短语技术是为了解决一些非标准词的输入,比如“QQ秀”,“U盘”等,用户可以自定义这些词的输入编码,自定义短语需要用户打开设置界面手动添加。
但是,上述两种候选词类型的自造词的现有获取方法中都存在一些问题:当用户在阅读文档或者浏览网页发现一个新词时,为了将该新词添加到输入法用户词库中或者自定义短语中,操作步骤都非常麻烦,比如:如果想添加到用户词库中,用户需要在输入法中将这个词通过键盘输入,一般这个词还不在用户词库中,用户需要一步一步将这个词手动组合出来,之后,输入法会将组合出来的词添加到用户词库中;如果想添加到自定义短语列表中,则需要手动打开自定义短语的设置界面,经过一系列的步骤才可以添加到自定义短语列表中,比如在QQ拼音输入法中,大致需要打开属性设置的高级页,接着打开自定义短语设置页面,点击“添加”按钮。在给出的页面中输入缩写和自定义短语并保存修改即可。
从现有自造词的获取方法来看,整个过程繁琐、而且需要用户选择是用户词还是自定义短语后,再手动一步一步完成。
发明内容
有鉴于此,本发明的主要目的在于提供一种获取自造词的方法及装置,能够方便、快捷地获取自造词,并自动添加进用户词库或自定义短语库。
为达到上述目的,本发明的技术方案是这样实现的:
一种获取自造词的方法,包括:
拷贝需要添加的自造词,根据需要添加的自造词,选择打开造词工具的用户词界面或自定义短语界面;
按照打开的造词工具的用户词界面或自定义短语界面,将自造词添加进用户词库中或自定义短语列表中。
所述拷贝需要添加的自造词为:利用剪切板将需要添加的自造词拷贝到剪切板中。
所述选择打开造词工具的用户词界面或自定义短语界面为:
如果所述剪切板中拷贝到的需要添加的自造词全部由汉字组成,并且汉字的个数在预设汉字阈值范围内,则判断出剪切板中的自造词为用户词,将剪切板中的自造词显示在造词工具的用户词界面中;
如果所述剪切板中拷贝到的需要添加的自造词不全是由汉字组成,并且字符的个数在预设字符阈值范围内,则判断出剪切板中的自造词为自定义短语,将剪切板中的自造词显示在造词工具的自定义短语界面中。
该方法还包括:
如果所述剪切板中拷贝到的需要添加的自造词全部是由汉字组成的,但是汉字的个数超过预设汉字阈值,并且字符的个数超出预设字符阈值;或者,
如果所述剪切板中拷贝到的需要添加的自造词不全是由汉字组成的,并且字符的个数超出预设字符阈值,则判断出剪切板中的内容为空,用户可选择按照现有方法获取该自造词。
当打开的是用户词界面时,所述将自造词添加进用户词库中或自定义短语列表中为:
在核心词库和用户词库中查找当前显示在造词工具的用户词界面中的自造词,如果找到,将核心词库或用户词库中匹配的记录的标音显示在用户词界面中;用户选择正确的音标并保存后,将确定的音标和用户词添加在用户词库中;
如果在核心词库或用户词库中未找到当前显示在造词工具的用户词界面中的自造词,利用汉字标音库对当前需要添加的自造词进行标音并显示在用户词界面中,用户选择正确的音标并保存后,将确定的音标和用户词添加在用户词库中。
当打开的是自定义短语界面时,所述将自造词添加进用户词库中或自定义短语列表中为:
在自定义短语列表中查找当前显示在造词工具的自定义短语界面中的自造词,如果找到,将自定义短语列表中匹配到的当前显示在自定义短语界面中的自造词的内容及其在自定义短语列表中的位置显示在自定义短语界面上,用户将该自造词的内容及其在自定义短语列表中的位置信息保存到自定义短语列表中;
如果在自定义短语列表中未找到当前显示在造词工具的自定义短语界面中的自造词,将当前自造词显示在自定义短语界面中,并指定其位置,用户将该自造词的内容及其在自定义短语列表中的位置信息保存到自定义短语列表中。
一种获取自造词的装置,主要包括拷贝单元、区分单元、用户词添加单元及自定义短语添加单元,其中,
拷贝单元,用于拷贝需要添加的自造词,比如利用剪切板将需要添加的自造词拷贝到剪切板中;
区分单元,用于区分剪切板中的自造词是属于用户词,还是属于自定义短语,并相应通知用户词添加单元及自定义短语添加单元进行处理;
用户词添加单元,用于将需要添加的自造词添加到用户词库中;
自定义短语添加单元,用于将需要添加的自造词添加到自定义短语列表中。
所述用户词处理单元具体包括第一显示模块、第一查找模块、第一处理模块和第二处理模块,其中,
第一显示模块,用于根据来自分区分单元的指示,将剪切板中的自造词显示在造词工具的用户词界面中;接收来自第一处理模块的指示,将核心词库中匹配的记录的标音显示在用户词界面中;接收来自第一处理模块的指示,将标音后的当前需要添加的自造词显示在用户词界面中;
第一查找模块,用于在核心词库中查找当前显示在造词工具的用户词界面中的自造词,如果查找到,通知第一处理模块进行处理;如果未找到,并通知第二处理模块进行处理;
第一处理模块,用于接收来自第一查找模块的通知,用户根据显示选择正确的音标并保存,向第一显示模块发出指示,并将确定的音标和用户词添加在用户词库中;
第二处理模块,用于接收来自第一查找模块的通知,利用汉字标音库对当前需要添加的自造词进行标音,用户选择正确的音标并保存,向第一显示模块发出指示,并将确定的音标和用户词添加在用户词库中。
所述自定义短语添加单元具体包括第二显示模块、第二查找模块、第三处理模块和第四处理模块,其中,
第二显示模块,用于根据来自分区分单元的指示,将剪切板中的自造词显示在造词工具的自定义短语界面中;接收来自第三处理模块的指示,将在自定义短语列表中匹配到的自定义短语的内容及其在自定义短语列表中的位置显示在自定义短语界面上;接收来自第四处理模块的指示,将当前需要添加的自造词显示在自定义短语界面中;
第二查找模块,用于在自定义短语列表中查找当前显示在造词工具的用户词界面中的自造词,如果查找到,通知第三处理模块进行处理;如果未找到,并通知第四处理模块进行处理;
第三处理模块,用于接收来自第二查找模块的通知,用户将在自定义短语列表中匹配到的内容及其在自定义短语列表中的位置信息保存到自定义短语列表中,向第二显示模块发出指示;
第四处理模块,用于接收来自第二查找模块的通知,为当前需要添加的自造词指定其位置,用户将该自造词的内容及其在自定义短语列表中的位置信息保存到自定义短语列表中,向第二显示模块发出指示。
所述区分单元,还用于区分剪切板中的自造词既不属于用户词,也不属于自定义短语时,通知手动处理单元;相应地,
该装置还包括手动处理单元,用于接收来自区分单元的通知,提示用户选择按照现有方法获取该自造词。
从上述本发明提供的技术方案可以看出,包括拷贝需要添加的自造词,根据需要添加的自造词,选择打开造词工具的用户词界面或自定义短语界面;按照打开的造词工具的用户词界面或自定义短语界面,将自造词添加进用户词库中或自定义短语列表中。通过本发明方法,方便、快捷地获取了自造词,并选择性地自动添加进了用户词库或自定义短语库。
附图说明
图1为本发明获取自造词的方法的流程图;
图2为本发明获取自造词的装置的组成结构示意图;
图3为本发明获取自造词的实施例的流程示意图。
具体实施方式
图1为本发明获取自造词的方法的流程图,如图1所示,包括:
步骤100:拷贝需要添加的自造词。
本步骤中的拷贝可以通过现有计算机中的拷贝到剪切板中的功能来实现。与现有技术相比,本发明中不需要通过输入法将这个词通过手动一步步输入,这样会更加方便、快捷。
步骤101:根据需要添加的自造词,选择打开造词工具的用户词界面或自定义短语界面。
如果剪切板中拷贝到的需要添加的自造词全部是由汉字组成的,并且汉字的个数在预设汉字阈值范围内,则判断出剪切板中的自造词为用户词,将剪切板中的自造词显示在造词工具的用户词界面中;
如果剪切板中拷贝到的需要添加的自造词不全是由汉字组成的,并且字符的个数在预设字符阈值范围内,则判断出剪切板中的自造词为自定义短语,将剪切板中的自造词显示在造词工具的自定义短语界面中;
进一步地,如果剪切板中拷贝到的需要添加的自造词全部是由汉字组成的,但是汉字的个数超过预设汉字阈值,并且字符的个数超出预设字符阈值;或者,如果剪切板中拷贝到的需要添加的自造词不全是由汉字组成的,并且字符的个数超出预设字符阈值,则判断出剪切板中的内容为空,用户可选择按照现有方法获取该自造词。
本步骤中,造词工具,以及造词工具的打开用户词界面或自定义短语界面都是现有就存在的,这里强调的是根据需要添加的需要添加的自造词的属性,如是否全是汉字,长度等,自动选择并调出造词工具的打开用户词界面或自定义短语界面。
步骤102:按照打开的造词工具的用户词界面或自定义短语界面,将自造词添加进用户词库中或自定义短语列表中。
当打开的是用户词界面时,本步骤包括:
在核心词库和用户词库中查找当前显示在造词工具的用户词界面中的自造词,如果找到,将核心词库或用户词库中匹配的记录(即在核心词库中存在的该自造词)的标音显示在用户词界面中,用户选择正确的音标并保存后,将确定的音标和用户词添加在用户词库中;如果在核心词库或用户词库中未找到当前显示在造词工具的用户词界面中的自造词,利用汉字标音库对当前需要添加的自造词进行标音(这里标音是系统默认的一组)并显示在用户词界面中,用户选择正确的音标并保存后,将确定的音标和用户词添加在用户词库中。
这里,对标音的标注,以及对标音的选择属于本领域技术人员惯用技术手段,其具体实现方法不用于限定本发明的保护范围,这里不再赘述。
当打开的是自定义短语界面时,本步骤包括:
在自定义短语列表中查找当前显示在造词工具的自定义短语界面中的自造词,如果找到,将自定义短语列表中匹配到的当前显示在自定义短语界面中的自造词的内容及其在自定义短语列表中的位置显示在自定义短语界面上,用户将该自造词的内容及其在自定义短语列表中的位置信息保存到自定义短语列表中;如果在自定义短语列表中未找到当前显示在造词工具的自定义短语界面中的自造词,将当前自造词显示在自定义短语界面中,并指定其位置(如默认为1),用户将该自造词的内容及其在自定义短语列表中的位置信息保存到自定义短语列表中。
对应本发明方法还提供一种获取自造词的装置,如图2所示,主要包括拷贝单元、区分单元、用户词添加单元及自定义短语添加单元,其中,
拷贝单元,用于拷贝需要添加的自造词,比如利用剪切板将需要添加的自造词拷贝到剪切板中。
区分单元,用于区分剪切板中的自造词是属于用户词,还是属于自定义短语,并相应通知用户词添加单元及自定义短语添加单元进行处理。
用户词添加单元,用于将需要添加的自造词添加到用户词库中。
自定义短语添加单元,用于将需要添加的自造词添加到自定义短语列表中。
其中,用户词处理单元具体包括第一显示模块、第一查找模块、第一处理模块和第二处理模块,其中,
第一显示模块,用于根据来自分区分单元的指示,将剪切板中的自造词显示在造词工具的用户词界面中;接收来自第一处理模块的指示,将核心词库中匹配的记录的标音显示在用户词界面中;接收来自第一处理模块的指示,将标音后的当前需要添加的自造词显示在用户词界面中。
第一查找模块,用于在核心词库中查找当前显示在造词工具的用户词界面中的自造词,如果查找到,通知第一处理模块进行处理;如果未找到,并通知第二处理模块进行处理。
第一处理模块,用于接收来自第一查找模块的通知,用户根据显示选择正确的音标并保存,向第一显示模块发出指示,并将确定的音标和用户词添加在用户词库中。
第二处理模块,用于接收来自第一查找模块的通知,利用汉字标音库对当前需要添加的自造词进行标音,用户选择正确的音标并保存,向第一显示模块发出指示,并将确定的音标和用户词添加在用户词库中。
自定义短语添加单元具体包括第二显示模块、第二查找模块、第三处理模块和第四处理模块,其中,
第二显示模块,用于根据来自分区分单元的指示,将剪切板中的自造词显示在造词工具的自定义短语界面中;接收来自第三处理模块的指示,将在自定义短语列表中匹配到的自定义短语的内容及其在自定义短语列表中的位置显示在自定义短语界面上;接收来自第四处理模块的指示,将当前需要添加的自造词显示在自定义短语界面中。
第二查找模块,用于在自定义短语列表中查找当前显示在造词工具的用户词界面中的自造词,如果查找到,通知第三处理模块进行处理;如果未找到,并通知第四处理模块进行处理。
第三处理模块,用于接收来自第二查找模块的通知,用户将在自定义短语列表中匹配到的内容及其在自定义短语列表中的位置信息保存到自定义短语列表中,向第二显示模块发出指示。
第四处理模块,用于接收来自第二查找模块的通知,为当前需要添加的自造词指定其位置,用户将该自造词的内容及其在自定义短语列表中的位置信息保存到自定义短语列表中,向第二显示模块发出指示。
本发明区分单元,还用于区分剪切板中的自造词既不属于用户词,也不属于自定义短语时,通知手动处理单元。相应地,本发明装置还包括手动处理单元,用于接收来自区分单元的通知,提示用户选择按照现有方法获取该自造词。
下面结合实施例,对本发明方法进行详细描述。
图3为本发明获取自造词的实施例的流程示意图,如图3所示,本实施例中,假设用户已将需要添加的自造词拷贝到了系统剪切板中,并已启动造词工具,包括:
步骤300:判断剪切板中的内容是否全部由汉字组成,如果是,进入步骤301,否则进入步骤308。
步骤301:判断剪切板中的汉字是否超过预设汉字阈值N,如果超过,进入步骤308;否则进入步骤302。其中,汉字阈值N是系统预先设置的,其大小表示造词工具允许一次性添加的自造词的汉字长度。
步骤302:将剪切板中的内容显示在造词工具的用户词界面上。
步骤303~步骤304:在核心词库和用户词库中查找剪切板中的内容,如果查找到,进入步骤305;否则进入步骤306。
其中,核心词库是输入法软件中固定的,不可扩展的标准词库;用户词库用于存储在用户使用输入法进行的输入过程中产生的不存在于核心词库中的词。
步骤305:将核心词库或用户词库中匹配的记录的标音(即加上拼音)显示在用户词界面上,进入步骤307。
步骤306:利用汉字标音库对当前自造词进行标音并显示在用户词界面上,这里是默认标上汉字最常用的音。其中,现有汉字标音库存储有汉字与用于对汉字进行标注的拼音的对应关系。
步骤307:用户选择标音并保存后,经标音和该自造词添加到用户词库中。结束本流程。
步骤308:判断剪切板中的字符是否超过预设字符阈值M,如果超过,进入步骤315;否则进入步骤309。其中,字符阈值M是系统预先设置的,其大小其表示造词工具允许一次性添加的自造词的字符长度。
步骤309:将剪切板内容显示在造词工具的自定义短语界面上。
步骤310~步骤311:在自定义短语列表中查找剪切板中的内容,如果查找到,进入步骤312;否则进入步骤313。
步骤312:将剪切板中的内容和缩写以及在候选次列表中的位置显示在自定义短语界面上,进入步骤314。
步骤313:将剪切板中的内容显示在自定义短语界面上,候选词列表中的位置指定为已和默认值(比如1),缩写初始为空。
步骤314:用户操作并保存后,将缩写、位置信息,及自定义短语内容添加到自定义短语列表中。结束本流程。
步骤315:造词工具打开并显示为空,用户可以手动添加需要保存的自造词的内容。
本步骤表明当前剪切板中的汉字或字符长度超出造词工具的处理能力时,用户可以按照现有方法,手动添加需要保存的自造词的内容。
步骤316:用户输入自造词并保存后,如果当前为用户词界面,则将自造词保存在用户词库中;如果当前为自定义短语界面,则将自造词保存在自定义短语列表中。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种获取自造词的方法,其特征在于,包括:
拷贝需要添加的自造词,根据需要添加的自造词,选择打开造词工具的用户词界面或自定义短语界面;
按照打开的造词工具的用户词界面或自定义短语界面,将自造词添加进用户词库中或自定义短语列表中。
2.根据权利要求1所述的方法,其特征在于,所述拷贝需要添加的自造词为:利用剪切板将需要添加的自造词拷贝到剪切板中。
3.根据权利要求2所述的方法,其特征在于,所述选择打开造词工具的用户词界面或自定义短语界面为:
如果所述剪切板中拷贝到的需要添加的自造词全部由汉字组成,并且汉字的个数在预设汉字阈值范围内,则判断出剪切板中的自造词为用户词,将剪切板中的自造词显示在造词工具的用户词界面中;
如果所述剪切板中拷贝到的需要添加的自造词不全是由汉字组成,并且字符的个数在预设字符阈值范围内,则判断出剪切板中的自造词为自定义短语,将剪切板中的自造词显示在造词工具的自定义短语界面中。
4.根据权利要求3所述的方法,其特征在于,该方法还包括:
如果所述剪切板中拷贝到的需要添加的自造词全部是由汉字组成的,但是汉字的个数超过预设汉字阈值,并且字符的个数超出预设字符阈值;或者,
如果所述剪切板中拷贝到的需要添加的自造词不全是由汉字组成的,并且字符的个数超出预设字符阈值,则判断出剪切板中的内容为空,用户可选择按照现有方法获取该自造词。
5.根据权利要求3或4所述的方法,其特征在于,当打开的是用户词界面时,所述将自造词添加进用户词库中或自定义短语列表中为:
在核心词库和用户词库中查找当前显示在造词工具的用户词界面中的自造词,如果找到,将核心词库或用户词库中匹配的记录的标音显示在用户词界面中;用户选择正确的音标并保存后,将确定的音标和用户词添加在用户词库中;
如果在核心词库或用户词库中未找到当前显示在造词工具的用户词界面中的自造词,利用汉字标音库对当前需要添加的自造词进行标音并显示在用户词界面中,用户选择正确的音标并保存后,将确定的音标和用户词添加在用户词库中。
6.根据权利要求3或4所述的方法,其特征在于,当打开的是自定义短语界面时,所述将自造词添加进用户词库中或自定义短语列表中为:
在自定义短语列表中查找当前显示在造词工具的自定义短语界面中的自造词,如果找到,将自定义短语列表中匹配到的当前显示在自定义短语界面中的自造词的内容及其在自定义短语列表中的位置显示在自定义短语界面上,用户将该自造词的内容及其在自定义短语列表中的位置信息保存到自定义短语列表中;
如果在自定义短语列表中未找到当前显示在造词工具的自定义短语界面中的自造词,将当前自造词显示在自定义短语界面中,并指定其位置,用户将该自造词的内容及其在自定义短语列表中的位置信息保存到自定义短语列表中。
7.一种获取自造词的装置,其特征在于,主要包括拷贝单元、区分单元、用户词添加单元及自定义短语添加单元,其中,
拷贝单元,用于拷贝需要添加的自造词,比如利用剪切板将需要添加的自造词拷贝到剪切板中;
区分单元,用于区分剪切板中的自造词是属于用户词,还是属于自定义短语,并相应通知用户词添加单元及自定义短语添加单元进行处理;
用户词添加单元,用于将需要添加的自造词添加到用户词库中;
自定义短语添加单元,用于将需要添加的自造词添加到自定义短语列表中。
8.根据权利要求7所述的装置,其特征在于,所述用户词处理单元具体包括第一显示模块、第一查找模块、第一处理模块和第二处理模块,其中,
第一显示模块,用于根据来自分区分单元的指示,将剪切板中的自造词显示在造词工具的用户词界面中;接收来自第一处理模块的指示,将核心词库中匹配的记录的标音显示在用户词界面中;接收来自第一处理模块的指示,将标音后的当前需要添加的自造词显示在用户词界面中;
第一查找模块,用于在核心词库中查找当前显示在造词工具的用户词界面中的自造词,如果查找到,通知第一处理模块进行处理;如果未找到,并通知第二处理模块进行处理;
第一处理模块,用于接收来自第一查找模块的通知,用户根据显示选择正确的音标并保存,向第一显示模块发出指示,并将确定的音标和用户词添加在用户词库中;
第二处理模块,用于接收来自第一查找模块的通知,利用汉字标音库对当前需要添加的自造词进行标音,用户选择正确的音标并保存,向第一显示模块发出指示,并将确定的音标和用户词添加在用户词库中。
9.根据权利要求7所述的装置,其特征在于,所述自定义短语添加单元具体包括第二显示模块、第二查找模块、第三处理模块和第四处理模块,其中,
第二显示模块,用于根据来自分区分单元的指示,将剪切板中的自造词显示在造词工具的自定义短语界面中;接收来自第三处理模块的指示,将在自定义短语列表中匹配到的自定义短语的内容及其在自定义短语列表中的位置显示在自定义短语界面上;接收来自第四处理模块的指示,将当前需要添加的自造词显示在自定义短语界面中;
第二查找模块,用于在自定义短语列表中查找当前显示在造词工具的用户词界面中的自造词,如果查找到,通知第三处理模块进行处理;如果未找到,并通知第四处理模块进行处理;
第三处理模块,用于接收来自第二查找模块的通知,用户将在自定义短语列表中匹配到的内容及其在自定义短语列表中的位置信息保存到自定义短语列表中,向第二显示模块发出指示;
第四处理模块,用于接收来自第二查找模块的通知,为当前需要添加的自造词指定其位置,用户将该自造词的内容及其在自定义短语列表中的位置信息保存到自定义短语列表中,向第二显示模块发出指示。
10.根据权利要求7~9任一项所述的装置,其特征在于,所述区分单元,还用于区分剪切板中的自造词既不属于用户词,也不属于自定义短语时,通知手动处理单元;相应地,
该装置还包括手动处理单元,用于接收来自区分单元的通知,提示用户选择按照现有方法获取该自造词。
CN201010250418XA 2010-08-06 2010-08-06 一种获取自造词的方法及装置 Pending CN102375817A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201010250418XA CN102375817A (zh) 2010-08-06 2010-08-06 一种获取自造词的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201010250418XA CN102375817A (zh) 2010-08-06 2010-08-06 一种获取自造词的方法及装置

Publications (1)

Publication Number Publication Date
CN102375817A true CN102375817A (zh) 2012-03-14

Family

ID=45794441

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201010250418XA Pending CN102375817A (zh) 2010-08-06 2010-08-06 一种获取自造词的方法及装置

Country Status (1)

Country Link
CN (1) CN102375817A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102937880A (zh) * 2012-10-22 2013-02-20 广东欧珀移动通信有限公司 一种使用自定义词句的输入法、输入法系统及移动终端
CN110704391A (zh) * 2019-09-23 2020-01-17 车智互联(北京)科技有限公司 一种词库构建方法及计算设备
CN113220468A (zh) * 2020-02-04 2021-08-06 北京搜狗科技发展有限公司 一种自定义内容的处理方法、装置和介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050096085A1 (en) * 2003-10-24 2005-05-05 Mirkin Eugene A. Apparatus and method for forming compound words
CN101114298A (zh) * 2007-08-31 2008-01-30 北京搜狗科技发展有限公司 一种获取口语词条的方法、装置以及一种输入法系统
CN101149679A (zh) * 2006-09-21 2008-03-26 腾讯科技(深圳)有限公司 在输入法词库中添加自定义词的方法及文字输入装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050096085A1 (en) * 2003-10-24 2005-05-05 Mirkin Eugene A. Apparatus and method for forming compound words
CN101149679A (zh) * 2006-09-21 2008-03-26 腾讯科技(深圳)有限公司 在输入法词库中添加自定义词的方法及文字输入装置
CN101114298A (zh) * 2007-08-31 2008-01-30 北京搜狗科技发展有限公司 一种获取口语词条的方法、装置以及一种输入法系统

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
天极网: "QQ拼音3.2可造词 满足输入多样化需求", 《HTTP://TOOLS.YESKY.COM/96/11229596.SHTML》, 25 April 2010 (2010-04-25), pages 1 - 3 *
田占霄: "中英文混合分词方法及应用研究", 《中国优秀硕士学位论文全文数据库信息科技辑》, no. 10, 15 October 2009 (2009-10-15), pages 9 *
腾讯: "QQ拼音输入法3.3", 《HTTP://WWW.7EDOWN.COM/SOFT/DOWN/SOFT_8354.HTML》, 28 July 2010 (2010-07-28), pages 1 - 6 *
陈涛: "打字很快乐 QQ拼音3.2创意功能逐个数", 《HTTP://WWW.PCPOP.COM/DOC/0/534/534793_ALL.SHTML#P2》, 21 May 2010 (2010-05-21), pages 1 - 7 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102937880A (zh) * 2012-10-22 2013-02-20 广东欧珀移动通信有限公司 一种使用自定义词句的输入法、输入法系统及移动终端
CN102937880B (zh) * 2012-10-22 2015-08-12 广东欧珀移动通信有限公司 一种使用自定义词句的输入法、输入法系统及移动终端
CN110704391A (zh) * 2019-09-23 2020-01-17 车智互联(北京)科技有限公司 一种词库构建方法及计算设备
CN113220468A (zh) * 2020-02-04 2021-08-06 北京搜狗科技发展有限公司 一种自定义内容的处理方法、装置和介质

Similar Documents

Publication Publication Date Title
KR101435265B1 (ko) 언어 변환에 있어서 다중 리딩 모호성 해결을 위한 방법
CN101154226B (zh) 在输入法词库中添加未登录词的方法及文字输入装置
CN100555203C (zh) 修正已输入文字的系统及方法
CN100472411C (zh) 输入法中取消字符串的方法及文字输入系统
US20080180283A1 (en) System and method of cross media input for chinese character input in electronic equipment
CN102298582A (zh) 数据搜索和匹配方法和系统
CN101133411A (zh) 非罗马字符的容错罗马化输入方法
CN102446061A (zh) 信息终端装置和文字输入方法
CN101149679A (zh) 在输入法词库中添加自定义词的方法及文字输入装置
CN101520693A (zh) 一种批量信息快速输入的方法及系统
CN102346560A (zh) 一种输入法中调整候选词顺序的方法及装置
CN100559332C (zh) 恢复已删文字的系统及方法
CN103324607A (zh) 一种泰语文本切词方法及装置
TW200842662A (en) Stroke number input
CN102375817A (zh) 一种获取自造词的方法及装置
Shillingsburg Development principles for virtual archives and editions
WO2008018274A1 (fr) dispositif de conversion de caractère et procédé de commande de dispositif de conversion de caractère
CN102685347B (zh) 图像处理装置和图像处理方法
CN106802722A (zh) 一种基于三笔数码输入法的语音输入方法及系统
TW420774B (en) Method and apparatus for automatically correcting documents in chinese language
US20170116180A1 (en) Document analysis system
JP2019057137A (ja) 情報処理装置及び情報処理プログラム
US11170182B2 (en) Braille editing method using error output function, recording medium storing program for executing same, and computer program stored in recording medium for executing same
JP4294456B2 (ja) 特定キャラクタ列検索装置、特定キャラクタ列検索方法、特定キャラクタ列検索プログラム、および記録媒体
JP2008217770A (ja) 言語データ表示システム、言語データ表示方法、及び言語データ表示プログラム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: SHENZHEN SHIJI LIGHT SPEED INFORMATION TECHNOLOGY

Free format text: FORMER OWNER: TENGXUN SCI-TECH (SHENZHEN) CO., LTD.

Effective date: 20131015

C41 Transfer of patent application or patent right or utility model
COR Change of bibliographic data

Free format text: CORRECT: ADDRESS; FROM: 518044 SHENZHEN, GUANGDONG PROVINCE TO: 518057 SHENZHEN, GUANGDONG PROVINCE

TA01 Transfer of patent application right

Effective date of registration: 20131015

Address after: A Tencent Building in Shenzhen Nanshan District City, Guangdong streets in Guangdong province science and technology 518057 16

Applicant after: Shenzhen Shiji Guangsu Information Technology Co., Ltd.

Address before: Shenzhen Futian District City, Guangdong province 518044 Zhenxing Road, SEG Science Park 2 East Room 403

Applicant before: Tencent Technology (Shenzhen) Co., Ltd.

RJ01 Rejection of invention patent application after publication

Application publication date: 20120314

RJ01 Rejection of invention patent application after publication