CN101206655A

CN101206655A - 依据输入数据习惯建立使用者常用字汇字典的系统及方法

Info

Publication number: CN101206655A
Application number: CNA2006101707994A
Authority: CN
Inventors: 邱全成; 韩晓旻
Original assignee: Inventec Corp
Current assignee: Inventec Corp
Priority date: 2006-12-22
Filing date: 2006-12-22
Publication date: 2008-06-25

Abstract

本发明公开一种依据使用者输入数据习惯建立使用者常用字汇字典的系统及其方法，该系统包括一使用者输入数据接口，提供使用者输入数据的一编辑窗口或一输入字段；一输入数据习惯捕捉模块，针对该编辑窗口或该输入字段的输入数据提取相应单词或词组；一语意规则库，建立一语意规则；一推论机，输出一字典推论结果；一使用者输入习惯字典，将该字典推论结果，分别储存在各该语意类别的相应数据库中；以及一智能优先提取模块，提取与该初始字词相关的优先排列，以供使用者选取。根据使用者输入习惯的捕捉、分析，对于相应数据库中内容进行不断的更新，并划分其优先级，在使用者再次输入相同字词的时候，给予最常用，最直接的智能型联想的提示与翻译。

Description

依据输入数据习惯建立使用者常用字汇字典的系统及方法

技术领域

本发明涉及一种建立使用者常用字汇字典的系统及其方法，尤其涉及一种依据使用者输入数据习惯建立使用者常用字汇字典的系统及其方法。

背景技术

以往对于使用者输入时的智能联想，只停留在输入法中对于单纯词汇的联想。而在多数搜索引擎中的联想内容提示也是只单纯罗列出所有曾出现过的输入内容，如此对于使用者来说，虽提高了些许的友善度，但仍旧没有达到较理想的智能化的过滤。

相对于使用者平常所能输入的软件接口，似乎尚未充分的加以智能化的汇整，此不同应用程序间的数据收集应是体现使用者习惯的可靠分析来源。

另外，对于已经收集到的使用者输入信息习惯数据虽然制定了一系列整理的方法，以及作为反馈时优先级的智能判断，但对于日渐庞大的数据库，反馈时仍旧存在无法更有针对性的，仅是一眛地提供庞大的联想词汇，无法更为贴切地提供使用者符合他需要的智能联想。

对于翻译软件客制化的词库建立，有其智能化、实用化及精确使用的努力方向，因此，一种依据使用者输入数据习惯建立使用者常用字汇字典的系统及其方法遂成为一被关注的议题。

发明内容

本发明所要解决的技术问题在于提供一种依据使用者输入数据习惯建立使用者常用字汇字典的系统。

为实现上述目的，本发明提供一种依据使用者输入数据习惯建立使用者常用字汇字典的系统，包括：一使用者输入数据接口，提供使用者输入数据的一编辑窗口或一输入字段；一输入数据习惯捕捉模块，依据多个捕捉条件，针对编辑窗口或输入字段的输入数据提取相应单词或词组；一语意规则库，依据一语意结构、一语意句法、一语意类别与捕捉条件建立一语意规则；一推论机，依据语意规则，针对所输入数据进行推论，并输出一字典推论结果；一使用者输入习惯字典，依据语意类别的分类，将字典推论结果，分别储存在各语意类别的相应数据库中；以及一智能优先提取模块，依据使用者输入数据的初始字词，从使用者输入习惯字典中提取与初始字词相关的优先排列，以供使用者选取。

本发明的另一目的还在于提供一种依据使用者输入数据习惯建立使用者常用字汇字典的方法。

为实现上述目的，本发明所提供的依据使用者输入数据习惯建立使用者常用字汇字典的方法包括下列步骤：提供使用者输入数据的一编辑窗口或一输入字段；依据多个捕捉条件，针对编辑窗口或输入字段的输入数据提取相应单词或词组；依据一语意结构、一语意句法、一语意类别与捕捉条件建立一语意规则；依据语意规则，针对所输入数据进行推论，并输出一字典推论结果；依据语意类别的分类，将字典推论结果，分别储存在各语意类别的相应数据库中；以及依据使用者输入数据的初始字词，从各语意类别的相应数据库中提取与初始字词相关的优先排列，以供使用者选取。

所述的捕捉条件是以曾经出现或查询过的单词或词组设定为一次，以经常出现或查询过的单词或词组设定为多次；使用者输入习惯字典还包括常用语句字典数据库、兴趣喜好字典数据库、商务交流字典数据库、生词字典数据库与使用者定义数据库；而使用者定义数据库是依据语意类别的自定义分类来建立。

本发明根据使用者输入习惯的捕捉、分析，对于相应数据库中内容进行不断的更新，并划分其优先级，进而在使用者再次输入相同字词的时候，给予最常用，最直接的智能型联想的提示与翻译。

以上的关于本发明内容的说明及以下的实施方式的说明用以示范与解释本发明的原理，并且提供本发明的权利要求更进一步的解释。

附图说明

图1为本发明所提的依据使用者输入数据习惯建立使用者常用字汇字典的系统方块图；

图2为本发明所提的依据使用者输入数据习惯建立使用者常用字汇字典的方法流程图；

图3A为本发明的第一实施例示意图；以及

图3B为本发明的第二实施例示意图。

其中，附图标记：

110：使用者输入数据接口

120：输入数据习惯捕捉模块

130：语意规则库

140：推论机

150：使用者输入习惯字典

151：常用语句字典数据库

152：兴趣喜好字典数据库

153：商务交流字典数据库

154：生词字典数据库

155：使用者定义数据库

160：智能优先提取模块

步骤210：提供使用者输入数据的一编辑窗口或一输入字段

步骤220：依据多个捕捉条件，针对编辑窗口或输入字段的输入数据提取相应单词或词组

步骤230：依据一语意结构、一语意句法、一语意类别与捕捉条件建立一语意规则

步骤240：依据语意规则，针对所输入数据进行推论，并输出一字典推论结果

步骤250：依据语意类别的分类，将字典推论结果，分别储存在各语意类别的相应数据库中

步骤260：依据使用者输入数据的初始字词，从各语意类别的相应数据库中提取与初始字词相关的优先排列，以供使用者选取

具体实施方式

本发明则是通过长期对于使用者输入信息的分类以及分析，建立一个不只是单纯记忆的数据库，而是根据持续的输入习惯捕捉，通过一系列对于输入信息内容构成捕捉以及消除记录条件的建立，对于数据库中内容的进行不断更新，并划分其优先级。进而在使用者再次输入相同字词的时候，给予最常用，最直接的智能型联想。

本发明是根据对于所有使用者输入信息内容中，构成可被收集条件的信息内容，通过系统内建的语意规则库，分析其语言结构，划分语言内容的类别，从而建立起若干符合不同使用者语言习惯的输入信息习惯字典。从而在使用者进行再输入时，通过语意规则库的再分析，判断其用词需求，并从相应的习惯字典中，根据该单词或词组的常用频率划分优先级，作智能型联想提示，以达到最大限度的贴近使用者需求的输入智能型联想方式。同时其建立的这套用户习惯字典，也将作为分析用户个人语言行为以及爱好偏向的最大参考。本发明所能实现应用的这套使用者信息习惯字典，让使用者进行日常输入的时候，能够更有针对性，更准确地提供智能联想。也为使用者的智能分身，对于使用者本身语言习惯的人工智能模拟，提供更完整而准确的数据信息来源。

图1为本发明所提的依据使用者输入数据习惯建立使用者常用字汇字典的系统方块图，包括：一使用者输入数据接口110，提供使用者输入数据的一编辑窗口或一输入字段，此编辑窗口或输入字段针对计算机执行接口中所能出现的输入框或一般的文字处理软件而言；一输入数据习惯捕捉模块120，依据多个捕捉条件，针对编辑窗口或输入字段的输入数据提取相应单词或词组，其中，捕捉条件以曾经出现或查询过的单词或词组设定为一次，以经常出现或查询过的单词或词组设定为多次，这些都被记录在系统中，作为[使用者输入数据习惯]的判断依据；一语意规则库130，依据一语意结构、一语意句法、一语意类别与捕捉条件建立一语意规则，该语意规则可以从上述的语意结构、语意句法、语意类别与捕捉条件的组合中任选其中一种，以作为下述推论的条件依据；一推论机140，依据语意规则，针对所输入数据进行推论，并输出一字典推论结果；一使用者输入习惯字典150，依据语意类别的分类，将字典推论结果，分别储存在各语意类别的相应数据库中，使用者输入习惯字典150还包括常用语句字典数据库151、兴趣喜好字典数据库152、商务交流字典数据库153、生词字典数据库154与使用者定义数据库155；以及一智能优先提取模块160，依据使用者输入数据的初始字词，从使用者输入习惯字典中提取与初始字词相关的优先排列，以供使用者选取。

图2为本发明所提的依据使用者输入数据习惯建立使用者常用字汇字典的方法流程图，包括下列步骤：提供使用者输入数据的一编辑窗口或一输入字段(步骤210)；依据多个捕捉条件，针对编辑窗口或输入字段的输入数据提取相应单词或词组(步骤220)；依据一语意结构、一语意句法、一语意类别与捕捉条件建立一语意规则(步骤230)；依据语意规则，针对所输入数据进行推论，并输出一字典推论结果(步骤240)；依据语意类别的分类，将字典推论结果，分别储存在各语意类别的相应数据库中(步骤250)；以及依据使用者输入数据的初始字词，从各语意类别的相应数据库中提取与初始字词相关的优先排列，以供使用者选取(步骤260)。

上述的捕捉条件以曾经出现或查询过的单词或词组设定为一次，以经常出现或查询过的单词或词组设定为多次；语意类别的分类还包括常用语句字典、兴趣喜好字典、商务交流字典、生词字典与使用者定义；而使用者定义数据库依据语意类别的自定义分类来建立。

现在以一较佳实施例来说明本发明的可行性，依据使用者输入数据习惯建立使用者常用字汇字典的技术手段体现在翻译软件中而言，对于使用者输入数据习惯的收集分为两方面，第一是对使用者在各应用模块中经常输入出现的重复信息，或者存储过的已知信息；另一方面，是判断为使用者不太熟悉，需要提醒的信息内容，一般来自于翻译软件中的输入单词内容，如使用翻译软件时，是来自于智能生词笔记中所记录的内容。从这两方面所能够提供的服务，可以做到对已知内容重复输入时的便捷，以及对于不熟悉内容的提醒。意图达到智能化引擎的人性化表现，图3A为本发明的第一实施例示意图，当使用者在输入字段里头输入[那天我要去Andy]时，输入内容中有重复出现过的词Andy，则出现下列跳现式窗口的联想内容：

Andy.Wang

Andy家的狗狗

Andy.Wang的生日聚会

Andy一起出游日

其排列的优先级以内容重复出现率为主，而每一词条的记录都来自不同的使用者输入习惯字典150，例如，[Andy.Wang]来自好友列表的数据库；[Andy家的狗狗]来自最常出现的相关组合；[Andy.Wang的生日聚会]以及[Andy一起出游日]都来自行事历数据库。

图3B为本发明的第二实施例示意图，当使用者在输入字段里头输入[Idon’t want any more tra]时，输入内容中有重复出现过的词tra，则出现下列跳现式窗口的联想内容：

trace

traffic

trademark是一艘船的样子...

其排列的优先级以内容重复出现率为主，而每一词条的记录都来自不同的使用者输入习惯字典150，例如，[trace]来自最常出现的单词组合；[traffic]曾经在翻译软件中查询过的单词；[trademark是一艘船的样子...]来自备忘录中储存的内容。

当然本发明还可有其它多种实施例，在不背离本发明精神及其实质的情况下，熟悉本领域的普通技术人员当可根据本发明做出各种相应的改变和变形，但这些相应的改变和变形都应属于本发明所附的权利要求的保护范围。

Claims

1.一种依据使用者输入数据习惯建立使用者常用字汇字典的系统，其特征在于，包括：

一使用者输入数据接口，提供使用者输入数据的一编辑窗口或一输入字段；

一输入数据习惯捕捉模块，依据多个捕捉条件，针对该编辑窗口或该输入字段的输入数据提取相应单词或词组；

一语意规则库，依据一语意结构、一语意句法、一语意类别与该捕捉条件建立一语意规则；

一推论机，依据该语意规则，针对所输入数据进行推论，并输出一字典推论结果；

一使用者输入习惯字典，依据该语意类别的分类，将该字典推论结果，分别储存在各该语意类别的相应数据库中；以及

一智能优先提取模块，依据使用者输入数据的初始字词，从该使用者输入习惯字典中提取与该初始字词相关的优先排列，以供使用者选取。

2.根据权利要求1所述的依据使用者输入数据习惯建立使用者常用字汇字典的系统，其特征在于，该捕捉条件以曾经出现或查询过的单词或词组设定为一次。

3.根据权利要求1所述的依据使用者输入数据习惯建立使用者常用字汇字典的系统，其特征在于，该捕捉条件以经常出现或查询过的单词或词组设定为多次。

4.根据权利要求1所述的依据使用者输入数据习惯建立使用者常用字汇字典的系统，其特征在于，该使用者输入习惯字典还包括常用语句字典数据库、兴趣喜好字典数据库、商务交流字典数据库、生词字典数据库与使用者定义数据库。

5.根据权利要求4所述的依据使用者输入数据习惯建立使用者常用字汇字典的系统，其特征在于，该使用者定义数据库依据该语意类别的自定义分类来建立。

6.一种依据使用者输入数据习惯建立使用者常用字汇字典的方法，其特征在于，包括下列步骤：

提供使用者输入数据的一编辑窗口或一输入字段；

依据多个捕捉条件，针对该编辑窗口或该输入字段的输入数据提取相应单词或词组；

依据一语意结构、一语意句法、一语意类别与该捕捉条件建立一语意规则；

依据该语意规则，针对所输入数据进行推论，并输出一字典推论结果；

依据该语意类别的分类，将该字典推论结果，分别储存在各该语意类别的相应数据库中；以及

依据使用者输入数据的初始字词，从各该语意类别的相应数据库中提取与该初始字词相关的优先排列，以供使用者选取。

7.根据权利要求6所述的依据使用者输入数据习惯建立使用者常用字汇字典的方法，其特征在于，该捕捉条件以曾经出现或查询过的单词或词组设定为一次。

8.根据权利要求6所述的依据使用者输入数据习惯建立使用者常用字汇字典的方法，其特征在于，该捕捉条件以经常出现或查询过的单词或词组设定为多次。

9.根据权利要求6所述的依据使用者输入数据习惯建立使用者常用字汇字典的方法，其特征在于，该语意类别的分类还包括常用语句字典、兴趣喜好字典、商务交流字典、生词字典与使用者定义。

10.根据权利要求9所述的依据使用者输入数据习惯建立使用者常用字汇字典的方法，其特征在于，该使用者定义依据该语意类别的自定义分类来建立。