CN101510124B - 语境相关敏感提示输入法 - Google Patents

语境相关敏感提示输入法 Download PDF

Info

Publication number
CN101510124B
CN101510124B CN2009100216325A CN200910021632A CN101510124B CN 101510124 B CN101510124 B CN 101510124B CN 2009100216325 A CN2009100216325 A CN 2009100216325A CN 200910021632 A CN200910021632 A CN 200910021632A CN 101510124 B CN101510124 B CN 101510124B
Authority
CN
China
Prior art keywords
chained list
content
input
data item
task items
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2009100216325A
Other languages
English (en)
Other versions
CN101510124A (zh
Inventor
闫相国
吴宁
潘克非
王子南
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xian Jiaotong University
Original Assignee
Xian Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xian Jiaotong University filed Critical Xian Jiaotong University
Priority to CN2009100216325A priority Critical patent/CN101510124B/zh
Publication of CN101510124A publication Critical patent/CN101510124A/zh
Application granted granted Critical
Publication of CN101510124B publication Critical patent/CN101510124B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

语境相关敏感提示输入法,包括以下步骤:1)在应用程序运行时,建立汉字首字母映射表;2)建立由初级链表和次级链表组成的两级结构链表;3)在进行相关任务项输入时,在输入控件侧出现一个浮动敏感提示窗口,窗口内容显示与该任务项相关的内容;4)输入相关内容或在浮动窗口中选择数据项;5)结束该任务项输入,维护数据链表;6)结束应用程序,保存初级链表和次级链表组成的两级结构链表。利用综合频度概率评价相关数据项的使用率,针对具体的输入语境,动态生成该语境下的敏感提示浮动窗口,通过对提示窗口直接选择或拼音首字母输入进行快速定位,实现在特定语境下、以语句为单位的快速输入。

Description

语境相关敏感提示输入法
技术领域
本发明属计算机输入法,更进一步涉及一种语境相关的敏感提示输入方法。
背景技术
在特定的应用程序中,往往涉及到多个任务项输入,如工作人员、工作内容等,而每个任务项包含完全不同的语境。目前很多具有智能功能的汉字输入法,通常都是按照文字的顺序连续输入符合特定规则的拼音及辅助编码,由输入法的智能算法进行智能匹配转换,然后输出转换后的汉字字符串。这些输入法关注的是一般应用,并未考虑不同语境下的差别,而且是字、词输入法,不能实现以语句为单位输入,无法满足针对具体应用下的特定语境快速输入的需要。
发明内容
针对现有技术中存在的缺陷,本发明的目的是提出一种语境相关敏感提示输入方法,针对具体的输入语境,动态生成该语境下的敏感提示浮动窗口,通过选择相关内容,实现在特定语境下、以语句为单位的快速输入。
为达到以上目的,本发明采用的技术方案是:一种语境相关敏感提示输入方法,包括以下步骤:
1.在应用程序运行时,建立汉字首字母映射表;
2.建立由初级链表和次级链表组成的两级结构链表,初级链表为任务项链表,次级链表为对应任务项的内容项链表;
3.在进行相关任务项输入时,在输入控件侧出现一个浮动敏感提示窗口,窗口内容显示与该任务项相关的内容;
4.输入相关内容或在浮动窗口中选择数据项;
5.结束该任务项输入,维护数据链表;
6.结束应用程序,保存初级链表和次级链表组成的两级结构链表。
步骤1和步骤2是初始化工作,在应用程序运行时进行一次。步骤3至步骤5是任务项输入时的过程,每次输入新的任务项都要重复执行。任务项输入以语句为单位。步骤6是系统终止操作,在应用程序结束时进行一次。
更进一步,汉字首字母映射表用于实现首字母输入时对敏感提示窗口内数据项的快速定位,根据汉字库编码建立如表1所示的汉字首字母映射表。表格按英文字母排序,一个英文字母对应一行,每行称为一个英文字母行,所有拼音首字母等于对应的英文字母行的汉字排列在一起,然后把这些汉字在汉字库编码表中的编码和包含的汉字数量写到该英文字母行。由于汉字中存在多音字,所以在汉字首字母映射表会出现同一汉字在不同行重复出现。
在步骤2中,两级结构链表如图1所示。初级链表为任务项链表,每个节点包含任务项索引和次级链表指针,任务项索引用于表示语境特征、综合频度概率计算使用的权重系数、次级链表维护类型,次级链表指针表示与该语境关联的数据;次级链表为任务项相关的内容项链表,每个节点包含特定语境的数据项和该数据项综合频度概率。初级链表只有一个,而次级链表数等于初级链表的节点数。
建立由初级链表和次级链表组成的两级结构链表分两种情况:1)当两级结构链表已存在时,直接读入;2)否则根据任务项表建立初级链表和次
表1首字母映射表
Figure GDA0000119604980000031
级链表,同时把次级链表所有节点的综合频度概率初始化为1。
次级链表中数据项的综合频度概率应用公式(1)计算:
Figure GDA0000119604980000032
公式右边第一项主要反映整体使用频度,第二项反映当前使用情况。其中,pi-1和pi分别代表计算前和计算后的综合使用频度概率;I是二值函数,当数据项是本次选择或添加的数据项时取值为1,否则为0;
Figure GDA0000119604980000033
是权重系数,取值范围为(0,1],用于调整输入操作对后续概率的影响程度,同时也决定了在该数据项所处链表内经过几次连续选择,被选择的数据项与其他数据项的综合频度概率相比为最大。表2是
Figure GDA0000119604980000034
取值与最大选择次数的关系。例如当
Figure GDA0000119604980000035
时,经过两次连续选择,可使被选择的数据项的综合频度概率在所处链表内达到最大。
表2
Figure GDA0000119604980000041
与最大选择次数关系表
Figure GDA0000119604980000042
更进一步,任务项链表是文本类型文件,每行代表一个任务项。行格式如表3所示,包含“输入控件ID”、
Figure GDA0000119604980000043
“操作类型”、  “数据源类型”和“数据源位置或内容”五个部分,每部分间以分号隔开。
表3任务项链表
Figure GDA0000119604980000044
“输入控件ID”为对应任务项的控件ID。
Figure GDA0000119604980000045
是公式(1)的
Figure GDA0000119604980000046
“操作类型”取值为1或2,1是固定,代表不修改对应次级链表数据项;2是动态调整,代表当输入内容在对应次级链表数据项中不存在时,把输入内容添加到次级链表中。“数据源类型”取值为1、2或3,1代表本地,2代表指定文件,3代表指定数据库。“数据源位置或内容”是对应次级链表中数据项的获取方式,当“数据源类型”值为1时,在“数据源位置或内容”处表示的是对应数据项,数据项按逗号分割;当“数据源类型”值为2时,在“数据源位置或内容”处是文件名,次级链表中数据项从该文件名对应的文件获得;当“数据源类型”值为3时,在“数据源位置或内容”处是数据库信息,次级链表中数据项从该数据库表格中的指定属性获得。对于“数据源类型”取值为2或3时,对应的内容在添加到次级链表数据项时,要进行语句分割,即根据逗号、句号、分号、问号、感叹号等语句分割符,把内容分割成多个数据项。
例如,在一个应用程序中包含3个输入任务的任务项表内容如下:
操作规则;0.2;1;1;顺序、随机
操作人员;0.1;1;2;c:\\操作人员.txt
操作内容;0.5;2;3;DataManager.mdb,device,content
第一行代表“输入控件ID”是“操作规则”,
Figure GDA0000119604980000051
值为0.2,对应次级链表数据项为“顺序”和“随机”,在以后使用过程中,不修改对应次级链表数据项;第二行代表“输入控件ID”是“操作人员”,
Figure GDA0000119604980000052
值为0.1,对应次级链表数据项由文件“c:\\操作人员.txt”获得,在以后使用过程中,不修改对应次级链表数据项;第三行代表“输入控件ID”是“操作内容”,值为0.5,对应次级链表数据项由数据库“DataManager.mdb”中“device”表的“content”属性获得,在以后使用过程中,动态修改对应次级链表数据项。
在步骤3中,在生成浮动敏感提示窗口前,根据要输入内容的编辑控件所处位置,在初级链表中查找对应的任务项索引,并由任务项索引定位关联的次级链表。对次级链表,根据每个节点上保存的综合频度概率进行降序排列,然后把次级链表的数据项顺序添加到浮动敏感提示窗口中,从而保证在浮动敏感提示窗口中数据项按综合频度概率降序排列,即最大的综合频度概率数据项排在首位。
在步骤4中,可以直接从浮动敏感提示窗口中通过鼠标选择相关内容,然后转步骤5。如果通过键盘输入,次级链表的数据项将根据字母序进行升序排列,键盘输入有两种输入模式可供选择,即非汉字输入模式和汉字输入模式。在非汉字输入模式下,可以直接进行汉字首字母输入,每输入一个字母,将根据汉字首字母映射表对浮动敏感提示窗口进行快速定位。在汉字输入模式下,根据输入的汉字对次级链表进行匹配搜索,实现对浮动敏感提示窗口的快速定位。
在步骤5中,以输入内容为基础,根据公式(1)对次级链表每个节点的综合频度概率进行重新计算。此外,如果任务操作类型是动态调整,且输入内容在次级链表中不存在,将把输入内容添加到次级链表,并把该节点的综合频度概率置为1。
此外,在步骤5中还要对次级链表进行动态维护。维护策略是:1)当次级链表的节点数大于预先设定的最大节点数,将删除综合频度概率最小的节点;2)当节点的综合频度概率低于预先设定值时,将删除该节点。
本发明的有益效果在于:在以本发明的语境相关敏感提示输入法为基础开发的应用系统中,可以根据各种具体需求,灵活建立满足用户要求的敏感提示输入环境,实现在特定语境下、以语句为单位的快速输入。
附图说明
图1是本发明的两级结构链表。
图2是本发明的两级结构链表的另一个实施例。
图3是对“操作内容”首次输入时的两级结构链表和浮动敏感提示窗口;其中,图3(a)是排列后的次级链表结构,图3(b)是浮动敏感提示窗口,在窗口中加亮第一个数据项。
图4是对“操作内容”再次输入时的两级结构链表和浮动敏感提示窗口;其中,图4(a)是排列后的次级链表结构,图4(b)是浮动敏感提示窗口,在窗口中加亮第一个数据项。
图5是对“操作内容”输入拼音首字母“h”时的两级结构链表和浮动敏感提示窗口;其中,图5(a)是排列后的次级链表结构,当输入“h”时,图5(b)是浮动敏感提示窗口,在窗口中加亮首字母是“h”的第一个数据项,即“合上a”。
具体实施方式
下面结合附图及实施实例对本发明作进一步的描述。
在一个信息管理系统中采用语境相关敏感提示输入法,实现步骤如下:
1)启动信息管理系统,根据汉字库编码建立如表1所示的汉字首字母映射表。
2)读入图2所示的两级结构链表。共有“操作类型”、“操作人员”、“操作内容”三个输入任务项,其中,“操作类型”输入任务项的
Figure GDA0000119604980000071
为0.2,链表操作类型是固定,语境相关内容为“初查”、“复查”;“操作人员”输入任务项的
Figure GDA0000119604980000072
为0.1,链表操作类型是固定,语境相关内容为“张三”、“李四”、“王五”;“操作内容”输入任务项的为0.5,链表操作类型是动态调整,语境相关内容为“断开a”、“断开b”、“检查a”、“合上c”、“合上a”;。
3)在对“操作内容”输入时,对应的次级链表按综合频度概率进行降序排列,图3(a)是排列后的次级链表结构,图3(b)是浮动敏感提示窗口,在窗口中加亮第一个数据项;
4)输入“确认d”内容后结束该任务项输入,重新计算该次级链表中所有节点的综合频度概率。由于“操作内容”输入任务项链表操作类型是动态调整,而“确认d”在该次级链表中不存在,所以把“确认d”添加到该次级链表,并把综合频度概率置为1。
5)在对“操作内容”再次输入时,对应的次级链表按综合频度概率进行降序排列,图4(a)是排列后的次级链表结构,图4(b)是浮动敏感提示窗口,在窗口中加亮第一个数据项;
6)在非汉字输入模式下,该次级链表的数据项将根据字母序进行升序排列,图5(a)是排列后的次级链表结构,当输入“h”时,图5(b)是浮动敏感提示窗口,在窗口中加亮首字母是“h”的第一个数据项,即“合上a”。
7)选择“合上a”内容后结束该任务项输入,重新计算该次级链表中所有节点的综合频度概率。由于“合上a”在该次级链表中已存在,所以不修改该次级链表。
8)结束应用程序,保存初级链表和次级链表组成的两级结构链表。
本发明提出的语境相关敏感提示输入法,可以根据各种具体需求,采用两级链表灵活建立满足用户要求的敏感提示输入环境,利用综合频度概率评价相关数据项的使用率,针对具体的输入语境,动态生成该语境下的敏感提示浮动窗口,通过对提示窗口直接选择或拼音首字母输入的快速定位,实现在特定语境下、以语句为单位的快速输入。本发明提出的方法可应用于所有需要提高用户输入速度的应用系统开发。

Claims (4)

1.语境相关敏感提示输入法,其特征在于,包括以下步骤:1)在应用程序运行时,建立汉字首字母映射表;2)建立由初级链表和次级链表组成的两级结构链表,初级链表为任务项链表,次级链表为对应任务项的内容项链表;建立由初级链表和次级链表组成的两级结构链表分两种情况:1)当两级结构链表已存在时,直接读入;2)否则根据任务项表建立初级链表和次级链表,同时把次级链表所有节点的综合频度概率初始化为1;其中,任务项链表每个节点包含任务项索引和内容项链表指针,内容项链表每个节点包含特定语境的数据项和该数据项综合频度概率,任务项链表只有一个,而内容项链表数等于初级链表的节点数;所说的任务项链表是文本类型文件,每行代表一个任务项,包含“输入控件ID”、“α”、“操作类型”、“数据源类型”和“数据源位置或内容”五个部分,每部分间以分号隔开;“输入控件ID”为对应任务项的控件ID;“α”是公式(1)的α;“操作类型”取值为1或2,1是固定,代表不修改对应次级链表数据项;2是动态调整,代表当输入内容在对应次级链表数据项中不存在时,把输入内容添加到次级链表中;“数据源类型”取值为1、2或3,1代表本地,2代表指定文件,3代表指定数据库;“数据源位置或内容”是对应次级链表中数据项的获取方式,当“数据源类型”值为1时,在“数据源位置或内容”处表示的是对应数据项,数据项按逗号分割;当“数据源类型”值为2时,在“数据源位置或内容”处是文件名,次级链表中数据项从该文件名对应的文件获得;当“数据源类型”值为3时,在“数据源位置或内容”处是数据库信息,次级链表中数据项从该数据库表格中的指定属性获得,对于“数据源类型”取值为2或3时,对应的内容在添加到次级链表数据项时,要进行语句分割,即根据逗号、句号、分号、间号、感叹号,把内容分割成多个数据项;其中,所说的次级链表中数据项的综合频度概率应用公式(1)计算:
Pi=(1-α)Pi-1+αI    (1)
公式右边第一项主要反映整体使用频度,第二项反映当前使用情况,其中,pi-1和pi分别代表计算前和计算后的综合使用频度概率;I是二值函数,当数据项是本次选择或添加的数据项时取值为1,否则为0;α是权重系数,取值范围为(0,1],用于调整输入操作对后续概率的影响程度,同时也决定了在该数据项所处链表内经过几次连续选择,被选择的数据项与其他数据项的综合频度概率相比为最大;3)在进行相关任务项输入时,在输入控件侧出现一个浮动敏感提示窗口,窗口内容显示与该任务项相关的内容:在生成浮动敏感提示窗口前,根据要输入内容的编辑控件所处位置,在初级链表中查找对应的任务项索引,并由任务项索引定位关联的次级链表,对次级链表,根据每个节点上保存的综合频度概率进行降序排列,然后把次级链表的数据项顺序添加到浮动敏感提示窗口中;4)输入相关内容或在浮动窗口中选择数据项;5)结束该任务项输入,维护数据链表:以输入内容为基础,根据公式(1)对次级链表每个节点的综合频度概率进行重新计算;此外,如果任务操作类型是动态调整,且输入内容在次级链表中不存在,将把输入内容添加到次级链表,并把该节点的综合频度概率置为1;6)结束应用程序,保存初级链表和次级链表组成的两级结构链表。
2.根据权利要求1所述的语境相关敏感提示输入法,其特征在于,所说的汉字首字母映射表按英文字母排序,一个英文字母对应一行,每行称为一个英文字母行,每个英文字母行包含所有汉字的拼音首字母中符合该英文字母的汉字在汉字库编码表中的编码、以及符合该条件的所有汉字的个数。
3.根据权利要求1所述的语境相关敏感提示输入法,其特征在于,在非汉字输入模式下,可以直接进行汉字首字母输入,每输入一个字母,将根据汉字首字母映射表对浮动敏感提示窗口进行快速定位;在汉字输入模式下,根据输入的汉字对次级链表进行匹配搜索,实现对浮动敏感提示窗口的快速定位。
4.根据权利要求1所述的语境相关敏感提示输入法,其特征在于,对内容项链表维护的策略是:1)当内容项链表的节点数大于预先设定的最大节点数,将删除综合频度概率最小的节点;2)当节点的综合频度概率低于预先设定值时,将删除该节点。
CN2009100216325A 2009-03-20 2009-03-20 语境相关敏感提示输入法 Expired - Fee Related CN101510124B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2009100216325A CN101510124B (zh) 2009-03-20 2009-03-20 语境相关敏感提示输入法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2009100216325A CN101510124B (zh) 2009-03-20 2009-03-20 语境相关敏感提示输入法

Publications (2)

Publication Number Publication Date
CN101510124A CN101510124A (zh) 2009-08-19
CN101510124B true CN101510124B (zh) 2012-05-23

Family

ID=41002536

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009100216325A Expired - Fee Related CN101510124B (zh) 2009-03-20 2009-03-20 语境相关敏感提示输入法

Country Status (1)

Country Link
CN (1) CN101510124B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB201108200D0 (en) 2011-05-16 2011-06-29 Touchtype Ltd User input prediction
CN101963842A (zh) * 2010-05-31 2011-02-02 宇龙计算机通信科技(深圳)有限公司 一种移动终端的文本输入方法、装置
CN102508922A (zh) * 2011-11-22 2012-06-20 四川长虹电器股份有限公司 基于嵌入式中间件的汉字输入法的下载方法
CN102591573B (zh) * 2011-12-22 2014-03-12 Tcl集团股份有限公司 一种应用提示的方法、装置
CN102999481B (zh) * 2012-12-07 2015-06-17 金川集团股份有限公司 中文项目集合的关键词可问答式自动完成的软件实现方法

Also Published As

Publication number Publication date
CN101510124A (zh) 2009-08-19

Similar Documents

Publication Publication Date Title
US10614266B2 (en) Recognition and population of form fields in an electronic document
US11874877B2 (en) Using natural language processing for visual analysis of a data set
US9671950B2 (en) Sample data computation for rendering of graph elements
US10740398B2 (en) Structuring incoherent nodes by superimposing on a base knowledge graph
CN101661462B (zh) 四层结构的中文文本正则化体系及实现
CN109902100A (zh) 报表查询方法、装置及存储介质
CN100483417C (zh) 获取限制词信息的方法、优化输出的方法和输入法系统
CN111709235A (zh) 一种基于自然语言处理的文本数据统计分析系统及方法
CN102439542A (zh) 电子设备的文本输入系统及文本输入方法
CN101510124B (zh) 语境相关敏感提示输入法
CN103703459A (zh) 基于字符变换和无监督网络数据的文本消息规格化方法和系统
US20110029852A1 (en) Metadata creation
JP2008159044A (ja) 適応的スペル・チェックのためのシステム及び方法
CN105027040A (zh) 文本输入系统及方法
WO2018005263A1 (en) Constructing new formulas through auto replacing functions
CN105653255A (zh) 一种在office框架中设置报告模板以自动生成报告文件的方法
CN113220835A (zh) 文本信息处理方法、装置、电子设备以及存储介质
US20210224323A1 (en) Learning system, learning method, and program
CN113836877A (zh) 一种文本标注方法、装置、设备以及存储介质
CN103106211A (zh) 客户咨询文本的情感识别方法及装置
JP5780036B2 (ja) 抽出プログラム、抽出方法及び抽出装置
CN108701153B (zh) 响应自然语言查询的方法、系统和计算机可读存储介质
CN113469461A (zh) 生成信息的方法和装置
TWI659321B (zh) 產業關聯性分析系統與方法
CN110717014A (zh) 一种本体知识库动态构建方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120523

Termination date: 20150320

EXPY Termination of patent right or utility model