CN103760991B - 一种实体输入方法和装置 - Google Patents

一种实体输入方法和装置 Download PDF

Info

Publication number
CN103760991B
CN103760991B CN201410014676.6A CN201410014676A CN103760991B CN 103760991 B CN103760991 B CN 103760991B CN 201410014676 A CN201410014676 A CN 201410014676A CN 103760991 B CN103760991 B CN 103760991B
Authority
CN
China
Prior art keywords
entity
candidate item
list entries
entity object
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410014676.6A
Other languages
English (en)
Other versions
CN103760991A (zh
Inventor
张友书
张坤
余浩
张阔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sogou Technology Development Co Ltd
Original Assignee
Beijing Sogou Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sogou Technology Development Co Ltd filed Critical Beijing Sogou Technology Development Co Ltd
Priority to CN201410014676.6A priority Critical patent/CN103760991B/zh
Publication of CN103760991A publication Critical patent/CN103760991A/zh
Application granted granted Critical
Publication of CN103760991B publication Critical patent/CN103760991B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供了一种实体输入方法,涉及输入法技术领域。所述方法包括:接收输入的输入序列;基于知识库对所述输入序列进行匹配,获取所述输入序列对应的实体对象;将所述实体对象对应的知识内容封装为实体候选项,加载至所述输入序列对应的各候选项中;根据所述实体候选项对应的权重在各候选项中展现所述实体候选项。本发明利用知识库识别用户的输入序列,以获取实体对象,再根据实体对象将对应的知识内容封装为实体候选项以提供给用户选择,通过该种方式,充分利用了知识库中记录的实体对象对应的实体信息,比如图片、属性等信息,使其可以直接展现给用户,提高了输入法的信息容量,加快输入效率。

Description

一种实体输入方法和装置
技术领域
本申请涉及输入法技术领域,特别是涉及一种实体输入方法和装置。
背景技术
用户在使用输入法进行字符输入时,由于很多语言本身的特征,输入的字符序列与上屏字词的对应关系往往不是唯一的(比如汉语,拼音或字形与字的对应关系并不唯一),因此用户输入字符序列后,字符序列往往对应很多候选项,而候选项只包括文字内容和少量的图标表情。
由于用户在输入时,在某些情景下,需要输入的不仅是汉字,还会需要输入更多的信息。现有输入法的候选项中,往往每个候选项只包含输入序列对应匹配的候选字符,没有提供更丰富的信息供用户选择,用户需要通过其他方式提供丰富的对话信息给对话方,使信息内容的传输效率过低。比如:在用户B和用户A进行即时通信时,A如问:华山在哪儿?B则需要打开浏览器,搜索华山的相关信息,并找到华山的地理位置,复制对应的内容再转发给A,如果A还有进一步的问题,如华山的景点、历史、路线等,则还需要对话方B再次打开浏览器搜索华山的对应信息,并复制对应信息内容发送给A,从而使信息内容的传输效率过低,甚至会给对话方B造成负面情绪。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种实体输入装置和相应的一种实体输入方法。
为了解决上述问题,本申请公开了一种实体输入方法,包括:
接收输入的输入序列;
基于知识库对所述输入序列进行匹配,获取所述输入序列对应的实体对象;
将所述实体对象对应的知识内容封装为实体候选项,加载至所述输入序列对应的各候选项中;
根据所述实体候选项对应的权重在各候选项中展现所述实体候选项。
另外,本发明还公开了一种实体输入装置,包括:
序列接收模块,用于接收输入的输入序列;
识别模块,用于基于知识库对所述输入序列进行匹配,获取所述输入序列对应的实体对象;
实体候选项封装模块,用于将所述实体对象对应的知识内容封装为实体候选项,加载至所述输入序列对应的各候选项中;
候选展示模块,用于根据所述实体候选项对应的权重在各候选项中展现所述实体候选项。
与现有技术相比,本申请包括以下优点:
本发明利用知识库识别用户的输入序列,以获取实体对象,再根据实体对象将对应的知识内容封装为实体候选项以提供给用户选择,,通过该种方式,充分利用了知识库中记录的实体对象对应的实体信息,比如图片、属性等信息,使其可以直接展现给用户,提高了输入法的信息容量,加快输入效率。
本发明识别用户当前的应用环境,针对用户的输入序列匹配的实体对象,选择该实体对象下的匹配所述输入环境对应的实体候选项进行展现,不但使输入法信息容量提高,还更符合用户的输入习惯和输入环境,进一步提高了输入效率。
附图说明
图1是本发明的一种实体输入方法的流程示意图;
图1a是本发明的基于知识库提取的信息示例;
图2是本发明优选的一种实体输入方法的流程示意图;
图3是本发明另一优选的一种实体输入方法的流程示意图;
图4是本发明另一优选的一种实体输入方法的流程示意图;
图5是本发明另一优选的一种实体输入方法的流程示意图;
图6是本发明另一优选的一种实体输入方法的流程示意图;
图7是本发明另一优选的一种实体输入方法的流程示意图;
图8是本发明另一优选的一种实体输入方法的流程示意图;
图9a至图9d是本发明一种实体输入方法示例1的示例图;
图10a至图10c是本发明一种实体输入方法示例2的示例图;
图11是本发明一种实体输入装置的结构示意图;
图12是本发明另一优选的一种实体输入装置的结构示意图。
具体实施方式
为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本申请作进一步详细的说明。
在介绍本发明之前,先对重要术语进行简述:
知识库:是知识工程中结构化,易操作,易利用,全面有组织的知识集群,是针对某一(或某些)领域问题求解的需要,采用某种(或若干)知识表示方式在计算机存储器中结构化存储、组织、管理和使用的互相联系的知识片集合。这些知识片包括全网中与领域相关的理论知识、事实数据,由专家经验得到的启发式知识,如某领域内有关的定义、定理和运算法则以及常识性知识等。
在本发明中,知识库具有实体对象和实体对象对应的属性信息。比如实体对象:对应的一个具体的个体,在明星类别中,比如刘德华,张柏芝,林青霞等,也包含一些宽泛的代表类别的个体,比如人,电影明星,歌手等。属性:就是实体对象所包含的特性,除了包含属性名称外,每个属性还有一个反应属性值类型的类型变量,比如[身高:长度],[年龄:整数],[出生日期:日期],[配偶:人名]等。
本发明的核心思想之一是:本发明在输入法系统中,改变现有技术中只能根据用户的输入序列提供字词、简单表情(比如,按键“a”对应自定义的表情(⊙o⊙)!)等信息量简单的输入,结合知识库识别用户输入的字符序列,得到相应的实体对象封装为实体候选项提供给用户,如此输入法可具备输入更多元化信息的能力,提高用户的输入效率。
参照图1,示出了本申请一种实体输入方法的流程示意图,具体可以包括:
步骤102,接收输入的输入序列;
当用户启动输入法,然后在键盘上进行输入后,输入法系统则首先接收用户的输入序列,比如输入的字符序列“huashan”。
步骤104,基于知识库对所述输入序列进行匹配,获取所述输入序列对应的实体对象;
在获取到输入的字符序列“huashan”后,则基于知识库对所述输入序列进行匹配,获取所述输入序列对应的实体对象,比如实体对象“华山”。
在本发明实施例中,可基于知识库预先构建实体列表,即还可包括:
步骤100,基于知识库构建实体列表,所述实体列表包括所述知识库中各实体对象、每个实体对象分别对应的各实体名称和所述实体名称对应输入串。
因为知识库中包括了一个实体的多个数据结构,比如实体对象、实体的名称(实体原名、实体第二名称(比如实体别名、简称、英文名等名称))、实体对象的属性等等信息。在本实施例中的知识库中,实体原名是主键,其对应实体对象,然后在知识库中查找到该实体对象后,则可读取该实体结构下的其他信息。在本发明中,可针对每个实体构建实体对象,如图1a,其示出了本发明基于知识库得到的信息,包括实体列表以及与实体列表对应的实体对象。
因此,本发明为了识别输入序列,则可将输入序列与实体的各种名称对应,然后在对应上实体对象,获得实体列表。
所述基于知识库构建实体列表,包括:
子步骤A110,从知识库中分别提取各实体对象的原名E_NAME,并根据所述原名找到对应的实体对象E,分别得到所述原名与所述实体对象的对应关系E_NAME—>E;
即从知识库中提取出所有的实体对象的原名E_NAME,并根据名称找到与对应的实体对象E,分别得到所述原名与所述实体对象的对应关系E_NAME—>E。比如,实体对象的原名“北京大学”—>实体对象“北京大学”等。
子步骤A120,从知识库中分别提取所述实体对象的第二名称E_ALIAS,分别得到所述第二名称与所述实体对象E的对应关系E_ALIAS—>E;
针对各实体对象,从知识库中提取出该实体对象的所有第二名称,比如实体别名、简称、英文名等E_ALIAS,与实体对象E对应,分别得到所述第二名称与所述实体对象E的对应关系E_ALIAS—>E。比如{北大,Pku,Peking University}—>北京大学。
子步骤A130,分别合并所述原名与实体对象的对应关系E_NAME—>E和所述第二名称与实体对象E的对应关系E_ALIAS—>E,得到实体名称和实体对象E的对应关系{E_NAME,E_ALIAS}—>E;
合并步骤A110和A120的结果,得到实体名称与实体对象的映射{E_NAME,E_ALIAS}—>E。比如{北京大学,北大,Pku,Peking University}—>北京大学。
子步骤A140,获取与实体对象E的每个实体名称分别对应的输入串,构建包括所述知识库中各实体对象、每个实体对象分别对应的实体名称和所述实体名称对应输入串的实体列表。
基于{E_NAME,E_ALIAS}中的各个实体名称,配置对应的输入串,即可构建输入串、实体名称、实体对应关系的实体列表。
优选的,所述获取与实体对象E的每个实体名称分别对应的输入串,构建包括所述知识库中各实体对象、每个实体对象分别对应的实体名称和所述实体名称对应输入串的实体列表,包括:
子步骤A141,针对所述实体对象的非英文名称,加载所述非英文名称每个字的完整的输入串,并将所述输入串与实体对象E映射;
加载每个字的拼音串,生成实体名称对应的全拼输入序列,并与实体对象映射。{INPUT_SEQ}—>E。比如北:bei,京:jing,大:da,学:xue,生成beijingdaxue—>北京大学。
子步骤A142,提取每个字完整的输入串的首字母,生成输入串并与实体对象E映射;
提实体名称取每个字首字母,生成输入串映射到实体,{bjdx}—>北京大学。
子步骤A143,对所述实体对象的非英文名称分词后,轮流提取每个词的完整输入串的首字母,生成输入串并与实体对象E映射;
对实体名称分词后,轮流提取每个词的首字母,生成输入串映射到实体,如{bjdaxue,beijingdx}->北京大学。
子步骤A144,针对所述实体对象的英文名称,将输入串经过大小写转换后与实体对象E映射。
如果实体名称是英文,经过大小写转换后映射到实体。{pku,pekingunivercity}—>北京大学。
经过上述步骤可得到如表一示例的实体列表:
输入串 实体名称 实体对象
bjdaxue 北京大学 北京大学
beijingdx 北京大学 北京大学
Bjdx 北京大学 北京大学
Beida 北大 北京大学
Pku PKU 北京大学
peking university Peking University 北京大学
表一
本实施例中,为形象表现出输入串、实体名称和实体对象三者的逻辑关系,表一为对数据库中多个表格进行抽象形成。在其他实施例中,实体列表也可为具有多个关联关系的结构化表格,如“实体名称”表、“实体对象”表、“输入串”表和关系映射表,分别对实体对象的名称、实体对象、用户输入的输入串和三者的对应关系进行结构化存储,更符合数据库中范式的规范,保证了输入序列的查询效率。
优选的,在本发明实施例中,所述基于知识库对所述输入序列进行匹配,获取所述输入序列对应的实体对象包括:
子步骤A12,将所述输入序列与基于知识库的实体列表中的输入串进行匹配;如果匹配,则根据实体列表获取所述输入序列对应的实体对象;所述实体列表包括所述知识库中各实体对象、每个实体对象分别对应的实体名称和所述实体名称对应输入串。
基于上述实体列表,则可将用户的输入序列与实体列表中的输入串进行匹配,匹配上了,则可根据实体列表的对应关系获取述输入序列对应的实体对象。
优选的,在基于知识库对所述输入序列进行匹配,获取所述输入序列对应的实体对象时还包括:
步骤105,计算所述输入序列与所述知识库中各实体对象的匹配度,选取对应匹配的实体对象;
在本发明中,在基于知识库识别所述输入序列时,会计算输入序列与知识库中各实体对象的匹配度。匹配度用于计算实体候选项所在的候选项位置。如输入序列与输入串完全匹配,则匹配度为100。比如,用户输入序列为beijingdaxue,则与实体列表匹配查找到对应的实体对象为“北京大学”。因为是完全匹配,则匹配度为100。输入序列为beida,也能对应到实体对象“北京大学”,则匹配度也为100。如果实体列表中没有完全匹配的输入串,则分别计算输入序列与各输入串的编辑距离,通过编辑距离计算用户输入序列与实体列表中所有输入串的相似程度。
步骤106,将所述实体对象对应的知识内容封装为实体候选项,加载至所述输入序列对应的各候选项中;
在前述步骤得到了实体对象后,即可从知识库中获取实体对象对应的知识内容,将上述知识内容封装为实体候选项。
当然本步骤中对前述提及的子实体对象,也将其对应的知识内容封装为实体候选项,加载至所述输入序列对应的各候选项中。
优选的,所述将所述实体对象对应的知识内容封装为实体候选项包括:
A14,以图片为载体,按行业类别将对应的所述子实体对象加入所述图片中,封装为所述实体候选项。
在本发明实施例中,封装的载体可为图片,也可在图片的基础上添加其他信息(比如内容链接等)作为封装载体。即在本实施例中,实体候选项可为图片形式,也可在图片中添加相关的链接,比如实体对象“北京大学”,可以取北京大学的正门图片,然后在该图片中添加介绍、周边美食、交通等信息的链接进行封装,再将封装好的实体候选项作为图片链接加载至输入序列对象的各候选项中。
在输入法系统的执行过程中首先对输入序列进行识别转换,获取输入序列对应的各候选项,然后再对各候选项进行排序,并对排序后的各候选项按权重逐步进行展示。本步骤则可对候选项以实体对象的形式进行扩充,提供现有输入法无法提供的丰富内容。
步骤108,根据所述实体候选项对应的权重在各候选项中展现所述实体候选项。
在本步骤中,可将前述步骤得到的实体候选项根据其权重在候选项中进展示。
优选的,所述根据所述实体候选项对应的权重在各候选项中展现所述实体候选项包括:
子步骤A21,根据所述匹配度计算每个实体对象对应封装的实体候选项在所述输入序列对应的各候选项中的目标位置,进而在所述目标位置展现所述实体候选项。
输入法程序中,对各候选项输出至候选框展示之前会进行排序,其一般为依据匹配度进行排序,根据排序后形成的位置在候选框中进行展示。那么本发明实施例中,首先根据匹配度计算根据每个实体对象对应封装的实体候选项在所述输入序列对应的各候选项中的目标位置,然后在候选框中的目标位置展现所述实体候选项。
本实施例中,各候选项的匹配度为100-编辑距离,且为了给字符候选项让位,实体候选项的位置最佳为第二位,则排序时,各候选项排序时位置为:2(起始位置)+100-匹配度,即2加上编辑距离的值。
因此,当输入序列与特定候选项完全匹配时,编辑距离为0,则匹配度为100,候选项的位置为第2位,展示后可方便地被用户选择上屏;输入序列与特定候选项对应的匹配度稍差时,编辑距离为10,则匹配度为90,候选项的位置为第12位,需要被用户触发翻页后展示、选择上屏;以此类推,输入序列与特定候选项完全不匹配,编辑距离为100,匹配度=0,候选项的位置为102位,几乎不会被用户展示和选择。当然也可采用其他计算方法,本申请不对此加以限制。
在本发明实施例中,输入法当前的候选框只能展示有限数量的候选项,如当前候选框限定数量为五个,当计算的候选项位置超过五个时,则按权重,即匹配度顺序存入后台候选项列表中。当用户点击变化候选框中的候选项时,则可根据指令加载到候选框中。
优选的,本发明实施例还包括:
步骤110,当所述实体候选项被触发时,所述实体候选项上屏,供用户进行触发。
当用户选择候选框中的实体候选项并确定输入时,则将所述实体候选项上屏输出。对于本发明实施例的实体候选项,其中添加了链接,因此可在上屏后供用户进行触发,并查看触发后对应实体对象的知识内容。
优选的,当所述实体候选项被触发时,所述实体候选项上屏,供用户进行触发包括:
子步骤A31,将所述实体候选项转换为输入法所在环境可识别的格式,进行输出上屏动作。
在本发明实施例中,为了将实体候选项上屏后,用户可以直接点击使用,即直接点击图片中的链接,则需要将封装的实体候选项根据输入法所在环境进行相应的格式转换。比如用户在word,则需要将封装的实体候选项转换为word格式可识别的文件格式,超级链接、package文件包等。
当用户选择实体信息后,输入法则将实体候选项输出进行上屏动作。
本发明利用知识库,识别用户的输入序列,以将对应输入序列的实体信息加载到候选项中提供给用户选择,当用户选择所述实体候选项,则将实体候选项上屏,通过该种方式,充分利用了知识库中记录的实体对象中的知识内容,比如图片、属性等信息,使其可以直接展现给用户,提高了输入法的信息容量,加快输入效率。本发明中的实体对象可以以图片为封装载体,将相关网页的链接封装到该载体中作为候选项,其比单纯的汉字等文字和简单的表情形式的候选项内容丰富,可传达的信息多样复杂。
实施例二
参照图2示出了本申请一种实体输入方法的流程示意图,具体可以包括:
步骤202,在移动设备中接收输入的输入序列;
在本实施例中,也如前述实施例,预先构建实体列表。
步骤204,将所述输入序列与基于知识库的实体列表中的输入串进行匹配,并计算所述输入序列与所述知识库中各实体对象的匹配度;如果对所述输入序列进行匹配时完全匹配,则进入步骤206;如果对所述输入序列进行匹配时不完全匹配,则进入步骤208;
步骤206,根据实体列表获取所述输入序列对应的实体对象;进入步骤212;
如果用户的输入序列与实体列表完全匹配,则直接根据实体列表获取所述输入序列对应的实体对象。另外,在本发明实施例中,在与实体列表匹配时计算匹配度,用于后续步骤计算展示位置。比如用户输入beijingdaxue,在表一种为完全匹配,则编辑距离为0,匹配度为100,候选项位置为2,各候选项中首位直接显示“北京大学”,第二项直接显示“北京大学”的实体对象。
在本发明实施例中,可通过输入序列与实体列表中的输入串之间的编辑距离进行选择和匹配。
优选的,当不完全匹配时,计算所述输入序列与实体对象的匹配度包括:
步骤B10,计算输入序列与实体列表中的输入串之间的编辑距离,
如用户输入beijindaxue,和北京大学对应的输入串beijingdaxue相差一个字符g,那么编辑距离即为1。
步骤B12,针对编辑距离最小的输入串,计算获得第一匹配度。
本实施例中,各候选项的匹配度为100-编辑距离,各候选项排序时位置为:N(起始位置)+100-匹配度,即N加上编辑距离的值,则在本实施例中N=2,可使后续计算候选位置时对输入法提供给用户的所有输入信息整体改变最小,具有更好的友好度。如前述例子beijindaxue对应的匹配度为99,候选项的位置为3。
步骤208,获取所述输入序列与实体列表中各输入串的第一匹配度;如第一匹配度符合第一阈值,则进入步骤206;如果第一匹配度不符合第一阈值,则进入步骤210;
如果实体列表中没有完全匹配的输入串,则通过编辑距离计算用户输入串与实体列表中所有输入串的匹配度,如果符合第一阈值条件,即说明二个输入串很相似。
在本发明实施例中,可对第一匹配度设置第一阈值,比如为96,大于等于96的可提取所述输入序列对应的实体对象,小于96的则不能。如前述输入序列“beijindaxue”,和实体对象“北京大学”对应的输入串“beijingdaxue”相差一个字符g,且第一匹配度为99大于96,则将输入序列的“beijindaxue”对应到实体对象“北京大学”。
当然,如前步骤B10和B12所述,通过编辑距离计算第一匹配度,由于+N均相同,那么阈值条件可针对编辑距离,即为组成第一匹配度的编辑距离设置阈值,而针对编辑距离进行筛选,比如编辑距离小于等于2的可提取实体信息,大于2的则不能。如前述输入序列“beijindaxue”,和实体对象“北京大学”对应的输入串beijingdaxue相差一个字符g,则编辑距离为1小于阈值2,则将用户输入的输入序列“beijindaxue”对应到实体对象“北京大学”。
步骤210,取输入法已有的候选项,分别计算各候选项文本与实体列表中的各实体名称对应的第二匹配度,如果所述第二匹配度符合第二阈值,则进入步骤206;
如果通过编辑距离仍然找不到对应的实体对象,则读取输入法已有候选项,计算各候选项与实体列表中各实体名称的第二匹配度,当对于一实体对象,存在符合第二阈值条件的第二匹配度,该实体对象则可选择。
另外,本申请可先将候选项与实体列表中的实体名称进行完全匹配,如果完全匹配上,则以字串在候选项中的位置为第二匹配度可。并且可针对第二匹配度设置第二阈值条件,对第二匹配度进行判断,符合则提取实体对象。如果已有候选项中的汉字串能对应到实体列表中的实体名称,则识别为对应的实体对象,比如用户输入bjingda,候选项第二个为汉字串“北京大学”,则识别用户输入的实体对象为“北京大学”。实体对象“北京大学”则第二匹配度为100。本实施例中设置第二阈值条件为95,则可提取实体对象“北京大学”,且在候选项中的位置为2。
步骤212,将所述实体对象对应的知识内容封装为实体候选项,加载至移动设备中所述输入序列对应的各候选项中;
步骤214,移动设备根据所述匹配度计算所述实体信息的在候选项中的候选项位置,进而在所述候选项位置展现所述实体候选项;
优选的,还可包括步骤216,当所述实体候选项被触发时,所述实体候选项上屏,供用户进行触发。
本发明实施例用于移动设备,供移动设备进行输入,与实施例一类似步骤原理类似,在此不再赘叙。
本发明利用知识库,识别用户的输入序列,获取对应输入序列的实体对象,然后将实体对象对应的知识内容封装为实体候选项,在将实体候选项加载到候选项中提供给用户选择。当用户选择所述实体候选项,则将实体候选项上屏,通过该种方式,充分利用了知识库中记录的实体对象中的知识内容,比如图片、属性等信息,使其可以直接展现给用户,提高了输入法的信息容量,加快输入效率。本发明中的实体对象可以以图片为封装载体,将相关网页的链接封装到该载体中作为候选项,其比单纯的汉字等文字和简单的表情形式的候选项内容丰富,可传达的信息多样复杂。
另外,本发明在利用实体列表进行匹配时,可采用前述多种匹配方式,即先判断是输入序列与输入串否完全匹配,如果不能则进行输入序列与输入串的不完全匹配,如果第一匹配度高于或等于第一阈值,则提取对应实体对象,再获取对应的知识内容封装为实体候选项进行展示,如果匹配度低于第一阈值,则获取输入法系统按正常流程对输入序列进行转换得到的候选项,在将候选项与实体列表进行匹配,如果第二匹配度高于或等于第二阈值,则提取对应的实体对象,再获取对应的知识内容封装为实体候选项进行展示。如此采用多种匹配方式,层层递进,可扩展输入串容错度,提高匹配的准确率,提高输入效率。
实施例三
参照图3,示出了本申请一种实体输入方法的流程示意图,具体可以包括:
步骤302,接收输入的输入序列;
在本实施例中,也如其他实施例,预先构建实体列表。
步骤304,将所述输入序列与基于知识库的实体列表中的输入串进行匹配,并计算所述输入序列与所述知识库中各实体对象的匹配度;如果对所述输入序列进行匹配时完全匹配,则进入步骤306;如果对所述输入序列进行匹配时不完全匹配,则进入步骤308;
步骤306,直接根据实体列表获取所述输入序列对应的实体对象;进入步骤314;
步骤308,获取输入序列与实体列表中各输入串的第一匹配度;
第一匹配度与实施例二的计算方法类似,在此不再详述。
步骤310,读取输入法已有的候选项,计算各候选项的字串与实体列表中的各实体名称的第二匹配度;
第二匹配度与实施例二的计算方法类似,在此不再详述。
步骤312,按所述第一匹配度和所述第二匹配度进行权重排序,获取对应的匹配度排序为既定位数的实体对象,进入步骤314;
比如直接将第一匹配度和第二匹配度进行排序(两者权重均为1),选择匹配度更大的对实体对象。
也可对第一匹配度和第二匹配度以某一权重进行标准化处理后,再进行匹配,比如实施例二中对第一匹配度和第二匹配度分别设定一个权重,比如第一匹配度设定为0.4,第二匹配度设定为0.6,那么第一匹配度*0.4,第二匹配度*0.6后,两者再进行大小排序,然后选择排序为既定位数的匹配度对应的实体对象。本实施例中,可选既定位数为2,即选择两个实体对象参与各候选项的排序。
本发明实施例权重排序方式可以有多种,在此不对其加以限定。
步骤314,将所述实体对象对应的知识内容封装为实体候选项,加载至所述输入序列对应的各候选项中;
步骤316,根据所述匹配度计算所述实体信息的在候选项中的候选项位置,进而在所述候选项位置展现所述实体候选项;
优选的,还可包括步骤318,当所述实体候选项被触发时,所述实体候选项上屏,供用户进行触发。
本发明实施例与实施例一类似步骤原理类似,在此不再赘叙。
本发明利用知识库,识别用户的输入序列,以将对应输入序列的实体信息加载到候选项中提供给用户选择,当用户选择所述实体候选项,则将实体候选项上屏,通过该种方式,充分利用了知识库中记录的实体对象中的知识内容,比如图片、属性等信息,使其可以直接展现给用户,提高了输入法的信息容量,加快输入效率。本发明中的实体对象可以以图片为封装载体,将相关网页的链接封装到该载体中作为候选项,其比单纯的汉字等文字和简单的表情形式的候选项内容丰富,可传达的信息多样复杂。
另外,本实施例对于不完全匹配的输入序列,其采用的两种匹配实体对象的方式进行最优权衡,选择最优的匹配结果,如此也可提高实体匹配的准确率,提高输入效率。
实施例四
参照图4,示出了本申请一种实体输入方法的流程示意图,具体可以包括:
步骤402,接收输入的输入序列;
步骤404,基于知识库识别所述输入序列,如果识别,获取当前的应用环境,根据所述应用环境对应的行业类别,结合所述输入序列从所述实体类表选择对应的行业类别的子实体对象;
在本发明实施例中,对于一个实体对象,本发明可预先针对不同的应用类别构建子实体对象。优选的,本发明实施例还包括:
步骤400,根据每个实体对象对应的各属性所属的行业类别,分别构建所述行业类别下的各子实体对象,并根据所述实体对象与各所述子实体对象的对应关系构建实体类表。
知识库中实体对象的知识内容存在不同行业类别的属性或者内容,比如“辣妈正传”,可能有百科类内容,也可能有视频类内容,那么本发明根据每个实体对象对应的各属性所属的行业类别,针对各属性构建所述行业类别下的子实体对象,并根据实体对象与子实体对象的对应关系构建实体类表。即同一个实体对象对应多个行业类别下的子实体对象的一对多关系表。
进一步的,优选的,所述根据每个实体对象对应的各属性所属的应用类别,针对各属性构建所述应用类别下的子实体对象包括:
子步骤C11,针对所述知识库中每个实体对象,分别读取所述实体对象对应的所有属性;
可读取知识库中每个实体对象的所有属性信息。
子步骤C12,获取被搜索的次数,分别统计每个属性返回的热度,并根据热度对各个属性进行热度排序;
可提取各实体对象或者属性的被搜索次数,然后根据搜索次数分别计算每个属性返回的热度,根据pv(点击次数)对属性的展示顺序进行排序。
子步骤C13,分别统计每个属性在不同应用环境的相关度,根据所述相关度在各环境下的分布确定所述属性对应的行业类别;
分别统计每个属性在不同应用环境的相关度,比如分别统计每个实体所有属性在不同环境(按软件的行业类别确定)中的输入次数,根据所述相关度将属性分成视频、百科等多个行业类别,以便后续根据用户输入环境不同,将各属性信息分别根据对应的行业类别封装成不同子实体对象。
子步骤C14,统计热度排序靠前的N个属性,将对应的各属性按行业类别封装为子实体对象。
最后分别将图片、介绍等按各行业类别,将热度靠前的属性分别进行封装,按行业类别分别封装成不同的子实体对象,将各行业类别的子实体对象在对应的应用环境中进行加载。如封装实体对象“辣妈正传”中主演、导演、上映日期等属性作为百科类的子实体对象,供在办公类的应用环境中的候选项进行加载;封装“辣妈正传”中播放链接、分集剧情等属性作为视频类的子实体对象,供在聊天类的应用环境中的候选项进行加载。行业类别的分类可根据黄页类的站点,如“网址大全”http://123.sogou.com/newtab/中的标签进行确定,软件的应用类别可根据软件下载类站点的结构明细,如“天空下载http://www.skycn.com/中“视频软件、“聊天工具”、“浏览器”等的细分的行业类别明细进行确定。
因此,本发明实施例不同行业类别的子实体,封装的属性不同,封装哪些属性根据事先计算好的属性热度选择,优先选择热度高的属性。
本实施例中,在用户输入时,自动识别用户的输入的环境信息,比如通过获取用户当前窗口所在进程,根据进程名判断环境等方式识别环境信息,选择与环境信息对应的应用类别的子实体对象。
步骤406,将所述子实体对象对应的知识内容封装为实体候选项,加载至所述输入序列对应的各候选项中;
所述将所述子实体对象对应的知识内容封装为实体候选项包括:
C16,以实体对象的图片为载体,将相关属性信息的链接加入所述图片中,封装为实体候选项。
比如,对于聊天环境中的北京大学,则封装的实体信息为介绍、周边美食、交通等属性的知识内容。如果是在办公环境中,则封装的是介绍、历史文化、地理位置等属性的知识内容。这些属性会封装成图片链接,供用户选择点击,提高输入信息容量。
步骤408,根据所述实体候选项对应的权重在各候选项中展现所述实体候选项;
还包括:步骤410,当所述实体候选项被触发时,所述实体候选项上屏,供用户进行触发。
优选的,所述当所述实体候选项被触发时,所述实体候选项上屏,供用户进行触发包括:
步骤C18,当用户选择所述实体候选项时,将所述实体候选项转换为输入法所在环境可识别的格式,将实体候选项上屏,供用户进行触发。
在本发明实施例中,为了将实体候选项上屏后,用户可以直接点击使用,即直接点击图片中的链接,则需要将封装的实体候选项根据输入法所在环境进行相应的格式转换。比如用户在word,则需要将封装的实体候选项转换为word格式可识别的文件格式,超级链接、package文件包等。
本实施例与前述实施例类似步骤原理类似,在此不再赘叙。
本发明利用知识库识别用户的输入序列,以获取实体对象,再根据实体对象将对应的知识内容封装为实体候选项以提供给用户选择,,通过该种方式,充分利用了知识库中记录的实体对象对应的实体信息,比如图片、属性等信息,使其可以直接展现给用户,提高了输入法的信息容量,加快输入效率。
本发明识别用户当前的应用环境,针对用户的输入序列匹配的实体对象,选择该实体对象下的匹配所述输入环境对应的实体候选项进行展现,不但使输入法信息容量提高,还能更符合用户的输入习惯和输入环境,进一步提高了输入效率。
实施例五
参照图5,示出了本申请一种实体输入方法的流程示意图,具体可以包括:
步骤502,接收输入的输入序列;
步骤504,基于知识库对所述输入序列进行匹配,获取所述输入序列对应的实体对象;
步骤506,获取当前的应用环境,根据所述应用环境对应的行业类别筛选所述实体对象属于所述应用环境的属性,将所述属性对应的内容封装为实体候选项;
即本发明可在获取实体对象后,可实时获取当前的输入法系统所在的应用环境,然后根据所述应用环境对应的行业类别筛选所述实体对象属于所述应用环境的属性,再将所述属性对应的内容封装为实体候选项。其环境与行业类别的对应关系可以类似实施例四方式的说明获得,比如:
子步骤D11,针对所述知识库中每个实体对象,分别读取所述实体对象对应的所有属性;
子步骤D12,获取被搜索的次数,分别统计每个属性返回的热度,并根据热度对各个属性进行热度排序;
子步骤D13,分别统计每个属性在不同应用环境的相关度,根据所述相关度在各环境下的分布确定所述属性对应的行业类别;
步骤508,根据所述实体候选项对应的权重在各候选项中展现所述实体候选项;
还可包括步骤510,当所述实体候选项被触发时,所述实体候选项上屏,供用户进行触发。
优选的,所述当所述实体候选项被触发时,所述实体候选项上屏,供用户进行触发包括:
当用户选择所述实体候选项时,将所述实体候选项转换为输入法所在环境可识别的格式,将实体候选项上屏,供用户进行触发。
本发明实施例中,可在步骤506中,针对一实体对象,根据当前环境信息,选择符合当前环境信息的属性内容进行封装,如此可使实体候选项更符合客观的输入环境,提供更符合用户输入环境的具备丰富内容的实体候选项。
实施例六
参照图6,示出了本申请一种实体输入方法的流程示意图,具体可以包括:
步骤602,客户端的输入法系统接收输入的输入序列;
步骤604,客户端的输入法系统基于知识库对所述输入序列进行匹配,获取所述输入序列对应的实体对象;
可以理解,本发明实施例中的输入法系统可首先获取前述实施例中介绍的基于知识库构建的实体列表,然后在客户端进行匹配分析。
步骤606,客户端的输入法系统从服务器的知识库中获取所述实体对象对应的知识内容,将所述知识内容下载至客户端后,将所述知识内容封装为实体候选项;
当然本实施例中可以将获取当前的应用环境,将应用环境发送至服务器,从服务器获取根据所述应用环境对应的行业类别筛选所述实体对象属于所述应用环境的属性,从而从服务器获取属性对应的内容,再将所述属性对应的内容封装为实体候选项。
可以理解,在本发明实施例中,实体对象对应的知识内容(比如图片、属性信息、属性链接等)还是存储于服务器的知识库中,本发明实施例的客户端从服务器下载知识内容,在本地进行封装,获得实体候选项,然后加载到输入序列对应的各候选项中。
步骤608,客户端的输入法系统根据所述实体候选项对应的权重在各候选项中展现所述实体候选项。
进一步的,还包括:
步骤610,当所述实体候选项被触发时,所述实体候选项上屏,供用户进行触发。
优选的,当所述实体候选项被触发时,所述实体候选项上屏,供用户进行触发包括:
步骤A62,将所述实体候选项转换为输入法所在环境可识别的格式,进行输出上屏动作。
本发明实施例的所有动作均可在终端侧的输入法系统中执行。其他类似步骤与前述实施例类似,在此不在详述。
实施例七
参照图7,示出了本申请一种实体输入方法的流程示意图,具体可以包括:
步骤702,客户端的输入法系统接收输入的输入序列;
步骤704,客户端的基于知识库对所述输入序列进行匹配,获取所述输入序列对应的实体对象,并将所述实体对象发送至服务器;
步骤706,服务器根据输入法系统发送的实体对象,从知识库中获取所述实体对象对应的知识内容,将所述知识内容封装为实体候选项后,提供给客户端下载;
当然本实施例中可以将获取当前的应用环境,将应用环境发送至服务器,从服务器获取根据所述应用环境对应的行业类别筛选所述实体对象属于所述应用环境的属性,再将所述属性对应的知识内容封装为实体候选项。
步骤708,客户端的输入法系统接从服务器下载所述实体候选项,并加载至所述输入序列对应的各候选项中;
步骤710,客户端的根据所述实体候选项对应的权重在各候选项中展现所述实体候选项。
在本发明中,如前所述,实体候选项对应的权重可根据输入序列与实体列表的匹配度,或者输入序列对应的传统候选项与实体列表的匹配度获得。
本发明实施例的实体候选项封装过程可在服务器执行,以减低客户端的资源占用。
实施例八
参照图8,示出了本申请一种实体输入方法的流程示意图,具体可以包括:
步骤802,输入法系统接收输入的输入序列,并将所述输入序列发送至服务器;
步骤804,服务器基于知识库对所述输入序列进行匹配,获取所述输入序列对应的实体对象;
步骤806,服务器根据输入法系统发送的实体对象,从服务器的知识库中获取所述实体对象对应的知识内容,将所述知识内容封装为实体候选项后,提供给客户端下载;
当然本实施例中可以将获取当前的应用环境,将应用环境发送至服务器,从服务器获取根据所述应用环境对应的行业类别筛选所述实体对象属于所述应用环境的属性,再将所述属性对应的内容封装为实体候选项。
步骤808,客户端的输入法系统接从服务器下载所述实体候选项,并加载至所述输入序列对应的各候选项中;
步骤810,根据所述实体候选项对应的权重在各候选项中展现所述实体候选项。
本实施例对用户的输入序列的所有分析和处理过程均放在云端的服务器中执行,进一步减轻客户端的处理逻辑,降低客户端资源的占用。
前述实施例中如果上述步骤未能识别出实体对象,则判断用户的当前输入不是实体对象。
下面以两个应用实例对本发明进行说明:
示例1,如图9d所示:QQ聊天中:A:华山在哪儿?B可直接将拼音串“huashan”对应候选项中的华山实体(以图标形式显示)上屏,并发送给A。A点击该图标后,查看华山的全部知识内容,包括地理位置、历史文化、交通路线等。
1.用户输入的输入序列:huashan
2.根据实体列表,查找输入串huashan在实体列表中对应的实体对象。实体列表中huansha映射到实体对象华山,所以最终识别的实体对象为“华山”,因为是完全匹配,所以匹配度为100。
3.加载“华山”的实体候选项(该候选项可预先封装完毕),根据匹配度计算得到位置为第2位,所以将实体信息添加到新候选项第二个位置。
对于实体候选项“华山”,其封装时可以图9a所示的图片为载体,对于详情链接http://baike.baidu.com/subview/2157/4941082.htm中的知识内容直接封装在图9a中,其中的知识内容可包括:“文化地理”、“地图”、“住宿”、“交通”、“美食”的链接。
4.展示新候选项,如图9c,得到候选位置,那么在第二个候选项位置展示实体候选项“华山”。
5.当前用户选实体候选项。上屏时判断用户当前输入环境,如果为聊天类的应用环境(如QQ),则实体候选项以图片链接的形式上屏,封装在实体候选项中的为知识库中华山实体对应的各属性信息,与当前用户交谈的对方用户也可直接点击实体候选项“华山”对应的图片,则显示该实体候选项封装的全部属性信息。
当然,实体候选项除以图片链接的形式调用各属性信息外,还可以将各属性信息的属性名称直接以链接的形式附在实体候选项的图片上供调用,当前用户或对方用户在实体候选项对应的图片上点选各属性名称对应的链接时,分别调用封装在该实体候选项“华山”下“文化地理”、“地图”等对应的属性信息单独加载显示。得到如图9b的聊天过程。
示例2
1.用户输入的字符序列为:zhenghuanzhuan
2.识别实体对象:
a)在事先做好的实体列表中查找zhenghuanzhuan,未找到精确匹配的实体对应输入串;
b)计算zhenghuanzhuan与所有实体对象对应输入串的编辑距离,得到zhenghuanzhuan与zhenhuanzhuan编辑距离为1,小于预设的阈值,则将用户输入串识别为实体对象“甄嬛传”。
c)此时,匹配度为100-编辑距离,即99。
3.根据当前输入环境分别获取并加载不同类别的实体候选项“甄嬛传”(将所述实体对象对应的知识内容封装为实体候选项可预先由服务器封装完毕),如果当前输入环境为办公类如word,则加载行业类别为百科类的“甄嬛传”子实体对象作为实体候选项加入到各候选项中,该实体候选项封装了剧情介绍、导演、演员表等百科类属性信息。如果输入环境为聊天类,如qq,则加载行业类别为视频类的“甄嬛传”子实体对象作为实体候选项加入到各候选项中,该实体候选项封装了在线播放地址、下载链接等播放类属性信息。
4.根据匹配度计算得到位置为3,所以将实体候选项添加到各候选项中的第三个位置。将新生成的包含实体的实体候选项“甄嬛传”展示给用户,如图10a所示。
5.用户选实体候选项。上屏时,如果检测到用户当前输入环境为聊天类(如QQ),则对应的实体对象以图片形式上屏,封装在实体对象中的则为“在线播放地址、下载链接”等与视频播放类相关的属性信息,在上屏后供当前用户或与当前用户对话的对方用户点选实体对应的图片后进行进行点击观看,如图10b所示。
如果检测到输入环境为办公类软件,如word,则调用百科类的“甄嬛传”实体候选项,该实体候选项封装了的实体以百科类的属性信息为主,包括各个属性链接,用户可以直接点击各属性信息对应的属性信息,查看对应的百科信息。通过提供链接让用户更快速的定位到想要的属性信息,如图10c所示。
在其他实施例中,对实体对象对应的各属性信息还可以根据检测到的当前输入环境实时地进行封装,即用户在QQ等聊天类环境中,输入“zhenhuanzhuan”时,对实体对象“甄嬛传”对应知识内容中的各属性进行筛选,实时选择在线播放地址、下载链接等播放类属性信息打包封装为实体候选项;在word等办公类环境中,实时选择剧情介绍、导演、演员表等百科类属性信息打包封装为实体候选项,以图标链接的形式在输入法的各候选项中显示,供用户调用。
在其他实施例中,所述知识内容包括媒体对象,所述媒体对象包括图片、音乐、flash、视频等,实体对象中一旦具有媒体对象的属性信息,可以分别封装为实体候选项。
如在实体对象“华山”中,将一介绍“华山”风光的视频单独封装为实体候选项,当用户输入“huashan”时,在候选区域则对应加载该媒体对象的实体候选项,可以该视频对应的首帧图片的形式进行显示,用户选中该视频后,将该视频作为实体候选项上屏,并根据输入环境设定触发播放的相应策略,在QQ等聊天类环境中,发送至聊天对象后直接进行播放。在word等办公类环境中,可嵌入输入区域中待用户触发后进行播放。知识内容中的媒体对象为图片时,可根据图片的拍摄周期、主题等属性进行划分后打包封装为实体候选项,并以首张图片为封面的形式进行显示,用户选中该组图片后,该组图片作为实体候选项上屏,调用本地或网络浏览插件对该组图片中的各图片进行浏览,从而使用户可以直接输入视频、音乐、图片等媒体对象,进一步提高了输入法的信息容量,加快输入效率。
当实体候选项在各候选项中的数量大于一个时,特别是实体候选项对应的知识内容含有媒体对象时,根据输入的匹配符进行匹配;所述匹配符与各实体候选项对应的知识内容所属的行业类别一一对应,可在封装时根据该实体候选项对应的行业类别进行设定。
如在用户在QQ等聊天类环境中,输入“zhenhuanzhuan”时,对实体对象“甄嬛传”对应知识内容中的各属性进行筛选,实时选择在线播放地址、下载链接等播放类属性信息打包封装为实体候选项,则将“媒体”或“meiti”作为该实体候选项对应的匹配符,用户输入“zhenhuanzhuan”后,如进一步输入“meiti”,即与匹配符“meiti”对应的匹配度最大,相应的,该媒体类的实体候选项则从各实体候选项中筛选出来,可设置将其排在各候选项的首位,供用户进行优先触发。匹配符还可以与各实体候选项对应的知识内容所属的标识相对应。如在QQ等聊天类环境中,用户欲给对方放一段“甄嬛传”的第51集的视频,则输入“zhenhuanzhuan”和“shipin”后,本应调用封装完毕的实体对象“甄嬛传”对应知识内容中各集的视频作为实体候选项,但用户再继续进一步输入“wushiyi”或“51”时,则与每个视频对应的标识,即各剧集视频中对应的集数相匹配,则在“甄嬛传”所属的各视频剧集中继续进行匹配,与第51集的视频文件对应的匹配符“51”匹配度最大,则将该视频作为媒体对象筛选出来后进行封装,可设置将其排在各候选项的首位,供用户进行优先触发,触发后用户可以发给对话方播放或是自行观看,从而在提高输入法的信息容量的同时,进一步对匹配的多个实体候选项进行筛选,提高了输入效率。
在其他实施例中,所述实体候选项被点击后,调用对应封装的知识内容在本地进行加载。展现字符序列对应的实体候选项后,可以在输入法系统的候选区域接受当前用户对于实体候选项的点击触发。实体候选项被触发后,分析加载对应的知识内容,供当前用户直接进行查看,不仅可供当前用户进行欣赏,而且也可以供当前用户对待上屏的实体候选项进行查看校验,特别是进行QQ聊天时,实体候选项需被发送给对话方供其触发,当前用户必须保证上屏的实体候选项所封装的知识内容符合自己的本意。如在用户输入“huashan”时,候选区域则对应加载“华山”的多个视频形式的实体候选项,用户如欲上屏一个介绍华山自然风光的视频,则可以分别点击触发候选区域中的多个视频形式的实体候选项,这些实体候选项则分别调用对应的知识内容,即加载播放链接,在当前用户的本地加载播放插件进行播放,使用户将介绍华山历史、华山文化等视频形式的实体候选项筛选掉,从而提高了上屏信息的精确度,保证了输入效率。在word等办公类环境中也同理,保证了文档中上屏的实体候选项对应知识内容的准确度。还可以加载知识内容后,自动地在本地对展现的各实体候选项封装的知识内容进行分析,根据输入时对应的上下文信息从各实体候选项对应的知识内容中筛选出符合当前语境的实体候选项。如对本地加载的三个关于“华山”视频的实体候选项进行图像帧分析和页面分析,分别与“风景”、“历史”、“文化”三个既定类别的匹配度最大,则根据word等办公类环境中上下文,将“文化”类型的“华山”视频作为实体候选项进行播放,供当前用户进行查看,从而保证上屏的实体候选项所封装的知识内容符合自己的本意。
所述实体候选项在各候选项中的数量大于一个时,由于候选区域面积的限制,不便于加载过多的实体候选项,则将各实体候选项可以集中设置,将其分别加载至在候选区域既定设置的二级菜单中。在用户查看实体候选项时,首先触发弹出该二级菜单,则展示各实体候选项。在二级菜单中的某个实体候选项接收到用户的触发信号时,可以直接上屏,供当前用户或对话方进行触发;也可以直接在本地加载所述实体候选项对应的知识内容,供当前用户进行欣赏或者上屏前对实体候选项的筛选。
实施例九
参照图11,其示出了本发明一种实体输入装置的结构示意图,包括:
序列接收模块1102,用于接收输入的输入序列;
识别模块1104,用于基于知识库对所述输入序列进行匹配,获取所述输入序列对应的实体对象;
优选的,所述识别模块包括:
匹配模块,用于将所述输入序列与基于知识库的实体列表中的输入串进行匹配;如果匹配,则根据实体列表获取所述输入序列对应的实体对象;所述实体列表包括所述知识库中各实体对象、每个实体对象分别对应的实体名称和所述实体名称对应输入串。
所述识别模块还包括:
匹配度计算模块,用于计算所述输入序列与所述知识库中各实体对象的匹配度,选取对应匹配的实体对象;
优选的,所述匹配模块包括:
第一匹配模块,用于如果对所述输入序列进行匹配时完全匹配,则直接根据实体列表获取所述输入序列对应的实体对象。
优选的,所述匹配模块包括:
第二匹配模块,用于如果对所述输入序列进行匹配时不完全匹配,获取所述输入序列与实体列表中各输入串的第一匹配度,如第一匹配度符合第一阈值,则根据实体列表获取所述输入序列对应的实体对象;
第三匹配模块,用于当第一匹配度不符合第一阈值,读取输入法已有的候选项,分别计算各候选项文本与实体列表中的各实体名称对应的第二匹配度,如果所述第二匹配度符合第二阈值,则根据实体列表获取所述输入序列对应的实体对象。
优选的,所述匹配模块包括:
第一匹配度计算模块,用于如果对所述输入序列进行匹配时不完全匹配时,获取输入序列与实体列表中各输入串的第一匹配度;
第二匹配度计算模块,用于如果对所述输入序列进行匹配时不完全匹配时,读取输入法已有的候选项,计算各候选项的字串与实体列表中的各实体名称的第二匹配度;
匹配度比较模块,用于按所述第一匹配度和所述第二匹配度进行权重排序,获取对应的匹配度排前的实体对象。
优选的,还包括:
实体列表构建模块,包括:
实体原名提取模块,用于从知识库中分别提取各实体对象的原名E_NAME,并根据所述原名找到对应的实体对象E,分别得到所述原名与所述实体对象的对应关系E_NAME—>E;
实体第二名称提取模块,用于从知识库中分别提取所述实体对象的第二名称E_ALIAS,分别得到所述第二名称与所述实体对象E的对应关系E_ALIAS—>E;
合并模块,用于分别合并所述原名与实体对象的对应关系E_NAME—>E和所述第二名称与实体对象E的对应关系E_ALIAS—>E,得到实体名称和实体对象E的对应关系{E_NAME,E_ALIAS}—>E;
建立模块,用于获取与实体对象E的每个实体名称分别对应的输入串,构建包括所述知识库中各实体对象、每个实体对象分别对应的实体名称和所述实体名称对应输入串的实体列表。
优选的,还包括:
实体类表构建模块,用于根据每个实体对象对应的各属性所属的行业类别,分别构建所述行业类别下的各子实体对象,并根据所述实体对象与各所述子实体对象的对应关系构建实体类表。
优选的,所述实体类表构建模块包括:
属性信息读取模块,用于针对所述知识库中每个实体对象,分别读取所述实体对象对应的所有属性;
热度分析模块,用于获取被搜索的次数,分别统计每个属性返回的热度,并根据热度对各个属性进行热度排序;
应用类别确定模块,用于分别统计每个属性在不同应用环境的相关度,根据所述相关度在各环境下的分布确定所述属性对应的行业类别;
子实体封装模块,用于统计热度排序靠前的N个属性,将对应的各属性按行业类别封装为子实体对象。
进一步的,优选的,所述识别模块还包括:
环境判断模块,用于获取当前的应用环境,根据所述应用环境对应的行业类别,结合所述输入序列从所述实体类表选择对应的行业类别的子实体对象。
实体候选项封装模块1106,用于将所述实体对象对应的知识内容封装为实体候选项,加载至所述输入序列对应的各候选项中;
优选的,所述实体候选项封装模块包括:
第一实体候选项封装模块,用于从知识库中获取所述实体对象对应的知识内容,将所述知识内容下载至客户端后,将所述知识内容封装为实体候选项。
优选的,在前述实体类表构建模块的情况下,所述实体候选项封装模块包括:
第一环境封装模块,用于以图片为载体,按行业类别将对应的所述子实体对象加入所述图片中,封装为所述实体候选项。
优选的,所述实体候选项封装模块包括:
第二环境封装模块,用于获取当前的应用环境,根据所述应用环境对应的行业类别筛选所述实体对象属于所述应用环境的属性,将所述属性对应的内容封装为实体候选项。
候选展示模块1108,用于根据所述实体候选项对应的权重在各候选项中展现所述实体候选项。
优选的,在所述识别模块包括匹配度计算模块的情况下,进一步的,所述候选展示模块,包括:
匹配展示模块,用于根据所述匹配度计算每个实体对象对应封装的实体候选项在所述输入序列对应的各候选项中的目标位置,进而在所述目标位置展现所述实体候选项。
优选的,还包括:
上屏模块1110,用于当所述实体候选项被触发时,所述实体候选项上屏,供用户进行触发。
优选的,所述知识内容包括媒体对象,所述媒体对象包括图片、音乐、flash、视频,将所述媒体对象被封装为实体候选项后,供用户直接进行上屏或查看。
优选的,还包括:第二匹配展示模块,用于在所述实体候选项在各候选项中的数量大于一个时,根据输入的匹配符进行匹配;所述匹配符与各实体候选项对应的知识内容所属的行业类别和/或标识相对应。
优选的,还包括:分析展示模块,用于所述实体候选项被点击后,调用对应封装的知识内容在本地进行加载,分析展现对应的知识内容,供当前用户进行查看。
优选的,还包括:菜单模块,用于所述实体候选项在各候选项中的数量大于一个时,将各实体候选项分别加载至候选区域的二级菜单。
实施例十
参照图12,其示出了本发明一种实体输入系统的结构示意图,包括:
服务器1700和客户端1720:
所述客户端1700包括:
序列接收模块1702,用于接收输入的输入序列;
识别模块1704,用于基于知识库对所述输入序列进行匹配,获取所述输入序列对应的实体对象,并将所述实体对象发送至服务器;
候选加载模块1706,用于输入法系统接从服务器下载所述实体候选项,并加载至所述输入序列对应的各候选项中;
候选展示模块1708,用于输入法系统根据所述实体候选项对应的权重在各候选项中展现所述实体候选项。
所述服务器1720包括:
实体候选项封装模块1722,用于根据输入法系统发送的实体对象,从知识库中获取所述实体对象对应的知识内容,将所述知识内容封装为实体候选项后,提供给客户端下载。
所述客户端还可包括上屏模块,用于当用户选择所述实体候选项时,进行上屏操作。
当然本发明实施例中的识别模块1704也可以在服务器中,相应的客户端中的序列接收模块1702,用于输入法系统接收输入的输入序列,并将所述输入序列发送至服务器。
以上对本申请所提供的一种实体输入方法和装置,进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (21)

1.一种实体输入方法,其特征在于,包括:
接收输入的输入序列;
基于知识库对所述输入序列进行匹配,获取所述输入序列对应的实体对象;
将所述实体对象对应的知识内容封装为实体候选项,加载至所述输入序列对应的各候选项中;
根据所述实体候选项对应的权重在各候选项中展现所述实体候选项;
所述方法还包括:根据每个实体对象对应的各属性所属的行业类别,分别构建所述行业类别下的各子实体对象,并根据所述实体对象与各所述子实体对象的对应关系构建实体类表;
所述根据每个实体对象对应的各属性所属的行业类别,分别构建所述行业类别下的各子实体对象,包括:针对所述知识库中每个实体对象,分别读取所述实体对象对应的所有属性;获取被搜索的次数,分别统计每个属性返回的热度,并根据热度对各个属性进行热度排序;分别统计每个属性在不同应用环境的相关度,根据所述相关度在各环境下的分布确定所述属性对应的行业类别;统计热度排序靠前的N个属性,将对应的各属性按行业类别封装为子实体对象。
2.根据权利要求1所述的方法,其特征在于,所述基于知识库对所述输入序列进行匹配,获取所述输入序列对应的实体对象包括:
将所述输入序列在基于所述知识库的实体列表中进行匹配;如果匹配,则根据所述实体列表获取所述输入序列对应的实体对象;所述实体列表包括所述知识库中各实体对象、每个实体对象分别对应的实体名称和所述实体名称对应输入串。
3.根据权利要求2所述的方法,其特征在于,在基于知识库对所述输入序列进行匹配,获取所述输入序列对应的实体对象时还包括:
计算所述输入序列与所述知识库中各实体对象的匹配度,选取对应匹配的实体对象;
进一步的,所述根据所述实体候选项对应的权重在各候选项中展现所述实体候选项包括:
根据所述匹配度计算每个实体对象对应封装的实体候选项在所述输入序列对应的各候选项中的目标位置,进而在所述目标位置展现所述实体候选项。
4.根据权利要求3所述的方法,其特征在于,所述将所述输入序列与基于知识库获得的实体列表中的输入串进行匹配包括:
如果对所述输入序列进行匹配时完全匹配,则直接根据实体列表获取所述输入序列对应的实体对象。
5.根据权利要求3所述的方法,其特征在于,如果对所述输入序列进行匹配时不完全匹配,还包括:
获取所述输入序列与实体列表中各输入串的第一匹配度,如第一匹配度符合第一阈值,则根据实体列表获取所述输入序列对应的实体对象;
否则,读取输入法已有的候选项,分别计算各候选项文本与实体列表中的各实体名称对应的第二匹配度,如果所述第二匹配度符合第二阈值,则根据实体列表获取所述输入序列对应的实体对象。
6.根据权利要求3所述的方法,其特征在于,如果对所述输入序列进行匹配时不完全匹配,还包括:
获取所述输入序列与实体列表中各输入串的第一匹配度;
读取所述输入序列对应已加载的字符候选项,分别计算各候选项文本与实体列表中的各实体名称对应的第二匹配度;
按所述第一匹配度和所述第二匹配度进行权重排序,获取对应的匹配度排序为既定位数的实体对象。
7.根据权利要求2所述的方法,其特征在于,所述实体列表基于所述知识库构建,包括:
从知识库中分别提取各实体对象的原名E_NAME,并根据所述原名找到对应的实体对象E,分别得到所述原名与所述实体对象的对应关系E_NAME—>E;
从知识库中分别提取所述实体对象的第二名称E_ALIAS,分别得到所述第二名称与所述实体对象E的对应关系E_ALIAS—>E;
分别合并所述原名与实体对象的对应关系E_NAME—>E和所述第二名称与实体对象E的对应关系E_ALIAS—>E,得到实体名称和实体对象E的对应关系{E_NAME,E_ALIAS}—>E;
获取与实体对象E的每个实体名称分别对应的输入串,构建包括所述知识库中各实体对象、每个实体对象分别对应的实体名称和所述实体名称对应输入串的实体列表。
8.根据权利要求1所述的方法,其特征在于,所述将所述实体对象对应的知识内容封装为实体候选项,包括:
从知识库中获取所述实体对象对应的知识内容,将所述知识内容下载至客户端后,将所述知识内容封装为实体候选项。
9.根据权利要求1所述的方法,其特征在于,所述将所述实体对象对应的知识内容封装为实体候选项,包括:
从知识库中获取所述实体对象对应的知识内容,将知识内容封装为实体候选项后下载至客户端。
10.根据权利要求1所述的方法,其特征在于,所述获取所述输入序列对应的实体对象时还包括:
获取当前的应用环境,根据所述应用环境对应的行业类别,结合所述输入序列从所述实体类表选择对应的行业类别的子实体对象。
11.根据权利要求1所述的方法,其特征在于,所述将所述实体对象对应的知识内容封装为实体候选项包括:
以图片为载体,按行业类别将对应的所述子实体对象加入所述图片中,封装为所述实体候选项。
12.根据权利要求1所述的方法,其特征在于,所述将所述实体对象对应的知识内容封装为实体候选项包括:
获取当前的应用环境,根据所述应用环境对应的行业类别筛选所述实体对象属于所述应用环境的属性,将所述属性对应的内容封装为实体候选项。
13.根据权利要求1所述的方法,其特征在于,还包括:所述实体候选项在各候选项中的数量大于一个时,根据输入的匹配符进行匹配;所述匹配符与各实体候选项对应的知识内容所属的行业类别和/或标识相对应。
14.根据权利要求1所述的方法,其特征在于,还包括:所述实体候选项在各候选项中的数量大于一个时,将各实体候选项分别加载至候选区域的二级菜单。
15.根据权利要求1、8、9、11、12、13或14中任一所述的方法,其特征在于,还包括:
当所述实体候选项被触发时,所述实体候选项上屏,供用户进行触发;
或者,
所述实体候选项被点击后,调用对应封装的知识内容在本地进行加载,分析展现对应的知识内容,供当前用户进行查看。
16.根据权利要求15所述的方法,其特征在于,所述知识内容包括媒体对象,
所述媒体对象包括图片、音乐、flash、视频,将所述媒体对象被封装为实体候选项后,供用户直接进行上屏或查看。
17.一种实体输入装置,其特征在于,包括:
序列接收模块,用于接收输入的输入序列;
识别模块,用于基于知识库对所述输入序列进行匹配,获取所述输入序列对应的实体对象;
实体候选项封装模块,用于将所述实体对象对应的知识内容封装为实体候选项,加载至所述输入序列对应的各候选项中;
候选展示模块,用于根据所述实体候选项对应的权重在各候选项中展现所述实体候选项;
所述装置还包括:实体类表构建模块,用于根据每个实体对象对应的各属性所属的行业类别,分别构建所述行业类别下的各子实体对象,并根据所述实体对象与各所述子实体对象的对应关系构建实体类表;
所述实体类表构建模块包括:属性信息读取模块,用于针对所述知识库中每个实体对象,分别读取所述实体对象对应的所有属性;热度分析模块,用于获取被搜索的次数,分别统计每个属性返回的热度,并根据热度对各个属性进行热度排序;应用类别确定模块,用于分别统计每个属性在不同应用环境的相关度,根据所述相关度在各环境下的分布确定所述属性对应的行业类别;子实体封装模块,用于统计热度排序靠前的N个属性,将对应的各属性按行业类别封装为子实体对象。
18.根据权利要求17所述的装置,其特征在于,所述识别模块包括:
匹配模块,用于将所述输入序列与基于知识库的实体列表中的输入串进行匹配;如果匹配,则根据实体列表获取所述输入序列对应的实体对象;所述实体列表包括所述知识库中各实体对象、每个实体对象分别对应的实体名称和所述实体名称对应输入串。
19.根据权利要求17所述的装置,其特征在于,还包括:第二匹配展示模块,用于在所述实体候选项在各候选项中的数量大于一个时,根据输入的匹配符进行匹配;所述匹配符与各实体候选项对应的知识内容所属的行业类别和/或标识相对应。
20.根据权利要求17所述的装置,其特征在于,还包括:菜单模块,用于所述实体候选项在各候选项中的数量大于一个时,将各实体候选项分别加载至候选区域的二级菜单。
21.根据权利要求17、19或20中任一所述的装置,其特征在于,还包括:
上屏模块,用于当所述实体候选项被触发时,所述实体候选项上屏,供用户进行触发;
或者,
分析展示模块,用于所述实体候选项被点击后,调用对应封装的知识内容在本地进行加载,分析展现对应的知识内容,供当前用户进行查看。
CN201410014676.6A 2014-01-13 2014-01-13 一种实体输入方法和装置 Active CN103760991B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410014676.6A CN103760991B (zh) 2014-01-13 2014-01-13 一种实体输入方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410014676.6A CN103760991B (zh) 2014-01-13 2014-01-13 一种实体输入方法和装置

Publications (2)

Publication Number Publication Date
CN103760991A CN103760991A (zh) 2014-04-30
CN103760991B true CN103760991B (zh) 2017-02-15

Family

ID=50528243

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410014676.6A Active CN103760991B (zh) 2014-01-13 2014-01-13 一种实体输入方法和装置

Country Status (1)

Country Link
CN (1) CN103760991B (zh)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104102712A (zh) * 2014-07-15 2014-10-15 百度在线网络技术(北京)有限公司 识别实体的方法和装置
CN105528338B (zh) * 2014-09-30 2019-10-25 上海触乐信息科技有限公司 智能预测的输入方法和系统
CN104881146A (zh) * 2015-04-28 2015-09-02 北京美秒科技有限公司 图片输入方法
CN105045409A (zh) * 2015-07-17 2015-11-11 百度在线网络技术(北京)有限公司 输入方法及装置
CN106227435A (zh) * 2016-07-20 2016-12-14 广东欧珀移动通信有限公司 一种输入法处理方法及终端
CN106648137A (zh) * 2016-11-17 2017-05-10 宇龙计算机通信科技(深圳)有限公司 一种表情符号管理和编辑方法、装置及终端
CN107247731A (zh) * 2017-05-04 2017-10-13 深圳哇哇鱼网络科技有限公司 一种语义识别推荐图形方法
CN108874170B (zh) * 2017-05-08 2023-05-23 北京搜狗科技发展有限公司 一种输入方法及装置
CN109002184B (zh) * 2017-06-07 2022-09-23 北京搜狗科技发展有限公司 一种输入法候选词的联想方法和装置
CN110021396A (zh) * 2017-07-12 2019-07-16 东软集团股份有限公司 医嘱录入方法及装置、存储介质、电子设备
CN107944025A (zh) * 2017-12-12 2018-04-20 北京百度网讯科技有限公司 信息推送方法和装置
WO2019119285A1 (en) * 2017-12-20 2019-06-27 Orange Method for inserting a web address in a message on a terminal
CN108595438A (zh) * 2018-05-08 2018-09-28 北京金山安全软件有限公司 信息处理方法、装置及设备
CN114638231B (zh) * 2022-03-21 2023-07-28 马上消费金融股份有限公司 实体链接方法、装置及电子设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1920754A (zh) * 2006-09-05 2007-02-28 北京搜狗科技发展有限公司 一种向应用程序输入艺术字/图形的方法及系统
CN101639755A (zh) * 2009-09-10 2010-02-03 腾讯科技(深圳)有限公司 一种支持图片输入的方法和设备
CN101650605A (zh) * 2009-09-25 2010-02-17 中国电信股份有限公司 一种智能汉字输入方法和系统
CN101986293A (zh) * 2010-09-03 2011-03-16 百度在线网络技术(北京)有限公司 用于在搜索界面中呈现搜索答案信息的方法及设备
CN102314441A (zh) * 2010-06-30 2012-01-11 百度在线网络技术(北京)有限公司 用于供用户进行个性化素材输入的方法、设备和系统
CN102722483A (zh) * 2011-03-29 2012-10-10 百度在线网络技术(北京)有限公司 用于确定输入法的候选项排序的方法、装置和设备

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6822664B2 (en) * 2000-10-11 2004-11-23 Microsoft Corporation Browser navigation for devices with a limited input system

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1920754A (zh) * 2006-09-05 2007-02-28 北京搜狗科技发展有限公司 一种向应用程序输入艺术字/图形的方法及系统
CN101639755A (zh) * 2009-09-10 2010-02-03 腾讯科技(深圳)有限公司 一种支持图片输入的方法和设备
CN101650605A (zh) * 2009-09-25 2010-02-17 中国电信股份有限公司 一种智能汉字输入方法和系统
CN102314441A (zh) * 2010-06-30 2012-01-11 百度在线网络技术(北京)有限公司 用于供用户进行个性化素材输入的方法、设备和系统
CN101986293A (zh) * 2010-09-03 2011-03-16 百度在线网络技术(北京)有限公司 用于在搜索界面中呈现搜索答案信息的方法及设备
CN102722483A (zh) * 2011-03-29 2012-10-10 百度在线网络技术(北京)有限公司 用于确定输入法的候选项排序的方法、装置和设备

Also Published As

Publication number Publication date
CN103760991A (zh) 2014-04-30

Similar Documents

Publication Publication Date Title
CN103760991B (zh) 一种实体输入方法和装置
CN103491205B (zh) 一种基于视频搜索的关联资源地址的推送方法和装置
CN106101747B (zh) 一种弹幕内容处理方法及应用服务器、用户终端
CN103631887B (zh) 浏览器侧进行网络搜索的方法与浏览器
US10491550B2 (en) Instant communication
CN106533899B (zh) 一种信息显示处理的方法、装置及系统
CN104933113A (zh) 一种基于语义理解的表情输入方法和装置
CN107104881A (zh) 一种信息处理方法和装置
CN105138558B (zh) 基于用户访问内容的实时个性化信息采集方法
CN113111026A (zh) 具有共享兴趣的消息的图库
CN102402619A (zh) 一种搜索方法和装置
US20200210053A1 (en) Systems, devices and methods for electronic determination and communication of location information
KR102135477B1 (ko) 이미지 자동분류 방법 및 시스템
CN107861927A (zh) 文档注释方法、装置、可读存储介质及计算机设备
CN104933191A (zh) 一种基于贝叶斯算法的垃圾评论识别方法、系统及终端
CN108197105B (zh) 自然语言处理方法、装置、存储介质及电子设备
CN103838862A (zh) 一种视频搜索的方法、装置及终端
CN107679141A (zh) 数据入库方法、装置、设备及计算机可读存储介质
CN103955480A (zh) 一种用于确定用户所对应的目标对象信息的方法与设备
CN106919593B (zh) 一种搜索的方法和装置
CN111813236B (zh) 输入方法、装置、电子设备及可读存储介质
CN107533574A (zh) 基于随机索引模式匹配的电子邮件关系查找器系统
US20210150243A1 (en) Efficient image sharing
CN106101359A (zh) 通讯录信息的显示方法和装置
CN106055688A (zh) 搜索结果的展现方法、装置和移动终端

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant