CN113359997A - 输入过程中已上屏内容的处理方法、装置和介质 - Google Patents

输入过程中已上屏内容的处理方法、装置和介质 Download PDF

Info

Publication number
CN113359997A
CN113359997A CN202010148957.6A CN202010148957A CN113359997A CN 113359997 A CN113359997 A CN 113359997A CN 202010148957 A CN202010148957 A CN 202010148957A CN 113359997 A CN113359997 A CN 113359997A
Authority
CN
China
Prior art keywords
screen content
candidate result
knowledge graph
content
screen
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010148957.6A
Other languages
English (en)
Inventor
刘伟
谢远江
许静芳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sogou Technology Development Co Ltd
Original Assignee
Beijing Sogou Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sogou Technology Development Co Ltd filed Critical Beijing Sogou Technology Development Co Ltd
Priority to CN202010148957.6A priority Critical patent/CN113359997A/zh
Publication of CN113359997A publication Critical patent/CN113359997A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/02Input arrangements using manually operated switches, e.g. using keyboards or dials
    • G06F3/023Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
    • G06F3/0233Character input methods
    • G06F3/0236Character input methods using selection techniques to select from displayed items
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/02Input arrangements using manually operated switches, e.g. using keyboards or dials
    • G06F3/023Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
    • G06F3/0233Character input methods
    • G06F3/0237Character input methods using prediction or retrieval techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明实施例提供了一种输入过程中已上屏内容的处理方法和装置、一种用于处理已上屏内容的装置,其中的方法具体包括:监测用户的已上屏内容;向知识图谱服务端发送所述已上屏内容;接收所述知识图谱服务端针对所述已上屏内容返回的候选结果;所述候选结果为依据知识图谱得到;对所述候选结果进行展示。本发明实施例能够提高候选结果的提供效率和候选结果的质量,进而能够提高用户的输入效率。

Description

输入过程中已上屏内容的处理方法、装置和介质
技术领域
本发明涉及输入法技术领域,特别是涉及一种输入过程中已上屏内容 的处理方法和装置、一种机器可读介质。
背景技术
输入法是指为了将各种文字输入计算机或其他设备(如手机、平板电脑 等)而采用的编码方法。用户如果要将文字输入到设备中,则需要使用输入 法程序。例如,用户可以在搜索引擎中输入关键词以搜索网页,也可以在 即时通信APP(应用程序,Application)中输入文字以与其他用户进行交流, 还可以在文档APP中输入文字以编辑文档等等。
输入法的联想功能是输入法程序的一种扩展功能,它的出现减少了用 户主动输入的次数、按键的次数,并增加了输入法的智能性。目前,可以依 据用户的已上屏内容,在多元关系词库中进行查找,并依据上述已上屏内容 命中的多元关系词库得到联想候选。例如,在已上屏内容为“惊得我”的情况 下,提供联想候选“目瞪口呆”、“无力反抗”、“出了一身汗”、“下巴没合上” 等,以供用户选择。
发明人在实施本发明实施例的过程中发现,多元关系词库往往是通过统 计学习的方式得到,通常存储的多元关系词库的覆盖能力是有限的。并且, 通常在已上屏内容完全命中多元关系词库的情况下,才提供联想候选,这使 得联想候选的提供效率较低,进而影响用户的输入效率。例如,在已上屏内 容为“XXX毕业于”、或者“XXX老婆的血型是”、或者“清朝的建立时间 是”、或者“故宫门票是”的情况下,由于已上屏内容无法命中多元关系词库,因此将无法提供联想候选,其中,“XXX”表征人名。
发明内容
鉴于上述问题,提出了本发明实施例以便提供一种克服上述问题或者 至少部分地解决上述问题的输入过程中已上屏内容的处理方法、输入过程 中已上屏内容的处理装置及用于处理已上屏内容的装置,本发明实施例能 够提高候选结果的提供效率和候选结果的质量,进而能够提高用户的输入效 率。
为了解决上述问题,本发明公开了一种输入过程中已上屏内容的处理 方法,包括:
监测用户的已上屏内容;
向知识图谱服务端发送所述已上屏内容;
接收所述知识图谱服务端针对所述已上屏内容返回的候选结果;所述候 选结果为依据知识图谱得到;
对所述候选结果进行展示。
另一方面,本发明实施例公开了一种输入过程中已上屏内容的处理装 置,所述装置包括:
监测模块,用于监测用户的已上屏内容;
已上屏内容发送模块,用于向知识图谱服务端发送所述已上屏内容;
接收模块,用于接收所述知识图谱服务端针对所述已上屏内容返回的候 选结果;所述候选结果为依据知识图谱得到;以及
展示模块,用于对所述候选结果进行展示。
再一方面,本发明实施例公开了一种用于处理已上屏内容的装置,包 括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序 存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或 者一个以上程序包含用于进行以下操作的指令:
监测用户的已上屏内容;
向知识图谱服务端发送所述已上屏内容;
接收所述知识图谱服务端针对所述已上屏内容返回的候选结果;所述候 选结果为依据知识图谱得到;
对所述候选结果进行展示。
本发明实施例包括以下优点:
本发明实施例在输入过程中针对实时监测得到的已上屏内容,提供基于 知识图谱的候选结果。由于知识图谱具有数据准确度高、覆盖率高、时效性 高、知识更新速度快和解析能力强的优点,因此,本发明实施例能够提高候 选结果的提供效率和候选结果的质量,进而能够提高用户的输入效率。
并且,本发明实施例的候选结果所依据的知识图谱具有时效性高和知识 更新速度快的优点,因此能够提高候选结果的时效性和准确率。例如,本发 明实施例能够依据事件对知识图谱进行快速更新,这样可以提高候选结果的 时效性和准确率。例如,事件为“人物A相关的生子事件”,则可以依据“某 人物A相关的生子事件”对“人物A”的“子女数量”属性进行更新,例如, “人物A”的“子女数量”属性的属性值为N;则在已上屏内容为“人物A有”或“人物B有”的情况下,可以提供“N个孩子”的候选结果,其中, “人物A”与“人物B”之间的关系为夫妻关系。
附图说明
图1是本发明实施例的一种输入过程中已上屏内容的处理方法的流程的 示意;
图2是本发明的一种输入过程中已上屏内容的处理方法实施例一的步骤 流程图;
图3是本发明的一种输入过程中已上屏内容的处理方法实施例二的步骤 流程图;
图4是本发明的一种输入过程中已上屏内容的处理装置的结构框图;
图5是本发明的一种输入过程中已上屏内容的处理装置的结构框图;
图6是本发明的一种用于处理已上屏内容的装置1300的框图;及
图7是本发明的一种服务端的结构示意图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附 图和具体实施方式对本发明作进一步详细的说明。
本发明实施例可以适用于输入场景,以提高用户的输入效率。输入场景 可以包括:即时通信场景、办公场景等,可以理解,本发明实施例对于具体 的输入场景不加以限制。
针对联想候选的提供效率较低导致输入效率较低的技术问题,本发明实 施例提供了一种输入过程中已上屏内容的处理方案,该方案具体包括:监测 用户的已上屏内容;向知识图谱服务端发送上述已上屏内容;接收上述知识 图谱服务端针对上述已上屏内容返回的候选结果;上述候选结果为依据知识 图谱得到;对上述候选结果进行展示。
在输入场景中,已上屏内容可以表征用户实时输入的内容。以键盘输入 为例,一次输入过程可以始于输入串的接收,终止于该输入串对应候选项的 上屏。以输入串“qingchaodejianlishijs”和上屏内容“清朝的建立时间是”的输 入过程为例,在接收到字符“q”时,该次输入过程开始,而在接收到输入 串“qingchaodejianlishijs”对应候选项“清朝的建立时间是”的上屏操作后, 该次输入过程结束,该次输入过程对应的已上屏内容可以为“你好”。在用 户的输入过程中,可以实时地监测得到用户的已上屏内容,如“XXX毕业 于”、或者“XXX老婆的血型是”、或者“清朝的建立时间是”、或者“故宫 门票是”等。
知识图谱(Knowledge Graph)是一种叫做语义网络(semantic network)的知 识库,即具有有向图结构的一个知识库。其中,图的节点代表实体(entity)或 者概念(concept),而图的边代表实体/概念之间的各种语义关系,图中的不同 节点通过语义关系相连。
本发明实施例中,实体是一个具体事物或概念。实体一般会划分类型, 例如人物类实体、电影类实体、动物类实体、历史类实体等。同一个实体可 以对应多个实体实例,实体实例可以是在网络(或其它媒介)中对一个实体的 描述性页面(内容),例如百科的页面中即包含实体对应的实体实例。
可选地,实体可以包括:命名实体(named entity),命名实体可以指人 名、机构名、地名以及其他所有以名称为标识的实体。更广泛的命名实体 还可以包括:书名、歌曲名、影视剧名、产品名、品牌名、数字、日期、货 币、地址等等。
可选地,所述实体类别可以包括如下类别中的至少一种:人物、地点、 水果、蔬菜、动物、植物、建筑物、衣物、食物、药物、交通工具、家具、 乐器、电器、以及自然现象。
实体可以由若干个属性表示,例如,人物这类实体有生日、身高、妻子 等属性。电影实体有导演、演员、制片国家、上映日期等。
通过实体的属性可以将不同的实体建立关联关系,例如:
刘德华(实体)--妻子(属性)->朱丽倩(另一个实体);
刘德华--电影作品->无间道;
无间道--制片国家/地区->中国香港;
人物(实体)--出生地(属性)->地名(另一个实体);
人物(实体)--职业(属性)->职业名称(另一个实体);
人物(实体)--代表作品(属性)->应用程序名称(另一个实体)。
本发明实施例中,可以通过三元组表征知识图谱中实体的结构信息。三 元组的形式可以包括:(实体1-关系-实体2)、或者(实体-属性-属性值)等。可 以理解,本发明实施例对于知识图谱中实体的结构信息不加以限制。
例如,中国是一个实体,北京是一个实体,(中国-首都-北京)是一个(实 体-关系-实体)的三元组样例。北京是一个实体,人口是一种属性,2069.3 万是属性值,(北京-人口-2069.3万)构成一个(实体-属性-属性值)的三元 组样例。
知识图谱可以包括如下优势:
1、数据准确度高;
知识图谱可以针对任意实体建立实体属性和实体关系的知识库。该知识 库的知识可以来源于权威性高的数据源,如搜狗百科等百科类的数据源,这 些数据源提供的知识和内容质量比较高,因此知识图谱具有实体数据质量 高、实体之间的关系准确的特点。
2、覆盖率高;
依赖于搜狗百科等数据源拥有的大量的词条数据,知识图谱中能够积累 用户日常关注的内容,因此具有覆盖率高的优点。
3、时效性高和知识更新速度快;
由于知识图谱的数据来源于搜狗百科等百科类的数据源,在百科类的数 据源被更新后,可以对知识图谱中相关的数据进行更新,因此知识图谱具有 时效性高和知识更新速度快的优点。
4、已上屏内容的解析能力强。
知识图谱服务端能够对用户的已上屏内容解析出其意图,因此具有解析 能力强的优点;这相对于已上屏内容完全命中多元关系词库,能够进一步提 高知识图谱的覆盖率和候选结果的提供效率。例如,本发明实施例能够针对 已上屏内容“XXX老婆的血型是”,解析出“特定人物血型”的意图,“特 定人物”具体为“XXX老婆”。
综上,本发明实施例在输入过程中针对实时监测得到的已上屏内容,提 供基于知识图谱的候选结果。由于知识图谱具有数据准确度高、覆盖率高、 时效性高、知识更新速度快和解析能力强的优点,因此,本发明实施例能够 提高候选结果的提供效率和候选结果的质量,进而能够提高用户的输入效 率。
并且,本发明实施例的候选结果所依据的知识图谱具有时效性高和知识 更新速度快的优点,因此能够提高候选结果的时效性和准确率。例如,本发 明实施例能够依据实体相关的事件对知识图谱对应的实体数据进行快速更 新,这样可以提高候选结果的时效性和准确率。例如,事件为“人物A相关 的生子事件”,则可以依据“某人物A相关的生子事件”对“人物A”的“子 女数量”属性进行更新,例如,“人物A”的“子女数量”属性的属性值为N,N为自然数;则在已上屏内容为“人物A有”或“人物B有”的情况下, 可以提供“N个孩子”的候选结果,其中,“人物A”与“人物B”之间的 关系为夫妻关系。
参照图1,示出了本发明实施例的一种输入过程中已上屏内容的处理方 法的应用环境的示意图,该方法可以应用于输入场景,其中,终端101和知 识图谱服务端102位于有线或无线网络中,通过该有线或无线网络,终端101 和知识图谱服务端102进行数据交互。
终端101可以监测用户的已上屏内容,并向知识图谱服务端102发送该 已上屏内容。
知识图谱服务端102可以针对该已上屏内容,基于知识图谱得到该已上 屏内容对应的候选结果,并向终端101提供候选结果。
终端101可以对上述候选结果进行展示,并将用户选择的候选结果上屏, 以实现已上屏内容的更新。例如,已上屏内容为“人物A有”或“人物B 有”,提供的候选结果可以包括:“3个孩子”、“2任妻子”等。又如,已上 屏内容为“清朝的建立时间是”,提供的候选结果可以包括:“1368年”等。 再如,已上屏内容为“故宫门票是”,提供的候选结果可以包括:“旺季60 元一张”、“淡季40元一张”等。
上述终端可以包括:智能手机、平板电脑、电子书阅读器、MP3(动态 影像专家压缩标准音频层面3,Moving Picture Experts Group Audio Layer III) 播放器、MP4(动态影像专家压缩标准音频层面4,Moving Picture Experts Group Audio Layer IV)播放器、膝上型便携计算机、车载电脑、台式计算机、 机顶盒、智能电视机、可穿戴设备、智能音响等等。可以理解,本发明实施 例对于具体的终端不加以限制。
需要说明的是,图1中,终端101与知识图谱服务端102直接进行数据 交互只是作为可选实施例,实际上,两者可以通过输入法服务端中转的方式 进行数据交互。具体地,终端101向输入法服务端发送已上屏内容,输入法 服务端向知识图谱服务端发送已上屏内容;以及,知识图谱服务端103向输 入法服务端发送候选结果,输入法服务端向终端101发送候选结果等。
方法实施例一
参照图2,示出了本发明的一种输入过程中已上屏内容的处理方法实施 例一的步骤流程图,该方法具体可以包括如下步骤:
步骤201、监测用户的已上屏内容;
步骤202、向知识图谱服务端发送上述已上屏内容;
步骤203、接收上述知识图谱服务端针对上述已上屏内容返回的候选结 果;上述候选结果可以为依据知识图谱得到;
步骤204、对上述候选结果进行展示。
步骤201中,在用户的输入过程中,输入法程序可以提供输入串对应的 候选项,供用户选择。上述候选项可以源自输入法程序的词库,如系统词库、 用户词库、多元关系词库等。如输入串“qingchaodejianlishijs”对应的候选项 包括:“清朝的建立时间是”、“清朝的建立实际是”等。并且,输入法程序 可以将用户选择的候选项,作为已上屏内容进行记录。
在用户的输入过程中,输入法程序可以提供基于知识图谱得到的候选结 果,供用户选择。输入法程序可以将用户选择的候选结果,作为已上屏内容 进行记录。
在本发明的一种可选实施例中,已上屏内容可以包括:剪贴内容。剪贴 内容可以指用户通过剪切、复制、粘贴等剪贴操作选定的内容。
本发明实施例中,可以通过监测输入装置的触发事件,监测用户的剪 贴操作,输入装置可以包括:键盘、鼠标或触摸屏等。或者,可以通过监 测剪贴板的信息,监测用户的剪贴操作。例如,在监测到剪贴板的信息发 生变化的情况下,认为监测到了用户的剪贴操作。
剪贴板是内存中的一块区域,是预置的程序中的一个插件,通过剪贴 板,用户可以通过剪切、复制、粘贴等动作将选定的信息在各种应用程序 之间进行传递和共享。剪贴板通过利用终端的内部资源存储器,或虚拟内 存来临时保存剪切或复制的信息。
在本发明的另一种可选实施例中,已上屏内容可以包括:通信对端发送 的内容。在通信场景下,通信本端可以与通信对端进行数据交互,因此,已 上屏内容可以包括:通信对端发送的内容。例如,用户A与用户B进行通 信,对于用户A而言,其对应的已上屏内容可以包括:用户B发送的内容。
本发明实施例中,可以按照时间从先到后的顺序,对用户的已上屏内容 进行记录和监测。
步骤202中,若监测到新的已上屏内容,可以向知识图谱服务端发送新 的已上屏内容。或者,可以对已上屏内容进行记录,若记录的已上屏内容的 字符长度超过阈值,则可以向知识图谱服务端发送记录的已上屏内容,阈值 可以为3、4等数值,也即,若记录的已上屏内容的字符长度超过3,则向知 识图谱服务端发送记录的已上屏内容,并对记录区域进行清空,以通过记录 区域记录新的已上屏内容。当然,本发明实施例对于向知识图谱服务端发送 上述已上屏内容的具体过程不加以限制。
步骤203中,接收上述知识图谱服务端针对上述已上屏内容返回的候选 结果;上述候选结果可以为依据知识图谱得到,由于知识图谱具有数据准确 度高、覆盖率高、时效性高、知识更新速度快和解析能力强的优点,因此, 本发明实施例能够提高候选结果的提供效率和候选结果的质量。
本发明实施例中,候选结果可以为一个,或者,候选结果可以为多个。
在本发明的一种可选实施例中,所述候选结果的字符长度可以不超过长 度阈值。长度阈值可以根据实际应用需求确定,例如,长度阈值可以为8等。 通常用户希望输入一个句子,而本发明实施例可以依据用户输入的句子的一 个部分,给出句子的另一部分,由于该候选结果表征句子的一部分,故本发 明实施例中候选结果的字符长度可以不超过长度阈值,以实现候选结果的补 充已上屏内容的作用。
在本发明的一种可选实施例中,所述方法还可以包括:
向所述知识图谱服务端发送用户选择的目标候选结果;或者
若用户未选择所述候选结果、且输入所述已上屏内容对应的下文,则向 所述知识图谱服务端发送所述下文。
向所述知识图谱服务端发送用户选择的目标候选结果,可以使知识图谱 服务端对该目标候选结果对应的数据进行处理,提升知识图谱的数据准确 度。例如,可以增加该候选结果对应实体字段的权重。例如,已上屏内容“XXX 老婆的血型是”对应的目标候选结果为“O型”,假设“XXX老婆”为“人 物C”,则可以增加“人物C”对应属性“血型”的属性值“O型”的权重。
若用户未选择所述候选结果、且输入所述已上屏内容对应的下文,则向 所述知识图谱服务端发送所述下文。此种情况下,说明提供的候选结果不符 合用户的输入意图,则可以依据用户输入的下文,对知识图谱进行纠错。例 如,已上屏内容“XXX老婆的血型是”对应的候选结果为“A型”,用户未 选择该候选结果,且输入了下文“O型”,因此,可以依据下文对“人物C” 对应属性“血型”的属性值进行纠错。又如,已上屏内容“人物D的老婆是” 对应的候选结果为“人物E”,用户未选择该候选结果,且输入了下文“人 物F”,因此,可以依据下文对“人物D”对应属性“老婆”的属性值进行纠 错。
本发明实施例中,可选的是,可以依据用户选择的目标候选结果,对输 入法程序的词库进行更新。例如,可以依据已上屏内容和目标候选结果,对 二元关系词库进行更新。例如,可以保存已上屏内容和目标候选结果之间的 二元关系。
综上,本发明实施例的输入过程中已上屏内容的处理方法,在输入过程 中针对实时监测得到的已上屏内容,提供基于知识图谱的候选结果。由于知 识图谱具有数据准确度高、覆盖率高、时效性高、知识更新速度快和解析能 力强的优点,因此,本发明实施例能够提高候选结果的提供效率和候选结果 的质量,进而能够提高用户的输入效率。
并且,本发明实施例的候选结果所依据的知识图谱具有时效性高和知识 更新速度快的优点,因此能够提高候选结果的时效性和准确率。例如,本发 明实施例能够依据事件对知识图谱进行快速更新,这样可以提高候选结果的 时效性和准确率。例如,事件为“人物A相关的生子事件”,则可以依据“某 人物A相关的生子事件”对“人物A”的“子女数量”属性进行更新,例如, “人物A”的“子女数量”属性的属性值为N;则在已上屏内容为“人物A有”或“人物B有”的情况下,可以提供“N个孩子”的候选结果,其中, “人物A”与“人物B”之间的关系为夫妻关系。
传统技术可以针对已上屏内容提供信息的链接,该链接可以指向对应的 信息,若接收到用户针对该链接的触发操作,则可以展示该链接指向的信息。 而本发明实施例可以直接在输入法程序的候选区域展示已上屏内容对应的 知识信息,该知识信息可由知识图谱服务端提供,因此可以节省用户的触发 操作。
方法实施例二
参照图3,示出了本发明的一种输入过程中已上屏内容的处理方法实施 例二的步骤流程图,该方法应用于知识图谱服务端,具体可以包括如下步 骤:
步骤301、接收用户的已上屏内容;
步骤302、将上述已上屏内容转换为查询任务;
步骤303、在知识图谱中执行上述查询任务,以得到上述查询任务对应 的执行结果;
步骤304、依据上述执行结果,得到上述已上屏内容对应的候选结果;
步骤305、发送上述候选结果。
本发明实施例将已上屏内容转换为查询任务,在知识图谱中执行上述查 询任务,以得到上述查询任务对应的执行结果,并依据上述执行结果,得到 上述已上屏内容对应的候选结果。本发明实施例可以利用自然语言理解方 法,将已上屏内容转换为查询任务,以实现已上屏内容的意图理解。
在本发明的一种可选实施例中,上述将上述已上屏内容转换为查询任 务,具体可以包括:从上述已上屏内容中识别出实体词、以及上述实体词对 应的附属词;对上述实体词和上述附属词与查询模板对应的标签词进行匹 配;依据匹配成功的查询模板,得到上述已上屏内容对应的查询任务。
本发明实施例可以采用NER(命名实体识别,Named Entity Recognition)方法,从上述已上屏内容中识别出实体词。
根据一种实施例,NER方法可以包括:基于词库的方法。基于词库的方 法可以根据词组出现的频率对高频词构建实体库,对于可以在实体库中检 索到的词直接将其识别为实体。其中,词组可以指两个或更多词的组合。在 实际应用中,可以从互联网抓取实体相关数据,并对实体相关数据进行分析, 以得到对应的实体词,并将该实体词存储至实体库,本发明实施例对于具体 的实体词及其获取方式不加以限制。
根据另一种实施例,NER方法可以包括:基于规则的方法。基于规则的 方法可以根据词组的组成规则,将请求中满足相应规则的词组标注为实 体。
根据再一种实施例,NER方法可以包括:基于统计学习的方法。基于统 计学习的方法将命名实体识别看作一个分类问题,采用类似SVM(支持向 量机,Support VectorMachine)、贝叶斯等分类方法;或者,将命名实体识别 看作一个序列标注问题,采用HMM(隐马尔科夫模型,Hidden Markov Model)、最大熵模型(Maximum Entropy Model)、CRF(条件随机场, conditional random field algorithm)、LSTM(长短期记忆网络,Long Short-Term Memory)模型等序列标注模型。
以已上屏内容“清朝的建立时间是”为例,可以从中识别出实体词“清 朝”。以已上屏内容“XXX老婆的血型是”为例,可以从中识别出实体词 “XXX”。
本发明实施例中,上述附属词可以包括:属性词和/或指示词。
属性词,也称“非谓形容词”、“区别词”。属性词通常表示人、事物的 属性或特征,具有区别或分类的作用。属性词一般能做定语,如‘男学生、 大型歌剧、野生动词、首要的任务’中的‘男、大型、野生、首要’,少数 还能做状语,如‘自动控制、定期检查’中的‘自动、定期’”。
本发明实施例中,可选的是,可以利用上下文关系或预设的语义模板中 的一种或组合,确定实体词对应的属性词。
其中,可以依据上下文关系,将与实体词的属性关系概率达到预设属性 概率阈值的词语作为该实体词的属性词,其中各词语之间的属性关系概率可 以基于预先的统计得到。例如:“人物X的出生日期”中,“出生日期”与作 为人名的实体词“人物X”之间的属性关系概率达到90%,如果预设属性概 率阈值为60%,则可以确定“出生日期”为实体词“人物X”的属性词。
也可以预先定义具有属性关系的语义模板,利用该预先定义的语义模板 识别实体词对应的属性词,语义模板中可以包含实体词与属性词构成的句式 结构。
例如,在语义模板中预先建立偏正结构的识别方式,将两个名词构成的 偏正结构中的中心词识别为属性词,该中心词的修饰词识别为实体词。诸如, “人物X的出生日期”中“人物X”首先被识别出为命名实体(人名),利用 语义模板识别出“出生日期”作为实体词“刘德华”的属性词;“中国的首 都是北京”中“中国”被识别出命名实体(国家名),“首都”作为实体词“中 国”的属性词,“北京”是对应的属性值。再如,对于“人物Y毕业于”,可 以利用语义模板识别出“毕业院校”作为实体词“人物Y”的属性词。
也可以在语义模板中预先建立基于距离的识别形式,将实体词之后距离 最近的名词识别为该实体词的属性词,诸如在页面中存在这样一个句子“人 物X演唱了歌曲X”,在进行分词和词性标注后,将实体词“人物X”之后 距离最近的名词“歌曲X”作为该实体词的属性词。
指示词可以具有指示作用。指示词可以包括:“是”、“为”、“指”等。
查询模板中可以包括:标签词及标签词之间的顺序,标签词可以包括: 实体词和附属词。
本发明实施例对上述实体词和上述附属词与查询模板对应的标签词进 行匹配,可以将匹配成功的查询模板作为与已上屏内容相匹配的查询模板, 可以记为目标查询模板。
在本发明的一种实施例中,查询模板A对应的标签词序列可以为:
<实体名称><属性词><指示词>。
则已上屏内容“XXX老婆是”、“清朝的建立时间是”、“故宫门票是”、 “XXX毕业于”可以命中查询模板A。
本发明实施例可以针对查询模板预置对应的查询任务。例如,查询模板 A对应的查询任务可以为:
select<属性>where实体名称=<实体名称>and实体类型=<X>,实体类 型X可以表征人名、机构名、地名等,还可以对人名进行进一步划分为:明 星名、作家名、歌手名等。
在本发明的另一种实施例中,查询模板B对应的标签词序列可以为:
<实体名称><属性词><属性词><指示词>。
则上屏内容“XXX老婆的血型是”可以命中查询模板B。
本发明实施例可以针对查询模板预置对应的查询任务。例如,查询模板 B对应的查询任务可以为:
select血型from(select妻子where实体名称=XXX and实体类型=明 星名或人名)。
需要说明的是,一个查询模板可以对应一个或多个查询任务,例如,查 询模板中的实体类型可以为“人名”这样的粗略类型,还可以为“明星名” 这样的精细类型。
需要说明的是,上面的查询任务采用SQL(结构化查询语言,Structured QueryLanguage)语言描述,其中,from用于嵌套的情况,where是用于指定 查询条件。可以理解,本发明实施例对于查询任务所采用的具体语言不加以 限制,例如,除了采用SQL语言之外,还可以采用GQL(图形查询语言,Graph Query Language)等。
在执行查询任务的过程中,可以首先执行from内层的子查询任务,然 后执行from外层的子查询任务。
在本发明的一种应用示例中,假设知识图谱的三元组包括:
(E0001、实体名称、汪峰)
(E0001、实体类型、明星)
(E0001、实体类型、人物)
(E0001、毕业院校、中央音乐学院)
(E0001、妻子、E0002)
(E0002、实体名称、章子怡)
(E0002、毕业院校、中央戏剧学院)
(E0002、血型、O型)
则对于查询任务select血型from(select妻子where实体名称=汪峰 and实体类型=明星名),在其执行过程中,可以首先执行from内层的子查询 任务,在前面的三元组中可以得到“E0002”的结果;接着再执行from外层的 子查询任务“select血型from(E0002)”,就能够得到“章子怡”这个实体名的 血型数据为“O型”了。
除了from对应的递归嵌套类型的查询任务,本发明实施例的查询任务 还可以包括:实体属性比较类型的查询任务、属性范围限定类型的查询任务、 实体属性共性类型的查询任务等。
在本发明的另一种实施例中,查询模板C对应的标签词序列可以为:
<实体名称>and<实体名称><指示词>。
则已上屏内容“人物A和人物B都是”可以命中查询模板C。
查询模板C对应的查询任务可以为实体属性共性类型的查询任务,具 体:
(select*where实体名称=人物A and实体类型=人名)join
(select*where实体名称=人物B and实体类型=人名)
“join”表示取交集。
在本发明的再一种实施例中,查询模板D对应的标签词序列可以为:
<属性词><实体名称>。
则已上屏内容“O型血的明星”、“O型血的明星里面我最喜欢”等,可以 命中查询模板D。
查询模板D对应的查询任务可以为属性范围限定类型的查询任务,具 体:
“select实体名称from(select实体ID where血型=O型and实体类型 =明星名)”这样的查询任务。在用户的已上屏内容为“O型血的明星里面我最 喜欢”的情况下,输入法程序就可以提供“O型血的明星”的列表,供用户选 择,以实现信息的快速输入。
在本发明的又一种实施例中,查询模板E对应的标签词序列可以为:
<实体名称><属性词><形容词>。
则已上屏内容“演员中演技最好的”、“大陆演员中演技最好的”、“港台 演员中演技最好的”、“好莱坞演员中演技最好的”等,可以命中查询模板E。
查询模板E对应的查询任务可以为实体属性比较类型的查询任务,具 体:
“select实体名称from(select实体ID where实体类型=演员and所 属地区=Rorder by演技得分desc)”,则可以表达“R区域的演员中演技最好 的”的意图,演技得分desc可由本领域技术人员根据实际应用需求确定,例 如,演技得分的最大值为5,则演技得分desc可以在4~5之间。
需要说明的是,上述对上述实体词和上述附属词与查询模板对应的标签 词进行匹配;依据匹配成功的查询模板,得到上述已上屏内容对应的查询任 务,只是作为可选实施例,实际上本领域技术人员可以根据实际应用需求, 采用查询任务的其他获取方案。例如,在查询任务的其他获取方案中,可以 对已上屏内容进行意图识别,并依据识别得到的意图得到查询任务。
意图可以指已上屏内容所表达的用户意图。例如已上屏内容“人物X的 男友是谁”对应的已上屏内容意图可以为“人物的男友属性查询”意图;又 如已上屏内容“疯狂魔方的品牌是”对应的已上屏内容意图可以为“品牌查 询”意图;或者已上屏内容“人物A有”对应的已上屏内容意图可以为“人 物的属性查询”意图,等等。
在本发明的一种可选实施例中,可以通过领域识别模块以及领域意图识 别模块,对已上屏内容进行意图识别。
其中,领域识别模块可用于识别已上屏内容所属的领域;领域的例子可 以包括:“奥运体育”、“地域问题”、“电脑数码”、“法律法规”、“健康生活”、 “教育科学”、“经济金融”、“情感家庭”、“社会民生”、“休闲娱乐”、“医疗 卫生”、“艺术文字”、“游戏”等,当然本发明实施例对于具体的领域不加以 限制。
领域意图识别模块可用于在领域内识别已上屏内容对应的意图。根据一 种实施例,意图识别可以看作是一个多分类任务,故领域意图识别模块可以 通过分类器,在领域内识别已上屏内容对应的意图,其中,可以依据多个意 图得到分类器的分类任务(一个已上屏内容意图可以对应一个分类任务), 并依据多个意图对应的语料得到的分类器的训练样本,例如,训练样本可以 为语料及标注好的意图类别,在此基础上对训练样本进行训练以得到分类 器。
上述依据识别得到的意图得到查询任务,具体可以包括:确定意图对应 的标签词,并依据意图对应的标签词,生成查询任务。
标签词可以包括:实体词和附属词。例如,“人物的男友属性查询”意 图对应的标签词可以包括:<实体词人物>和<男友属性>等。
本发明实施例中,并不是所有的已上屏内容可以用于知识图谱的查询, 换言之,不一定针对所有的已上屏内容确定对应的查询任务。本发明实施例 可以从实时性和连续性的已上屏内容中,确定出能够应用于知识图谱的内容 片段,并针对该内容片段确定对应的查询任务、以及提供对应的候选结果。 因此,本发明实施例能够跟踪用户的已上屏内容,并将其中的内容片段用于 知识图谱的查询。
在本发明的一种可选实施例中,可以判断已上屏内容中是否包含实体 词,若否,则可以认为该已上屏内容不能用于知识图谱的查询。若已上屏内 容中包含实体词,则可以进一步判断已上屏内容能否用于知识图谱的查询。 例如,对已上屏内容中实体词和附属词与查询模板对应的标签词进行匹配, 若匹配成功,则已上屏内容能够用于知识图谱的查询,若匹配失败,则已上 屏内容不能用于知识图谱的查询。可以理解,本发明实施例对于判断已上屏 内容能否用于知识图谱的查询的具体判断过程不加以限制。
本发明实施例中,候选结果可以为一个或多个。
在本发明的一种可选实施例中,上述发送上述候选结果,具体可以包括: 依据排序特征,对上述候选结果进行排序;发送排序后的候选结果。
上述排序特征可以包括:查询任务的重要度信息、和/或、上述候选结果 对应实体词的重要度信息、和/或、所述候选结果对应的来源页面信息等。
查询任务的重要度信息表征查询任务的重要度,通常查询任务的重要度 越高,则对应候选结果的优先级越高。例如,查询任务1和查询任务2,查 询任务1的重要度高于查询任务2,则查询任务1对应候选结果的优先级高 于查询任务2对应候选结果的优先级。
可选地,可以依据查询任务对应实体类型的区分度,确定查询任务的重 要度信息。通常查询任务对应实体类型的区分度越大,则对应查询任务的重 要度越高。例如,实体类型“人名”和“明星名”,其中,“明星名”的区分 度高于“人名”。实体类型的区分度通常与实体类型的数据量成反比。
可以依据实体词对应数据源的权威性、和/或、实体词的热度等信息,确 定上述候选结果对应实体词的重要度信息。通常上述候选结果对应实体词的 重要度信息表征的重要度越高,则对应候选结果的优先级越高。
所述候选结果对应的来源页面,可以指候选结果对应知识的来源页面。 例如,“XXX老婆的血型是O型”来源于页面A,“XXX老婆的血型是A型” 来源于页面B,则可以依据页面A和页面B的权威性,对候选结果“O型” 和“A型”进行排序。通常来源页面的权威性越高,则对应候选结果的优先 级越高。
在本发明的一种可选实施例中,所述候选结果的字符长度可以不超过长 度阈值。长度阈值可以根据实际应用需求确定,例如,长度阈值可以为8等。 通常用户希望输入一个句子,而本发明实施例可以依据用户输入的句子的一 个部分,给出句子的另一部分,由于该候选结果表征句子的一部分,故本发 明实施例中候选结果的字符长度可以不超过长度阈值,以实现候选结果的补 充已上屏内容的作用。
因此,在本发明的一种可选实施例中,可以过滤掉字符长度超过长度阈 值候选结果。
在本发明的另一种可选实施例中,可以依据来源页面的权威性,对候选 结果进行过滤,例如,可以过滤掉权威值不超过权威阈值的来源页面对应的 候选结果。
本发明实施例中,可选的是,可以依据网页的入链数量,确定网页的权 威性。入链可以指指向某一网站或网页的超级链接。例如,网页A指向网页 B,则网页A中的链接为网页B的入链。通常入链数量越高,则网页的权威 性越高。当然,本发明实施例对于网页的权威性的具体确定过程不加以限制。
在本发明的一种可选实施例中,上述方法还可以包括:
接收用户选择的目标候选结果;
依据上述目标候选结果,对知识图谱进行更新。
依据上述目标候选结果,对知识图谱进行更新,能够提升知识图谱的数 据准确度。例如,可以增加该目标候选结果对应实体字段的权重。例如,已 上屏内容“XXX老婆的血型是”对应的目标候选结果为“O型”,假设“XXX 老婆”为“人物C”,则可以增加“人物C”对应属性“血型”的属性值“O 型”的权重。
在本发明的另一种可选实施例中,上述方法还可以包括:
接收上述已上屏内容对应的下文;上述下文为用户在未选择上述候选结 果情况下输入的内容;
依据上述下文,对知识图谱进行更新。
若用户未选择所述候选结果、且输入所述已上屏内容对应的下文,则向 所述知识图谱服务端发送所述下文。此种情况下,说明提供的候选结果不符 合用户的输入意图,则可以依据用户输入的下文,对知识图谱进行纠错。例 如,已上屏内容“XXX老婆的血型是”对应的候选结果为“A型”,用户未 选择该候选结果,且输入了下文“O型”,因此,可以依据下文对“人物C” 对应属性“血型”的属性值进行纠错。又如,已上屏内容“人物D的老婆是” 对应的候选结果为“人物E”,用户未选择该候选结果,且输入了下文“人 物F”,因此,可以依据下文对“人物D”对应属性“老婆”的属性值进行纠 错。
可选地,上述对知识图谱进行更新,具体可以包括:对上述已上屏内容 和上述上文与上述已上屏内容和上述候选结果进行准确度校验;依据校验结 果,对知识图谱进行更新。
假设上述已上屏内容和上述上文对应有第一知识,已上屏内容和候选结 果对应有第二知识,上述准确度可以校验第一知识和第二知识的准确度,若 第一知识的准确度高于第二知识的准确度,则可以依据第一知识,对知识库 进行更新。
其中,更新所涉及的三元组可以为(实体-属性-属性值)。例如,已上屏 内容“人物D的老婆是”对应的候选结果为“人物E”,用户未选择该候选 结果,且输入了下文“人物F”,因此,可以依据下文对“人物D”对应属性 “老婆”的属性值进行纠错。
更新所涉及的三元组可以为(实体1-关系-实体2)。例如,已上屏内容“人 物D的老婆是”对应的候选结果为“人物E”,用户未选择该候选结果,且 输入了下文“人物F”,因此,可以将与“人物D”具有“夫妻关系”的实体 更新为“人物F”,还可以删除(人物D-夫妻关系-人物E)。
可以理解,若第一知识的准确度低于第二知识的准确度,则可以不对知 识库进行更新。
综上,本发明实施例的输入过程中已上屏内容的处理方法,在输入过 程中针对实时监测得到的已上屏内容,提供基于知识图谱的候选结果。由于 知识图谱具有数据准确度高、覆盖率高、时效性高、知识更新速度快和解析 能力强的优点,因此,本发明实施例能够提高候选结果的提供效率和候选结 果的质量,进而能够提高用户的输入效率。
并且,本发明实施例的候选结果所依据的知识图谱具有时效性高和知识 更新速度快的优点,因此能够提高候选结果的时效性和准确率。例如,本发 明实施例能够依据事件对知识图谱进行快速更新,这样可以提高候选结果的 时效性和准确率。例如,事件为“人物A相关的生子事件”,则可以依据“某 人物A相关的生子事件”对“人物A”的“子女数量”属性进行更新,例如, “人物A”的“子女数量”属性的属性值为N;则在已上屏内容为“人物A有”或“人物B有”的情况下,可以提供“N个孩子”的候选结果,其中, “人物A”与“人物B”之间的关系为夫妻关系。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一 系列的运动动作组合,但是本领域技术人员应该知悉,本发明实施例并不 受所描述的运动动作顺序的限制,因为依据本发明实施例,某些步骤可以 采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书 中所描述的实施例均属于优选实施例,所涉及的运动动作并不一定是本发 明实施例所必须的。
装置实施例
参照图4,示出了本发明的一种输入过程中已上屏内容的处理装置实施 例的结构框图,具体可以包括:
监测模块401,用于监测用户的已上屏内容;
已上屏内容发送模块402,用于向知识图谱服务端发送上述已上屏内容;
接收模块403,用于接收上述知识图谱服务端针对上述已上屏内容返回 的候选结果;上述候选结果为依据知识图谱得到;以及
展示模块404,用于对上述候选结果进行展示。
可选地,上述装置还可以包括:
目标候选结果发送模块,用于向上述知识图谱服务端发送用户选择的目 标候选结果;或者
下文发送模块,用于若用户未选择上述候选结果、且输入上述已上屏内 容对应的下文,则向上述知识图谱服务端发送上述下文。
可选地,上述候选结果的字符长度不超过长度阈值。
参照图5,示出了本发明的一种输入过程中已上屏内容的处理装置实施 例的结构框图,具体可以包括:
已上屏内容接收模块501,用于接收用户的已上屏内容;
任务转换模块502,用于将上述已上屏内容转换为查询任务;
任务执行模块503,用于在知识图谱中执行上述查询任务,以得到上述 查询任务对应的执行结果;
候选结果确定模块504,用于依据上述执行结果,得到上述已上屏内容 对应的候选结果;
候选结果发送模块505,用于发送上述候选结果。
可选地,任务转换模块502可以包括:
识别模块,用于从上述已上屏内容中识别出实体词、以及上述实体词对 应的附属词;
匹配模块,用于对上述实体词和上述附属词与查询模板对应的标签词进 行匹配;
任务确定模块,用于依据匹配成功的查询模板,得到上述已上屏内容对 应的查询任务。
可选地,上述附属词可以包括:属性词和/或指示词。
可选地,上述候选结果发送模块可以包括:
排序模块,用于依据排序特征,对上述候选结果进行排序;上述排序特 征可以包括:查询任务的重要度信息、和/或、上述候选结果对应实体词的重 要度信息、和/或、上述候选结果对应的来源页面信息;
排序后发送模块,用于发送排序后的候选结果。
可选地,上述装置还可以包括:
目标候选结果接收模块,用于接收用户选择的目标候选结果;
第一更新模块,用于依据上述目标候选结果,对知识图谱进行更新。
可选地,上述装置还可以包括:
下文接收模块,用于接收上述已上屏内容对应的下文;上述下文为用户 在未选择上述候选结果情况下输入的内容;
第二更新模块,用于依据上述下文,对知识图谱进行更新。
可选地,上述更新模块可以包括:
准确度校验模块,用于对上述已上屏内容和上述上文与上述已上屏内容 和上述候选结果进行准确度校验;
校验后更新模块,用于依据校验结果,对知识图谱进行更新。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比 较简单,相关之处参见方法实施例的部分说明即可。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明 的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见 即可。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有 关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图6是根据一示例性实施例示出的一种用于处理已上屏内容的装置 1300的框图。例如,装置1300可以是移动电话,计算机,数字广播终端, 消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助 理等。
参照图6,装置1300可以包括以下一个或多个组件:处理组件1302, 存储器1304,电源组件1306,多媒体组件1308,音频组件1310,输入/输出 (I/O)的接口1312,传感器组件1314,以及通信组件1316。
处理组件1302通常控制装置1300的整体操作,诸如与显示,电话呼叫, 数据通信,相机操作和记录操作相关联的操作。处理元件1302可以包括一 个或多个处理器1320来执行指令,以完成上述的方法的全部或部分步骤。 此外,处理组件1302可以包括一个或多个模块,便于处理组件1302和其他 组件之间的交互。例如,处理组件1302可以包括多媒体模块,以方便多媒 体组件1308和处理组件1302之间的交互。
存储器1304被配置为存储各种类型的数据以支持在设备1300的操作。 这些数据的示例包括用于在装置1300上操作的任何应用程序或方法的指令, 联系人数据,电话簿数据,消息,图片,视频等。存储器1304可以由任何 类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存 储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只 读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM), 磁存储器,快闪存储器,磁盘或光盘。
电源组件1306为装置1300的各种组件提供电力。电源组件1306可以 包括电源管理系统,一个或多个电源,及其他与为装置1300生成、管理和 分配电力相关联的组件。
多媒体组件1308包括在所述装置1300和用户之间的提供一个输出接口 的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。 如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入 信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上 的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测 与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组 件1308包括一个前置摄像头和/或后置摄像头。当设备1300处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒 体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具 有焦距和光学变焦能力。
音频组件1310被配置为输出和/或输入音频信号。例如,音频组件1310 包括一个麦克风(MIC),当装置1300处于操作模式,如呼叫模式、记录模 式和语音数据处理模式时,麦克风被配置为接收外部音频信号。所接收的音 频信号可以被进一步存储在存储器1304或经由通信组件1316发送。在一些 实施例中,音频组件1310还包括一个扬声器,用于输出音频信号。
I/O接口1312为处理组件1302和外围接口模块之间提供接口,上述外 围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页 按钮、音量按钮、启动按钮和锁定按钮。
传感器组件1314包括一个或多个传感器,用于为装置1300提供各个方 面的状态评估。例如,传感器组件1314可以检测到设备1300的打开/关闭状 态,组件的相对定位,例如所述组件为装置1300的显示器和小键盘,传感 器组件1314还可以检测装置1300或装置1300一个组件的位置改变,用户 与装置1300接触的存在或不存在,装置1300方位或加速/减速和装置1300 的温度变化。传感器组件1314可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件1314还可以包括光传感 器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例 中,该传感器组件1314还可以包括加速度传感器,陀螺仪传感器,磁传感 器,压力传感器或温度传感器。
通信组件1316被配置为便于装置1300和其他设备之间有线或无线方式 的通信。装置1300可以接入基于通信标准的无线网络,如WiFi,2G或3G, 或它们的组合。在一个示例性实施例中,通信组件1316经由广播信道接收 来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例 中,所述通信组件1316还包括近场通信(NFC)模块,以促进短程通信。 例如,在NFC模块可基于射频数据处理(RFID)技术,红外数据协会(IrDA) 技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置1300可以被一个或多个应用专用集成电路 (ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻 辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理 器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储 介质,例如包括指令的存储器1304,上述指令可由装置1300的处理器1320 执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是 ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备 等。
一种非临时性计算机可读存储介质,当所述存储介质中的指令由智能 终端的处理器执行时,使得智能终端能够执行一种输入过程中已上屏内容 的处理方法,所述方法包括:监测用户的已上屏内容;向知识图谱服务端 发送所述已上屏内容;接收所述知识图谱服务端针对所述已上屏内容返回 的候选结果;所述候选结果为依据知识图谱得到;对所述候选结果进行展 示。
图7是本发明实施例中服务端的结构示意图。该服务端1900可因配置 或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器 (central processingunits,CPU)1922(例如,一个或一个以上处理器)和 存储器1932,一个或一个以上存储应用程序1942或数据1944的存储介质 1930(例如一个或一个以上海量存储设备)。其中,存储器1932和存储介质 1930可以是短暂存储或持久存储。存储在存储介质1930的程序可以包括一 个或一个以上模块(图示没标出),每个模块可以包括对服务端中的一系列 指令操作。更进一步地,中央处理器1922可以设置为与存储介质1930通信, 在服务端1900上执行存储介质1930中的一系列指令操作。
服务端1900还可以包括一个或一个以上电源1926,一个或一个以上有 线或无线网络接口1950,一个或一个以上输入输出接口1958,一个或一个 以上键盘1956,和/或,一个或一个以上操作系统1941,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本 发明的其它实施方案。本发明旨在涵盖本发明的任何变型、用途或者适应性 变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公 开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被 视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确 结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所 附的权利要求来限制
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明 的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发 明的保护范围之内。
本发明实施例公开了A1、一种输入过程中已上屏内容的处理方法,包 括:
监测用户的已上屏内容;
向知识图谱服务端发送所述已上屏内容;
接收所述知识图谱服务端针对所述已上屏内容返回的候选结果;所述候 选结果为依据知识图谱得到;
对所述候选结果进行展示。
A2、根据A1所述的方法,其特征在于,所述方法还包括:
向所述知识图谱服务端发送用户选择的目标候选结果;或者
若用户未选择所述候选结果、且输入所述已上屏内容对应的下文,则向 所述知识图谱服务端发送所述下文。
A3、根据A1所述的方法,其特征在于,所述候选结果的字符长度不超 过长度阈值。
本发明实施例公开了B4、一种输入过程中已上屏内容的处理方法,其 特征在于,所述方法包括:
接收用户的已上屏内容;
将所述已上屏内容转换为查询任务;
在知识图谱中执行所述查询任务,以得到所述查询任务对应的执行结 果;
依据所述执行结果,得到所述已上屏内容对应的候选结果;
发送所述候选结果。
B5、根据B4所述的方法,其特征在于,所述将所述已上屏内容转换为 查询任务,包括:
从所述已上屏内容中识别出实体词、以及所述实体词对应的附属词;
对所述实体词和所述附属词与查询模板对应的标签词进行匹配;
依据匹配成功的查询模板,得到所述已上屏内容对应的查询任务。
B6、根据B5所述的方法,其特征在于,所述附属词包括:属性词和/ 或指示词。
B7、根据B4所述的方法,其特征在于,所述发送所述候选结果,包括:
依据排序特征,对所述候选结果进行排序;所述排序特征包括:查询任 务的重要度信息、和/或、所述候选结果对应实体词的重要度信息、和/或、 所述候选结果对应的来源页面信息;
发送排序后的候选结果。
B8、根据B4所述的方法,其特征在于,所述方法还包括:
接收用户选择的目标候选结果;
依据所述目标候选结果,对知识图谱进行更新。
B9、根据B4所述的方法,其特征在于,所述方法还包括:
接收所述已上屏内容对应的下文;所述下文为用户在未选择所述候选结 果情况下输入的内容;
依据所述下文,对知识图谱进行更新。
B10、根据B9所述的方法,其特征在于,所述对知识图谱进行更新, 包括:
对所述已上屏内容和所述上文与所述已上屏内容和所述候选结果进行 准确度校验;
依据校验结果,对知识图谱进行更新。
本发明实施例公开了C11、一种输入过程中已上屏内容的处理装置,其 特征在于,所述装置包括:
监测模块,用于监测用户的已上屏内容;
已上屏内容发送模块,用于向知识图谱服务端发送所述已上屏内容;
接收模块,用于接收所述知识图谱服务端针对所述已上屏内容返回的候 选结果;所述候选结果为依据知识图谱得到;以及
展示模块,用于对所述候选结果进行展示。
C12、根据C11所述的装置,其特征在于,所述装置还包括:
目标候选结果发送模块,用于向所述知识图谱服务端发送用户选择的目 标候选结果;或者
下文发送模块,用于若用户未选择所述候选结果、且输入所述已上屏内 容对应的下文,则向所述知识图谱服务端发送所述下文。
C13、根据C11所述的装置,其特征在于,所述候选结果的字符长度不 超过长度阈值。
D14、一种输入过程中已上屏内容的处理装置,其特征在于,所述装置 包括:
已上屏内容接收模块,用于接收用户的已上屏内容;
任务转换模块,用于将所述已上屏内容转换为查询任务;
任务执行模块,用于在知识图谱中执行所述查询任务,以得到所述查询 任务对应的执行结果;
候选结果确定模块,用于依据所述执行结果,得到所述已上屏内容对应 的候选结果;
候选结果发送模块,用于发送所述候选结果。
D15、根据D14所述的装置,其特征在于,所述任务转换模块包括:
识别模块,用于从所述已上屏内容中识别出实体词、以及所述实体词对 应的附属词;
匹配模块,用于对所述实体词和所述附属词与查询模板对应的标签词进 行匹配;
任务确定模块,用于依据匹配成功的查询模板,得到所述已上屏内容对 应的查询任务。
D16、根据D15所述的装置,其特征在于,所述附属词包括:属性词和 /或指示词。
D17、根据D14所述的装置,其特征在于,所述候选结果发送模块包括:
排序模块,用于依据排序特征,对所述候选结果进行排序;所述排序特 征包括:查询任务的重要度信息、和/或、所述候选结果对应实体词的重要度 信息、和/或、所述候选结果对应的来源页面信息;
排序后发送模块,用于发送排序后的候选结果。
D18、根据D14所述的装置,其特征在于,所述装置还包括:
目标候选结果接收模块,用于接收用户选择的目标候选结果;
第一更新模块,用于依据所述目标候选结果,对知识图谱进行更新。
D19、根据D14所述的装置,其特征在于,所述装置还包括:
下文接收模块,用于接收所述已上屏内容对应的下文;所述下文为用户 在未选择所述候选结果情况下输入的内容;
第二更新模块,用于依据所述下文,对知识图谱进行更新。
D20、根据D19所述的装置,其特征在于,所述更新模块包括:
准确度校验模块,用于对所述已上屏内容和所述上文与所述已上屏内容 和所述候选结果进行准确度校验;
校验后更新模块,用于依据校验结果,对知识图谱进行更新。
本发明实施例公开了E21、一种用于处理已上屏内容的装置,其特征在 于,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上 程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个 或者一个以上程序包含用于进行以下操作的指令:
监测用户的已上屏内容;
向知识图谱服务端发送所述已上屏内容;
接收所述知识图谱服务端针对所述已上屏内容返回的候选结果;所述候 选结果为依据知识图谱得到;
对所述候选结果进行展示。
E22、根据E21所述的装置,其特征在于,所述装置还经配置以由一个 或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操 作的指令:
向所述知识图谱服务端发送用户选择的目标候选结果;或者
若用户未选择所述候选结果、且输入所述已上屏内容对应的下文,则向 所述知识图谱服务端发送所述下文。
E23、根据E21所述的装置,其特征在于,所述候选结果的字符长度不 超过长度阈值。
本发明实施例公开了F24、一种输入过程中已上屏内容的处理装置,其 特征在于,所述装置包括:
接收用户的已上屏内容;
将所述已上屏内容转换为查询任务;
在知识图谱中执行所述查询任务,以得到所述查询任务对应的执行结 果;
依据所述执行结果,得到所述已上屏内容对应的候选结果;
发送所述候选结果。
F25、根据F24所述的装置,其特征在于,所述将所述已上屏内容转换 为查询任务,包括:
从所述已上屏内容中识别出实体词、以及所述实体词对应的附属词;
对所述实体词和所述附属词与查询模板对应的标签词进行匹配;
依据匹配成功的查询模板,得到所述已上屏内容对应的查询任务。
F26、根据F25所述的装置,其特征在于,所述附属词包括:属性词和/ 或指示词。
F27、根据F24所述的装置,其特征在于,所述发送所述候选结果,包 括:
依据排序特征,对所述候选结果进行排序;所述排序特征包括:查询任 务的重要度信息、和/或、所述候选结果对应实体词的重要度信息、和/或、 所述候选结果对应的来源页面信息;
发送排序后的候选结果。
F28、根据F24所述的装置,其特征在于,所述装置还经配置以由一个 或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操 作的指令:
接收用户选择的目标候选结果;
依据所述目标候选结果,对知识图谱进行更新。
F29、根据F24所述的装置,其特征在于,所述装置还经配置以由一个 或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操 作的指令:
接收所述已上屏内容对应的下文;所述下文为用户在未选择所述候选结 果情况下输入的内容;
依据所述下文,对知识图谱进行更新。
F30、根据F29所述的装置,其特征在于,所述对知识图谱进行更新, 包括:
对所述已上屏内容和所述上文与所述已上屏内容和所述候选结果进行 准确度校验;
依据校验结果,对知识图谱进行更新。
本发明实施例公开了G31、一个或多个机器可读介质,其特征在于, 其上存储有指令,当由一个或多个处理器执行时,使得装置执行如A1至 A3中一个或多个所述的方法。
本发明实施例公开了H32、一个或多个机器可读介质,其特征在于, 其上存储有指令,当由一个或多个处理器执行时,使得装置执行如B4至 B10中一个或多个所述的方法。
以上对本发明所提供的一种输入过程中已上屏内容的处理方法、一种 输入过程中已上屏内容的处理装置和一种用于处理已上屏内容的装置,进 行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了 阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想; 同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式 及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种输入过程中已上屏内容的处理方法,其特征在于,所述方法包括:
监测用户的已上屏内容;
向知识图谱服务端发送所述已上屏内容;
接收所述知识图谱服务端针对所述已上屏内容返回的候选结果;所述候选结果为依据知识图谱得到;
对所述候选结果进行展示。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
向所述知识图谱服务端发送用户选择的目标候选结果;或者
若用户未选择所述候选结果、且输入所述已上屏内容对应的下文,则向所述知识图谱服务端发送所述下文。
3.根据权利要求1所述的方法,其特征在于,所述候选结果的字符长度不超过长度阈值。
4.一种输入过程中已上屏内容的处理方法,其特征在于,所述方法包括:
接收用户的已上屏内容;
将所述已上屏内容转换为查询任务;
在知识图谱中执行所述查询任务,以得到所述查询任务对应的执行结果;
依据所述执行结果,得到所述已上屏内容对应的候选结果;
发送所述候选结果。
5.一种输入过程中已上屏内容的处理装置,其特征在于,所述装置包括:
监测模块,用于监测用户的已上屏内容;
已上屏内容发送模块,用于向知识图谱服务端发送所述已上屏内容;
接收模块,用于接收所述知识图谱服务端针对所述已上屏内容返回的候选结果;所述候选结果为依据知识图谱得到;以及
展示模块,用于对所述候选结果进行展示。
6.一种输入过程中已上屏内容的处理装置,其特征在于,所述装置包括:
已上屏内容接收模块,用于接收用户的已上屏内容;
任务转换模块,用于将所述已上屏内容转换为查询任务;
任务执行模块,用于在知识图谱中执行所述查询任务,以得到所述查询任务对应的执行结果;
候选结果确定模块,用于依据所述执行结果,得到所述已上屏内容对应的候选结果;
候选结果发送模块,用于发送所述候选结果。
7.一种用于处理已上屏内容的装置,其特征在于,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
监测用户的已上屏内容;
向知识图谱服务端发送所述已上屏内容;
接收所述知识图谱服务端针对所述已上屏内容返回的候选结果;所述候选结果为依据知识图谱得到;
对所述候选结果进行展示。
8.一种输入过程中已上屏内容的处理装置,其特征在于,所述装置包括:
接收用户的已上屏内容;
将所述已上屏内容转换为查询任务;
在知识图谱中执行所述查询任务,以得到所述查询任务对应的执行结果;
依据所述执行结果,得到所述已上屏内容对应的候选结果;
发送所述候选结果。
9.一个或多个机器可读介质,其特征在于,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如权利要求1至3中一个或多个所述的方法。
10.一个或多个机器可读介质,其特征在于,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如权利要求4所述的方法。
CN202010148957.6A 2020-03-05 2020-03-05 输入过程中已上屏内容的处理方法、装置和介质 Pending CN113359997A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010148957.6A CN113359997A (zh) 2020-03-05 2020-03-05 输入过程中已上屏内容的处理方法、装置和介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010148957.6A CN113359997A (zh) 2020-03-05 2020-03-05 输入过程中已上屏内容的处理方法、装置和介质

Publications (1)

Publication Number Publication Date
CN113359997A true CN113359997A (zh) 2021-09-07

Family

ID=77523885

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010148957.6A Pending CN113359997A (zh) 2020-03-05 2020-03-05 输入过程中已上屏内容的处理方法、装置和介质

Country Status (1)

Country Link
CN (1) CN113359997A (zh)

Similar Documents

Publication Publication Date Title
CN109844708B (zh) 通过聊天机器人推荐媒体内容
US20180285700A1 (en) Training Image-Recognition Systems Using a Joint Embedding Model on Online Social Networks
US11394675B2 (en) Method and device for commenting on multimedia resource
US20170154104A1 (en) Real-time recommendation of reference documents
US20090249198A1 (en) Techniques for input recogniton and completion
CN109582869B (zh) 一种数据处理方法、装置和用于数据处理的装置
CN110232137B (zh) 一种数据处理方法、装置和电子设备
CN108345612B (zh) 一种问题处理方法和装置、一种用于问题处理的装置
CN111708943B (zh) 一种搜索结果展示方法、装置和用于搜索结果展示的装置
Crestani et al. Mobile information retrieval
CN109101505B (zh) 一种推荐方法、推荐装置和用于推荐的装置
WO2021017238A1 (zh) 一种文本生成方法和装置
CN111538830B (zh) 法条检索方法、装置、计算机设备及存储介质
CN113705210A (zh) 一种文章大纲生成方法、装置和用于生成文章大纲的装置
CN107424612B (zh) 处理方法、装置和机器可读介质
CN110110204A (zh) 一种信息推荐方法、装置和用于信息推荐的装置
CN110033338B (zh) 推荐方法和装置、用于推荐的装置
CN110929122B (zh) 一种数据处理方法、装置和用于数据处理的装置
EP3306555A1 (en) Diversifying media search results on online social networks
CN113359997A (zh) 输入过程中已上屏内容的处理方法、装置和介质
CN114218930A (zh) 一种标题生成方法、装置和用于标题生成的装置
CN110362686B (zh) 一种词库的生成方法、装置、终端设备和服务器
KR102130145B1 (ko) 예약어 및 속성 언어 간의 연관도를 이용한 정보 제공 방법 및 장치
CN112214692A (zh) 基于输入法的数据处理方法、装置和机器可读介质
CN113010768B (zh) 一种数据处理方法、装置和用于数据处理的装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination