CN105677709A - 一种信息处理方法和装置、一种用于信息处理的装置 - Google Patents

一种信息处理方法和装置、一种用于信息处理的装置 Download PDF

Info

Publication number
CN105677709A
CN105677709A CN201511001089.4A CN201511001089A CN105677709A CN 105677709 A CN105677709 A CN 105677709A CN 201511001089 A CN201511001089 A CN 201511001089A CN 105677709 A CN105677709 A CN 105677709A
Authority
CN
China
Prior art keywords
character
target entity
entry
string
entity entry
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201511001089.4A
Other languages
English (en)
Inventor
张欢
张坤
谢毓彬
李化
刘兵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sogou Technology Development Co Ltd
Original Assignee
Beijing Sogou Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sogou Technology Development Co Ltd filed Critical Beijing Sogou Technology Development Co Ltd
Priority to CN201511001089.4A priority Critical patent/CN105677709A/zh
Publication of CN105677709A publication Critical patent/CN105677709A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Abstract

本发明实施例提供了一种信息处理方法和装置、一种用于信息处理的装置,其中的方法具体包括:接收用户的查询串;当所述查询串中包括有用于标记空缺字符的预置字符串时,依据所述查询串在实体库中进行查询,以得到所述实体库中命中所述查询串中第一字符的目标实体词条;其中,所述第一字符为所述查询串中除所述预置字符串之外的字符;输出所述目标实体词条。采用本发明实施例,能够较好地契合用户的查询意图的目标实体词条,可以解决用户无法准确描述查询意图的问题。

Description

一种信息处理方法和装置、一种用于信息处理的装置
技术领域
本发明涉及互联网信息处理技术领域,特别是涉及一种信息处理方法、一种信息处理装置、及一种用于信息处理的装置。
背景技术
随着信息和网络技术的不断发展,人们越来越多地通过搜索引擎进行各种信息的搜索。搜索引擎是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供搜索服务,并将用户搜索相关的信息展示给用户的系统。
目前,用户可以在搜索引擎提供的搜索框中输入查询词,由搜索引擎查询得到与该查询词匹配的网页或文档,以作为搜索结果,并利用一定的排序策略,将经过排序的搜索结果返回给用户。
然而,用户在使用搜索引擎的过程中,有时会遇到无法准确描述查询意图的问题。此种情况下若将不符合查询意图的、欠准确的查询词提交至搜索引擎,将容易得到不准确的搜索结果,从而影响了用户的搜索效率。例如,用户欲要搜索某人名“马化腾”,但只知道该人名的前字“马”和后字“腾”,不知道该人名的中间字“化”。又如,用户欲要搜索某道菜名“红烧烤麸”,但不知道“麸”字的读音,无法输入该汉字。上述情况下,如果将“马腾”或者“红烧烤”提交至搜索引擎,则将使得搜索引擎给出较多的无效信息(无用的搜索结果),这些无效信息还会误导用户,使得用户挑选真正所需的搜索结果比较困难,因此增加了用户的搜索时间,影响了用户的搜索效率。
发明内容
鉴于上述问题,提出了本发明实施例以便提供一种克服上述问题或者至少部分地解决上述问题的信息处理方法、信息处理装置及用于信息处理的装置,可以得到能够较好地契合用户的查询意图的目标实体词条,因此可以解决用户无法准确描述查询意图的问题。
为了解决上述问题,本发明公开了一种信息处理方法,包括:
接收用户的查询串;
当所述查询串中包括有用于标记空缺字符的预置字符串时,依据所述查询串在实体库中进行查询,以得到所述实体库中命中所述查询串中第一字符的目标实体词条;其中,所述第一字符为所述查询串中除所述预置字符串之外的字符;
输出所述目标实体词条。
优选的,所述依据所述查询串在实体库中进行查询,以得到所述实体库中命中所述查询串中第一字符的目标实体词条的步骤,包括:
查找实体库,得到命中所述查询串中第一字符的目标实体词条;所述目标实体词条包括所述第一字符、且所述第一字符在所述查询串中的第一位置与所述第一字符在所述目标实体词条中的第二位置一致。
优选的,所述查找实体库,得到命中所述查询串中第一字符的目标实体词条的步骤,包括:
将所述查询串中包括的预置字符串作为空缺字符,以得到所述第一字符和所述空缺字符组合得到的匹配串;
按照字符位置,将所述匹配串中第一字符与所述实体库中实体词条对应的第二字符进行匹配,以得到所述匹配串对应的目标实体词条;其中,所述第二字符与所述第一字符相同且所述第二字符在所述目标实体词条中的位置与所述第一字符在所述查询串中的位置一致。
优选的,单次出现的预置字符串对应一个或者多个空缺字符。
优选的,所述输出所述目标实体词条的步骤,包括:
在搜索结果页,展示所述目标实体词条;和/或
在所述搜索结果页,展示与所述目标实体词条相关的网页链接;和/或
在所述搜索结果页,展示与热度最高的目标实体词条相关的网页链接和其他的目标实体词条;和/或
在所述搜索结果页,展示所述目标实体词条、以及与所述目标实体词条相关的推荐搜索词。
优选的,所述目标实体词条包括:第一目标实体词条和第二目标实体词条,则所述输出所述目标实体词条的步骤,包括:
客户端展示所述第一目标实体词条对应的实体信息,以及,客户端展示所述第二目标实体词条。
优选的,所述方法还包括:依据目标实体词条的热度,对多个目标实体词条进行排序;
则所述输出所述目标实体词条的步骤,包括:将排好序的多个目标实体词条输出。
优选的,所述目标实体词条的热度包括如下热度中的至少一种:目标实体词条在搜索程序中的第一搜索热度、及目标实体词条在百科网站中的第二搜索热度。
优选的,所述实体信息包括:所述第一目标实体词条对应实体的图片信息,和/或,所述第一目标实体词条对应实体的简介信息。
优选的,通过如下步骤建立所述实体库:
从百科网站抓取实体名称,并将所述实体名称作为实体词条保存至所述实体库;和/或
从垂直网站抓取领域数据,对所述领域数据进行分析,依据分析结果从所述领域数据中抽取关键词,并将所述关键词作为实体词条保存至所述实体库。
本发明还提供一种信息处理装置,包括:
接收模块,用于接收用户的查询串;
查询模块,用于当所述查询串中包括有用于标记空缺字符的预置字符串时,依据所述查询串在实体库中进行查询,以得到所述实体库中命中所述查询串中第一字符的目标实体词条;其中,所述第一字符为所述查询串中除所述预置字符串之外的字符;
输出模块,用于输出所述目标实体词条。
本发明还提供一种用于信息处理的装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
接收用户的查询串;
当所述查询串中包括有用于标记空缺字符的预置字符串时,依据所述查询串在实体库中进行查询,以得到所述实体库中命中所述查询串中第一字符的目标实体词条;其中,所述第一字符为所述查询串中除所述预置字符串之外的字符;
输出所述目标实体词条。
本发明实施例包括以下优点:
本发明实施例在查询串中包括有预置字符串时,依据所述查询串在实体库中进行查询,以得到所述实体库中命中所述查询串中第一字符的目标实体词条;其中,所述第一字符为所述查询串中除所述预置字符串之外的字符;由于上述预置字符串可用于标记空缺,故本发明实施例可以基于上述第一字符和上述实体库对上述预置字符串代表的空缺查询字符进行填充,以向用户提供填充后具有完整含义的查询串,从而可以解决用户无法准确描述查询意图的问题;
并且,由于上述实体库中可以存储有各领域内实体的实体词条,故得到的目标实体词条能够较好地契合用户的查询意图;这样,可以使得用户选择所需的目标实体词条进行搜索,从而能够提高用户的搜索效率。
附图说明
图1是本发明的一种信息处理方法的应用环境的结构示意图;
图2是本发明的一种信息处理方法实施例一的步骤流程图;
图3是本发明的一种信息处理方法实施例二的步骤流程图;
图4是本发明的一种展示目标实体词条的示意图;
图5是本发明的一种信息处理方法实施例三的步骤流程图;
图6是本发明的一种展示目标实体词条的示意图;
图7是本发明的一种信息处理方法实施例四的步骤流程图;
图8是本发明的一种信息处理装置实施例的结构图;
图9是本发明的一种用于信息处理的装置900的框图;及
图10是本发明的一种服务器的结构示意图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
针对用户无法准确描述查询意图的问题,本发明实施例可以允许用户在查询串中携带具有明确含义的第一字符和用于标记空缺的预置字符串,并基于上述第一字符对上述预置字符串代表的空缺查询字符进行填充,以向用户提供填充后具有完整含义的查询串。
并且,本发明实施例经研究发现,用户的查询意图经常与人名、地名、菜名、影视剧名、技术名称等各领域内实体有关,故为了提高对空缺查询字符的填充结果与用户的查询意图的契合度,本发明实施例可以依据上述查询串在实体库中进行查询,以得到实体库中命中所述查询串中第一字符的目标实体词条;由于上述实体库中可以存储有各领域内实体的实体词条,故得到的目标实体词条能够较好地契合用户的查询意图;这样,可以使得用户选择所需的目标实体词条进行搜索,从而能够提高用户的搜索效率。
在实际应用中,上述预置字符串可以为本领域技术人员或者用户根据实际应用需求预置的、用于标记空缺的任意字符串,如“什么”、“*”、“sm”、“x”、“%”、“#”等,也可以是用户随手输入的不代表任何含义的字符,如“(”、“>”等,可以理解,本发明实施例对于具体的预置字符串不加以限制。
在本发明的一种应用示例1中,用户A欲要搜索某人名“马化腾”,但只知道该人名的前字“马”和后字“腾”,不知道该人名的中间字“化”,故可以在搜索引擎的搜索框中输入查询串“马*腾”或“马什么腾”,其中“马”“腾”为具有明确含义的第一字符,“*”或“什么”为用于标记空缺的预置字符串。则本发明实施例可以基于前字“马”和后字“腾”对空缺查询字符进行填充,以得到命中前字“马”和后字“腾”、且“马”和“腾”之间具有字符的目标实体词条,例如,可以为“马化腾”、“马昌腾”、“马晓腾”、“马云腾”、“马奔腾”、“马雪腾”等。
在本发明的一种应用示例2中,用户B欲要搜索某道菜名“红烧烤麸”,但不知道“麸”字的读音,无法输入该汉字,故可以在搜索引擎的搜索框中输入查询串“红烧()”,其中“()”为用于标记空缺的预置字符串。则本发明实施例可以基于前两个字“红烧”对空缺查询字符“()”进行填充,以得到命中前两个字“红烧”的目标实体词条,例如可以包括:“红烧鱼”、“红烧鸡翅”、“红烧牛肉面”、“红烧菠萝”、“红烧烤麸”等。由此可见,对空缺查询字符进行填充时,可以但不限于一个字符,也可以为两个字符、三个字符等等。
本发明实施例可以应用于搜索引擎等具有搜索功能的网站或者应用程序中,或者,本发明实施例可以应用于具有输入框的任意应用程序中,当接收到用户在这些应用程序的输入框中输入的查询串时,这些应用程序均可以利用本发明实施例对上述查询串中的预置字符串进行填充,从而可以得到契合用户的查询意图的目标实体词条。
本发明实施例提供的信息处理方法可应用于图1所示的应用环境中,如图1所示,客户端100与服务器200位于有线或无线网络中,通过该有线或无线网络,客户端100与服务器200进行数据交互。
具体地,客户端100可以运行在信息设备上,上述信息设备具体包括但不限:智能手机、平板电脑、电子书阅读器、MP3(动态影像专家压缩标准音频层面3,MovingPictureExpertsGroupAudioLayerIII)播放器、MP4(动态影像专家压缩标准音频层面4,MovingPictureExpertsGroupAudioLayerIV)播放器、膝上型便携计算机、车载电脑、台式计算机、机顶盒、智能电视机、可穿戴设备等等;
客户端100可以在对应的UI(用户界面,UserInterface)上展示有输入框,以使用户通过该输入框进行查询串的输入;
服务器200可以建立并维护实体库,其中,该实体库中可以存储有各领域内实体的实体词条;具体地,服务器200可以从互联网抓取实体相关数据,并对实体相关数据进行分析,以得到对应的实体词条,并将该实体词条存储至实体库;
在本发明的一种可选实施例中,服务器200可以向客户端100定期下发实体库,则客户端100在用户的查询串中包括有预置字符串时,可以依据所述查询串在实体库中进行查询,以得到所述实体库中命中所述查询串中第一字符的目标实体词条,并向用户展示所述目标实体词条;其中,所述第一字符可以为所述查询串中除所述预置字符串之外的字符。
在本发明的另一种可选实施例中,客户端100在接收到用户的查询串后,可以将该查询串发送至服务器200,以使服务器200在用户的查询串中包括有预置字符串时,依据所述查询串在实体库中进行查询,以得到所述实体库中命中所述查询串中第一字符的目标实体词条,并向客户端100输出所述目标实体词条,以使客户端100向用户展示所述目标实体词条;其中,所述第一字符可以为所述查询串中除所述预置字符串之外的字符。
在本发明的再一种可选实施例中,服务器除了向客户端100输出所述目标实体词条外,还可以向客户端100输出所述查询串对应的搜索结果,以使客户端100在搜索结果页展示所述目标实体词条和所述查询串对应的搜索结果。
在本发明的又一种可选实施例中,所述目标实体词条的数目可以为多个,则在接收到用户针对其中一个目标实体词条的触发操作后,可以将该触发操作对应的目标实体词条作为当前查询串、继续依据当前查询串进行搜索、并输出对应的搜索结果。
可以理解,上述图1所示应用环境只是作为应用示例,本发明实施例中信息处理流程的目的之一在于,基于查询串中第一字符进行查询串对上述预置字符串代表的空缺查询字符进行填充,并向用户提供填充后具有完整含义的查询串,从而可以解决用户无法准确描述查询意图的问题,而对信息处理流程的具体执行主体和具体应用环境不加以限制。
方法实施例一
参照图2,示出了本发明的一种信息处理方法实施例一的步骤流程图,具体可以包括如下步骤:
步骤201、接收用户的查询串;
步骤202、当所述查询串中包括有用于标记空缺字符的预置字符串时,依据所述查询串在实体库中进行查询,以得到所述实体库中命中所述查询串中第一字符的目标实体词条;其中,所述第一字符可以为所述查询串中除所述预置字符串之外的字符;
在本发明实施例应用于客户端时,客户端可以通过输入框接收用户输入的查询串;在本发明实施例应用于服务器时,服务器可以接收客户端发送的查询串。
在接收到用户的查询串后,客户端或者服务器可以基于字符串的匹配获取预置字符串在所述查询串中的出现次数;若出现次数为0,则确定所述查询串中不包括预置字符串,若出现次数大于0,则确定所述查询串中包括有预置字符串,并且,还可以获取预置字符串在所述查询串中的出现位置。
本发明实施例中,实体库中命中所述查询串中第一字符的目标实体词条,具体可以包括:目标实体词条中包括第一字符、且第一字符在上述查询串中的第一位置与第一字符在目标实体词条中的第二位置一致,由此可以保证预置字符串的精确填充。例如,在上述应用示例1中,“马化腾”等目标实体词条包括第一字符“马”和“腾”、且第一字符“马”和“腾”在查询串“马*腾”中的第一位置与第一字符“马”和“腾”在“马化腾”等目标实体词条中的第二位置相同。又如,在上述应用示例2中,“红烧烤麸”等目标实体词条包括第一字符“红”和“烧”、且第一字符“红”和“烧”在查询串“红烧()”中的第一位置与第一字符“红”和“烧”在“红烧烤麸”等目标实体词条中的第二位置相同。
在本发明的一种可选实施例中,所述依据所述查询串在实体库中进行查询,以得到所述实体库中命中所述查询串中第一字符的目标实体词条的步骤,具体可以包括:查找实体库,得到命中所述查询串中第一字符的目标实体词条;所述目标实体词条具体可以包括所述第一字符、且所述第一字符在所述查询串中的第一位置与所述第一字符在所述目标实体词条中的第二位置一致。
在本发明的另一种可选实施例中,所述查找实体库,得到命中所述查询串中第一字符的目标实体词条的步骤,具体可以包括:
步骤S1、将所述查询串中包括的预置字符串作为空缺字符,以得到所述第一字符和所述空缺字符组合得到的匹配串;
步骤S2、按照字符位置,将所述匹配串中第一字符与所述实体库中实体词条对应的第二字符进行匹配,以得到所述匹配串对应的目标实体词条;其中,所述第二字符与所述第一字符相同且所述第二字符在所述目标实体词条中的位置与所述第一字符在所述查询串中的位置一致。
本可选实施例依据第一字符和预置字符串对应空缺字符组合得到匹配串,并按照字符位置对该匹配串与实体词条对应字符串进行匹配,以得到该匹配串对应的目标实体词条,由此可以得到包括第一字符、且第一字符在该匹配串中的第一位置与第二字符在目标实体词条中第二位置相同的目标实体词条。
在本发明实施例的一种可选实施例中,单次出现的预置字符串可以对应一个或者多个空缺字符。
其中,在单次出现的预置字符串对应1个空缺字符时,无论预置字符串包括几个字符,其对应的空缺字符可以占用匹配串中的一个位置。在本发明的一种应用示例3中,用户C欲要搜索某影视剧名“芈月传”,但只知道该影视剧名的后两字“月传”,不知道该影视剧名的前一字“芈”,故可以在搜索引擎的搜索框中输入查询串“sm月传”,则步骤S1可以将预置字符串“sm”作为1个空缺字符,由此可以确定第一字符“月”和“传”在匹配串中的第一位置分别为第二和第三。
在单次出现的预置字符串对应多个空缺字符时,其对应的空缺字符可以占用匹配串中的多个位置。在本发明的一种应用示例4中,用户D欲要搜索某诗句“锄禾日当午”,但只知道该诗句的前两字“锄禾”和后一字“午”,不知道该诗句的中间两字“日当”,故可以在搜索引擎的搜索框中输入查询串“锄禾什么午”,则步骤S1可以将预置字符串“什么”作为2个空缺字符,由此可以确定第一字符“锄”、“禾”和“午”在匹配串中的第一位置分别为第一、第二和第五。
在本发明的另一种可选实施例中,为了提高第一字符的命中率和填充结果的丰富性,本发明实施例可以分别在单次出现的预置字符串可以对应一个、多个空缺字符的情况下,得到对应的多个匹配串,通过匹配获得多个匹配串对应的目标实体词条。
在本发明的再一种可选实施例中,上述查询串中还可以携带有第一指示字符串,该第一指示字符串可用于指示预置字符串所对应空缺字符的数目。例如,在上述应用示例1中,查询串“马*1腾”中预置字符串“*”之后的“1”可用于指示预置字符串“*”对应1个空缺字符;又如,在上述应用示例4中,查询串“锄禾什么2午”中预置字符串“什么”之后的“2”可用于指示预置字符串“什么”对应2个空缺字符。
在本发明的又一种可选实施例中,上述查询串中还可以携带第二指示字符串,该第二指示字符串可用于指示用户不确定预置字符串所对应空缺字符的数目。例如,在本发明的一种应用示例5中,用户E欲要搜索老挝的景点名“琅勃拉邦”,但只知道该景点名的后两字“拉邦”,不知道该景点名所占的总字数,故可以在搜索引擎的搜索框中输入查询串“什么?拉邦”,则预置字符串“什么”之后的“?”可用于指示用户不确定预置字符串所对应空缺字符的数目。此种情况下,可以针对预置字符串所对应空缺字符的数目进行多次尝试,以得到对应的目标实体词条。
需要说明的是,若用户确定预置字符串所对应空缺字符的数目,则可以不在查询串中携带第二指示字符串,或者,还可以在在查询串中携带第三指示字符串,该第三指示字符串可用于指示用户确定预置字符串所对应空缺字符的数目,此种情况下,可以认为单次出现的预置字符串可以对应一个空缺字符。
另外,需要说明的是,上述预置字符串、第一指示字符串、第二指示字符串和第三指示字符串所对应的字符串只是作为本发明的应用示例,实际上,本领域技术人员可以根据实际应用需求采用任意字符串作为上述预置字符串、第一指示字符串、第二指示字符串和第三指示字符串,另外,在采用预置字符串、第一指示字符串、第二指示字符串和第三指示字符串中两种以上时,可以对两种以上的字符串进行区分等,本发明实施例对于上述预置字符串、第一指示字符串、第二指示字符串和第三指示字符串所对应的具体字符串不加以限制。
并且,上述步骤S1依据第一字符和预置字符串对应空缺字符组合得到匹配串的方式只是作为可选实施例,实际上,本领域技术人员可以根据实际应用需求采用其他方式得到匹配串,例如,将上述查询串中单次出现的预置字符串替换为对应数目的空缺字符,以替换后的查询串作为匹配串等。
在实际应用中,服务器可以从互联网抓取实体相关数据,并对实体相关数据进行分析,以得到对应的实体词条,并将该实体词条存储至实体库。
在本发明的一种可选实施例中,上述建立所述实体库的过程具体可以包括:从百科网站抓取实体名称,并将所述实体名称作为实体词条保存至所述实体库。其中,上述百科网站具体可以包括:百度百科、维基百科、互动百科等,这些百科网站具有众多实体的实体名称,由于可以直接将所述实体名称作为实体词条保存至所述实体库,故可以提高建立实体库的便捷性。
在本发明的另一种可选实施例中,上述建立所述实体库的过程具体可以包括:从垂直网站抓取领域数据,对所述领域数据进行分析,依据分析结果从所述领域数据中抽取关键词,并将所述关键词作为实体词条保存至所述实体库。其中,上述垂直网站可用于表示注意力集中在某些特定的领域或某种特定的需求,提供有关这个领域或需求的全部深度信息和相关服务的网站,如旅游网站、汽车网站、医疗网站等。
例如,可以从旅游网站中抓取游记相关数据,并对游记相关数据进行分析,以得到游记中所记录的较为冷门的、或者新发现的景点名称;由于这些景点名称较为冷门、或者发现时间较晚,故还未被收录在百科网站中,故可以作为百科网站中实体名称的有效补充。
又如,可以从医疗网站中抓取医疗相关数据,并对医疗相关数据进行分析,以得到疾病、药品、医院、患者、医生等实体对应的关键词;由于这些实体相较为专业和领域化,故还未被收录在百科网站中,故可以作为百科网站中实体名称的有效补充。
需要说明的是,上述建立实体库的过程只是作为可选实施例中,实际上,本发明实施例对于建立实体库的具体过程不加以限制,例如,可以通过人工方式向实体库中添加实体词条等,
步骤203、输出所述目标实体词条。
在本发明实施例应用于客户端时,客户端可以通过UI向用户展示上述目标实体词条;在本发明实施例应用于服务器时,服务器向客户端发送上述目标实体词条。
本发明实施例可以提供所述目标实体词条的如下输出方案:
输出方案1
输出方案1中,上述输出所述目标实体词条的步骤,具体可以包括:在所述查询串对应的搜索结果页展示所述目标实体词条。
输出方案1可以应用于搜索引擎等具有搜索功能的网站或者应用程序中,在搜索结果页中将得到的目标实体词条作为推荐搜索词提供给用户选择。当用户确定某个目标实体词条符合自己的搜索意图时,可以直接选择该目标实体词条,此时页面跳转至以该目标实体词条作为搜索词的搜索结果页面,提高用户的搜索效率。
例如,假设用户输入查询串为“马*腾”,采用本发明实施例,可以得到目标实体词条“马化腾”、“马昌腾”、“马晓腾”、“马云腾”等等,则可以将这些目标实体词条作为推荐搜索词在搜索结果页中展示给用户。如果用户确定希望搜索的是“马化腾”,则只需要点击“马化腾”,就可以启动对“马化腾”的搜索,跳转至以“马化腾”为搜索词的搜索结果页面。
在实际应用中,可以将上述目标实体词条展示在搜索结果页的预设位置,其中,上述预设位置可以为位于搜索框下方的、首个搜索结果的位置等,由此可以提高目标实体词条的吸引度。
输出方案2
输出方案2中,上述输出所述目标实体词条的步骤,具体可以包括:在所述查询串对应的搜索结果页、展示与所述目标实体词条相关的网页链接。输出方案2直接在搜索结果页中展示与所述目标实体词条相关的网页链接,可以省去继续搜索所花费的操作成本和时间成本,从而能够提高用户的搜索效率。
例如,假设用户输入查询串为“马*腾”,采用本发明实施例,得到的目标实体词条“马化腾”、“马昌腾”、“马晓腾”、“马云腾”等等,则可以直接在搜索结果页面中展示与“马化腾”相关的网页链接,与“马昌腾”相关的网页链接,与“马晓腾”相关的网页链接等。在本发明的一种可选实施例中,所述目标实体词条可以为热度最高的若干个目标实体词条,此种情况下,可以说明其最契合用户的查询意图。例如,可以依据目标实体词条的热度,对多个目标实体词条进行排序,并依据排序结果选择排在前两位的目标实体词条;或者,可以选择热度大于热度阈值的若干个目标实体词条;并采用输出方案2输出所选择的目标实体词条。
在本发明的另一种可选实施例中,上述目标实体词条的热度具体可以包括如下热度中的至少一种:目标实体词条在搜索程序中的第一搜索热度、及目标实体词条在百科网站中的第二搜索热度。其中,上述第一搜索热度或者第二搜索热度可用于表示目标实体词条作为查询词被搜索的次数,并且,上述第一搜索热度或者第二搜索热度可以具有对应的预置时间段,其中,上述预置时间段可以为最近一个月、最近7天等,本发明实施例对于上述预置时间段的具体长度不加以限制。
可以理解,搜索行为对应的上述第一搜索热度或者第二搜索热度只是作为本发明实施例中目标实体词条的热度的可选实施例,实际上,本领域技术人员还可以根据实际应用需求,采用目标实体词条的其他热度,如评论热度、转发热度、粉丝热度等,本发明实施例对于目标实体词条的具体热度不加以限制。
进一步的,所述方法还可以包括:在所述搜索结果页,展示与热度最高的目标实体词条相关的网页链接和其他的目标实体词条。
具体的,获取所述目标实体词条中热度最高的作为最优推荐词,直接在所述搜索结果页面中展示与所述最优搜索词相关的网页链接,并将其他目标实体词条作为推荐搜索词展示在所述搜索结果页面中。
如图4所示,假设得到的目标实体词条“马化腾”、“马昌腾”、“马晓腾”、“马云腾”中,“马化腾”的搜索热度最高,则直接在搜索结果页面中展示与“马化腾”相关的网页链接,图4中以百科词条结果为例,并将其他的目标实体词“马昌腾”、“马晓腾”、“马云腾”等等,作为推荐搜索词展示在搜索结果页面中。
输出方案3
输出方案3中,上述输出所述目标实体词条的步骤,具体可以包括:在所述查询串对应的搜索结果页展示所述目标实体词条、以及与所述目标实体词条相关的推荐搜索词。
例如,在目标实体词条为“芈月传”时,与其相关的推荐搜索词具体可以包括:“孙俪”、“刘楚恬”、“芈月传演员表”、“芈月传剧情”等。又如,在目标实体词条为“锄禾日当午”时,与其相关的推荐搜索词具体可以包括:“悯农”、“李绅”、“汗滴禾下土”、等。
在实际应用中,与所述目标实体词条相关的推荐搜索词可以为包括目标实体词条、且搜索热度较高的搜索词,如“芈月传演员表”、“芈月传剧情”等。或者,与所述目标实体词条相关的推荐搜索词也可以为对目标实体词条的实体信息进行分析得到的、与目标实体词条的相关性比较高、且热度比较高的搜索词,如,可以对影视剧“芈月传”进行分析,以得到契合其“演员”、“剧情”、“播放时间”等参数的搜索词。或者,与所述目标实体词条相关的推荐搜索词也可以为预设时间内与第一搜索相邻的第二搜索的搜索词,其中,第一搜索可以为以目标实体词条为搜索词的搜索,如大多数用户在搜索“芈月传”后还会搜索“孙俪”、“刘楚恬”,故可以将“孙俪”、“刘楚恬”作为与“芈月传”相关的推荐搜索词。可以理解,本发明实施例对于与所述目标实体词条相关的推荐搜索词的具体获取过程不加以限制。
以上对目标实体词条的输出方案1-输出方案3进行了详细介绍,可以理解,本领域技术人员可以根据实际应用需求,采用输出方案1-输出方案3中的任一或者组合,例如,在组合采用输出方案1和输出方案2时,可以通过输出方案2输出热度最高的若干个目标实体词条,以及可以通过输出方案1输出热度较低的目标实体词条,可以理解,本发明实施例对于目标实体词条的具体输出方案不加以限制。综上,本发明实施例在查询串中包括有预置字符串时,依据所述查询串在实体库中进行查询,以得到所述实体库中命中所述查询串中第一字符的目标实体词条;其中,所述第一字符为所述查询串中除所述预置字符串之外的字符;由于上述预置字符串可用于标记空缺,故本发明实施例可以基于上述第一字符和上述实体库对上述预置字符串代表的空缺查询字符进行填充,以向用户提供填充后具有完整含义的查询串,从而可以解决用户无法准确描述查询意图的问题;
并且,由于上述实体库中可以存储有各领域内实体的实体词条,故得到的目标实体词条能够较好地契合用户的查询意图;这样,可以使得用户选择所需的目标实体词条进行搜索,从而能够提高用户的搜索效率。
方法实施例二
参照图3,示出了本发明的一种信息处理方法实施例二的步骤流程图,具体可以包括如下步骤:
步骤301、接收用户的查询串;
步骤302、当所述查询串中包括有用于标记空缺字符的预置字符串时,依据所述查询串在实体库中进行查询,以得到所述实体库中命中所述查询串中第一字符的目标实体词条;其中,所述第一字符可以为所述查询串中除所述预置字符串之外的字符;
步骤303、输出所述目标实体词条;
相对于图2所示实施例一,本实施例中所述目标实体词条具体可以包括:第一目标实体词条和第二目标实体词条,则所述输出所述目标实体词条的步骤303,具体可以包括:
步骤331、展示所述第一目标实体词条对应的实体信息,以及,展示所述第二目标实体词条。
本实施例中,第一目标实体词条可用于表示最契合用户的查询意图的词条,第二目标实体词条可用于表示较为契合用户的查询意图的词条,上述直接展示所述第一目标实体词条对应的实体信息的方式,可以在解决用户无法准确描述查询意图的问题的同时,向用户提供改查询意图对应的查询结果,从而可以提高用户的搜索效率。
在本发明的一种可选实施例中,所述实体信息具体可以包括:所述第一目标实体词条对应实体的图片信息,和/或,所述第一目标实体词条对应实体的简介信息。以人名实体为例,上述简介信息具体可以包括:名字、职业、出生日期、籍贯等信息;以菜名实体为例,上述简介信息具体可以包括:名称、主料、辅料、耗时、功效、烹调步骤等信息,可以理解,本发明实施例对于具体的实体信息和具体的简介信息不加以限制。
在本发明的一种可选实施例中,第一目标实体词条可以为热度最高的一个或多个目标实体词条,此种情况下,可以说明其最契合用户的查询意图;相应地,可以通过如下步骤确定上述第一目标实体词条和第二目标实体词条:
步骤A1、依据目标实体词条的热度,对多个目标实体词条进行排序;
步骤A2、将热度最高的目标实体词条作为第一目标实体词条,以及,将除第一目标实体词条之外的目标实体词条作为第二目标实体词条。
在本发明的一种可选实施例中,所述目标实体词条的热度具体可以包括如下热度中的至少一种:目标实体词条在搜索程序中的第一搜索热度、及目标实体词条在百科网站中的第二搜索热度。其中,上述第一搜索热度或者第二搜索热度可用于表示目标实体词条作为查询词被搜索的次数,并且,上述第一搜索热度或者第二搜索热度可以具有对应的预置时间段,其中,上述预置时间段可以为最近一个月、最近7天等,本发明实施例对于上述预置时间段的具体长度不加以限制。
可以理解,搜索行为对应的上述第一搜索热度或者第二搜索热度只是作为本发明实施例中目标实体词条的热度的可选实施例,实际上,本领域技术人员还可以根据实际应用需求,采用目标实体词条的其他热度,如评论热度、转发热度、粉丝热度等,本发明实施例对于目标实体词条的具体热度不加以限制。
参照图4,示出了本发明的一种展示目标实体词条的示意图,其中,搜索引擎在接收到用户A在搜索框中输入的查询串“马*腾”后,可以通过本发明实施例的信息处理流程得到第一目标实体词条“马化腾”、及第二目标实体词条“马昌腾”、“马晓腾”、“马云腾”、“马奔腾”、“马雪腾”等;
并且,由于第一目标实体词条“马化腾”最契合用户的查询意图,故本发明实施例可以将第一目标实体词条的图片信息、简介信息等实体信息展示在位于搜索框下方的、首个搜索结果的位置,以提高其对于用户的吸引度;
另外,由于第二目标实体词条“马昌腾”、“马晓腾”、“马云腾”、“马奔腾”、“马雪腾”等较为契合用户的查询意图,也即,第二目标实体词条可以作为第一目标实体词条的有效补充,故本发明实施例将其展示在第一目标实体词条的下部区域,可以提高填充结果的覆盖度。
需要说明的是,本发明实施例还可以在第一目标实体词条和第二目标实体词条对应展现区域的下方展现查询串“马*腾”对应的搜索结果。并且,在接收到用户针对第一目标实体词条和第二目标实体词条中的任意一个目标实体词条的触发操作后,可以将该触发操作对应的目标实体词条作为当前查询串、继续依据当前查询串进行搜索、并输出对应的搜索结果。
方法实施例三
参照图5,示出了本发明的一种信息处理方法实施例三的步骤流程图,具体可以包括如下步骤:
步骤501、接收用户的查询串;
步骤502、当所述查询串中包括有用于标记空缺字符的预置字符串时,依据所述查询串在实体库中进行查询,以得到所述实体库中命中所述查询串中第一字符的目标实体词条;其中,所述第一字符可以为所述查询串中除所述预置字符串之外的字符;
步骤503、依据目标实体词条的热度,对多个目标实体词条进行排序;
步骤504、将排好序的多个目标实体词条输出。
相对于图2所示实施例,本实施例在输出多个目标实体词条之前,还可以依据目标实体词条的热度,对多个目标实体词条进行排序,并将排好序的多个目标实体词条输出;其中,上述排序可以按照热度从高到低的顺序对多个目标实体词条进行排序,因此可以将热度高的目标实体词条排在热度低的目标实体词条的前面。
在本发明的一种可选实施例中,所述目标实体词条的热度具体可以包括如下热度中的至少一种:目标实体词条在搜索程序中的第一搜索热度、及目标实体词条在百科网站中的第二搜索热度。其中,上述第一搜索热度或者第二搜索热度可用于表示目标实体词条作为查询词被搜索的次数,并且,上述第一搜索热度或者第二搜索热度可以具有对应的预置时间段,其中,上述预置时间段可以为最近一个月、最近7天等,本发明实施例对于上述预置时间段的具体长度不加以限制。
可以理解,搜索行为对应的上述第一搜索热度或者第二搜索热度只是作为本发明实施例中目标实体词条的热度的可选实施例,实际上,本领域技术人员还可以根据实际应用需求,采用目标实体词条的其他热度,如评论热度、转发热度、粉丝热度等,本发明实施例对于目标实体词条的具体热度不加以限制。
参照图6,示出了本发明的一种展示目标实体词条的示意图,其中,搜索引擎在接收到用户B在搜索框中输入的查询串“红烧()()”后,可以通过本发明实施例的信息处理流程得到排好序的多个目标实体词条:“红烧鸡翅”、“红烧牛肉”、“红烧菠萝”等。并且,由于图6中目标实体词条的数目较多,为了避免其过多地占用页面区域,故可以对其进行分页展示,以使用户通过翻页查看对应的目标实体词条。
需要说明的是,本发明实施例还可以在目标实体词条对应展现区域的下方展现查询串“红烧()()”对应的搜索结果。在接收到用户针对所展示的任意一个目标实体词条的触发操作后,可以将该触发操作对应的目标实体词条作为当前查询串、继续依据当前查询串进行搜索、并输出对应的搜索结果。
方法实施例四
参照图7,示出了本发明的一种信息处理方法实施例四的步骤流程图,具体可以包括如下步骤:
步骤701、客户端接收用户在输入框中输入的查询串;
步骤702、客户端向服务器发送上述查询串;
步骤703、服务器在所述查询串中包括有用于标记空缺字符的预置字符串时,依据所述查询串在实体库中进行查询,以得到所述实体库中命中所述查询串中第一字符的目标实体词条;其中,所述第一字符可以为所述查询串中除所述预置字符串之外的字符;
步骤704、服务器依据目标实体词条的热度,对多个目标实体词条进行排序;
步骤705、服务器判断热度最高的第一目标实体词条所对应图片是否符合预置条件,若是,则执行步骤706,否则执行步骤708;
步骤706、服务器向客户端发送热度最高的第一目标实体词条的实体信息,以及,服务器向客户端发送排好序的多个第二目标实体词条;其中,上述第二目标实体词条可以为除第一目标实体词条之外的目标实体词条;
步骤707、客户端展示第一目标实体词条对应的实体信息,以及,展示排好序的多个第二目标实体词条,结束流程;
步骤708、服务器向客户端发送排好序的多个目标实体词条;
步骤709、客户端展示排好序的多个目标实体词条,结束流程。
在实际应用中,图片是否符合预置条件可用于表示图片质量是否符合预置条件。例如,在图像分辨率符合预置清晰条件时,可以表示图片较为清晰,因此可以采用步骤706-步骤707对应的第一展示方案;反之,在图像分辨率不符合预置清晰条件时,可以表示图片较为模糊,此种情况下向用户展示图片信息,将容易影响用户的视觉体验,因此可以采用步骤708-步骤709对应的第二展示方案。
需要说明的是,本发明实施例将第一目标实体词条所对应图片是否符合预置条件作为第一展示方案和第二展示方案的选择依据,只是作为可选实施例;实际上,本领域技术人员可以根据其他依据进行第一展示方案和第二展示方案的选择,例如,在目标实体词条的数目超出阈值时采用第二展示方案,及在目标实体词条的数目未超出阈值时采用第一展示方案等,本发明实施例对于第一展示方案和第二展示方案的具体选择依据不加以限制。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。
装置实施例
参照图8,示出了本发明的一种信息处理装置实施例的结构框图,具体可以包括如下模块:接收模块U801、查询模块U802和输出模块U803。
所述接收模块U801,用于接收用户的查询串;
所述查询模块U802,用于当所述查询串中包括有用于标记空缺字符的预置字符串时,依据所述查询串在实体库中进行查询,以得到所述实体库中命中所述查询串中第一字符的目标实体词条;其中,所述第一字符为所述查询串中除所述预置字符串之外的字符;
所述输出模块U803,输出所述目标实体词条。
优选的,所述查询模块U802可以包括:查找单元。
所述查找单元,用于查找实体库,得到命中所述查询串中第一字符的目标实体词条;所述目标实体词条包括所述第一字符、且所述第一字符在所述查询串中的第一位置与所述第一字符在所述目标实体词条中的第二位置一致。
优选的,所述查找单元可以包括:组合子单元和匹配子单元。
所述组合子单元,用于将所述查询串中包括的预置字符串作为空缺字符,以得到所述第一字符和所述空缺字符组合得到的匹配串;
所述匹配子单元,用于按照字符位置,将所述匹配串中第一字符与所述实体库中实体词条对应的第二字符进行匹配,以得到所述匹配串对应的目标实体词条;其中,所述第二字符与所述第一字符相同且所述第二字符在所述目标实体词条中的位置与所述第一字符在所述查询串中的位置一致。
优选的,单次出现的预置字符串对应一个或者多个空缺字符。
优选的,所述输出模块U803可以包括:
第一展示单元,用于在搜索结果页,展示所述目标实体词条;和/或
第二展示单元,用于在所述搜索结果页,展示与所述目标实体词条相关的网页链接;和/或
第三展示单元,用于在所述搜索结果页,展示与热度最高的目标实体词条相关的网页链接和其他的目标实体词条;和/或
第四展示单元,用于在所述搜索结果页,展示所述目标实体词条、以及与所述目标实体词条相关的推荐搜索词。
优选的,所述目标实体词条可以包括:第一目标实体词条和第二目标实体词条,则所述输出模块U803可以包括:
第五展示单元,用于客户端展示所述第一目标实体词条对应的实体信息,以及,客户端展示所述第二目标实体词条。
优选的,所述装置还可以包括:排序模块。
所述排序模块,用于依据目标实体词条的热度,对多个目标实体词条进行排序;
则所述输出模块U803可以包括:第六展示单元,用于将排好序的多个目标实体词条输出。
优选的,所述目标实体词条的热度可以但不限于包括如下热度中的至少一种:目标实体词条在搜索程序中的第一搜索热度、及目标实体词条在百科网站中的第二搜索热度。
优选的,所述实体信息可以但不限于包括:所述第一目标实体词条对应实体的图片信息,和/或,所述第一目标实体词条对应实体的简介信息。
优选的,所述装置还可以包括:
第一抓取模块,用于从百科网站抓取实体名称,并将所述实体名称作为实体词条保存至所述实体库;和/或
第二抓取模块,用于从垂直网站抓取领域数据,对所述领域数据进行分析,依据分析结果从所述领域数据中抽取关键词,并将所述关键词作为实体词条保存至所述实体库。
综上,本发明实施例在查询串中包括有预置字符串时,依据所述查询串在实体库中进行查询,以得到所述实体库中命中所述查询串中第一字符的目标实体词条;其中,所述第一字符为所述查询串中除所述预置字符串之外的字符;由于上述预置字符串可用于标记空缺,故本发明实施例可以基于上述第一字符和上述实体库对上述预置字符串代表的空缺查询字符进行填充,以向用户提供填充后具有完整含义的查询串,从而可以解决用户无法准确描述查询意图的问题;
并且,由于上述实体库中可以存储有各领域内实体的实体词条,故得到的目标实体词条能够较好地契合用户的查询意图;这样,可以使得用户选择所需的目标实体词条进行搜索,从而能够提高用户的搜索效率。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图9是根据一示例性实施例示出的一种用于信息处理的装置900的框图。例如,装置900可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图9,装置900可以包括以下一个或多个组件:处理组件902,存储器904,电源组件906,多媒体组件908,音频组件910,输入/输出(I/O)的接口912,传感器组件914,以及通信组件916。
处理组件902通常控制装置900的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理元件902可以包括一个或多个处理器920来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件902可以包括一个或多个模块,便于处理组件902和其他组件之间的交互。例如,处理部件902可以包括多媒体模块,以方便多媒体组件908和处理组件902之间的交互。
存储器904被配置为存储各种类型的数据以支持在设备900的操作。这些数据的示例包括用于在装置900上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器904可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件906为装置900的各种组件提供电力。电源组件906可以包括电源管理系统,一个或多个电源,及其他与为装置900生成、管理和分配电力相关联的组件。
多媒体组件908包括在所述装置900和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件908包括一个前置摄像头和/或后置摄像头。当设备900处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件910被配置为输出和/或输入音频信号。例如,音频组件910包括一个麦克风(MIC),当装置900处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器904或经由通信组件916发送。在一些实施例中,音频组件910还包括一个扬声器,用于输出音频信号。
I/O接口912为处理组件902和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件914包括一个或多个传感器,用于为装置900提供各个方面的状态评估。例如,传感器组件914可以检测到设备900的打开/关闭状态,组件的相对定位,例如所述组件为装置900的显示器和小键盘,传感器组件914还可以检测装置900或装置900一个组件的位置改变,用户与装置900接触的存在或不存在,装置900方位或加速/减速和装置900的温度变化。传感器组件914可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件914还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件914还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件916被配置为便于装置900和其他设备之间有线或无线方式的通信。装置900可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信部件916经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信部件916还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置900可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器904,上述指令可由装置900的处理器920执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
一种非临时性计算机可读存储介质,当所述存储介质中的指令由移动终端的处理器执行时,使得移动终端能够执行一种信息处理方法,所述方法包括:接收用户的查询串;当所述查询串中包括有用于标记空缺字符的预置字符串时,依据所述查询串在实体库中进行查询,以得到所述实体库中命中所述查询串中第一字符的目标实体词条;其中,所述第一字符为所述查询串中除所述预置字符串之外的字符;输出所述目标实体词条。
图10是本发明实施例中服务器的结构示意图。该服务器1900可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(centralprocessingunits,CPU)1922(例如,一个或一个以上处理器)和存储器1932,一个或一个以上存储应用程序1942或数据1944的存储介质1930(例如一个或一个以上海量存储设备)。其中,存储器1932和存储介质1930可以是短暂存储或持久存储。存储在存储介质1930的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器1922可以设置为与存储介质1930通信,在服务器1900上执行存储介质1930中的一系列指令操作。
服务器1900还可以包括一个或一个以上电源1926,一个或一个以上有线或无线网络接口1950,一个或一个以上输入输出接口1958,一个或一个以上键盘1956,和/或,一个或一个以上操作系统1941,例如WindowsServerTM,MacOSXTM,UnixTM,LinuxTM,FreeBSDTM等等。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本发明旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
以上对本发明所提供的一种信息处理方法、一种信息处理装置和一种用于信息处理的装置,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (12)

1.一种信息处理方法,其特征在于,包括:
接收用户的查询串;
当所述查询串中包括有用于标记空缺字符的预置字符串时,依据所述查询串在实体库中进行查询,以得到所述实体库中命中所述查询串中第一字符的目标实体词条;其中,所述第一字符为所述查询串中除所述预置字符串之外的字符;
输出所述目标实体词条。
2.根据权利要求1所述的方法,其特征在于,所述依据所述查询串在实体库中进行查询,以得到所述实体库中命中所述查询串中第一字符的目标实体词条的步骤,包括:
查找实体库,得到命中所述查询串中第一字符的目标实体词条;所述目标实体词条包括所述第一字符、且所述第一字符在所述查询串中的第一位置与所述第一字符在所述目标实体词条中的第二位置一致。
3.根据权利要求2所述的方法,其特征在于,所述查找实体库,得到命中所述查询串中第一字符的目标实体词条的步骤,包括:
将所述查询串中包括的预置字符串作为空缺字符,以得到所述第一字符和所述空缺字符组合得到的匹配串;
按照字符位置,将所述匹配串中第一字符与所述实体库中实体词条对应的第二字符进行匹配,以得到所述匹配串对应的目标实体词条;其中,所述第二字符与所述第一字符相同且所述第二字符在所述目标实体词条中的位置与所述第一字符在所述查询串中的位置一致。
4.根据权利要求3所述的方法,其特征在于,单次出现的预置字符串对应一个或者多个空缺字符。
5.根据权利要求1至4中任一所述的方法,其特征在于,所述输出所述目标实体词条的步骤,包括:
在搜索结果页,展示所述目标实体词条;和/或
在所述搜索结果页,展示与所述目标实体词条相关的网页链接;和/或
在所述搜索结果页,展示与热度最高的目标实体词条相关的网页链接和其他的目标实体词条;和/或
在所述搜索结果页,展示所述目标实体词条、以及与所述目标实体词条相关的推荐搜索词。
6.根据权利要求1至4中任一所述的方法,其特征在于,所述目标实体词条包括:第一目标实体词条和第二目标实体词条,则所述输出所述目标实体词条的步骤,包括:
客户端展示所述第一目标实体词条对应的实体信息,以及,客户端展示所述第二目标实体词条。
7.根据权利要求1至4中任一所述的方法,其特征在于,所述方法还包括:依据目标实体词条的热度,对多个目标实体词条进行排序;
则所述输出所述目标实体词条的步骤,包括:将排好序的多个目标实体词条输出。
8.根据权利要求7所述的方法,其特征在于,所述目标实体词条的热度包括如下热度中的至少一种:目标实体词条在搜索程序中的第一搜索热度、及目标实体词条在百科网站中的第二搜索热度。
9.根据权利要求6所述的方法,其特征在于,所述实体信息包括:所述第一目标实体词条对应实体的图片信息,和/或,所述第一目标实体词条对应实体的简介信息。
10.根据权利要求1至4中任一所述的方法,其特征在于,通过如下步骤建立所述实体库:
从百科网站抓取实体名称,并将所述实体名称作为实体词条保存至所述实体库;和/或
从垂直网站抓取领域数据,对所述领域数据进行分析,依据分析结果从所述领域数据中抽取关键词,并将所述关键词作为实体词条保存至所述实体库。
11.一种信息处理装置,其特征在于,包括:
接收模块,用于接收用户的查询串;
查询模块,用于当所述查询串中包括有用于标记空缺字符的预置字符串时,依据所述查询串在实体库中进行查询,以得到所述实体库中命中所述查询串中第一字符的目标实体词条;其中,所述第一字符为所述查询串中除所述预置字符串之外的字符;
输出模块,用于输出所述目标实体词条。
12.一种用于信息处理的装置,其特征在于,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
接收用户的查询串;
当所述查询串中包括有用于标记空缺字符的预置字符串时,依据所述查询串在实体库中进行查询,以得到所述实体库中命中所述查询串中第一字符的目标实体词条;其中,所述第一字符为所述查询串中除所述预置字符串之外的字符;
输出所述目标实体词条。
CN201511001089.4A 2015-12-28 2015-12-28 一种信息处理方法和装置、一种用于信息处理的装置 Pending CN105677709A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201511001089.4A CN105677709A (zh) 2015-12-28 2015-12-28 一种信息处理方法和装置、一种用于信息处理的装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201511001089.4A CN105677709A (zh) 2015-12-28 2015-12-28 一种信息处理方法和装置、一种用于信息处理的装置

Publications (1)

Publication Number Publication Date
CN105677709A true CN105677709A (zh) 2016-06-15

Family

ID=56297700

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201511001089.4A Pending CN105677709A (zh) 2015-12-28 2015-12-28 一种信息处理方法和装置、一种用于信息处理的装置

Country Status (1)

Country Link
CN (1) CN105677709A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106776808A (zh) * 2016-11-23 2017-05-31 百度在线网络技术(北京)有限公司 基于人工智能的资讯数据提供方法及装置
CN106993203A (zh) * 2017-03-08 2017-07-28 广州视源电子科技股份有限公司 电视机激活方法及系统
CN110110078A (zh) * 2018-01-11 2019-08-09 北京搜狗科技发展有限公司 数据处理方法和装置、用于数据处理的装置
CN113742558A (zh) * 2021-08-30 2021-12-03 武汉海昌信息技术有限公司 多种数据库兼容和并存的查询方法、系统、设备及介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6556990B1 (en) * 2000-05-16 2003-04-29 Sun Microsystems, Inc. Method and apparatus for facilitating wildcard searches within a relational database
CN1936896A (zh) * 2006-09-20 2007-03-28 网之易信息技术(北京)有限公司 一种基于搜索引擎的信息检索方法及检索系统
CN103544165A (zh) * 2012-07-12 2014-01-29 腾讯科技(深圳)有限公司 新词挖掘方法和系统
CN104077320A (zh) * 2013-03-29 2014-10-01 北京百度网讯科技有限公司 一种用于生成待发布信息的方法和装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6556990B1 (en) * 2000-05-16 2003-04-29 Sun Microsystems, Inc. Method and apparatus for facilitating wildcard searches within a relational database
CN1936896A (zh) * 2006-09-20 2007-03-28 网之易信息技术(北京)有限公司 一种基于搜索引擎的信息检索方法及检索系统
CN103544165A (zh) * 2012-07-12 2014-01-29 腾讯科技(深圳)有限公司 新词挖掘方法和系统
CN104077320A (zh) * 2013-03-29 2014-10-01 北京百度网讯科技有限公司 一种用于生成待发布信息的方法和装置

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106776808A (zh) * 2016-11-23 2017-05-31 百度在线网络技术(北京)有限公司 基于人工智能的资讯数据提供方法及装置
CN106993203A (zh) * 2017-03-08 2017-07-28 广州视源电子科技股份有限公司 电视机激活方法及系统
CN106993203B (zh) * 2017-03-08 2020-06-30 广州视源电子科技股份有限公司 电视机激活方法及系统
CN110110078A (zh) * 2018-01-11 2019-08-09 北京搜狗科技发展有限公司 数据处理方法和装置、用于数据处理的装置
CN110110078B (zh) * 2018-01-11 2024-04-30 北京搜狗科技发展有限公司 数据处理方法和装置、用于数据处理的装置
CN113742558A (zh) * 2021-08-30 2021-12-03 武汉海昌信息技术有限公司 多种数据库兼容和并存的查询方法、系统、设备及介质

Similar Documents

Publication Publication Date Title
TWI744368B (zh) 播放處理方法、裝置和設備
CN110020140B (zh) 推荐内容显示方法、装置及系统
WO2019120068A1 (zh) 缩略图显示控制方法及移动终端
JP6384474B2 (ja) 情報処理装置および情報処理方法
US20190236099A1 (en) Picture processing method and apparatus, and electronic device
US20190220492A1 (en) Display apparatus and method of controlling the same
KR101846756B1 (ko) Tv 프로그램 식별 방법, 장치, 단말기, 서버, 및 시스템
CN105701254A (zh) 一种信息处理方法和装置、一种用于信息处理的装置
WO2020082938A1 (zh) 标签的处理方法、装置、电子设备及存储介质
US20170103072A1 (en) Generating Image Tags
CN105095427A (zh) 搜索推荐方法和装置
CN108062390B (zh) 推荐用户的方法、装置和可读存储介质
CN109189986B (zh) 信息推荐方法、装置、电子设备和可读存储介质
US20200007907A1 (en) System and Method for Providing Image-Based Video Service
CN111783001A (zh) 页面显示方法、装置、电子设备和存储介质
CN105607757A (zh) 一种输入方法和装置、一种用于输入的装置
CN105677709A (zh) 一种信息处理方法和装置、一种用于信息处理的装置
CN111858971A (zh) 多媒体资源推荐方法、装置、终端及服务器
CN112004156A (zh) 一种视频播放方法、相关装置及存储介质
CN107622074A (zh) 一种数据处理方法、装置和计算设备
CN105373580A (zh) 主题显示方法及装置
CN108307039B (zh) 一种应用信息展示方法及移动终端
JP5891909B2 (ja) サーバ装置、プログラム及び通信システム
JP6056847B2 (ja) コンテンツ及び投稿情報連携方法、並びに情報処理端末
CN106919642A (zh) 一种跨语言搜索方法和装置、一种用于跨语言搜索的装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20160615