CN108038165A - 一种信息搜索方法、搜索装置、终端设备和服务器设备 - Google Patents

一种信息搜索方法、搜索装置、终端设备和服务器设备 Download PDF

Info

Publication number
CN108038165A
CN108038165A CN201711278988.8A CN201711278988A CN108038165A CN 108038165 A CN108038165 A CN 108038165A CN 201711278988 A CN201711278988 A CN 201711278988A CN 108038165 A CN108038165 A CN 108038165A
Authority
CN
China
Prior art keywords
search
message
sent
client
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201711278988.8A
Other languages
English (en)
Other versions
CN108038165B (zh
Inventor
王萌
王伟光
郑尚文
周锟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Neusoft Corp
Original Assignee
Neusoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Neusoft Corp filed Critical Neusoft Corp
Priority to CN201711278988.8A priority Critical patent/CN108038165B/zh
Publication of CN108038165A publication Critical patent/CN108038165A/zh
Application granted granted Critical
Publication of CN108038165B publication Critical patent/CN108038165B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/14Details of searching files based on file metadata
    • G06F16/156Query results presentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/14Details of searching files based on file metadata
    • G06F16/148File search processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/04Real-time or near real-time messaging, e.g. instant messaging [IM]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/06Message adaptation to terminal or network requirements

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Library & Information Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种信息搜索方法及设备。该方法包括:接收客户端发送来的消息,所述消息中包含有标识符,所述标识符用以标识搜索关键词和/或搜索类型;根据所述标识符从消息中提取出搜索关键词;根据所述搜索关键词在数据库中搜索相关信息,并将搜索结果发送给所述客户端。本发明通过在消息中添加用于标识搜索关键字的标识符,使服务器在接收收到消息后可以从消息中提出取搜索关键词进行搜索,并将搜索结果反馈给用户,用户无须从聊天界面切换到搜索入口,大大提高了用户搜索信息的便利性,同时提高了搜索效率。

Description

一种信息搜索方法、搜索装置、终端设备和服务器设备
技术领域
本发明涉及一种信息搜索方法,尤其是一种基于即时通讯的信息搜索方法,以及可以执行该方法的设备。
背景技术
随着无线技术的发展与智能手机的兴起,能够实时交换信息的即时通讯工具越来越受到人们的欢迎。
即时通讯工具中随着信息的累积与用户的增多,人们需要对信息进行搜索,搜索也是目前即时通讯工具中必不可少的功能。目前即时通讯中的搜索功能主要包括用户搜索、消息搜索、文件搜索等。常见的搜索入口为统一入口,通过统一搜索入口进行系统搜索。但是这种方案需要用户从聊天界面切换到搜索入口,操作麻烦。尤其是当用户使用PC客户端时,需要用户将手从键盘上离开,以操作鼠标打开搜索入口,然后再将手回到键盘输入搜索内容,在得到搜索结果后,还需要再次将手从键盘上离开,以操作鼠标切换回聊天界面。繁琐的操作过程导致用户体验很差。
另外,上述方案还忽略了这样一种需求:即用户不仅需要系统搜索,还需要询问式搜索(通过聊天会话)。比如用户需要“***”文档,现行的信息搜索方法是在统一搜索入口处输入“***”进行系统搜索,如果搜索不到,或者担心文档更新者并没有把最近更新的文件传送到系统中,用户也会在聊天会话中询问“谁有***文档”。在即时通讯聊天会话中,特别是群会话中,这样的场景还是很常见的,显然现有的信息搜索方法无法高效、方便地满足用户需求。
发明内容
本发明要解决的技术问题是提供一种信息搜索方法及设备,使得用户获取所需信息更加简单、高效。
为了解决上述技术问题,根据本发明的一个方面,提供了一种信息搜索方法,包括:
接收客户端发送来的消息,所述消息中包含有标识符,所述标识符用以标识搜索关键词和/或搜索类型;
根据所述标识符从消息中提取出搜索关键词;
根据所述搜索关键词在数据库中搜索相关信息,并将搜索结果发送给所述客户端。
进一步地,还包括:将所述客户端发送来的消息发送给一个或多个其他客户端。
进一步地,将所述搜索结果发送给一个或多个其他客户端。
进一步地,所述搜索关键词类型为文档相关类型时,对搜索结果按照以下原则至少之一进行排序:文件名匹配字数、文件名总长度、文件更新时间。
进一步地,所述搜索关键词类型为文档相关类型时,根据所述搜索关键词在数据库中搜索,并将搜索结果发送给所述客户端的方法为:
在数据库中搜索是否存在文档名称与所述搜索关键词匹配度高于一预设值的文档,若存在,选取匹配度最高的文档作为搜索结果发送给所述客户端;若不存在,将未搜索到相关文档作为搜索结果发送给所述客户端;
若匹配度最高的文档有多个,选取文档名称最短的文档作为搜索结果发送给所述客户端;
若匹配度最高且文档名称最短的文档有多个,选取上传时间或修改时间最晚的文档作为搜索结果发送给所述客户端。
进一步地,所述搜索关键词类型为人员相关类型时,根据所述搜索关键词在数据库中搜索,并将搜索结果发送给所述客户端的方法为:
在数据库中搜索是否存在与所述搜索关键词相对应的人员信息,若存在,将所述搜索关键词相对应的人员信息作为搜索结果发送给所述客户端,或者将所述搜索关键词相对应的人员信息的页面链接作为搜索结果发送给所述客户端;若不存在,将未搜索到相关人员信息作为搜索结果发送给所述客户端。
进一步地,在所述接收客户端发送来的消息步骤中还包括:删除所述消息中包含的搜索标识符后将所述消息呈现在所述即时通讯场景下。
进一步地,在所述提取搜索关键词的步骤中,提取所述搜索关键词的方式包括:根据所述标识符截取关键词,或者,根据自动分词的结果提取与搜索对象类型匹配的关键词。
进一步地,所述数据库包括即时通讯场景参与者的人员数据库和所述即时通讯场景中存储的文件数据库。
进一步地,所述搜索关键词类型为文件相关类型时,在所述文件数据库中搜索不到匹配的信息时,转到所述人员数据库中进行搜索;如果在所述人员数据库中搜索到了匹配的结果,将该人员数据库中涉及的参与者的链接返回发送所述消息的客户端,并提示该参与者拥有被搜索的信息。
进一步地,所述将搜索结果发送给所述客户端步骤包括:将搜索结果信息直接返回,或者将搜索结果信息有关的链接返回。
根据本发明的另一方面,还提供一种信息搜索装置,包括:
接收模块,用于接收客户端发送来的消息,所述消息中包含有标识符,所述标识符用以标识搜索关键词。
提取模块,用于根据所述标识符从消息中提取出搜索关键词。
搜索模块,用于根据所述搜索关键词在数据库中搜索。
发送模块,用于将搜索结果发送给所述客户端。
根据本发明的另一方面,还提供一种终端设备,包括:输入装置、处理器和存储器,以及被存储在所述存储器上的程序,所述程序被配置成由所述处理器执行,所述程序包括用于执行以下步骤的指令:
接收用户通过所述输入装置输入的消息,所述消息中包含有标识符,所述标识符用以标识搜索关键词;
将所述消息发送给服务器;
从所述服务器接收消息。
根据本发明的另一方面,还提供了一种服务器设备,包括处理器和存储器,以及被存储在所述存储器上的程序,所述程序被配置成由所述处理器执行,所述程序包括用于执行以下步骤的指令:
接收终端设备发送来的消息,所述消息中包含有标识符,所述标识符用以标识搜索关键词;
根据所述标识符从消息中提取出搜索关键词;
根据所述搜索关键词在数据库中搜索,并将搜索结果发送给所述终端设备。
本发明通过在消息中添加用于标识搜索关键字的标识符,使服务器在接收收到消息后可以从消息中提出取搜索关键词进行搜索,并将搜索结果反馈给用户,用户无须从聊天界面切换到搜索入口,大大提高了用户搜索信息的便利性,同时提高了搜索效率。另外,服务器还可以将用户的消息转发给其他用户,以便用户无法从服务器得到满意的搜索结果时,还可以从其他用户处获得需要的文档或信息。本发明适用于各种有搜索需求的场景,尤其适用于即时通讯场景下的询问时搜索。
附图说明
图1为本发明一个实施例的信息搜索方法流程示意图。
图2是本发明另一实施例的信息搜索方法的流程示意图。
图3是本发明另一实施例的信息搜索方法的流程示意图。
图4是本发明中对搜索结果进行处理的流程示意图。
图5是本发明另一实施例的信息搜索装置的结构示意图。
具体实施方式
下面将结合附图对本发明技术方案的实施例进行详细的描述。以下实施例仅用于更加清楚地说明本发明的技术方案,因此只是作为示例,而不能以此来限制本发明的保护范围。
需要注意的是,除非另有说明,本申请使用的技术术语或者科学术语应当为本发明所属领域技术人员所理解的通常意义。
根据本发明的一个方面,如图1所示,一种信息搜索方法,包括:
步骤S110,接收客户端发送来的消息,所述消息中包含有标识符,所述标识符用以标识搜索关键词和/或搜索类型。
客户端发送来的消息由客户端用户在客户端输入,可以在即时通信场景下输入实现询问式搜索,比如在群聊、单聊等场景下通过聊天方式(比如一方提问,一方或多方应答)直接进行搜索。用户在客户端输入消息的同时,还需要在消息中输入用以标识搜索关键词和/或搜索类型的标识符(下文也简称搜索标识符)。
标识符可以直接标识搜索关键词,比如,定义标识符“<”和“>”内的内容为搜索关键词,对标识符“<”和“>”括起来的内容直接进行搜索。由于消息搜索一般是通过本地缓存进行搜索的,因此可以根据不同的搜索需求对应不同的搜索类型,可以用特殊符号作为标识符来标识搜索类型,不同类型的搜索对应不同类型的搜索标识符,搜索类型包括文件信息类型和人员信息类型,比如标识符“#”代表对文件信息进行搜索,标识符“&”代表对人员信息进行搜索。搜索标识符可以是系统预先定义好的,也可以是用户根据自己的使用习惯自定义设置好的。
标识符优选使用聊天场景很少使用的字符,例如上述的“<”、“>”和“&”等。“<”、“>”也可以由“{”和“}”替代,优点是中文用户(或其他非拉丁语系用户)无须切换输入法即可输入。而“<”、“>”需要用户切换成英文输入法才能输入,在中文输入法下输入的是“《”“》”,而这两个字符在聊天时往往会被用来表示书名、文章名等。使用“{”和“}”可以最大程度的简化用户的输入操作。
标识符也可以采用ASCII码中其他不常用的字符,或其他字符编码中的字符,这些字符可以由用户通过快捷键输入。标识符也可以采用对用户不可见的字符,但这些字符可以被计算机读取。
标识符也可以在聊天窗口的输入系统中添加。例如在聊天窗口的界面上显示一个按钮,通过符号或文字提示用户该按钮为“添加搜索标识符”的输入按钮,当用户点击该按钮时,在聊天窗口的输入区域中添加搜索标识符(例如“{”和“}”),然后由用户在搜索标识符之间输入搜索关键词。另外,也可以先由用户在聊天窗口输入区域中已输入的文字里选取搜索关键词,然后再点击聊天窗口的界面上“添加搜索标识符”按钮,系统自动将搜索标识符添加到用户选取的搜索关键词两侧。当然,前、后两个搜索标识符也可以分别输入,即由用户先点击聊天窗口的界面上“添加搜索标识符”按钮,插入前搜索标识符,接着由用户输入搜索关键词,然后由用户再次点击聊天窗口的界面上“添加搜索标识符”按钮,插入后搜索标识符。
添加搜索标识符的操作不限于由聊天窗口的界面上的按钮触发,还可以由任何可行的方式触发,例如触控手势、终端设备上的实体按钮、语音等。
步骤S120,根据所述标识符从消息中提取出搜索关键词。
搜索标识符的标识范围可以为精准匹配,或者分词匹配。当标识符标识了搜索关键词时,根据标识符直接截取搜索关键词,对截取出的搜索关键词进行后续搜索操作,比如对标识符“<”和“>”括起来的内容直接截取为搜索关键词,进行精确匹配搜索。
当标识符标识了搜索类型时,根据情况可进行精准匹配搜索,也可以进行分词匹配搜索,比如对结尾添加了标识符的语句触发后台服务器进行分词,根据分词的结果提取与搜索对象类型匹配的关键词进行搜索,分词匹配既可以由后台服务器来完成,也可以由客户端来完成。假设结尾添加了标识符“&”代表搜索人员信息,当实时聊天场景有人询问“谁有张三的联系方式?&”时,则触发后台服务器进行分词,得到与人员信息有关的“张三”关键词后,对分词产生的“张三”进行搜索,得到“张三”的人员信息。
当既有标识了搜索关键词的标识符,又有标识了搜索类型的标识符时,则可根据上述规则同时进行关键词提取搜索。假设结尾添加了标识符“#”代表搜索文档信息,标识符“<”和“>”内的内容为要精确搜索的关键词,则当实时聊天场景有人询问“谁有三亚的<旅游攻略>#”,则对“旅游攻略”及分词后的“三亚”作为搜索关键词搜索相关的文档。
步骤S130,根据所述搜索关键词在数据库中搜索目标信息,并将搜索结果发送给所述客户端。
数据库可以是与即时通信场景关联的数据库,包括即时通信场景中存储的文件数据库或即时通讯场景参与者的人员数据库;也可以是系统存储的数据库。根据搜索关键词在数据库中进行搜索,搜索对象类型包括文件信息搜索和/或人员信息搜索;搜索目标信息的方式包括精准匹配或者模糊匹配,之后将搜索结果返回给客户端,包括将搜索结果信息直接返回,或者将搜索结果信息有关的链接返回,同时,也可以在即时通信场景内同步显示。
本实施例中,通过在消息中添加用于标识搜索关键字的标识符,使服务器在接收收到消息后可以从消息中提出取搜索关键词进行搜索,并将搜索结果反馈给用户,用户无须从聊天界面切换到搜索入口,大大提高了用户搜索信息的便利性,同时提高了搜索效率。
作为上述实施例的进一步改进,服务器还可以将客户端发送来的消息发送给一个或多个其他客户端,由其他客户端的用户对发送消息的用户的问题进行回答。当发送给多个其他客户端时,可以分别发送给多个其他客户端,也可以以群聊的方式发送给其他客户端。如此,当用户无法从服务器得到满意的搜索结果时,还可以从其他用户处获得需要的文档或信息。服务器在将消息发送给其他客户端前,可以先删除消息中的标识符。是否删除标识符取决于业务要求,如果业务要求搜索结果对聊天会话全员可见,则不用去掉标识符;否则最好去掉搜索标识符,这样不会使聊天会话中其他成员产生疑惑,不影响即时通信场景中其他参与者正常理解该消息,即删除消息中包含的搜索标识符后将该消息呈现在当前即时通信场景下。当采用对用户不可见的标识符时,无论何种需求,都可以不对标识符进行处理。
对应的,对于搜索到的文档或信息,不仅可以发送给发送需求的客户端,还可以根据业务需要发送给其他客户端,以供其他用户使用。其他客户端与发送需求的客户端可以是彼此相关联的客户端(比如均共处于同一个工作群组),也可以是彼此不相关联的客户端。进一步的,还可以将搜索到的文档或信息只发送给发送需求的客户端,对于表示搜索成功的结果发送给其他客户端,这样其他用户在看到发出消息的用户已经获得需要的文档或信息时,就不必再花时间进行答复了。
基于上述实施例的原理,本发明还提供另一种实施例,为了阐述方便,对于相同步骤的原理不再重复阐述。如图2和图3所示,一种信息搜索方法,包括:
步骤S210,接收客户端发送来的消息,所述消息中包含有标识符,所述标识符用以标识搜索关键词。
步骤S220,根据搜索标识符判断搜索对象类型。
标识符还可以用以标识搜索关键词的类型,搜索关键词类型可以包括文档相关类型和人员相关类型。当然,还可以包括其他的搜索类型。不同的搜索类型添加不同的自定义标识符,这个标识符是与后台服务器事先定义好的。
步骤S230,根据搜索标识符和搜索对象类型从所述消息中提取搜索关键词。
文档相关类型的搜索关键词主要用于对文档的搜索。针对文档搜索的一应用示例,用户在聊天会话输入系统中在搜索关键字两侧添加搜索特殊标识符(比如“<”、“>”),同时服务器后台也添加对“<”、“>”标识符的过滤。比如用户如果想要“专利交底书文档”,原本输入内容应该为“谁有专利交底书文档?”,通过添加标识符,现在的输入内容变成“谁有<专利交底书>文档?”,点击发送后发送到后台服务器同时显示在聊天会话中,后台服务器过对搜索特殊标识符“<”、“>”进行过滤识,识别出搜索关键字“专利交底书”,并去掉特殊标识符“<”、“>”还原正常消息“谁有专利交底书文档?”后发送给聊天会话中的其他成员。后台服务器针对搜索关键字在后台进行文件的系统搜索,首先对本聊天会话中产生的文件进行搜索,如果没有,可以对聊天会话外的文件进行搜索,对于系统搜索结果则只发送给发送搜索请求消息的用户,聊天会话中其他成员不接收系统搜索结果消息,但仍可以针对询问式搜索进行回答。
人员相关类型的搜索关键词主要用于对人员的搜索。针对人员搜索的一应用示例,在聊天会话输入系统中添加搜索特殊标识符“&”,用户在询问人员信息(电话或邮箱)的聊天内容中添加人员搜索标识符“&”,服务器接收内容进行过滤,如果包含“&”,比如用户如果输入“谁有李洋电话?&”,后台服务器通过分词工具进行分词后得到人名的关键词“李洋”,并针对该关键字在后台进行系统搜索,得到李洋的电话和/或李洋的其他联系方式(比如邮箱),同时对于搜索结果则只发送给发出搜索请求消息的用户,聊天会话中其他成员不接收系统搜索结果消息,但仍可以针对询问式搜索进行回答。
本发明通过以上的信息关键词提取方法,实现了直接通过询问的方式进行搜索,同时不影响聊天会话中其他成员的正常消息收发,也不影响原有的系统搜索方式,用户操作起来更加方便、便捷。
步骤S240,根据所述搜索关键词在数据库中搜索目标信息,并将搜索结果发送给所述客户端。
如图4所示,针对搜索关键词类型为文档相关类型的信息搜索方法,对搜索结果可以按照以下原则至少之一进行排序:文件名匹配字数、文件名总长度、文件更新时间,比如单独以其中任意一个原则进行排序;或者以其中任意两个原则进行排序,比如以文件名匹配字数和文件更新时间进行排序时,对于文件名匹配字数相同的情况下,以文件更新时间为最新时间的文档作为搜索结果。
比如,服务器在数据库中搜索是否存在文档名称与所述搜索关键词匹配度高于一预设值的文档,若存在,选取匹配度最高的文档作为搜索结果发送给所述客户端;若不存在,将未搜索到相关文档作为搜索结果发送给所述客户端。
若匹配度最高的文档有多个,选取文档名称最短的文档作为搜索结果发送给所述客户端。
若匹配度最高且文档名称最短的文档有多个,选取上传时间或修改时间最晚的文档作为搜索结果发送给所述客户端。
若通过上述方式,均搜索不到匹配信息时,则转到与即时通信场景参与者关联的数据库中进行搜索。如果在即时通讯场景的某个参与者关联的数据库中搜索到了匹配的结果,将该参与者的链接返回发送所述消息的客户端,并提示该参与者拥有被搜索的信息。
具体地,例如服务器在上传文件和新建人员的时候向搜索引擎服务器(例如Solr)中添加数据。当收到“谁有<产品使用手册>?”的消息时,截取特殊字符中的文字“产品使用手册”去搜索引擎服务器(Solr)中去查询本聊天信息中的文档信息,Solr会返回文档的列表,再用下面的算法筛选出最优的文档或文档列表(根据业务要求)。
步骤一:比较搜索匹配度分值。例如搜索结果是:
文档a:“产品使用手册文档”;
文档b:“推送系统CloudPush的使用手册”;
文档a的匹配部分是“产品使用手册”,长度是6,则文档a的匹配度分值计为6分。文档b的匹配部分是“使用手册”,匹配度分值计为4分。文档a的匹配度分值高于文档b的匹配度分值,则选文档a为最优的文档作为搜索结果。
如果匹配度分值相同,则再执行步骤二:
比较文档名称总长度,文档名的总长度最短的为最优解。
例如搜索结果是:
文档a:“产品使用手册文档”;
文档b:“推送系统CloudPush的产品使用手册文档”;
文档a的长度比文档b的短,选文档a为最优文档。
如果文档总长度相同,则再执行步骤三:
比较文档的上传时间,将上传时间晚的文档即为最优文档。
例如搜索出文档a和文档b的名称都是“产品使用手册文档”,则比较文档a和文档b的上传时间,上传时间晚的文档即为最优文档。
如果本聊天会话中没有搜索到文档信息,还去聊天信息外搜索。但由于安全原因,此时一般不直接返回给用户文档信息,而是返回给用户文档上传者的名片信息,用户可以向上传者去索要相关文档。
针对搜索关键词类型为人员相关类型的信息搜索方法可以为:
在数据库中搜索是否存在与所述搜索关键词相对应的人员信息,若存在,将所述搜索关键词相对应的人员信息作为搜索结果发送给所述客户端,或者将所述搜索关键词相对应的人员信息的页面链接作为搜索结果发送给所述客户端;若不存在,将未搜索到相关人员信息作为搜索结果发送给所述客户端。
具体地,例如用户在即时通讯系统聊天会话的输入系统中输入正常的聊天询问语句,比如“谁有李洋电话?”。
服务器配置触发搜索人员的关键字,例如“电话”、“手机号”等等。客户端输入语句“谁有李洋的电话?”,触发搜索人员的操作,利用开源分词工具(例如Ansj),分词结果:[谁/r,有/v,李洋/nr,的/uj,电话/n,?/w],字符“/”左边是分词,右边是分词的词性,nr代表人名,取出“李洋”,用“李洋”调用Solr查询,还可以再用“李洋”的全拼liyang调用Solr查询,将两次查询结果合并,并且将查询到的完全匹配的李洋排在前面,例如结果中有“李洋”、“李阳”两条信息。如果只有一个搜索结果,返回单个人员搜索类型消息,用户点击消息后跳转到人员个人名片页面;如果有多个结果,返回多个人员搜索类型消息,用户点击消息后跳转到人员列表页面,点击列表项跳转到个人名片页面。
聊天会话中其他成员看到提问者发送的提问,也可以进行回答。回答消息服务器一般不进行过滤,发送给聊天会话中所有成员。
通过本发明的搜索方法与流程,基于即时通讯特别的聊天基因,可以同时进行询问式搜索与系统搜索,在即时通讯工具中提高搜索效率和用户体验。另外,还可以对系统搜索结果进行分类,并展示成不同类型的消息,点击分别跳转到不同的处理页面。
与上述方法相对应的,根据本发明的另一方面,如图5所示,还提供一种信息搜索装置,由于原理与方法对应,在此不再展开赘述。信息搜索装置包括:
接收模块510,用于接收客户端发送来的消息,所述消息中包含有标识符,所述标识符用以标识搜索关键词。
提取模块520,用于根据所述标识符从消息中提取出搜索关键词。
搜索模块530,用于根据所述搜索关键词在数据库中搜索。
发送模块540,用于将搜索结果发送给所述客户端。
根据本发明的另一方面,还提供一种终端设备,包括:输入装置、处理器和存储器,以及被存储在存储器上的程序,程序被配置成由处理器执行,程序包括用于执行以下步骤的指令:
接收用户通过输入装置输入的消息,消息中包含有标识符,标识符用以标识搜索关键词;
将消息发送给服务器;
从服务器接收消息。
其中,标识符由用户通过程序界面上的输入区域输入或通过键盘输入。一般来讲,当终端设备为手机、平板电脑等带有触摸输入装置的设备时,优选采用程序界面上的输入区域输入。例如通过显示在手机触控屏幕的虚拟键盘,或程序界面上的特定虚拟按钮。当终端设备为PC等主要由物理键盘实现操作的设备时,优选采用键盘输入。当然,对于配置有鼠标等光标操控装置的终端设备,例如PC,也可以采用光标操控装置在程序界面上选取输入。
对于通过标识符标识搜索关键词可以有多种方案。其中一种方案是标识符包括至少两个,两个标识符分别位于搜索关键词的两侧,用以标识出搜索关键词。基于该方案输入标识符的方法也有多少,其中第一种方法为:
接收用户输入的第一个标识符;
接收用户输入的搜索关键词;
接收用户输入的第二个标识符。
如此,用户按顺序输入第一个标识符、搜索关键词和第二个标识符,两个标示符分别被输入到了搜索关键词两侧,从而标识出搜索关键词。该方法未改变通常的输入方式,简单方便,易于掌握。
用户在输入第一个标识和第二个标识符时,可以通过键盘输入,也可以通过点击程序界面的预设按钮输入。可以通过不同的键盘按键或预设按钮输入第一个标识和第二个标识符,也可以通过同一个键盘按键或预设按钮输入第一个标识和第二个标识符,由程序自动识别是第一个标识还是第二个标识符。
向搜索关键词的两侧输入标识符的另一种方法为:
接收用户输入的消息;
接收用户的选取搜索关键词的指令;
将消息分解成一个或多个词;
根据预设的选取规则或者由用户通过输入装置从分解后的词中选取出搜索关键词,再在选取出的搜索关键词两侧添加表示搜索关键词的标识符。
当用户仅想搜索某一个词时,输入的消息中也仅有一个词以及用于表示分词的标识符,此时分解后的词也只有一个。当用户输入一个包含多个词的语句时,分解后的词相应有多个。
该方法的优点是用户在输入消息过程中不必考虑输入标识符,而在消息输入完毕后通过指令触发分词,再选取搜索关键词。输入消息的过程不会被打断,也无需在消息中输入标识符,更自然流畅。用户可以通过键盘快捷键来输入选取搜索关键词的指令,也可以通过触发程序界面上的特定按钮来输入选取搜索关键词的指令。
另外一种通过标识符标识搜索关键词的方案是,用户输入的标识符仅有一个,当消息中具有该标识符时,对消息进行分词,再选取搜索关键词。
具体地,终端设备的存储器里所存储的程序还包括用于执行以下步骤的指令:检测消息中是否包含有用于表示分词的标识符,若有,将消息分解成一个或多个词,并从分解后的词中选取出搜索关键词,再在选取出的搜索关键词两侧添加表示搜索关键词的标识符。同样,当用户仅想搜索某一个词时,输入的消息中也仅有一个词以及用于表示分词的标识符,此时分解后的词也只有一个。当用户输入一个包含多个词的语句时,分解后的词相应有多个。
从分解后的词中选取出搜索关键词,可以根据预设的选取规则选取,也可以由用户通过输入装置选取。根据预设的选取规则选取,例如可以预置关键词,这些预置的关键词根据统计或使用场景选取,例如“电话”、“手机”、“手机号”等。将分解后的词分别与预置的关键词进行比较,若发现某个词与预置的某关键词相匹配,则将该词选取为搜索关键词。当有多个词匹配时,可以为各预置的关键词设置权重,选取权重大的预置关键词对应的词作为搜索关键词。一条消息里的搜索关键词可以有一个,也可以有多个。
另外,由用户通过输入装置选取搜索关键词时,可以由用户通过作为输入装置的触控屏或鼠标选取。也可以将每个搜索关键词映射为作为输入装置的键盘上的一个或多个按键,由用户通过键盘上的一个或多个按键选取。例如,将分解后词按顺序分别映射为数字1、2、3、……等,用户通过键盘上的数字选取相应关键词。
对消息进行分词并选取搜索关键词的操作可以如上所述在终端设备上完成,其优点是或者由用户选取,其选取的搜索关键词准确无误。或者由预设规则自动选取时,即使选取不准确,也可以由用户及时纠正。当然,也可以在用户输入完消息后不进行分词操作,而是将带有标识符的消息直接发送给服务器,由服务器来完成分词并选取搜索关键词的操作。
根据本发明的另一方面,还提供了一种服务器设备,该服务器设备的一实施例包括处理器和存储器,以及被存储在存储器上的程序,程序被配置成由处理器执行,其特征在于,程序包括用于执行以下步骤的指令:
接收终端设备发送来的消息,消息中包含有标识符,标识符用以标识搜索关键词;
根据标识符从消息中提取出搜索关键词;
根据搜索关键词在数据库中搜索,并将搜索结果发送给终端设备。
其中,标识符包括至少两个,两个标识符分别位于搜索关键词的两侧,根据标识符从消息中提取出搜索关键词的方法为:
将两个标识符之间的字符提取出来作为搜索关键词。
另外,标识符也可以仅有一个用于表示分词的标识符,根据标识符从消息中提取出搜索关键词的方法为:
检测消息中是否包含有用于表示分词的标识符,若有,将消息分解成一个或多个词,并根据预设的选取规则从分解后的词中选取出搜索关键词。
另外,本实施例中的程序还可以包括用于执行以下步骤的指令:
将终端设备发送来的消息和/或搜索结果发送给一个或多个其他终端设备。
优选地,在将消息发送给一个或多个其他终端设备前,删除消息中的标识符。
本发明中对于不同的搜索类型结果,服务器会返回给提问者不同的搜索类型消息,提问者点击不同的类型消息,跳转到不同的处理页面,比如某人搜索了“谁有产品使用手册?”,服务器会返回文件搜索类型消息与名片类型搜索消息(例如消息内容为“张某某发布过某某产品技术白皮书,你可以找他要”),点击文件类型搜索消息跳转到技术白皮书文件详情,点击名片消息跳转到张某某名片,可以查看张某某详情,可以发送消息向他询问最新文档等。
在本发明中,对于文档搜索,如果采用分词方案,由于文件名称规则不统一,可能造成搜索结果不准确,所以采用搜索关键词的精准匹配更为优选。而对于用户搜索,由于对人名的分词结果较为准确,采用分词方案更为优选。
通过本发明的实施例,基于即时通讯特别的聊天基因,可以同时进行询问式搜索与系统搜索,在即时通讯工具中提高搜索效率和用户体验。
本发明可以对系统搜索结果进行分类,并展示成不同类型的消息,点击分别跳转到不同的处理页面。
本领域普通技术人员可以理解:附图只是一个实施例的示意图,附图中的模块或流程并不一定是实施本发明所必须的。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置或系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的装置及系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

Claims (10)

1.一种信息搜索方法,其特征在于,包括:
接收客户端发送来的消息,所述消息中包含有标识符,所述标识符用以标识搜索关键词和/或搜索类型;
根据所述标识符从消息中提取出搜索关键词;
根据所述搜索关键词在数据库中搜索相关信息,并将搜索结果发送给所述客户端。
2.根据权利要求1所述的信息搜索方法,其特征在于,还包括:
将所述客户端发送来的消息发送给一个或多个其他客户端。
3.根据权利要求1所述的信息搜索方法,其特征在于,将所述搜索结果发送给一个或多个其他客户端。
4.根据权利要求3所述的信息搜索方法,其特征在于,所述搜索关键词类型为文档相关类型时,对搜索结果按照以下原则至少之一进行排序:文件名匹配字数、文件名总长度、文件更新时间。
5.根据权利要求4所述的信息搜索方法,其特征在于,所述搜索关键词类型为文档相关类型时,根据所述搜索关键词在数据库中搜索,并将搜索结果发送给所述客户端的方法为:
在数据库中搜索是否存在文档名称与所述搜索关键词匹配度高于一预设值的文档,若存在,选取匹配度最高的文档作为搜索结果发送给所述客户端;若不存在,将未搜索到相关文档作为搜索结果发送给所述客户端;
若匹配度最高的文档有多个,选取文档名称最短的文档作为搜索结果发送给所述客户端;
若匹配度最高且文档名称最短的文档有多个,选取上传时间或修改时间最晚的文档作为搜索结果发送给所述客户端。
6.根据权利要求3所述的信息搜索方法,其特征在于,所述搜索关键词类型为人员相关类型时,根据所述搜索关键词在数据库中搜索,并将搜索结果发送给所述客户端的方法为:
在数据库中搜索是否存在与所述搜索关键词相对应的人员信息,若存在,将所述搜索关键词相对应的人员信息作为搜索结果发送给所述客户端,或者将所述搜索关键词相对应的人员信息的页面链接作为搜索结果发送给所述客户端;若不存在,将未搜索到相关人员信息作为搜索结果发送给所述客户端。
7.根据权利要求1所述的信息搜索方法,其特征在于,在所述接收客户端发送来的消息步骤中还包括:删除所述消息中包含的搜索标识符后将所述消息呈现在所述即时通讯场景下。
8.根据权利要求1所述的信息搜索方法,其特征在于,在所述提取搜索关键词的步骤中,提取所述搜索关键词的方式包括:根据所述标识符截取关键词,或者,根据自动分词的结果提取与搜索对象类型匹配的关键词。
9.根据权利要求1所述的信息搜索方法,其特征在于,所述数据库包括即时通讯场景参与者的人员数据库和所述即时通讯场景中存储的文件数据库。
10.根据权利要求9所述的信息搜索方法,其特征在于,所述搜索关键词类型为文件相关类型时,在所述文件数据库中搜索不到匹配的信息时,转到所述人员数据库中进行搜索;如果在所述人员数据库中搜索到了匹配的结果,将该人员数据库中涉及的参与者的链接返回发送所述消息的客户端,并提示该参与者拥有被搜索的信息。
CN201711278988.8A 2017-12-06 2017-12-06 一种信息搜索方法、搜索装置、终端设备和服务器设备 Active CN108038165B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711278988.8A CN108038165B (zh) 2017-12-06 2017-12-06 一种信息搜索方法、搜索装置、终端设备和服务器设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711278988.8A CN108038165B (zh) 2017-12-06 2017-12-06 一种信息搜索方法、搜索装置、终端设备和服务器设备

Publications (2)

Publication Number Publication Date
CN108038165A true CN108038165A (zh) 2018-05-15
CN108038165B CN108038165B (zh) 2021-07-06

Family

ID=62095634

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711278988.8A Active CN108038165B (zh) 2017-12-06 2017-12-06 一种信息搜索方法、搜索装置、终端设备和服务器设备

Country Status (1)

Country Link
CN (1) CN108038165B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108874975A (zh) * 2018-06-08 2018-11-23 Oppo(重庆)智能科技有限公司 搜索内容推荐方法、装置、终端设备及存储介质
CN110336731A (zh) * 2019-04-26 2019-10-15 上海掌门科技有限公司 一种群组中的用户匹配方法及设备
CN110598009A (zh) * 2019-09-12 2019-12-20 北京达佳互联信息技术有限公司 查找作品的方法、装置、电子设备及存储介质
CN112000620A (zh) * 2020-08-14 2020-11-27 深圳市绿联科技有限公司 文件搜索方法、装置及设备
CN113158094A (zh) * 2021-03-31 2021-07-23 北京达佳互联信息技术有限公司 信息分享方法、装置及电子设备
CN113792186A (zh) * 2021-08-16 2021-12-14 青岛海尔科技有限公司 用于人名检索的方法、装置、电子设备及存储介质
CN113836350A (zh) * 2021-09-23 2021-12-24 深圳绿米联创科技有限公司 录像视频检索方法、系统、装置、存储介质及电子设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1965314A (zh) * 2004-04-19 2007-05-16 雅虎公司 用于在即时消息环境中进行内嵌搜索的技术
KR20140132630A (ko) * 2013-05-08 2014-11-18 에스케이플래닛 주식회사 메시징 서비스 기반의 대화 중 검색 기능 제공 방법, 이를 위한 프로그램을 기록한 기록 매체 및 단말
US20160330150A1 (en) * 2015-05-06 2016-11-10 Kakao Corp. Message service providing method for message service linked to search service and message server and user terminal to perform the method

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1965314A (zh) * 2004-04-19 2007-05-16 雅虎公司 用于在即时消息环境中进行内嵌搜索的技术
KR20140132630A (ko) * 2013-05-08 2014-11-18 에스케이플래닛 주식회사 메시징 서비스 기반의 대화 중 검색 기능 제공 방법, 이를 위한 프로그램을 기록한 기록 매체 및 단말
US20160330150A1 (en) * 2015-05-06 2016-11-10 Kakao Corp. Message service providing method for message service linked to search service and message server and user terminal to perform the method

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108874975A (zh) * 2018-06-08 2018-11-23 Oppo(重庆)智能科技有限公司 搜索内容推荐方法、装置、终端设备及存储介质
CN110336731A (zh) * 2019-04-26 2019-10-15 上海掌门科技有限公司 一种群组中的用户匹配方法及设备
CN110598009A (zh) * 2019-09-12 2019-12-20 北京达佳互联信息技术有限公司 查找作品的方法、装置、电子设备及存储介质
CN110598009B (zh) * 2019-09-12 2022-04-22 北京达佳互联信息技术有限公司 查找作品的方法、装置、电子设备及存储介质
CN112000620A (zh) * 2020-08-14 2020-11-27 深圳市绿联科技有限公司 文件搜索方法、装置及设备
CN113158094A (zh) * 2021-03-31 2021-07-23 北京达佳互联信息技术有限公司 信息分享方法、装置及电子设备
CN113158094B (zh) * 2021-03-31 2024-03-01 北京达佳互联信息技术有限公司 信息分享方法、装置及电子设备
CN113792186A (zh) * 2021-08-16 2021-12-14 青岛海尔科技有限公司 用于人名检索的方法、装置、电子设备及存储介质
CN113792186B (zh) * 2021-08-16 2023-07-11 青岛海尔科技有限公司 用于人名检索的方法、装置、电子设备及存储介质
CN113836350A (zh) * 2021-09-23 2021-12-24 深圳绿米联创科技有限公司 录像视频检索方法、系统、装置、存储介质及电子设备
CN113836350B (zh) * 2021-09-23 2024-02-27 深圳绿米联创科技有限公司 录像视频检索方法、系统、装置、存储介质及电子设备

Also Published As

Publication number Publication date
CN108038165B (zh) 2021-07-06

Similar Documents

Publication Publication Date Title
CN108038165A (zh) 一种信息搜索方法、搜索装置、终端设备和服务器设备
US11100065B2 (en) Tools and techniques for extracting knowledge from unstructured data retrieved from personal data sources
CN109800352B (zh) 基于剪贴板进行信息推送的方法、系统及终端设备
CN109873745B (zh) 通信控制方法、装置及存储介质
US11176453B2 (en) System and method for detangling of interleaved conversations in communication platforms
CN101595447B (zh) 输入预测
CN106796682B (zh) 填充用户联系人条目
CN108062316A (zh) 一种辅助客户服务的方法和装置
CN105653673B (zh) 信息搜索方法及装置
JP2008507792A (ja) ネットワーク上に配置される、背景状況を利用するサーチエンジン
KR102277300B1 (ko) 검색 서비스와 연결된 메시지 서비스를 위한 메시지 서비스 제공 방법 및 상기 메시지 서비스 제공 방법을 수행하는 메시지 서버 및 사용자 단말
CN106649409A (zh) 一种基于场景信息显示搜索结果的方法及装置
CN111158831A (zh) 基于即时通讯应用的数据处理方法、装置、设备及介质
CN103678460B (zh) 用于识别适于在多语言环境中进行通信的非文本元素的方法和系统
CN106656748A (zh) 一种信息展示方法及装置,电子设备
CN107168599B (zh) 一种即时通信方法和装置
US20090204589A1 (en) Document management apparatus, method, system, medium storing a program thereof
CN101943991A (zh) 一种基于云计算的输入方法与设备
CN113010255B (zh) 基于捆绑会话组的交互方法、装置和计算机设备
CN109558531A (zh) 新闻信息推送方法、装置以及计算机设备
CN101119339B (zh) 即时通信系统中建立多用户讨论组的方法及装置
CN110929014A (zh) 信息处理方法、装置、电子设备及存储介质
CN106970899A (zh) 一种文本处理方法及装置
CN103457834B (zh) 即时通信中item项触发语音搜索的方法及客户端
CN112567364A (zh) 知识信息创建支援装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant