CN108228802B - 一种输入联想的推荐方法及装置 - Google Patents

一种输入联想的推荐方法及装置 Download PDF

Info

Publication number
CN108228802B
CN108228802B CN201711480871.8A CN201711480871A CN108228802B CN 108228802 B CN108228802 B CN 108228802B CN 201711480871 A CN201711480871 A CN 201711480871A CN 108228802 B CN108228802 B CN 108228802B
Authority
CN
China
Prior art keywords
search
user
input
session data
search query
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711480871.8A
Other languages
English (en)
Other versions
CN108228802A (zh
Inventor
彭睿棋
赵亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Qihoo Technology Co Ltd
Original Assignee
Beijing Qihoo Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Qihoo Technology Co Ltd filed Critical Beijing Qihoo Technology Co Ltd
Priority to CN201711480871.8A priority Critical patent/CN108228802B/zh
Publication of CN108228802A publication Critical patent/CN108228802A/zh
Application granted granted Critical
Publication of CN108228802B publication Critical patent/CN108228802B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/02Input arrangements using manually operated switches, e.g. using keyboards or dials
    • G06F3/023Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
    • G06F3/0233Character input methods
    • G06F3/0237Character input methods using prediction or retrieval techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Human Computer Interaction (AREA)
  • Data Mining & Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种输入联想的推荐方法及装置,其中,该方法包括:预设时间段内接收到用户输入的搜索query时,获取已经记录的该预设时间段内的session数据,并依据建立的搜索关键词的关联性模型,分析当前接收到的搜索query与获取到的session数据是否具有相关性,若是,可以结合当前接收到的搜索query和获取到的预设时间段内的session数据进行输入联想的推荐。由此,本发明实施例能够结合与当前搜索query相关的之前的搜索记录共同为用户推荐输入联想,对于用户的实时搜索query动态改变输入联想候选词的内容,挖掘出用户潜在的搜索词,大大提升了整个搜索输入联想的准确率以及用户的操作体验。

Description

一种输入联想的推荐方法及装置
技术领域
本发明涉及计算机技术领域,特别是涉及一种输入联想的推荐方法及装置。
背景技术
当用户在搜索引擎的搜索框中输入query后,搜索框下方会自动推荐候选词,候选词用于向用户推荐与其输入query语义相关的其他查询,从而降低用户的搜索成本,其中,搜索框下方自动推荐的候选词即为输入联想。
传统的输入联想主要通过字典树模型,基于用户在搜索引擎的搜索频次,按照概率分布和字符前缀依次展现候选词方式进行推荐。但是,这种方式推荐的候选词仅和用户当前搜索的query有关,而无法根据用户的实时搜索需求进行动态改变,存在推荐时效性滞后且准确率较低的问题,不仅无法及时满足用户连续查询需求,还极大地增加了用户的搜索成本。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的输入联想的推荐方法及装置。
根据本发明的一方面,提供了一种输入联想的推荐方法,包括:
预设时间段内接收到用户输入的搜索query时,获取已经记录的该预设时间段内的session数据;
依据建立的搜索关键词的关联性模型,分析当前接收到的搜索query与获取到的所述session数据是否相关;
若是,结合当前接收到的搜索query和所述session数据进行输入联想的推荐。
可选地,所述预设时间段内接收到用户输入的搜索query时,获取已经记录的该预设时间段内的session数据之前,还包括:
实时记录用户在预设时间段内的搜索和/或点击行为产生的session数据,其中,所述session数据包括用户输入的搜索query和/或用户点击的输入联想候选词。
可选地,所述方法还包括:
若依据建立的搜索关键词的关联性模型,分析当前接收到的搜索query与获取到的所述session数据不相关,则基于当前接收到的搜索query推荐输入联想。
可选地,所述结合当前接收到的搜索query和所述session数据进行输入联想的推荐,包括:
从所述关联性模型中查找与当前搜索query和所述session数据均相关的搜索关键词;
从查找到的与当前搜索query和所述session数据均相关的搜索关键词中,获取预设数量的搜索关键词作为输入联想候选词进行推荐。
可选地,所述结合当前接收到的搜索query和所述session数据进行输入联想的推荐,包括:
从输入联想的字典树模型中查找当前搜索query的输入联想候选词;
对查找到的所述预设数量的搜索关键词和与当前搜索query的输入联想候选词进行统一排序,将排序结果作为输入联想进行推荐。
可选地,所述对查找到的所述预设数量的搜索关键词和与当前搜索query的输入联想候选词进行统一排序,包括:
按照所述预设数量的搜索关键词的优先级别高于所述当前搜索query的输入联想候选词的优先级别的顺序进行统一排序。
可选地,所述方法还包括:
收集网络中的用户搜索相关信息,从收集的用户搜索相关信息中提取搜索关键词;
解析所述搜索关键词之间的关联性,并依据解析结果建立所述搜索关键词的关联性模型。
可选地,所述收集网络中的用户搜索相关信息,包括:
收集网络中的用户搜索行为日志,从所述用户搜索行为日志中获取用户搜索相关信息。
可选地,所述用户搜索相关信息包括以下至少之一:
搜索query、搜索query对应的搜索结果、浏览对象信息、接收点击操作的输入联想。
可选地,所述从收集的用户搜索相关信息中提取搜索关键词,包括:
从收集的用户搜索相关信息中解析搜索关键词,对解析到的搜索关键词的特性信息进行统计,得到统计结果;
依据统计结果,从解析到的搜索关键词中提取搜索关键词的特性信息达到指定阈值的搜索关键词。
可选地,所述搜索关键词的特性信息包括以下至少之一:
所述搜索关键词的搜索频次、被点击次数、展示时长、变化率、飙升度。
依据本发明的另一方面,还提供了一种输入联想的推荐装置,包括:
获取模块,适于预设时间段内接收到用户输入的搜索query时,获取已经记录的该预设时间段内的session数据;
分析模块,适于依据建立的搜索关键词的关联性模型,分析当前接收到的搜索query与获取到的所述session数据是否相关;
推荐模块,适于若所述分析模块依据建立的搜索关键词的关联性模型,分析当前接收到的搜索query与获取到的所述session数据相关,结合当前接收到的搜索query和所述session数据进行输入联想的推荐。
可选地,所述装置还包括记录模块,适于:
在所述获取模块在预设时间段内接收到用户输入的搜索query时,获取已经记录的该预设时间段内的session数据之前,实时记录用户在预设时间段内的搜索和/或点击行为产生的session数据,其中,所述session数据包括用户输入的搜索query和/或用户点击的输入联想候选词。
可选地,所述推荐模块还适于:
若所述分析模块依据建立的搜索关键词的关联性模型,分析当前接收到的搜索query与获取到的所述session数据不相关,则基于当前接收到的搜索query推荐输入联想。
可选地,所述推荐模块还适于:
从所述关联性模型中查找与当前搜索query和所述session数据均相关的搜索关键词;
从查找到的与当前搜索query和所述session数据均相关的搜索关键词中,获取预设数量的搜索关键词作为输入联想候选词进行推荐。
可选地,所述推荐模块还适于:
从输入联想的字典树模型中查找当前搜索query的输入联想候选词;
对查找到的所述预设数量的搜索关键词和与当前搜索query的输入联想候选词进行统一排序,将排序结果作为输入联想进行推荐。
可选地,所述推荐模块还适于:
按照所述预设数量的搜索关键词的优先级别高于所述当前搜索query的输入联想候选词的优先级别的顺序进行统一排序。
可选地,所述装置还包括:
收集模块,适于收集网络中的用户搜索相关信息,从收集的用户搜索相关信息中提取搜索关键词;
建立模块,适于解析所述搜索关键词之间的关联性,并依据解析结果建立所述搜索关键词的关联性模型。
可选地,所述收集模块还适于:
收集网络中的用户搜索行为日志,从所述用户搜索行为日志中获取用户搜索相关信息。
可选地,所述用户搜索相关信息包括以下至少之一:
搜索query、搜索query对应的搜索结果、浏览对象信息、接收点击操作的输入联想。
可选地,所述收集模块还适于:
从收集的用户搜索相关信息中解析搜索关键词,对解析到的搜索关键词的特性信息进行统计,得到统计结果;
依据统计结果,从解析到的搜索关键词中提取搜索关键词的特性信息达到指定阈值的搜索关键词。
可选地,所述搜索关键词的特性信息包括以下至少之一:
所述搜索关键词的搜索频次、被点击次数、展示时长、变化率、飙升度。
依据本发明的再一方面,还提供了一种电子设备,包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行根据上文任意实施例的输入联想的推荐方法。
依据本发明的又一方面,还提供了一种计算机可读存储介质,其中,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被包括多个应用程序的电子设备执行时,使得所述电子设备执行根据上文任意实施例的输入联想的推荐方法。
在本发明实施例中,当预设时间段内接收到用户输入的搜索query时,获取已经记录的该预设时间段内的session数据,并依据建立的搜索关键词的关联性模型,分析当前接收到的搜索query与获取到的session数据是否具有相关性,若是,可以结合当前接收到的搜索query和获取到的预设时间段内的session数据进行输入联想的推荐。由此,本发明实施例不仅可以基于用户输入的搜索query推荐输入联想,还能够结合与当前搜索query相关的之前的搜索记录共同为用户推荐输入联想,从而对于用户的实时搜索query动态改变输入联想候选词的内容,挖掘出用户潜在的搜索词,大大提升了整个搜索输入联想的准确率以及用户的操作体验。进一步地,本发明实施例还有效地避免了单纯通过字典树模型进行字符前缀匹配得到输入联想候选词,造成输入联想更新滞后、不能及时满足用户需求的问题,节约了用户的二次输入成本。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
根据下文结合附图对本发明具体实施例的详细描述,本领域技术人员将会更加明了本发明的上述以及其他目的、优点和特征。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了根据本发明一个实施例的输入联想的推荐方法的流程示意图;
图2示出了根据本发明一个实施例的搜索界面示意图;
图3示出了根据本发明另一个实施例的输入联想的推荐方法的流程示意图;
图4示出了根据本发明另一个实施例的搜索界面示意图;
图5示出了根据本发明另一个实施例的搜索界面示意图;
图6示出了根据本发明一个实施例的输入联想的推荐装置的结构示意图;
图7示出了根据本发明另一个实施例的输入联想的推荐装置的结构示意图;
图8示出了用于执行根据本发明的输入联想的推荐方法的计算设备的框图;以及
图9示出了用于保持或者携带实现根据本发明的输入联想的推荐方法的程序代码的存储单元。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
为解决上述技术问题,本发明实施例提供了一种输入联想的推荐方法,该方法可以应用在360浏览器、百度浏览器、UC浏览器等等浏览器中,也可以应用于各类搜索引擎中。图1示出了根据本发明一个实施例的输入联想的推荐方法的流程示意图。参见图1,该方法至少包括步骤S102至步骤S104。
步骤S102,预设时间段内接收到用户输入的搜索query时,获取已经记录的该预设时间段内的session数据。
在该步骤中,session数据可以是用户输入的搜索query,也可以是用户点击的任意输入联想候选词,还可以是用户在搜索过程中得到其他任何与搜索内容相关的数据。
例如,预设时间为15分钟,session数据为在这15分钟内用户的搜索、点击、浏览等行为产生的数据,具体可以包括用户输入的搜索词,基于搜索词得到输入联想候选词后用户的点击操作对应的输入联想候选词等数据。
此处需要说明的是,预设时间段内的session数据,可以是在预设时间段内相同用户ID产生的session数据、也可以是预设时间段内同一终端上的浏览器、搜索引擎产生并记录的session数据等等,本发明实施例对此不做具体限定。
步骤S104,若依据建立的搜索关键词的关联性模型,分析当前接收到的搜索query与获取到的session数据相关,则结合当前接收到的搜索query和session数据进行输入联想的推荐。
在本发明实施例中,当预设时间段内接收到用户输入的搜索query时,获取已经记录的该预设时间段内的session数据,并依据建立的搜索关键词的关联性模型,分析当前接收到的搜索query与获取到的session数据是否具有相关性,若是,可以结合当前接收到的搜索query和获取到的预设时间段内的session数据进行输入联想的推荐。由此,本发明实施例不仅可以基于用户输入的搜索query推荐输入联想,还能够结合与当前搜索query相关的之前的搜索记录共同为用户推荐输入联想,从而对于用户的实时搜索query动态改变输入联想候选词的内容,挖掘出用户潜在的搜索词,大大提升了整个搜索输入联想的准确率以及用户的操作体验。进一步地,本发明实施例还有效地避免了单纯通过字典树模型进行字符前缀匹配得到输入联想候选词,造成输入联想更新滞后、不能及时满足用户需求的问题,节约了用户的二次输入成本。
参见上文步骤S102,在本发明一实施例中,在预设时间段内接收到用户输入的搜索query,并获取已经记录的该预设时间段内的session数据之前,还需要实时记录用户在预设时间段内的搜索和/或点击行为产生的session数据,以为后续提供数据支持。例如,预设时间为15分钟,用户在15分钟之内的搜索和/或点击行为所产生的session数据都会被记录下来,当用户在15分钟内更改之前输入的搜索query、或者重新输入搜索query进行搜索时,可以先获取此前15分钟内记录的如用户输入的其他搜索query、用户点击的输入联想候选词等session数据,进而在后续结合当前搜索query和15分钟内的session数据共同实现输入联想的推荐。此处列举的15分钟仅仅是示意性的,本发明实施例对预设时间不做具体的限定。
参见上文步骤S104,一般情况下展示在搜索框下的输入联想候选词的数量是有限的,仅展示与搜索query相关的、搜索热度较大的多个输入联想候选词。在本发明一实施例中,在结合当前接收到的搜索query和session数据进行输入联想的推荐时,可以先从关联性模型中查找与当前搜索query和session数据均相关的多个搜索关键词,然后,从查找到的多个搜索关键词中获取预设数量的搜索关键词作为输入联想候选词进行推荐。其中,搜索关键词的预设数量可以是任意数值,例如选出3个、5个、8个、10个等数量的搜索关键词作为输入联想候选词进行推荐。
在本发明实施例中,为了增加输入联想候选词的丰富性,不仅可以将从关联性模型中查找到的与当前搜索query和session数据均相关的多个搜索关键词作为输入联想候选词进行推荐,还可以结合现有的推荐输入联想候选词的方式,共同为用户推荐输入联想。
具体的,在从关联性模型中获取到与当前搜索query和session数据均相关的预设数量的搜索关键词之后,还可以仅仅基于当前搜索query从输入联想的字典树模型中查找当前搜索query的输入联想候选词,并对查找到的预设数量的搜索关键词和与当前搜索query的输入联想候选词进行统一排序,从而将排序结果作为输入联想进行推荐。其中,统一排序的排序规则可以是,按照预设数量的搜索关键词的优先级别高于当前搜索query的输入联想候选词的优先级别的顺序进行统一排序,即设置预设数量的搜索关键词的优先级高于当前搜索query的输入联想候选词的优先级,从而按照优先级别由高到低的顺序对两者进行排序。需要说明的是,本发明实施例中从输入联想的字典树模型中查找当前搜索query的输入联想候选词的数量也可以进行自定义,如3个、5个等等。
例如,参见图2,用户通过“360搜索”输入的搜索query为人物“张三”,并且,用户8分钟前搜索过人物“李四”,设置的预设时间为15分钟,由此,8分钟前输入的搜索内容“李四”属于session数据。通过关联性模型分析得知“张三”与“李四”为朋友,他们之间存在相关性,因此,基于关联性模型得到与“张三”和“李四”均相关的3个搜索关键词分别为“张三与李四绯闻”、“张三与李四合影”以及“张三与李四合作的电影”。并且,仅基于当前搜索query“张三”从输入联想的字典树模型中通过前缀匹配查找与“张三”相关的3个输入联想候选词包括“张三新书签售会”、“张三称当爸选角有局限”以及“张三电影”。
其中,搜索关键词“张三与李四绯闻”、“张三与李四合影”以及“张三与李四合作的电影”的优先级高于与“张三”相关的3个输入联想候选词“张三新书签售会”、“张三称当爸选角有局限”以及“张三电影”的优先级。因此,在图2中,优先级高的搜索关键词排在最终推荐的输入联想的前面位置。
而在现有技术中,在最终展示的输入联想中可能并不会出现“张三”与“李四”相关的输入联想候选词,而仅仅是展示与“张三”相关的,最近比较热门的输入联想候选词。
本发明实施例还提供了另一种输入联想的推荐方法,该方法可以应用在360浏览器、百度浏览器、UC浏览器等等浏览器中,也可以应用于各类搜索引擎中。图3示出了根据本发明另一个实施例的输入联想的推荐方法的流程示意图。参见图3,该方法至少包括步骤S302至步骤S312。
步骤S302,收集网络中的用户搜索相关信息,从收集的用户搜索相关信息中提取搜索关键词。
该步骤中,可以采用数据挖掘技术挖掘网络中大量用户的搜索行为日志,进而从用户的搜索行为日志中获取用户搜索相关信息。此处用户的搜索行为日志主要包括主流搜索引擎中记录的用户搜索、点击、浏览行为等产生的日志。并且,从用户的搜索行为日志中收集的用户搜索相关信息可以是用户输入的搜索query、搜索query对应的搜索结果、浏览对象信息、接收点击操作的输入联想等等与用户搜索相关的信息。
步骤S304,解析搜索关键词之间的关联性,并依据解析结果建立搜索关键词的关联性模型。
该步骤中,搜索关键词的关联性模型可以通过对现有的输入联想模型改进得到。上文步骤中可以基于现有的输入联想模型从收集到的大量用户搜索相关信息中提取搜索关键词,通过解析搜索关键词之间的关联性,对现有的输入联想模型进行相应的训练,进而得到功能更加强大的搜索关键词的关联性模型。
步骤S306,预设时间段内接收到用户输入的搜索query时,获取已经记录的该预设时间段内的session数据。
该步骤中,上文已经对session数据进行了详细的介绍,此处不再赘述。
步骤S308,依据建立的搜索关键词的关联性模型,分析当前接收到的搜索query与获取到的session数据是否相关。
若是,执行步骤S310,结合当前接收到的搜索query和session数据进行输入联想的推荐。
若否,执行步骤S312,基于当前接收到的搜索query推荐输入联想。
在该步骤中,如果通过关联性模型分析得到当前接收到的搜索query与获取到的session数据并不是相关的数据,那么可以按照现有的输入联想推荐方式进行输入联想的推荐。
参见上文步骤S302,在本发明一实施例中,从收集的用户搜索相关信息中提取搜索关键词可以采用如下方式进行提取。具体的,首先,从收集的用户搜索相关信息中解析出搜索关键词。然后,对解析到的搜索关键词的特性信息进行统计,得到相应的统计结果。进而,依据统计结果从解析到的搜索关键词中提取搜索关键词的特性信息达到指定阈值的搜索关键词。其中,搜索关键词的特性信息可以包括搜索关键词的搜索频次、被点击次数、展示时长、变化率、飙升度等等。其中,展示时长指的是每一次搜索与搜索关键词相关内容时,搜索关键词所展示的平均时长。
本发明实施例中的指定阈值可以是任意数值,具体可以依据不同的搜索关键词的特性信息进行确定,本发明实施例对此不做限定。例如,搜索频次的指定阈值为1000次,那么从收集的用户搜索相关信息中解析出500个搜索关键词后,经过对搜索关键词的搜索频次进行统计得到200个搜索关键词的搜索频次超过了1000次,300个搜索关键词的搜索频次未达到1000次,因此,可以提取200个搜索频次超过1000次的搜索关键词。同理,可以得出依据其他特性信息统计结果来提取搜索关键词,此处不再赘述。
为了更加清楚地体现本发明实施例,现以输入同一搜索query为例,对采用现有技术推荐的输入联想和本发明方案推荐的输入联想进行对比介绍。其中,预设时间段设置为15分钟。
参见图4,现有技术中,用户8分钟之前通过PC终端的360搜索搜索过“三体”,当用户在搜索输入框中输入“xiao”时,仅仅是依据当前输入的与“xiao”相关的搜索词的热度,按照概率分布、根据字符前缀匹配推荐出的输入联想候选词,如图4中在搜索输入框下依次展示的“小红”、“小丽”、“小丽影视”等等。实际上,“小红”和“小丽”是目前热度比较高的明星。利用现有技术推荐的输入联想候选词中并没有和“三体”相关的输入联想候选词。
参见图5,本发明实施例中,用户8分钟之前通过PC终端的360搜索搜索过“三体”,并将“三体”作为session数据进行记录,此时当用户在搜索输入框中输入“xiao”时,通过建立的搜索关键词的关联性模型分析当前接收到的搜索“xiao”与session数据“三体”相关,从而结合当前接收到的搜索词“xiao”和之前记录的session数据“三体”推荐的输入联想包括“小欣”、“小丽”、“小丽影视”等等。实际上,搜索关键词的关联性模型基于挖掘的海量数据得到大量搜索“三体小说”的用户,又搜索了“三体”相关的作者、主角、剧情等,其中三体小说的作者为“小欣”。因此,用户在预设时间内输入“xiao”时,会推荐出三体小说的作者“小欣”。或者用户在输入“三体”之后立刻将“三体”改写为“xiao”,此时也会推荐出“小欣”,并将“小欣”排在输入联想的最前面。
此处需要说明的是,输入的搜索query不区分拼音和汉字,用户输入拼音后可以由浏览器或者搜索引擎翻译为汉字。由此,本发明实施例基于预设时间内产生的session数据,在用户实时搜索时可以动态改变输入联想候选词的内容及排序,提升了整个搜索输入联想的准确率,减少了用户的二次输入成本。
基于同一发明构思,本发明实施例还提供了一种输入联想的推荐装置。图6示出了根据本发明一个实施例的输入联想的推荐装置的结构示意图。参见图6,输入联想的推荐装置600至少可以包括获取模块610、分析模块620以及推荐模块630。
现介绍本发明实施例的输入联想的推荐装置600的各组成或器件的功能以及各部分间的连接关系:
获取模块610,适于预设时间段内接收到用户输入的搜索query时,获取已经记录的该预设时间段内的session数据;
分析模块620,与获取模块610耦合,适于依据建立的搜索关键词的关联性模型,分析当前接收到的搜索query与获取到的session数据是否相关;
推荐模块630,与分析模块620耦合,适于若分析模块620依据建立的搜索关键词的关联性模型,分析当前接收到的搜索query与获取到的session数据相关,结合当前接收到的搜索query和session数据进行输入联想的推荐。
在本发明一实施例中,推荐模块630还适于,若分析模块620依据建立的搜索关键词的关联性模型,分析当前接收到的搜索query与获取到的session数据不相关,则基于当前接收到的搜索query推荐输入联想。
在本发明一实施例中,推荐模块630还适于,从关联性模型中查找与当前搜索query和session数据均相关的搜索关键词。从查找到的与当前搜索query和session数据均相关的搜索关键词中,获取预设数量的搜索关键词作为输入联想候选词进行推荐。
在本发明一实施例中,推荐模块630还适于,从输入联想的字典树模型中查找当前搜索query的输入联想候选词。对查找到的预设数量的搜索关键词和与当前搜索query的输入联想候选词进行统一排序,将排序结果作为输入联想进行推荐。
在本发明一实施例中,推荐模块630还适于,按照预设数量的搜索关键词的优先级别高于当前搜索query的输入联想候选词的优先级别的顺序进行统一排序。
本发明实施例还提供了另一种输入联想的推荐装置。图7示出了根据本发明一个实施例的输入联想的推荐装置的结构示意图。参见图7,输入联想的推荐装置600除了包含上述各模块之外,还可以包括记录模块640、收集模块650以及建立模块660。
记录模块640,适于在获取模块610在预设时间段内接收到用户输入的搜索query时,获取已经记录的该预设时间段内的session数据之前,实时记录用户在预设时间段内的搜索和/或点击行为产生的session数据,其中,session数据包括用户输入的搜索query和/或用户点击的输入联想候选词。
收集模块650,适于收集网络中的用户搜索相关信息,从收集的用户搜索相关信息中提取搜索关键词。
建立模块660,与分析模块620和收集模块650分别耦合,适于解析搜索关键词之间的关联性,并依据解析结果建立搜索关键词的关联性模型。
在本发明一实施例中,收集模块650还适于,收集网络中的用户搜索行为日志,从用户搜索行为日志中获取用户搜索相关信息。在该实施例中,用户搜索相关信息包括以下至少之一:搜索query、搜索query对应的搜索结果、浏览对象信息、接收点击操作的输入联想等等。
在本发明一实施例中,收集模块650还适于,从收集的用户搜索相关信息中解析搜索关键词,对解析到的搜索关键词的特性信息进行统计,得到统计结果。依据统计结果,从解析到的搜索关键词中提取搜索关键词的特性信息达到指定阈值的搜索关键词。在该实施例中,搜索关键词的特性信息可以包括以下至少之一:搜索关键词的搜索频次、被点击次数、展示时长、变化率、飙升度等等。
根据上述任意一个优选实施例或多个优选实施例的组合,本发明实施例能够达到如下有益效果:
在本发明实施例中,当预设时间段内接收到用户输入的搜索query时,获取已经记录的该预设时间段内的session数据,并依据建立的搜索关键词的关联性模型,分析当前接收到的搜索query与获取到的session数据是否具有相关性,若是,可以结合当前接收到的搜索query和获取到的预设时间段内的session数据进行输入联想的推荐。由此,本发明实施例不仅可以基于用户输入的搜索query推荐输入联想,还能够结合与当前搜索query相关的之前的搜索记录共同为用户推荐输入联想,从而对于用户的实时搜索query动态改变输入联想候选词的内容,挖掘出用户潜在的搜索词,大大提升了整个搜索输入联想的准确率以及用户的操作体验。进一步地,本发明实施例还有效地避免了单纯通过字典树模型进行字符前缀匹配得到输入联想候选词,造成输入联想更新滞后、不能及时满足用户需求的问题,节约了用户的二次输入成本。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的输入联想的推荐装置中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
本发明实施例还提供了一种电子设备,包括处理器;以及被安排成存储计算机可执行指令的存储器,可执行指令在被执行时使处理器执行根据上文任意实施例的输入联想的推荐方法。
本发明实施例还提供了一种计算机可读存储介质,其中,计算机可读存储介质存储一个或多个程序,一个或多个程序当被包括多个应用程序的电子设备执行时,使得电子设备执行根据上文任意实施例的输入联想的推荐方法。
例如,图8示出了可以实现输入联想的推荐方法的计算设备。该计算设备传统上包括处理器810和存储器820形式的计算机程序产品或者计算机可读介质。存储器820可以是诸如闪存、EEPROM(电可擦除可编程只读存储器)、EPROM、硬盘或者ROM之类的电子存储器。存储器820具有存储用于执行上述方法中的任何方法步骤的程序代码831的存储空间830。例如,存储程序代码的存储空间830可以包括分别用于实现上面的方法中的各种步骤的各个程序代码831。这些程序代码可以从一个或者多个计算机程序产品中读出或者写入到这一个或者多个计算机程序产品中。这些计算机程序产品包括诸如硬盘,紧致盘(CD)、存储卡或者软盘之类的程序代码载体。这样的计算机程序产品通常为例如图9所示的便携式或者固定存储单元。该存储单元可以具有与图8的计算设备中的存储器820类似布置的存储段、存储空间等。程序代码可以例如以适当形式进行压缩。通常,存储单元包括用于执行本发明的方法步骤的计算机可读代码831’,即可以由诸如810之类的处理器读取的代码,当这些代码由计算设备运行时,导致该计算设备执行上面所描述的方法中的各个步骤。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
至此,本领域技术人员应认识到,虽然本文已详尽示出和描述了本发明的多个示例性实施例,但是,在不脱离本发明精神和范围的情况下,仍可根据本发明公开的内容直接确定或推导出符合本发明原理的许多其他变型或修改。因此,本发明的范围应被理解和认定为覆盖了所有这些其他变型或修改。

Claims (22)

1.一种输入联想的推荐方法,包括:
预设时间段内接收到用户输入的搜索query时,获取已经记录的该预设时间段内的session数据;
依据建立的搜索关键词的关联性模型,分析当前接收到的搜索query与获取到的所述session数据是否相关;
若是,结合当前接收到的搜索query和所述session数据进行输入联想的推荐;
其中,所述结合当前接收到的搜索query和所述session数据进行输入联想的推荐,包括:
从所述关联性模型中查找与当前搜索query和所述session数据均相关的搜索关键词;
从查找到的与当前搜索query和所述session数据均相关的搜索关键词中,获取预设数量的搜索关键词作为输入联想候选词进行推荐。
2.根据权利要求1所述的方法,其中,所述预设时间段内接收到用户输入的搜索query时,获取已经记录的该预设时间段内的session数据之前,还包括:
实时记录用户在预设时间段内的搜索和/或点击行为产生的session数据,其中,所述session数据包括用户输入的搜索query和/或用户点击的输入联想候选词。
3.根据权利要求1所述的方法,其中,还包括:
若依据建立的搜索关键词的关联性模型,分析当前接收到的搜索query与获取到的所述session数据不相关,则基于当前接收到的搜索query推荐输入联想。
4.根据权利要求3所述的方法,其中,所述结合当前接收到的搜索query和所述session数据进行输入联想的推荐,包括:
从输入联想的字典树模型中查找当前搜索query的输入联想候选词;
对查找到的所述预设数量的搜索关键词和与当前搜索query的输入联想候选词进行统一排序,将排序结果作为输入联想进行推荐。
5.根据权利要求4所述的方法,其中,所述对查找到的所述预设数量的搜索关键词和与当前搜索query的输入联想候选词进行统一排序,包括:
按照所述预设数量的搜索关键词的优先级别高于所述当前搜索query的输入联想候选词的优先级别的顺序进行统一排序。
6.根据权利要求5所述的方法,其中,还包括:
收集网络中的用户搜索相关信息,从收集的用户搜索相关信息中提取搜索关键词;
解析所述搜索关键词之间的关联性,并依据解析结果建立所述搜索关键词的关联性模型。
7.根据权利要求6所述的方法,其中,所述收集网络中的用户搜索相关信息,包括:
收集网络中的用户搜索行为日志,从所述用户搜索行为日志中获取用户搜索相关信息。
8.根据权利要求7所述的方法,其中,所述用户搜索相关信息包括以下至少之一:
搜索query、搜索query对应的搜索结果、浏览对象信息、接收点击操作的输入联想。
9.根据权利要求6所述的方法,其中,所述从收集的用户搜索相关信息中提取搜索关键词,包括:
从收集的用户搜索相关信息中解析搜索关键词,对解析到的搜索关键词的特性信息进行统计,得到统计结果;
依据统计结果,从解析到的搜索关键词中提取搜索关键词的特性信息达到指定阈值的搜索关键词。
10.根据权利要求1-9任一项所述的方法,其中,所述搜索关键词的特性信息包括以下至少之一:
所述搜索关键词的搜索频次、被点击次数、展示时长、变化率、飙升度。
11.一种输入联想的推荐装置,包括:
获取模块,适于预设时间段内接收到用户输入的搜索query时,获取已经记录的该预设时间段内的session数据;
分析模块,适于依据建立的搜索关键词的关联性模型,分析当前接收到的搜索query与获取到的所述session数据是否相关;
推荐模块,适于若所述分析模块依据建立的搜索关键词的关联性模型,分析当前接收到的搜索query与获取到的所述session数据相关,结合当前接收到的搜索query和所述session数据进行输入联想的推荐;
所述推荐模块还适于:
从所述关联性模型中查找与当前搜索query和所述session数据均相关的搜索关键词;
从查找到的与当前搜索query和所述session数据均相关的搜索关键词中,获取预设数量的搜索关键词作为输入联想候选词进行推荐。
12.根据权利要求11所述的装置,其中,所述装置还包括记录模块,适于:
在所述获取模块在预设时间段内接收到用户输入的搜索query时,获取已经记录的该预设时间段内的session数据之前,实时记录用户在预设时间段内的搜索和/或点击行为产生的session数据,其中,所述session数据包括用户输入的搜索query和/或用户点击的输入联想候选词。
13.根据权利要求11所述的装置,其中,所述推荐模块还适于:
若所述分析模块依据建立的搜索关键词的关联性模型,分析当前接收到的搜索query与获取到的所述session数据不相关,则基于当前接收到的搜索query推荐输入联想。
14.根据权利要求13所述的装置,其中,所述推荐模块还适于:
从输入联想的字典树模型中查找当前搜索query的输入联想候选词;
对查找到的所述预设数量的搜索关键词和与当前搜索query的输入联想候选词进行统一排序,将排序结果作为输入联想进行推荐。
15.根据权利要求14所述的装置,其中,所述推荐模块还适于:
按照所述预设数量的搜索关键词的优先级别高于所述当前搜索query的输入联想候选词的优先级别的顺序进行统一排序。
16.根据权利要求15所述的装置,其中,所述装置还包括:
收集模块,适于收集网络中的用户搜索相关信息,从收集的用户搜索相关信息中提取搜索关键词;
建立模块,适于解析所述搜索关键词之间的关联性,并依据解析结果建立所述搜索关键词的关联性模型。
17.根据权利要求16所述的装置,其中,所述收集模块还适于:
收集网络中的用户搜索行为日志,从所述用户搜索行为日志中获取用户搜索相关信息。
18.根据权利要求17所述的装置,其中,所述用户搜索相关信息包括以下至少之一:
搜索query、搜索query对应的搜索结果、浏览对象信息、接收点击操作的输入联想。
19.根据权利要求16所述的装置,其中,所述收集模块还适于:
从收集的用户搜索相关信息中解析搜索关键词,对解析到的搜索关键词的特性信息进行统计,得到统计结果;
依据统计结果,从解析到的搜索关键词中提取搜索关键词的特性信息达到指定阈值的搜索关键词。
20.根据权利要求11-19任一项所述的装置,其中,所述搜索关键词的特性信息包括以下至少之一:
所述搜索关键词的搜索频次、被点击次数、展示时长、变化率、飙升度。
21.一种电子设备,包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行根据权利要求1-10任一项所述的输入联想的推荐方法。
22.一种计算机可读存储介质,其中,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被包括多个应用程序的电子设备执行时,使得所述电子设备执行根据权利要求1-10任一项所述的输入联想的推荐方法。
CN201711480871.8A 2017-12-29 2017-12-29 一种输入联想的推荐方法及装置 Active CN108228802B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711480871.8A CN108228802B (zh) 2017-12-29 2017-12-29 一种输入联想的推荐方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711480871.8A CN108228802B (zh) 2017-12-29 2017-12-29 一种输入联想的推荐方法及装置

Publications (2)

Publication Number Publication Date
CN108228802A CN108228802A (zh) 2018-06-29
CN108228802B true CN108228802B (zh) 2021-08-24

Family

ID=62647240

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711480871.8A Active CN108228802B (zh) 2017-12-29 2017-12-29 一种输入联想的推荐方法及装置

Country Status (1)

Country Link
CN (1) CN108228802B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109582155B (zh) * 2018-11-23 2023-05-16 抖音视界有限公司 输入联想词的推荐方法、装置、存储介质及电子设备
CN111324804B (zh) * 2020-02-21 2023-09-22 抖音视界有限公司 搜索关键词推荐模型生成方法、关键词推荐方法与装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102360358A (zh) * 2011-09-28 2012-02-22 百度在线网络技术(北京)有限公司 关键词推荐方法及系统
CN103309869A (zh) * 2012-03-09 2013-09-18 阿里巴巴集团控股有限公司 数据对象的展示关键词推荐方法及系统
US9201856B2 (en) * 2012-12-17 2015-12-01 Amadeus S.A.S. Recommendation engine for interactive search forms
CN105260419A (zh) * 2015-09-25 2016-01-20 广州亿码科技有限公司 一种相关关键词推荐方法及装置
EP3061005A1 (en) * 2013-10-24 2016-08-31 Microsoft Technology Licensing, LLC Discussion summary

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8972397B2 (en) * 2010-03-11 2015-03-03 Microsoft Corporation Auto-detection of historical search context

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102360358A (zh) * 2011-09-28 2012-02-22 百度在线网络技术(北京)有限公司 关键词推荐方法及系统
CN103309869A (zh) * 2012-03-09 2013-09-18 阿里巴巴集团控股有限公司 数据对象的展示关键词推荐方法及系统
US9201856B2 (en) * 2012-12-17 2015-12-01 Amadeus S.A.S. Recommendation engine for interactive search forms
EP3061005A1 (en) * 2013-10-24 2016-08-31 Microsoft Technology Licensing, LLC Discussion summary
CN105260419A (zh) * 2015-09-25 2016-01-20 广州亿码科技有限公司 一种相关关键词推荐方法及装置

Also Published As

Publication number Publication date
CN108228802A (zh) 2018-06-29

Similar Documents

Publication Publication Date Title
US10902077B2 (en) Search result aggregation method and apparatus based on artificial intelligence and search engine
CN107193987B (zh) 获取与页面相关的搜索词的方法、装置和系统
US10977317B2 (en) Search result displaying method and apparatus
CN108572990B (zh) 信息推送方法和装置
CN108319376B (zh) 一种优化商业词推广的输入联想推荐方法及装置
CN109558513B (zh) 一种内容推荐方法、装置、终端及存储介质
JP2015191655A (ja) 推奨ページを生成するための方法及び装置
CN106991175B (zh) 一种客户信息挖掘方法、装置、设备以及存储介质
US8825620B1 (en) Behavioral word segmentation for use in processing search queries
JP6165955B1 (ja) 検索クエリに応答してホワイトリストとブラックリストを使用し画像とコンテンツをマッチングする方法及びシステム
CN102968417A (zh) 一种应用于计算机网络中的搜索方法和系统
CN103678362A (zh) 搜索方法及系统
CN108170293A (zh) 输入联想的个性化推荐方法及装置
CN112395867B (zh) 同义词挖掘方法、装置、存储介质及计算机设备
CN104503988A (zh) 搜索方法及装置
CN103745380A (zh) 一种广告投放方法和装置
CN108228802B (zh) 一种输入联想的推荐方法及装置
CN110245357B (zh) 主实体识别方法和装置
CN106919593B (zh) 一种搜索的方法和装置
KR20070082075A (ko) 질의어 및 콘텐츠 분류 기반 템플릿을 이용한 검색결과제공방법 및 그 장치
CN104933099B (zh) 一种为用户提供目标搜索结果的方法与装置
CN106933380B (zh) 一种词库的更新方法和装置
CN107085573B (zh) 热点信息的获取方法及装置
WO2015143911A1 (zh) 推送包含时效性信息的网页的方法和装置
CN110543457A (zh) 轨迹类文档处理方法和装置、存储介质及电子装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant