CN106708886B - 站内搜索词的显示方法及装置 - Google Patents

站内搜索词的显示方法及装置 Download PDF

Info

Publication number
CN106708886B
CN106708886B CN201510789817.6A CN201510789817A CN106708886B CN 106708886 B CN106708886 B CN 106708886B CN 201510789817 A CN201510789817 A CN 201510789817A CN 106708886 B CN106708886 B CN 106708886B
Authority
CN
China
Prior art keywords
clustering
phrase
search word
station
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510789817.6A
Other languages
English (en)
Other versions
CN106708886A (zh
Inventor
张鹏霄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Gridsum Technology Co Ltd
Original Assignee
Beijing Gridsum Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Gridsum Technology Co Ltd filed Critical Beijing Gridsum Technology Co Ltd
Priority to CN201510789817.6A priority Critical patent/CN106708886B/zh
Publication of CN106708886A publication Critical patent/CN106708886A/zh
Application granted granted Critical
Publication of CN106708886B publication Critical patent/CN106708886B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3338Query expansion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种站内搜索词的显示方法及装置。其中,该方法包括:检测站内是否有搜索词输入;在检测结果为站内有搜索词输入的情况下,找出与当前输入的搜索词对应的聚类词组,与当前输入的搜索词对应的聚类词组中包含有与当前输入的搜索词语义相同或相近的关键词;将与当前输入的搜索词对应的聚类词组中包含的关键词作为提示词显示以供用户选择输入。本发明解决了相关技术中由于受站内搜索本身条件的限制造成的用户难以搜索到自己想要的内容的技术问题。

Description

站内搜索词的显示方法及装置
技术领域
本发明涉及互联网领域,具体而言,涉及一种站内搜索词的显示方法及装置。
背景技术
以往在网站建设、企业信息系统搭建过程中,由于信息结构简单、信息量少,包括站内搜索在内的信息搜索都不是网站系统的必要功能。但随着Web2.0的使用,海量信息井喷式涌现,以及企业自身对信息架构、管理、发布的需求越来越高,而用户对信息的组织、查询、可寻性的要求也越来越高,于是站内搜索出现了。目前,站内搜索几乎已经成为所有网站必不可少的一块功能,尤其在内容丰富的网站中,当用户有目的地寻找目标内容但又无法直接从首页或导航页中找到时,就会求助于站内搜索。
站内搜索最重要的意义在于,通过访问者在站内搜索里使用的搜索词我们可以清楚地了解访问者的意图,即访问者来到网站后,他们究竟在想什么,他们在找什么,网站是否满足了他们的需求,哪些是网站内可以补充和优化的等等。
但是一种很常见的情况是用户有时很难搜索到自己想要的内容。比如用户进入国家质检总局的网站,想要搜索某个内容,如“三聚氰胺”,但该用户一时忘记了该内容具体的名称,只知道这是牛奶的一种添加剂,并且这种添加剂是对人体有害的,此时该用户可能难以搜索到自己想要的内容。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种站内搜索词的显示方法及装置,以至少解决相关技术中由于受站内搜索本身条件的限制造成的用户难以搜索到自己想要的内容的技术问题。
根据本发明实施例的一个方面,提供了一种站内搜索词的显示方法,包括:检测站内是否有搜索词输入;在检测结果为上述站内有搜索词输入的情况下,找出与当前输入的搜索词对应的聚类词组,上述与当前输入的搜索词对应的聚类词组中包含有与上述当前输入的搜索词语义相同或相近的关键词;将上述与当前输入的搜索词对应的聚类词组中包含的上述关键词作为提示词显示以供用户选择输入。
进一步地,生成各聚类词组的步骤包括:记录输入到上述站内的所有搜索词;对输入的上述所有搜索词按语义关系进行聚类分析,得到上述各聚类词组,其中,上述各聚类词组中任意两个词组中的关键词语义不同。
进一步地,在对输入的上述所有搜索词按语义关系进行聚类分析,得到上述各聚类词组之后,上述步骤还包括:分行业对得到的上述各聚类词组进行优化处理。
进一步地,分行业对得到上述各聚类词组进行优化处理包括:通过机器学习上述站内的文章的方式分行业对得到的上述各聚类词组进行优化处理。
进一步地,查找上述与当前输入的搜索词对应的聚类词组包括:遍历上述各聚类词组;将上述当前输入的搜索词与遍历到的聚类词组中的关键词进行匹配;将匹配成功的关键词所属的聚类词组作为找出的上述与当前输入的搜索词对应的聚类词组。
根据本发明实施例的另一方面,还提供了一种站内搜索词的显示装置,包括:检测单元,用于检测站内是否有搜索词输入;查找单元,用于在检测结果为上述站内有搜索词输入的情况下,找出与当前输入的搜索词对应的聚类词组,上述与当前输入的搜索词对应的聚类词组中包含有与上述当前输入的搜索词语义相同或相近的关键词;提示单元,用于将上述与当前输入的搜索词对应的聚类词组中包含的上述关键词作为提示词显示以供用户选择输入。
进一步地,上述装置还包括:生成单元,用于生成各聚类词组,上述生成单元包括:记录模块,用于记录输入到上述站内的所有搜索词;聚类模块,用于对输入的上述所有搜索词按语义关系进行聚类分析,得到上述各聚类词组,其中,上述各聚类词组中任意两个词组中的关键词语义不同。
进一步地,上述生成单元还包括:优化模块,用于在对输入的上述所有搜索词按语义关系进行聚类分析,得到上述各聚类词组之后,分行业对得到的上述各聚类词组进行优化处理。
进一步地,上述优化模块还用于通过机器学习上述站内的文章的方式分行业对得到的上述各聚类词组进行优化处理。
进一步地,上述查找单元包括:遍历模块,用于遍历上述各聚类词组;匹配模块,用于将上述当前输入的搜索词与遍历到的聚类词组中的关键词进行匹配;确定模块,用于将匹配成功的关键词所属的聚类词组作为找出的上述与当前输入的搜索词对应的聚类词组。
在本发明实施例中,采用向用户提示语义相关的关键词的方式,通过检测站内是否有搜索词输入;在检测结果为站内有搜索词输入的情况下,找出与当前输入的搜索词对应的聚类词组,与当前输入的搜索词对应的聚类词组中包含有与当前输入的搜索词语义相同或相近的关键词;将与当前输入的搜索词对应的聚类词组中包含的关键词作为提示词显示以供用户选择输入,达到了完善站内搜索功能的目的,从而实现了使用户易于在站内搜索到自己想要的内容的技术效果,进而解决了相关技术中由于受站内搜索本身条件的限制造成的用户难以搜索到自己想要的内容的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的一种可选的站内搜索词的显示方法的流程图;
图2是根据本发明实施例的另一种可选的站内搜索词的显示方法的流程图;
图3是根据本发明实施例的一种可选的站内搜索词的显示装置的示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例1
根据本发明实施例,提供了一种站内搜索词的显示方法的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图1是根据本发明实施例的一种可选的站内搜索词的显示方法的流程图,如图1所示,该方法包括如下步骤:
步骤S102,检测站内是否有搜索词输入;
步骤S104,在检测结果为站内有搜索词输入的情况下,找出与当前输入的搜索词对应的聚类词组,与当前输入的搜索词对应的聚类词组中包含有与当前输入的搜索词语义相同或相近的关键词;
步骤S106,将与当前输入的搜索词对应的聚类词组中包含的关键词作为提示词显示以供用户选择输入。
实施时,当用户在站内输入搜索词搜索相关内容时,站内检测系统就可以检测到当前用户正在输入的搜索词,此时,系统就会从预先生成的各聚类词组中找出与当前正在输入的搜索词对应的那个聚类词组,并将该聚类词组中包含的关键词全部或者部分地提示给用户,以供用户选择输入。这样,用户通过选择系统的提示词,可以快速、准确地搜索到想要的内容。
例如,预先将“有害的牛奶添加剂”、“三聚氰胺”、“让牛奶看起来更新鲜”等关键词聚到同一类里面,形成一个名称为“三聚氰胺”的聚类词组,并存储起来,当用户搜索了某个词语,如“有害的牛奶添加剂”,而此时系统会查找到“有害的牛奶添加剂”隶属于“三聚氰胺”这个词组,并将“三聚氰胺”这个词组中所有的词语都作为提示词以供用户在输入搜索词时选择,此时用户就会发现自己实际上要查找的就是“三聚氰胺”的相关内容。这样就可以很大程度上优化用户的搜索体验,尤其在用户一时忘记了要搜索内容的具体名称时,使用本发明提供的技术方案,可以帮助用户快速找到其想要的内容。
通过上述实施例,可以实现给用户提供与其输入的搜索词语义相同或相近的提示词的目的,达到了完善站内搜索功能的目的,从而实现了使用户易于在站内搜索到自己想要的内容的技术效果。
生成各聚类词组的方法可以包括多种,如根据配置信息生成或者根据用户的访问记录生成等,在此不作限定。可选地,生成各聚类词组的步骤可以包括:
S2,记录输入到站内的所有搜索词;
S4,对输入的所有搜索词按语义关系进行聚类分析,得到各聚类词组,其中,各聚类词组中任意两个词组中的关键词语义不同。
实施时,首先可以记录下来所有用户的历史搜索,将之前所有的站内搜索词存储下来。具体地,可以实时记录用户的访问情况,形成记录有输入站内的所有搜索词的访问日志,通过解析该日志,可以得到所有搜索词。聚类时,可以先分析各搜索词的语义,将在语义上相同或相近的词语都放在一个聚类词组中,从而可以得到多个具有不同语义的聚类词组。
需要说明的是,这里对词语聚类采用的相关聚类算法不做限定,如其可以是基于搜索引擎的关键词聚类算法,或者基于关键词共现频率的聚类算法等等。
通过本发明实施例,根据用户的访问记录可以准确地了解用户在搜索同一内容时经常性、习惯性使用的搜索词,并将具有相同或相近语义的搜索词聚类到一个词组中,可以供本用户或其他用户下次搜索同样内容时,根据系统提示快速、准确地输入对应的搜索词。
一般地,聚类词组是根据聚类算法得到的聚类结果,这种聚类仅仅是不分行业地基于词语或短语原有语义的聚类,无法得到精确的聚类结果。比如,“蜘蛛”在生物界代表的是一种爬虫,而在计算机网络领域代表的是一种网站数据抓取方式,使用上述实施例,只能将“蜘蛛”聚类到具有生物属性的聚类词组中,无法将其聚类到具有计算机属性的聚类词组中。为了考虑行业属性对聚类的影响,可选地,对输入的所有搜索词按语义关系进行聚类分析,得到各聚类词组之后,上述步骤还可以包括:
S6,分行业对得到的各聚类词组进行优化处理。
具体地,对各聚类词组进行优化处理时,可以分别优化每个词组。比如,可以根据网站本身所涉及信息的属性特征,得到相应的行业属性信息,进而根据该行业属性信息分析每个词组中每个关键词在行业内的实际语义。如果关键词在行业内的实际语义与当前所属的聚类词组匹配,则不作任何处理;如果关键词在行业内的实际语义与当前所属的聚类词组不匹配,则需要将其调整到匹配的聚类词组中。这样,可以使聚类结果更精确、更细致、更具有实际意义。
分行业对得到各聚类词组进行优化处理的方法可以包括多种,比如,可以采用上述实施例中的方式,或者可以采用本实施例中的方式,即分行业对得到的各聚类词组进行优化处理包括:
S8,通过机器学习站内的文章的方式分行业对得到的各聚类词组进行优化处理。
机器学习站内的文章的主要目的是分行业对上述实施例中得到的聚类词组进行迭代优化,以便获取更加准确的含义,比如“蜘蛛”在生物界代表的是一种爬虫,而在计算机网络领域代表的是一种网站数据抓起的方式。
可选地,查找与当前输入的搜索词对应的聚类词组包括:
S10,遍历各聚类词组;
S12,将当前输入的搜索词与遍历到的聚类词组中的关键词进行匹配;
S14,将匹配成功的关键词所属的聚类词组作为找出的与当前输入的搜索词对应的聚类词组。
需要说明的是,在匹配不成功的情况下,可以记录当前输入的搜索词,并将留作聚类分析的资料。
通过本发明实施例,采用站内搜索词聚类方式,能够更专业地理解用户的需求;将聚类词组中的关键词用作提示词,能够辅助用户更快地查找到自己想要的内容;通过对聚类词组中的关键词进行优化处理,能够更准确地理解用户的需求。
如图2所示,以下通过一个具体实施例详细阐述本发明:
步骤S202,记录站内搜索词;
步骤S204,将站内搜索词进行聚类分析;
步骤S206,通过机器学习处理站内文章,对站内搜索词的聚类结果进行优化处理;
步骤S208,生成聚类词组;
步骤S210,用户输入搜索词;
步骤S212,找出与用户输入的搜索词相关联的聚类词组;
步骤S214,将步骤S212中的相关联的聚类词组中的关键词作为提示词提示用户。
实施例2
根据本发明实施例,提供了一种站内搜索词的显示装置的装置实施例。
图3是根据本发明实施例的一种可选的站内搜索词的显示装置的示意图,如图3所示,该装置包括:检测单元302,用于检测站内是否有搜索词输入;查找单元304,用于在检测结果为站内有搜索词输入的情况下,找出与当前输入的搜索词对应的聚类词组,与当前输入的搜索词对应的聚类词组中包含有与当前输入的搜索词语义相同或相近的关键词;显示单元306,用于将与当前输入的搜索词对应的聚类词组中包含的关键词作为提示词显示以供用户选择输入。
实施时,当用户在站内输入搜索词搜索相关内容时,站内检测系统就可以检测到当前用户正在输入的搜索词,此时,系统就会从预先生成的各聚类词组中找出与当前正在输入的搜索词对应的那个聚类词组,并将该聚类词组中包含的关键词全部或者部分地提示给用户,以供用户选择输入。这样,用户通过选择系统的提示词,可以快速、准确地搜索到想要的内容。
例如,预先将“有害的牛奶添加剂”、“三聚氰胺”、“让牛奶看起来更新鲜”等关键词聚到同一类里面,形成一个名称为“三聚氰胺”的聚类词组,并存储起来,当用户搜索了某个词语,如“有害的牛奶添加剂”,而此时系统会查找到“有害的牛奶添加剂”隶属于“三聚氰胺”这个词组,并将“三聚氰胺”这个词组中所有的词语都作为提示词以供用户在输入搜索词时选择,此时用户就会发现自己实际上要查找的就是“三聚氰胺”的相关内容。这样就可以很大程度上优化用户的搜索体验,尤其在用户一时忘记了要搜索内容的具体名称时,使用本发明提供的技术方案,可以帮助用户快速找到其想要的内容。
通过上述实施例,可以实现给用户提供与其输入的搜索词语义相同或相近的提示词的目的,达到了完善站内搜索功能的目的,从而实现了使用户易于在站内搜索到自己想要的内容的技术效果。
生成各聚类词组的方法可以包括多种,如根据配置信息生成或者根据用户的访问记录生成等,在此不作限定。可选地,上述装置还包括:生成单元,用于生成各聚类词组,该生成单元包括:记录模块,用于记录输入到站内的所有搜索词;聚类模块,用于对输入的所有搜索词按语义关系进行聚类分析,得到各聚类词组,其中,各聚类词组中任意两个词组中的关键词语义不同。
实施时,首先可以记录下来所有用户的历史搜索,将之前所有的站内搜索词存储下来。具体地,可以实时记录用户的访问情况,形成记录有输入站内的所有搜索词的访问日志,通过解析该日志,可以得到所有搜索词。聚类时,可以先分析各搜索词的语义,将在语义上相同或相近的词语都放在一个聚类词组中,从而可以得到多个具有不同语义的聚类词组。
需要说明的是,这里对词语聚类采用的相关聚类算法不做限定,如其可以是基于搜索引擎的关键词聚类算法,或者基于关键词共现频率的聚类算法等等。
通过本发明实施例,根据用户的访问记录可以准确地了解用户在搜索同一内容时经常性、习惯性使用的搜索词,并将具有相同或相近语义的搜索词聚类到一个词组中,可以供本用户或其他用户下次搜索同样内容时,根据系统提示快速、准确地输入对应的搜索词。
一般地,聚类词组是根据聚类算法得到的聚类结果,这种聚类仅仅是不分行业地基于词语或短语原有语义的聚类,无法得到精确的聚类结果。比如,“蜘蛛”在生物界代表的是一种爬虫,而在计算机网络领域代表的是一种网站数据抓取方式,使用上述实施例,只能将“蜘蛛”聚类到具有生物属性的聚类词组中,无法将其聚类到具有计算机属性的聚类词组中。为了考虑行业属性对聚类的影响,可选地,该生成单元还包括:优化模块,用于在对输入的所有搜索词按语义关系进行聚类分析,得到各聚类词组之后,分行业对得到各聚类词组进行优化处理。
具体地,对各聚类词组进行优化处理时,可以分别优化每个词组。比如,可以根据网站本身所涉及信息的属性特征,得到相应的行业属性信息,进而根据该行业属性信息分析每个词组中每个关键词在行业内的实际语义。如果关键词在行业内的实际语义与当前所属的聚类词组匹配,则不作任何处理;如果关键词在行业内的实际语义与当前所属的聚类词组不匹配,则需要将其调整到匹配的聚类词组中。这样,可以使聚类结果更精确、更细致、更具有实际意义。
分行业对得到各聚类词组进行优化处理的方法可以包括多种,比如,可以采用上述实施例中的方式,或者可以采用本实施例中的方式,上述优化模块还用于通过机器学习站内的文章的方式分行业对得到各聚类词组进行优化处理。
机器学习站内的文章的主要目的是分行业对上述实施例中得到的聚类词组进行迭代优化,以便获取更加准确的含义,比如“蜘蛛”在生物界代表的是一种爬虫,而在计算机网络领域代表的是一种网站数据抓起的方式。
可选地,上述查找单元包括:遍历模块,用于遍历各聚类词组;匹配模块,用于将当前输入的搜索词与遍历到的聚类词组中的关键词进行匹配;确定模块,用于将匹配成功的关键词所属的聚类词组作为找出的与当前输入的搜索词对应的聚类词组。
需要说明的是,在匹配不成功的情况下,可以记录当前输入的搜索词,并将留作聚类分析的资料。
通过本发明实施例,采用站内搜索词聚类方式,能够更专业地理解用户的需求;将聚类词组中的关键词用作提示词,能够辅助用户更快地查找到自己想要的内容;通过对聚类词组中的关键词进行优化处理,能够更准确地理解用户的需求。
上述站内搜索词的显示装置包括处理器和存储器,上述检测单元、查找单元和显示单元等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数解析文本内容。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
本申请还提供了一种计算机程序产品的实施例,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序代码:检测站内是否有搜索词输入;在检测结果为站内有搜索词输入的情况下,找出与当前输入的搜索词对应的聚类词组,与当前输入的搜索词对应的聚类词组中包含有与当前输入的搜索词语义相同或相近的关键词;将与当前输入的搜索词对应的聚类词组中包含的关键词作为提示词显示以供用户选择输入。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (10)

1.一种站内搜索词的显示方法,其特征在于,包括:
检测站内是否有搜索词输入;
在检测结果为所述站内有搜索词输入的情况下,从预先生成的各聚类词组中找出与当前输入的搜索词对应的聚类词组,所述与当前输入的搜索词对应的聚类词组中包含有与所述当前输入的搜索词语义相同或相近的关键词;
将所述与当前输入的搜索词对应的聚类词组中包含的所述关键词作为提示词显示以供用户选择输入;
其中,根据网站所涉及的信息的属性特征,得到行业属性信息;根据所述行业属性信息分析每个所述聚类词组中的每个所述关键词在行业内的实际语义;如果所述关键词在所述行业内的实际语义与当前所属的聚类词组不匹配,则将所述关键词调整到与所述关键词相匹配的聚类词组中。
2.根据权利要求1所述的方法,其特征在于,生成各聚类词组的步骤包括:
记录输入到所述站内的所有搜索词;
对输入的所述所有搜索词按语义关系进行聚类分析,得到所述各聚类词组,其中,所述各聚类词组中任意两个词组中的关键词语义不同。
3.根据权利要求2所述的方法,其特征在于,在对输入的所述所有搜索词按语义关系进行聚类分析,得到所述各聚类词组之后,所述步骤还包括:
分行业对得到的所述各聚类词组进行优化处理。
4.根据权利要求3所述的方法,其特征在于,分行业对得到的所述各聚类词组进行优化处理包括:
通过机器学习所述站内的文章的方式分行业对得到的所述各聚类词组进行优化处理。
5.根据权利要求2所述的方法,其特征在于,查找所述与当前输入的搜索词对应的聚类词组包括:
遍历所述各聚类词组;
将所述当前输入的搜索词与遍历到的聚类词组中的关键词进行匹配;
将匹配成功的关键词所属的聚类词组作为找出的所述与当前输入的搜索词对应的聚类词组。
6.一种站内搜索词的显示装置,其特征在于,包括:
检测单元,用于检测站内是否有搜索词输入;
查找单元,用于在检测结果为所述站内有搜索词输入的情况下,从预先生成的各聚类词组中找出与当前输入的搜索词对应的聚类词组,所述与当前输入的搜索词对应的聚类词组中包含有与所述当前输入的搜索词语义相同或相近的关键词;
显示单元,用于将所述与当前输入的搜索词对应的聚类词组中包含的所述关键词作为提示词显示以供用户选择输入;
其中,所述装置还用于根据网站所涉及的信息的属性特征,得到行业属性信息;根据所述行业属性信息分析每个所述聚类词组中的每个所述关键词在行业内的实际语义;如果所述关键词在所述行业内的实际语义与当前所属的聚类词组不匹配,则将所述关键词调整到与所述关键词相匹配的聚类词组中。
7.根据权利要求6所述的装置,其特征在于,所述装置还包括:生成单元,用于生成各聚类词组,所述生成单元包括:
记录模块,用于记录输入到所述站内的所有搜索词;
聚类模块,用于对输入的所述所有搜索词按语义关系进行聚类分析,得到所述各聚类词组,其中,所述各聚类词组中任意两个词组中的关键词语义不同。
8.根据权利要求7所述的装置,其特征在于,所述生成单元还包括:
优化模块,用于在对输入的所述所有搜索词按语义关系进行聚类分析,得到所述各聚类词组之后,分行业对得到的所述各聚类词组进行优化处理。
9.根据权利要求8所述的装置,其特征在于,所述优化模块还用于通过机器学习所述站内的文章的方式分行业对得到的所述各聚类词组进行优化处理。
10.根据权利要求7所述的装置,其特征在于,所述查找单元包括:
遍历模块,用于遍历所述各聚类词组;
匹配模块,用于将所述当前输入的搜索词与遍历到的聚类词组中的关键词进行匹配;
确定模块,用于将匹配成功的关键词所属的聚类词组作为找出的所述与当前输入的搜索词对应的聚类词组。
CN201510789817.6A 2015-11-17 2015-11-17 站内搜索词的显示方法及装置 Active CN106708886B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510789817.6A CN106708886B (zh) 2015-11-17 2015-11-17 站内搜索词的显示方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510789817.6A CN106708886B (zh) 2015-11-17 2015-11-17 站内搜索词的显示方法及装置

Publications (2)

Publication Number Publication Date
CN106708886A CN106708886A (zh) 2017-05-24
CN106708886B true CN106708886B (zh) 2020-08-11

Family

ID=58933277

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510789817.6A Active CN106708886B (zh) 2015-11-17 2015-11-17 站内搜索词的显示方法及装置

Country Status (1)

Country Link
CN (1) CN106708886B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110147426B (zh) * 2017-12-01 2021-08-13 北京搜狗科技发展有限公司 一种查询文本的分类标签确定方法及相关装置
CN110109965A (zh) * 2018-02-02 2019-08-09 上海颐为网络科技有限公司 知识分享平台上建立知识结构的辅助提示方法和组件
CN108536676B (zh) * 2018-03-28 2020-10-13 广州华多网络科技有限公司 数据处理方法、装置、电子设备及存储介质
CN110363605A (zh) * 2018-04-10 2019-10-22 北京京东尚科信息技术有限公司 信息搜索方法和装置及计算机可读存储介质
CN109271574A (zh) * 2018-08-28 2019-01-25 麒麟合盛网络技术股份有限公司 一种热词推荐方法及装置
CN112650907B (zh) * 2020-12-25 2023-07-14 百度在线网络技术(北京)有限公司 搜索词的推荐方法、目标模型的训练方法、装置及设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102360358A (zh) * 2011-09-28 2012-02-22 百度在线网络技术(北京)有限公司 关键词推荐方法及系统
CN103365904A (zh) * 2012-04-05 2013-10-23 阿里巴巴集团控股有限公司 一种广告信息搜索方法和系统
WO2014056337A1 (zh) * 2012-10-09 2014-04-17 腾讯科技(深圳)有限公司 搜索词获取方法、服务器、搜索词推荐系统
CN104933081A (zh) * 2014-03-21 2015-09-23 阿里巴巴集团控股有限公司 一种搜索建议提供方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102360358A (zh) * 2011-09-28 2012-02-22 百度在线网络技术(北京)有限公司 关键词推荐方法及系统
CN103365904A (zh) * 2012-04-05 2013-10-23 阿里巴巴集团控股有限公司 一种广告信息搜索方法和系统
WO2014056337A1 (zh) * 2012-10-09 2014-04-17 腾讯科技(深圳)有限公司 搜索词获取方法、服务器、搜索词推荐系统
CN104933081A (zh) * 2014-03-21 2015-09-23 阿里巴巴集团控股有限公司 一种搜索建议提供方法及装置

Also Published As

Publication number Publication date
CN106708886A (zh) 2017-05-24

Similar Documents

Publication Publication Date Title
CN106708886B (zh) 站内搜索词的显示方法及装置
CN107657048B (zh) 用户识别方法及装置
US10762549B2 (en) Analysis and collection system for user interest data and method therefor
US10423648B2 (en) Method, system, and computer readable medium for interest tag recommendation
US9152674B2 (en) Performing application searches
CN108280114B (zh) 一种基于深度学习的用户文献阅读兴趣分析方法
AU2014204091B2 (en) Determining product categories by mining chat transcripts
US10977317B2 (en) Search result displaying method and apparatus
JP5721818B2 (ja) 検索におけるモデル情報群の使用
WO2017000513A1 (zh) 一种基于用户搜索行为的信息推送方法、装置、存储介质和设备
CN109145110B (zh) 标签查询方法和装置
US8868570B1 (en) Selection and display of online content items
KR20160107187A (ko) 검색 결과에서의 논리적인 질문 응답 기법
KR20170093713A (ko) 인공 지능을 기반으로 하는 모바일 검색 방법 및 장치
CN108305180B (zh) 一种好友推荐方法及装置
US20140379719A1 (en) System and method for tagging and searching documents
CN108121455B (zh) 识别纠正方法及装置
US20170011114A1 (en) Common data repository for improving transactional efficiencies of user interactions with a computing device
WO2014206151A1 (en) System and method for tagging and searching documents
KR101700820B1 (ko) 사용자 코멘트 기반 개인화 컨텐츠 검색 장치 및 방법
US20180075070A1 (en) Search space reduction for knowledge graph querying and interactions
CN110569419A (zh) 问答系统优化方法、装置、计算机设备及存储介质
KR20220116794A (ko) 빅데이터를 기반으로 한 취향 분석 맛집 추천 서비스 제공 시스템
US9607031B2 (en) Social data filtering system, method and non-transitory computer readable storage medium of the same
US9098543B2 (en) Attribute detection

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 100083 No. 401, 4th Floor, Haitai Building, 229 North Fourth Ring Road, Haidian District, Beijing

Applicant after: Beijing Guoshuang Technology Co.,Ltd.

Address before: 100086 Cuigong Hotel, 76 Zhichun Road, Shuangyushu District, Haidian District, Beijing

Applicant before: Beijing Guoshuang Technology Co.,Ltd.

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant