CN108388650B - 基于需求的搜索处理方法、装置和智能设备 - Google Patents

基于需求的搜索处理方法、装置和智能设备 Download PDF

Info

Publication number
CN108388650B
CN108388650B CN201810168264.6A CN201810168264A CN108388650B CN 108388650 B CN108388650 B CN 108388650B CN 201810168264 A CN201810168264 A CN 201810168264A CN 108388650 B CN108388650 B CN 108388650B
Authority
CN
China
Prior art keywords
demand
label
search
network
tag
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810168264.6A
Other languages
English (en)
Other versions
CN108388650A (zh
Inventor
雷谦
柏林
吴广发
施鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201810168264.6A priority Critical patent/CN108388650B/zh
Publication of CN108388650A publication Critical patent/CN108388650A/zh
Application granted granted Critical
Publication of CN108388650B publication Critical patent/CN108388650B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3334Selection or weighting of terms from queries, including natural language queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Human Computer Interaction (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于需求的搜索处理方法、装置和智能设备,其中,方法包括:获取搜索语句;对搜索语句进行解析,确定搜索语句对应的目标需求标签;若目标需求标签在预设的需求知识网络中,则从预设的需求知识网络中获取与目标需求标签关联的各关联需求标签;根据目标需求标签及各关联需求标签,进行结果召回。由此,解决了现有技术中,仅仅根据搜索语句中的关键词进行搜索导致搜索结果不准确的技术问题。提高了搜索结果的准确性,并且实现了对用户需求的挖掘,实现了搜索结果的多样性,增加了用户和产品的粘性。

Description

基于需求的搜索处理方法、装置和智能设备
技术领域
本发明涉及信息搜索技术领域,尤其涉及一种基于需求的搜索处理方法、装置和智能设备。
背景技术
互联网用户通过搜索或者在线提问的方式,表达自身的搜索需求。其中,分析用户的搜索词和提问等搜索语句,可以为后续满足用户的搜索需求提供基础数据。
相关技术中,仅仅根据用户的输入的搜索语句中的关键词进行结果召回,然而,实际上,用户的搜索语句可能采用自然语言表达的需求,具有表达方式多样性,提取的关键词可能与用户的实际搜索需求并不一致,从而,导致根据搜索语句的关键词进行结果召回的方式,获取的搜索结果不准确。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本发明的第一个目的在于提出一种基于需求的搜索处理方法,提高了搜索结果的准确性,并且实现了对用户需求的挖掘,实现了搜索结果的多样性,增加了用户和产品的粘性。
本发明的第二个目的在于提出一种基于需求的搜索处理装置。
本发明的第三个目的在于提出一种智能终端。
本发明的第四个目的在于提出一种非临时性计算机可读存储介质。
本发明的第五个目的在于提出一种计算机程序产品。
为达上述目的,本发明第一方面实施例提出了基于需求的搜索处理方法,包括:获取搜索语句;对所述搜索语句进行解析,确定所述搜索语句对应的目标需求标签;若所述目标需求标签在预设的需求知识网络中,则从所述预设的需求知识网络中获取与所述目标需求标签关联的各关联需求标签;根据所述目标需求标签及所述各关联需求标签,进行结果召回。
本发明实施例的基于需求的搜索处理方法,获取搜索语句,对搜索语句进行解析,确定搜索语句对应的目标需求标签,若目标需求标签在预设的需求知识网络中,则从预设的需求知识网络中获取与目标需求标签关联的各关联需求标签,进而,根据目标需求标签及各关联需求标签,进行结果召回。由此,解决了现有技术中,仅仅根据搜索语句中的关键词进行搜索导致搜索结果不准确的技术问题。提高了搜索结果的准确性,并且实现了对用户需求的挖掘,实现了搜索结果的多样性,增加了用户和产品的粘性。
为达上述目的,本发明第二方面实施例提出了一种基于需求的搜索处理装置,包括:第一获取模块,用于获取搜索语句;确定模块,用于对所述搜索语句进行解析,确定所述搜索语句对应的目标需求标签;第二获取模块,用于在所述目标需求标签在预设的需求知识网络中时,从所述预设的需求知识网络中获取与所述目标需求标签关联的各关联需求标签;处理模块,用于根据所述目标需求标签及所述各关联需求标签,进行结果召回。
本发明实施例的基于需求的搜索处理装置,获取搜索语句,对搜索语句进行解析,确定搜索语句对应的目标需求标签,若目标需求标签在预设的需求知识网络中,则从预设的需求知识网络中获取与目标需求标签关联的各关联需求标签,进而,根据目标需求标签及各关联需求标签,进行结果召回。由此,解决了现有技术中,仅仅根据搜索语句中的关键词进行搜索导致搜索结果不准确的技术问题。提高了搜索结果的准确性,并且实现了对用户需求的挖掘,实现了搜索结果的多样性,增加了用户和产品的粘性。
为达上述目的,本发明第三方面实施例提出了一种智能终端,包括:处理器和存储器;其中,所述处理器通过读取所述存储器中存储的可执行程序代码来运行与所述可执行程序代码对应的程序,以用于实现如上述实施例描述的基于需求的搜索处理方法。
为了实现上述目的,本发明第四方面实施例提出了一种非临时性计算机可读存储介质,该程序被处理器执行时实现如上述实施例描述的基于需求的搜索处理方法。
为了实现上述目的,本发明第五方面实施例提出了一种计算机程序产品,当所述计算机程序产品中的指令处理器执行时,执行如上述实施例描述的基于需求的搜索处理方法。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1是根据本发明一个实施例的基于需求的搜索处理方法的流程图;
图2是根据本发明另一个实施例的基于需求的搜索处理方法的流程图;
图3是根据本发明一个实施例的基于需求的搜索处理方法的实现系统示意图;
图4是根据本发明一个实施例的基于需求的搜索处理装置的结构示意图;
图5是根据本发明另一个实施例的基于需求的搜索处理装置的结构示意图;以及
图6为实现本发明实施方式的示例性计算机设备的框图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
基于背景技术可知,用户采用自然语言表达的需求,具有表达方式多样,时效性强,长尾分布等特点,分析清楚每一个用户的需求,并不容易,从而,由于难以提取用户的搜索需求而导致搜索结果的不准确。
为了解决上述技术问题,本发明提供一种基于需求的搜索处理方法,可以准确分析用户的搜索需求,根据用户的搜索需求进行搜索,提高搜索结果的准确度,并且,还可以基于用户当前的搜索需求进行潜在需求的挖掘,满足了一些场景下,用户的搜索需求还具有延伸的特点:即用户并不仅仅希望了解某一个搜索需求点,还对该搜索需求点相关的其他需求点也会有需求,提高了用户对搜索结果的满意度,从而,增加了用户和产品的粘性。
下面参考附图描述本发明实施例的基于需求的搜索处理方法、装置及智能终端。
图1是根据本发明一个实施例的基于需求的搜索处理方法的流程图,如图1所示,该方法包括:
步骤101,获取搜索语句。
具体地,根据不同的应用场景,用户搜索语句可以是语音形式、文字形式等,如果用户的搜索语句为语音形式,则可以基于搜索系统的麦克风等语音接收接口获取搜索语句,如果用户的搜索语句为文字形式,则可以基于搜索系统的搜索输入框接收用户输入的搜索语句。
步骤102,对搜索语句进行解析,确定搜索语句对应的目标需求标签。
应当理解的是,识别搜索语句中用户的搜索需求,以根据用户真正的搜索需求进行搜索结果的召回,而不是通过简单的关键词的匹配。
具体地,以目标需求标签体现用户真正的搜索需求,对搜索语句进行解析,确定搜索语句对应的目标需求标签。
当然,在不同的应用场景中,从用户的搜索语句中解析出对应的目标需求标签的方式不同,示例如下:
第一种示例:
对搜索语句进行内容结构化处理,确定对应的内容标签,由此,基于搜索语句的内容维度进行搜索需求的确定,其中,对搜索语句进行内容结构化处理包括对搜索语句的所属技术领域-主题-内容等的结构化分析处理。
在本示例中,基于对搜索语句的内容结构化的处理分析确定的内容标签,减少了自然语言中不规范的用语对识别结果的影响,有助于提高识别的准确度。举例而言,当搜索语句为“帮我看看这个奶粉对孩子的生长发育好不,我真的很着急,要点靠谱的答案”,显然直接识别该搜索语句会有多种不规范用语的影响,而本实例中,基于对搜索语句的内容结构化的处理,确定该搜索语句的技术领域为“育婴”,主题为“奶粉”等,从而,通过这种内容结构化分析维度的处理,有助于提高搜索结果召回的准确度。
第二种示例:
确定搜索语句包括的人物对象标签及对应的发起人物对象标签。由此,基于搜索语句的人物对象维度进行搜索需求的确定,其中,对搜索语句进行包括的人物对象标签及对应的发起人物对象标签包括对搜索语句的所针对的人群信息和对象信息等的识别。
在本示例中,基于对搜索语句包括的人物对象标签及对应的发起人物对象标签的确定,减少了自然语言中不规范的用语对识别结果的影响,有助于提高识别的准确度。举例而言,当搜索语句为“帮我看看这个奶粉对孩子的生长发育好不,我真的很着急,要点靠谱的答案”,显然直接识别该搜索语句会有多种不规范用语的影响,而本实例中,基于对搜索语句包括的人物对象标签及对应的发起人物对象标签,确定该搜索语句的发起人物标签为“幼儿的父母”,人物标签为“幼儿”,对象标签为“宝宝”,从而,通过这种基于服务对象与待服务对象的识别,有助于提高搜索结果召回的准确度。
第三种示例:根据搜索语句所属的领域,确定对应的类型标签。
在本示例中,基于根据搜索语句所属的领域确定的搜索语句对应的类型标签,限定出搜索语句对应的需求类型,其中,针对不同的领域采用不同的分类模型确定类型标签,比如针对音乐领域采用音乐分类模型确定类型标签等。从而,基于对应类型针对性的为召回搜索结果,避免不相关内容的召回,比如,对于搜索语句“牛奶咖啡的歌曲好听吗”,确定出对应的类型标签为“音乐”,从而避免为用户召回牛奶和咖啡等饮品相关的搜索结果。
需要说明的是,上述三种示例示出的方式,均可从开放域中的自然语言描述的搜索语句,提取出体现用户真正搜索需求的目标需求标签,通过不同维度的需求标签的分析确定,初步筛选出与用户的搜索需求相一致的搜索结果范围,便于进一步从该确定出的搜索结果范围中确定出与用户的搜索需求相一致的搜索结果。
需要强调的是,上述三种示例示出的方式,可以根据应用需要单独实施,也可以任意组合配合实施,其中,当配合实施时,可以对根据搜索语句对应的内容标签、包括的人物对象标签、发起人物对象标签及类型标签的识别结果进行打分,比如,分别建立对根据搜索语句对应的内容标签、包括的人物对象标签、发起人物对象标签及类型标签识别的学习模型,该学习模型可以根据输入的搜索语句进行多种可能的标签识别,并根据每个标签识别结果的可信度赋予权值,根据学习模型输出的结果权值进行打分。
从而,根据搜索语句对应的内容标签、包括的人物对象标签、发起人物对象标签及类型标签的得分,确定搜索语句对应的目标需求标签,比如将最高的得分对应的标签确定为目标需求标签。
在本示例中,基于对搜索语句包括的人物对象标签及对应的发起人物对象标签的确定,减少了自然语言中不规范的用语对识别结果的影响,有助于提高识别的准确度。举例而言,当搜索语句为“帮我看看这个奶粉对孩子的生长发育好不,我真的很着急,要点靠谱的答案”,显然直接识别该搜索语句会有多种不规范用语的影响,而本实例中,基于对搜索语句包括的人物对象标签及对应的发起人物对象标签,确定该搜索语句的发起人物标签为“幼儿的父母”,人物标签为“幼儿”,对象标签为“宝宝”,从而,通过这种基于服务对象与待服务对象的识别,有助于提高搜索结果召回的准确度。
步骤103,若目标需求标签在预设的需求知识网络中,则从预设的需求知识网络中获取与目标需求标签关联的各关联需求标签。
步骤104,根据目标需求标签及各关联需求标签,进行结果召回。
可以理解,预先设置需求知识网络,该需求知识网络的节点包含需求标签对应的标签节点,标签节点与标签节点之间的连接关系包括需求标签与需求标签之间的关系,其中,需求标签可以对应于任意维度表示的用户搜索需求,该需求标签可以包括指示搜索需求对应的搜索内容的内容标签,可以包括指示搜索需求对应的对象类别(包括宝宝等人群类别和肚子等对象类别)的人物对象标签,可以包括指示搜索需求对应的搜索领域(音乐领域、美食领域等)的类型标签等。
从而,若目标需求标签在预设的需求知识网络中,则从预设的需求知识网络中获取与目标需求标签关联的各关联需求标签,进而,根据目标需求标签及各关联需求标签,进行结果召回。
其中,在不同的应用场景下,根据目标需求标签及各关联需求标签,进行结果召回的方式,包括但不限于以下方式:
作为一种可能的实现方式,确定目标需求标签与各关联需求标签间的各关联度,根据各关联度,确定根据各需求标签召回的结果的数量及排序。
可以理解,在本示例中,需求知识网络中需求标签和需求标签之间的连接边的边值为需求标签和需求标签之间的关联度,从而,由于用户对一个需求点感兴趣时,对与该需求点关联性较强的其他兴趣点也感兴趣,在确定出与目标需求标签关联的关联需求标签后,根据目标需求标签与各关联需求标签间的各关联度,将根据与目标需求标签关联度较强的各关联需求标签召回的结果确定并按照关联度由强到弱的顺序提供给用户。
由此,本发明实施例的基于需求的搜索处理方法,一方面,由于目标需求标签对应于用户的真正搜索需求,因而,根据目标需求标签进行结果召回后,获取的搜索结果与用户的搜索需求符合,准确度较高,另一方面,基于确定的与目标需求标签关联的关联需求标签进行结果召回,满足了用户搜索需求具有延伸性的特点,发掘与用户的搜索需求相关的其他潜在的需求点,进一步提高用户对搜索结果的满意度,提高了用户和产品的粘性。
在本发明的一个实施例中,为了进一步保证搜索结果的满意度,还可以结合用户的在线搜索行为进行搜索结果的补充优化等,即在本发明的一个实施例中,从预设的需求知识网络中获取与目标需求标签关联的各关联需求标签之后,还可分别更新目标需求标签及各关联需求标签的对应的搜索次数,在确定任一需求标签的搜索次数达到阈值时,根据任一需求标签更新搜索数据库。举例而言,当确定用户针对音乐需求标签的搜索次数较多时,则可以丰富有关音乐的搜索数据,以便于提供更多关于音乐的搜索结果。
另外,上述实施例中描述的需求知识网络,包含需求标签与需求标签之间的连接关系,实际上,用户的搜索需求以及网络数据都是较为复杂和多变的,为了适应这种复杂性和多变性,本发明中的需求知识网络需要尽量克服定义的完整性难以实现的缺陷,以便于能够准确定出用户的搜索需求。
在本发明的实施例中,建立具有层级关系的需求知识网络,这种结构的网络稳定性较强,且实用性较高,即使某个低等级的标签节点不被包含,也可以基于高级标签节点确定出基本符合的搜索结果,并且,这种结构的网络便于增强和修正,无论是对标签节点的增加和修正都具有较强的可操作性,从而保证了整个需求知识网络的稳定性和可靠性。
在一些可能的实施例中,该建立需求网络的方式为如图2所示的方式:
步骤201,根据获取的具有层级关系的数据集合,建立初始需求网络。
具体地,本发明中的需求知识网络具有层级间的逻辑关系,比如,具有技术领域-主题-内容对应的由上至下的层级关系,从而,可以基于逐级识别的机理实现对搜索需求对应的目标需求标签的识别,保证了搜索需求识别的准确度,在本实施例中,获取具有层级关系的数据集合,建立初始需求网络。
其中,具有层级的数据结构在不同的应用场景下,具有不同的获取方式,在本发明的一个实施例中,可以基于全网的数据进行学习生成的。
步骤202,根据预设的规则,对初始需求网络进行剪枝处理。
具体地,为了保证需求网络的简洁,减轻计算压力,根据预设的规则对初始需求网络进行剪枝处理,以将不符合当前场景需求的标签节点枝节进行删减,其中,预设的规则与当前识别场景对应,根据场景的不同,可以对应于对不符合长度要求的标签节点的删除,可以对应于不符合类型要求的标签节点的删除,可以对应于不符合词性(比如形容词)的标签节点的删除等。
步骤203,利用挖掘的名词词表,对剪枝后的需求网络进行修正,生成预设的需求知识网络。
具体地,可从全网数据中挖掘实体词(比如商店名称、商店品牌、商品名称等),进而,根据预设的规则,对挖掘的实体词进行清洗处理,以生成名词词表,该名词词表作为后续识别搜索语句对应的搜索需求的基础数据,名词词表可包括需求标签。其中,上述预设的规则根据应用场景需求的不同而不同,比如当前应用场景为购物应用,则预设的规则用以清洗出与购物无关的实体词等。
需要强调的是,在实际执行中,还可以根据应用需要采取人工等方式对名词词表进行更新,以保证需求知识网络的灵活性。
在本发明的一个实施例中,为了进一步提高需求知识网络的性能,还可基于标签节点之间的关联度进行边的处理,在该实施例中,对标签节点之间的边的处理包括对标签节点之间的边的方向和权重值的处理,其中,基于标签节点之间的上下级关系,确定标签节点之间连接方向,基于标签节点之间的联系关系强度,确定节点之间连接边的权重值。
在实际执行过程中,对标签节点的添加场景可以为:若名词词表中使用频率大于第一阈值的第一名词未在剪枝后的需求网络中,则将第一名词作为标签节点增加至需求网络,生成预设的需求知识网络,其中,在增加标签节点时,不增加标签节点和标签节点之间的边,而是通过的标签节点之间的共现关系,对已经存在的边进行增强,对不存在的边,计算标签节点和标签节点之前的上下位关系,如果可以明确标签节点之前的上下为的方向,则在需求知识网络中增加有向的边,当然,如果不能明确判断,还可以采用人工的方式进行判断。
显而易见,在本实施例中的对剪枝后的需求网络进行修正,除了上述提到的对标签节点的标准化修正,还包括根据各名词间的关联度,对剪枝后的需求知识网络中连接各标签节点的边的连接方向以及权重值等属性的修正。从而,应当理解,经过对需求知识网络的不断修正可以使得需求知识网络越来越稳定。
基于以上描述可知,需求知识网络具有层级结构,因而,目标需求标签对应的关联的各关联需求标签也具有逻辑上的层级关系,显然,基于目标需求标签和各关联需求标签召回的结果也具有层级关系,因而,还可以根据预设的需求知识网络中,连接目标需求标签与各关联需求标签的边的方向,确定各召回结果间的层级关系,根据该层级关系,可以为用户展现结构化的搜索结果,提高了用户体验。
为了使得本发明实施例的基于需求的搜索处理方法更加清楚,下面结合一个具体实施例中的应用进行说明:
如图3所示,实现基于需求的搜索处理方法的系统可以包括在线请求部分和离线计算部分,其中,在线请求部分用于对用户的搜索语句进行目标需求标签的确定,可包括:内容结构化的处理等内容维度的处理,其中,在该实施例中,该内容结构化的处理可包括领域计算、主题计算、内容标签计算等,在线计算部分还可包括确定搜索语句包括的人物对象标签及对应的发起人物对象标签等维人物对象维度的处理,比如包括直接的人物对象及对应的发起人物对象的抽取,以及人物对象及对应的发起人物对象的预估等,在线计算部分还可包括搜索语句所属的领域的确定等需求维度的处理,确定对应的类型标签,其中,为了提高类型标签的确定效率,还可以针对不同的领域采用不同的需求分类模型,比如,搜索语句属于A领域则对需求结构化以后,采用与A领域对应的需求分类模型确定搜索语句对应的类型标签,比如,搜索语句属于B领域则对需求结构化以后,采用与B领域对应的需求分类模型确定搜索语句对应的类型标签,比如,搜索语句属于C领域则对需求结构化以后,采用与C领域对应的需求分类模型确定搜索语句对应的类型标签。
另外,离线计算部分对应于需求知识网络的获取,可以通过的对名词词表挖掘、网页抓取以及数据清洗等手段建立需求知识网络,以根据该需求知识网络挖掘出与在线计算部分确定的搜索语句对应的目标需求标签关联的各关联需求标签,从而实现根据目标需求标签及各关联需求标签,进行结果召回。
综上所述,本发明实施例的基于需求的搜索处理方法,获取搜索语句,对搜索语句进行解析,确定搜索语句对应的目标需求标签,若目标需求标签在预设的需求知识网络中,则从预设的需求知识网络中获取与目标需求标签关联的各关联需求标签,进而,根据目标需求标签及各关联需求标签,进行结果召回。由此,解决了现有技术中,仅仅根据搜索语句中的关键词进行搜索导致搜索结果不准确的技术问题。提高了搜索结果的准确性,并且实现了对用户需求的挖掘,实现了搜索结果的多样性,增加了用户和产品的粘性。
为了实现上述实施例,本发明还提出一种基于需求的搜索处理装置。图4是根据本发明一个实施例的基于需求的搜索处理装置的结构示意图,如图4所示,该基于需求的搜索处理装置包括第一获取模块100、确定模块200、第二获取模块300和处理模块400。
其中,第一获取模块100,用于获取搜索语句。
确定模块200,用于对搜索语句进行解析,确定搜索语句对应的目标需求标签。
第二获取模块300,用于在目标需求标签在预设的需求知识网络中时,从预设的需求知识网络中获取与目标需求标签关联的各关联需求标签。
处理模块400,用于根据目标需求标签及各关联需求标签,进行结果召回。
在本发明的一个实施例中,如图5所示,处理模块400包括确定单元410和处理单元420。
其中,确定单元410,用于确定目标需求标签与各关联需求标签间的各关联度。
处理单元420,用于根据各关联度,确定根据各需求标签召回的结果的数量及排序。
需要说明的是,前述对基于需求的搜索处理方法实施例的解释说明也适用于该实施例的基于需求的搜索处理装置,此处不再赘述。
综上所述,本发明实施例的基于需求的搜索处理装置,获取搜索语句,对搜索语句进行解析,确定搜索语句对应的目标需求标签,若目标需求标签在预设的需求知识网络中,则从预设的需求知识网络中获取与目标需求标签关联的各关联需求标签,进而,根据目标需求标签及各关联需求标签,进行结果召回。由此,解决了现有技术中,仅仅根据搜索语句中的关键词进行搜索导致搜索结果不准确的技术问题。提高了搜索结果的准确性,并且实现了对用户需求的挖掘,实现了搜索结果的多样性,增加了用户和产品的粘性。
为了实现上述实施例,本发明还提出一种智能终端,包括:处理器,其中,处理器通过读取存储器中存储的可执行程序代码来运行与可执行程序代码对应的程序,以用于实现上述实施例描述的基于需求的搜索处理方法。其中,该智能终端可以是手机、平板电脑、个人数字助理、穿戴式设备等具有各种操作系统的硬件设备,该穿戴式设备可以是智能手环、智能手表、智能眼镜等。
为了实现上述实施例,本发明还提出一种非临时性计算机可读存储介质,当所述存储介质中的指令由处理器被执行时,使得能够执行上述实施例示出的基于需求的搜索处理方法。
为了实现上述实施例,本发明还提出一种计算机程序产品,当所述计算机程序产品中的指令处理器执行时,执行上述实施例示出的截屏搜索方法。
图6示出了适于用来实现本发明实施方式的示例性计算机设备的框图。图6显示的计算机设备12仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图6所示,计算机设备12以通用计算设备的形式表现。计算机设备12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,系统存储器28,连接不同系统组件(包括系统存储器28和处理单元16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(Industry StandardArchitecture;以下简称:ISA)总线,微通道体系结构(Micro Channel Architecture;以下简称:MAC)总线,增强型ISA总线、视频电子标准协会(Video Electronics StandardsAssociation;以下简称:VESA)局域总线以及外围组件互连(Peripheral ComponentInterconnection;以下简称:PCI)总线。
计算机设备12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机设备12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(Random Access Memory;以下简称:RAM)30和/或高速缓存存储器32。计算机设备12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图6未显示,通常称为“硬盘驱动器”)。尽管图6中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如:光盘只读存储器(Compact Disc Read OnlyMemory;以下简称:CD-ROM)、数字多功能只读光盘(Digital Video Disc Read OnlyMemory;以下简称:DVD-ROM)或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如存储器28中,这样的程序模块42包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。
计算机设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该计算机系统/服务器12交互的设备通信,和/或与使得该计算机系统/服务器12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,计算机设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(Local AreaNetwork;以下简称:LAN),广域网(Wide Area Network;以下简称:WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器20通过总线18与计算机设备12的其它模块通信。应当明白,尽管图中未示出,可以结合计算机设备12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理单元16通过运行存储在系统存储器28中的程序,从而执行各种功能应用以及数据处理,例如实现前述实施例中提及的方法。
在本发明的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”“内”、“外”、“顺时针”、“逆时针”、“轴向”、“径向”、“周向”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
在本发明中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”、“固定”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系,除非另有明确的限定。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
在本发明中,除非另有明确的规定和限定,第一特征在第二特征“上”或“下”可以是第一和第二特征直接接触,或第一和第二特征通过中间媒介间接接触。而且,第一特征在第二特征“之上”、“上方”和“上面”可是第一特征在第二特征正上方或斜上方,或仅仅表示第一特征水平高度高于第二特征。第一特征在第二特征“之下”、“下方”和“下面”可以是第一特征在第二特征正下方或斜下方,或仅仅表示第一特征水平高度小于第二特征。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (10)

1.一种基于需求的搜索处理方法,其特征在于,包括:
获取搜索语句;
对所述搜索语句进行解析,确定所述搜索语句对应的目标需求标签,所述目标需求标签包括内容标签;
若所述目标需求标签在预设的需求知识网络中,则从所述预设的需求知识网络中获取与所述目标需求标签关联的各关联需求标签;
根据所述目标需求标签及所述各关联需求标签,进行结果召回;
所述从所述预设的需求知识网络中获取与所述目标需求标签关联的各关联需求标签之前,还包括:
根据获取的具有层级关系的数据集合,建立初始需求网络;
根据预设的规则,对所述初始需求网络进行剪枝处理;
利用挖掘的名词词表,对剪枝后的需求网络进行修正,生成所述预设的需求知识网络,所述对剪枝后的需求网络进行修正,包括:若所述名词词表中使用频率大于第一阈值的第一名词未在所述剪枝后的需求网络中,则将所述第一名词作为标签节点增加至所述需求网络,其中,在增加所述标签节点时,不增加所述标签节点和标签节点之间的边,而是通过所述标签节点之间的共现关系,对已经存在的边进行增强,对不存在的边,计算所述标签节点和所述标签节点之间的上下位关系,若明确所述标签节点之间的上下位的方向,则在所述需求知识网络中增加有向的边;
所述对剪枝后的需求网络进行修正之前,还包括:
从全网数据中挖掘实体词;
按照所述预设的规则,对挖掘的实体词进行清洗处理,生成所述名词词表;
所述名词词表中包括各词的使用频率;
所述名词词表中包括各名词间的关联度及层级关系;
所述对剪枝后的需求网络进行修正,包括:
根据所述各名词间的关联度,对所述剪枝后的需求网络中连接各标签节点的边的连接方向以及权重值进行修正。
2.如权利要求1所述的方法,其特征在于,所述进行结果召回,包括:
确定所述目标需求标签与所述各关联需求标签间的各关联度;
根据所述各关联度,确定根据各需求标签召回的结果的数量及排序。
3.如权利要求1所述的方法,其特征在于,所述进行结果召回之后,还包括:
根据所述预设的需求知识网络中,连接所述目标需求标签与各关联需求标签的边的方向,确定各召回结果间的层级关系。
4.如权利要求1所述的方法,其特征在于,所述从所述预设的需求知识网络中获取与所述目标需求标签关联的各关联需求标签之后,还包括:
分别更新所述目标需求标签及所述各关联需求标签的对应的搜索次数;
在确定任一需求标签的搜索次数达到阈值时,根据所述任一需求标签更新搜索数据库。
5.如权利要求1所述的方法,其特征在于,所述确定所述搜索语句对应的目标需求标签,包括:
对所述搜索语句进行内容结构化处理,确定对应的内容标签;
和/或,
确定所述搜索语句包括的人物对象标签及对应的发起人物对象标签;
和/或,根据所述搜索语句所属的领域,确定对应的类型标签。
6.如权利要求5所述的方法,其特征在于,所述确定所述搜索语句对应的目标需求标签,包括:
根据所述搜索语句对应的内容标签、包括的人物对象标签、发起人物对象标签及类型标签的得分,确定所述搜索语句对应的目标需求标签。
7.一种基于需求的搜索处理装置,其特征在于,包括:
第一获取模块,用于获取搜索语句;
确定模块,用于对所述搜索语句进行解析,确定所述搜索语句对应的目标需求标签,所述目标需求标签包括内容标签;
第二获取模块,用于在所述目标需求标签在预设的需求知识网络中时,从所述预设的需求知识网络中获取与所述目标需求标签关联的各关联需求标签;
处理模块,用于根据所述目标需求标签及所述各关联需求标签,进行结果召回;
所述从所述预设的需求知识网络中获取与所述目标需求标签关联的各关联需求标签之前,还包括:
根据获取的具有层级关系的数据集合,建立初始需求网络;
根据预设的规则,对所述初始需求网络进行剪枝处理;
利用挖掘的名词词表,对剪枝后的需求网络进行修正,生成所述预设的需求知识网络,所述对剪枝后的需求网络进行修正,包括:若所述名词词表中使用频率大于第一阈值的第一名词未在所述剪枝后的需求网络中,则将所述第一名词作为标签节点增加至所述需求网络,其中,在增加所述标签节点时,不增加所述标签节点和标签节点之间的边,而是通过所述标签节点之间的共现关系,对已经存在的边进行增强,对不存在的边,计算所述标签节点和所述标签节点之间的上下位关系,若明确所述标签节点之间的上下位的方向,则在所述需求知识网络中增加有向的边;
所述对剪枝后的需求网络进行修正之前,还包括:
从全网数据中挖掘实体词;
按照所述预设的规则,对挖掘的实体词进行清洗处理,生成所述名词词表;
所述名词词表中包括各词的使用频率;
所述名词词表中包括各名词间的关联度及层级关系;
所述对剪枝后的需求网络进行修正,包括:
根据所述各名词间的关联度,对所述剪枝后的需求网络中连接各标签节点的边的连接方向以及权重值进行修正。
8.如权利要求7所述的装置,其特征在于,所述处理模块,包括:
确定单元,用于确定所述目标需求标签与所述各关联需求标签间的各关联度;
处理单元,用于根据所述各关联度,确定根据各需求标签召回的结果的数量及排序。
9.一种智能终端,其特征在于,包括处理器和存储器;
其中,所述处理器通过读取所述存储器中存储的可执行程序代码来运行与所述可执行程序代码对应的程序,以用于实现如权利要求1-6中任一所述的基于需求的搜索处理方法。
10.一种非临时性计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-6中任一所述的基于需求的搜索处理方法。
CN201810168264.6A 2018-02-28 2018-02-28 基于需求的搜索处理方法、装置和智能设备 Active CN108388650B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810168264.6A CN108388650B (zh) 2018-02-28 2018-02-28 基于需求的搜索处理方法、装置和智能设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810168264.6A CN108388650B (zh) 2018-02-28 2018-02-28 基于需求的搜索处理方法、装置和智能设备

Publications (2)

Publication Number Publication Date
CN108388650A CN108388650A (zh) 2018-08-10
CN108388650B true CN108388650B (zh) 2022-11-04

Family

ID=63069092

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810168264.6A Active CN108388650B (zh) 2018-02-28 2018-02-28 基于需求的搜索处理方法、装置和智能设备

Country Status (1)

Country Link
CN (1) CN108388650B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109684633B (zh) * 2018-12-14 2023-05-16 北京百度网讯科技有限公司 搜索处理方法、装置、设备及存储介质
CN110245357B (zh) * 2019-06-26 2023-05-02 北京百度网讯科技有限公司 主实体识别方法和装置
CN111324626B (zh) * 2020-01-21 2022-07-12 思必驰科技股份有限公司 基于语音识别的搜索方法、装置、计算机设备及存储介质
CN111552780B (zh) * 2020-04-29 2023-09-29 微医云(杭州)控股有限公司 医用场景的搜索处理方法、装置、存储介质及电子设备
CN111813828B (zh) * 2020-06-30 2024-02-27 北京百度网讯科技有限公司 一种实体关系挖掘方法、装置、电子设备及存储介质
CN112131436A (zh) * 2020-09-25 2020-12-25 北京理工大学 需求网络构建方法、装置及系统
CN113051253A (zh) * 2021-04-15 2021-06-29 广州云族佳科技有限公司 一种构建标签数据库的方法和装置
CN114398993B (zh) * 2022-01-18 2024-05-14 平安科技(深圳)有限公司 基于标签数据的搜索信息召回方法、系统、装置和介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102207946A (zh) * 2010-06-29 2011-10-05 天津海量信息技术有限公司 一种知识网络的半自动生成方法
CN103353894A (zh) * 2013-07-19 2013-10-16 武汉睿数信息技术有限公司 一种基于语义分析的数据搜索方法和系统
CN104537065A (zh) * 2014-12-29 2015-04-22 北京奇虎科技有限公司 一种搜索结果的推送方法及系统
CN106909662A (zh) * 2017-02-27 2017-06-30 腾讯科技(上海)有限公司 知识图谱构建方法及装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102073729B (zh) * 2011-01-14 2013-03-06 百度在线网络技术(北京)有限公司 一种关系化知识共享平台及其实现方法
CN104850554B (zh) * 2014-02-14 2020-05-19 北京搜狗科技发展有限公司 一种搜索方法和系统
CN104252533B (zh) * 2014-09-12 2018-04-13 百度在线网络技术(北京)有限公司 搜索方法和搜索装置
US10180989B2 (en) * 2015-07-24 2019-01-15 International Business Machines Corporation Generating and executing query language statements from natural language
CN106844407B (zh) * 2015-12-07 2020-03-10 华为技术有限公司 基于数据集相关性的标签网络产生方法和系统
CN106372191A (zh) * 2016-08-31 2017-02-01 广东华邦云计算股份有限公司 一种数据搜索方法和装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102207946A (zh) * 2010-06-29 2011-10-05 天津海量信息技术有限公司 一种知识网络的半自动生成方法
CN103353894A (zh) * 2013-07-19 2013-10-16 武汉睿数信息技术有限公司 一种基于语义分析的数据搜索方法和系统
CN104537065A (zh) * 2014-12-29 2015-04-22 北京奇虎科技有限公司 一种搜索结果的推送方法及系统
CN106909662A (zh) * 2017-02-27 2017-06-30 腾讯科技(上海)有限公司 知识图谱构建方法及装置

Also Published As

Publication number Publication date
CN108388650A (zh) 2018-08-10

Similar Documents

Publication Publication Date Title
CN108388650B (zh) 基于需求的搜索处理方法、装置和智能设备
CN108829822B (zh) 媒体内容的推荐方法和装置、存储介质、电子装置
CN114578969B (zh) 用于人机交互的方法、装置、设备和介质
CN109460512B (zh) 推荐信息处理方法、装置、设备及存储介质
CN106649603B (zh) 一种基于网页文本数据情感分类的指定信息推送方法
CN110134931B (zh) 媒介标题生成方法、装置、电子设备及可读介质
CN110597962B (zh) 搜索结果展示方法、装置、介质及电子设备
US9015168B2 (en) Device and method for generating opinion pairs having sentiment orientation based impact relations
CN110737774B (zh) 图书知识图谱的构建、图书推荐方法、装置、设备及介质
CN110287405B (zh) 情感分析的方法、装置和存储介质
CN113806588B (zh) 搜索视频的方法和装置
CN112860852A (zh) 信息分析方法及装置、电子设备和计算机可读存储介质
EP3825869A1 (en) Method and apparatus for pushing information, electronic device, medium and computer program product
CN113704507B (zh) 数据处理方法、计算机设备以及可读存储介质
CN111666766A (zh) 数据处理方法、装置和设备
CN115099239B (zh) 一种资源识别方法、装置、设备以及存储介质
CN110874534A (zh) 数据处理方法和数据处理装置
CN112148958A (zh) 用于信息推荐的方法、设备和计算机存储介质
CN116662495A (zh) 问答处理方法、训练问答处理模型的方法及装置
CN112446214A (zh) 广告关键词的生成方法、装置、设备及存储介质
CN112417210A (zh) 健身视频的查询方法、装置、终端和存储介质
CN116955591A (zh) 用于内容推荐的推荐语生成方法、相关装置和介质
CN110705308A (zh) 语音信息的领域识别方法、装置、存储介质及电子设备
CN116775815B (zh) 对话数据的处理方法、装置、电子设备及存储介质
CN114064854A (zh) 查询文本处理方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant