CN112905884B - 生成序列标注模型的方法、设备、介质及程序产品 - Google Patents

生成序列标注模型的方法、设备、介质及程序产品 Download PDF

Info

Publication number
CN112905884B
CN112905884B CN202110187089.7A CN202110187089A CN112905884B CN 112905884 B CN112905884 B CN 112905884B CN 202110187089 A CN202110187089 A CN 202110187089A CN 112905884 B CN112905884 B CN 112905884B
Authority
CN
China
Prior art keywords
information
label
entity
knowledge
result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110187089.7A
Other languages
English (en)
Other versions
CN112905884A (zh
Inventor
林泽南
卢佳俊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN202110187089.7A priority Critical patent/CN112905884B/zh
Publication of CN112905884A publication Critical patent/CN112905884A/zh
Application granted granted Critical
Publication of CN112905884B publication Critical patent/CN112905884B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种生成序列标注模型的方法、设备、介质及程序产品,涉及知识图谱、自然语言处理和深度学习等人工智能技术领域。该方法的一具体实施方式包括:获取第一搜索信息和对应的第一标签;根据第一搜索信息,从预设的知识图谱中获取第一搜索信息对应的第二标签;响应于第二标签与第一标签不一致,确定第一搜索信息中的第一需求信息不为知识图谱中的信息;基于第一需求信息和第一需求信息对应的标签进行训练,得到训练后的序列标注模型。

Description

生成序列标注模型的方法、设备、介质及程序产品
技术领域
本申请涉及计算机技术领域,具体涉及知识图谱、自然语言处理和深度学习等人工智能技术领域,尤其涉及一种生成序列标注模型的方法、设备、介质及程序产品。
背景技术
随着互联网的发展,用户可以通过搜索信息来获取用户需要搜索的结果。
目前,基于知识图谱理解固定搜索信息,以达到识别用户意图和需求的目的。
发明内容
本申请实施例提出了一种生成序列标注模型的方法、设备、介质及程序产品。
第一方面,本申请实施例提出了一种生成序列标注模型的方法,包括:获取第一搜索信息和对应的第一标签;根据第一搜索信息,从预设的知识图谱中获取第一搜索信息对应的第二标签;响应于第二标签与第一标签不一致,确定第一搜索信息中的第一需求信息不为知识图谱中的信息;基于第一需求信息和第一需求信息对应的标签进行训练,得到训练后的序列标注模型。
第二方面,本申请实施例提出了一种生成序列标注模型的装置,包括:第一获取模块,被配置成获取第一搜索信息和对应的第一标签;第二获取模块,被配置成根据第一搜索信息,从预设的知识图谱中获取第一搜索信息对应的第二标签;信息确定模块,被配置成响应于第二标签与第一标签不一致,确定第一搜索信息中的第一需求信息不为知识图谱中的信息;模型训练模块,被配置成基于第一需求信息和第一需求信息对应的标签进行训练,得到训练后的序列标注模型。
第三方面,本申请实施例提出了一种确定搜索结果的方法,包括:获取第二搜索信息,其中,第二搜索信息包括第二需求信息和预设的知识图谱中的知识图谱既定信息;根据知识图谱既定信息,从知识图谱中获取知识图谱既定信息对应的标签结果,以及将第二需求信息输入序列标注模型中,得到第二需求信息对应的标签结果;根据知识图谱既定信息对应的标签结果和第二需求信息对应的标签结果,得到第二搜索信息对应的搜索结果,并展示搜索结果。
第四方面,本申请实施例提出了一种确定搜索结果的装置,包括:信息获取模块,被配置成获取第二搜索信息,其中,第二搜索信息包括第二需求信息和预设的知识图谱中的知识图谱既定信息;标签得到模块,被配置成根据知识图谱既定信息,从知识图谱中获取知识图谱既定信息对应的标签结果,以及将第二需求信息输入序列标注模型中,得到第二需求信息对应的标签结果;结果得到模块,被配置成根据知识图谱既定信息对应的标签结果和第二需求信息对应的标签结果,得到第二搜索信息对应的搜索结果,并展示搜索结果。
第五方面,本申请实施例提出了一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行如第一方面或第二方面描述的方法。
第六方面,本申请实施例提出了一种存储有计算机指令的非瞬时计算机可读存储介质,计算机指令用于使计算机执行如第一方面或第二方面描述的方法。
第七方面,本申请实施例提出了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现第一方面或第二方面描述的方法。
第八方面,本申请实施例提出了一种搜索信息,包括生成序列标注模型的装置和确定搜索结果的装置。
本申请实施例提供的生成序列标注模型的方法、设备、介质及程序产品,首先获取第一搜索信息和对应的第一标签;然后,根据第一搜索信息,从预设的知识图谱中获取第一搜索信息对应的第二标签;然后在第二标签与第一标签不一致时,确定第一搜索信息中的第一需求信息不为知识图谱中的信息;最后基于第一需求信息和第一需求信息对应的标签进行训练,得到训练后的序列标注模型,可以基于第一搜索信息中变化的部分(即第一需求信息)训练序列标注模型,以辅助知识图谱,实现对第一搜索信息准确的识别,从而到达准确识别用户意图和需求的目的。
应当理解,本部分所描述的内容并非旨在标识本申请的实施例的关键或重要特征,也不用于限制本申请的范围。本申请的其它特征将通过以下的说明书而变得容易理解。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显。附图用于更好地理解本方案,不构成对本申请的限定。其中:
图1是本申请可以应用于其中的示例性系统架构;
图2是根据本申请的生成序列标注模型的方法的一个实施例的流程图;
图3是根据本申请的确定搜索结果的方法的一个实施例的流程图;
图4是根据本申请的确定搜索结果的方法的一个应用场景图;
图5是根据本申请的搜索系统的一个应用示意图;
图6是根据本申请的生成序列标注模型的装置的一个实施例的结构示意图;
图7是根据本申请的确定搜索结果的装置的一个实施例的结构示意图;
图8是用来实现本申请实施例的生成序列标注模型的方法的电子设备的框图。
具体实施方式
以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
图1示出了可以应用本申请的生成序列标注模型的方法和装置或确定搜索结果的方法和装置的实施例的示例性系统架构100。
如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103、服务器105任意两个之间提供通信链路的介质。网络104可以包括各种连接类别,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种应用,例如各种客户端应用、多方交互应用、人工智能应用等。
服务器105可以是提供各种服务的服务器,例如对终端设备101、102、103提供支持的后台服务器。后台服务器可以对接收到的请求等数据进行分析等处理,并将处理结果反馈给终端设备。
需要说明的是,服务器可以是硬件,也可以是软件。当服务器为硬件时,可以实现成多个服务器组成的分布式服务器集群,也可以实现成单个服务器。当服务器为软件时,可以实现成例如用来提供分布式服务的多个软件或软件模块,也可以实现成单个软件或软件模块。在此不做具体限定。
在实践中,本申请实施例所提供的生成序列标注模型的方法或确定搜索结果的方法可以由终端设备101、102、103或服务器105执行,生成序列标注模型的装置或确定搜索结果的装置也可以设置于终端设备101、102、103或服务器105中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
继续参考图2,其示出了根据本申请的生成序列标注模型的方法的一个实施例的流程200。该生成序列标注模型的方法包括以下步骤:
步骤201,获取第一搜索信息和对应的第一标签。
在本实施例中,生成序列标注模型的执行主体(例如图1所示的终端设备101、102、103)可以从本地获取第一搜索信息和第一搜索信息对应的第一标签;或,生成序列标注模型的执行主体(例如图1所示的服务器105)可以从终端设备(例如图1所示的终端设备101、102、103)上获取第一搜索信息和第一搜索信息对应的第一标签。上述第一搜索信息可以为用户在搜索框中输入的信息。上述第一标签可以用于确定第一搜索信息的属性信息。
步骤202,根据第一搜索信息,从预设的知识图谱中获取第一检索信息对应的第二标签。
在本实施例中,上述执行主体可以将将第一搜索信息作为知识图谱的索引,从知识图谱中检索得到第一搜索信息对应的第二标签。上述知识图谱可以用于为第一搜索信息设置标签,以充分识别用户的意图和需求。上述第二标签可以为基于知识图谱确定的标签。
步骤203,响应于第二标签与第一标签不一致,确定第一搜索信息中的第一需求信息不为知识图谱中的信息。
在本实施例中,上述执行主体可以在第二标签与第一标签不一致时,可以确定第一搜索信息中存在知识图谱无法识别的第一需求信息,也即,第一需求信息不为知识图谱中的信息。
在这里,在第二标签与第一标签不一致时,说明第一标签中存在基于知识图谱设置标签的信息和不能基于知识图谱设置标签的信息(即,第一需求信息)。上述第二标签与第一标签不一致可以为:第二标签为错误标签(与第一标签不同的标签即为错误标签),或第二标签为无法识别对应的标签。
需要说明的是,对于不能基于知识图谱设置标签的信息(即,第一需求信息),则可以由人工设置标签。
步骤204,基于第一需求信息和第一需求信息对应的标签进行训练,得到训练后的序列标注模型。
在本实施例中,上述执行主体可以在第二标签与第一标签不一致时,将第一需求信息作为序列标注模型的输入,将与第一需求信息对应的第一标签作为序列标注模型的输出,以得到序列标注模型。
在本实施例中,序列标注模型可以用于挖掘第一需求信息,以便用于搜索系统,辅助知识图谱进行知识标注,以充分识别用户的意图和需求。另外,在后续有知识图谱无法标注的用户需求信息时,就需要根据该用户需求信息对序列标注模型进行优化,以拓展搜索系统的理解能力。
需要说明的是,序列标注模型,基于知识图谱中的知识图谱既定信息和对应的标签,以及第一需求信息和第一需求信息对应的标签,将第一需求信息和第一需求信息对应的标签作为序列标注模型的训练集,在知识图谱无法识别需求信息时,则需要根据需求信息不断优化训练序列标注模型,以达到准确识别用户意图和需求的目的。
本申请实施例提供的生成序列标注模型的方法,可自动挖掘用户信的需求信息,用于搜索系统,以辅助知识图谱进行标注,充分识别用户的意图和需求。
在本实施例的一些可选的实现方式中,第一需求信息包括以下至少一项:实体需求限定信息、问答需求限定信息、泛需求限定信息。
在本实现方式中,第一需求信息可以用于表征用户其他检索需求。该第一需求信息可以用于让用户搜索自己需求的信息。
需要说明的是,问答需求限定信息、问答限定信息和泛需求限定信息可以是相同的限定信息,还可以是不同的限定信息。
在本实现方式中,以“影视领域”为例,提出一个知识图谱之外,但出现在第一搜索信息中的第一需求信息(如免费、语言类型(例如,中文))、站点词(“A播放平台”、“B播放平台”、“C影院”)、表述词(是谁演的)、问答p(导演、编剧、上映时间等p),p的意思是predicate(谓语),注意,这里不是知识图谱没有p,而是挖掘知识图谱中用户关心的p,因为p太多了。其中,表述词(是谁演的)、问答p(导演、编剧、上映时间等p)可以为问答需求限定信息;(如免费、国语中字)、站点词(“A播放平台”、“B播放平台”、“C影院”)可以为实体需求限定信息;“古装剧”、“战争片”等可以为泛需求限定信息。
实体:2015年“D版本”“CCC影视”在线看。知识图谱可以获取n个“CCC影视”实体,找到某个是2015年,且是“D版本”的“CCC影视”实体,即从知识图谱获取实体知识信息(即实体既定信息)。其中,“D版本”可以为“A演员版本”。
泛需求:9分以上“D导演”导演的文艺电影。从知识图谱获取9分以上的&“D导演”作为导演&文艺标签的&电影,所有需求的实体交集,就是此泛需求的答案。
问答:“CCC影视”中“A角色”是谁演的。从知识图谱中获取所有“CCC影视”实体集合,并知识标注“A角色”,知道“A角色”为“CCC影视第一季”中为一个角色。所以基于完备知识图谱很重要。
在本实现方式中,可以基于第一需求信息对序列标注模型进行半自动优化,以使序列标注模型能充分挖掘新的第一需求信息,该第一需求信息可以针对实体、问答、泛需求对应的需求限定信息,在实体、问答、泛需求三个方面都可以准确地识别用户的意图和需求。
在本实施例的一些可选的实现方式中,第一用户搜索信息还包括:知识图谱既定信息,其中,知识图谱既定信息为知识图谱中的信息。
在本实现方式中,知识图谱既定信息可以为知识图谱中已存储的信息。
在本实现方式中,利用知识图谱可以准确地识别知识图谱既定信息,以备后续可以将人工标注的第一需求信息,作为序列标注模型的训练样本,半自动的不断优化序列标注模型,以实现基于知识图谱和序列标注模型识别用户的意图和需求。
在本实施例的一些可选的实现方式中,知识图谱既定信息包括以下至少一项:实体既定信息、问答既定信息、泛需求既定信息。
在本实现方式中,实体既定信息可以为与实体相关的信息。问答既定信息可以为与问答相关的信息,例如问答表述词,例如“导演是谁”,“年龄多大”。泛需求限定信息可以为与泛需求相关的信息,例如泛需求表述词,例如“古装剧”、“战争片”、“动画片”、“年龄分布规律”等。
需要说明的是,在每个搜索信息中可以同时包括实体既定信息、问答既定信息和泛需求既定信息;例如,在搜索信息包括实体既定信息和问答既定信息时,可以确定该搜索信息的类型为问答信息。
在本实现方式中,可以基于知识图谱中的知识图谱既定信息实现对第一搜索信息的准确标注,另外,实体既定信息、问答既定信息、泛需求既定信息为实体、问答、泛需求特有的信息,所以后续可以在标注出实体既定信息、问答既定信息、泛需求既定信息之后,就可以确定搜索信息的类型。例如“问答表述词”可以用于区分问答,“泛需求表述词”可以用于区分泛需求。
在本实施例的一些可选的实现方式中,实体既定信息包括:实体提及和针对实体的本质属性信息;或实体提及。问答既定信息包括:实体提及和/或针对实体的本质属性信息。泛需求既定信息包括:针对实体的本质属性信息。
在这里,实体提及可以为实体的文本表现形式,可以是命名实体、普通名词短语、代词等。例如,对于实体“AAA大学”来说,其实体提及可以包括“AAA大学”、“AAA”等等。
在这里,针对实体的本质属性信息可以为用于描述实体本质属性的信息。例如,实体为“A”,“A”的本质属性信息可以为“电视剧”、“古装”、“电影”、“第一季”、“第一部”等、“权谋”(即实体tag)等。
在一个具体的示例中,以“影视领域”为例,实体既定信息可以为“A影视”和“古装”[针对实体的本质属性信息],例如“古装”为“实体tag”。问答既定信息可以为“A影视”和“古装”[针对实体的本质属性信息];泛需求既定信息可以为“古装”[针对实体的本质属性信息],泛需求既定信息可以用于搜索所有的“古装”影视。
需要说明的是,在实体既定信息和问答既定信息相同时,以备后续在获取到用户输入的第二搜索信息时,可以在对第二实体既定信息过程中,在对第二搜索信息设置标签时,可以先对第二搜索信息执行实体标注阶段,之后再执行问答标注阶段,已达到代码逻辑复用。
在本实现方式中,利用实体提及和/或针对实体的本质属性信息可以准确地确定实体既定信息、问答既定信息和泛需求既定信息,从而可以基于知识图谱准确地识别知识图谱既定信息,以到达识别用户意图和需求的目的。
在本实施例的一些可选的实现方式中,序列标注模型包括:ERNIE层、双向长短期记忆网络(BiLSTM)层和条件随机场(CRF)层。
在本实现方式中,基于序列标注模型包括:ERNIE层、双向长短期记忆网络(BiLSTM)层和条件随机场(CRF)层,将人工标注的第一需求信息作为训练样本,不断半自动迭代模型,挖掘新的第一需求信息。
在本实现方式中,将第一需求信息作为训练样本,对序列标注模型进行训练;其中,ERNIE(Enhanced Representation from Knowledge Integration)是基于知识增强的持续学习语义理解框架,该框架将大数据预训练与多源丰富知识相结合,通过持续学习技术,不断吸收海量文本数据中词汇、结构、语义等方面的知识,实现模型效果不断进化。另外,ERNIE为上下文相关(contextual)的迁移学习模型,可以将该序列标注模型进行类比、泛化,所以进一步增强了序列标注模型的能力;之后,利用训练后的序列标注模型,再对搜索信息(query)进行序列标注,挖掘新的第一需求信息,然后将新的第一需求信息加入搜索系统,又新增了对第一搜索信息的理解,然后再训练序列标注模型,如此反复,可以准确地识别用户的意图和目的。
在本实现方式中,基于ERNIE层+BiLSTM+CRF,可以将人工标注的第一需求信息作为训练样本,不断半自动迭代模型,挖掘新的第一需求信息,以备后续利用训练后的模型实现对用户需求信息的准确识别。
在本实施例的一些可选的实现方式中,第一用户搜索信息可以为标题文本、商品搜索信息、文本搜索等。
需要说明的是,生成序列标注模型的方法不单单应用于“影视领域”、还可以应用于“生日”、“商品”、“导航”等所有涉及“搜索”的领域均可纳入本申请的保护范围。
在本实现方式中,生成序列标注模型的方法可以在各种搜索引擎上使用。
在本实施例的一些可选的实现方式中,所述第二标签与所述第一标签不一致,包括:
所述第二标签为错误的标签;或,所述第二标签为无法识别对应的标签。
在这里,在第二标签与第一标签不一致时,说明第一标签中存在基于知识图谱设置标签的信息和不能基于知识图谱设置标签的信息(即,第一需求信息)。上述第二标签与第一标签不一致可以为:第二标签为错误标签(与第一标签不同的标签即为错误标签),或第二标签为无法识别对应的标签,例如“Unknow”。
在本实现方式中,通过第二标签与第一标签的不一致来确定第一需求信息不为知识图谱中的信息,来触发序列标注模型的训练,从而可以基于训练好的序列标注模型挖掘新的需求信息,以达到准确识别用户的意图和需求的目的。
继续参考图3,其示出了根据本申请的确定搜索结果的方法的一个实施例的流程300。该确定搜索结果的方法包括以下步骤:
步骤301,获取第二用户搜索信息。
在本实施例中,确定搜索结果的方法的执行主体(例如图1所示的服务器105)可以获取用户在终端设备(例如图1所示的终端设备101、102、103)上的搜索框中输入的第二用户搜索信息;或,确定搜索结果的方法的执行主体(例如图1所示的终端设备101、102、103)可以获取用户在其上的搜索框中输入的第二用户搜索信息。上述第二用户搜索信息可以为用户在搜索过程中在搜索框中输入的信息。
在这里,第二用户搜索信息包括:知识图谱中知识图谱既定信息和第二需求信息。上述知识图谱中知识图谱既定信息可以为知识图谱中已存储的信息(可以参照图2中对知识图谱既定信息的限定)。上述第二需求信息可以用于表征用户的其他检索需求。
步骤302,根据知识图谱既定信息,从知识图谱中检索知识图谱既定信息对应的标签结果,以及将第二需求信息输入预先训练的序列标注模型中,得到第二需求信息对应的标签结果。
在本实施例中,上述执行主体可以将知识图谱既定信息作为知识图谱的索引,从知识图谱中检索得到知识图谱既定信息对应的标签结果;以及,将第二需求信息输入序列标注模型中,得到第二需求信息对应的标签结果。上述预先训练的序列标注模型可以为通过图2实施例得到的序列标注模型。
需要说明的是,利用知识图谱和序列标注模型得到标签结果的步骤,可以并行执行,也可以先执行利用知识图谱得到标签结果的步骤,再执行利用序列标注模型得到标签结果的步骤;对于先执行利用知识图谱得到标签结果的步骤,可以先通过知识图谱对第二用户搜索信息中的大部分信息设置标签结果,以避免再由序列标注模型对知识图谱中已设置标签结果的部分再次设置标签结果,进而提高了设置标签结果的执行效率。
在一个具体的示例中,以“影视领域”为例,假设第二搜索信息=“A”电视剧在线看。首先基于知识图谱,确定“实体提及”为“A”,再基于序列标注模型,确定“第二需求信息”为“在线看”。
在本实施例中,利用知识图谱和序列标注模型,可以精准的对第二用户搜索信息中的每一个成分设置标签,从而达到准确识别用户意图和需求的目的。
步骤303,根据知识图谱既定信息对应的标签结果和第二需求信息对应的标签结果,得到第二搜索信息对应的搜索结果,并展示搜索结果。
在本实施例中,上述执行主体可以基于知识图谱既定信息对应的标签结果和第二需求信息对应的标签结果,召回与该第二用户搜索信息对应的搜索结果;然后,在终端设备(例如图1所示的终端设备101、102、103)的界面上展示搜索结果。上述搜索结果可以为根据第二用户搜索信息召回的检索结果。
在这里,展示搜索结果可以包括:全部显示、显示部分(例如,显示排序前50)、折叠显示(按照类型折叠显示,每个折叠部分显示排序最高,其他则折叠显示)。其中,部分显示可以为显示排在前10的搜索结果;折叠显示可以为将相同类型的搜索结果折叠在一起,例如图片类搜索结果为一类,文本类搜索结果为一类。
本申请实施例提供的确定搜索结果的方法,通过序列标注模型可自动挖掘用户其他需求信息(即第二需求信息),然后将挖掘的第二需求信息更新至搜索系统,以辅助知识图谱进行知识标注,从而达到充分识别用户的意图和需求的目的。
在本实施例的一些可选的实现方式中,根据知识图谱既定信息,从知识图谱中检索知识图谱既定信息对应的标签结果,以及将第二需求信息输入序列标注模型中,得到第二需求信息对应的标签结果,包括:
在本实现方式中,上述执行主体可以先利用知识图谱对第二用户搜索信息执行实体标注阶段和泛需求标注阶段;之后,在泛需求标注阶段失败时,执行问答标注阶段。
在一个示例中,得到第二需求信息对应的标签结果,包括:
第一步,先执行实体标注阶段,在执行实体标注阶段过程中,利用知识图谱对第二需求信息中的实体既定信息进行标注;之后,利用序列标注模型对第二需求信息中的实体需求限定信息进行标注。
第二步,判断第二搜索信息中是否存在未被标注的部分,如果存在未被标注的部分,则执行问答标注阶段,在执行问答标注阶段过程中,先利用知识图谱对第二需求信息中的问答既定信息进行标注;之后,利用序列标注模型对第二需求信息中的问答需求限定信息进行标注。
第三步,在执行实体标注阶段,并行执行泛需求标注阶段,在执行泛需求标注阶段,利用知识图谱对第二需求信息中的泛需求既定信息进行标注;之后,利用序列标注模型对第二需求信息中的泛需求限定信息进行标注。
在本实施例的一些可选的实现方式中,根据知识图谱既定信息,从知识图谱中检索知识图谱既定信息对应的标签结果,以及将第二需求信息输入序列标注模型中,得到第二需求信息对应的标签结果,包括:
在本实现方式中,上述执行主体可以先利用知识图谱对第二用户搜索信息执行实体标注阶段;如果实体标注阶段标注失败(即,第二搜索信息中不存在实体既定信息),执行泛需求标注阶段;如果实体标注阶段成功,执行问答标注阶段。
在一个示例中,得到第二需求信息对应的标签结果,包括:
第一步,先执行实体标注阶段,在执行实体标注阶段过程中,利用知识图谱对第二需求信息中的实体既定信息进行标注;判断实体标注阶段是否成功,如果实体标注阶段成功,利用序列标注模型对第二需求信息中的实体需求限定信息进行标注;日光实体标注阶段成功,则执行泛需求标注阶段。
第二步,判断第二搜索信息中是否存在未被标注的部分,如果存在未被标注的部分,则执行问答标注阶段,在执行问答标注阶段过程中,先利用知识图谱对第二需求信息中的问答既定信息进行标注;之后,利用序列标注模型对第二需求信息中的问答需求限定信息进行标注。
在本实现方式中,可以先对第二搜索信息执行实体标注阶段,在执行实体标注阶段成功,在执行问答标注阶段;如果实体标注阶段执行失败,则再执行泛需求执行阶段,从而可以快速地确定第二搜索信息的类型,以便后续可以得到与第二搜索信息的类型对应的搜索结果。
在在本实施例的一些可选的实现方式中,根据知识图谱既定信息对应的标签结果和第二需求信息对应的标签结果,得到第二搜索信息对应的搜索结果,包括:根据知识图谱既定信息对应的标签结果和第二需求信息对应的标签结果,确定第二搜索信息的类型;根据知识图谱既定信息对应的标签结果、第二需求信息对应的标签结果,以及第二搜索信息的类型,确定第二搜索信息的类型对应的搜索结果。
在本实现方式中,上述执行主体可以先根据知识图谱既定信息对应的标签结果和第二需求信息对应的标签结果,确定第二搜索信息类型之后,根据知识图谱既定信息对应的标签结果、第二需求信息对应的标签结果,以及第二搜索信息的类型,确定第二搜索信息的类型对应的搜索结果。
在本实现方式中,可以基于由知识图谱既定信息对应的标签结果和第二需求信息对应的标签结果所确定的第二搜索信息的类型,以及知识图谱既定信息对应的标签结果和第二需求信息对应的标签结果,以实现对第二搜索信息的类型对应的搜索结果的准确确定。
在本实施例的一些可选的实现方式中,根据知识图谱既定信息对应的标签结果和第二需求信息对应的标签结果,确定第二搜索信息的类型,包括:利用知识图谱对知识图谱既定信息设置实体知识标签,得到实体知识标签结果,以及利用序列标注模型对第二需求信息设置实体需求标签,得到实体需求标签结果;与利用知识图谱对知识图谱既定信息设置实体知识标签的步骤并行执行,利用知识图谱对知识图谱既定信息设置泛需求知识标签,得到泛需求知识标签结果,以及利用序列标注模型对第二需求信息设置泛需求需求标签,得到泛需求需求标签结果;响应于知识图谱既定信息和/或第二需求信息还包括未被识别的信息,利用知识图谱对未被识别的信息设置问答知识标签,得到问答知识标签结果,以及利用序列标注模型对未被识别的信息设置问答需求标签;根据实体知识标签结果、实体需求标签结果、泛需求知识标签结果、泛需求需求标签结果、问答知识标签结果、问答需求标签结果,得到第二搜索信息的标签结果;根据第二搜索信息的标签结果,确定第二搜索信息的类型。
需要说明的是,问答阶段复用实体阶段的内容可以为:在实体阶段对“A”设置标签之后,在问答阶段(前提是问答既定信息和/或问答需求限定信息包括“A”),则不需要再对“A”设置标签,直接复用实体阶段对“A”设置的结果即可。
在本实现方式中,将实体、问答进行串联;以及将实体中的知识标注阶段与泛需求进行并行,从而实现将实体、问答、泛需求整个在一个服务中。
在本实现方式中,将实体搜索信息、泛需求搜索信息、问答信息整合到一个在线服务中,极大地节省了非常大的机器资源,且实体搜索信息、泛需求搜索信息和问答信息之间复用逻辑是非常多,采用复用技术降低代码冗余,从而节省了通信所消耗的网络带宽。另外,在实体搜索信息、泛需求搜索信息、问答信息整合到一个在线服务之后,在领域迁移的时候,降低迁移成本。
在本实施例的一些可选的实现方式中,该确定搜索结果的方法还包括:定位知识图谱既定信息中的目标实体;确定目标实体的实体候选集;从实体候选集中确定最终实体。
在本实现方式中,在第二搜索信息的类型为实体搜索信息时,该确定搜索结果的方法还包括:定位实体既定信息中的目标实体;之后,确定目标实体的实体候选集;之后,从实体候选集中确定最终实体;之后,根据最终实体对应的标签、第二需求信息对应的标签,确定实体搜索信息对应的实体搜索结果。上述最终实体可以用于向用户基于该最终实体推荐搜索结果。
在这里,根据知识图谱既定信息对应的标签结果、第二需求信息对应的标签结果,以及第二搜索信息的类型,确定第二搜索信息的类型对应的搜索结果,包括:根据最终实体对应的标签结果、第二需求信息对应的标签结果,以及第二搜索信息的类型,确定第二搜索信息的类型对应的搜索结果。
需要说明的是,在知识图谱既定信息还包括:最终实体的本质属性信息时,根据知识图谱既定信息对应的标签结果、第二需求信息对应的标签结果,以及第二搜索信息的类型,确定第二搜索信息的类型对应的搜索结果,包括:根据最终实体对应的标签结果、根据最终实体的本质属性信息对应的标签结果、第二需求信息对应的标签结果,以及第二搜索信息的类型,确定第二搜索信息的类型对应的搜索结果。
在一个实例中,定位知识图谱既定信息中的目标实体,可以包括:基于文本识别的方式确定目标实体,或执行实体标注阶段确定目标实体。上述目标实体可以为第二搜索信息包括的目标实体。例如,对于实体“AAA大学”来说,其目标实体为“AAA大学”,其实体提及可以包括“AAA大学”、“AAA”等等,由“AAA大学”、“AAA”等组成的集合为实体候选集。
在一个实例中,确定目标实体的实体候选集可以包括:先根据目标实体,确定目标实体提及;然后基于目标实体提及,构建实体候选集。
在本实现方式中,将实体搜索信息、泛需求搜索信息、问答信息整合到一个在线服务中,极大地节省了非常大的机器资源,且实体搜索信息、泛需求搜索信息和问答信息之间复用逻辑是非常多,采用复用技术降低代码冗余,从而节省了通信所消耗的网络带宽。另外,在实体搜索信息、泛需求搜索信息、问答信息整合到一个在线服务之后,在领域迁移的时候,降低迁移成本。
在本实施例的一些可选的实现方式中,从实体候选集中确定最终实体,包括:
根据以下至少一项,从实体候选集中确定最终实体:实体候选集中每个实体的热度特征、实体候选集中每个实体的时间特征、实体候选集中每个实体与所述目标实体的相似度。
在本实现方式中,上述执行主体可以根据每个实体的热度特征、每个实体的时间特征,以及每个实体与目标实体的相似度中的任一项,从实体候选集中确定最终实体。
在这里,每个实体的热度特征可以为用户对当前实体对应的搜索结果的操作多,以“影视领域”为例,对于“CCC影视第一季”用户搜索量最高、评论量最高等,那么“CCC影视第一季”的权重高。每个实体的时间特征可以为每个实体面向用户的时间,“CCC影视第一季”上映的时间早于“CCC影视第二季”,那么“CCC影视第二季”的权重可以高于“CCC影视第一季”的权重。每个实体与目标实体的相似度可以为每个实体与目标实体的文本相似度,例如,目标实体为“CCC电视剧”,实体候选集中的实体可以为“CCC电视剧第一季”和“CCC电影”,由于“CCC电视剧第一季”与“CCC电视剧”的相似度大于“CCC电影”与“CCC电视剧”的相似度,那么“CCC电视剧第一季”的权重大于“CCC电影”的权重。
在实现方式中,可以基于实体候选集中每个实体的热度特征、实体候选集中每个实体的时间特征、实体候选集中每个实体与所述目标实体的相似度中的任一项,准确地从实体候选集中确定最终实体。
在本实施例的一些可选的实现方式中,该确定搜索结果的方法还包括:根据每个实体的热度特征与对应的第一权重、每个实体的时间特征与对应的权重,以及每个实体与目标实体的相似度对应的权重进行加权求和,得到求和结果;根据求和结果,从实体候选集中确定最终实体。
在本实现方式中,上述第一权重可以基于实体的热度特征进行确定。第二权重可以基于时间特征进行确定、第三权重可以基于相似度进行确定。
需要说明的是,可以根据用户的需求设置热度特征、时间特征和相似度对应的权重范围。例如,以“影视领域”为例,用户是一个很喜欢追剧的人,那么则可以时间特征对应的权重范围设置的高于热度特征对应的权重范围和相似度对应的权重范围。
在本实现方式中,可以基于每个实体的热度特征、每个实体的时间特征,以及每个实体与目标实体的相似度进行加权求和,从实体候选集中确定最终实体。
在本实施例的一些可选的实现方式中,其中,根据实体知识标签结果、实体需求标签结果、泛需求知识标签结果、泛需求需求标签结果、问答知识标签结果、问答需求标签结果,确定第二搜索信息的类型,包括:响应于泛需求知识标签结果、泛需求需求标签结果、问答知识标签结果、问答需求标签结果为错误的标签结果,根据实体知识标签结果和实体需求标签结果,确定第二搜索信息的类型为实体搜索信息;响应于泛需求知识标签结果、泛需求需求标签结果为错误的标签结果,根据实体知识标签结果、实体需求标签结果、问答知识标签结果和问答需求标签结果,确定第二搜索信息的类型为问答信息;响应于实体知识标签结果、实体需求标签结果、问答知识标签结果、问答需求标签结果,根据泛需求知识标签结果和泛需求需求标签结果,确定第二搜索信息的类型为泛需求搜索信息。
在本实现方式中,在泛需求知识标签结果、泛需求需求标签结果、问答知识标签结果、问答需求标签结果为错误的标签结果时,则确定第二搜索信息的类型为实体搜索信息。在泛需求知识标签结果、泛需求需求标签结果为错误的标签结果时,则确定第二搜索信息的类型为问答信息。在实体知识标签结果、实体需求标签结果、问答知识标签结果、问答需求标签结果时,则确定第二搜索信息的类型为泛需求搜索信息。
需要说明的是,在问答阶段的复用可以包括对实体知识标注结果、实体需要标注结果的复用。
在本实现方式中,可以基于第二搜索信息的类型,得到与该类型对应的搜索结果,包括:在第二用户搜索信息的类型为实体搜索信息时,第二搜索信息的类型对应的搜索结果为实体搜索结果。在第二用户搜索信息的类型为问答信息时,第二搜索信息的类型对应的搜索结果为问答结果。在第二用户搜索信息的类型为泛需求搜索信息时,第二搜索信息的类型对应的搜索结果为泛需求搜索结果。
在本实现方式中,可以基于不同的标签结果,以确定第二搜索信息的类型。
在本实施例的一些可选的实现方式中,根据知识图谱既定信息对应的标签和第二需求信息对应的标签,得到第二搜索信息对应的搜索结果,包括:将知识图谱既定信息对应的标签和第二需求信息对应的标签,转化为图检索语句;根据图检索语句,得到图检索语句对应的搜索结果。
在一个具体的示例中,将知识标注结果,转化为图检索语句(gremlin)。
在本实现方式中,将知识图谱既定信息对应的标签和第二需求信息对应的标签->图检索语句的方法,作为搜索系统的输出。
在本实现方式中,直接利用图检索语句,从知识图谱中进行检索,获取了满足用户需求的答案,并返回给用户。
在本实施例的一些可选的实现方式中,若第二需求信息包括多个需求信息,该生成序列标注模型的方法还包括:
确定多个需求信息的频次;根据频次最高的需求信息,得到与频次最高的需求信息对应的搜索结果。
在本实现方式中,可以基于频次高的需求信息,优先向用户推荐当前最符合时效性的搜索结果。
为了便于理解,下面提供可以实现本申请实施例的确定搜索结果的方法的应用场景。如图4所示,服务器401(例如图1所示的服务器105)获取用户在终端设备402上的搜索框403中输入的第二搜索信息,该第二搜索信息包括第二需求信息和知识图谱中知识图谱既定信息;之后根据知识图谱既定信息从知识图谱中获取知识图谱既定信息对应的标签结果,以将第二需求信息输入序列标注模型中得到第二需求信息对应的标签结果;之后,根据第二需求信息对应的标签结果和知识图谱既定信息对应的标签结果,得到第二搜索信息对应的搜索结果404,其中,搜索结果可以为图片和/或文字的形式呈现。
进一步参考图5,本发明提出的搜索系统500,可以包括:
注释(Query Annotation)模块501,该注释模块501用于给第二用户搜索信息设置标签,设置标签的步骤可以包括:
知识标注(Knowledge Tagging)阶段和需求标注(Demand Tagging)阶段;其中,知识标注阶段可以为利用知识图谱对知识图谱既定信息进行标注的节点。需求标注阶段可以为利用序列标注模型对第二需求信息进行标注的阶段。
需要说明的是,在上述实施例中以对具体对第二搜索信息进行标注的过程进行了详细描述,在此不再赘述。
在一个具体的示例中,以“影视领域”为例,首先知识图谱,确定目标实体提及,包括名称/别名/纠错,例如“CCC影视”,“CC影视”为别名(或错误的名称);实体spo数据,如predicate=演员,object=“A演员”、“B演员”等;实体tag(标签)数据,如古装、权谋等。其中,SPO数据中包括S、P、O三元组信息,分别存储了实体名称,以及与实体名称对应的属性名和属性值;可以根据知识图谱的SPO数据,获取所述实体名称对应的属性名和属性值。实体名称为“A演员”,则获取对应的属性名和属性值,例如生日为X年Y月Z日;代表影视作品为“S1影视”、“B1影视”等。
然后基于本发明提出的半自动ERNIE+BiLSTM+CRF模型,人工标注第二需求信息作为序列标注模型的训练样本,然后不断半自动迭代序列标注模型,挖掘新的第二需求信息。
基于以上知识图谱和序列标注模型,可以针对第二搜索信息做知识标注阶段和需求标注阶段。
该注释(Query Annotation)模块501的工作过程如下:
目标实体定位,构建所有实体的实体候选集;之后,针对实体标注阶段、问答标注阶段进行串联标注,将实体候选集中每个实体对应的搜索信息的标签对第二搜索信息进行一次标注;之后,执行实体知识标注;之后,执行实体需求标注;此时若第二搜索信息中还包含unknown的未解释成分,则继续做问答标注,否则退出;之后,执行问答知识标注;之后,执行问答需求标注;执行,与实体知识标注并行执行泛需求知识标注;之后,执行泛需求需求标注阶段。
该注释(Query Annotation)模块501还可以用于统一检查,相关检查策略。
该注释(Query Annotation)模块501还可以用于统一选择,相关选择策略。
需要说明的是,实体标注、问答做标注的时候计算逻辑复用率高,节省了网络资源,加快了搜索速度。
需要说明的是,执行实体、问答标注时,涉及到多个线程,以及执行泛需求标注也是涉及到多线性,在本实例中,则采用实体标注、问答标注串联执行,泛需求标注与实体标注并行执行。
在一个具体的示例中,以“影视领域”为例,假设第二搜索信息=“A播放平台”2015“B演员版”“CCC影视”“D角色”是谁饰演的。
首先,定位第二搜索信息中的实体“CCC影视”;之后,生成“CCC影视”的实体候选集,例如“CCC影视”的实体候选集为“CCC影视第一季”、“CCC影视第二季”和“CCC电视剧”。对第二搜索信息执行标注阶段,具体包括:
在泛需求标注阶段,所有实体候选集中每个实体对应的搜索信息都包含unknown未知元素,所以泛需求标注阶段全部失败。
在执行泛需求标注阶段的同时,并行执行实体标注阶段,标注如下:
执行实体知识标注,在实体知识标注过程中,实体知识标注的过程如下:
“CCC影视第一季”:“A播放平台”2015[年份]“B演员版”[演员]“CCC影视”[提及(mention)]“D角色”[角色]是谁饰演的;
“CCC影视第二季”:“A播放平台”2015“B演员版”“CCC影视”[mention]“D角色”是谁饰演的;
“CCC电视剧”:“A播放平台”2015“B演员版”“CCC电视剧”[mention]“D角色”是谁饰演的。
之后,执行实体需求标注,在实体需求标注过程中,实体需求标注的过程如下:
“CCC影视第一季”:“A播放平台”2015[年份]“B演员版”[演员]“CCC影视”[提及(mention)]“D角色”[角色]是谁饰演的;
“CCC影视第二季”:“A播放平台”2015“B演员版”“CCC电视剧”[mention]“D角色”是谁饰演的;
“CCC电视剧”:“A播放平台”2015“B演员版”“CCC电视剧”[mention]“D角色”是谁饰演的。
由于执行实体标注阶段,第二搜索信息中存在未被识别的信息,则执行问答标注阶段。
执行问答知识标注,在执行问答知识标注过程中,问答知识标注的过程如下:
“CCC影视第一季”:“A播放平台”2015[年份]“B演员版”[演员]“CCC影视”[提及(mention)]“D角色”[角色]是谁饰演的[问答表述词];
“CCC影视第二季”:“A播放平台”2015“B演员版”“CCC影视”[mention]“D角色”是谁饰演的[问答表述词];
“CCC电视剧”:“A播放平台”2015“B演员版”“CCC电视剧”[mention]“D角色”是谁饰演的[问答表述词];
之后,执行问答需求标注,问答需求标注的阶段与问答知识标注阶段的过程类似,在此不在赘述。
另外,“CCC影视第一季”,得分最高,因为第二搜索信息中字符串标注成分最为完备,所以得分最高。
需要说明的是,在从实体候选集中确定最终实体时,还可以基于标注的完备性来选择。当前,完备性对应的权重范围也是可以基于用户的搜索行为进行确定,具体描述可以参见上述实施例中的描述,在此不再赘述。
搜索分类(Query Classification)模块502,用于在确定第二搜索信息对应的标签(即知识图谱既定信息对应的标签和第二需求信息对应的标签),对第二搜索信息的类型进行分类,判定到底是实体搜索信息,还是泛需求搜索信息,还是问答信息。
先剔除包含unknown未知成分的实体候选集中的所有candidate,让candidate对第二搜索信息设置标签之后,第二搜索信息的所有成分被识别。
需要说明的是:仅仅包括修饰实体mention词的是实体搜索信息;泛需求限定词和泛需求既定信息组成的合集是泛需求搜索信息;包含问答需求限定词和问答既定信息的是问答信息。
搜索生成模块(Query Interpretation)503,可以用于从搜索结果中选择与下游应用相关的有用信息,例如,结构化(structure)信息;搜索生成模块(QueryInterpretation)503,还可以用于生成图检索语句。
在一个具体的示例中,以“影视领域”为例,如泛需求搜索信息为9分以上的“X导演”电影在线看,那么图检索语句可直接遍历生成如下语句:
score.gt(9)and(starring.equal(“X导演”)or director.equal(“X导演”))andcategory.equal(电影)and watch.eq(1);之后,基于图检索语句,得到搜索结果。
本发明提出的搜索系统是在线计算服务,且将耗时部分设计为多线程计算,极大的提升了计算性能。可以达到内存极大的减小,且无论多复杂的第二搜索信息,在线计算分析后,都能进行充分理解的目的。
进一步参考图6,作为对上述各图所示方法的实现,本申请提供了一种生成序列标注模型的装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图6所示,本实施例的生成序列标注模型的装置600可以包括:第一获取模块601,被配置成获取第一搜索信息和对应的第一标签;第二获取模块602,被配置成根据第一搜索信息,从预设的知识图谱中获取第一搜索信息对应的第二标签;信息确定模块603,被配置成响应于第二标签与第一标签不一致,确定第一搜索信息中的第一需求信息不为知识图谱中的信息;模型训练模块604,被配置成基于第一需求信息和第一需求信息对应的标签进行训练,得到训练后的序列标注模型。
在本实施例中,图像处理装置600中:第一获取模块601、第二获取模块602、信息确定模块603和模型训练模块604的具体处理及其所带来的技术效果可分别参考图2对应实施例中的步骤201-204的相关说明,在此不再赘述。其中,第一获取模块601和第二获取模块602可以为相同的模块,也可以为不同的模块。
在本实施例的一些可选的实现方式中,第一需求信息包括以下至少一项:实体需求限定信息、问答需求限定信息、泛需求限定信息。
在本实施例的一些可选的实现方式中,第一搜索信息还包括:知识图谱既定信息,其中,知识图谱既定信息为知识图谱中的信息。
在本实施例的一些可选的实现方式中,知识图谱既定信息包括以下至少一项:实体既定信息、问答既定信息、泛需求既定信息。
在本实施例的一些可选的实现方式中,实体既定信息包括:实体提及和/或实体的本质属性信息。
在本实施例的一些可选的实现方式中,序列标注模型,包括:ERNIE层、双向长短期记忆网络层和条件随机场层。
在本实施例的一些可选的实现方式中,第二标签与第一标签不一致,包括:第二标签为错误的标签,第一标签为正确的标签;或,第二标签为无法识别对应的标签。
进一步参考图7,作为对上述各图所示方法的实现,本申请提供了一种确定搜索结果的装置的一个实施例,该装置实施例与图3所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图7所示,本实施例的确定搜索结果的装置700可以包括:信息获取模块701,被配置成获取第二搜索信息,其中,第二搜索信息包括第二需求信息和预设的知识图谱中的知识图谱既定信息;标签得到模块702,被配置成根据知识图谱既定信息,从知识图谱中获取知识图谱既定信息对应的标签结果,以及将第二需求信息输入序列标注模型中,得到第二需求信息对应的标签结果;结果得到模块703,被配置成根据知识图谱既定信息对应的标签结果和第二需求信息对应的标签结果,得到第二搜索信息对应的搜索结果,并展示搜索结果。
在本实施例中,图像处理装置700中:信息获取模块701、标签得到模块702和结果得到模块703的具体处理及其所带来的技术效果可分别参考图3对应实施例中的步骤301-303的相关说明,在此不再赘述。
在本实施例的一些可选的实现方式中,结果得到模块703,包括:类型确定单元,被配置成根据知识图谱既定信息对应的标签结果和第二需求信息对应的标签结果,确定第二搜索信息的类型;结果确定单元,被配置成根据知识图谱既定信息对应的标签结果、第二需求信息对应的标签结果,以及第二搜索信息的类型,确定第二搜索信息的类型对应的搜索结果。
在本实施例的一些可选的实现方式中,类型确定单元,进一步配置成:利用知识图谱对知识图谱既定信息设置实体知识标签,得到实体知识标签结果,以及利用序列标注模型对第二需求信息设置实体需求标签,得到实体需求标签结果;与利用知识图谱对知识图谱既定信息设置实体知识标签的步骤并行执行,利用知识图谱对知识图谱既定信息设置泛需求知识标签,得到泛需求知识标签结果,以及利用序列标注模型对第二需求信息设置泛需求需求标签,得到泛需求需求标签结果;响应于知识图谱既定信息和/或第二需求信息还包括未被识别的信息,利用知识图谱对未被识别的信息设置问答知识标签,得到问答知识标签结果,以及利用序列标注模型对未被识别的信息设置问答需求标签;根据实体知识标签结果、实体需求标签结果、泛需求知识标签结果、泛需求需求标签结果、问答知识标签结果、问答需求标签结果,确定第二搜索信息的类型。
在本实施例的一些可选的实现方式中,该确定搜索结果的装置还包括:实体定位模块,被配置成定位第二搜索信息中的目标实体;实体集确定模块,被配置成确定目标实体的实体候选集;实体选择模块,被配置成从实体候选集中确定最终实体;结果确定单元,进一步配置成:根据最终实体对应的标签结果,第二需求信息对应的标签结果,以及第二搜索信息的类型,确定第二搜索信息的类型对应的搜索结果。
在本实施例的一些可选的实现方式中,从实体候选集中确定最终实体,包括:根据以下至少一项,从实体候选集中确定最终实体:实体候选集中每个实体的热度特征、实体候选集中每个实体的时间特征、实体候选集中每个实体与目标实体的相似度。
在本实施例的一些可选的实现方式中,类型确定单元,进一步被配置成:响应于泛需求知识标签结果、泛需求需求标签结果、问答知识标签结果、问答需求标签结果为错误的标签结果,根据实体知识标签结果和实体需求标签结果,确定第二搜索信息的类型为实体搜索信息;响应于泛需求知识标签结果、泛需求需求标签结果为错误的标签结果,根据实体知识标签结果、实体需求标签结果、问答知识标签结果和问答需求标签结果,确定第二搜索信息的类型为问答信息;响应于实体知识标签结果、实体需求标签结果、问答知识标签结果、问答需求标签结果,根据泛需求知识标签结果和泛需求需求标签结果,确定第二搜索信息的类型为泛需求搜索信息。
在本实施例的一些可选的实现方式中,根据知识图谱既定信息对应的标签结果和第二需求信息对应的标签结果,得到第二搜索信息对应的搜索结果,包括:将知识图谱既定信息对应的标签结果和第二需求信息对应的标签结果,转化为图检索语句;根据图检索语句,得到图检索语句对应的搜索结果。
根据本申请的实施例,本申请还提供了一种搜索系统,该搜索信息包括:确定搜索结果的装置。
在本实施例的一些可选的实现方式中,该搜索系统还包括:生成序列标注模型的装置。
根据本申请的实施例,本申请还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
图8示出了可以用来实施本申请的实施例的示例电子设备800的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。
如图8所示,设备800包括计算单元801,其可以根据存储在只读存储器(ROM)802中的计算机程序或者从存储单元805加载到随机访问存储器(RAM)803中的计算机程序,来执行各种适当的动作和处理。在RAM 803中,还可存储设备800操作所需的各种程序和数据。计算单元801、ROM 802以及RAM 803通过总线804彼此相连。输入/输出(I/O)接口808也连接至总线804。
设备800中的多个部件连接至I/O接口808,包括:输入单元806,例如键盘、鼠标等;输出单元807,例如各种类型的显示器、扬声器等;存储单元805,例如磁盘、光盘等;以及通信单元809,例如网卡、调制解调器、无线通信收发机等。通信单元809允许设备800通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元801可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元801的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元801执行上文所描述的各个方法和处理,例如生成序列标注模型的方法或确定搜索结果的方法。例如,在一些实施例中,生成序列标注模型的方法或确定搜索结果的方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元805。在一些实施例中,计算机程序的部分或者全部可以经由ROM802和/或通信单元809而被载入和/或安装到设备800上。当计算机程序加载到RAM 803并由计算单元801执行时,可以执行上文描述的生成序列标注模型的方法或确定搜索结果的方法的一个或多个步骤。备选地,在其他实施例中,计算单元801可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行生成序列标注模型的方法或确定搜索结果的方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本申请的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本申请的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。
人工智能是研究计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科,既有硬件层面的技术也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术;人工智能软件技术主要包括计算机视觉技术、语音识别技术、自然语音处理技术以及机器学习/深度学习、大数据处理技术、知识图谱技术等几大方向。
本申请实施例提供的生成序列标注模型的方法、设备、介质及程序产品,首先获取第一搜索信息和对应的第一标签;然后,根据第一搜索信息,从预设的知识图谱中获取第一搜索信息对应的第二标签;然后在第二标签与第一标签不一致时,确定第一搜索信息中的第一需求信息不为知识图谱中的信息;最后基于第一需求信息和第一需求信息对应的标签进行训练,得到训练后的序列标注模型,可以基于第一搜索信息中变化的部分(即第一需求信息)训练序列标注模型,以辅助知识图谱,实现对第一搜索信息准确的识别,从而到达准确识别用户意图和需求的目的。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。

Claims (33)

1.一种生成序列标注模型的方法,包括:
获取第一搜索信息和对应的第一标签,其中,所述第一标签为人工标注的标签;
根据所述第一搜索信息,从预设的知识图谱中获取第一搜索信息对应的第二标签;
响应于所述第二标签与所述第一标签不一致,确定所述第一搜索信息中的第一需求信息不为所述知识图谱中的信息;
基于所述第一需求信息和所述第一需求信息对应的标签进行训练,得到训练后的序列标注模型;以及在所述知识图谱中基于目标需求信息查找到的标签与所述目标需求信息对应的人工标注标签不一致时,根据所述目标需求信息和其对应的人工标注的标签优化训练所述序列标注模型。
2.根据权利要求1所述的方法,其中,所述第一需求信息包括以下至少一项:实体需求限定信息、问答需求限定信息、泛需求限定信息。
3.根据权利要求1或2所述的方法,其中,所述第一搜索信息还包括:知识图谱既定信息,其中,所述知识图谱既定信息为所述知识图谱中的信息。
4.根据权利要求3所述的方法,其中,所述知识图谱既定信息包括以下至少一项:实体既定信息、问答既定信息、泛需求既定信息。
5.根据权利要求4所述的方法,其中,所述实体既定信息包括:实体提及和/或实体的本质属性信息。
6.根据权利要求5所述的方法,其中,所述序列标注模型,包括:ERNIE层、双向长短期记忆网络层和条件随机场层。
7.根据权利要求1或2所述的方法,其中,所述第二标签与所述第一标签不一致,包括:
所述第二标签为错误的标签;或,所述第二标签为无法识别对应的标签。
8.一种确定搜索结果的方法,包括:
获取第二搜索信息,其中,所述第二搜索信息包括第二需求信息和预设的知识图谱中的知识图谱既定信息;
根据所述知识图谱既定信息,从所述知识图谱中获取所述知识图谱既定信息对应的标签结果,以及将所述第二需求信息输入如权利要求1-7任一项所述的方法生成的序列标注模型中,得到所述第二需求信息对应的标签结果;
根据所述知识图谱既定信息对应的标签结果和所述第二需求信息对应的标签结果,得到所述第二搜索信息对应的搜索结果,并展示所述搜索结果。
9.根据权利要求8所述的方法,其中,所述根据所述知识图谱既定信息对应的标签结果和所述第二需求信息对应的标签结果,得到所述第二搜索信息对应的搜索结果,包括:
根据所述知识图谱既定信息对应的标签结果和所述第二需求信息对应的标签结果,确定所述第二搜索信息的类型;
根据所述知识图谱既定信息对应的标签结果、所述第二需求信息对应的标签结果,以及所述第二搜索信息的类型,确定所述第二搜索信息的类型对应的搜索结果。
10.根据权利要求9所述的方法,其中,所述根据所述知识图谱既定信息对应的标签结果和所述第二需求信息对应的标签结果,确定所述第二搜索信息的类型,包括:
利用所述知识图谱对所述知识图谱既定信息设置实体知识标签,得到实体知识标签结果,以及利用所述序列标注模型对所述第二需求信息设置实体需求标签,得到实体需求标签结果;
与利用所述知识图谱对所述知识图谱既定信息设置实体知识标签的步骤并行执行,利用所述知识图谱对所述知识图谱既定信息设置泛需求知识标签,得到泛需求知识标签结果,以及利用所述序列标注模型对所述第二需求信息设置泛需求需求标签,得到泛需求需求标签结果;
响应于所述知识图谱既定信息和/或第二需求信息还包括未被识别的信息,利用所述知识图谱对所述未被识别的信息设置问答知识标签,得到问答知识标签结果,以及利用所述序列标注模型对所述未被识别的信息设置问答需求标签;
根据所述实体知识标签结果、实体需求标签结果、泛需求知识标签结果、泛需求需求标签结果、问答知识标签结果、问答需求标签结果,确定所述第二搜索信息的类型。
11.根据权利要求9或10所述的方法,所述方法还包括:
定位所述知识图谱既定信息中的目标实体;
确定所述目标实体的实体候选集;
从所述实体候选集中确定最终实体;
所述根据所述知识图谱既定信息对应的标签结果、所述第二需求信息对应的标签结果,以及所述第二搜索信息的类型,确定所述第二搜索信息的类型对应的搜索结果,包括:
根据所述最终实体对应的标签结果、所述第二需求信息对应的标签结果,以及所述第二搜索信息的类型,确定所述第二搜索信息的类型对应的搜索结果。
12.根据权利要求11所述的方法,其中,所述从所述实体候选集中确定最终实体,包括:
根据以下至少一项,从所述实体候选集中确定最终实体:
实体候选集中每个实体的热度特征、实体候选集中每个实体的时间特征、实体候选集中每个实体与所述目标实体的相似度。
13.根据权利要求10所述的方法,其中,所述根据所述实体知识标签结果、实体需求标签结果、泛需求知识标签结果、泛需求需求标签结果、问答知识标签结果、问答需求标签结果,确定所述第二搜索信息的类型,包括:
响应于所述泛需求知识标签结果、泛需求需求标签结果、问答知识标签结果、问答需求标签结果为错误的标签结果,根据所述实体知识标签结果和实体需求标签结果,确定所述第二搜索信息的类型为实体搜索信息;
响应于所述泛需求知识标签结果、泛需求需求标签结果为错误的标签结果,根据所述实体知识标签结果、实体需求标签结果、问答知识标签结果和问答需求标签结果,确定所述第二搜索信息的类型为问答信息;
响应于所述实体知识标签结果、实体需求标签结果、问答知识标签结果、问答需求标签结果,根据所述泛需求知识标签结果和泛需求需求标签结果,确定所述第二搜索信息的类型为泛需求搜索信息。
14.根据权利要求8所述的方法,其中,所述根据所述知识图谱既定信息对应的标签和所述第二需求信息对应的标签,得到所述第二搜索信息对应的搜索结果,包括:
将所述知识图谱既定信息对应的标签结果和所述第二需求信息对应的标签结果,转化为图检索语句;
根据所述图检索语句,得到所述图检索语句对应的搜索结果。
15.一种生成序列标注模型的装置,包括:
第一获取模块,被配置成获取第一搜索信息和对应的第一标签,其中,所述第一标签为人工标注的标签;
第二获取模块,被配置成根据所述第一搜索信息,从预设的知识图谱中获取第一搜索信息对应的第二标签;
信息确定模块,被配置成响应于所述第二标签与所述第一标签不一致,确定所述第一搜索信息中的第一需求信息不为所述知识图谱中的信息;
模型训练模块,被配置成基于所述第一需求信息和所述第一需求信息对应的标签进行训练,得到训练后的序列标注模型;以及在所述知识图谱中基于目标需求信息查找到的标签与所述目标需求信息对应的人工标注标签不一致时,根据所述目标需求信息和其对应的人工标注的标签优化训练所述序列标注模型。
16.根据权利要求15所述的装置,其中,所述第一需求信息包括以下至少一项:实体需求限定信息、问答需求限定信息、泛需求限定信息。
17.根据权利要求15或16所述的装置,其中,所述第一搜索信息还包括:知识图谱既定信息,其中,所述知识图谱既定信息为所述知识图谱中的信息。
18.根据权利要求17所述的装置,其中,所述知识图谱既定信息包括以下至少一项:实体既定信息、问答既定信息、泛需求既定信息。
19.根据权利要求18所述的装置,其中,所述实体既定信息包括:实体提及和/或实体的本质属性信息。
20.根据权利要求19所述的装置,其中,所述序列标注模型,包括:ERNIE层、双向长短期记忆网络层和条件随机场层。
21.根据权利要求15或16所述的装置,其中,所述第二标签与所述第一标签不一致,包括:
所述第二标签为错误的标签;或,所述第二标签为无法识别对应的标签。
22.一种确定搜索结果的装置,包括:
信息获取模块,被配置成获取第二搜索信息,其中,所述第二搜索信息包括第二需求信息和预设的知识图谱中的知识图谱既定信息;
标签得到模块,被配置成根据所述知识图谱既定信息,从所述知识图谱中获取所述知识图谱既定信息对应的标签结果,以及将所述第二需求信息输入如权利要求1-7任一项所述的方法生成的序列标注模型中,得到所述第二需求信息对应的标签结果;
结果得到模块,被配置成根据所述知识图谱既定信息对应的标签结果和所述第二需求信息对应的标签结果,得到所述第二搜索信息对应的搜索结果,并展示所述搜索结果。
23.根据权利要求22所述的装置,其中,所述结果得到模块,包括:
类型确定单元,被配置成根据所述知识图谱既定信息对应的标签结果和所述第二需求信息对应的标签结果,确定所述第二搜索信息的类型;
结果确定单元,被配置成根据所述知识图谱既定信息对应的标签结果、所述第二需求信息对应的标签结果,以及所述第二搜索信息的类型,确定所述第二搜索信息的类型对应的搜索结果。
24.根据权利要求23所述的装置,其中,所述类型确定单元,包括:
第一结果单元,被配置成利用所述知识图谱对所述知识图谱既定信息设置实体知识标签,得到实体知识标签结果,以及利用所述序列标注模型对所述第二需求信息设置实体需求标签,得到实体需求标签结果;
第二结果单元,被配置成与利用所述知识图谱对所述知识图谱既定信息设置实体知识标签的步骤并行执行,利用所述知识图谱对所述知识图谱既定信息设置泛需求知识标签,得到泛需求知识标签结果,以及利用所述序列标注模型对所述第二需求信息设置泛需求需求标签,得到泛需求需求标签结果;
第三结果单元,被配置成响应于所述知识图谱既定信息和/或第二需求信息还包括未被识别的信息,利用所述知识图谱对所述未被识别的信息设置问答知识标签,得到问答知识标签结果,以及利用所述序列标注模型对所述未被识别的信息设置问答需求标签;
所述类型确定单元,进一步被配置成根据所述实体知识标签结果、实体需求标签结果、泛需求知识标签结果、泛需求需求标签结果、问答知识标签结果、问答需求标签结果,确定所述第二搜索信息的类型。
25.根据权利要求23或24所述的装置,所述装置还包括:
实体定位模块,被配置成定位所述第二搜索信息中的目标实体;
实体集确定模块,被配置成确定所述目标实体的实体候选集;
实体选择模块,被配置成从所述实体候选集中确定最终实体;
所述结果确定单元,进一步配置成:
根据所述最终实体对应的标签,所述第二需求信息对应的标签,以及所述第二搜索信息的类型,确定所述第二搜索信息的类型对应的搜索结果。
26.根据权利要求25所述的装置,其中,所述从所述实体候选集中确定最终实体,包括:
根据以下至少一项,从所述实体候选集中确定最终实体:
实体候选集中每个实体的热度特征、实体候选集中每个实体的时间特征、实体候选集中每个实体与所述目标实体的相似度。
27.根据权利要求24所述的装置,其中,所述类型确定单元,进一步被配置成:
响应于所述泛需求知识标签结果、泛需求需求标签结果、问答知识标签结果、问答需求标签结果为错误的标签结果,根据所述实体知识标签结果和实体需求标签结果,确定所述第二搜索信息的类型为实体搜索信息;
响应于所述泛需求知识标签结果、泛需求需求标签结果为错误的标签结果,根据所述实体知识标签结果、实体需求标签结果、问答知识标签结果和问答需求标签结果,确定所述第二搜索信息的类型为问答信息;
响应于所述实体知识标签结果、实体需求标签结果、问答知识标签结果、问答需求标签结果,根据所述泛需求知识标签结果和泛需求需求标签结果,确定所述第二搜索信息的类型为泛需求搜索信息。
28.根据权利要求22所述的装置,其中,所述结果得到模块,进一步被配置成:
将所述知识图谱既定信息对应的标签和所述第二需求信息对应的标签,转化为图检索语句;
根据所述图检索语句,得到所述图检索语句对应的搜索结果。
29.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-7或8-14中任一项所述的方法。
30.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-7或8-14中任一项所述的方法。
31.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1-7或8-14中任一项所述的方法。
32.一种搜索系统,包括:如权利要求22-28所述的确定搜索结果的装置。
33.根据权利要求32所述的系统,所述系统还包括:如权利要求15-21所述的生成序列标注模型的装置。
CN202110187089.7A 2021-02-10 2021-02-10 生成序列标注模型的方法、设备、介质及程序产品 Active CN112905884B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110187089.7A CN112905884B (zh) 2021-02-10 2021-02-10 生成序列标注模型的方法、设备、介质及程序产品

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110187089.7A CN112905884B (zh) 2021-02-10 2021-02-10 生成序列标注模型的方法、设备、介质及程序产品

Publications (2)

Publication Number Publication Date
CN112905884A CN112905884A (zh) 2021-06-04
CN112905884B true CN112905884B (zh) 2024-05-31

Family

ID=76123700

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110187089.7A Active CN112905884B (zh) 2021-02-10 2021-02-10 生成序列标注模型的方法、设备、介质及程序产品

Country Status (1)

Country Link
CN (1) CN112905884B (zh)

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018072563A1 (zh) * 2016-10-18 2018-04-26 中兴通讯股份有限公司 一种知识图谱构建方法、装置及系统
CN109033374A (zh) * 2018-07-27 2018-12-18 四川长虹电器股份有限公司 基于贝叶斯分类器的知识图谱检索方法
CN109388793A (zh) * 2017-08-03 2019-02-26 阿里巴巴集团控股有限公司 实体标注方法、意图识别方法及对应装置、计算机存储介质
CN110298042A (zh) * 2019-06-26 2019-10-01 四川长虹电器股份有限公司 基于Bilstm-crf与知识图谱影视实体识别方法
CN110569367A (zh) * 2019-09-10 2019-12-13 苏州大学 一种基于知识图谱的空间关键字查询方法、装置及设备
CN111274373A (zh) * 2020-01-16 2020-06-12 山东大学 一种基于知识图谱的电子病历问答方法及系统
CN111309872A (zh) * 2020-03-26 2020-06-19 北京百度网讯科技有限公司 搜索处理方法、装置及设备
CN111506722A (zh) * 2020-06-16 2020-08-07 平安科技(深圳)有限公司 基于深度学习技术的知识图谱问答方法、装置及设备
CN111639228A (zh) * 2020-05-29 2020-09-08 北京百度网讯科技有限公司 视频检索方法、装置、设备及存储介质
CN111708899A (zh) * 2020-06-13 2020-09-25 广州华建工智慧科技有限公司 一种基于自然语言和知识图谱工程信息智能搜索方法
WO2021003819A1 (zh) * 2019-07-05 2021-01-14 平安科技(深圳)有限公司 基于知识图谱的人机对话方法及人机对话装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9792560B2 (en) * 2015-02-17 2017-10-17 Microsoft Technology Licensing, Llc Training systems and methods for sequence taggers

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018072563A1 (zh) * 2016-10-18 2018-04-26 中兴通讯股份有限公司 一种知识图谱构建方法、装置及系统
CN107967267A (zh) * 2016-10-18 2018-04-27 中兴通讯股份有限公司 一种知识图谱构建方法、装置及系统
CN109388793A (zh) * 2017-08-03 2019-02-26 阿里巴巴集团控股有限公司 实体标注方法、意图识别方法及对应装置、计算机存储介质
CN109033374A (zh) * 2018-07-27 2018-12-18 四川长虹电器股份有限公司 基于贝叶斯分类器的知识图谱检索方法
CN110298042A (zh) * 2019-06-26 2019-10-01 四川长虹电器股份有限公司 基于Bilstm-crf与知识图谱影视实体识别方法
WO2021003819A1 (zh) * 2019-07-05 2021-01-14 平安科技(深圳)有限公司 基于知识图谱的人机对话方法及人机对话装置
CN110569367A (zh) * 2019-09-10 2019-12-13 苏州大学 一种基于知识图谱的空间关键字查询方法、装置及设备
CN111274373A (zh) * 2020-01-16 2020-06-12 山东大学 一种基于知识图谱的电子病历问答方法及系统
CN111309872A (zh) * 2020-03-26 2020-06-19 北京百度网讯科技有限公司 搜索处理方法、装置及设备
CN111639228A (zh) * 2020-05-29 2020-09-08 北京百度网讯科技有限公司 视频检索方法、装置、设备及存储介质
CN111708899A (zh) * 2020-06-13 2020-09-25 广州华建工智慧科技有限公司 一种基于自然语言和知识图谱工程信息智能搜索方法
CN111506722A (zh) * 2020-06-16 2020-08-07 平安科技(深圳)有限公司 基于深度学习技术的知识图谱问答方法、装置及设备

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于属性关系深度挖掘的试题知识点标注模型;何彬;李心宇;陈蓓蕾;夏盟;曾致中;;南京信息工程大学学报(自然科学版);20191128(第06期);全文 *
基于知识图谱与语义计算的智能信息搜索技术研究;高龙;张涵初;杨亮;;情报理论与实践;20180510(第07期);全文 *

Also Published As

Publication number Publication date
CN112905884A (zh) 2021-06-04

Similar Documents

Publication Publication Date Title
CN107679039B (zh) 用于确定语句意图的方法和装置
US9471874B2 (en) Mining forums for solutions to questions and scoring candidate answers
CN107526846B (zh) 频道排序模型的生成、排序方法、装置、服务器和介质
US10360219B2 (en) Applying level of permanence to statements to influence confidence ranking
CN111694965A (zh) 一种基于多模态知识图谱的图像场景检索系统及方法
CN112926308B (zh) 匹配正文的方法、装置、设备、存储介质以及程序产品
KR20220006491A (ko) 댓글 자막을 생성하는 방법, 장치, 전자 기기, 저장 매체 및 컴퓨터 프로그램
US20230008897A1 (en) Information search method and device, electronic device, and storage medium
CN111737559A (zh) 资源排序方法、训练排序模型的方法及对应装置
CN113032673A (zh) 资源的获取方法、装置、计算机设备及存储介质
CN112287168A (zh) 用于生成视频的方法和装置
CN116955591A (zh) 用于内容推荐的推荐语生成方法、相关装置和介质
CN111813993A (zh) 视频内容的拓展方法、装置、终端设备及存储介质
CN113919360A (zh) 语义理解方法、语音交互方法、装置、设备及存储介质
US20230367972A1 (en) Method and apparatus for processing model data, electronic device, and computer readable medium
CN114120166A (zh) 视频问答方法、装置、电子设备及存储介质
US20240020538A1 (en) Systems and methods for real-time search based generative artificial intelligence
CN112905884B (zh) 生成序列标注模型的方法、设备、介质及程序产品
CN113468311B (zh) 一种基于知识图谱的复杂问句问答方法、装置及存储介质
CN112182179B (zh) 实体问答处理方法、装置、电子设备和存储介质
CN117648504A (zh) 媒体资源序列的生成方法、装置、计算机设备和存储介质
CN111222011B (zh) 一种视频向量确定方法和装置
CN109657129B (zh) 用于获取信息的方法及装置
TWI693524B (zh) 專屬個性化圖片搜尋優化方法
KR20210084641A (ko) 정보를 송신하는 방법 및 장치

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant