CN111858880B - 获取查询结果的方法、装置、电子设备和可读存储介质 - Google Patents

获取查询结果的方法、装置、电子设备和可读存储介质 Download PDF

Info

Publication number
CN111858880B
CN111858880B CN202010560732.1A CN202010560732A CN111858880B CN 111858880 B CN111858880 B CN 111858880B CN 202010560732 A CN202010560732 A CN 202010560732A CN 111858880 B CN111858880 B CN 111858880B
Authority
CN
China
Prior art keywords
query
sentence
result
reason
statement
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010560732.1A
Other languages
English (en)
Other versions
CN111858880A (zh
Inventor
郑俊强
刘凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN202010560732.1A priority Critical patent/CN111858880B/zh
Publication of CN111858880A publication Critical patent/CN111858880A/zh
Application granted granted Critical
Publication of CN111858880B publication Critical patent/CN111858880B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor
    • G06F16/345Summarisation for human users
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种获取查询结果的方法、装置、电子设备和可读存储介质,涉及深度学习、自然语言处理技术领域。本申请在获取查询结果时所采用的实现方案为:获取查询语句,并得到所述查询语句对应的候选答案;获取所述查询语句的查询类别;确定所述查询语句的查询类别为问答是非类时,根据所述查询语句从所述候选答案中定位原因句;根据所述查询语句以及所述原因句进行观点识别,生成观点识别结果;将所述观点识别结果以及所述原因句作为所述查询语句的查询结果。本申请能够提供更加简洁有效的查询结果,并提升查询结果的准确性。

Description

获取查询结果的方法、装置、电子设备和可读存储介质
技术领域
本申请涉及互联网技术领域,尤其涉及自然语言处理、深度学习技术领域中的一种获取查询结果的方法、装置、电子设备和可读存储介质。
背景技术
目前,互联网中用户输入的查询语句可以分为问答类查询语句和非问答类查询语句。对于语音交互、语音播报等场景,问答类查询语句需要直接给出答案摘要,而不是让用户从较长的答案中自己找寻。
现有技术在向用户给出答案摘要的同时,还会向用户提供合适的理由,从而增加答案摘要的置信度。但目前现有技术在向用户提供理由时,通常是将与查询语句对应的答案直接返回给用户,而该答案中可能存在与答案摘要不相对应的内容,从而导致用户混淆,给用户带来困扰。
发明内容
本申请为解决技术问题所采用的技术方案是提供一种获取查询结果的方法,包括:获取查询语句,并得到所述查询语句对应的候选答案;获取所述查询语句的查询类别;确定所述查询语句的查询类别为问答是非类时,根据所述查询语句从所述候选答案中定位原因句;根据所述查询语句以及所述原因句进行观点识别,生成观点识别结果;将所述观点识别结果以及所述原因句作为所述查询语句的查询结果。
本申请为解决技术问题所采用的技术方案是提供一种获取查询结果的装置,包括:获取单元,用于获取查询语句,并得到所述查询语句对应的候选答案;处理单元,用于获取所述查询语句的查询类别;确定单元,用于确定所述查询语句的查询类别为问答是非类时,根据所述查询语句从所述候选答案中定位原因句;生成单元,用于根据所述查询语句以及所述原因句进行观点识别,生成观点识别结果;查询单元,用于将所述观点识别结果以及所述原因句作为所述查询语句的查询结果。
上述申请中的一个实施例具有如下优点或有益效果:本申请能够提供更加简洁有效的查询结果,并提升查询结果的准确性。因为采用了根据查询语句从候选答案中对原因句进行定位的技术手段,所以克服了现有技术直接将答案作为原因句返回所导致的原因句与答案摘要不相对应的技术问题,能够实现提供更加简洁有效的查询结果,并提升查询结果的准确性的技术效果。
上述可选方式所具有的其他效果将在下文中结合具体实施例加以说明。
附图说明
附图用于更好地理解本方案,不构成对本申请的限定。其中:
图1是根据本申请第一实施例的示意图;
图2是根据本申请第二实施例的示意图;
图3是根据本申请第三实施例的示意图;
图4是根据本申请第四实施例的示意图;
图5是用来实现本申请实施例的获取查询结果的方法的电子设备的框图。
具体实施方式
以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
图1是根据本申请第一实施例的示意图。如图1中所示,本实施例的获取查询结果的方法,具体可以包括如下步骤:
S101、获取查询语句,并得到所述查询语句对应的候选答案;
S102、获取所述查询语句的查询类别;
S103、确定所述查询语句的查询类别为问答是非类时,根据所述查询语句从所述候选答案中定位原因句;
S104、根据所述查询语句以及所述原因句进行观点识别,生成观点识别结果;
S105、将所述观点识别结果以及所述原因句作为所述查询语句的查询结果。
本实施例的获取查询结果的方法,能够针对属于问答是非类的查询语句,得到包含观点识别结果以及原因句的查询结果,一方面能够避免用户需要从原因句中人工提取答案观点,使得查询结果更加简洁有效,另一方面能够确保原因句与观点识别结果相对应,提升了查询结果的准确性。
本实施例所获取的查询语句可以为用户输入的query,而在获取查询语句之后,本实施例可以通过人工标注、互联网搜索等方式,得到与查询语句对应的多个候选答案,其中,所得到的候选答案可以为网页、文档等。
通常情况下,查询语句可以分为问答类和非问答类,而问答类查询语句又可以分为实体类、描述类、是非类等类别。
其中,问答是非类查询语句的查询结果可以包括不同的观点,例如,问答是非类查询语句为“孕妇能吃苹果吗”,其查询结果可以包括“能吃”、“不能吃”以及“不确定”这三个观点。
本实施例在获取查询语句及其对应的候选答案之后,再获取查询语句的查询类别,进而根据所获取的查询类别来采用不同的方式生成查询结果。因此,本实施例的获取查询结果的方法针对的是特定查询类别的查询语句,而该特定的查询类别为问答是非类。
本实施例在获取查询语句的查询类别时,可以通过预先训练得到的识别模型来获取查询语句的查询类别,该识别模型能够根据所输入的查询语句输出其所属的查询类别;也可以在对查询语句中的各个查询词语进行识别之后,根据各个词语的识别结果来获取查询语句的查询类别。
本实施例若确定查询语句的查询类别是问答是非类,则继续执行本实施例的后续步骤;若本实施例确定查询语句的查询类别不是问答是非类,则可以从所得到的候选答案中选取一个,作为该查询语句对应的查询结果。
本实施例在确定查询语句的查询类别是问答是非类之后,首先根据查询语句从候选答案中定位原因句,本实施例所定位的原因句为各候选答案中能够准确回答查询语句的句子。
这是因为,在得到查询语句对应的候选答案之后,各候选答案中包含有能够回答查询语句的内容,但也可能会包含有无法回答查询语句的内容。若直接将上述候选答案作为原因句返回给用户,一方面会由于过于复杂而影响用户查看,另一方面可能出现原因句与观点识别结果不对应的问题,使得用户对查询结果产生混淆。
因此,本实施例通过根据查询语句从候选答案中对原因句进行定位的方式,使得所得到的原因句更为简洁而便于用户查看,且确保了原因句与观点识别结果能够准确对应,从而提升查询结果的准确性。
本实施例在根据查询语句从候选答案中定位原因句之后,再根据定位得到的原因句以及查询语句进行观点识别,生成观点识别结果。本实施例所生成的观点识别结果包括“是”、“否”以及“不确定”这三种观点,用于简洁地表示候选答案的答案摘要,使得用户快速准确地获取答案观点。
本实施例在根据查询语句以及原因句进行观点识别来生成观点识别结果时,可以采用以下方式:确定查询词语中的焦点词;根据焦点词对原因句进行挖掘,生成观点识别结果。
其中,本实施例使用现有技术来分离查询词语,从而确定其中的焦点词,例如对“西红柿好吃吗”进行分离,获取主题词为西红柿,疑问词为吗,焦点词为好吃。
另外,本实施例在根据查询语句以及原因句进行观点识别来生成观点识别结果时,还可以采用以下方式:将查询语句以及原因句输入预先训练得到的观点生成模型,将观点生成模型的输出结果作为观点识别结果。
本实施例在生成观点识别结果之后,将所生成的观点识别结果以及定位得到的原因句作为查询语句的查询结果,该查询结果一方面包含有直接回答问题的观点表示,另一方面包含有支持观点表示的理由,提升用户的查询体验。
为了更加便于用户理解,使得查询结果能够与查询语句通顺地对应,本实施例在将观点识别结果以及原因句作为查询语句的查询结果时,可以采用以下方式:确定查询语句中的焦点词;利用所确定的焦点词对观点识别结果进行校验,即使得观点识别结果与查询语句具有相同的表述方式;将校验结果以及原因句作为查询语句的查询结果。
举例来说,若查询语句为“孕妇能吃苹果吗”,该查询语句的焦点词为“能吃”,若所生成的观点识别结果为“是”,则该观点识别结果的校验结果即为“能吃”;若所生成的观点识别结果为“否”,则该观点识别结果的校验结果即为“不能吃”。
可以理解的是,若本实施例生成了多个观点识别结果,即对应查询语句的答案并不固定,则获取每一类别观点识别结果的百分比,从而在查询结果中以百分比的形式显示答案观点。
图2是根据本申请第二实施例的示意图。如图2中所示,本实施例在执行步骤S103根据查询语句从候选答案中定位原因句时,具体可以包括如下步骤:
S201、将所述查询语句以及所述候选答案输入预先训练得到的阅读理解模型;
S202、根据所述阅读理解模型的输出结果,从所述候选答案中定位原因句。
本实施例中预先训练得到的阅读理解模型能够根据输入的查询语句以及候选答案,输出位置坐标(例如文档中的哪一页、哪一页中的哪一行等),从而根据所得到的位置坐标便能够对候选答案中的原因句进行定位。
具体地,本实施例可以采用以下方式预先训练得到阅读理解模型:获取训练语句、各训练语句对应的候选答案以及各候选答案中原因句的位置坐标;将各训练语句及其对应的候选答案作为输入,将候选答案中原因句的位置坐标作为输出,训练神经网络模型,得到阅读理解模型。其中,本实施例中的神经网络模型可以为深度学习模型,例如ernie模型。
另外,本实施例在根据查询语句从候选答案中定位原因句时,也可以将人工从候选答案中所选取的句子作为原因句。
图3是根据本申请第三实施例的示意图。如图3中所示,本实施例的获取查询结果的方法,具体可以包括如下步骤:
S301、获取查询语句,并得到所述查询语句对应的候选答案;
S302、获取所述查询语句的查询类别;
S303、确定所述查询语句的查询类别为问答是非类时,根据所述查询语句从所述候选答案中定位原因句;
S304、根据所述查询语句以及所述原因句进行观点识别,生成观点识别结果;
S305、将所述观点识别结果以及所述原因句作为所述查询语句的查询结果;
S306、对所述查询语句进行泛化,得到泛化查询语句;
本实施例对查询语句进行泛化,即本实施例进行查询语句的改写,所得到的泛化查询语句与查询语句之间的表述不同,但具有相同语义。其中,本实施例可以通过query改写或者query替换的方式对查询语句进行泛化。
S307、将所述查询语句的查询结果作为所述泛化查询语句的查询结果。
本实施例将查询语句的查询结果作为泛化查询语句的查询结果,从而当用户输入泛化查询语句之后,无需再进行上述步骤的处理而直接返回查询结果,从而提升获取查询结果的速度。
本实施例可以直接将查询语句的查询结果作为泛化语句的查询结果。
另外,本实施例在将查询语句的查询结果作为泛化查询语句的查询结果时,还可以采用以下方式:确定泛化查询语句中的焦点词;利用所确定的焦点词对查询结果中的观点识别结果进行校验;将校验结果以及原因句作为泛化查询语句的查询结果。
举例来说,若查询语句为“孕妇能吃苹果吗”,若该查询语句的查询结果中的观点识别结果为“可以”,若与该查询语句对应的泛化查询语句为“孕妇吃苹果合适吗”,则可以直接将“可以”作为该泛化查询语句的观点识别结果,也可以将观点识别结果校验为“合适”。
图4是根据本申请第四实施例的示意图。如图4中所示,本实施例的获取查询结果的装置,包括:
获取单元401、用于获取查询语句,并得到所述查询语句对应的候选答案;
处理单元402、用于获取所述查询语句的查询类别;
确定单元403、用于确定所述查询语句的查询类别为问答是非类时,根据所述查询语句从所述候选答案中定位原因句;
生成单元404、用于根据所述查询语句以及所述原因句进行观点识别,生成观点识别结果;
查询单元405、用于将所述观点识别结果以及所述原因句作为所述查询语句的查询结果。
获取单元401所获取的查询语句可以为用户输入的query,而在获取查询语句之后,获取单元401可以通过人工标注、互联网搜索等方式,得到与查询语句对应的多个候选答案,其中,所得到的候选答案可以为网页、文档等。
获取单元401在获取查询语句及其对应的候选答案之后,由处理单元402再获取查询语句的查询类别,进而根据所获取的查询类别来采用不同的方式生成查询结果。
处理单元402在获取查询语句的查询类别时,可以通过预先训练得到的识别模型来获取查询语句的查询类别,该识别模型能够根据所输入的查询语句输出其所属的查询类别;也可以在对查询语句中的各个查询词语进行识别之后,根据各个词语的识别结果来获取查询语句的查询类别。
确定单元403在确定查询语句的查询类别是问答是非类之后,首先根据查询语句从候选答案中定位原因句,确定单元403所定位的原因句为各候选答案中能够准确回答查询语句的句子。
因此,确定单元403通过根据查询语句从候选答案中对原因句进行定位的方式,使得所得到的原因句更为简洁而便于用户查看,且确保了原因句与观点识别结果能够准确对应,从而提升查询结果的准确性。
具体地,确定单元403在根据查询语句从候选答案中定位原因句时,可以采用如下方式:将查询语句以及候选答案输入预先训练得到的阅读理解模型;根据阅读理解模型的输出结果,从候选答案中定位原因句。
确定单元403所使用的阅读理解模型能够根据输入的查询语句以及候选答案,输出位置坐标(例如文档中的哪一页、哪一页中的哪一行等),从而根据所得到的位置坐标便能够对候选答案中的原因句进行定位。
其中,阅读理解模型是由训练单元406采用以下方式预先训练得到:获取训练语句、各训练语句对应的候选答案以及各候选答案中原因句的位置坐标;将各训练语句及其对应的候选答案作为输入,将候选答案中原因句的位置坐标作为输出,训练神经网络模型,得到阅读理解模型。其中,训练单元406中的神经网络模型可以为深度学习模型,例如ernie模型。
另外,确定单元403在根据查询语句从候选答案中定位原因句时,也可以将人工从候选答案中所选取的句子作为原因句。
确定单元403在根据查询语句从候选答案中定位原因句之后,由生成单元404根据定位得到的原因句以及查询语句进行观点识别,生成观点识别结果。生成单元404所生成的观点识别结果包括“是”、“否”以及“不确定”这三种观点,用于简洁地表示候选答案的答案摘要,使得用户快速准确地获取答案观点。
生成单元404在根据查询语句以及原因句进行观点识别来生成观点识别结果时,可以采用以下方式:确定查询词语中的焦点词;根据焦点词对原因句进行挖掘,生成观点识别结果。
其中,查询单元405使用现有技术来分离查询词语,从而确定其中的焦点词,例如对“西红柿好吃吗”进行分离,获取主题词为西红柿,疑问词为吗,焦点词为好吃。
另外,生成单元404在根据查询语句以及原因句进行观点识别来生成观点识别结果时,还可以采用以下方式:将查询语句以及原因句输入预先训练得到的观点生成模型,将观点生成模型的输出结果作为观点识别结果。
为了更加便于用户理解,使得查询结果能够与查询语句通顺地对应,查询单元405在将观点识别结果以及原因句作为查询语句的查询结果时,可以采用以下方式:确定查询语句中的焦点词;利用所确定的焦点词对观点识别结果进行校验;将校验结果以及原因句作为查询语句的查询结果。
可以理解的是,若生成单元404生成了多个观点识别结果,即对应查询语句的答案并不固定,则查询单元405获取每一类别观点识别结果的百分比,从而在查询结果中以百分比的形式显示答案观点。
本实施例还可以包含泛化单元407,用于在查询单元405将观点识别结果以及原因句作为查询语句的查询结果之后,执行:对查询语句进行泛化,得到泛化查询语句;将查询语句的查询结果作为泛化查询语句的查询结果。
其中,泛化单元407对查询语句进行泛化,即进行查询语句的改写,所得到的泛化查询语句与查询语句之间的表述不同,但具有相同语义。其中,泛化单元407可以通过query改写或者query替换的方式对查询语句进行泛化。
因此,泛化单元407将查询语句的查询结果作为泛化查询语句的查询结果,从而当用户输入泛化查询语句之后,无需再进行上述步骤的处理而直接返回查询结果,从而提升获取查询结果的速度。
泛化单元407可以直接将查询语句的查询结果作为泛化语句的查询结果。泛化单元407在将查询语句的查询结果作为泛化查询语句的查询结果时,还可以采用以下方式:确定泛化查询语句中的焦点词;利用所确定的焦点词对查询结果中的观点识别结果进行校验;将校验结果以及原因句作为泛化查询语句的查询结果。
根据本申请的实施例,本申请还提供了一种电子设备和一种计算机可读存储介质。
如图5所示,是根据本申请实施例的获取查询结果的方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。
如图5所示,该电子设备包括:一个或多个处理器501、存储器502,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示GUI的图形信息的指令。在其它实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个电子设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图5中以一个处理器501为例。
存储器502即为本申请所提供的非瞬时计算机可读存储介质。其中,所述存储器存储有可由至少一个处理器执行的指令,以使所述至少一个处理器执行本申请所提供的获取查询结果的方法。本申请的非瞬时计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行本申请所提供的获取查询结果的方法。
存储器502作为一种非瞬时计算机可读存储介质,可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块,如本申请实施例中的获取查询结果的方法对应的程序指令/模块(例如,附图4所示的获取单元401、处理单元402、确定单元403、生成单元404、查询单元405、训练单元406以及泛化单元407)。处理器501通过运行存储在存储器302中的非瞬时软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例中的获取查询结果的方法。
存储器502可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据的电子设备的使用所创建的数据等。此外,存储器502可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中,存储器502可选包括相对于处理器501远程设置的存储器,这些远程存储器可以通过网络连接至获取查询结果的方法的电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
获取查询结果的方法的电子设备还可以包括:输入装置503和输出装置504。处理器501、存储器502、输入装置503和输出装置504可以通过总线或者其他方式连接,图5中以通过总线连接为例。
输入装置503可接收输入的数字或字符信息,以及产生与获取查询结果的方法的电子设备的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置504可以包括显示设备、辅助照明装置(例如,LED)和触觉反馈装置(例如,振动电机)等。该显示设备可以包括但不限于,液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中,显示设备可以是触摸屏。
此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用ASIC(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令,并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(PLD)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。
根据本申请实施例的技术方案,能够针对属于问答是非类的查询语句,得到包含观点识别结果以及原因句的查询结果,一方面能够避免用户需要从原因句中人工提取答案观点,使得查询结果更加简洁有效,另一方面能够确保原因句与观点识别结果相对应,提升了查询结果的准确性。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。

Claims (10)

1.一种获取查询结果的方法,包括:
获取查询语句,并得到所述查询语句对应的候选答案;
获取所述查询语句的查询类别;
确定所述查询语句的查询类别为问答是非类时,根据所述查询语句从所述候选答案中定位原因句;
根据所述查询语句以及所述原因句进行观点识别,生成观点识别结果;
将所述观点识别结果以及所述原因句作为所述查询语句的查询结果;
所述根据所述查询语句从所述候选答案中定位原因句包括:
将所述查询语句以及所述候选答案输入预先训练得到的阅读理解模型;
根据所述阅读理解模型的输出结果,从所述候选答案中定位原因句;
还包括,
获取训练语句、各训练语句对应的候选答案以及各候选答案中原因句的位置坐标;
将各训练语句及其对应的候选答案作为输入,将候选答案中原因句的位置坐标作为输出,训练神经网络模型,得到所述阅读理解模型。
2.根据权利要求1所述的方法,其中,所述将所述观点识别结果以及所述原因句作为所述查询语句的查询结果包括:
确定所述查询语句中的焦点词;
利用所述焦点词对所述观点识别结果进行校验;
将校验结果以及原因句作为所述查询语句的查询结果。
3.根据权利要求1所述的方法,还包括,
在将所述观点识别结果以及所述原因句作为所述查询语句的查询结果之后,对所述查询语句进行泛化,得到泛化查询语句;
将所述查询语句的查询结果作为所述泛化查询语句的查询结果。
4.根据权利要求3所述的方法,其中,所述将所述查询语句的查询结果作为所述泛化查询语句的查询结果包括:
确定所述泛化查询语句中的焦点词;
利用所述焦点词对所述查询结果中的观点识别结果进行校验;
将校验结果以及原因句作为所述泛化查询语句的查询结果。
5.一种获取查询结果的装置,包括:
获取单元,用于获取查询语句,并得到所述查询语句对应的候选答案;
处理单元,用于获取所述查询语句的查询类别;
确定单元,用于确定所述查询语句的查询类别为问答是非类时,根据所述查询语句从所述候选答案中定位原因句;
生成单元,用于根据所述查询语句以及所述原因句进行观点识别,生成观点识别结果;
查询单元,用于将所述观点识别结果以及所述原因句作为所述查询语句的查询结果;
所述确定单元在根据所述查询语句从所述候选答案中定位原因句时,具体执行:
将所述查询语句以及所述候选答案输入预先训练得到的阅读理解模型;
根据所述阅读理解模型的输出结果,从所述候选答案中定位原因句;
还包括训练单元,用于执行:
获取训练语句、各训练语句对应的候选答案以及各候选答案中原因句的位置坐标;
将各训练语句及其对应的候选答案作为输入,将候选答案中原因句的位置坐标作为输出,训练神经网络模型,得到所述阅读理解模型。
6.根据权利要求5所述的装置,其中,所述查询单元在将所述观点识别结果以及所述原因句作为所述查询语句的查询结果时,具体执行:
确定所述查询语句中的焦点词;
利用所述焦点词对所述观点识别结果进行校验;
将校验结果以及原因句作为所述查询语句的查询结果。
7.根据权利要求5所述的装置,还包括泛化单元,
用于在所述查询单元在将所述观点识别结果以及所述原因句作为所述查询语句的查询结果之后,对所述查询语句进行泛化,得到泛化查询语句;
将所述查询语句的查询结果作为所述泛化查询语句的查询结果。
8.根据权利要求7所述的装置,其中,所述泛化单元在将所述查询语句的查询结果作为所述泛化查询语句的查询结果时,具体执行:
确定所述泛化查询语句中的焦点词;
利用所述焦点词对所述查询结果中的观点识别结果进行校验;
将校验结果以及原因句作为所述泛化查询语句的查询结果。
9.一种电子设备,其特征在于,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-4中任一项所述的方法。
10.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行权利要求1-4中任一项所述的方法。
CN202010560732.1A 2020-06-18 2020-06-18 获取查询结果的方法、装置、电子设备和可读存储介质 Active CN111858880B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010560732.1A CN111858880B (zh) 2020-06-18 2020-06-18 获取查询结果的方法、装置、电子设备和可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010560732.1A CN111858880B (zh) 2020-06-18 2020-06-18 获取查询结果的方法、装置、电子设备和可读存储介质

Publications (2)

Publication Number Publication Date
CN111858880A CN111858880A (zh) 2020-10-30
CN111858880B true CN111858880B (zh) 2024-01-26

Family

ID=72986228

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010560732.1A Active CN111858880B (zh) 2020-06-18 2020-06-18 获取查询结果的方法、装置、电子设备和可读存储介质

Country Status (1)

Country Link
CN (1) CN111858880B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112506949B (zh) * 2020-12-03 2023-07-25 北京百度网讯科技有限公司 结构化查询语言查询语句生成方法、装置及存储介质
CN113157877A (zh) * 2021-03-19 2021-07-23 北京百度网讯科技有限公司 多语义识别方法、装置、设备和介质
CN113392308B (zh) * 2021-06-22 2024-06-25 抖音视界有限公司 内容搜索方法、装置、设备及介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105930452A (zh) * 2016-04-21 2016-09-07 北京紫平方信息技术股份有限公司 一种识别自然语言的智能应答方法
CN107480149A (zh) * 2016-06-07 2017-12-15 株式会社Ntt都科摩 问答系统中的答案提供方法及装置
CN108959531A (zh) * 2018-06-29 2018-12-07 北京百度网讯科技有限公司 信息搜索方法、装置、设备及存储介质
CN110209786A (zh) * 2019-05-28 2019-09-06 北京百度网讯科技有限公司 是非类答案的显示方法、装置、计算机设备和存储介质
CN111143531A (zh) * 2019-12-24 2020-05-12 深圳市优必选科技股份有限公司 一种问答对构建方法、系统、装置及计算机可读存储介质

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101992399B1 (ko) * 2016-07-05 2019-06-24 한국전자통신연구원 하이브리드 추론 기반의 자연어 질의응답 시스템 및 그 방법
CN106649761A (zh) * 2016-12-27 2017-05-10 北京百度网讯科技有限公司 基于深度问答的搜索结果展现方法和装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105930452A (zh) * 2016-04-21 2016-09-07 北京紫平方信息技术股份有限公司 一种识别自然语言的智能应答方法
CN107480149A (zh) * 2016-06-07 2017-12-15 株式会社Ntt都科摩 问答系统中的答案提供方法及装置
CN108959531A (zh) * 2018-06-29 2018-12-07 北京百度网讯科技有限公司 信息搜索方法、装置、设备及存储介质
CN110209786A (zh) * 2019-05-28 2019-09-06 北京百度网讯科技有限公司 是非类答案的显示方法、装置、计算机设备和存储介质
CN111143531A (zh) * 2019-12-24 2020-05-12 深圳市优必选科技股份有限公司 一种问答对构建方法、系统、装置及计算机可读存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
阅读理解中观点类问题的扩展研究;张兆滨;王素格;陈鑫;赵琳玲;王典;;中文信息学报(06);全文 *
面向高考阅读理解观点类问题的答案抽取方法;王素格;李书鸣;陈鑫;穆婉青;乔霈;;郑州大学学报(理学版)(01);全文 *

Also Published As

Publication number Publication date
CN111858880A (zh) 2020-10-30

Similar Documents

Publication Publication Date Title
EP3923160A1 (en) Method, apparatus, device and storage medium for training model
US11854237B2 (en) Human body identification method, electronic device and storage medium
EP3913499A1 (en) Method and apparatus for processing dataset, electronic device and storage medium
CN111401033B (zh) 事件抽取方法、事件抽取装置和电子设备
CN111414482B (zh) 一种事件论元抽取方法、装置以及电子设备
CN111858880B (zh) 获取查询结果的方法、装置、电子设备和可读存储介质
CN111967256B (zh) 事件关系的生成方法、装置、电子设备和存储介质
CN111259671B (zh) 文本实体的语义描述处理方法、装置及设备
CN111488740B (zh) 一种因果关系的判别方法、装置、电子设备及存储介质
US20210209309A1 (en) Semantics processing method, electronic device, and medium
CN111507355B (zh) 一种字符识别方法、装置、设备和存储介质
CN111611468B (zh) 页面交互方法、装置和电子设备
US20210256038A1 (en) Method and apparatus for recognizing entity word, and storage medium
CN111949814A (zh) 搜索方法、装置、电子设备和存储介质
JP2021111334A (ja) 検索データに基づくヒューマンコンピュータ対話型インタラクションの方法、装置及び電子機器
CN111078878B (zh) 文本处理方法、装置、设备及计算机可读存储介质
CN111324715B (zh) 问答机器人的生成方法和装置
CN111695519B (zh) 关键点定位方法、装置、设备以及存储介质
EP3832492A1 (en) Method and apparatus for recommending voice packet, electronic device, and storage medium
CN112541362B (zh) 一种泛化处理的方法、装置、设备和计算机存储介质
CN110674260A (zh) 语义相似模型的训练方法、装置、电子设备和存储介质
CN111708800A (zh) 查询方法、装置及电子设备
CN111177339A (zh) 对话生成方法、装置、电子设备及存储介质
CN113516491B (zh) 推广信息展示方法、装置、电子设备及存储介质
CN111666771B (zh) 文书的语义标签抽取、装置、电子设备及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant