CN106649760A - 基于深度问答的提问型搜索词搜索方法及装置 - Google Patents
基于深度问答的提问型搜索词搜索方法及装置 Download PDFInfo
- Publication number
- CN106649760A CN106649760A CN201611222771.0A CN201611222771A CN106649760A CN 106649760 A CN106649760 A CN 106649760A CN 201611222771 A CN201611222771 A CN 201611222771A CN 106649760 A CN106649760 A CN 106649760A
- Authority
- CN
- China
- Prior art keywords
- feature
- search word
- page info
- answer
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2457—Query processing with adaptation to user needs
- G06F16/24578—Query processing with adaptation to user needs using ranking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2455—Query execution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3347—Query execution using vector based model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/10—Machine learning using kernel methods, e.g. support vector machines [SVM]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提出一种基于深度问答的提问型搜索词的搜索方法和装置,其中,方法包括:通过对搜索词进行识别,确定搜索词为提问型的搜索词之后,从数据库中查询与该搜索词匹配的页面信息。进而根据各特征,对页面信息进行多特征分析,得到各特征的特征分值,并根据各特征的特征分值,对页面信息进行排序后进行展示。由于多个特征用于从多个维度评价页面信息回答所述搜索词所提问题的有效性,因此,能够将回答搜索词所提问题的页面信息展示给用户,避免了用户逐个查询的过程,解决了现有技术中搜索效率较差的技术问题。
Description
技术领域
本发明涉及信息搜索技术领域,尤其涉及一种基于深度问答的提问型搜索词搜索方法及装置。
背景技术
深度问答(Deep question and answer),是指理解人类的语言,智能识别问题的含义,并从海量的互联网数据中针对问题提取答案的技术。
在现有技术的信息搜索过程中,用户可以自行设置搜索词,从而搜索引擎根据搜索词进行搜索,将搜索结果返回给用户。在搜索引擎运行的过程中,发明人发现:用户在一些情况下会提出一个问题作为搜索词,也就是说搜索词为提问型搜索词,在这种情况下,往往搜索结果与问题的答案相关性不高,用户在获取问题的答案时,还需要首先通过在搜索结果中点击相关链接,以查看页面中的具体内容,进而用户还需要自行总结归纳出问题的答案,因此,现有技术中,针对提问型搜索词进行搜索时搜索效率较差。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本发明的第一个目的在于提出一种基于深度问答的提问型搜索词的搜索方法,以解决现有技术中在采用提问型搜索词进行搜索时,搜索效率较差的技术问题。
本发明的第二个目的在于提出一种提问型搜索词的搜索装置。
本发明的第三个目的在于提出另一种提问型搜索词的搜索装置。
本发明的第四个目的在于提出一种非临时性计算机可读存储介质。
本发明的第五个目的在于提出一种计算机程序产品。
为达上述目的,本发明第一方面实施例提出了一种基于深度问答的提问型搜索词的搜索方法,包括:
对搜索词进行识别,确定所述搜索词为提问型的搜索词;
从数据库中查询与所述搜索词匹配的页面信息;
根据各特征,对所述页面信息进行多特征分析,得到各特征的特征分值;所述特征用于评价页面信息回答所述搜索词所提问题的有效性;
根据各特征的特征分值,对所述页面信息进行排序;
依据所述排序,对所述页面信息进行展示。
本发明实施例的基于深度问答的提问型搜索词的搜索方法,通过对搜索词进行识别,确定搜索词为提问型的搜索词之后,从数据库中查询与该搜索词匹配的页面信息。进而根据各特征,对页面信息进行多特征分析,得到各特征的特征分值,并根据各特征的特征分值,对页面信息进行排序后进行展示。由于多个特征用于从多个维度评价页面信息回答所述搜索词所提问题的有效性,因此,能够将回答搜索词所提问题的页面信息展示给用户,避免了用户逐个查询的过程,解决了现有技术中搜索效率较差的技术问题。
为达上述目的,本发明第二方面实施例提出了一种基于深度问答的提问型搜索词的搜索装置,包括:
识别模块,用于对搜索词进行识别,确定所述搜索词为提问型的搜索词;
查询模块,用于从数据库中查询与所述搜索词匹配的页面信息;
分析模块,用于根据各特征,对所述页面信息进行多特征分析,得到各特征的特征分值;其中,所述特征用于评价页面信息回答所述搜索词所提问题的有效性;
排序模块,用于根据各特征的特征分值,对所述页面信息进行排序;
展示模块,用于依据所述排序,对所述页面信息进行展示。
本发明实施例的提问型搜索词的搜索装置,通过对搜索词进行识别,确定搜索词为提问型的搜索词之后,从数据库中查询与该搜索词匹配的页面信息。进而根据各特征,对页面信息进行多特征分析,得到各特征的特征分值,并根据各特征的特征分值,对页面信息进行排序后进行展示。由于多个特征用于从多个维度评价页面信息回答所述搜索词所提问题的有效性,因此,能够将回答搜索词所提问题的页面信息展示给用户,避免了用户逐个查询的过程,解决了现有技术中搜索效率较差的技术问题。
为达上述目的,本发明第三方面实施例提出了另一种提问型搜索词的搜索装置,包括:处理器;用于存储所述处理器可执行指令的存储器;其中,所述处理器被配置为:
对搜索词进行识别,确定所述搜索词为提问型的搜索词;
从数据库中查询与所述搜索词匹配的页面信息;
根据各特征,对所述页面信息进行多特征分析,得到各特征的特征分值;其中,所述特征用于评价页面信息回答所述搜索词所提问题的有效性;
根据各特征的特征分值,对所述页面信息进行排序;
依据所述排序,对所述页面信息进行展示。
为了实现上述目的,本发明第四方面实施例提出了一种非临时性计算机可读存储介质,当所述存储介质中的指令由服务器的处理器被执行时,使得服务器能够执行一种提问型搜索词的搜索方法,所述方法包括:
对搜索词进行识别,确定所述搜索词为提问型的搜索词;
从数据库中查询与所述搜索词匹配的页面信息;
根据各特征,对所述页面信息进行多特征分析,得到各特征的特征分值;其中,所述特征用于评价页面信息回答所述搜索词所提问题的有效性;
根据各特征的特征分值,对所述页面信息进行排序;
依据所述排序,对所述页面信息进行展示。
为了实现上述目的,本发明第五方面实施例提出了一种计算机程序产品,当所述计算机程序产品中的指令处理器执行时,执行一种提问型搜索词的搜索方法,所述方法包括:
对搜索词进行识别,确定所述搜索词为提问型的搜索词;
从数据库中查询与所述搜索词匹配的页面信息;
根据各特征,对所述页面信息进行多特征分析,得到各特征的特征分值;其中,所述特征用于评价页面信息回答所述搜索词所提问题的有效性;
根据各特征的特征分值,对所述页面信息进行排序;
依据所述排序,对所述页面信息进行展示。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本发明实施例所提供的一种基于深度问答的提问型搜索词的搜索方法的流程示意图;
图2为搜索结果的示意图;
图3为本发明实施例提供的一种提问型搜索词的搜索装置的结构示意图;
图4为本发明实施例提供的又一种提问型搜索词的搜索装置的结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
下面参考附图描述本发明实施例的提问型搜索词的搜索方法和装置。其中,提问型搜索词是指用于提出问题以搜索到该问题的答案的搜索词。
图1为本发明实施例所提供的一种基于深度问答的提问型搜索词的搜索方法的流程示意图。
如图1所示,该基于深度问答的提问型搜索词的搜索方法包括:
步骤101,对搜索词进行识别,确定所述搜索词为提问型的搜索词。
具体地,为了确定哪些搜索词是在提出问题,需要对每个搜索词进行识别。经过识别步骤后,可以确切的知道搜索词是不是提出问题的提问型的搜索词。具体来说,可以根据所述搜索词中所包含的疑问词,和/或所述搜索词中的问答型结尾词,和/或所述搜索词的匹配的页面中属于问答型页面的比例,识别所述搜索词是否为提问型的搜索词。
例如:判断搜索词是不是提出问题的提问型的搜索词,主要通过搜索词的内容,和搜索词所搜索到的结果两种数据来判断,先对搜索词进行分词,判断搜索词中是否有疑问词,若有疑问词,则搜索词属于提问型的搜索词;若没有疑问词,则进一步判断搜索词的结尾词是否为具有查询意图的问答型结尾词,如搜索词为河南省省长,结尾词为省长,可以判断用户有搜索河南省省长是谁的查询意图;如果结尾词不是问答型结尾词,则进一步判断搜索结果中是否含有较多的问答型页面,如果搜索结果中具有很多问答型页面,则说明搜索引擎判断用户有查询意图,则确定该搜索词为提问型的搜索词。
进一步,在确切的知道搜索词是不是提出问题的提问型的搜索词之后,可以继续识别提出的问题属于那种类型、提出的问题答案是否唯一等等更详细的信息。
具体地,可以在识别所述搜索词是否为提问型的搜索词之后,针对提问型的搜索词,采用预先训练的支持向量机模型,继续识别,得到所述搜索词的问题类型和/或答案是否唯一等相关信息。
例如:判断搜索词的问题类型和/或答案是否唯一,主要通过如下方式。可以离线查询大量的历史搜索词并进行标注,标注该历史搜索词的问题类型、答案是否唯一,并根据历史搜索词的分词、历史搜索词的词性标注以及历史搜索词是否具有疑问词等作为参数,对支持向量机模型进行训练。通过训练好的模型,对当前在线搜索的搜索词识别问题类型和答案是否唯一。
需要说明是,这里的问题类型可以包括如何、为什么、什么时候、是否等等。
步骤102,从数据库中查询与搜索词匹配的页面信息。
具体地,数据库为离线数据库,数据库中所记载的页面信息包括:对页面进行实体抽取得到的实体数据;和/或,对页面中包含答案的段落进行抽取得到的分段数据;和/或,从问答型页面中对包含问题的段落,以及包含答案的段落以预设结构化方式进行组织所得到的结构化数据。
数据库是在执行步骤101之前已经预先建立的,作为一种可能的实现方式,可以将全网数据进行实体抽取,然后以数据库形式存入实体数据。同时,对于页面的超文本标记语言(HTML)信息,对页面划分为语义上相互独立的段落,抽取出包含答案的段落作为分段数据。另外,还可以从问答型网站中的各个问答型页面中,将每一个问答中的问题和答案,以预设结构化方式进行组织所得到的结构化数据。
步骤103,根据各特征,对所述页面信息进行多特征分析,得到各特征的特征分值。
其中,特征用于评价页面信息回答所述搜索词所提问题的有效性。
具体地,特征可以包括深度卷积神经网络(DNN)特征、数字特征、聚合特征、实体特征、对齐特征、长度特征和位置特征中的一个或多个组合。
步骤104,根据各特征的特征分值,对页面信息进行排序。
具体地,综合考虑各个特征的特征分值,计算得到页面信息的分值,从而依据页面信息的分值对页面信息进行排序。页面信息的分值越高说明页面信息回答所述搜索词所提问题的有效性越高,也就是说能够有效回答问题,相反地,页面信息的分值越低说明页面信息回答所述搜索词所提问题的有效性越低,也就是说不能够有效回答问题。在进行排序时,将能够有效回答问题的页面信息排在前面。
作为一种可能的实现方式,可以具体通过对各特征的特征分值进行加权求和,得到各个页面信息的总分值,根据总分值对所述页面信息进行排序。其中,位置特征和长度特征的权重为用于指示搜索词与页面信息的匹配程度的搜索相关度。
需要说明的是,搜索词与页面信息的匹配程度,可以是字面匹配程度也可以是语义匹配程度,本实施例中对此不作限定。
例如:可以采用公式score=w1×digit+w2×entity+w3×alignment+w4×aggregation+w5×dnn+w6×list+sim_score×(pos_weight+require_score+len_score)进行总分值的计算。
w1、w2、w3、w4、w5和w6为对应的各特征人工指定的权重,digit为数字特征的特征分值,entity为实体特征的特征分值,alignment为对齐特征的特征分值,aggregation为聚合特征的特征分值,dnn为深度神经网络特征的特征分值,list为列表特征的特征分值,sim_score为搜索相关度,pos_weight为位置特征的特征分值,require为用户问答需求分值,len_score为长度特征的特征分值。其中,用户问答需求分值用于指示用户所提供的搜索词的问答性需求的强烈程度。需要说明的是,一般来说,分值越高,分值对应的特征就越显著,如对于用户问答需求分值来说,用户问答需求分值越高,用户的问答需求就越强烈。
作为另一种可能的实现方式,可以具体通过对将各个特征的特征分值输入依据用户排序需求预先进行训练的排序模型,得到所述页面信息的排序。
例如:可以首先标注一批人工排序的数据作为样本,该数据的排序满足用户对于排序结果质量的需求,通过这个样本进行前述特征分析得到特征分值后,输入排序模块,对排序模型进行训练。然后在线利用训练好的排序模型,输入在线对页面信息进行特征分析获得的特征分值,由排序模型输出页面信息的排序。
步骤105,依据排序,对页面信息进行展示。
将排序在前的页面信息在搜索结果页面上进行展示。作为一种可能的实现方式,可以取排序在前若干位的页面信息,在搜索结果页面上,作为摘要进行显示。图2为搜索结果的示意图,如图2所示,可以直接对包含答案的页面信息进行展示,避免了用户点击查询的过程。
本实施例中,通过对搜索词进行识别,确定搜索词为提问型的搜索词之后,从数据库中查询与该搜索词匹配的页面信息。进而根据各特征,对页面信息进行多特征分析,得到各特征的特征分值,并根据各特征的特征分值,对页面信息进行排序后进行展示。由于多个特征用于从多个维度评价页面信息回答所述搜索词所提问题的有效性,因此,能够将回答搜索词所提问题的页面信息展示给用户,避免了用户逐个查询的过程,解决了现有技术中搜索效率较差的技术问题。
为了清楚说明上一实施例,本实施例中将对步骤103中根据各特征,对所述页面信息进行多特征分析,得到各特征的特征分值的过程进行详细说明。
需要说明的是,这里的页面信息可以是实体数据、分段数据还可以是结构化数据,具体参见前述步骤102中的相关描述,此处不再赘述。
可选地,在特征具体为深度卷积神经网络特征时,根据页面信息中的单词,以及当前的搜索词,利用深度卷积神经网络进行问题答案对的匹配,以确定出页面信息的第一特征分值。其中,深度卷积神经网络已预先对问题和答案之间的匹配程度进行学习,深度卷积神经网络所计算出的第一特征分值,可以用于指示页面信息是否在回答问题。
可选地,在特征具体为数字特征时,当所述搜索词所提问题的答案为数字形式时,依据度量单位抽取各个页面信息中的数字答案;若所述搜索词所需查询的数字答案为约数,则对抽取出的数字答案进行单遍聚类,得到每一个聚簇的分值;若所述搜索词所需查询的数字答案为确定的数值,则对抽取出的数据答案进行字面值聚类,得到每一个聚簇的分值;将所述聚簇的分值作为包含所述聚簇中数字答案的页面信息的第二特征分值。
可见,数字特征主要着眼于对答案为数字的搜索词,根据搜索词的问题类型判断用户需要什么样的数字答案,例如:搜索词为“南京到北京多少公里”,则数字答案可能为某某公里、某某米等,根据单位信息抽取可能存在的数字答案,并对这些数字答案的单位和表述进行归一化,如果搜索词所需查询的数字答案为约数,比如南京到北京多少公里,没有确定的距离,则对这些数字答案进行单遍聚类,如果搜索词所需查询的数字答案为确定的数值,比如刘德华年龄是多少,则对这些数字答案进行字面值聚类。
可选地,特征包括聚合特征时,可以利用统计单词出现频次的算法,例如,文本分类(textrank)算法,对页面信息所包含的各单词进行打分,得到用于指示各单词出现频次的分值;根据用于指示各单词出现频次的分值,确定包含所述单词的页面信息的第三特征分值。
聚合特征主要着眼于答案的字面值共现信息,如果是比较确定的答案,那么网页中会有某些词被提及的频率高,例如:搜索词为“***的老婆”,网页内容中该人妻子名字出现的频率会很多,根据高频词确定出包含答案的页面信息。
可选地,特征包括实体特征时,可以根据所述搜索词所提问题,估计所述用户的查询意图;依据所述页面信息中的实体数据,对所述页面信息的各实体进行聚类,从而对这些实体信息是否能满足用户查询意图进行判别,得到用于指示各实体数据能够满足所述查询意图的程度的第四特征分值。
可选地,特征包括对齐特征,可以利用对齐模型,将所述搜索词与页面信息中的段落进行对齐,得到包含所述段落的页面信息的第五特征分值;其中,所述对齐模型已预先对问题和答案中单词的词对齐情况进行学习。
可见,这里是将机器翻译中的词对齐、短语对齐及句式对齐的方法引入到了提问型搜索词的搜索方法中。可以在离线训练的过程中,利用对齐模型学习搜索词和答案的词的对齐特征等,在线通过该模型对这些页面信息的分段数据进行打分。
可选地,特征包括长度特征时,可以对所述页面信息的长度特征进行分析,得到用于指示页面信息所包含内容的丰富程度的第六特征分值。
可选地,特征包括位置特征时,可以对所述页面信息的位置特征进行分析,得到用于指示页面信息在搜索词匹配的全部页面信息中的排序情况的第七特征分值;所述排序依据所述搜索词与页面信息的匹配程度。
需要说明是,这里的长度特征和位置特征还可以统称为基础特征。
本实施例中,由于通过采用了多个特征,从多个维度评价页面信息回答所述搜索词所提问题的有效性,因此,能够将回答搜索词所提问题的页面信息展示给用户,避免了用户逐个查询的过程,解决了现有技术中搜索效率较差的技术问题。
为了实现上述实施例,本发明还提出一种提问型搜索词的搜索装置。
图3为本发明实施例提供的一种提问型搜索词的搜索装置的结构示意图,如图3所示,包括:识别模块31、查询模块32、分析模块33、排序模块34和展示模块35。
识别模块31,用于对搜索词进行识别,确定所述搜索词为提问型的搜索词。
查询模块32,用于从数据库中查询与所述搜索词匹配的页面信息。
其中,数据库为离线数据库,所述数据库中所记载的页面信息包括:对页面进行实体抽取得到的实体数据;和/或,对页面中包含答案的段落进行抽取得到的分段数据;和/或,从问答型页面中对包含问题的段落,以及包含答案的段落以预设结构化方式进行组织所得到的结构化数据。
分析模块33,用于根据各特征,对所述页面信息进行多特征分析,得到各特征的特征分值。
其中,所述特征用于评价页面信息回答所述搜索词所提问题的有效性。
排序模块34,用于根据各特征的特征分值,对所述页面信息进行排序。
具体地,排序模块34,具体用于:对各特征的特征分值进行加权求和,得到各个页面信息的总分值,根据总分值对所述页面信息进行排序;其中,位置特征和长度特征的权重为用于指示所述搜索词与页面信息的匹配程度的搜索相关度。
或者,排序模块34将各个特征的特征分值输入依据用户排序需求预先进行训练的排序模型,得到所述页面信息的排序。
展示模块35,用于依据所述排序,对所述页面信息进行展示。
本实施例中,提问型搜索词的搜索装置通过对搜索词进行识别,确定搜索词为提问型的搜索词之后,从数据库中查询与该搜索词匹配的页面信息。进而根据各特征,对页面信息进行多特征分析,得到各特征的特征分值,并根据各特征的特征分值,对页面信息进行排序后进行展示。由于多个特征用于从多个维度评价页面信息回答所述搜索词所提问题的有效性,因此,能够将回答搜索词所提问题的页面信息展示给用户,避免了用户逐个查询的过程,解决了现有技术中搜索效率较差的技术问题。
在上一实施例的基础上,本实施例中的特征包括:深度卷积神经网络特征、数字特征、聚合特征、实体特征、对齐特征、长度特征和位置特征。
基于此,图4为本发明实施例提供的又一种提问型搜索词的搜索装置的结构示意图,如图4所示,分析模块33包括:第一分析单元331、第二分析单元332、第三分析单元333、第四分析单元334、第五分析单元335、第六分析单元336和第七分析单元337。
第一分析单元331,用于根据所述页面信息中的单词,以及所述搜索词,利用深度卷积神经网络进行问题答案对的匹配,以确定出所述页面信息的第一特征分值;所述深度卷积神经网络已预先对问题和答案之间的匹配程度进行学习。
第二分析单元332,用于当所述搜索词所提问题的答案为数字形式时,依据度量单位抽取各个页面信息中的数字答案;若所述搜索词所需查询的数字答案为约数,则对抽取出的数字答案进行单遍聚类,得到每一个聚簇的分值;若所述搜索词所需查询的数字答案为确定的数值,则对抽取出的数据答案进行字面值聚类,得到每一个聚簇的分值;将所述聚簇的分值作为包含所述聚簇中数字答案的页面信息的第二特征分值。
第三分析单元333,用于利用统计单词出现频次的算法,对页面信息所包含的各单词进行打分,得到用于指示各单词出现频次的分值;根据用于指示各单词出现频次的分值,确定包含所述单词的页面信息的第三特征分值。
第四分析单元334,用于根据所述搜索词所提问题,估计所述用户的查询意图;依据所述页面信息中的实体数据,对所述页面信息的各实体进行聚类,得到用于指示各实体数据能够满足所述查询意图的程度的第四特征分值。
第五分析单元335,用于利用对齐模型,将所述搜索词与页面信息中的段落进行对齐,得到包含所述段落的页面信息的第五特征分值;其中,所述对齐模型已预先对问题和答案中单词的词对齐情况进行学习。
第六分析单元336,用于对所述页面信息的长度特征进行分析,得到用于指示页面信息所包含内容的丰富程度的第六特征分值。
第七分析单元337,用于对所述页面信息的位置特征进行分析,得到用于指示页面信息在搜索词匹配的全部页面信息中的排序情况的第七特征分值;所述排序依据所述搜索词与页面信息的匹配程度。
进一步地,在本发明实施例的一种可能的实现方式中,如图4所示,识别模块31,包括:第一识别单元311和第二识别单元312。
第一识别单元311,用于根据所述搜索词中所包含的疑问词,和/或所述搜索词中的问答型结尾词,和/或所述搜索词的匹配的页面中属于问答型页面的比例,识别所述搜索词是否为提问型的搜索词。
第二识别单元312,用于针对提问型的搜索词,采用预先训练的支持向量机模型,识别得到所述搜索词的问题类型和/或答案是否唯一。
本发明实施例中,提问型搜索词的搜索装置,通过对搜索词进行识别,确定搜索词为提问型的搜索词之后,从数据库中查询与该搜索词匹配的页面信息。进而根据各特征,对页面信息进行多特征分析,得到各特征的特征分值,并根据各特征的特征分值,对页面信息进行排序后进行展示。由于多个特征用于从多个维度评价页面信息回答所述搜索词所提问题的有效性,因此,能够将回答搜索词所提问题的页面信息展示给用户,避免了用户逐个查询的过程,解决了现有技术中搜索效率较差的技术问题。
为了实现上述实施例,本发明还提出另一种提问型搜索词的搜索装置,包括:处理器,以及用于存储所述处理器可执行指令的存储器。
其中,处理器被配置为:对搜索词进行识别,确定所述搜索词为提问型的搜索词;从数据库中查询与所述搜索词匹配的页面信息;根据各特征,对所述页面信息进行多特征分析,得到各特征的特征分值;其中,所述特征用于评价页面信息回答所述搜索词所提问题的有效性;根据各特征的特征分值,对所述页面信息进行排序;依据所述排序,对所述页面信息进行展示。
为了实现上述实施例,本发明还提出一种非临时性计算机可读存储介质,当所述存储介质中的指令由处理器执行时,使得处理器能够执行一种提问型搜索词的搜索方法,所述方法包括:对搜索词进行识别,确定所述搜索词为提问型的搜索词;从数据库中查询与所述搜索词匹配的页面信息;根据各特征,对所述页面信息进行多特征分析,得到各特征的特征分值;其中,所述特征用于评价页面信息回答所述搜索词所提问题的有效性;根据各特征的特征分值,对所述页面信息进行排序;依据所述排序,对所述页面信息进行展示。
为了实现上述实施例,本发明还提出一种计算机程序产品,当所述计算机程序产品中的指令处理器执行时,执行一种提问型搜索词的搜索方法,所述方法包括:对搜索词进行识别,确定所述搜索词为提问型的搜索词;从数据库中查询与所述搜索词匹配的页面信息;根据各特征,对所述页面信息进行多特征分析,得到各特征的特征分值;其中,所述特征用于评价页面信息回答所述搜索词所提问题的有效性;根据各特征的特征分值,对所述页面信息进行排序;依据所述排序,对所述页面信息进行展示。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (24)
1.一种基于深度问答的提问型搜索词的搜索方法,其特征在于,包括以下步骤:
对搜索词进行识别,确定所述搜索词为提问型的搜索词;
从数据库中查询与所述搜索词匹配的页面信息;
根据各特征,对所述页面信息进行多特征分析,得到各特征的特征分值;其中,所述特征用于评价页面信息回答所述搜索词所提问题的有效性;
根据各特征的特征分值,对所述页面信息进行排序;
依据所述排序,对所述页面信息进行展示。
2.根据权利要求1所述的提问型搜索词的搜索方法,其特征在于,所述数据库为离线数据库,所述数据库中所记载的页面信息包括:
对页面进行实体抽取得到的实体数据;
和/或,对页面中包含答案的段落进行抽取得到的分段数据;
和/或,从问答型页面中对包含问题的段落,以及包含答案的段落以预设结构化方式进行组织所得到的结构化数据。
3.根据权利要求1所述的提问型搜索词的搜索方法,其特征在于,所述特征包括深度卷积神经网络特征,所述对所述页面信息进行多特征分析,得到各特征的特征分值,包括:
根据所述页面信息中的单词,以及所述搜索词,利用深度卷积神经网络进行问题答案对的匹配,以确定出所述页面信息的第一特征分值;所述深度卷积神经网络已预先对问题和答案之间的匹配程度进行学习。
4.根据权利要求1所述的提问型搜索词的搜索方法,其特征在于,所述特征包括数字特征,所述对所述页面信息进行多特征分析,得到各特征的特征分值,包括:
当所述搜索词所提问题的答案为数字形式时,依据度量单位抽取各个页面信息中的数字答案;
若所述搜索词所需查询的数字答案为约数,则对抽取出的数字答案进行单遍聚类,得到每一个聚簇的分值;若所述搜索词所需查询的数字答案为确定的数值,则对抽取出的数据答案进行字面值聚类,得到每一个聚簇的分值;
将所述聚簇的分值作为包含所述聚簇中数字答案的页面信息的第二特征分值。
5.根据权利要求1所述的提问型搜索词的搜索方法,其特征在于,所述特征包括聚合特征,所述对所述页面信息进行多特征分析,得到各特征的特征分值,包括:
利用统计单词出现频次的算法,对页面信息所包含的各单词进行打分,得到用于指示各单词出现频次的分值;
根据用于指示各单词出现频次的分值,确定包含所述单词的页面信息的第三特征分值。
6.根据权利要求1所述的提问型搜索词的搜索方法,其特征在于,所述特征包括实体特征,所述对所述页面信息进行多特征分析,得到各特征的特征分值,包括:
根据所述搜索词所提问题,估计所述用户的查询意图;
依据所述页面信息中的实体数据,对所述页面信息的各实体进行聚类,得到用于指示各实体数据能够满足所述查询意图的程度的第四特征分值。
7.根据权利要求1所述的提问型搜索词的搜索方法,其特征在于,所述特征包括对齐特征,所述对所述页面信息进行多特征分析,得到各特征的特征分值,包括:
利用对齐模型,将所述搜索词与页面信息中的段落进行对齐,得到包含所述段落的页面信息的第五特征分值;其中,所述对齐模型已预先对问题和答案中单词的词对齐情况进行学习。
8.根据权利要求1所述的提问型搜索词的搜索方法,其特征在于,所述特征包括长度特征,所述对所述页面信息进行多特征分析,得到各特征的特征分值,包括:
对所述页面信息的长度特征进行分析,得到用于指示页面信息所包含内容的丰富程度的第六特征分值。
9.根据权利要求1所述的提问型搜索词的搜索方法,其特征在于,所述特征包括位置特征,所述对所述页面信息进行多特征分析,得到各特征的特征分值,包括:
对所述页面信息的位置特征进行分析,得到用于指示页面信息在搜索词匹配的全部页面信息中的排序情况的第七特征分值;所述排序依据所述搜索词与页面信息的匹配程度。
10.根据权利要求1-9任一项所述的提问型搜索词的搜索方法,其特征在于,所述对搜索词进行识别,确定所述搜索词为提问型的搜索词,包括:
根据所述搜索词中所包含的疑问词,和/或所述搜索词中的问答型结尾词,和/或所述搜索词的匹配的页面中属于问答型页面的比例,识别所述搜索词是否为提问型的搜索词。
11.根据权利要求10所述的提问型搜索词的搜索方法,其特征在于,所述识别所述搜索词是否为提问型的搜索词之后,还包括:
针对提问型的搜索词,采用预先训练的支持向量机模型,识别得到所述搜索词的问题类型和/或答案是否唯一。
12.根据权利要求1-9任一项所述的提问型搜索词的搜索方法,其特征在于,所述根据各特征的特征分值,对所述页面信息进行排序,包括:
对各特征的特征分值进行加权求和,得到各个页面信息的总分值,根据总分值对所述页面信息进行排序;其中,位置特征和长度特征的权重为用于指示所述搜索词与页面信息的匹配程度的搜索相关度;
或者,将各个特征的特征分值输入依据用户排序需求预先进行训练的排序模型,得到所述页面信息的排序。
13.一种基于深度问答的提问型搜索词的搜索装置,其特征在于,包括:
识别模块,用于对搜索词进行识别,确定所述搜索词为提问型的搜索词;
查询模块,用于从数据库中查询与所述搜索词匹配的页面信息;
分析模块,用于根据各特征,对所述页面信息进行多特征分析,得到各特征的特征分值;其中,所述特征用于评价页面信息回答所述搜索词所提问题的有效性;
排序模块,用于根据各特征的特征分值,对所述页面信息进行排序;
展示模块,用于依据所述排序,对所述页面信息进行展示。
14.根据权利要求13所述的提问型搜索词的搜索装置,其特征在于,所述数据库为离线数据库,所述数据库中所记载的页面信息包括:
对页面进行实体抽取得到的实体数据;
和/或,对页面中包含答案的段落进行抽取得到的分段数据;
和/或,从问答型页面中对包含问题的段落,以及包含答案的段落以预设结构化方式进行组织所得到的结构化数据。
15.根据权利要求13所述的提问型搜索词的搜索装置,其特征在于,所述特征包括深度卷积神经网络特征,所述分析模块,包括:
第一分析单元,用于根据所述页面信息中的单词,以及所述搜索词,利用深度卷积神经网络进行问题答案对的匹配,以确定出所述页面信息的第一特征分值;所述深度卷积神经网络已预先对问题和答案之间的匹配程度进行学习。
16.根据权利要求13所述的提问型搜索词的搜索装置,其特征在于,所述特征包括数字特征,所述分析模块,包括:
第二分析单元,用于当所述搜索词所提问题的答案为数字形式时,依据度量单位抽取各个页面信息中的数字答案;若所述搜索词所需查询的数字答案为约数,则对抽取出的数字答案进行单遍聚类,得到每一个聚簇的分值;若所述搜索词所需查询的数字答案为确定的数值,则对抽取出的数据答案进行字面值聚类,得到每一个聚簇的分值;将所述聚簇的分值作为包含所述聚簇中数字答案的页面信息的第二特征分值。
17.根据权利要求13所述的提问型搜索词的搜索装置,其特征在于,所述特征包括聚合特征,所述分析模块,包括:
第三分析单元,用于利用统计单词出现频次的算法,对页面信息所包含的各单词进行打分,得到用于指示各单词出现频次的分值;根据用于指示各单词出现频次的分值,确定包含所述单词的页面信息的第三特征分值。
18.根据权利要求13所述的提问型搜索词的搜索装置,其特征在于,所述特征包括实体特征,所述分析模块,包括:
第四分析单元,用于根据所述搜索词所提问题,估计所述用户的查询意图;依据所述页面信息中的实体数据,对所述页面信息的各实体进行聚类,得到用于指示各实体数据能够满足所述查询意图的程度的第四特征分值。
19.根据权利要求13所述的提问型搜索词的搜索装置,其特征在于,所述特征包括对齐特征,所述分析模块,包括:
第五分析单元,用于利用对齐模型,将所述搜索词与页面信息中的段落进行对齐,得到包含所述段落的页面信息的第五特征分值;其中,所述对齐模型已预先对问题和答案中单词的词对齐情况进行学习。
20.根据权利要求13所述的提问型搜索词的搜索装置,其特征在于,所述特征包括长度特征,所述分析模块,包括:
第六分析单元,用于对所述页面信息的长度特征进行分析,得到用于指示页面信息所包含内容的丰富程度的第六特征分值。
21.根据权利要求13所述的提问型搜索词的搜索装置,其特征在于,所述特征包括位置特征,所述分析模块,包括:
第七分析单元,用于对所述页面信息的位置特征进行分析,得到用于指示页面信息在搜索词匹配的全部页面信息中的排序情况的第七特征分值;所述排序依据所述搜索词与页面信息的匹配程度。
22.根据权利要求13-21任一项所述的提问型搜索词的搜索装置,其特征在于,所述识别模块,包括:
第一识别单元,用于根据所述搜索词中所包含的疑问词,和/或所述搜索词中的问答型结尾词,和/或所述搜索词的匹配的页面中属于问答型页面的比例,识别所述搜索词是否为提问型的搜索词。
23.根据权利要求22所述的提问型搜索词的搜索装置,其特征在于,所述识别模块,还包括:
第二识别单元,用于针对提问型的搜索词,采用预先训练的支持向量机模型,识别得到所述搜索词的问题类型和/或答案是否唯一。
24.根据权利要求13-21任一项所述的提问型搜索词的搜索装置,其特征在于,所述排序模块,具体用于:
对各特征的特征分值进行加权求和,得到各个页面信息的总分值,根据总分值对所述页面信息进行排序;其中,位置特征和长度特征的权重为用于指示所述搜索词与页面信息的匹配程度的搜索相关度;
或者,将各个特征的特征分值输入依据用户排序需求预先进行训练的排序模型,得到所述页面信息的排序。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611222771.0A CN106649760A (zh) | 2016-12-27 | 2016-12-27 | 基于深度问答的提问型搜索词搜索方法及装置 |
US15/648,877 US10831769B2 (en) | 2016-12-27 | 2017-07-13 | Search method and device for asking type query based on deep question and answer |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611222771.0A CN106649760A (zh) | 2016-12-27 | 2016-12-27 | 基于深度问答的提问型搜索词搜索方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106649760A true CN106649760A (zh) | 2017-05-10 |
Family
ID=58831509
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201611222771.0A Pending CN106649760A (zh) | 2016-12-27 | 2016-12-27 | 基于深度问答的提问型搜索词搜索方法及装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US10831769B2 (zh) |
CN (1) | CN106649760A (zh) |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107301170A (zh) * | 2017-06-19 | 2017-10-27 | 北京百度网讯科技有限公司 | 基于人工智能的切分语句的方法和装置 |
CN107895000A (zh) * | 2017-10-30 | 2018-04-10 | 昆明理工大学 | 一种基于卷积神经网络的跨领域语义信息检索方法 |
CN108536791A (zh) * | 2018-03-30 | 2018-09-14 | 北京百度网讯科技有限公司 | 基于神经网络的搜索方法、设备及存储介质 |
CN108829719A (zh) * | 2018-05-07 | 2018-11-16 | 中国科学院合肥物质科学研究院 | 一种非事实类问答答案选择方法及系统 |
CN109241031A (zh) * | 2018-08-14 | 2019-01-18 | 腾讯科技(深圳)有限公司 | 模型生成方法、模型使用方法、装置、系统及存储介质 |
CN109582773A (zh) * | 2018-11-29 | 2019-04-05 | 深圳爱问科技股份有限公司 | 智能问答匹配方法及装置 |
CN110222260A (zh) * | 2019-05-21 | 2019-09-10 | 深圳壹账通智能科技有限公司 | 一种搜索方法、装置及存储介质 |
CN110297897A (zh) * | 2019-06-21 | 2019-10-01 | 科大讯飞(苏州)科技有限公司 | 问答处理方法及相关产品 |
CN110580313A (zh) * | 2018-06-08 | 2019-12-17 | 北京搜狗科技发展有限公司 | 一种数据处理方法、装置和用于数据处理的装置 |
CN111125387A (zh) * | 2019-12-12 | 2020-05-08 | 科大讯飞股份有限公司 | 多媒体列表生成、命名方法、装置、电子设备和存储介质 |
CN112784141A (zh) * | 2019-10-23 | 2021-05-11 | 腾讯科技(深圳)有限公司 | 搜索结果质量确定方法、装置、存储介质和计算机设备 |
CN113287175A (zh) * | 2018-11-30 | 2021-08-20 | 蒋荣先 | 互动式健康状态评估方法及其系统 |
CN113792209A (zh) * | 2021-08-13 | 2021-12-14 | 唯品会(广州)软件有限公司 | 搜索词生成方法、系统及计算机可读存储介质 |
CN116842128A (zh) * | 2023-09-01 | 2023-10-03 | 合肥机数量子科技有限公司 | 一种文本关系抽取方法、装置、计算机设备及存储介质 |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180341716A1 (en) * | 2017-05-26 | 2018-11-29 | Microsoft Technology Licensing, Llc | Suggested content generation |
CN112673367A (zh) | 2018-10-31 | 2021-04-16 | 华为技术有限公司 | 用于预测用户意图的电子设备和方法 |
US10853394B2 (en) * | 2018-11-02 | 2020-12-01 | Optum, Inc. | Method, apparatus and computer program product for a hybrid question-answering (QA) system with a question classification model |
US11921761B2 (en) | 2018-11-02 | 2024-03-05 | Optum, Inc. | Method, apparatus and computer program product for improving deep question-answering (QA) applications using feedback from retrieval QA applications |
CN113536156B (zh) * | 2020-04-13 | 2024-05-28 | 百度在线网络技术(北京)有限公司 | 搜索结果排序方法、模型构建方法、装置、设备和介质 |
US11556806B2 (en) | 2020-05-14 | 2023-01-17 | Merative Us L.P. | Using machine learning to facilitate design and implementation of a clinical trial with a high likelihood of success |
US11651243B2 (en) | 2020-05-14 | 2023-05-16 | Merative Us L.P. | Using machine learning to evaluate data quality during a clinical trial based on participant queries |
US11538559B2 (en) | 2020-05-14 | 2022-12-27 | Merative Us L.P. | Using machine learning to evaluate patients and control a clinical trial |
JP7364065B2 (ja) * | 2020-05-20 | 2023-10-18 | 日本電信電話株式会社 | 推定装置、学習装置、推定方法、学習方法及びプログラム |
CN111858854B (zh) * | 2020-07-20 | 2024-03-19 | 上海汽车集团股份有限公司 | 一种基于历史对话信息的问答匹配方法及相关装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090106203A1 (en) * | 2007-10-18 | 2009-04-23 | Zhongmin Shi | Method and apparatus for a web search engine generating summary-style search results |
CN104636465A (zh) * | 2015-02-10 | 2015-05-20 | 百度在线网络技术(北京)有限公司 | 网页摘要生成方法、展示方法及相应装置 |
CN105677764A (zh) * | 2015-12-30 | 2016-06-15 | 百度在线网络技术(北京)有限公司 | 信息提取方法和装置 |
CN105975639A (zh) * | 2016-07-04 | 2016-09-28 | 北京百度网讯科技有限公司 | 搜索结果排序方法和装置 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7937402B2 (en) * | 2006-07-10 | 2011-05-03 | Nec (China) Co., Ltd. | Natural language based location query system, keyword based location query system and a natural language and keyword based location query system |
US9886591B2 (en) * | 2015-02-10 | 2018-02-06 | International Business Machines Corporation | Intelligent governance controls based on real-time contexts |
US10169489B2 (en) * | 2015-03-02 | 2019-01-01 | International Business Machines Corporation | Query disambiguation in a question-answering environment |
-
2016
- 2016-12-27 CN CN201611222771.0A patent/CN106649760A/zh active Pending
-
2017
- 2017-07-13 US US15/648,877 patent/US10831769B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090106203A1 (en) * | 2007-10-18 | 2009-04-23 | Zhongmin Shi | Method and apparatus for a web search engine generating summary-style search results |
CN104636465A (zh) * | 2015-02-10 | 2015-05-20 | 百度在线网络技术(北京)有限公司 | 网页摘要生成方法、展示方法及相应装置 |
CN105677764A (zh) * | 2015-12-30 | 2016-06-15 | 百度在线网络技术(北京)有限公司 | 信息提取方法和装置 |
CN105975639A (zh) * | 2016-07-04 | 2016-09-28 | 北京百度网讯科技有限公司 | 搜索结果排序方法和装置 |
Cited By (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107301170A (zh) * | 2017-06-19 | 2017-10-27 | 北京百度网讯科技有限公司 | 基于人工智能的切分语句的方法和装置 |
CN107301170B (zh) * | 2017-06-19 | 2020-12-22 | 北京百度网讯科技有限公司 | 基于人工智能的切分语句的方法和装置 |
CN107895000A (zh) * | 2017-10-30 | 2018-04-10 | 昆明理工大学 | 一种基于卷积神经网络的跨领域语义信息检索方法 |
CN108536791A (zh) * | 2018-03-30 | 2018-09-14 | 北京百度网讯科技有限公司 | 基于神经网络的搜索方法、设备及存储介质 |
CN108829719A (zh) * | 2018-05-07 | 2018-11-16 | 中国科学院合肥物质科学研究院 | 一种非事实类问答答案选择方法及系统 |
CN108829719B (zh) * | 2018-05-07 | 2022-03-01 | 中国科学院合肥物质科学研究院 | 一种非事实类问答答案选择方法及系统 |
CN110580313A (zh) * | 2018-06-08 | 2019-12-17 | 北京搜狗科技发展有限公司 | 一种数据处理方法、装置和用于数据处理的装置 |
CN110580313B (zh) * | 2018-06-08 | 2024-02-02 | 北京搜狗科技发展有限公司 | 一种数据处理方法、装置和用于数据处理的装置 |
CN109241031A (zh) * | 2018-08-14 | 2019-01-18 | 腾讯科技(深圳)有限公司 | 模型生成方法、模型使用方法、装置、系统及存储介质 |
CN109582773A (zh) * | 2018-11-29 | 2019-04-05 | 深圳爱问科技股份有限公司 | 智能问答匹配方法及装置 |
CN109582773B (zh) * | 2018-11-29 | 2020-11-27 | 深圳爱问科技股份有限公司 | 智能问答匹配方法及装置 |
CN113287175B (zh) * | 2018-11-30 | 2024-03-19 | 蒋荣先 | 互动式健康状态评估方法及其系统 |
CN113287175A (zh) * | 2018-11-30 | 2021-08-20 | 蒋荣先 | 互动式健康状态评估方法及其系统 |
CN110222260A (zh) * | 2019-05-21 | 2019-09-10 | 深圳壹账通智能科技有限公司 | 一种搜索方法、装置及存储介质 |
WO2020233344A1 (zh) * | 2019-05-21 | 2020-11-26 | 深圳壹账通智能科技有限公司 | 一种搜索方法、装置及存储介质 |
CN110297897A (zh) * | 2019-06-21 | 2019-10-01 | 科大讯飞(苏州)科技有限公司 | 问答处理方法及相关产品 |
CN112784141A (zh) * | 2019-10-23 | 2021-05-11 | 腾讯科技(深圳)有限公司 | 搜索结果质量确定方法、装置、存储介质和计算机设备 |
CN112784141B (zh) * | 2019-10-23 | 2023-10-31 | 腾讯科技(深圳)有限公司 | 搜索结果质量确定方法、装置、存储介质和计算机设备 |
CN111125387B (zh) * | 2019-12-12 | 2023-04-07 | 科大讯飞股份有限公司 | 多媒体列表生成、命名方法、装置、电子设备和存储介质 |
CN111125387A (zh) * | 2019-12-12 | 2020-05-08 | 科大讯飞股份有限公司 | 多媒体列表生成、命名方法、装置、电子设备和存储介质 |
CN113792209A (zh) * | 2021-08-13 | 2021-12-14 | 唯品会(广州)软件有限公司 | 搜索词生成方法、系统及计算机可读存储介质 |
CN113792209B (zh) * | 2021-08-13 | 2024-02-02 | 唯品会(广州)软件有限公司 | 搜索词生成方法、系统及计算机可读存储介质 |
CN116842128A (zh) * | 2023-09-01 | 2023-10-03 | 合肥机数量子科技有限公司 | 一种文本关系抽取方法、装置、计算机设备及存储介质 |
CN116842128B (zh) * | 2023-09-01 | 2023-11-21 | 合肥机数量子科技有限公司 | 一种文本关系抽取方法、装置、计算机设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
US20180181573A1 (en) | 2018-06-28 |
US10831769B2 (en) | 2020-11-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106649760A (zh) | 基于深度问答的提问型搜索词搜索方法及装置 | |
CN110633373B (zh) | 一种基于知识图谱和深度学习的汽车舆情分析方法 | |
CN109829166B (zh) | 基于字符级卷积神经网络的民宿顾客意见挖掘方法 | |
CN106339756B (zh) | 训练数据的生成方法、搜索方法以及装置 | |
CN108280155B (zh) | 基于短视频的问题检索反馈方法、装置及其设备 | |
CN109726274B (zh) | 问题生成方法、装置及存储介质 | |
CN108763321B (zh) | 一种基于大规模相关实体网络的相关实体推荐方法 | |
CN103218436B (zh) | 一种融合用户类别标签的相似问题检索方法及装置 | |
CN105653562B (zh) | 一种文本内容与查询请求之间相关性的计算方法及装置 | |
CN106649786A (zh) | 基于深度问答的答案检索方法及装置 | |
CN106547871A (zh) | 基于神经网络的搜索结果的召回方法和装置 | |
CN108121702A (zh) | 数学主观题评阅方法及系统 | |
CN106294635B (zh) | 应用程序搜索方法、深度神经网络模型的训练方法及装置 | |
CN112270188B (zh) | 一种提问式的分析路径推荐方法、系统及存储介质 | |
CN106776869A (zh) | 基于神经网络的搜索优化方法、装置以及搜索引擎 | |
CN111639258B (zh) | 一种基于神经网络的新闻推荐方法 | |
CN109829045A (zh) | 一种问答方法和装置 | |
CN108052504A (zh) | 数学主观题解答结果的结构分析方法及系统 | |
CN105787662A (zh) | 基于属性的移动应用软件性能预测方法 | |
CN112395410A (zh) | 一种基于实体抽取的产业舆情推荐方法、装置及电子设备 | |
CN109582788A (zh) | 垃圾评论训练、识别方法、装置、设备及可读存储介质 | |
CN105975639A (zh) | 搜索结果排序方法和装置 | |
CN109992781A (zh) | 文本特征的处理、装置、存储介质和处理器 | |
CN111369294B (zh) | 软件造价估算方法及装置 | |
CN106462644A (zh) | 标识来自多个结果页面标识的优选结果页面 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170510 |
|
RJ01 | Rejection of invention patent application after publication |