CN110287487B - 主谓语识别方法、装置、设备及计算机可读存储介质 - Google Patents
主谓语识别方法、装置、设备及计算机可读存储介质 Download PDFInfo
- Publication number
- CN110287487B CN110287487B CN201910521578.4A CN201910521578A CN110287487B CN 110287487 B CN110287487 B CN 110287487B CN 201910521578 A CN201910521578 A CN 201910521578A CN 110287487 B CN110287487 B CN 110287487B
- Authority
- CN
- China
- Prior art keywords
- predicate
- determining
- subject
- entity
- score
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/3332—Query translation
- G06F16/3335—Syntactic pre-processing, e.g. stopword elimination, stemming
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/253—Grammatical analysis; Style critique
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Machine Translation (AREA)
Abstract
本公开提供一种主谓语识别方法、装置、设备及计算机可读存储介质,包括:通过主语预测模型确定用户问题中的至少一个预测主语,并确定预测主语的第一分值;根据预测主语在用户问题中确定对应的预测谓语,并通过谓语预测模型确定预测谓语的第二分值;根据第一分值、第二分值在预测主语、预测谓语的组合中,确定出目标主语、谓语的组合。本公开提供的方法、装置、设备及计算机可读存储介质,结合预测主语的第一分值以及预测谓语的第二分值,在预测组合中确定目标组合,使得识别的结果更为准确。同时,基于主语预测模型预测主语,基于谓语预测模型预测谓语,能够使本公开提供的方案适用于多种问答场景。
Description
技术领域
本公开涉及主谓语识别技术,尤其涉及一种主谓语识别方法、装置、设备及计算机可读存储介质。
背景技术
随着人工智能的发展,基于知识库对用户输入的问题自动进行答复成为了可能,这种问答方式能够节约人力资源,被越来越广泛的关注。
为了保证回复答案的准确性,首先需要对用户输入的问题中的主谓语进行准确识别。现有技术中,通过大量的人工挖掘匹配模式,再基于这种匹配模式对用户的问题进行逐词检索,从而识别用户问题中的主语和谓语,再基于识别结果搜寻这个问题的答案。
但是,这种方式存在需要人工挖掘匹配模式,这就导致现有技术的方案存在泛化能力不足,无法被应用于多种场合的技术问题。
发明内容
本公开提供一种主谓语识别方法、装置、设备及计算机可读存储介质,以解决现有技术中识别主谓语的方法泛化能力不足,无法被应用于多种场合的技术问题。
本公开的第一个方面是提供一种主谓语识别方法,包括:
通过主语预测模型确定用户问题中的至少一个预测主语,并确定所述预测主语的第一分值;
根据所述预测主语在所述用户问题中确定对应的预测谓语,并通过谓语预测模型确定所述预测谓语的第二分值;
根据所述第一分值、所述第二分值在所述预测主语、所述预测谓语的组合中,确定出目标主语、谓语的组合。
本公开的另一个方面是提供一种主谓语识别装置,包括:
主语预测模块,用于通过主语预测模型确定用户问题中的至少一个预测主语,并确定所述预测主语的第一分值;
谓语预测模块,用于根据所述预测主语在所述用户问题中确定对应的预测谓语,并通过谓语预测模型确定所述预测谓语的第二分值;
确定模块,用于根据所述第一分值、所述第二分值在所述预测主语、所述预测谓语的组合中,确定出目标主语、谓语的组合。
本公开的又一个方面是提供一种主谓语识别设备,包括:
存储器;
处理器;以及
计算机程序;
其中,所述计算机程序存储在所述存储器中,并配置为由所述处理器执行以实现如上述第一方面所述的主谓语识别方法。
本公开的又一个方面是提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行以实现如上述第一方面所述的主谓语识别方法。
本公开提供的主谓语识别方法、装置、设备及计算机可读存储介质的技术效果是:
本公开提供的主谓语识别方法、装置、设备及计算机可读存储介质,包括:通过主语预测模型确定用户问题中的至少一个预测主语,并确定预测主语的第一分值;根据预测主语在用户问题中确定对应的预测谓语,并通过谓语预测模型确定预测谓语的第二分值;根据第一分值、第二分值在预测主语、预测谓语的组合中,确定出目标主语、谓语的组合。本公开提供的方法、装置、设备及计算机可读存储介质,能够识别出用户问题中包括的多个预测主语与预测谓语的组合,再在这些预测组合中确定目标组合,能够不会遗漏可能的组合形式。并且,结合预测主语的第一分值以及预测谓语的第二分值,在预测组合中确定目标组合,使得识别的结果更为准确。同时,基于主语预测模型预测主语,基于谓语预测模型预测谓语,能够使本公开提供的方案适用于多种问答场景。
附图说明
图1为本发明一示例性实施例示出的主谓语识别方法的流程图;
图2为本发明另一示例性实施例示出的主谓语识别方法的流程图;
图2A为本发明一示例性实施例示出的确定语句向量的流程图;
图2B为本发明一示例性实施例示出的确定谓语向量的流程图;
图3为本发明一示例性实施例示出的主谓语识别装置的结构图;
图4为本发明另一示例性实施例示出的主谓语识别装置的结构图;
图5为本发明一示例性实施例示出的主谓语识别设备的结构图。
具体实施方式
目前,很多用户会在网络中提出问题,尤其是在一些问答平台中提出问题,随着人工智能的发展,可以通过一些自动化的手段对用户进行答复,从而不需要人工客服对用户的问题进行逐个回复。
在基于用户问题寻求答案时,需要识别出用户问题中的主语以及谓语,再在知识库中确定相应的问题答案。
本发明实施例中,在用户问题中识别出至少一个预测主语,并基于每个预测主语,再识别出对应的至少一个预测谓语,从而形成至少一个预测主语与预测谓语的组合,在识别过程中,还确定预测主语以及预测谓语的分值,从而基于二者分值在多个主谓语组合中,确定出目标主谓语。这种方式应识别结果准确,且泛化能力足,可以应用于不同的问答场景。
图1为本发明一示例性实施例示出的主谓语识别方法的流程图。
如图1所示,本实施例提供的主谓语识别方法包括:
步骤101,通过主语预测模型确定用户问题中的至少一个预测主语,并确定预测主语的第一分值。
其中,本实施例提供的方法可以应用在用于自动化答复用户问题的后台,具体可以设置在一具备计算能力的电子设备中,例如一用于自动化答复用户问题的后台服务器。用户可以通过前端与后台进行交互,使得该后台服务器能够获取到用户发送的用户问题。前端可以是设置在用户终端中的客户端,该用户终端例如可以是计算机、手机等,客户端可以是安装在用户终端中的软件。用户终端与后台通过网络连接。
具体的,用户可以在前端中输入问题,并操作用户终端,进而通过用户终端向后台发送用户问题。后台接收到用户问题后,可以将其发送给执行本实施例提供的方法的电子设备,或者可以直接由该电子设备接收用户问题。
进一步的,可以在电子设备中存储有主语预测模型,其可以在用户问题中确定出至少一个预测主语,并确定每个预测主语的第一分值。
实际应用时,该主语预测模型中可以包括序列标注任务,通过该序列标注任务,能够在用户问题中标注准实体。例如,可以在主语预测模型中设置crf+lstm模型,用来识别主语预测模型中的准实体。可以认为,在这些准实体中包括了预测主语。
其中,可以根据文字组合是否为常见组合设计序列标注任务,例如“act的儿子是谁”,其中,“儿子是谁”是一个较为常见的组合,因此,不将其作为预测主语,而“act”是一个不常见的组合,因此,可以将其作为一个准实体。可以基于此构建crf+lstm模型,用来识别用户问题中的准实体。
还可以在准实体中识别出预测主语。
具体的,可以预先设置实体库,在实体库中存储有多个实体。再通过比对已有的实体与准实体,从而确定预测主语。例如,若一个实体包含在准实体中,则可以认为该实体为预测主语。
进一步的,还可以直接通过实体库中的实体与用户问题进行比对,确定用户问题中的预测主语。例如,可以直接将用户问题中包括的与实体库中相同的实体作为预测主语,比如若实体库中包括实体AB,而用户问题为ABCCC,则可以认为AB是一个预测主语。
实际应用时,还可以确定每个预测主语的第一分值,用于衡量其是真是主语的指标。
其中,若先在用户问题中识别准实体,再在准实体中识别预测主语,则可以通过预测主语与准实体之间的重合程度确定第一分值。若直接根据实体库中的实体在用户问题中确定预测主语,则可以根据预测主语在用户问题中的位置确定第一分值,还可以结合用户问题的句式以及预测主语的位置确定第一分值。
步骤102,根据预测主语在用户问题中确定对应的预测谓语。
具体的,确定出预测主语后,需要在用户问题中确定与该预测主语对应的预测谓语。在用户问题中,可以认为预测主语以外的内容包括预测谓语,因此,可以在用户问题中除了预测主语以外的内容中,确定预测谓语。
进一步的,可以将用户问题中的预测主语替换为一特殊字符,例如可以是“*”,将替换后的用户问题作为谓语语句。可以在谓语语句中确定预测谓语。
实际应用时,可以根据对用户问题的实体标注结果,在谓语语句中确定预测谓语。此时确定的预测谓语与预测主语对应,即一个预测主语可以对应于至少一个预测谓语。例如在一个用户问题中可以识别出预测主语A、预测主语B,针对预测主语A可以确定预测谓语A1,预测谓语A2,对于预测主语B,还可以确定预测谓语B1,预测谓语B2,预测谓语B3。
步骤103,通过谓语预测模型确定预测谓语的第二分值。
其中,还可以在电子设备中设置谓语预测模型,用于确定预测谓语的第二分值。该第二分值是用于衡量预测谓语是真实模型的指标。
具体的,该谓语预测模型可以将谓语语句转换为向量形式,还可以将预测谓语转换为向量形式,通过确定这两个向量关联关系确定第二分值。
进一步的,在将谓语语句和/或预测谓语转换为向量形式时,还可以考虑语句中各个词或字之间的前后关系生成对应的向量,从而使得该向量中具备语句中的各个词或字的前后文关系。
实际应用时,上述主语预测模型、谓语预测模型可以通过训练得到。可以预先收集用户问题,并标注其中的真实主语与谓语,从而形成已知主谓语结果的训练数据。可以构建主语识别模型以及谓语识别模型,将训练数据输入主、谓语识别模型,从而确定用户问题中的预测主谓语组合。
其中,还可以确定真实主谓语组合对应的组合分值。例如,可以确定包括主语的准实体,并基于该主语以及准实体确定第一分值。还可以根据谓语确定第二分值,例如,可以确定用户问题中除了主语外的语句内容的向量,并确定谓语对应的向量,并基于这两个向量确定第二分值,从而根据第一分值以及第二分值确定真实的组合分值。
在训练模型时,可以构建最小化损失函数,例如可以是:
其中,q代表一用户问题,sp代表正确的主谓语组合,代表错误的主谓语组合。S(sp,q)代表用户问题q的正确主谓语组合的组合分值,/>代表用户问题q的错误主谓语组合的组合分值。r为以超参数,/>为损失值。[]+表示取大于等于0的值。
通过调整模型中的参数,使得损失函数值更小,例如可以设置阈值,用于确定训练结果是否满足要求。
步骤104,根据第一分值、第二分值在预测主语、预测谓语的组合中,确定出目标主语、谓语的组合。
其中,通过主语预测模型以及谓语预测模型,可以得到不同预测主语对应的第一分值,以及该预测主语对应的预测谓语的第二分值。认为一个预测主语与其对应的任一个预测谓语是一个组合,例如,预测主语A可以确定预测谓语A1,预测谓语A2,那么可以得到两个组合(A、A1),组合(A、A2)。
具体的,可以根据每个组合中预测主语以及预测谓语的分值,在这些组合中确定目标组合。例如,可以认为第一分值与第二分值之和最高的组合,是目标组合。再例如,可以在第一分值与第二分值之和较高的多个组合中,选择第一分值最高的组合作为目标组合,若包括多个第一分值最高的组合,还可以在多个组合中选择第二分值最高的组合作为目标组合。
进一步的,还可以设置第一分值与第二分值的权重值,再结合权重值以及第一分值和第二分值,在预测的主谓语组合中确定目标组合。
本实施例提供的方法用于识别用户问题中的主语和谓语,该方法由设置有本实施例提供的方法的设备执行,该设备通常以硬件和/或软件的方式来实现。
本实施例提供的主谓语识别方法,包括:通过主语预测模型确定用户问题中的至少一个预测主语,并确定预测主语的第一分值;根据预测主语在用户问题中确定对应的预测谓语,并通过谓语预测模型确定预测谓语的第二分值;根据第一分值、第二分值在预测主语、预测谓语的组合中,确定出目标主语、谓语的组合。本实施例提供的方法,能够识别出用户问题中包括的多个预测主语与预测谓语的组合,再在这些预测组合中确定目标组合,能够不会遗漏可能的组合形式。并且,结合预测主语的第一分值以及预测谓语的第二分值,在预测组合中确定目标组合,使得识别的结果更为准确。同时,基于主语预测模型预测主语,基于谓语预测模型预测谓语,能够使本实施例提供的方案适用于多种问答场景。
图2为本发明另一示例性实施例示出的主谓语识别方法的流程图。
如图2所示,本实施例提供的主谓语识别方法,包括:
步骤201,在用户问题中标注准实体。
本实施例提供的方法中,识别预测主语的步骤可以由主语预测模型实现。
其中,主语预测模型可以具有在用户问题中标注准实体的功能。
具体的,可以设置crf+lstm的组合,用于识别准实体。将用户问题输入lstm层,lstm层能够输出用户问题中各个词属于不同实体的概率,再将每个词对应的实体概率值输入crf层,使得crf层能够基于概率值确定每个词属于的实体。例如,可以基于预先训练的实体间关系,以及概率值确定各个词的实体类别。
根据本步骤,能够识别出用户问题包括的有实际含义的准实体,例如人名、地名、机构名、专有名词等。可以认为主语包含在这些准实体中。
步骤202,在准实体中确定预测主语,并确定预测主语的第一分值。
识别出准实体后,可以在准实体中确定预测主语。例如,可以在每个准实体中确定一个预测主语,对于一些能够确定不会包含主语的准实体,也可以不在其中确定预测主语。
基于本步骤,能够确定出用户问题中包括的至少一个预测主语。
在一种实施方式中,可以在实体库中确定准实体的最长公共子串,并将最长公共子串作为预测主语。
具体的,可以预先设置一实体库,其中包括多个实体。这些实体可以包括人名、地名、国家名称等多种类型。可以从海量的网络数据中提取实体,也可以通过人工筛选的方式得到实体。
进一步的,可以在实体库中进行全量检索,确定匹配准实体的最长公共子串。公共子串是指包含在准实体中,且是实体库中的一个实体的子串。对于一个准实体来说,可能能够得到与其匹配的多个公共子串,在其中确定一字符长度最长的子串作为预测主语。例如,对于准实体ABBACD来说,实体ABB是一个公共子串,ACD是其一个公共子串,ABBA也是一个公共子串,可以将字符长度最长的ABBA作为准实体的预测主语。
在这种实施方式中,可以根据预测主语与准实体的重合程度,确定预测主语的第一分值。
实际应用时,可以认为预测主语包含在准实体之中,因此,可以计算预测主语的字符长度与准实体字符长度的比值,作为预测主语的第一分值。
在另一种实施方式中,可以通过比对实体库中已有的实体拼音与准实体拼音的情况,确定预测主语。
可以预先确定实体库中的实体对应的实体拼音,并在执行本步骤时,直接获取已经确定的实体拼音。也可以设定拼音转换方法,并在执行本步骤时,基于设定的方法确定实体库中的实体对应的实体拼音,并获取确定结果。
其中,实体库中可以设置有数量较多的实体,可以确定所有实体所对应的实体拼音,即每个实体都对应于一个实体拼音。该实体拼音是实体的全拼拼音。
具体的,还可以确定准实体对应的准实体拼音。由于无法预先获知准实体,因此,可以在执行本步骤时,确定准实体对应的准实体拼音,具体为该准实体的全拼拼音。
进一步的,可以确定实体拼音与准实体拼音的编辑距离。编辑距离是针对二个字符串(例如英文字)的差异程度的量化量测,量测方式是看至少需要多少次的处理才能将一个字符串变成另一个字符串。可以预先设置确定编辑距离的方法,并基于该方法确定准实体拼音与每个实体拼音间的距离。
实际应用时,可以采用现有技术中已有的编辑距离确定方法。
其中,可以根据编辑距离在实体拼音中确定目标拼音,并将目标拼音对应的实体作为预测主语。
具体的,可以认为编辑距离越小,准实体拼音与实体拼音相似程度越高。例如,识别一准实体为“小明的”,其对应的准实体拼音为“xiaomingde”。在实体库中存在一实体为“小明”,其对应的实体拼音为“xiaoming”,则二者的编辑距离为2,若将“xiaoming”确定为目标拼音,则可以将其对应的实体“小明”作为预测主语。
在另一种实时场景中,可能存在拼音拼写错误的情况,导致用户问题中存在错别字。例如,用户问题包括一准实体“牛盾是”,其对应的准实体拼音是“niudunshi”,在实体库中存在一实体“牛顿”,对应的实体拼音是“niudun”。从而确定二者拼音的编辑距离为3,相较于仅比对中文文字内容,这种实施方式能够解决用户输入错别字导致识别失败的问题。
这种实施方式中,可以根据预测主语与准实体的拼音编辑距离确定第一分值。
编辑距离用于衡量两个字符串的差异,差异越大,二者相似性越差。因此,可以根据编辑距离确定两个字符串的公共长度。例如,可以用字符串的最大长度减去编辑距离,得到公共长度。并根据该公共长度确定第一分值。
其中,可以设置一拼音衰减系数α,可以将公共长度与α的乘积作为第一分值。
可选的,若确定了多个预测主语,还可以根据多个预测主语对应的第一分值对其进行筛选,从而确定多个备选预测主语。这种实施方式中,可以基于备选预测主语执行步骤203。
步骤203,根据预测主语、用户问题确定预测主语对应的谓语语句。
具体的,可以先在用户问题中确定出谓语语句,再在谓语语句中确定出预测谓语。
进一步的,可以认为主语以外的内容包括谓语,因此,将用户问题中除了预测主语外的内容作为当前的预测主语对应的谓语语句。还可以将用户问题中的预测主语使用特殊字符替代,形成一谓语语句,例如用“*”替代。
步骤204,在谓语语句中确定至少一个预测谓语。
实际应用时,可以认为谓语语句中的实体可能是真实的谓语。可以根据步骤201中在用户问题中标注实体的结果,确定预测谓语。还可以直接识别谓语语句中的实体,并将其中包括的实体确定为预测谓语。
其中,针对一个谓语语句可以识别出至少一个预测谓语,有可能存在多个预测谓语。此时,针对当前识别的预测主语,也可能对应多个预测谓语。
步骤205,根据谓语语句确定语句向量,根据预测谓语确定谓语向量。
具体的,在确定了预测谓语后,针对每个预测谓语都可以确定一第二分值。其中,可以设置一谓语预测模型,用于确定预测谓语的第二分值。步骤205、206可以通过该谓语预测模型实现。
具体的,由于谓语语句以及预测谓语均为文字形式(这里的文字可以包括中文、英文等多种文字形式),无法直接确定二者之间的联系,因此,可以将谓语语句以及预测谓语转换为向量形式,再根据二者向量确定关联。
进一步的,在确定谓语语句的语句向量时,根据字级别字典确定谓语语句对应的语句字级别向量,根据词级别字典确定谓语语句对应的语句词级别向量;将语句字级别向量输入第一bilstm,将语句词级别向量输入第二bilstm;将第一bilstm输出的具备前后关系的语句字级别向量,与第二bilstm输出的具备前后关系的语句词级别向量进行联合,得到语句向量。
实际应用时,可以预先设置字级别字典以及词级别字典,在字典中存储有字或词对应的向量。通过字典能够将谓语语句转换为语句字级别向量以及语句词级别向量。
其中,还可以设置第一bilstm以及第二bilstm,分别用于处理字级别向量和词级别向量。bilstm是Bi-directional Long Short-Term Memory的缩写,是由前向LSTM与后向LSTM组合而成。LSTM的全称是Long Short-Term Memory,它是RNN(Recurrent NeuralNetwork)的一种。
具体的,bilstm可以对输入的向量进行处理,确定向量中各个部分的前后关系。第一bilstm可以基于输入的向量输出具备前后关系的语句字级别向量;第二bilstm可以基于输入的向量输出具备前后关系的语句词级别向量。
进一步的,可以关联备前后关系的语句字级别向量与具备前后关系的语句词级别向量,例如,可以直接将这两个向量进行拼接,得到语句向量。
图2A为本发明一示例性实施例示出的确定语句向量的流程图。
如图2A所示,字级别embedding可以将谓语语句转换为语句字级别向量,词级别embedding可以将谓语语句转换为语句词级别向量。再将语句字级别向量输入第一bilstm,将语句词级别向量输入第二bilstm,从而使其分别输出具备前后关系的语句字级别向量以及具备前后关系的语句词级别向量。这两个向量被输入到concat层,用于对输入的向量进行关联,通过concat层能够得到语句向量。
将每个预测谓语确定谓语向量时,可以根据字级别字典确定预测谓语对应的谓语字级别向量,根据词级别字典确定预测谓语对应的谓语词级别向量;获取预测谓语的并列实体,并根据字级别字典确定并列实体对应的实体字级别向量,根据词级别字典确定并列实体对应的实体词级别向量;根据谓语字级别向量、谓语词级别向量、实体字级别向量、实体词级别向量,确定谓语向量。
与确定语句向量时类似,也可以基于预先设置的字级别字典和词级别字典,确定预测谓语的谓语字级别向量、谓语词级别向量。
此外,用户问题中的一些词汇可能用的并不准确,若将这些不准确的词汇作为谓语,并通过这样的谓语在知识库中确定回复内容时,可能无法准确的确定答案。
因此,本实施例提供的方法,还可以获取预测谓语的并列实体。可以预先确定具有并列关系的实体组合,从而可以根据预测谓语确定对应的并列实体。例如,一个组合中包括C1、C2、C3,若识别的预测谓语属于该组合,例如预测谓语是C1,则可以将C2、C3作为并列实体。可以将表达含义一致的实体作为一个组合。对于一个预测谓语来说,其可以具有多个并列实体,也可以不具备并列实体。
若其具备并列实体,则获取相应的并列实体。若不具备并列实体,则可以不执行获取并列实体以及基于并列实体进行计算的步骤。
若包括并列实体,则根据字级别字典确定并列实体对应的实体字级别向量,根据词级别字典确定并列实体对应的实体词级别向量。
此时,基于预测谓语能够得到谓语字级别向量、谓语词级别向量、实体字级别向量、实体词级别向量,可以根据这些向量确定谓语向量。
其中,可以根据谓语字级别向量、实体字级别向量确定字级别向量平均值。可以直接将谓语字级别向量与实体字级别向量相加,并除以字级别向量的数量。还可以根据谓语词级别向量、实体词级别向量确定词级别向量平均值。确定字级别向量平均值与确定词级别向量平均值的步骤之间的时序不做限制。
具体的,将字级别向量平均值、词级别向量平均值进行联合,就能够得到谓语向量。例如,可以直接将这两个向量进行拼接,得到谓语向量。
步骤206,根据语句向量、谓语向量确定第二分值。
进一步的,在确定了语句向量和谓语向量后,还可以根据这两个向量确定第二分值,用于衡量预测谓语与谓语语句之间的关联程度。
实际应用时,可以将语句向量与谓语向量的余弦相似度作为第二分值。
通过计算两个向量的夹角余弦值,能够评估他们之间的相似度,因此,可以将这一相似度值作为第二分值。
图2B为本发明一示例性实施例示出的确定谓语向量的流程图。
如图2B所示,通过字级别embedding可以确定预测谓语的字级别向量,还可以确定并列实体的字级别向量;通过词级别embedding可以确定预测谓语的词级别向量,还可以确定并列实体的词级别向量;再对字级别向量进行加权求和,对词级别向量进行加权求和,从而得到字级别向量平均值、词级别向量平均值。最后,再将两个向量输入到concat层,用于对输入的向量进行关联,通过concat层能够得到谓语向量。
步骤207,根据第一分值、第二分值、预设参数,确定预测主语与预测谓语的组合分值。
其中,在确定了第一分值和第二分值后,可以通过这两个分值得到预测主语与预测谓语的组合分值。
具体的,还可以设置预测参数,用于确定组合分值。这一预测参数可以作为调整参数,可以通过训练得到的。
进一步的,可以将第一分值,与第二分值与预设参数乘积相加的结果,作为组合分值。
步骤208,将组合分值最高的预测主语与预测谓语的组合,作为目标主语、谓语的组合。
针对每个预测主语和预测谓语的组合来说,都可以确定出对应的组合分值,因此,可以直接将将组合分值最高的预测主语与预测谓语的组合,作为目标主语、谓语的组合。
目标主语、谓语组合可以作为最终确定的用户问题中的主语和谓语。
步骤209,根据目标主语、谓语的组合,在知识库中确定与用户问题对应的答复内容。
进一步的,在确定了主语和谓语之后,可以根据主、谓语组合在知识库中确定与用户问题对应的答复内容,并向用户终端反馈该答复内容。例如,用户问题是“XX的媳妇是谁”,基于本实施例提供的方法能够识别出主语“XX”以及位于“媳妇”,此时,就可以在知识库中进行搜索,确定“XX媳妇”对应的结果,并将这一结果作为用户问题对应的答复内容。
实际应用时,电子设备可以通过网络将答复内容发送到用户终端,以使用户了解相应的内容。
图3为本发明一示例性实施例示出的主谓语识别装置的结构图。
如图3所示,本实施例提供的主谓语识别装置,包括:
主语预测模块31,用于通过主语预测模型确定用户问题中的至少一个预测主语,并确定所述预测主语的第一分值;
谓语预测模块32,用于根据所述预测主语在所述用户问题中确定对应的预测谓语,并通过谓语预测模型确定所述预测谓语的第二分值;
确定模块33,用于根据所述第一分值、所述第二分值在所述预测主语、所述预测谓语的组合中,确定出目标主语、谓语的组合。
本实施例提供的主谓语识别装置,包括:主语预测模块,用于通过主语预测模型确定用户问题中的至少一个预测主语,并确定预测主语的第一分值;谓语预测模块,用于根据预测主语在用户问题中确定对应的预测谓语,并通过谓语预测模型确定预测谓语的第二分值;确定模块,用于根据第一分值、第二分值在预测主语、预测谓语的组合中,确定出目标主语、谓语的组合。本实施例提供的装置,能够识别出用户问题中包括的多个预测主语与预测谓语的组合,再在这些预测组合中确定目标组合,能够不会遗漏可能的组合形式。并且,结合预测主语的第一分值以及预测谓语的第二分值,在预测组合中确定目标组合,使得识别的结果更为准确。同时,基于主语预测模型预测主语,基于谓语预测模型预测谓语,能够使本实施例提供的方案适用于多种问答场景。
本实施例提供的主谓语识别装置的具体原理和实现方式均与图1所示的实施例类似,此处不再赘述。
图4为本发明另一示例性实施例示出的主谓语识别装置的结构图。
如图4所示,在上述实施例的基础上,本实施例提供的主谓语识别装置,所述主语预测模块31,包括:
标注单元311,用于在所述用户问题中标注准实体;
主语预测单元312,用于在所述准实体中确定所述预测主语。
可选的,所述主语预测单元312具体用于:
在实体库中确定所述准实体的最长公共子串,并将所述最长公共子串作为所述预测主语。
可选的,所述主语预测模块31还包括第一分值确定单元313,用于:
根据所述预测主语与所述准实体的重合程度,确定所述预测主语的第一分值。
可选的,所述主语预测单元312具体用于:
获取所述实体库中的实体对应的实体拼音,确定所述准实体对应的准实体拼音;
确定所述实体拼音与所述准实体拼音的编辑距离;
根据所述编辑距离在所述实体拼音中确定目标拼音,并将所述目标拼音对应的实体作为所述预测主语。
可选的,所述主语预测模块31还包括第二分值确定单元314,用于:
根据所述预测主语与所述准实体的拼音编辑距离确定所述第一分值。
可选的,所述谓语预测模块32具体用于:
根据所述预测主语、所述用户问题确定所述预测主语对应的谓语语句,并在所述谓语语句中确定至少一个预测谓语。
可选的,所述谓语预测模块32包括第三分值确定单元321,用于:
根据所述谓语语句确定语句向量,根据所述预测谓语确定谓语向量;
根据所述语句向量、所述谓语向量确定所述第二分值。
可选的,所述第三分值确定单元321具体用于:
根据字级别字典确定所述谓语语句对应的语句字级别向量,根据词级别字典确定所述谓语语句对应的语句词级别向量;
将所述语句字级别向量输入第一bilstm,将所述语句词级别向量输入第二bilstm;
将第一bilstm输出的具备前后关系的语句字级别向量,与第二bilstm输出的具备前后关系的语句词级别向量进行联合,得到所述语句向量。
可选的,所述第三分值确定单元321,用于:
根据字级别字典确定所述预测谓语对应的谓语字级别向量,根据词级别字典确定所述预测谓语对应的谓语词级别向量;
获取所述预测谓语的并列实体,并根据字级别字典确定所述并列实体对应的实体字级别向量,根据词级别字典确定所述并列实体对应的实体词级别向量;
根据所述谓语字级别向量、所述谓语词级别向量、所述实体字级别向量、所述实体词级别向量,确定所述谓语向量。
可选的,所述第三分值确定单元321,用于:
根据所述谓语字级别向量、所述实体字级别向量确定字级别向量平均值;
根据所述谓语词级别向量、所述实体词级别向量确定词级别向量平均值;
将所述字级别向量平均值、所述词级别向量平均值进行联合,得到所述谓语向量。
可选的,所述第三分值确定单元321,具体用于:
将所述语句向量与所述谓语向量的余弦相似度作为所述第二分值。
可选的,所述确定模块33,包括:
组合分值确定单元331,用于根据所述第一分值、所述第二分值、预设参数,确定所述预测主语与所述预测谓语的组合分值;
目标组合确定单元332,用于将所述组合分值最高的所述预测主语与所述预测谓语的组合,作为目标主语、谓语的组合。
可选的,所述谓语预测模块32在根据所述预测主语、所述用户问题确定所述预测主语对应的谓语语句之前,还用于:
根据所述第一分值确定预设数量的备选预测主语,并根据所述备选预测主语确定所述谓语语句。
可选的,本实施例提供的装置,还包括回复模块34,用于在所述确定模块33确定所述确定出目标主语、谓语的组合之后,根据所述目标主语、谓语的组合,在知识库中确定与所述用户问题对应的答复内容。
本实施例提供的装置的具体原理和实现方式均与图2所示的实施例类似,此处不再赘述。
图5为本发明一示例性实施例示出的主谓语识别设备的结构图。
如图5所示,本实施例提供的主谓语识别设备包括:
存储器51;
处理器52;以及
计算机程序;
其中,所述计算机程序存储在所述存储器51中,并配置为由所述处理器52执行以实现如上所述的任一种主谓语识别方法。
本实施例还提供一种计算机可读存储介质,其上存储有计算机程序,
所述计算机程序被处理器执行以实现如上所述的任一种主谓语识别方法。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
Claims (28)
1.一种主谓语识别方法,其特征在于,包括:
通过主语预测模型确定用户问题中的至少一个预测主语,并确定所述预测主语的第一分值;
根据所述第一分值确定预设数量的备选预测主语,并根据所述备选预测主语确定谓语语句,并在所述谓语语句中确定至少一个预测谓语,并通过谓语预测模型确定所述预测谓语的第二分值;
根据所述第一分值、所述第二分值在所述预测主语、所述预测谓语的组合中,确定出目标主语、谓语的组合。
2.根据权利要求1所述的方法,其特征在于,所述通过主语预测模型确定用户问题中的至少一个预测主语,包括:
在所述用户问题中标注准实体;
在所述准实体中确定所述预测主语。
3.根据权利要求2所述的方法,其特征在于,所述在所述准实体中确定所述预测主语,包括:
在实体库中确定所述准实体的最长公共子串,并将所述最长公共子串作为所述预测主语。
4.根据权利要求3所述的方法,其特征在于,所述确定所述预测主语的第一分值,包括:
根据所述预测主语与所述准实体的重合程度,确定所述预测主语的第一分值。
5.根据权利要求2所述的方法,其特征在于,所述在所述准实体中确定所述预测主语,包括:
获取实体库中的实体对应的实体拼音,确定所述准实体对应的准实体拼音;
确定所述实体拼音与所述准实体拼音的编辑距离;
根据所述编辑距离在所述实体拼音中确定目标拼音,并将所述目标拼音对应的实体作为所述预测主语。
6.根据权利要求5所述的方法,其特征在于,所述确定所述预测主语的第一分值,包括:
根据所述预测主语与所述准实体的拼音编辑距离确定所述第一分值。
7.根据权利要求1所述的方法,其特征在于,所述通过谓语预测模型确定所述预测谓语的第二分值,包括:
根据所述谓语语句确定语句向量,根据所述预测谓语确定谓语向量;
根据所述语句向量、所述谓语向量确定所述第二分值。
8.根据权利要求7所述的方法,其特征在于,所述根据所述谓语语句确定语句向量,包括:
根据字级别字典确定所述谓语语句对应的语句字级别向量,根据词级别字典确定所述谓语语句对应的语句词级别向量;
将所述语句字级别向量输入第一bilstm,将所述语句词级别向量输入第二bilstm;
将第一bilstm输出的具备前后关系的语句字级别向量,与第二bilstm输出的具备前后关系的语句词级别向量进行联合,得到所述语句向量。
9.根据权利要求7所述的方法,其特征在于,所述根据所述预测谓语确定谓语向量,包括:
根据字级别字典确定所述预测谓语对应的谓语字级别向量,根据词级别字典确定所述预测谓语对应的谓语词级别向量;
获取所述预测谓语的并列实体,并根据字级别字典确定所述并列实体对应的实体字级别向量,根据词级别字典确定所述并列实体对应的实体词级别向量;
根据所述谓语字级别向量、所述谓语词级别向量、所述实体字级别向量、所述实体词级别向量,确定所述谓语向量。
10.根据权利要求9所述的方法,其特征在于,所述根据所述谓语字级别向量、所述谓语词级别向量、所述实体字级别向量、所述实体词级别向量,确定所述谓语向量,包括:
根据所述谓语字级别向量、所述实体字级别向量确定字级别向量平均值;
根据所述谓语词级别向量、所述实体词级别向量确定词级别向量平均值;
将所述字级别向量平均值、所述词级别向量平均值进行联合,得到所述谓语向量。
11.根据权利要求7所述的方法,其特征在于,所述根据所述语句向量、所述谓语向量确定所述第二分值,包括:
将所述语句向量与所述谓语向量的余弦相似度作为所述第二分值。
12.根据权利要求1所述的方法,其特征在于,所述根据所述第一分值、所述第二分值在所述预测主语、所述预测谓语的组合中,确定出目标主语、谓语的组合,包括:
根据所述第一分值、所述第二分值、预设参数,确定所述预测主语与所述预测谓语的组合分值;
将所述组合分值最高的所述预测主语与所述预测谓语的组合,作为目标主语、谓语的组合。
13.根据权利要求1所述的方法,其特征在于,所述确定出目标主语、谓语的组合之后,还包括:
根据所述目标主语、谓语的组合,在知识库中确定与所述用户问题对应的答复内容。
14.一种主谓语识别装置,其特征在于,包括:
主语预测模块,用于通过主语预测模型确定用户问题中的至少一个预测主语,并确定所述预测主语的第一分值;
谓语预测模块,用于根据所述第一分值确定预设数量的备选预测主语,并根据所述备选预测主语确定谓语语句,并在所述谓语语句中确定至少一个预测谓语,并通过谓语预测模型确定所述预测谓语的第二分值;
确定模块,用于根据所述第一分值、所述第二分值在所述预测主语、所述预测谓语的组合中,确定出目标主语、谓语的组合。
15.根据权利要求14所述的装置,其特征在于,所述主语预测模块,包括:
标注单元,用于在所述用户问题中标注准实体;
主语预测单元,用于在所述准实体中确定所述预测主语。
16.根据权利要求15所述的装置,其特征在于,所述主语预测单元具体用于:
在实体库中确定所述准实体的最长公共子串,并将所述最长公共子串作为所述预测主语。
17.根据权利要求16所述的装置,其特征在于,所述主语预测模块还包括第一分值确定单元,用于:
根据所述预测主语与所述准实体的重合程度,确定所述预测主语的第一分值。
18.根据权利要求15所述的装置,其特征在于,所述主语预测单元具体用于:
获取实体库中的实体对应的实体拼音,确定所述准实体对应的准实体拼音;
确定所述实体拼音与所述准实体拼音的编辑距离;
根据所述编辑距离在所述实体拼音中确定目标拼音,并将所述目标拼音对应的实体作为所述预测主语。
19.根据权利要求18所述的装置,其特征在于,所述主语预测模块还包括第二分值确定单元,用于:
根据所述预测主语与所述准实体的拼音编辑距离确定所述第一分值。
20.根据权利要求14所述的装置,其特征在于,所述谓语预测模块包括第三分值确定单元,用于:
根据所述谓语语句确定语句向量,根据所述预测谓语确定谓语向量;
根据所述语句向量、所述谓语向量确定所述第二分值。
21.根据权利要求20所述的装置,其特征在于,所述第三分值确定单元具体用于:
根据字级别字典确定所述谓语语句对应的语句字级别向量,根据词级别字典确定所述谓语语句对应的语句词级别向量;
将所述语句字级别向量输入第一bilstm,将所述语句词级别向量输入第二bilstm;
将第一bilstm输出的具备前后关系的语句字级别向量,与第二bilstm输出的具备前后关系的语句词级别向量进行联合,得到所述语句向量。
22.根据权利要求20所述的装置,其特征在于,所述第三分值确定单元,用于:
根据字级别字典确定所述预测谓语对应的谓语字级别向量,根据词级别字典确定所述预测谓语对应的谓语词级别向量;
获取所述预测谓语的并列实体,并根据字级别字典确定所述并列实体对应的实体字级别向量,根据词级别字典确定所述并列实体对应的实体词级别向量;
根据所述谓语字级别向量、所述谓语词级别向量、所述实体字级别向量、所述实体词级别向量,确定所述谓语向量。
23.根据权利要求22所述的装置,其特征在于,所述第三分值确定单元,用于:
根据所述谓语字级别向量、所述实体字级别向量确定字级别向量平均值;
根据所述谓语词级别向量、所述实体词级别向量确定词级别向量平均值;
将所述字级别向量平均值、所述词级别向量平均值进行联合,得到所述谓语向量。
24.根据权利要求20所述的装置,其特征在于,所述第三分值确定单元,具体用于:
将所述语句向量与所述谓语向量的余弦相似度作为所述第二分值。
25.根据权利要求14所述的装置,其特征在于,所述确定模块,包括:
组合分值确定单元,用于根据所述第一分值、所述第二分值、预设参数,确定所述预测主语与所述预测谓语的组合分值;
目标组合确定单元,用于将所述组合分值最高的所述预测主语与所述预测谓语的组合,作为目标主语、谓语的组合。
26.根据权利要求14所述的装置,其特征在于,还包括回复模块,用于在所述确定模块确定所述确定出目标主语、谓语的组合之后,根据所述目标主语、谓语的组合,在知识库中确定与所述用户问题对应的答复内容。
27.一种主谓语识别设备,其特征在于,包括:
存储器;
处理器;以及
计算机程序;
其中,所述计算机程序存储在所述存储器中,并配置为由所述处理器执行以实现如权利要求1-13任一种所述的方法。
28.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,
所述计算机程序被处理器执行以实现如权利要求1-13任一种所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910521578.4A CN110287487B (zh) | 2019-06-17 | 2019-06-17 | 主谓语识别方法、装置、设备及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910521578.4A CN110287487B (zh) | 2019-06-17 | 2019-06-17 | 主谓语识别方法、装置、设备及计算机可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110287487A CN110287487A (zh) | 2019-09-27 |
CN110287487B true CN110287487B (zh) | 2023-08-11 |
Family
ID=68005307
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910521578.4A Active CN110287487B (zh) | 2019-06-17 | 2019-06-17 | 主谓语识别方法、装置、设备及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110287487B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111126049B (zh) * | 2019-12-14 | 2023-11-24 | 中国科学院深圳先进技术研究院 | 对象关系预测方法、装置、终端设备及可读存储介质 |
CN111159345B (zh) * | 2019-12-27 | 2023-09-05 | 中国矿业大学 | 一种中文知识库答案获取方法及其装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101593174A (zh) * | 2009-03-11 | 2009-12-02 | 林勋准 | 一种机器翻译方法及系统 |
CN101930428A (zh) * | 2009-06-18 | 2010-12-29 | 万继华 | 计算机理解自然语言的系统及方法 |
CN108229272A (zh) * | 2017-02-23 | 2018-06-29 | 北京市商汤科技开发有限公司 | 视觉关系检测方法和装置及视觉关系检测训练方法和装置 |
CN108874778A (zh) * | 2018-06-15 | 2018-11-23 | 广东蔚海数问大数据科技有限公司 | 语义实体关系抽取方法、装置及电子设备 |
CN109815253A (zh) * | 2018-12-26 | 2019-05-28 | 出门问问信息科技有限公司 | 一种查询语句的主语实体识别方法及装置 |
-
2019
- 2019-06-17 CN CN201910521578.4A patent/CN110287487B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101593174A (zh) * | 2009-03-11 | 2009-12-02 | 林勋准 | 一种机器翻译方法及系统 |
CN101930428A (zh) * | 2009-06-18 | 2010-12-29 | 万继华 | 计算机理解自然语言的系统及方法 |
CN108229272A (zh) * | 2017-02-23 | 2018-06-29 | 北京市商汤科技开发有限公司 | 视觉关系检测方法和装置及视觉关系检测训练方法和装置 |
CN108874778A (zh) * | 2018-06-15 | 2018-11-23 | 广东蔚海数问大数据科技有限公司 | 语义实体关系抽取方法、装置及电子设备 |
CN109815253A (zh) * | 2018-12-26 | 2019-05-28 | 出门问问信息科技有限公司 | 一种查询语句的主语实体识别方法及装置 |
Non-Patent Citations (1)
Title |
---|
"论元角色与话题性——兼论主谓谓语句的确定";陈洁;《黔南民族师范学院学报》;20100825;第8-13,33页 * |
Also Published As
Publication number | Publication date |
---|---|
CN110287487A (zh) | 2019-09-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20210390271A1 (en) | Neural machine translation systems | |
CN108304372B (zh) | 实体提取方法和装置、计算机设备和存储介质 | |
WO2019153737A1 (zh) | 用于对评论进行评估的方法、装置、设备和存储介质 | |
CN110377916B (zh) | 词预测方法、装置、计算机设备及存储介质 | |
CN106503231B (zh) | 基于人工智能的搜索方法和装置 | |
CN113361266B (zh) | 文本纠错方法、电子设备及存储介质 | |
US11232263B2 (en) | Generating summary content using supervised sentential extractive summarization | |
CN113505200B (zh) | 一种结合文档关键信息的句子级中文事件检测的方法 | |
CN109857846B (zh) | 用户问句与知识点的匹配方法和装置 | |
CN111984766A (zh) | 缺失语义补全方法及装置 | |
US11461613B2 (en) | Method and apparatus for multi-document question answering | |
CN111401084A (zh) | 一种机器翻译的方法、设备以及计算机可读存储介质 | |
CN113590810B (zh) | 摘要生成模型训练方法、摘要生成方法、装置及电子设备 | |
CN113128203A (zh) | 基于注意力机制的关系抽取方法、系统、设备及存储介质 | |
CN110717021A (zh) | 人工智能面试中获取输入文本和相关装置 | |
CN110287487B (zh) | 主谓语识别方法、装置、设备及计算机可读存储介质 | |
CN113468891A (zh) | 文本处理方法以及装置 | |
CN115147849A (zh) | 字符编码模型的训练方法、字符匹配方法和装置 | |
CN111062209A (zh) | 自然语言处理模型训练方法和自然语言处理模型 | |
CN108268443B (zh) | 确定话题点转移以及获取回复文本的方法、装置 | |
Lhasiw et al. | A bidirectional LSTM model for classifying Chatbot messages | |
CN113705207A (zh) | 语法错误识别方法及装置 | |
CN117235523A (zh) | 一种语言生成模型改进方法、系统、设备及存储介质 | |
CN115905187B (zh) | 一种面向云计算工程技术人员认证的智能化命题系统 | |
CN112000767B (zh) | 一种基于文本的信息抽取方法和电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |