CN112183060A - 多轮对话系统的指代消解方法 - Google Patents

多轮对话系统的指代消解方法 Download PDF

Info

Publication number
CN112183060A
CN112183060A CN202011042444.3A CN202011042444A CN112183060A CN 112183060 A CN112183060 A CN 112183060A CN 202011042444 A CN202011042444 A CN 202011042444A CN 112183060 A CN112183060 A CN 112183060A
Authority
CN
China
Prior art keywords
sentence
word
candidate entity
entity
sentences
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011042444.3A
Other languages
English (en)
Other versions
CN112183060B (zh
Inventor
张会焱
敖文刚
刘宗敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing Technology and Business University
Original Assignee
Chongqing Technology and Business University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing Technology and Business University filed Critical Chongqing Technology and Business University
Priority to CN202011042444.3A priority Critical patent/CN112183060B/zh
Publication of CN112183060A publication Critical patent/CN112183060A/zh
Application granted granted Critical
Publication of CN112183060B publication Critical patent/CN112183060B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue

Abstract

本发明提供的一种多轮对话系统的指代消解方法,包括以下步骤:S1.对多轮对话系统所接收到的语句进行检测,判断语句是否需要进行指代消解,如是,则进入到步骤S2中;S2.对确定为需要进行指代消解的语句进行判断,区分语句的指代类型,并从区分出指代类型的语句中筛选出候选实体;语句的指代类型包括回指语句和共指语句;S3.确定候选实体与语句中指代词的距离,并将距离最小的候选实体作为指代链接词;S4.将指代词更新为指代链接词;通过上述方法,能够对输入多轮对话系统的语句的指代进行准确的识别,并进行准确的指代消解,能有效提高多轮交互系统的顺畅性,提升用户体验。

Description

多轮对话系统的指代消解方法
技术领域
本发明涉及人机对话语言处理领域,尤其涉及一种多轮对话系统的指代消解方法。
背景技术
指代是一种常见的语言现象。在多轮对话系统中,指代和省略影响人机对话系统的流畅度和用户体验。人脑具有知识背景和记忆能力,能够很好的重现对话历史的关键信息,自动补全或者替换对方当前轮的代词,来理解对话的真正含义。同样,人机对话系统中需要指代消解模块,来理解用户输入的真正语义。
指代消解方法分为基于管道的方法和基于端到端的方法。基于管道的方法是先进行指代检测,然后再进行指代消解。基于端到端的方法,对输入层编码,通过中间层的计算,输出指代消解结果,常见的基于端到端的方法有基于联合训练的方法、基于序列标注的方法、基于指针网络的方法。基于端到端的方法通常采用深度学习模型,但是需要大量带标签的标注数据,在面对领域数据缺乏时模型构建成本较高,尤其在初期是多轮指代消解标注数据缺乏,且在实际应用中遇到问题,模型修改迭代不满足线上系统的及时性。
因此,为了解决上述技术问题,亟需提出一种新的技术手段加以解决。
发明内容
有鉴于此,本发明的目的是提供一种多轮对话系统的指代消解方法,能够对输入多轮对话系统的语句的指代进行准确的识别,并进行准确的指代消解,能有效提高多轮交互系统的顺畅性,提升用户体验。
本发明提供的一种多轮对话系统的指代消解方法,包括以下步骤:
S1.对多轮对话系统所接收到的语句进行检测,判断语句是否需要进行指代消解,如是,则进入到步骤S2中;
S2.对确定为需要进行指代消解的语句进行判断,区分语句的指代类型,并从区分出指代类型的语句中筛选出候选实体;
S3.确定候选实体与语句中指代词的距离,并将距离最小的候选实体作为指代链接词;
S4.将指代词更新为指代链接词。
进一步,步骤S3中,根据如下方法确定候选实体与语句中指代词的距离:
D=α*(w1*D1+w2*D2);其中,D为候选实体与语句中指代词的距离,α为实体类型与待消解语句的类型匹配度,w1为实体与语句话题关联度系数,w2为实体替换后的句子概率系数,D1为待指代消解的语句的句向量和候选实体之间的语义距离,D2为候选实体与待指代消解语句之间的距离。
进一步,根据如下方法计算类型匹配度α:
Figure BDA0002707046540000021
其中,PL为指代词的指代类型的预测概率,Pm为候选实体内第m个字的字标签属性概率,k为候选实体中字的个数。
进一步,根据如下方法计算实体与语句话题关联度系数w1
w1=Pt;其中,Pt为当前语句的话题的前一个话题转移到当前语句的话题的概率。
进一步,所述实体替换后的句子概率系数w2计算方法为:
w2=P(s1i≥2P(si|si-1),其中:P(s1)为待消解语句中编号为1的词s1排在待消解语句句首的概率,P(si|si-1)为待消解语句的第i个词si排在第i-1个词si-1个词后的概率。
进一步,根据如下方法确定待指代消解的语句的句向量和候选实体之间的语义距离D1
Figure BDA0002707046540000031
其中,Vsen为待消解语句的句向量,Vcdt为候选实体向量,
Figure BDA0002707046540000032
Figure BDA0002707046540000033
n表示组成待消解语句的词的个数,r表示组成待消解语句的第r个词,q为组成候选实体的词的个数,j为组成候选实体的第j个词,vr为组成待消解语句的第r个词的词向量,vj为组成候选实体第j个词的词向量。
进一步,根据如下方法确定候选实体与指代句之间的距离D2
D2=eU-V,其中,U为候选实体出现的次数,V为候选实体与待消解的语句之间的间隔字符数。
进一步,步骤S1和步骤S2中,采用fasttext分类模型对语句进行检测并提取出指代词,并对语句的指代类型进行判断。
进一步,步骤S2中,采用BiLSTM_CRF深度学习模型对语句中的实体进行提取。
本发明的有益效果:通过本发明,能够对输入多轮对话系统的语句的指代进行准确的识别,并进行准确的指代消解,能有效提高多轮交互系统的顺畅性,提升用户体验。
附图说明
下面结合附图和实施例对本发明作进一步描述:
图1为本发明的流程图。
具体实施方式
以下对本发明做出进一步详细说明:
本发明提供的一种多轮对话系统的指代消解方法,包括以下步骤:
S1.对多轮对话系统所接收到的语句进行检测,判断语句是否需要进行指代消解,如是,则进入到步骤S2中;其中,输入到多轮对话系统的语句可以是语音语句,也可以是文字语句;
S2.对确定为需要进行指代消解的语句进行判断,区分语句的指代类型,并从区分出指代类型的语句中筛选出候选实体;
S3.确定候选实体与语句中指代词的距离,并将距离最小的候选实体作为指代链接词;
S4.将指代词更新为指代链接词;通过上述方法,能够对输入多轮对话系统的语句的指代进行准确的识别,并进行准确的指代消解,能有效提高多轮交互系统的顺畅性,提升用户体验。其中:
步骤S1和步骤S2中,采用fasttext分类模型对语句进行检测并提取出指代词,并对语句的指代类型进行判断。
步骤S2中,采用BiLSTM_CRF深度学习模型对语句中的实体进行提取。
指代消解主要目的是对代词进行替换,在这之前,需对指代词进行检测及提取,其中,指代词比如“他”、“她”、“它”、“这”、“那”等等;实体比如人名、物名、地名、机构名称等;
对于BiLSTM_CRF深度学习模型,此为一个现有技术,模型第一层为数据表示层,对于一段输入序列,该层将每一字符映射为向量表示,本事实例中采用word2vec;BiLSTM层。LSTM在RNN的基础上增加了输入门、遗忘门、输出门,能够根据信息特征的重要性进行保留与遗忘,解决了神经网络中长序列依赖问题。神经网络可以根据文本中词的分布式表示自动提取特征,字向量的BiLSTM-CRF模型,在BiLSTM输出预测曾后,CRF层可以为最后预测的标签添加一些约束来保证预测的标签是合法的。在训练数据训练过程中,这些约束可以通过CRF层自动学习到,最后输出序列化的标签,标签第一级采用BIOES表示,其中B实体词的开始,I表示实体词的中间字或词,E表示实体词的结束,S表示单字实体,O表示为非实体字或词。二级标签采用实体类别的英文表示。例如,人名类实体标签分别为B-PER,I-PER,E-PER,S-PER,O-PER。
本实施例中,步骤S3中,根据如下方法确定候选实体与语句中指代词的距离:
D=α*(w1*D1+w2*D2);其中,D为候选实体与语句中指代词的距离,α为类型匹配度,w1为权重值,w2为权重值,D1为待指代消解的语句的句向量和候选实体之间的语义距离,D2为候选实体与指代句之间的距离。
具体地:根据如下方法计算类型匹配度α:
Figure BDA0002707046540000051
其中,PL为指代词的指代类型的预测概率,Pm为候选实体内第m个字的字标签属性概率,k为候选实体中字的个数,其中,指代类型比如人名、地名、产品名称、机构名称等。
根据如下方法计算实体与语句话题关联度系数w1
w1=Pt;其中,Pt为当前语句的话题的前一个话题转移到当前语句的话题的概率。
所述实体替换后的句子概率系数w2计算方法为:
w2=P(s1i≥2P(si|si-1),其中:P(s1)为待消解语句中编号为1的词s1排在待消解语句句首的概率,P(si|si-1)为待消解语句的第i个词si排在第i-1个词si-1个词后的概率。
根据如下方法确定待指代消解的语句的句向量和候选实体之间的语义距离D1
Figure BDA0002707046540000061
其中,Vsen为待消解语句的句向量,Vcdt为候选实体向量,
Figure BDA0002707046540000062
Figure BDA0002707046540000063
n表示组成待消解语句的词的个数,r表示组成待消解语句的第r个词,q为组成候选实体的词的个数,j为组成候选实体的第j个词,vr为组成待消解语句的第r个词的词向量,vj为组成候选实体第j个词的词向量,其中,词向量为将待指代消解语句的每个字按照既定映射关系映射成向量表示,采用word2vec模型实现,为该模型为现有技术,在此不加以赘述。
根据如下方法确定候选实体与指代句之间的距离D2
D2=eU-V,其中,U为候选实体出现的次数,V为候选实体与待消解的语句之间的间隔字符数,通过上述方法,能够准确地对指代语句进行实体更新替换,从而确保替换结果的准确性。
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。

Claims (9)

1.一种多轮对话系统的指代消解方法,其特征在于:包括以下步骤:
S1.对多轮对话系统所接收到的语句进行检测,判断语句是否需要进行指代消解,如是,则进入到步骤S2中;
S2.对确定为需要进行指代消解的语句进行判断,区分语句的指代类型,并从区分出指代类型的语句中筛选出候选实体;
S3.确定候选实体与语句中指代词的距离,并将距离最小的候选实体作为指代链接词;
S4.将指代词更新为指代链接词。
2.根据权利要求1所述多轮对话系统的指代消解方法,其特征在于:步骤S3中,根据如下方法确定候选实体与语句中指代词的距离:
D=α*(w1*D1+w2*D2);其中,D为候选实体与语句中指代词的距离,α为实体类型与待消解语句的类型匹配度,w1为实体与语句话题关联度系数,w2为实体替换后的句子概率系数,D1为待指代消解的语句的句向量和候选实体之间的语义距离,D2为候选实体与待指代消解语句之间的距离。
3.根据权利要求2所述多轮对话系统的指代消解方法,其特征在于:根据如下方法计算类型匹配度α:
Figure FDA0002707046530000011
其中,PL为指代词的指代类型的预测概率,Pm为候选实体内第m个字的字标签属性概率,k为候选实体中字的个数。
4.根据权利要求2所述多轮对话系统的指代消解方法,其特征在于:根据如下方法计算实体与语句话题关联度系数w1
w1=Pt;其中,Pt为当前语句的话题的前一个话题转移到当前语句的话题的概率。
5.根据权利要求2所述多轮对话系统的指代消解方法,其特征在于:所述实体替换后的句子概率系数w2计算方法为:
w2=P(s1i≥2P(si|si-1),其中:P(s1)为待消解语句中编号为1的词s1排在待消解语句句首的概率,P(si|si-1)为待消解语句的第i个词si排在第i-1个词si-1个词后的概率。
6.根据权利要求2所述多轮对话系统的指代消解方法,其特征在于:根据如下方法确定待指代消解的语句的句向量和候选实体之间的语义距离D1
Figure FDA0002707046530000021
其中,Vsen为待消解语句的句向量,Vcdt为候选实体向量,
Figure FDA0002707046530000022
Figure FDA0002707046530000023
n表示组成待消解语句的词的个数,r表示组成待消解语句的第r个词,q为组成候选实体的词的个数,j为组成候选实体的第j个词,vr为组成待消解语句的第r个词的词向量,vj为组成候选实体第j个词的词向量。
7.根据权利要求2所述多轮对话系统的指代消解方法,其特征在于:根据如下方法确定候选实体与指代句之间的距离D2
D2=eU-V,其中,U为候选实体出现的次数,V为候选实体与待消解的语句之间的间隔字符数。
8.根据权利要求1所述多轮对话系统的指代消解方法,其特征在于:步骤S1和步骤S2中,采用fasttext分类模型对语句进行检测并提取出指代词,并对语句的指代类型进行判断。
9.根据权利要求1所述多轮对话系统的指代消解方法,其特征在于:步骤S2中,采用BiLSTM_CRF深度学习模型对语句中的实体进行提取。
CN202011042444.3A 2020-09-28 2020-09-28 多轮对话系统的指代消解方法 Active CN112183060B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011042444.3A CN112183060B (zh) 2020-09-28 2020-09-28 多轮对话系统的指代消解方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011042444.3A CN112183060B (zh) 2020-09-28 2020-09-28 多轮对话系统的指代消解方法

Publications (2)

Publication Number Publication Date
CN112183060A true CN112183060A (zh) 2021-01-05
CN112183060B CN112183060B (zh) 2022-05-10

Family

ID=73945435

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011042444.3A Active CN112183060B (zh) 2020-09-28 2020-09-28 多轮对话系统的指代消解方法

Country Status (1)

Country Link
CN (1) CN112183060B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113051384A (zh) * 2021-04-26 2021-06-29 中国平安人寿保险股份有限公司 基于对话的用户画像抽取方法及相关装置
WO2023087935A1 (zh) * 2021-11-22 2023-05-25 京东方科技集团股份有限公司 指代消解方法、指代消解模型的训练方法及装置

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014002172A1 (ja) * 2012-06-25 2014-01-03 株式会社東芝 文脈解析装置および文脈解析方法
CN104462053A (zh) * 2013-09-22 2015-03-25 江苏金鸽网络科技有限公司 一种文本内的基于语义特征的人称代词指代消解方法
WO2015194934A2 (en) * 2014-06-18 2015-12-23 Mimos Berhad A system and method for entity resolution
CN105589844A (zh) * 2015-12-18 2016-05-18 北京中科汇联科技股份有限公司 一种用于多轮问答系统中缺失语义补充的方法
CN108446268A (zh) * 2018-02-11 2018-08-24 青海师范大学 藏文人称代词指代消解系统
CN108549662A (zh) * 2018-03-16 2018-09-18 北京云知声信息技术有限公司 多轮会话中语义解析结果的补充消解方法及装置
CN109446517A (zh) * 2018-10-08 2019-03-08 平安科技(深圳)有限公司 指代消解方法、电子装置及计算机可读存储介质
CN110347895A (zh) * 2019-06-11 2019-10-18 重庆工商大学融智学院 基于Web的生态空间数据爬取方法
CN110516069A (zh) * 2019-08-28 2019-11-29 中南大学 一种基于FastText-CRF的引文元数据抽取方法
CN111325034A (zh) * 2020-02-12 2020-06-23 平安科技(深圳)有限公司 多轮对话中语义补齐的方法、装置、设备及存储介质
CN111626042A (zh) * 2020-05-28 2020-09-04 成都网安科技发展有限公司 指代消解方法及装置

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014002172A1 (ja) * 2012-06-25 2014-01-03 株式会社東芝 文脈解析装置および文脈解析方法
CN104462053A (zh) * 2013-09-22 2015-03-25 江苏金鸽网络科技有限公司 一种文本内的基于语义特征的人称代词指代消解方法
WO2015194934A2 (en) * 2014-06-18 2015-12-23 Mimos Berhad A system and method for entity resolution
CN105589844A (zh) * 2015-12-18 2016-05-18 北京中科汇联科技股份有限公司 一种用于多轮问答系统中缺失语义补充的方法
CN108446268A (zh) * 2018-02-11 2018-08-24 青海师范大学 藏文人称代词指代消解系统
CN108549662A (zh) * 2018-03-16 2018-09-18 北京云知声信息技术有限公司 多轮会话中语义解析结果的补充消解方法及装置
CN109446517A (zh) * 2018-10-08 2019-03-08 平安科技(深圳)有限公司 指代消解方法、电子装置及计算机可读存储介质
CN110347895A (zh) * 2019-06-11 2019-10-18 重庆工商大学融智学院 基于Web的生态空间数据爬取方法
CN110516069A (zh) * 2019-08-28 2019-11-29 中南大学 一种基于FastText-CRF的引文元数据抽取方法
CN111325034A (zh) * 2020-02-12 2020-06-23 平安科技(深圳)有限公司 多轮对话中语义补齐的方法、装置、设备及存储介质
CN111626042A (zh) * 2020-05-28 2020-09-04 成都网安科技发展有限公司 指代消解方法及装置

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
HE JUNQING 等: "Hierarchical attention and knowledge matching networks with information enhancement for end-to-end task-oriented dialog systems", 《IEEE ACCESS》 *
JAUREGI UNANUE I.: "Improving Low-Resource Named-Entity Recognition and Neural Machine Translation", 《UNIVERSITY OF TECHNOLOGY SYDNEY》 *
冯建周 等: "基于迁移学习的细粒度实体分类方法的研究", 《自动化学报》 *
苏锦钿 等: "基于依存树及距离注意力的句子属性情感分类", 《计算机研究与发展》 *
陈晓伟: "基于中文知识图谱的问答系统的设计与实现", 《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113051384A (zh) * 2021-04-26 2021-06-29 中国平安人寿保险股份有限公司 基于对话的用户画像抽取方法及相关装置
CN113051384B (zh) * 2021-04-26 2023-09-19 中国平安人寿保险股份有限公司 基于对话的用户画像抽取方法及相关装置
WO2023087935A1 (zh) * 2021-11-22 2023-05-25 京东方科技集团股份有限公司 指代消解方法、指代消解模型的训练方法及装置

Also Published As

Publication number Publication date
CN112183060B (zh) 2022-05-10

Similar Documents

Publication Publication Date Title
CN107729313B (zh) 基于深度神经网络的多音字读音的判别方法和装置
CN111209401A (zh) 网络舆情文本信息情感极性分类处理系统及方法
CN111931506B (zh) 一种基于图信息增强的实体关系抽取方法
CN110704576B (zh) 一种基于文本的实体关系抽取方法及装置
CN111611810B (zh) 一种多音字读音消歧装置及方法
CN109960728B (zh) 一种开放域会议信息命名实体识别方法及系统
CN110516256A (zh) 一种中文命名实体提取方法及其系统
CN113283236B (zh) 一种复杂中文文本中的实体消歧方法
CN113449514B (zh) 一种适用于垂直领域的文本纠错方法及其纠错装置
CN112183060B (zh) 多轮对话系统的指代消解方法
Singh et al. HINDIA: a deep-learning-based model for spell-checking of Hindi language
CN113919366A (zh) 一种面向电力变压器知识问答的语义匹配方法和装置
Qiu et al. ChineseTR: A weakly supervised toponym recognition architecture based on automatic training data generator and deep neural network
CN112800184A (zh) 基于Target-Aspect-Opinion联合抽取的短文本评论情感分析方法
CN109086274A (zh) 基于约束模型的英文社交媒体短文本时间表达式识别方法
CN111178080A (zh) 一种基于结构化信息的命名实体识别方法及系统
Anbukkarasi et al. Neural network-based error handler in natural language processing
KR101941692B1 (ko) 한국어 개체명 인식방법 및 장치
CN116522165B (zh) 一种基于孪生结构的舆情文本匹配系统及方法
CN113705207A (zh) 语法错误识别方法及装置
CN113822052A (zh) 一种文本错误检测方法、装置、电子设备及存储介质
CN116595023A (zh) 地址信息的更新方法和装置、电子设备及存储介质
CN114781381B (zh) 基于规则和神经网络模型融合的标准指标抽取方法
Khorjuvenkar et al. Parts of speech tagging for Konkani language
CN116029300A (zh) 一种强化中文实体语义特征的语言模型训练方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant