CN112183060B - 多轮对话系统的指代消解方法 - Google Patents
多轮对话系统的指代消解方法 Download PDFInfo
- Publication number
- CN112183060B CN112183060B CN202011042444.3A CN202011042444A CN112183060B CN 112183060 B CN112183060 B CN 112183060B CN 202011042444 A CN202011042444 A CN 202011042444A CN 112183060 B CN112183060 B CN 112183060B
- Authority
- CN
- China
- Prior art keywords
- sentence
- word
- candidate entity
- entity
- resolved
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 42
- 238000012216 screening Methods 0.000 claims abstract description 4
- 239000013598 vector Substances 0.000 claims description 25
- 238000013136 deep learning model Methods 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000013145 classification model Methods 0.000 claims description 3
- 230000002452 interceptive effect Effects 0.000 abstract description 6
- 238000012549 training Methods 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 230000007087 memory ability Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Data Mining & Analysis (AREA)
- Biophysics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Molecular Biology (AREA)
- Evolutionary Computation (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Probability & Statistics with Applications (AREA)
- Databases & Information Systems (AREA)
- Machine Translation (AREA)
Abstract
本发明提供的一种多轮对话系统的指代消解方法,包括以下步骤:S1.对多轮对话系统所接收到的语句进行检测,判断语句是否需要进行指代消解,如是,则进入到步骤S2中;S2.对确定为需要进行指代消解的语句进行判断,区分语句的指代类型,并从区分出指代类型的语句中筛选出候选实体;语句的指代类型包括回指语句和共指语句;S3.确定候选实体与语句中指代词的距离,并将距离最小的候选实体作为指代链接词;S4.将指代词更新为指代链接词;通过上述方法,能够对输入多轮对话系统的语句的指代进行准确的识别,并进行准确的指代消解,能有效提高多轮交互系统的顺畅性,提升用户体验。
Description
技术领域
本发明涉及人机对话语言处理领域,尤其涉及一种多轮对话系统的指代消解方法。
背景技术
指代是一种常见的语言现象。在多轮对话系统中,指代和省略影响人机对话系统的流畅度和用户体验。人脑具有知识背景和记忆能力,能够很好的重现对话历史的关键信息,自动补全或者替换对方当前轮的代词,来理解对话的真正含义。同样,人机对话系统中需要指代消解模块,来理解用户输入的真正语义。
指代消解方法分为基于管道的方法和基于端到端的方法。基于管道的方法是先进行指代检测,然后再进行指代消解。基于端到端的方法,对输入层编码,通过中间层的计算,输出指代消解结果,常见的基于端到端的方法有基于联合训练的方法、基于序列标注的方法、基于指针网络的方法。基于端到端的方法通常采用深度学习模型,但是需要大量带标签的标注数据,在面对领域数据缺乏时模型构建成本较高,尤其在初期是多轮指代消解标注数据缺乏,且在实际应用中遇到问题,模型修改迭代不满足线上系统的及时性。
因此,为了解决上述技术问题,亟需提出一种新的技术手段加以解决。
发明内容
有鉴于此,本发明的目的是提供一种多轮对话系统的指代消解方法,能够对输入多轮对话系统的语句的指代进行准确的识别,并进行准确的指代消解,能有效提高多轮交互系统的顺畅性,提升用户体验。
本发明提供的一种多轮对话系统的指代消解方法,包括以下步骤:
S1.对多轮对话系统所接收到的语句进行检测,判断语句是否需要进行指代消解,如是,则进入到步骤S2中;
S2.对确定为需要进行指代消解的语句进行判断,区分语句的指代类型,并从区分出指代类型的语句中筛选出候选实体;
S3.确定候选实体与语句中指代词的距离,并将距离最小的候选实体作为指代链接词;
S4.将指代词更新为指代链接词。
进一步,步骤S3中,根据如下方法确定候选实体与语句中指代词的距离:
D=α*(w1*D1+w2*D2);其中,D为候选实体与语句中指代词的距离,α为实体类型与待消解语句的类型匹配度,w1为实体与语句话题关联度系数,w2为实体替换后的句子概率系数,D1为待指代消解的语句的句向量和候选实体之间的语义距离,D2为候选实体与待指代消解语句之间的距离。
进一步,根据如下方法计算类型匹配度α:
进一步,根据如下方法计算实体与语句话题关联度系数w1:
w1=Pt;其中,Pt为当前语句的话题的前一个话题转移到当前语句的话题的概率。
进一步,所述实体替换后的句子概率系数w2计算方法为:
w2=P(s1)∏i≥2P(si|si-1),其中:P(s1)为待消解语句中编号为1的词s1排在待消解语句句首的概率,P(si|si-1)为待消解语句的第i个词si排在第i-1个词si-1个词后的概率。
进一步,根据如下方法确定待指代消解的语句的句向量和候选实体之间的语义距离D1:
进一步,根据如下方法确定候选实体与指代句之间的距离D2:
D2=eU-V,其中,U为候选实体出现的次数,V为候选实体与待消解的语句之间的间隔字符数。
进一步,步骤S1和步骤S2中,采用fasttext分类模型对语句进行检测并提取出指代词,并对语句的指代类型进行判断。
进一步,步骤S2中,采用BiLSTM_CRF深度学习模型对语句中的实体进行提取。
本发明的有益效果:通过本发明,能够对输入多轮对话系统的语句的指代进行准确的识别,并进行准确的指代消解,能有效提高多轮交互系统的顺畅性,提升用户体验。
附图说明
下面结合附图和实施例对本发明作进一步描述:
图1为本发明的流程图。
具体实施方式
以下对本发明做出进一步详细说明:
本发明提供的一种多轮对话系统的指代消解方法,包括以下步骤:
S1.对多轮对话系统所接收到的语句进行检测,判断语句是否需要进行指代消解,如是,则进入到步骤S2中;其中,输入到多轮对话系统的语句可以是语音语句,也可以是文字语句;
S2.对确定为需要进行指代消解的语句进行判断,区分语句的指代类型,并从区分出指代类型的语句中筛选出候选实体;
S3.确定候选实体与语句中指代词的距离,并将距离最小的候选实体作为指代链接词;
S4.将指代词更新为指代链接词;通过上述方法,能够对输入多轮对话系统的语句的指代进行准确的识别,并进行准确的指代消解,能有效提高多轮交互系统的顺畅性,提升用户体验。其中:
步骤S1和步骤S2中,采用fasttext分类模型对语句进行检测并提取出指代词,并对语句的指代类型进行判断。
步骤S2中,采用BiLSTM_CRF深度学习模型对语句中的实体进行提取。
指代消解主要目的是对代词进行替换,在这之前,需对指代词进行检测及提取,其中,指代词比如“他”、“她”、“它”、“这”、“那”等等;实体比如人名、物名、地名、机构名称等;
对于BiLSTM_CRF深度学习模型,此为一个现有技术,模型第一层为数据表示层,对于一段输入序列,该层将每一字符映射为向量表示,本实施例中采用word2vec;BiLSTM层。LSTM在RNN的基础上增加了输入门、遗忘门、输出门,能够根据信息特征的重要性进行保留与遗忘,解决了神经网络中长序列依赖问题。神经网络可以根据文本中词的分布式表示自动提取特征,字向量的BiLSTM-CRF模型,在BiLSTM输出预测曾后,CRF层可以为最后预测的标签添加一些约束来保证预测的标签是合法的。在训练数据训练过程中,这些约束可以通过CRF层自动学习到,最后输出序列化的标签,标签第一级采用BIOES表示,其中B实体词的开始,I表示实体词的中间字或词,E表示实体词的结束,S表示单字实体,O表示为非实体字或词。二级标签采用实体类别的英文表示。例如,人名类实体标签分别为B-PER,I-PER,E-PER,S-PER,O-PER。
本实施例中,步骤S3中,根据如下方法确定候选实体与语句中指代词的距离:
D=α*(w1*D1+w2*D2);其中,D为候选实体与语句中指代词的距离,α为类型匹配度,w1为权重值,w2为权重值,D1为待指代消解的语句的句向量和候选实体之间的语义距离,D2为候选实体与指代句之间的距离。
具体地:根据如下方法计算类型匹配度α:
根据如下方法计算实体与语句话题关联度系数w1:
w1=Pt;其中,Pt为当前语句的话题的前一个话题转移到当前语句的话题的概率。
所述实体替换后的句子概率系数w2计算方法为:
w2=P(s1)∏i≥2P(si|si-1),其中:P(s1)为待消解语句中编号为1的词s1排在待消解语句句首的概率,P(si|si-1)为待消解语句的第i个词si排在第i-1个词si-1个词后的概率。
根据如下方法确定待指代消解的语句的句向量和候选实体之间的语义距离D1:
n表示组成待消解语句的词的个数,r表示组成待消解语句的第r个词,q为组成候选实体的词的个数,j为组成候选实体的第j个词,vr为组成待消解语句的第r个词的词向量,vj为组成候选实体第j个词的词向量,其中,词向量为将待指代消解语句的每个字按照既定映射关系映射成向量表示,采用word2vec模型实现,为该模型为现有技术,在此不加以赘述。
根据如下方法确定候选实体与指代句之间的距离D2:
D2=eU-V,其中,U为候选实体出现的次数,V为候选实体与待消解的语句之间的间隔字符数,通过上述方法,能够准确地对指代语句进行实体更新替换,从而确保替换结果的准确性。
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。
Claims (3)
1.一种多轮对话系统的指代消解方法,其特征在于:包括以下步骤:
S1.对多轮对话系统所接收到的语句进行检测,判断语句是否需要进行指代消解,如是,则进入到步骤S2中;
S2.对确定为需要进行指代消解的语句进行判断,区分语句的指代类型,并从区分出指代类型的语句中筛选出候选实体;
S3.确定候选实体与语句中指代词的距离,并将距离最小的候选实体作为指代链接词;
S4.将指代词更新为指代链接词;
步骤S3中,根据如下方法确定候选实体与语句中指代词的距离:
D=α*(w1*D1+w2*D2);其中,D为候选实体与语句中指代词的距离,α为实体类型与待消解语句的类型匹配度,w1为实体与语句话题关联度系数,w2为实体替换后的句子概率系数,D1为待指代消解的语句的句向量和候选实体之间的语义距离,D2为候选实体与待指代消解语句之间的距离;
根据如下方法计算类型匹配度α:
根据如下方法计算实体与语句话题关联度系数w1:
w1=Pt;其中,Pt为当前语句的话题的前一个话题转移到当前语句的话题的概率;
所述实体替换后的句子概率系数w2计算方法为:
w2=P(s1)∏i≥2P(si|si-1),其中:P(s1)为待消解语句中编号为1的词s1排在待消解语句句首的概率,P(si|si-1)为待消解语句的第i个词si排在第i-1个词si-1个词后的概率;
根据如下方法确定待指代消解的语句的句向量和候选实体之间的语义距离D1:
根据如下方法确定候选实体与指代句之间的距离D2:
D2=eU-V,其中,U为候选实体出现的次数,V为候选实体与待消解的语句之间的间隔字符数。
2.根据权利要求1所述多轮对话系统的指代消解方法,其特征在于:步骤S1和步骤S2中,采用fasttext分类模型对语句进行检测并提取出指代词,并对语句的指代类型进行判断。
3.根据权利要求1所述多轮对话系统的指代消解方法,其特征在于:步骤S2中,采用BiLSTM_CRF深度学习模型对语句中的实体进行提取。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011042444.3A CN112183060B (zh) | 2020-09-28 | 2020-09-28 | 多轮对话系统的指代消解方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011042444.3A CN112183060B (zh) | 2020-09-28 | 2020-09-28 | 多轮对话系统的指代消解方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112183060A CN112183060A (zh) | 2021-01-05 |
CN112183060B true CN112183060B (zh) | 2022-05-10 |
Family
ID=73945435
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011042444.3A Active CN112183060B (zh) | 2020-09-28 | 2020-09-28 | 多轮对话系统的指代消解方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112183060B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113051384B (zh) * | 2021-04-26 | 2023-09-19 | 中国平安人寿保险股份有限公司 | 基于对话的用户画像抽取方法及相关装置 |
CN114117001A (zh) * | 2021-11-22 | 2022-03-01 | 京东方科技集团股份有限公司 | 指代消解方法、指代消解模型的训练方法及装置 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014002172A1 (ja) * | 2012-06-25 | 2014-01-03 | 株式会社東芝 | 文脈解析装置および文脈解析方法 |
CN104462053A (zh) * | 2013-09-22 | 2015-03-25 | 江苏金鸽网络科技有限公司 | 一种文本内的基于语义特征的人称代词指代消解方法 |
WO2015194934A2 (en) * | 2014-06-18 | 2015-12-23 | Mimos Berhad | A system and method for entity resolution |
CN105589844A (zh) * | 2015-12-18 | 2016-05-18 | 北京中科汇联科技股份有限公司 | 一种用于多轮问答系统中缺失语义补充的方法 |
CN108446268A (zh) * | 2018-02-11 | 2018-08-24 | 青海师范大学 | 藏文人称代词指代消解系统 |
CN108549662A (zh) * | 2018-03-16 | 2018-09-18 | 北京云知声信息技术有限公司 | 多轮会话中语义解析结果的补充消解方法及装置 |
CN109446517A (zh) * | 2018-10-08 | 2019-03-08 | 平安科技(深圳)有限公司 | 指代消解方法、电子装置及计算机可读存储介质 |
CN110347895A (zh) * | 2019-06-11 | 2019-10-18 | 重庆工商大学融智学院 | 基于Web的生态空间数据爬取方法 |
CN110516069A (zh) * | 2019-08-28 | 2019-11-29 | 中南大学 | 一种基于FastText-CRF的引文元数据抽取方法 |
CN111325034A (zh) * | 2020-02-12 | 2020-06-23 | 平安科技(深圳)有限公司 | 多轮对话中语义补齐的方法、装置、设备及存储介质 |
CN111626042A (zh) * | 2020-05-28 | 2020-09-04 | 成都网安科技发展有限公司 | 指代消解方法及装置 |
-
2020
- 2020-09-28 CN CN202011042444.3A patent/CN112183060B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014002172A1 (ja) * | 2012-06-25 | 2014-01-03 | 株式会社東芝 | 文脈解析装置および文脈解析方法 |
CN104462053A (zh) * | 2013-09-22 | 2015-03-25 | 江苏金鸽网络科技有限公司 | 一种文本内的基于语义特征的人称代词指代消解方法 |
WO2015194934A2 (en) * | 2014-06-18 | 2015-12-23 | Mimos Berhad | A system and method for entity resolution |
CN105589844A (zh) * | 2015-12-18 | 2016-05-18 | 北京中科汇联科技股份有限公司 | 一种用于多轮问答系统中缺失语义补充的方法 |
CN108446268A (zh) * | 2018-02-11 | 2018-08-24 | 青海师范大学 | 藏文人称代词指代消解系统 |
CN108549662A (zh) * | 2018-03-16 | 2018-09-18 | 北京云知声信息技术有限公司 | 多轮会话中语义解析结果的补充消解方法及装置 |
CN109446517A (zh) * | 2018-10-08 | 2019-03-08 | 平安科技(深圳)有限公司 | 指代消解方法、电子装置及计算机可读存储介质 |
CN110347895A (zh) * | 2019-06-11 | 2019-10-18 | 重庆工商大学融智学院 | 基于Web的生态空间数据爬取方法 |
CN110516069A (zh) * | 2019-08-28 | 2019-11-29 | 中南大学 | 一种基于FastText-CRF的引文元数据抽取方法 |
CN111325034A (zh) * | 2020-02-12 | 2020-06-23 | 平安科技(深圳)有限公司 | 多轮对话中语义补齐的方法、装置、设备及存储介质 |
CN111626042A (zh) * | 2020-05-28 | 2020-09-04 | 成都网安科技发展有限公司 | 指代消解方法及装置 |
Non-Patent Citations (5)
Title |
---|
Hierarchical attention and knowledge matching networks with information enhancement for end-to-end task-oriented dialog systems;He Junqing 等;《IEEE Access》;20190114;第7卷;18871-18883 * |
Improving Low-Resource Named-Entity Recognition and Neural Machine Translation;Jauregi Unanue I.;《University of Technology Sydney》;20200630;1-170 * |
基于中文知识图谱的问答系统的设计与实现;陈晓伟;《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑》;20191215(第12期);I138-807 * |
基于依存树及距离注意力的句子属性情感分类;苏锦钿 等;《计算机研究与发展》;20190815;第56卷(第8期);1731-1745 * |
基于迁移学习的细粒度实体分类方法的研究;冯建周 等;《自动化学报》;20190918;第46卷(第8期);1759-1766 * |
Also Published As
Publication number | Publication date |
---|---|
CN112183060A (zh) | 2021-01-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108304372B (zh) | 实体提取方法和装置、计算机设备和存储介质 | |
Kim et al. | Two-stage multi-intent detection for spoken language understanding | |
CN107729313B (zh) | 基于深度神经网络的多音字读音的判别方法和装置 | |
CN111611810B (zh) | 一种多音字读音消歧装置及方法 | |
WO2018028077A1 (zh) | 一种基于深度学习的中文语义分析的方法及装置 | |
CN109960728B (zh) | 一种开放域会议信息命名实体识别方法及系统 | |
CN110704576B (zh) | 一种基于文本的实体关系抽取方法及装置 | |
CN110489760A (zh) | 基于深度神经网络文本自动校对方法及装置 | |
CN112528649B (zh) | 针对多语言混合文本的英文拼音识别方法和系统 | |
Singh et al. | HINDIA: a deep-learning-based model for spell-checking of Hindi language | |
CN113449514B (zh) | 一种适用于垂直领域的文本纠错方法及其纠错装置 | |
CN117454906B (zh) | 一种基于自然语言处理和机器学习的文字校对方法与系统 | |
CN112183060B (zh) | 多轮对话系统的指代消解方法 | |
CN114298035A (zh) | 一种文本识别脱敏方法及其系统 | |
Qiu et al. | ChineseTR: A weakly supervised toponym recognition architecture based on automatic training data generator and deep neural network | |
CN116595023A (zh) | 地址信息的更新方法和装置、电子设备及存储介质 | |
Anbukkarasi et al. | Neural network-based error handler in natural language processing | |
CN114781381A (zh) | 基于规则和神经网络模型融合的标准指标抽取方法 | |
CN111178080A (zh) | 一种基于结构化信息的命名实体识别方法及系统 | |
KR101941692B1 (ko) | 한국어 개체명 인식방법 및 장치 | |
US20220284191A1 (en) | Neural tagger with deep multi-level model | |
CN116522165B (zh) | 一种基于孪生结构的舆情文本匹配系统及方法 | |
CN111723583B (zh) | 基于意图角色的语句处理方法、装置、设备及存储介质 | |
CN113012685B (zh) | 音频识别方法、装置、电子设备及存储介质 | |
CN113705207A (zh) | 语法错误识别方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |