CN105183716B - 一种基于抽象语义的智能交互方法 - Google Patents

一种基于抽象语义的智能交互方法 Download PDF

Info

Publication number
CN105183716B
CN105183716B CN201510603559.8A CN201510603559A CN105183716B CN 105183716 B CN105183716 B CN 105183716B CN 201510603559 A CN201510603559 A CN 201510603559A CN 105183716 B CN105183716 B CN 105183716B
Authority
CN
China
Prior art keywords
word
information
semantic
phrase
abstract semantics
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510603559.8A
Other languages
English (en)
Other versions
CN105183716A (zh
Inventor
李波
曾永梅
姚贡之
朱频频
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Zhizhen Intelligent Network Technology Co Ltd
Original Assignee
Shanghai Zhizhen Intelligent Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Zhizhen Intelligent Network Technology Co Ltd filed Critical Shanghai Zhizhen Intelligent Network Technology Co Ltd
Priority to CN201510603559.8A priority Critical patent/CN105183716B/zh
Publication of CN105183716A publication Critical patent/CN105183716A/zh
Application granted granted Critical
Publication of CN105183716B publication Critical patent/CN105183716B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明公开了一种基于抽象语义的智能交互方法,包括以下步骤:A、对用户发出的信息进行分词;B、对步骤A所述分词后的字、词及词组是否属于实体进行识别;C、对步骤A所述分词后的字、词及词组进行语义标注分析;D、对步骤A所述分词后的字、词及词组进行文本纠错;E、对用户发出的信息进行句法分析;F、对用户发出的信息及步骤A所述分词后的字、词及词组进行权重校正,所述步骤C中通过一组语义表达式在组成元素上进行了扩充,语义表达式的集合来描述一个语义的不同表达。本发明提高了在与机器人交互时,机器人识别指令的准确性。

Description

一种基于抽象语义的智能交互方法
技术领域
本发明涉及一种智能交互方法,更具体的说是涉及一种基于抽象语义用于智能交互的语义模型方法。
背景技术
在传统的智能交互中,智能交互的一般采用模板方式来应对复杂的对话,准确度较低,或者对信息进行各种分词后进行分析,但一般的分词结果种类多,准确度较低。
发明内容
本发明公开了一种用于智能交互的语义模型方法,包括以下步骤:
A、对用户发出的信息进行分词;
B、对步骤A所述分词后的字、词及词组是否属于实体进行识别;
C、对步骤A所述分词后的字、词及词组进行语义标注分析;
D、对步骤A所述分词后的字、词及词组进行文本纠错;
E、对用户发出的信息进行句法分析;
F、对用户发出的信息及步骤A所述分词后的字、词及词组进行权重校正;
所述步骤C中通过一组语义表达式在组成元素上进行了扩充,语义表达式的集合来描述一个语义的不同表达。
所述步骤A中的分词会基于特定领域的实例。
所述步骤C中的语义标注分析包括领域、重要度、同类词、同义词、网络用语。
所述步骤E中的句法分析根据重要度进行区分,区分方法包括开放领域和专业领域。
具体实施方式
下面对本方法进行具体说明:
A、对用户发出的信息进行分词;
分词是计算机语言学或人工智能领域的常用技术手段,一般采用“最大匹配分词法”或“最大概率法分词”;
B、对步骤A所述分词后的字、词及词组是否属于实体进行识别;
对于实体,是本体的实例化。
所谓本体,是对概念的一种明确且详细的说明,是对现实世界的一种描述方法。或者说,本体实际上就是对特定领域之中某套概念及其相互之间关系的形式化表达。一般包含:
——具体的本体实例(对象Object)
——本体的属性
——所属的本体类别。
本体实例化后,就可以继承本体的属性,为其后的语义标注分析做好准备;
C、对步骤A所述分词后的字、词及词组进行语义标注分析;
对于语义标注分析,包括词性标注和词义标注两个部分:
对于词性标注:一般采用隐马尔科夫模型或者基于转换的错误驱动的磁性标注方法;
对于词义标注:一般采用基于互信息的词义排歧方法或基于词典的排歧方法;
对于本发明来说,抽象语义语法与语义表达式语法类似,由语义成份符、词类、词、以及语法符号构成,其中语义成份符是对语义表达式在其元素上的扩充。抽象语义表达的语义粒度应该足够的细,且可以和其他语义有一定的辨析度。
当这些扩充的元素一旦被赋予了相应的值就可以表达各种各样的具体语义。
抽象语义来源于两个方面,其一是对本体类属性的抽象,其二是对一些通用语义的归纳。
具体举例来说:
1)对于行为方式的抽象:
日常生活中,很多行为都是对一种业务如何操作,这种行为就可以归纳为一个概念和一个行为,例如concept=信用卡action=申请;concept=基金action=购买,对于这种抽象语义,就可以将其通用的语义给与抽象,例如:
当经过分析,发现用户的输入语句是:
[concept]<有|用|以><何种|哪些><办法|方法|方式|流程|途径|步骤|规程|手续>[action]或者是
<如何|怎么|怎么样|怎样><才可以|才能|才能够>[action][concept]这种模式,我们就知道,实际用户是想知道关于[concept]应该如何[action];
2)行为方式的判断:
有时,某件事涉及一个动作及两个名词性概念,例如:concept1=网上银行action=办理concept2=信用卡;concept1=自由职业者action=申请concept2=贷款
当经过分析,发现用户的输入语句是:
<可以|能够|能>[concept1][action][concept2]吗
<是否|是不是>[concept1]<都|也|均><能够|可以|可|能?>支持{[action]-[concept2]}
我们也知道,用户实际是想知道[concept1]<能不能>[action][concept2];
3)行为的原因
还有时,某件事涉及一件事的原因,例如concept1=信用卡action=降低concept2=额度;concept1=电脑action=显示concept2=乱码如果经过分析,语句符合下述模式:
[concept1]<为何|为什么|怎么><就?><会?>[action][concept2]<了?>
[concept1]会[action][concept2]<的?>原因<是什么|有哪些|有什么?>
[concept1][action][concept2]<了?><是?>怎么回事
实际上都是在问
[concept1]会[action][concept2]是什么原因<造成的|导致的?>
经过上述描述的抽象,对于用户的语义理解可以更加准确。
D、对步骤A所述分词后的字、词及词组进行文本纠错;
E、对用户发出的信息进行句法分析;
F、对用户发出的信息及步骤A所述分词后的字、词及词组进行权重校正。
本系统还会根据用户数据日志来调整权重。例如:“不”字基于统计学不重要,但经过统计分析,“不”字出现及句尾比例较高,其含义完全不同,所以当“不”字出现在句尾时,例如“我能开通彩铃不”调整“不”字权重。
所述步骤A中的分词会基于特定领域的实例。
具体来说,本专利的分词会基于特定领域,因为相同的汉字或词组在不同领域其分词结果可能不同。
所述步骤C中的语义标注分析包括领域、重要度、同类词、同义词、网络用语。
所述步骤E中的句法分析根据重要度进行区分,区分方法包括开放领域和专业领域。

Claims (4)

1.一种基于抽象语义的智能交互方法,其特征在于,包括以下步骤:
A、对用户发出的信息进行分词;
B、对步骤A所述分词后的字、词及词组是否属于实体进行识别;
C、对步骤A所述分词后的字、词及词组进行语义标注分析;
D、对步骤A所述分词后的字、词及词组进行文本纠错;
E、对用户发出的信息进行句法分析;
F、对用户发出的信息及步骤A所述分词后的字、词及词组进行权重校正;
所述步骤C中抽象语义语法与语义表达式语法类似,由语义成份符、词类、词、以及语法符号构成,其中语义成份符是对语义表达式在其元素上的扩充;
在所述抽象语义语法下,将信息抽象为特定的语句进行表达;
当信息涉及行为方式自身时,所述特定的语句包括[concept]应该如何[action];
当信息涉及行为方式的判断时,所述特定的语句包括[concept1]<能不能>[action][concept2];
当信息涉及行为的原因时,所述特定的语句包括[concept1]会[action][concept2]是什么原因<造成的|导致的?>。
2.根据权利要求1所述的基于抽象语义的智能交互方法,其特征在于,所述步骤A中的分词会基于特定领域的实例。
3.根据权利要求1所述的基于抽象语义的智能交互方法,其特征在于,所述步骤C中的语义标注分析包括领域、重要度、同类词、同义词、网络用语。
4.根据权利要求1所述的基于抽象语义的智能交互方法,其特征在于,所述步骤E中的句法分析根据重要度进行区分,区分方法包括开放领域和专业领域。
CN201510603559.8A 2015-09-21 2015-09-21 一种基于抽象语义的智能交互方法 Active CN105183716B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510603559.8A CN105183716B (zh) 2015-09-21 2015-09-21 一种基于抽象语义的智能交互方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510603559.8A CN105183716B (zh) 2015-09-21 2015-09-21 一种基于抽象语义的智能交互方法

Publications (2)

Publication Number Publication Date
CN105183716A CN105183716A (zh) 2015-12-23
CN105183716B true CN105183716B (zh) 2017-12-15

Family

ID=54905805

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510603559.8A Active CN105183716B (zh) 2015-09-21 2015-09-21 一种基于抽象语义的智能交互方法

Country Status (1)

Country Link
CN (1) CN105183716B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105653620B (zh) * 2015-12-25 2020-05-22 上海智臻智能网络科技股份有限公司 智能问答系统的日志分析方法及装置
CN109063075A (zh) * 2015-12-31 2018-12-21 上海智臻智能网络科技股份有限公司 优化抽象语义库的方法、装置及存储介质
CN105677637A (zh) * 2015-12-31 2016-06-15 上海智臻智能网络科技股份有限公司 智能问答系统中抽象语义库的更新方法及更新装置
CN105631032B (zh) * 2015-12-31 2018-12-28 上海智臻智能网络科技股份有限公司 基于抽象语义推荐的问答知识库建立方法、装置及系统
CN107423432B (zh) * 2017-08-03 2020-05-12 当家移动绿色互联网技术集团有限公司 机器人区分专业问题和寒暄问题的方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101010221A (zh) * 2004-06-23 2007-08-01 全塑胶公司 包括有低通路能量吸收件的汽车部件
CN101847141A (zh) * 2010-06-03 2010-09-29 复旦大学 中文词语语义相似度度量方法
CN102866990A (zh) * 2012-08-20 2013-01-09 北京搜狗信息服务有限公司 一种主题对话方法和装置
WO2014104943A1 (en) * 2012-12-27 2014-07-03 Abbyy Development Llc Finding an appropriate meaning of an entry in a text

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101010221A (zh) * 2004-06-23 2007-08-01 全塑胶公司 包括有低通路能量吸收件的汽车部件
CN101847141A (zh) * 2010-06-03 2010-09-29 复旦大学 中文词语语义相似度度量方法
CN102866990A (zh) * 2012-08-20 2013-01-09 北京搜狗信息服务有限公司 一种主题对话方法和装置
WO2014104943A1 (en) * 2012-12-27 2014-07-03 Abbyy Development Llc Finding an appropriate meaning of an entry in a text

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Abstract Meaning Representation for Sembanking;Laura Banarescu 等;《Proceedings of the 7th Linguistic Annotation Workshop & Interoperability with Discourse》;20130809;第178-186页 *

Also Published As

Publication number Publication date
CN105183716A (zh) 2015-12-23

Similar Documents

Publication Publication Date Title
Hawkins et al. Criterial features in learner corpora: Theory and illustrations
CN105183716B (zh) 一种基于抽象语义的智能交互方法
Rastogi et al. Weighting finite-state transductions with neural context
CN108804414A (zh) 文本修正方法、装置、智能设备及可读存储介质
CN111062217B (zh) 语言信息的处理方法、装置、存储介质及电子设备
Darwish et al. Using Stem-Templates to Improve Arabic POS and Gender/Number Tagging.
CN110428823A (zh) 口语理解装置和使用该装置的口语理解方法
Rustamov et al. Sentence-level subjectivity detection using neuro-fuzzy models
Alfter et al. Towards single word lexical complexity prediction
Rozovskaya et al. Correcting grammatical verb errors
Dien et al. POS-tagger for English-Vietnamese bilingual corpus
Sampson Probabilistic parsing
CN115392264A (zh) 一种基于rasa的任务型智能多轮对话方法及相关设备
CN105302859B (zh) 一种基于互联网的智能交互系统
Lamb et al. Developing an automatic part-of-speech tagger for Scottish Gaelic
Votrubec Morphological tagging based on averaged perceptron
Hsieh et al. Improving PCFG Chinese parsing with context-dependent probability re-estimation
Balodis et al. Intent detection system based on word embeddings
Hellwig Improving the morphological analysis of classical Sanskrit
CN109871528A (zh) 语音数据的语义识别方法及装置、存储介质、计算机设备
Mahafdah et al. Arabic Part of speech Tagging using k-Nearest Neighbour and Naive Bayes Classifiers Combination.
Ram et al. Clause boundary identification using conditional random fields
Jesuraj et al. Mblp approach applied to pos tagging in Malayalam language
Tur et al. Semi-supervised learning for spoken language understanding semantic role labeling
RU2595489C2 (ru) Выделение временных выражений для текстов на естественном языке

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant