CN106294321A - 一种特定领域的对话挖掘方法及装置 - Google Patents

一种特定领域的对话挖掘方法及装置 Download PDF

Info

Publication number
CN106294321A
CN106294321A CN201610633391.XA CN201610633391A CN106294321A CN 106294321 A CN106294321 A CN 106294321A CN 201610633391 A CN201610633391 A CN 201610633391A CN 106294321 A CN106294321 A CN 106294321A
Authority
CN
China
Prior art keywords
specific area
dialogue
language material
resource
multimedia session
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610633391.XA
Other languages
English (en)
Other versions
CN106294321B (zh
Inventor
郭瑞
郭祥
雷宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Rubu Technology Co.,Ltd.
Original Assignee
Beijing Intelligent Housekeeper Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Intelligent Housekeeper Technology Co Ltd filed Critical Beijing Intelligent Housekeeper Technology Co Ltd
Priority to CN201610633391.XA priority Critical patent/CN106294321B/zh
Publication of CN106294321A publication Critical patent/CN106294321A/zh
Application granted granted Critical
Publication of CN106294321B publication Critical patent/CN106294321B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

本发明实施例公开了一种特定领域的对话挖掘方法及装置。该方法包括:收集特定领域的多媒体对话资源;依据所述多媒体对话资源构建所述特定领域的对话语料;对所述对话语料进行分词、词性标注和实体识别处理;依据处理结果确定所述特定领域的对话特征。本发明实施例提供的技术方案,针对特定领域对话环境做特殊优化得到特定领域的对话特征,满足了特定领域的对话需求,提升了特定领域用户体验。

Description

一种特定领域的对话挖掘方法及装置
技术领域
本发明实施例涉及语言处理技术领域,尤其涉及一种特定领域的对话挖掘方法及装置。
背景技术
对话交互是智能硬件的一个基本功能,而目前的对话系统多数面向通用,不能直接应用于特定领域,特定领域的对话环境要求特殊,如儿童领域需要去除脏话、成人、政治和暴力等敏感信息,并且有特殊的对话内容和对话习惯。
然而,目前尚且缺乏针对特定领域对话环境做特殊优化,无法真正满足特定领域对话需求。
发明内容
本发明实施例提供一种特定领域的对话挖掘方法及装置,以通过对特定领域对话环境做特殊优化来满足特定领域对话需求。
本发明实施例提供了一种特定领域的对话挖掘方法,包括:
收集特定领域的多媒体对话资源;
依据所述多媒体对话资源构建所述特定领域的对话语料;
对所述对话语料进行分词、词性标注和实体识别处理;
依据处理结果确定所述特定领域的对话特征。
另一方面,本发明实施例还提供了一种特定领域的对话挖掘装置,包括:
资源收集模块,用于收集特定领域的多媒体对话资源;
语料构建模块,用于依据所述多媒体对话资源构建所述特定领域的对话语料;
语料处理模块,用于对所述对话语料进行分词、词性标注和实体识别处理;
对话特征模块,用于依据处理结果确定所述特定领域的对话特征。
本发明实施例提供的技术方案,通过收集特定领域的多媒体对话资源,并依据收集的多媒体对话资源构建特定领域的对话语料,对构建的对话语料进行分词、词性标注和实体识别处理,并依据处理结果确定特定领域的对话特征,即针对特定领域对话环境做特殊优化得到特定领域的对话特征,满足了特定领域的对话需求,提升了特定领域用户体验。
附图说明
图1为本发明实施例一中提供的一种特定领域的对话挖掘方法的流程图;
图2为本发明实施例二中提供的一种特定领域的对话挖掘方法的流程图;
图3为本发明实施例三中提供的一种特定领域的对话挖掘方法的流程图;
图4a为本发明实施例四中提供的一种特定领域的对话挖掘方法的流程图;
图4b为本发明实施例四中提供的一种知识图谱的示意图;
图5为本发明实施例五中提供的一种特定领域的对话挖掘装置的结构图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1为本发明实施例一中提供的一种特定领域的对话挖掘方法的流程图。本实施例的方法可以由特定领域的对话挖掘装置来执行,该装置可通过硬件和/或软件的方式实现。参考图1,本实施例提供的特定领域的对话挖掘方法具体可以包括如下:
步骤11、收集特定领域的多媒体对话资源。
在本实施例中,特征领域指的是儿童领域或外语领域等非通用领域,多媒体对话资源不仅可以包括对话内容还可以包括描述性内容,如旁白内容。为了便于理解,以特定领域为儿童领域为例进行说明。具体的,收集包含儿童对话的多媒体对话资源,其中对话资源的格式可以是文本、音频或视频,文本对话资源可以包含各种儿童读物,如童话故事、成语故事、寓言故事、民间故事和儿童小说等,音频和视频对话资源可以包含有声读物、动画动漫和儿童节目等,儿童节目可以是儿童类真人秀节目和儿童访谈节目等。
步骤12、依据所述多媒体对话资源构建所述特定领域的对话语料。
将音频和视频对话资源转换成文本对话资源。具体的,针对音频对话资源作如下处理:将音频对话资源转换成文本,使用声纹技术将声纹特征记录到文本中;解析转换得到的文本中包含的称呼、称谓及代指;依据声纹特征和文本内容做关系推理,推理出声纹特征对应的称呼、称谓及代指;以声纹特征为基准,将推理出的称呼、称谓及代指记录到对应的文本中;将音频对话资源转换为文本对话语料。针对视频对话资源作如下处理:提取视频对话资源包含的画面中的图片字幕,利用光学字符识别(Optical Character Recognition,OCR)技术将图片字幕转换成文本;提取视频画面中说话的实体,对实体进行编码,记录到文本中;依据图像编码和文本内容做关系推理,推理出图像编码对应的称呼、称谓及代指;以图像特征为基准,将推理出的称呼、称谓及代指记录到文本中;也可以使用声纹特征识别视频中当前的说话实体;将视频对话资源转换为文本对话语料。
步骤13、对所述对话语料进行分词、词性标注和实体识别处理。
分词是对对话语料进行分析和理解的基础。词性标注是指将词语进行分类,可以将句子中具体词的组合关系抽象成词类之间的组合关系,进而得到句法结果的规律。一个词的不同词性往往对应不同的含义,所以确定词的词性对于分析词和句子的语义也很重要。实体识别是指识别出对话语料中包含的人名、动物名或地名等命名实体。
步骤14、依据处理结果确定所述特定领域的对话特征。
具体的,依据对对话语料进行分词、词性标注和实体识别的处理结果,确定特定领域的对话模式、语法模式或知识图谱,将得到的对话模式、语法模式和知识图谱作为特定领域的对话特征。由于特征领域的对话特征是依据特定领域的多媒体对话资源经分词、词性标注和实体识别等处理得到的,因而特征领域的对话特征能够满足特定领域对话需求,提升了特定领域的用户体验。
示例性的,得到特定领域的对话特征之后,还可以采用多种方式对对话特征进行格式化处理,包括但不限于问答、树状和图状方式等。其中,问答方式是指采用“问题-答案”方式存储,存储问题及该问题对应的答案,可按并列或者递进的方式存储,问答方式可以为单问答(一问一答)和连续问答(多个单问答的组合)方式。树状方式是指采用树状结构进行存储,包含问题节点和答案节点两类树节点,其中问题节点存储问题,在该节点下建立答案节点,存储该问题对应的答案,问题节点之下也可以建立问题节点,表示和该节点相关的问题。图状方式是指采用图状结构进行存储,包含问题节点和答案节点两类图节点,其中问题节点存储问题,答案节点存储答案,且问题和答案、问题和问题、答案和答案都可以互相连接,表示其相关性。
需要说明的是,特定领域的对话特征可以存储在云端,构建云端存储器,可通过网络协议访问将特定领域的对话特征将存储到云端。特定领域的对话特征也可以存储在客户端,如存储于在机器人、智能硬件等客户端的存储器中。另外,为兼容客户端空间不易扩展的特性,以及客户端的内容支持动态更新,也可以使用本地更新和云端更新的方式进行存储。
本实施例提供的技术方案,通过收集特定领域的多媒体对话资源,并依据收集的多媒体对话资源构建特定领域的对话语料,对构建的对话语料进行分词、词性标注和实体识别处理,并依据处理结果确定特定领域的对话特征,即针对特定领域对话环境做特殊优化得到特定领域的对话特征,满足了特定领域的对话需求,提升了特定领域用户体验。
示例性的,依据所述多媒体对话资源构建所述特定领域的对话语料,可以包括:
将音频对话资源和/或视频对话资源转化为文本对话资源;
解析所述文本对话资源中包含的称谓信息;
依据所述称谓信息,将所述特定领域的所述文本对话资源处理成对话文本,以得到所述特定领域的对话语料。
示例性的,依据处理结果确定所述特定领域的对话特征之后,可以包括:
获取用户输入的查询语句;
依据所述特定领域的对话特征,确定所述查询语句的查询结果。
实施例二
本实施例在上述实施例一的基础上,提供了一种新的特定领域的对话挖掘方法。图2为本发明实施例二中提供的一种特定领域的对话挖掘方法的流程图。参考图2,本实施例提供的特定领域的对话挖掘方法具体可以包括如下:
步骤21、收集特定领域的多媒体对话资源。
具体的,收集特定领域的文本、音频和视频格式的对话资源。
步骤22、依据所述多媒体对话资源构建所述特定领域的对话语料。
具体的,将收集的音频对话资源和视频对话资源转换为文本对话资源,并推理步骤21中收集到的以及步骤22中转换到的文本对话资源中包含的称呼、称谓以及代指,且依据推理得到的称呼、称谓以及代指将所有的文本对话资源转换为对话语料。
步骤23、对所述对话语料进行分词、词性标注和实体识别处理。
以对话语料“妈妈:明明饿吗?;小明:吃牛牛”为例,经分词得到词组:妈妈、明明、饿吗、小明、吃、牛牛,经词性标注得到:明明是名词,饿是形容词、吃是动词、牛牛是名词,对应的实体有妈妈、明明和小明。
步骤24、依据所述对话语料的问答顺序,以及对所述对话语料进行分词、词性标注和实体识别的处理结果,得到所述特定领域的对话问答模式。
仍以对话语料“妈妈:明明饿吗?;小明:吃牛牛”为例,得到“问:*(名词)饿吗?答:吃*(名词)”是儿童领域的对话问答模式。
本实施例提供的技术方案,通过收集特定领域的多媒体对话资源,并依据收集的多媒体对话资源构建特定领域的对话语料,对构建的对话语料进行分词、词性标注和实体识别处理,并依据处理结果确定特定领域的对话问答模式,即针对特定领域对话环境做特殊优化得到特定领域的对话问答模式,满足了特定领域的对话需求,提升了特定领域用户体验。
实施例三
本实施例在上述实施例一的基础上,提供了一种新的特定领域的对话挖掘方法。图3为本发明实施例三中提供的一种特定领域的对话挖掘方法的流程图。参考图3,本实施例提供的特定领域的对话挖掘方法具体可以包括如下:
步骤31、收集特定领域的多媒体对话资源。
具体的,收集特定领域的文本、音频和视频格式的对话资源。
步骤32、依据所述多媒体对话资源构建所述特定领域的对话语料。
具体的,将收集的音频对话资源和视频对话资源转换为文本对话资源,并推理步骤31中收集到的以及步骤32中转换到的文本对话资源中包含的称呼、称谓以及代指,且依据推理得到的称呼、称谓以及代指将所有的文本对话资源转换为对话语料。
步骤33、对所述对话语料进行分词、词性标注和实体识别处理。
以对话语料“妈妈:宝宝吃什么?小明:苹果七七”为例,经分词得到词组:妈妈、宝宝、吃、什么、小明、苹果和七七,经词性标注得到:宝宝是名词,吃是动词,什么是代词,苹果是名词,七七是动词,对应的实体有妈妈、宝宝和小明。
步骤34、依据对所述对话语料进行分词、词性标注和实体识别的处理结果,提取所述对话语料的语气词和语法模式。
其中,儿童领域对话语料的语气词可以包括拖长音、叠词和字节模糊词等,如识别出“小明:苹果七七”中包含的叠词以及字节模糊词“七七(吃吃)”,并且得到宾语+谓语是儿童领域的语法模式。
步骤35、对所述对话语料的语气词和语法模式进行筛选,得到符合特定领域对话习惯的语气词和语法模式。
具体的,可以采用人工方式对步骤34中得到的语气词和语法模式进行筛选,得到符合特定领域对话习惯的语气词和语法模式,也可以依据语气词和语法模式出现的频次自动地对对话语料的语气词和语法模式进行筛选,例如针对得到的每一语气词,若该语气词出现的频次小于第一频次阈值,则滤除该语气词;否则,保留该语气词;针对得到的每一语法模式,若该语法模式出现的频次小于第二频次阈值,则滤除该语法模式;否则,保留该语法模式。
本实施例提供的技术方案,通过收集特定领域的多媒体对话资源,并依据收集的多媒体对话资源构建特定领域的对话语料,对构建的对话语料进行分词、词性标注和实体识别处理,并依据处理结果提取对话语料的语气词和语法模式,并对提取的语气词和语法模式进行筛选,即针对特定领域对话环境做特殊优化得到符合特定领域对话习惯的语气词和语法模式,满足了特定领域的对话需求,提升了特定领域用户体验。
实施例四
本实施例在上述实施例一的基础上,提供了一种新的特定领域的对话挖掘方法。图4a为本发明实施例四中提供的一种特定领域的对话挖掘方法的流程图。参考图4a,本实施例提供的特定领域的对话挖掘方法具体可以包括如下:
步骤41、收集特定领域的多媒体对话资源。
具体的,收集特定领域的文本、音频和视频格式的对话资源。
步骤42、依据所述多媒体对话资源构建所述特定领域的对话语料。
具体的,将收集的音频对话资源和视频对话资源转换为文本对话资源,并推理步骤41中收集到的以及步骤42中转换到的文本对话资源中包含的称呼、称谓以及代指,且依据推理得到的称呼、称谓以及代指将所有的文本对话资源转换为对话语料。
步骤43、对所述对话语料进行分词、词性标注和实体识别处理。
步骤44、依据处理结果确定所述特定领域的对话特征。
具体的,依据处理结果可以确定特定领域的对话问答模式和/或语法模式。
步骤45、对收集的多媒体对话资源进行实体、属性及关系识别。
实体是指特定领域的对话语料中包含的人物或动物等可命名对象。属性指的是实体的年龄、性别或地址等信息,关系指的是不同实体之间的相互关系,如可以是母女关系、主仆关系或朋友关系等。不同特定领域可以定义有不同实体、属性及关系。具体的,在对对话语料进行分词、词性标注和实体识别处理之后,还对处理结果进行实体、属性以及关系标注。以对话资源是白雪公主童话故事为例,对应的实体有国王、白雪公主、新王后和小矮人等,对应的关系有:白雪公主与国王是父女关系,白雪公主与新王后是继母女关系,国王与新王后是夫妻关系,白雪公主与小矮人是朋友关系等。
需要说明的是,在对多媒体对话资源进行识别之前,还对多媒体对话资源进行分词处理。
步骤46、依据所述多媒体对话资源中包含的实体、属性及关系,构建所述特定领域的知识图谱。
具体的,依据多媒体资源中包含的实体、属性以及关系,可以构建以实体作为节点,以关系作为边的知识图谱;也可以构建以实体和属性为几点,以关系作为边的知识图谱。
知识图谱可以作为特定领域内用户的对话基础,在构建知识图谱之后包括:获取用户输入的查询语句;基于特定领域的知识图谱,确定所述查询语句的查询结果。具体的,获取用户输入的查询语句之后,可以解析出查询语句对应的实体、属性以及关系,并依据解析结果和知识图谱,推理出查询语句的答案。参考图4b,以查询语句是“白雪公主后母是谁”为例,根据知识图谱得到与白雪公主是继母女关系的是新王后,从而推理出查询语句的答案是新王后。
本实施例提供的技术方案,通过收集特定领域的多媒体对话资源,对多媒体对话资源进行实体、属性及关系识别,依据所述多媒体对话资源中包含的实体、属性及关系,构建所述特定领域的知识图谱,即针对特定领域对话环境做特殊优化得到符合特定领域对话习惯的知识图谱,满足了特定领域的对话需求,提升了特定领域用户体验。
实施例五
本实施例提供了一种特定领域的对话挖掘装置。图5为本发明实施例五中提供的一种特定领域的对话挖掘装置的结构图,如图5所示,该特定领域的对话挖掘装置可以包括:
资源收集模块51,用于收集特定领域的多媒体对话资源;
语料构建模块52,用于依据所述多媒体对话资源构建所述特定领域的对话语料;
语料处理模块53,用于对所述对话语料进行分词、词性标注和实体识别处理;
对话特征模块54,用于依据处理结果确定所述特定领域的对话特征。
示例性的,对话特征模块54具体可以用于:
依据所述对话语料的问答顺序,以及对所述对话语料进行分词、词性标注和实体识别的处理结果,得到所述特定领域的对话问答模式。
示例性的,对话特征模块54具体可以用于:
依据对所述对话语料进行分词、词性标注和实体识别的处理结果,提取所述对话语料的语气词和语法模式;
对所述对话语料的语气词和语法模式进行筛选,得到符合特定领域对话习惯的语气词和语法模式。
示例性的,上述特定领域的对话挖掘装置还可以包括:
资源识别模块,用于收集特定领域的多媒体对话资源之后,对收集的多媒体对话资源进行实体、属性及关系识别;
知识图谱模块,用于依据所述多媒体对话资源中包含的实体、属性及关系,构建所述特定领域的知识图谱。
示例性的,其特征在于,语料构建模块52具体可以用于:
将音频对话资源和/或视频对话资源转化为文本对话资源;
解析所述文本对话资源中包含的称谓信息;
依据所述称谓信息,将所述特定领域的所述文本对话资源处理成对话文本,以得到所述特定领域的对话语料。
示例性,上述特定领域的对话挖掘装置可以包括:
查询语句模块,用于在依据处理结果确定所述特定领域的对话特征之后,获取用户输入的查询语句;
查询结果模块,用于依据所述特定领域的对话特征,确定所述查询语句的查询结果。
本实施例提供的特定领域的对话挖掘装置,与本发明任意实施例所提供的特定领域的对话挖掘方法属于同一发明构思,可执行本发明任意实施例所提供的特定领域的对话挖掘方法,具备执行特定领域的对话挖掘方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本发明任意实施例提供的特定领域的对话挖掘法。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (10)

1.一种特定领域的对话挖掘方法,其特征在于,包括:
收集特定领域的多媒体对话资源;
依据所述多媒体对话资源构建所述特定领域的对话语料;
对所述对话语料进行分词、词性标注和实体识别处理;
依据处理结果确定所述特定领域的对话特征。
2.根据权利要求1所述的方法,其特征在于,依据处理结果确定所述特定领域的对话特征,包括:
依据所述对话语料的问答顺序,以及对所述对话语料进行分词、词性标注和实体识别的处理结果,得到所述特定领域的对话问答模式。
3.根据权利要求1所述的方法,其特征在于,依据处理结果确定所述特定领域的对话特征,包括:
依据对所述对话语料进行分词、词性标注和实体识别的处理结果,提取所述对话语料的语气词和语法模式;
对所述对话语料的语气词和语法模式进行筛选,得到符合特定领域对话习惯的语气词和语法模式。
4.根据权利要求1所述的方法,其特征在于,收集特定领域的多媒体对话资源之后,包括:
对收集的多媒体对话资源进行实体、属性及关系识别;
依据所述多媒体对话资源中包含的实体、属性及关系,构建所述特定领域的知识图谱。
5.根据权利要求1-4任一项所述的方法,其特征在于,依据所述多媒体对话资源构建所述特定领域的对话语料,包括:
将音频对话资源和/或视频对话资源转化为文本对话资源;
解析所述文本对话资源中包含的称谓信息;
依据所述称谓信息,将所述特定领域的所述文本对话资源处理成对话文本,以得到所述特定领域的对话语料。
6.一种特定领域的对话挖掘装置,其特征在于,包括:
资源收集模块,用于收集特定领域的多媒体对话资源;
语料构建模块,用于依据所述多媒体对话资源构建所述特定领域的对话语料;
语料处理模块,用于对所述对话语料进行分词、词性标注和实体识别处理;
对话特征模块,用于依据处理结果确定所述特定领域的对话特征。
7.根据权利要求6所述的装置,其特征在于,对话特征模块具体用于:
依据所述对话语料的问答顺序,以及对所述对话语料进行分词、词性标注和实体识别的处理结果,得到所述特定领域的对话问答模式。
8.根据权利要求6所述的装置,其特征在于,对话特征模块具体用于:
依据对所述对话语料进行分词、词性标注和实体识别的处理结果,提取所述对话语料的语气词和语法模式;
对所述对话语料的语气词和语法模式进行筛选,得到符合特定领域对话习惯的语气词和语法模式。
9.根据权利要求6所述的装置,其特征在于,包括:
资源识别模块,用于收集特定领域的多媒体对话资源之后,对收集的多媒体对话资源进行实体、属性及关系识别;
知识图谱模块,用于依据所述多媒体对话资源中包含的实体、属性及关系,构建所述特定领域的知识图谱。
10.根据权利要求6-10任一项所述的装置,其特征在于,语料构建模块具体用于:
将音频对话资源和/或视频对话资源转化为文本对话资源;
解析所述文本对话资源中包含的称谓信息;
依据所述称谓信息,将所述特定领域的所述文本对话资源处理成对话文本,以得到所述特定领域的对话语料。
CN201610633391.XA 2016-08-04 2016-08-04 一种特定领域的对话挖掘方法及装置 Active CN106294321B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610633391.XA CN106294321B (zh) 2016-08-04 2016-08-04 一种特定领域的对话挖掘方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610633391.XA CN106294321B (zh) 2016-08-04 2016-08-04 一种特定领域的对话挖掘方法及装置

Publications (2)

Publication Number Publication Date
CN106294321A true CN106294321A (zh) 2017-01-04
CN106294321B CN106294321B (zh) 2019-05-31

Family

ID=57664828

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610633391.XA Active CN106294321B (zh) 2016-08-04 2016-08-04 一种特定领域的对话挖掘方法及装置

Country Status (1)

Country Link
CN (1) CN106294321B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107423432A (zh) * 2017-08-03 2017-12-01 当家移动绿色互联网技术集团有限公司 机器人区分专业问题和寒暄问题的方法及系统
CN109697050A (zh) * 2019-01-07 2019-04-30 浙江大学 一种基于知识图谱面向电商领域的需求描述模型设计方法
CN110413983A (zh) * 2018-04-27 2019-11-05 北京海马轻帆娱乐科技有限公司 一种识别人名的方法及装置
CN113239164A (zh) * 2021-05-13 2021-08-10 杭州摸象大数据科技有限公司 多轮对话流程构建方法、装置、计算机设备及存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070233656A1 (en) * 2006-03-31 2007-10-04 Bunescu Razvan C Disambiguation of Named Entities
CN101075435A (zh) * 2007-04-19 2007-11-21 深圳先进技术研究院 一种智能聊天系统及其实现方法
CN102456060A (zh) * 2010-10-28 2012-05-16 株式会社日立制作所 信息处理装置及信息处理方法
CN103514165A (zh) * 2012-06-15 2014-01-15 佳能株式会社 用于识别对话中所提及的人的方法和装置
CN104133848A (zh) * 2014-07-01 2014-11-05 中央民族大学 藏语实体知识信息抽取方法
CN105824935A (zh) * 2016-03-18 2016-08-03 北京光年无限科技有限公司 面向问答机器人的信息处理方法及系统
CN106156365A (zh) * 2016-08-03 2016-11-23 北京智能管家科技有限公司 一种知识图谱的生成方法及装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070233656A1 (en) * 2006-03-31 2007-10-04 Bunescu Razvan C Disambiguation of Named Entities
CN101075435A (zh) * 2007-04-19 2007-11-21 深圳先进技术研究院 一种智能聊天系统及其实现方法
CN102456060A (zh) * 2010-10-28 2012-05-16 株式会社日立制作所 信息处理装置及信息处理方法
CN103514165A (zh) * 2012-06-15 2014-01-15 佳能株式会社 用于识别对话中所提及的人的方法和装置
CN104133848A (zh) * 2014-07-01 2014-11-05 中央民族大学 藏语实体知识信息抽取方法
CN105824935A (zh) * 2016-03-18 2016-08-03 北京光年无限科技有限公司 面向问答机器人的信息处理方法及系统
CN106156365A (zh) * 2016-08-03 2016-11-23 北京智能管家科技有限公司 一种知识图谱的生成方法及装置

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107423432A (zh) * 2017-08-03 2017-12-01 当家移动绿色互联网技术集团有限公司 机器人区分专业问题和寒暄问题的方法及系统
CN107423432B (zh) * 2017-08-03 2020-05-12 当家移动绿色互联网技术集团有限公司 机器人区分专业问题和寒暄问题的方法及系统
CN110413983A (zh) * 2018-04-27 2019-11-05 北京海马轻帆娱乐科技有限公司 一种识别人名的方法及装置
CN110413983B (zh) * 2018-04-27 2022-09-27 北京海马轻帆娱乐科技有限公司 一种识别人名的方法及装置
CN109697050A (zh) * 2019-01-07 2019-04-30 浙江大学 一种基于知识图谱面向电商领域的需求描述模型设计方法
CN109697050B (zh) * 2019-01-07 2021-04-27 浙江大学 一种基于知识图谱面向电商领域的需求描述模型设计方法
CN113239164A (zh) * 2021-05-13 2021-08-10 杭州摸象大数据科技有限公司 多轮对话流程构建方法、装置、计算机设备及存储介质

Also Published As

Publication number Publication date
CN106294321B (zh) 2019-05-31

Similar Documents

Publication Publication Date Title
CN107832286B (zh) 智能交互方法、设备及存储介质
KR102170563B1 (ko) 인공 지능에 기반한 휴먼 머신 인터랙티브 방법 및 장치
Bunt et al. Towards an ISO standard for dialogue act annotation
CN114547329A (zh) 建立预训练语言模型的方法、语义解析方法和装置
CN106294321A (zh) 一种特定领域的对话挖掘方法及装置
JP6676109B2 (ja) 発話文生成装置とその方法とプログラム
Hunter et al. A formal semantics for situated conversation
Vincent et al. On the narrative vs non‐narrative functions of reported speech: A socio‐pragmatic study
WO2012011092A1 (en) System, method and device for intelligent textual conversation system
JP2007264789A (ja) シーン情報抽出方法、シーン抽出方法および抽出装置
JP2008234431A (ja) コメント蓄積装置、コメント作成閲覧装置、コメント閲覧システムおよびプログラム
JP2014071769A (ja) 表現変換装置、方法およびプログラム
CN109361962A (zh) 互联网流媒体大数据弹幕信息处理系统及处理方法
Bunt Plug-ins for content annotation of dialogue acts
CN108595406A (zh) 一种用户状态的提醒方法、装置、电子设备及存储介质
CN106708950B (zh) 用于智能机器人自学习系统的数据处理方法及装置
CN112906391B (zh) 元事件抽取方法、装置、电子设备和存储介质
KR20200051173A (ko) 인공지능 스피커를 이용한 실시간 이야깃거리 제공 시스템
Ambrus Categorization of memes
JP6511192B2 (ja) 議論支援システム、議論支援方法、及び議論支援プログラム
Manfredi Demonstratives in a Bedouin Arabic dialect of western Sudan
Asrul et al. Diathesis in Mandailing Language South Tapanuli
Salah et al. Analysing storytelling in design talk using LIWC (Linguistic Inquiry and Word Count)
JP7368335B2 (ja) ポジティブなオウム返し的応答文によって対話するプログラム、装置及び方法
JP2005157823A (ja) 知識ベースシステム、および同システムにおける単語間の意味関係判別方法、ならびにそのコンピュータプログラム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: Room 508-598, Xitian Gezhuang Town Government Office Building, No. 8 Xitong Road, Miyun County Economic Development Zone, Beijing 101500

Applicant after: Beijing Rubo Technology Co., Ltd.

Address before: Room 508-598, Xitian Gezhuang Town Government Office Building, No. 8 Xitong Road, Miyun County Economic Development Zone, Beijing 101500

Applicant before: BEIJING INTELLIGENT HOUSEKEEPER TECHNOLOGY CO., LTD.

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20210906

Address after: 301-112, floor 3, building 2, No. 18, YANGFANGDIAN Road, Haidian District, Beijing 100038

Patentee after: Beijing Rubu Technology Co.,Ltd.

Address before: Room 508-598, Xitian Gezhuang Town Government Office Building, No. 8 Xitong Road, Miyun County Economic Development Zone, Beijing 101500

Patentee before: BEIJING ROOBO TECHNOLOGY Co.,Ltd.

TR01 Transfer of patent right