CN107870896B - 一种对话分析方法及装置 - Google Patents

一种对话分析方法及装置 Download PDF

Info

Publication number
CN107870896B
CN107870896B CN201610847008.0A CN201610847008A CN107870896B CN 107870896 B CN107870896 B CN 107870896B CN 201610847008 A CN201610847008 A CN 201610847008A CN 107870896 B CN107870896 B CN 107870896B
Authority
CN
China
Prior art keywords
emotion
role
dictionary
analysis
weight value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610847008.0A
Other languages
English (en)
Other versions
CN107870896A (zh
Inventor
孙暐
张侦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen yunwangwandian e-commerce Co.,Ltd.
Original Assignee
Shenzhen Yunwangwandian E Commerce Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Yunwangwandian E Commerce Co ltd filed Critical Shenzhen Yunwangwandian E Commerce Co ltd
Priority to CN201610847008.0A priority Critical patent/CN107870896B/zh
Publication of CN107870896A publication Critical patent/CN107870896A/zh
Application granted granted Critical
Publication of CN107870896B publication Critical patent/CN107870896B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例公开了一种对话分析方法及装置,涉及互联网技术领域,能够自动地对于即时通讯中的对话文本进行分析,并及时获取情感倾向的分析结果。本发明包括:按照对话窗口中角色的不同,建立相应的情感分类模型和情感判别模板,并依据对话窗口中各个角色输入的文本信息,通过相应的情感分类模型和情感判别模板,分析出各角色的情感倾向,再融合对话窗口中各角色的情感倾向得到针对整个对话的情感倾向判别结果。本发明适用于即时通讯场景的情感分析。

Description

一种对话分析方法及装置
技术领域
本发明涉及互联网技术、自然语言处理技术和数据挖掘等领域,尤其涉及一种对话分析方法及装置。
背景技术
出于舆论监控、满意度监控等方面的需求,很多运营商及研究机构都提出了对于对话进行情感分析的方案,这些方案大都是基于音视频文件进行,并采用面部识别、语音识别等技术实现。
而对于文本、文字的情感分析,通常是针对评论文字或是短文等相对规整且文本主题都较为明确的文本进行分析,主要用于判断某一段评论文字或是短文(比如在线购物后评论文字)的情感倾向性,从而获取用户针对某个话题、某个企业或某种产品等谈论对象的评述,分析出大致的情感倾向(比如对于一次购物的评价是负面还是正面)。因此,现有的分析手段,更多的是用在市场调研、统计企业、产品的市场反馈等方面。并在该技术思路下发展出一些用于提高准确度的方案,比如:通过改进分词分析的训练器来提高情感倾向的分析准确度;或者通过优化词语之间的关联性分析手段,从而来提高分析准确度。
但是,对于在线导购系统、客服系统等存在大量文本对话的即时通讯场景,现有分析手段由于未考虑对话更加口语化,对话文本很不规整,短句偏多,存在不同类型的元数据、对话情感倾向会随时间发生迁移,对话角色对对话情感倾向影响不同等原因,很难得出较好的结果。因此在这类即时通讯的场景中,很多是依靠统计客户打分结果(比如人工服务中的满意度打分)或者由监控人员事后人工分析,这就提高了人工成本。
发明内容
本发明的实施例提供一种对话分析方法及装置,能够自动地对于即时通讯中的对话文本进行分析并获取对话文本的情感倾向,
为达到上述目的,本发明的实施例采用如下技术方案:
第一方面,本发明的实施例提供的方法,包括:
根据对话窗口对应的业务标识确定至少两个角色,并按照所确定的角色划分所述对话窗口中出现的文本信息;
从对应所述业务标识的模型库中读取各个角色的情感分类模型和情感判别模板,并针对每一个角色:根据这一个角色的情感分类模型提取情感特征,并利用这一个角色的情感分类模型及情感判别模板得到所述这一个角色的情感倾向的判别结果;
按照对应各个角色的权重值和各个角色的情感倾向的判别结果,得到对应所述对话窗口的情感倾向的判别结果。
结合第一方面,在第一方面的第一种可能的实现方式中,还包括:
根据当前的时间窗口调整文本分析的时间权重值,所述时间权重值随时长增加而衰减。
结合第一方面,在第一方面的第二种可能的实现方式中,在按照对应各个角色的权重值和各个角色的情感倾向的判别结果,得到对应所述对话窗口的情感倾向的判别结果之前,还包括:
根据所述对话窗口对应的业务标识,读取预设的权重值,并根据所述预设的权重值调整各个角色的权重值。
结合第一方面,在第一方面的第三种可能的实现方式中,在按照对应各个角色的权重值和各个角色的情感倾向的判别结果,得到对应所述对话窗口的情感倾向的判别结果之前,还包括:
预处理,包括:对文本信息进行分词;对不同类型的元数据进行处理,所述元数据至少包括:颜文字、口头习惯语和停用词,对元数据进行的处理包括数据清洗、数据整理;
对预处理后文本信息抽取特定情感模板。
对预处理后文本信息提取情感倾向相关特征,如情感词、否定词、词性组合、依存关系、元数据和权重,特定场景下的敏感特征等。
结合第一方面或第一方面的第一至三种可能的实现方式,在第四种可能的实现方式中,还包括:
读取情感分析的历史记录,并从所述情感分析的历史记录中获取对应了不同业务标识的对话窗口中出现的文本信息,和与之对应的情感倾向的判别结果;
根据从所述情感分析的历史记录中获取的文本信息和情感倾向的判别结果,抽取情感判别模板同时训练各对话窗口中各个角色的情感分类模型。
结合第一方面或第一方面的第一至四种可能的实现方式,在第五种可能的实现方式中,还包括:根据所提取的情感特征,建立对应各个业务标识的词典,其中,所述各个业务标识的词典按照所提取的词组类型,划分为情感词典、极性词典、修饰词词典、实体词词典和专业词典等。
第二方面,本发明的实施例提供的装置,包括:
预处理模块,用于根据对话窗口对应的业务标识确定至少两个角色,并按照所确定的角色划分所述对话窗口中出现的文本信息;
独立分析模块,用于从对应所述业务标识的模型库中读取各个角色的情感分类模型和情感判别模板,并针对每一个角色:利用这一个角色的情感分类模型及情感判别模板得到所述这一个角色的情感倾向的判别结果;
综合分析模块,用于按照对应各个角色的权重值和各个角色的情感倾向的判别结果,得到对应所述对话窗口的情感倾向的判别结果。
结合第二方面,在第二方面的第一种可能的实现方式中,所述预处理模块,还在于得到对应所述对话窗口的情感倾向的判别结果之前,对文本信息进行分词;对不同类型的元数据进行处理,所述元数据至少包括:颜文字、口头习惯语和停用词,对元数据进行的处理包括数据清洗、数据整理;
所述独立分析模块,具体用于从对应所述业务标识的模型库中读取各个角色的情感分类模型和情感判别模板,并针对每一个角色:依据情感判别模板得到情感倾向模板判别结果,同时根据这一个角色的情感分类模型,从所述文本信息中划分至所述这一个角色的部分中提取情感倾向特征,将所提取的情感特征导入所述这一个角色的情感分类模型并得到所述这一个角色的情感倾向的模型判别结果;所述情感倾向特征涉及情感词、否定词、词性组合、依存关系、元数据和权重,特定场景下的敏感特征;
所述综合分析模块,具体用于按照对应各个角色的权重值和各个角色的情感倾向的分类模型和判别模板的分析结果,得到对应所述对话窗口的情感倾向的判别结果。
结合第二方面或第二方面的第一可能的实现方式,在第二种可能的实现方式中,还包括:训练模块,用于读取情感分析的历史记录,并从所述情感分析的历史记录中获取对应了不同业务标识的对话窗口中出现的文本信息,和对应了不同业务标识的对话窗口的情感倾向的判别结果;并根据从所述情感分析的历史记录中获取的文本信息和情感倾向的判别结果,抽取情感判别模板,同时训练各对话窗口中各个角色的情感分类模型。
结合第二方面或第二方面的第一可能的实现方式,在第三种可能的实现方式中,还包括:
结合第二方面的第二种可能的实现方式,在第三种可能的实现方式中
还包括:词典管理模块,用于根据所提取的情感特征,建立对应各个业务标识的词典,其中,所述各个业务标识的词典按照所提取的词组类型,划分为情感词典、极性词典、修饰词词典、实体词词典和专业词典。
本发明实施例提供的对话分析方法及装置,按照对话窗口中角色的不同,建立相应的情感分类模型和情感判别模板,并依据对话窗口中各个角色输入的文本信息,通过相应的情感分类模型和情感判别模板,分析出各角色的情感倾向的判别结果,再融合对话窗口中各角色的情感倾向的判别结果,从而得到针对文本对话行为的情感倾向的判别结果。相对于现有的针对相对规整且文本主题、对话主体都较为明确的,比如:针对某一个大的话题、一个企业、产品的评论短文进行分析的方案,本实施例能够实现对于在线导购系统、客服系统等存在大量文本对话的即时通讯场景的情感倾向的分析,减少了通过事后人工分析造成的人工成本。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1a、图1b为本发明实施例提供的系统实例的架构示意图;
图2为本发明实施例提供的对话分析方法流程示意图;
图3、图4、图5为本发明实施例提供的对话分析装置的结构示意图。
具体实施方式
为使本领域技术人员更好地理解本发明的技术方案,下面结合附图和具体实施方式对本发明作进一步详细描述。下文中将详细描述本发明的实施方式,所述实施方式的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施方式是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的任一单元和全部组合。本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语)具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样定义,不会用理想化或过于正式的含义来解释。
本实施例中的方法流程,具体可以在一种如图1a所示的系统上执行,该系统包括了:分析服务器和在线聊天平台。
其中,分析服务器具体可以是服务器、工作站、超级计算机等设备,或者是由多个服务器组成的一种用于数据处理的服务器集群系统。分析服务器用于从在线聊天平台提取文本信息,所提取的文本信息为在线聊天平台向用户设备展现的对话窗口中出现的文本信息,并按照所确定的角色划分所述对话窗口中出现的文本信息。
具体的,在分析服务器的存储设备中,或者与分析服务器相连的数据库系统中,存储有情感分类模型和情感判别模板。其中,情感分类模型和情感判别模板对应不同的角色。需要说明的是,对应这一次对话的行为的最终输出的情感倾向的判别结果可以由分析服务器向监控中心发送,以便于监控中心的人员或监控系统快速发现出现负面的情感倾向的对话行为。本实施例中的监控中心,具体可以是如图1b所示的,用于监控包括在线聊天平台在内的各类业务系统运行情况的综合性的监控平台,也可以是在线聊天平台内部的用于对话监控的一种监控系统。
本实施例中所述的“用户”,可以理解为通过用户设备打开在线聊天平台提供的对话窗口并通过用户设备的输入单元(比如鼠标、键盘、触摸屏等)输入文字进行聊天的人员。并且,在一个对话窗口中包括至少两个角色(也可以称为参与聊天的成员),每个角色的用户分别使用各自的用户设备进行聊天操作。其中,用户设备具体可以实做成单独一台装置,或整合于各种不同的媒体数据播放装置中,诸如机顶盒、移动电话、平板电脑(TabletPersonal Computer)、膝上型电脑(Laptop Computer)、多媒体播放器、数字摄影机、个人数字助理(personal digital assistant,简称PDA)、导航装置、移动上网装置(MobileInternet Device,MID)或可穿戴式设备(Wearable Device)等。
若对话窗口中的角色为在线聊天平台的人员,则该在线聊天平台的人员的用户终端也可以理解为接入在线聊天平台中的计算机、膝上型电脑、智能手机等用于聊天对话的设备,比如:在线聊天平台为售后服务系统的人工平台,在线聊天平台的人员为人工平台的服务人员,则服务人员的用户设备为各服务人员工位上、接入了售后服务系统的办公电脑。
本发明实施例提供一种对话分析方法,如图2所示,包括:
S1、根据对话窗口对应的业务标识确定至少两个角色,并按照所确定的角色划分所述对话窗口中出现的文本信息。
其中,本实施例中所述的“角色”可以理解为一个对话窗口参与聊天的用户,为了从对话窗口的具体业务场景和聊天内容上区分各参与聊天的用户,在本实施例中可以将参与聊天的一个用户称为对话窗口的一个角色。
业务标识具体可以是一种用于识别业务系统的标识(也可称为标签),这类业务系统通常都具有在线聊天的功能,比如:售后客服系统的标识、在线销售服务系统的标识、用于投诉举报的人工服务系统的标识,以及用于咨询服务的人工服务系统的标识等业务系统的标识。分析服务器通过业务标识可以识别一个对话窗口所属的业务系统,从而根据所属的业务系统确定对话窗口中的可能出现的角色类型,比如:角色类型包括客户、服务人员(比如像客户解答有关商品的疑问的人员)、顾问人员(比如像客户解答有关电子商品、工业机械类商品等高技术性商品的技术问题的人员)等。针对不同类别的业务系统,可以根据其具体业务场景的不同,预先设定可能出现的角色类型,以便于分析服务器根据对话窗口对应的业务标识快速区分对话窗口中的各个角色。
本实施例中所述的对话窗口,具体可以是在线聊天平台向参与在线聊天的用户设备提供的,用于记录及展现聊天内容的界面。通常理解为:用户通过用户设备输入的文本信息传输至在线聊天平台,并由在线聊天平台将用户输入的文本信息发送至对话窗口中的其他作为一侧聊天角色的用户(或称为聊天对象),从而将所有角色输入的文本信息同步呈现在各个用户的用户终端所显示的界面中,即将所有用户输入的文本信息同步地在对话窗口中呈现。分析服务器可以直接从在线聊天平台获取对话窗口中的各个作为聊天角色的用户所输入的文本信息。比如:在客服会话的场景中,在线聊天平台向用户设备展现客服聊天窗口(其中的平台向用户设备展现聊天窗口的具体实现方式,可以参照现有的各类在线购物平台所提供的“联系客服”的方式,用户点击商品展示页面中的“联系客服”的图标控件后,在线平台向用户设备展现客服聊天窗口)。在根据各个角色各自对应的情感分类模型和情感判别模板完成情感倾向的判别后,分析服务器进一步按照对应各个角色的权重和各个角色的情感倾向的判别结果进行,并得到一个经过融合后的判别结果,作为对应这一次对话的行为的最终输出的情感倾向的判别结果。
S2、从对应所述业务标识的模型库中读取各个角色的情感分类模型和情感判别模板,并针对每一个角色:利用这一个角色的情感分类模型及情感判别模板得到所述这一个角色的情感倾向的判别结果;
在本实施例中,对话窗口中各个角色的情感分类模型和情感判别模板可以根据不同的业务场景进行定义。根据对话及业务场景,定义对话窗口中的各个角色,并根据角色的不同分别建立情感分类模型和情感判别模板。本实施例中可以采用一种离线模型训练,用于建立并训练对话窗口中的各个角色的情感分类模型和抽取情感判别模板。具体包括:
读取情感分析的历史记录,并从所述情感分析的历史记录中获取对应了不同业务标识的对话窗口中出现的文本信息,和对应了不同业务标识的对话窗口的情感倾向的判别结果。根据从所述情感分析的历史记录中获取的文本信息和情感倾向的判别结果,训练对话窗口中各个角色的情感分类模型并抽取情感判别模板。例如:在客服系统中,可将对话文本按角色分为顾客与服务人员,可以采用离线的方式训练各个角色的情感分类模型、抽取情感判别模板。提取历史记录情感倾向的相关特征,如情感词、否定词、词性组合、依存关系、元数据和权重,特定场景下的敏感特征等,并利用所提取的情感倾向的相关特征训练情感分类模型。
S3、按照对应各个角色的权重值和各个角色的情感倾向的判别结果,得到对应所述对话窗口的情感倾向的判别结果。
在即时通讯场景中,由于对话角色的角度不同,会较大的影响对话情感,传统评论或是短文的文本情感分析主要是针对静态短文,未考虑对话的上诉特点。本发明实施例提供的对话分析方法,按照对话窗口中角色的不同,建立相应的情感分类模型和情感判别模板,并依据对话窗口中各个角色输入的文本信息,通过相应的情感分类模型和情感判别模板,分析出各角色的情感倾向的判别结果,再融合对话窗口中各角色的情感倾向的判别结果,从而得到针对文本对话行为的情感倾向的判别结果。相对于现有的针对相对规整且文本主题较为明确的,比如:针对一个企业、产品的评论进行分析的方案,本实施例能够实现对于在线导购系统、客服系统等存在大量文本对话的即时通讯场景的情感倾向的分析。
在本实施例中,在按照对应各个角色的权重值和各个角色的情感倾向的判别结果,得到对应所述对话窗口的情感倾向的判别结果之前,还包括预处理,预处理包括:对文本信息进行分词;对不同类型的元数据进行处理,所述元数据至少包括:颜文字、口头习惯语和停用词,对元数据进行的处理包括数据清洗、数据整理;并对预处理后文本信息抽取特定情感模板;以及对预处理后文本信息提取情感倾向相关特征,如情感词、否定词、词性组合、依存关系、元数据和权重,特定场景下的敏感特征;再从所述情感分析的历史记录中,获取对应不同业务标识的对话窗口中出现的文本信息和对应了不同业务标识的对话窗口的情感倾向的判别结果,抽取情感判别模板,同时基于上述情感倾向相关特征,训练对话窗口中各个角色的情感分类模型。
所述情感特征包括:情感词、否定词、词性组合、特定场景下的敏感词、与特定业务场景相关的实体词及专业词汇,词性组合,句法依存关系,以及特定场景下的敏感特征等。
在本实施例中,可以基于时间窗的情感判别,还包括:根据当前的时间窗口调整文本分析的时间权重值,所述时间权重值随时长增加而衰减
在本实施例中,一个对话窗口中的各个角色的权重可以互不相同,并可以根据具体的业务场景中的角色差异训练不同的权重,比如:在客服人员的服务质量监控的场景中,客户的权重值高于服务人员的权重值,更利于获取客户对于本次在线客服服务的情感趋势。
在本实施例中,提供了一种调整各个角色的权重值的具体手段,包括:
在按照对应各个角色的权重值和各个角色的情感倾向的判别结果,得到对应所述对话窗口的情感倾向的判别结果之前,根据所述对话窗口对应的业务标识,读取预设的权重值,并根据所述预设的权重值调整各个角色的权重值。
在本实施例中,需要建立情感分析所需的词典,所建立的词典包括已经被验证为准确的情感特征的词。词典可以用于情感特征的提取过程。其中,所述各个业务标识的词典按照所提取的词组类型,划分为情感词典、极性词典、修饰词词典、实体词词典和专业词典等。
本发明实施例还提供一种对话分析装置,如图3所示,包括:
预处理模块,用于根据对话窗口对应的业务标识确定至少两个角色,并按照所确定的角色划分所述对话窗口中出现的文本信息;
独立分析模块,用于从对应所述业务标识的模型库中读取各个角色的情感分类模型和情感判别模板,并针对每一个角色:利用这一个角色的情感分类模型及情感判别模板得到所述这一个角色的情感倾向的判别结果;
综合分析模块,用于按照对应各个角色的权重值和各个角色的情感倾向的判别结果,得到对应所述对话窗口的情感倾向的判别结果。其中,所述预处理模块,还在于得到对应所述对话窗口的情感倾向的判别结果之前,对文本信息进行分词;对不同类型的元数据进行处理,所述元数据至少包括:颜文字、口头习惯语和停用词,对元数据进行的处理包括数据清洗、数据整理;
所述独立分析模块,具体用于从对应所述业务标识的模型库中读取各个角色的情感分类模型和情感判别模板,并针对每一个角色:依据情感判别模板得到情感倾向模板判别结果,同时根据这一个角色的情感分类模型,从所述文本信息中划分至所述这一个角色的部分中提取情感倾向特征,将所提取的情感特征导入所述这一个角色的情感分类模型并得到所述这一个角色的情感倾向的模型判别结果;所述情感倾向特征涉及情感词、否定词、词性组合、依存关系、元数据和权重,特定场景下的敏感特征;
所述综合分析模块,具体用于按照对应各个角色的权重值和各个角色的情感倾向的分类模型和判别模板的分析结果,得到对应所述对话窗口的情感倾向的判别结果。
所述综合分析模块,还用于根据当前的时间窗口调整文本分析的时间权重值,所述时间权重值随时长增加而衰减;
所述综合分析模块,还用于在按照对应各个角色的权重值和各个角色的情感倾向的判别结果,得到对应所述对话窗口的情感倾向的判别结果之前,根据所述对话窗口对应的业务标识,读取预设的权重值,并根据所述预设的权重值调整各个角色的权重值。
进一步的,所述对话分析装置,如图4所示,还包括:
训练模块,用于读取情感分析的历史记录,并从所述情感分析的历史记录中获取对应了不同业务标识的对话窗口中出现的文本信息,和对应了不同业务标识的对话窗口的情感倾向的判别结果;并根据从所述情感分析的历史记录中获取的文本信息和情感倾向的判别结果,抽取情感判别模板,同时训练各对话窗口中各个角色的情感分类模型。
进一步的,所述对话分析装置,如图5所示,还包括:
词典管理模块,用于根据所提取的情感特征,建立对应各个业务标识的词典,其中,所述各个业务标识的词典按照所提取的词组类型,划分为情感词典、极性词典、修饰词词典、实体词词典和专业词典。
本发明实施例提供的对话分析装置,按照对话窗口中角色的不同,建立相应的情感分类模型和情感判别模板,并依据对话窗口中各个角色输入的文本信息,通过相应的情感分类模型和情感判别模板,分析出各角色的情感倾向的判别结果,再融合对话窗口中各角色的情感倾向的判别结果,从而得到针对文本对话行为的情感倾向的判别结果。相对于现有的针对相对规整且文本主题、对话主体都较为明确的,比如:针对一个企业、电影、产品的评论进行分析的方案,本实施例能够实现对于在线导购系统、客服系统等存在大量文本对话的即时通讯场景的情感倾向分析,可以广泛用于对话文本分析中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于设备实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

Claims (8)

1.一种对话分析方法,其特征在于,包括:
根据对话窗口对应的业务标识确定至少两个角色,并按照所确定的角色划分所述对话窗口中出现的文本信息;
从对应所述业务标识的模型库中读取各个角色的情感分类模型和情感判别模板,并针对每一个角色:利用这一个角色的情感分类模型及情感判别模板得到所述这一个角色的情感倾向的判别结果;
按照对应各个角色的权重值和各个角色的情感倾向的判别结果,得到对应所述对话窗口的情感倾向的判别结果。
2.根据权利要求1所述的方法,其特征在于,还包括:
根据当前的时间窗口调整文本分析的时间权重值,所述时间权重值随时长增加而衰减。
3.根据权利要求1所述的方法,其特征在于,在按照对应各个角色的权重值和各个角色的情感倾向的判别结果,得到对应所述对话窗口的情感倾向的判别结果之前,还包括:
根据所述对话窗口对应的业务标识,读取预设的权重值,并根据所述预设的权重值调整各个角色的权重值。
4.根据权利要求1-3中任意一项所述的方法,其特征在于,还包括:
建立情感分析所需的词典,包括:情感词典、极性词典、修饰词词典、实体词字典和专业词典。
5.一种对话分析装置,其特征在于,包括:
预处理模块,用于根据对话窗口对应的业务标识确定至少两个角色,并按照所确定的角色划分所述对话窗口中出现的文本信息;
独立分析模块,用于从对应所述业务标识的模型库中读取各个角色的情感分类模型和情感判别模板,并针对每一个角色:利用这一个角色的情感分类模型及情感判别模板得到所述这一个角色的情感倾向的判别结果;
综合分析模块,用于按照对应各个角色的权重值和各个角色的情感倾向的判别结果,得到对应所述对话窗口的情感倾向的判别结果。
6.根据权利要求5所述的装置,其特征在于,所述综合分析模块,还用于根据当前的时间窗口调整文本分析的时间权重值,所述时间权重值随时长增加而衰减;
所述综合分析模块,还用于在按照对应各个角色的权重值和各个角色的情感倾向的判别结果,得到对应所述对话窗口的情感倾向的判别结果之前,根据所述对话窗口对应的业务标识,读取预设的权重值,并根据所述预设的权重值调整各个角色的权重值。
7.根据权利要求5所述的装置,其特征在于,还包括:训练模块,用于读取情感分析的历史记录,并从所述情感分析的历史记录中获取对应了不同业务标识的对话窗口中出现的文本信息,和对应了不同业务标识的对话窗口的情感倾向的判别结果;并根据从所述情感分析的历史记录中获取的文本信息和情感倾向的判别结果,抽取情感判别模板,同时训练各对话窗口中各个角色的情感分类模型。
8.根据权利要求7所述的装置,其特征在于,还包括:词典管理模块,用于根据所提取的情感特征,建立对应各个业务标识的词典,其中,所述各个业务标识的词典按照所提取的词组类型,划分为情感词典、极性词典、修饰词词典、实体词词典和专业词典。
CN201610847008.0A 2016-09-23 2016-09-23 一种对话分析方法及装置 Active CN107870896B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610847008.0A CN107870896B (zh) 2016-09-23 2016-09-23 一种对话分析方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610847008.0A CN107870896B (zh) 2016-09-23 2016-09-23 一种对话分析方法及装置

Publications (2)

Publication Number Publication Date
CN107870896A CN107870896A (zh) 2018-04-03
CN107870896B true CN107870896B (zh) 2021-06-25

Family

ID=61751688

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610847008.0A Active CN107870896B (zh) 2016-09-23 2016-09-23 一种对话分析方法及装置

Country Status (1)

Country Link
CN (1) CN107870896B (zh)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108897888B (zh) * 2018-07-10 2021-08-24 四川淘金你我信息技术有限公司 语音客服培训场景下的人机对练方法
CN108959588B (zh) * 2018-07-10 2021-10-08 四川淘金你我信息技术有限公司 基于大数据的文本客服机器人智能学习方法
CN108959275B (zh) * 2018-07-10 2022-05-17 四川淘金你我信息技术有限公司 基于在线语言翻译的人机对练系统
CN109408621B (zh) * 2018-10-29 2021-04-02 苏州派维斯信息科技有限公司 对话情感分析方法和系统
CN111309899A (zh) * 2018-12-11 2020-06-19 阿里巴巴集团控股有限公司 对话情感分析方法及装置、存储介质和处理器
CN110188190B (zh) * 2019-04-03 2023-07-14 创新先进技术有限公司 对话解析方法、装置、服务器及可读存储介质
CN110245236B (zh) * 2019-06-25 2021-07-20 北京向上一心科技有限公司 信息呈现方法、装置和电子设备
CN112765971B (zh) * 2019-11-05 2023-11-17 北京火山引擎科技有限公司 文本语音的转换方法、装置、电子设备及存储介质
CN111046157B (zh) * 2019-12-10 2021-12-07 北京航空航天大学 一种基于平衡分布的通用英文人机对话生成方法和系统
CN111199253A (zh) * 2019-12-30 2020-05-26 北京小白世纪网络科技有限公司 基于3d cnn深度学习的前列腺癌症图像识别方法
CN111553144A (zh) * 2020-04-28 2020-08-18 深圳壹账通智能科技有限公司 基于人工智能的话题挖掘方法、装置及电子设备
CN111859902A (zh) * 2020-07-16 2020-10-30 微医云(杭州)控股有限公司 一种文本处理方法、装置、设备及介质
CN113239170B (zh) * 2021-06-01 2023-11-28 平安科技(深圳)有限公司 基于相互角色感知的对话生成方法、装置、设备及介质
CN113645126A (zh) * 2021-08-13 2021-11-12 黎明职业大学 一种集成情感分析的即时通讯方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1553845A (zh) * 2001-11-07 2004-12-08 索尼公司 机器人系统和机器人设备的控制方法
CN101661569A (zh) * 2009-09-18 2010-03-03 北京科技大学 一种智能情感机器人多模态行为关联表达系统
CN101930735A (zh) * 2009-06-23 2010-12-29 富士通株式会社 语音情感识别设备和进行语音情感识别的方法
CN102169642A (zh) * 2011-04-06 2011-08-31 李一波 具有智能纠错功能的交互式虚拟教师系统
CN104182387A (zh) * 2014-07-21 2014-12-03 安徽华贞信息科技有限公司 一种文本情感倾向分析系统
CN104516873A (zh) * 2014-12-12 2015-04-15 北京智谷睿拓技术服务有限公司 建立情感模型的方法和装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7912720B1 (en) * 2005-07-20 2011-03-22 At&T Intellectual Property Ii, L.P. System and method for building emotional machines

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1553845A (zh) * 2001-11-07 2004-12-08 索尼公司 机器人系统和机器人设备的控制方法
CN101930735A (zh) * 2009-06-23 2010-12-29 富士通株式会社 语音情感识别设备和进行语音情感识别的方法
CN101661569A (zh) * 2009-09-18 2010-03-03 北京科技大学 一种智能情感机器人多模态行为关联表达系统
CN102169642A (zh) * 2011-04-06 2011-08-31 李一波 具有智能纠错功能的交互式虚拟教师系统
CN104182387A (zh) * 2014-07-21 2014-12-03 安徽华贞信息科技有限公司 一种文本情感倾向分析系统
CN104516873A (zh) * 2014-12-12 2015-04-15 北京智谷睿拓技术服务有限公司 建立情感模型的方法和装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于知识语义权重特征的朴素贝叶斯情感分类算法;冀俊忠 等;《北京工业大学学报》;20141231;第40卷(第12期);第1884-1890页 *

Also Published As

Publication number Publication date
CN107870896A (zh) 2018-04-03

Similar Documents

Publication Publication Date Title
CN107870896B (zh) 一种对话分析方法及装置
US10515156B2 (en) Human-to-human conversation analysis
Gu et al. " what parts of your apps are loved by users?"(T)
US9189514B1 (en) Optimized fact checking method and system
CN106649603B (zh) 一种基于网页文本数据情感分类的指定信息推送方法
EP3021264A1 (en) Information recommendation method and apparatus in social media
CN108874832B (zh) 目标评论确定方法及装置
CN105095288B (zh) 数据分析方法及数据分析装置
CN108269125B (zh) 评论信息质量评估方法及系统、评论信息处理方法及系统
CN111797820B (zh) 一种视频数据处理方法、装置、电子设备及存储介质
CN112951275B (zh) 语音质检方法、装置、电子设备及介质
CN107862058B (zh) 用于生成信息的方法和装置
US11392791B2 (en) Generating training data for natural language processing
CN108009297B (zh) 基于自然语言处理的文本情感分析方法与系统
CN110598008A (zh) 录制数据的数据质检方法及装置、存储介质
Soares et al. An optimization model for temporal video lecture segmentation using word2vec and acoustic features
CN111695357A (zh) 文本标注方法及相关产品
KR20200064490A (ko) 프로필 자동생성서버 및 방법
WO2024030314A1 (en) Search results within segmented communication session content
Mircoli et al. Automatic Emotional Text Annotation Using Facial Expression Analysis.
CN115719058A (zh) 一种内容分析方法、电子设备和存储介质
CN110728131A (zh) 一种分析文本属性的方法和装置
Baldwin et al. A Character Recognition Tool for Automatic Detection of Social Characters in Visual Media Content
CN115098729A (zh) 视频处理方法、样本生成方法、模型训练方法及装置
Kovilpatti et al. Analyzing social media data for understanding students learning experiences and predicting their psychological pressure

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20210601

Address after: 518001 unit 3510-131, Luohu business center, 2028 Shennan East Road, Chengdong community, Dongmen street, Luohu District, Shenzhen City, Guangdong Province

Applicant after: Shenzhen yunwangwandian e-commerce Co.,Ltd.

Address before: 210042 Suning Headquarters, No. 1 Suning Avenue, Xuanwu District, Nanjing City, Jiangsu Province

Applicant before: SUNING COMMERCE GROUP Co.,Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant