CN105450497A - 生成聚类模型以及基于该聚类模型进行聚类的方法和装置 - Google Patents
生成聚类模型以及基于该聚类模型进行聚类的方法和装置 Download PDFInfo
- Publication number
- CN105450497A CN105450497A CN201410373109.XA CN201410373109A CN105450497A CN 105450497 A CN105450497 A CN 105450497A CN 201410373109 A CN201410373109 A CN 201410373109A CN 105450497 A CN105450497 A CN 105450497A
- Authority
- CN
- China
- Prior art keywords
- message
- history
- current
- history message
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Transfer Between Computers (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了生成聚类模型以及基于该聚类模型进行聚类的方法和装置。一种方法包括:响应于接收到来自历史语音对话中的多个历史消息,提取多个历史消息中的每个历史消息的特征信息;获取多个历史消息之间的关联关系;基于多个历史消息中的每个历史消息的特征信息和关联关系来生成将多个历史消息进行聚类的聚类模型。一种方法包括:响应于接收到当前对话中的多个当前消息,提取多个当前消息中的每个当前消息的特征信息;采用本发明的方法生成的聚类模型,基于多个当前消息的每个当前消息的特征信息,将多个当前消息聚类至至少一个主题分组。采用本发明,可以生成可靠并准确的聚类模型,并可以基于该聚类模型将多个消息进行聚类并显示。
Description
技术领域
本发明的各实施方式涉及消息处理,更具体地,涉及在消息处理中生成聚类模型(clusteringmodel)以及基于该聚类模型进行聚类的方法和装置。
背景技术
随着通信技术的发展,目前已经开发出了各种通信应用。广大用户可以通过即时消息应用(例如,微信、Sametime、QQ等)、短消息应用、以及聊天室应用等通信应用来进行沟通。这些通信应用可以运行在具有通信能力的计算设备上(例如,计算机、膝上型计算机、平板式计算机、智能终端、移动终端等),并且用户可以经由这些通信应用与一个或者多个其他用户进行通信。
不同于传统的连续语音通信,用户可以使用这些通信应用在离散的时间点进行通信,并且前后相继的两个消息可能涉及不同的主题。例如,用户Alan可以向用户Teresa发送消息“北京天气好吗?”Teresa在接收到来自Alan的消息之后可能并没有马上回答北京的天气状况,而是可能先向Alan发送了几条问候信息,并且在询问“你哪天到北京?”之后,才回答Alan“北京下雨”。
从上述示例中可以发现,在使用通信应用进行的对话中,来自两个用户的前后相继的两个或者更多消息并不总是讨论相同的主题(theme),而是可以讨论多个相关或者无关的主题(例如,天气、交通、教育、体育等内容)。在群聊(groupchatting)中,多个用户可能同时会讨论更多主题。当基于现有技术的按照时间顺序来逐个呈现来自各个用户的消息时,用户很难快速了解各个消息之间的关联关系;尤其是当用户正在使用诸如移动终端等显示屏幕尺寸有限的设备时,将会造成页面显示的混乱。
另外,目前的通信应用可以支持用户发送语音消息,例如,用户可以按下通信应用中的“语音”按钮录制语音消息,当抬起“语音”按钮时可以将该语音消息发送至一个或者多个其他用户。该语音消息在接收者的用户设备处可以显示为特殊的图标,而当用户按下该图标时则可以听到发送者录制的语音。当两个或者更多用户采用语音方式通信时,在用户设备处的显示屏上根本不能区分哪些语音消息涉及相同的主题。此时用户需要依次收听每个语音消息,这将占用很多时间。
因而,如何按照各个消息所讨论的主题来区分来自于两个或者更多用户的多个消息,成为目前的一个研究热点。
发明内容
因而,期望开发出一种基于通信应用中的对话的特征来生成可以将对话中的多个消息进行聚类的聚类模型的技术方案。进一步,还期望能够基于所生成的聚类模型来将当前对话中的多个消息进行聚类的技术方案。
在本发明的一个实施方式中,提供了一种用于生成聚类模型的方法,包括:响应于接收到来自历史语音对话中的多个历史消息,提取多个历史消息中的每个历史消息的特征信息;获取多个历史消息之间的关联关系;以及基于多个历史消息中的每个历史消息的特征信息和关联关系来生成将多个历史消息进行聚类的聚类模型。
在本发明的一个实施方式中,提供了一种用于将对话中的多个当前消息进行聚类的方法,包括:响应于接收到对话中的多个当前消息,提取多个当前消息中的每个当前消息的特征信息;以及采用本发明的方法生成的聚类模型,基于多个当前消息的每个当前消息的特征信息,将多个当前消息聚类至至少一个主题分组。
在本发明的一个实施方式中,提供了一种用于生成聚类模型的装置,包括:提取模块,配置用于响应于接收到来自历史语音对话中的多个历史消息,提取多个历史消息中的每个历史消息的特征信息;获取模块,配置用于获取多个历史消息之间的关联关系;以及生成模块,配置用于基于多个历史消息中的每个历史消息的特征信息和关联关系来生成将多个历史消息进行聚类的聚类模型。
在本发明的一个实施方式中,提供了一种用于将对话中的多个当前消息进行聚类的装置,包括:第一提取模块,配置用于响应于接收到对话中的多个当前消息,提取多个当前消息中的每个当前消息的特征信息;以及聚类模块,配置用于采用本发明的装置生成的聚类模型,基于多个当前消息的每个当前消息的特征信息,将多个当前消息聚类至至少一个主题分组。
采用本发明所述的方法和装置,可以高效并且准确地生成用于将多个消息进行聚类的聚类模型。进一步,采用本发明所述的其他方法和装置,可以基于该聚类模型将当前会话中的多个当前消息聚类至至少一个主题分组,可以基于各个用户的定制信息来显示各个分组中的消息,还可以突出显示分组中的无响应消息。
附图说明
通过结合附图对本公开示例性实施方式进行更详细的描述,本公开的上述以及其他目的、特征和优势将变得更加明显,其中,在本公开示例性实施方式中,相同的参考标号通常代表相同部件。
图1示意性示出了适于用来实现本发明实施方式的示例性计算机系统/服务器的框图;
图2示意性示出了一个示例性的云计算环境;
图3示意性示出了云计算环境50(图2)提供的一组功能抽象层;
图4示意性示出了根据一个技术方案的显示对话中的多个消息的界面;
图5示意性示出了根据本发明一个实施方式的用于生成聚类模型的技术方案的框图,并示意性示出了根据本发明一个实施方式的用于基于所生成的聚类模型将当前对话中的多个当前消息进行聚类的技术方案的框图;
图6A示意性示出了根据本发明一个实施方式的用于生成聚类模型的方法的流程图,以及图6B示意性示出了根据本发明一个实施方式的基于所生成的聚类模型将当前对话中的多个当前消息进行聚类的方法的流程图;
图7示意性示出了根据本发明一个实施方式的对聚类后的多个当前消息进行显示的界面的示意图;
图8示意性示出了根据本发明另一实施方式的对聚类后的多个当前消息进行显示的界面的示意图;
图9A示意性示出了根据本发明一个实施方式的用于生成聚类模型的装置的框图,以及图9B示意性示出了根据本发明一个实施方式的基于所生成的聚类模型将当前对话中的多个当前消息进行聚类的装置的框图。
具体实施方式
下面将参照附图更详细地描述本公开的优选实施方式。虽然附图中显示了本公开的优选实施方式,然而应该理解,可以以各种形式实现本公开而不应被这里阐述的实施方式所限制。相反,提供这些实施方式是为了使本公开更加透彻和完整,并且能够将本公开的范围完整的传达给本领域的技术人员。
首先应当理解,尽管本公开包括关于云计算的详细描述,但其中记载的技术方案的实现却不限于云计算环境,而是能够结合现在已知或以后开发的任何其他类型的计算环境而实现。
云计算是一种服务交付模式,用于对共享的可配置计算资源池进行方便、按需的网络访问。可配置计算资源是能够以最小的管理成本或与服务提供者进行最少的交互就能快速部署和释放的资源,例如可以是网络、网络带宽、服务器、处理、内存、存储、应用、虚拟机和服务。这种云模式可以包括至少五个特征、至少三个服务模型和至少四个部署模型。
特征包括:
按需自助式服务:云的消费者在无需与服务提供者进行人为交互的情况下能够单方面自动地按需部署诸如服务器时间和网络存储等的计算能力。
广泛的网络接入:计算能力可以通过标准机制在网络上获取,这种标准机制促进了通过不同种类的瘦客户机平台或厚客户机平台(例如移动电话、膝上型电脑、个人数字助理PDA)对云的使用。
资源池:提供者的计算资源被归入资源池并通过多租户(multi-tenant)模式服务于多重消费者,其中按需将不同的实体资源和虚拟资源动态地分配和再分配。一般情况下,消费者不能控制或甚至并不知晓所提供的资源的确切位置,但可以在较高抽象程度上指定位置(例如国家、州或数据中心),因此具有位置无关性。
迅速弹性:能够迅速、有弹性地(有时是自动地)部署计算能力,以实现快速扩展,并且能迅速释放来快速缩小。在消费者看来,用于部署的可用计算能力往往显得是无限的,并能在任意时候都能获取任意数量的计算能力。
可测量的服务:云系统通过利用适于服务类型(例如存储、处理、带宽和活跃用户账号)的某种抽象程度的计量能力,自动地控制和优化资源效用。可以监测、控制和报告资源使用情况,为服务提供者和消费者双方提供透明度。
服务模型如下:
软件即服务(SaaS):向消费者提供的能力是使用提供者在云基础架构上运行的应用。可以通过诸如网络浏览器的瘦客户机接口(例如基于网络的电子邮件)从各种客户机设备访问应用。除了有限的特定于用户的应用配置设置外,消费者既不管理也不控制包括网络、服务器、操作系统、存储、乃至单个应用能力等的底层云基础架构。
平台即服务(PaaS):向消费者提供的能力是在云基础架构上部署消费者创建或获得的应用,这些应用利用提供者支持的程序设计语言和工具创建。消费者既不管理也不控制包括网络、服务器、操作系统或存储的底层云基础架构,但对其部署的应用具有控制权,对应用托管环境配置可能也具有控制权。
基础架构即服务(IaaS):向消费者提供的能力是消费者能够在其中部署并运行包括操作系统和应用的任意软件的处理、存储、网络和其他基础计算资源。消费者既不管理也不控制底层的云基础架构,但是对操作系统、存储和其部署的应用具有控制权,对选择的网络组件(例如主机防火墙)可能具有有限的控制权。
部署模型如下:
私有云:云基础架构单独为某个组织运行。云基础架构可以由该组织或第三方管理并且可以存在于该组织内部或外部。
共同体云:云基础架构被若干组织共享并支持有共同利害关系(例如任务使命、安全要求、政策和合规考虑)的特定共同体。共同体云可以由共同体内的多个组织或第三方管理并且可以存在于该共同体内部或外部。
公共云:云基础架构向公众或大型产业群提供并由出售云服务的组织拥有。
混合云:云基础架构由两个或更多部署模型的云(私有云、共同体云或公共云)组成,这些云依然是独特的实体,但是通过使数据和应用能够移植的标准化技术或私有技术(例如用于云之间的负载平衡的云突发流量分担技术)绑定在一起。
云计算环境是面向服务的,特点集中在无状态性、低耦合性、模块性和语意的互操作性。云计算的核心是包含互连节点网络的基础架构。
现在参考图1,其中显示了云计算节点的一个例子。图1显示的云计算节点10仅仅是适合的云计算节点的一个示例,不应对本发明实施方式的功能和使用范围带来任何限制。总之,云计算节点10能够被用来实现和/或执行以上所述的任何功能。
云计算节点10具有计算机系统/服务器12,其可与众多其他通用或专用计算系统环境或配置一起操作。众所周知,适于与计算机系统/服务器12一起操作的计算系统、环境和/或配置的例子包括但不限于:个人计算机系统、服务器计算机系统、瘦客户机、厚客户机、手持或膝上设备、基于微处理器的系统、机顶盒、可编程消费电子产品、网络个人电脑、小型计算机系统﹑大型计算机系统和包括上述任意系统的分布式云计算技术环境,等等。
计算机系统/服务器12可以在由计算机系统执行的计算机系统可执行指令(诸如程序模块)的一般语境下描述。通常,程序模块可以包括执行特定的任务或者实现特定的抽象数据类型的例程、程序、目标程序、组件、逻辑、数据结构等。计算机系统/服务器12可以在通过通信网络链接的远程处理设备执行任务的分布式云计算环境中实施。在分布式云计算环境中,程序模块可以位于包括存储设备的本地或远程计算系统存储介质上。
如图1所示,云计算节点10中的计算机系统/服务器12以通用计算设备的形式表现。计算机系统/服务器12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,系统存储器28,连接不同系统组件(包括系统存储器28和处理单元16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
计算机系统/服务器12典型地包括多种计算机系统可读介质。这些介质可以是能够被计算机系统/服务器12访问的任意可获得的介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)30和/或高速缓存存储器32。计算机系统/服务器12可以进一步包括其他可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图1未显示,通常称为“硬盘驱动器”)。尽管图1中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其他光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施方式的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在存储器28中,这样的程序模块42包括但不限于操作系统、一个或者多个应用程序、其他程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施方式中的功能和/或方法。
计算机系统/服务器12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该计算机系统/服务器12交互的设备通信,和/或与使得该计算机系统/服务器12能与一个或多个其他计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,计算机系统/服务器12还可以通过网络适配器20与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器20通过总线18与计算机系统/服务器12的其他模块通信。应当明白,尽管图中未示出,其他硬件和/或软件模块可以与计算机系统/服务器12一起操作,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
现在参考图2,其中显示了示例性的云计算环境50。如图所示,云计算环境50包括云计算消费者使用的本地计算设备可以与其相通信的一个或者多个云计算节点10,本地计算设备例如可以是个人数字助理(PDA)或移动电话54A,台式电脑54B、笔记本电脑54C和/或汽车计算机系统54N。云计算节点10之间可以相互通信。可以在包括但不限于如上所述的私有云、共同体云、公共云或混合云或者它们的组合的一个或者多个网络中将云计算节点10进行物理或虚拟分组(图中未显示)。这样,云的消费者无需在本地计算设备上维护资源就能请求云计算环境50提供的基础架构即服务(IaaS)、平台即服务(PaaS)和/或软件即服务(SaaS)。应当理解,图2显示的各类计算设备54A-N仅仅是示意性的,云计算节点10以及云计算环境50可以与任意类型网络上和/或网络可寻址连接的任意类型的计算设备(例如使用网络浏览器)通信。
现在参考图3,其中显示了云计算环境50(图2)提供的一组功能抽象层。首先应当理解,图3所示的组件、层以及功能都仅仅是示意性的,本发明的实施方式不限于此。如图3所示,提供下列层和对应功能:
硬件和软件层60包括硬件和软件组件。硬件组件的例子包括:主机,例如系统;基于RISC(精简指令集计算机)体系结构的服务器,例如IBM系统;IBM系统;IBM系统;存储设备;网络和网络组件。软件组件的例子包括:网络应用服务器软件,例如IBM应用服务器软件;数据库软件,例如IBM数据库软件。(IBM,zSeries,pSeries,xSeries,BladeCenter,WebSphere以及DB2是国际商业机器公司在全世界各地的注册商标)。
虚拟层62提供一个抽象层,该层可以提供下列虚拟实体的例子:虚拟服务器、虚拟存储、虚拟网络(包括虚拟私有网络)、虚拟应用和操作系统,以及虚拟客户端。
在一个示例中,管理层64可以提供下述功能:资源供应功能:提供用于在云计算环境中执行任务的计算资源和其他资源的动态获取;计量和定价功能:在云计算环境内对资源的使用进行成本跟踪,并为此提供账单和发票。在一个例子中,该资源可以包括应用软件许可。安全功能:为云的消费者和任务提供身份认证,为数据和其他资源提供保护。用户门户功能:为消费者和系统管理员提供对云计算环境的访问。服务水平管理功能:提供云计算资源的分配和管理,以满足必需的服务水平。服务水平协议(SLA)计划和履行功能:为根据SLA预测的对云计算资源未来需求提供预先安排和供应。
工作负载层66提供云计算环境可能实现的功能的示例。在该层中,可提供的工作负载或功能的示例包括:地图绘制与导航;软件开发及生命周期管理;虚拟教室的教学提供;数据分析处理;交易处理;以及消息处理。
在本发明的一个实施方式中,可以在工作负载层66处实现根据本发明的各个实施方式的消息处理的技术方案,以便在云计算环境中可以方便、高效并且准确地生成用于将多个消息进行聚类的聚类模型;进一步,可以基于所生成的聚类模型来将对话中的多个消息进行聚类,继而以用户定制的方式显示聚类后的多个消息。具体地,可以在通信应用的服务器端实现本发明的技术方案。
图4示意性示出了根据一个技术方案的显示对话中的多个消息的界面400。具体地,图4示意性示出了在线销售中客户410与商家420之间的对话的示意,客户410连续发出了4个消息(即,消息401-404)来向商家420询问关于折扣、价格、促销和发货四个主题的信息。接着,商家420发出消息405来应答消息401,并发出消息406来应答消息403。之后,客户410发出消息407询问关于号码的信息。继而,商家420分别发出消息408和409来应答消息407和404。
从图4中的示例可以发现,在显示界面中交错地显示相关于各个主题的问题和回答,并且用户(无论是客户410还是商家420)难以看清问题和回答之间的对应关系。还应当注意,尽管客户410发出消息402询问“一次买两件多少钱?”然而由于显示界面中混乱的显示效果,商家420并没有注意到消息402因而并未给出相应的答复。
在上文图4的示例中仅仅示出了两个用户之间的对话,本领域技术人员应当理解,当对话涉及更多用户和更多主题时,界面中的显示效果将更加复杂。尤其是在显示屏幕尺寸有限的移动终端上,更加难以区分用户讨论的各个主题。
目前已经开发出了针对消息进行文本分析来获取消息的主题的技术方案。在一个技术方案中,可以分析各个消息中的关键字来区分各个消息所涉及的主题,然而由于对话中的语言通常是口语化的表达,并且会存在大量含义相同但表达不同的词语(例如,在某些语言环境下,车、汽车具有相同含义),因而单纯地基于关键字分析很难准确了解消息的主题。
另外,目前还提出了“username”的技术方案。当对话涉及多个用户时,当前用户可以通过在消息中插入“username”来向特定用户发送消息。例如,用户Alan、Teresa和其他用户正处于对话中,当Teresa希望提示Alan她的消息是针对Alan的提问的回复时,Teresa可以发送消息“Alan北京下雨”。在Alan的客户端处,该消息将会被突出显示以区别于来自参与会话的其他用户的消息。
尽管“username”可以使得接收者在众多消息中区分出发送者发送的某个消息,然而该技术方案需要发送者在消息中人工添加“username”。另外,当发送者和接收者之间的交互涉及多个消息时,此技术方案也不能将该多个消息区别于其他的消息。
面对上述现有技术中的诸多不足,期望能够生成一种聚类模型,并期望该聚类模型可以自动地按照消息所讨论的主题来将多个消息进行聚类。具体地,在本发明的一个实施方式中,提出了一种用于生成聚类模型的方法,包括:响应于接收到来自历史语音对话中的多个历史消息,提取多个历史消息中的每个历史消息的特征信息;获取多个历史消息之间的关联关系;以及基于多个历史消息中的每个历史消息的特征信息和关联关系来生成将多个历史消息进行聚类的聚类模型。
在本发明的一个实施方式中,进一步提出了一种用于将当前对话中的多个当前消息进行聚类的方法,包括:响应于接收到当前对话中的多个当前消息,提取多个当前消息中的每个当前消息的特征信息;采用根据本发明的方法生成的聚类模型,基于多个当前消息的每个当前消息的特征信息,将多个当前消息聚类至至少一个主题分组。
图5示意性示出了根据本发明一个实施方式的用于生成聚类模型、以及基于所生成的聚类模型将当前对话中的多个当前消息进行聚类的技术方案的框图500。本发明的原理在于,基于聚类算法来将对话中的多个消息聚类至不同的主题,此时如何生成准确可靠的聚类模型是一个关键因素。另外,聚类模型是一种通过训练来逐渐提高聚类准确性的技术,因而如何选取用于训练聚类模型的训练数据成为一项挑战。
本领域技术人员应当理解,不同于使用例如微信等通信应用发送消息,在语音对话中各个用户之间的谈话通常是连续的。例如,在语音对话中可以包括如下类型的语音片段:问题类型(以Q表示)、回答类型(以A表示)以及陈述类型(以S表示)。
在语音对话中,在一个用户的问题类型的片段之后立刻跟随有另一用户的回答类型的片段。例如,用户1问用户2,“北京天气好吗?”则用户2会立刻回答“北京下雨”。当以上标1和2分别表示参与对话的两个用户时,来自两个用户的针对一个主题的对话中的语音片段可以表示为:S1S2Q1A2S1S2。即各个语音片段分别表示用户1的陈述、用户2的陈述、用户1的问题、用户2的回答、用户1的陈述、用户2的陈述。基于语音对话的上述特征,可以从历史语音对话中提取用于生成聚类模型的训练数据。
如图5左上角的方框中示意性示出了用于生成聚类模型的技术方案的框图。可以从历史语音对话510中提取多个历史消息,即历史消息1512至历史消息N514。应当注意,在此的历史语音对话510可以是一个语音对话,也可以是多个语音对话,并且在本发明的实施方式中并不限定各个语音对话是否是相同或者不同用户之间的对话。
应当注意,在本发明的上下文中应当对“一个语音对话”和“多个语音对话”做出宽泛的解释。例如,假设用户Alan和Teresa进行了20分钟的电话通话,则可以认为20分钟的电话是一个语音对话。又例如,在20分钟的通话期间因信号质量等原因造成通话中出现短暂的语音中断,则还可以认为20分钟语音对话包括因语音中断造成的多个语音对话。
在本发明的实施方式中,并不限定历史语音对话的来源,例如,在不损害用户隐私的情况下,可以从面对面的谈话、从语音服务中心、或者从用户的历史语音呼叫等获取历史语音对话。在本发明的实施方式中,并不限定历史语音对话是哪些人之间的对话。历史语音对话可以是来自使用通信应用的用户之间的对话,或者还可以是无关人员的对话,例如,来源于电影对白等。
在本发明的一个实施方式中,可以基于来自特定用户的历史语音对话,来生成用于该特定用户的个性化聚类模型。例如,为了获得特定用户的表达习惯,还可以由该用户来提供历史语音对话以便生成训练数据。具体地,在用户以及与该用户进行语音呼叫的其他用户允许的情况下,还可以基于这些用户之间的历史语音呼叫来获取历史语音对话。以此方式获得的训练数据可以更加准确地反映该用户自身的语言习惯,因而可以针对该用户生成更加准确可靠的聚类模型。
接着可以从每个历史消息提取特征信息520,在本发明的实施方式中,特征信息是可以使得一个消息区别于其他消息的信息,例如特征信息可以包括多个维度。在下文中将结合具体示例描述如何提取特征信息。另外,还可以获取多个历史消息之间的关联关系522。关联关系描述两个历史消息之间的关联性,例如上文所述的前后相继的两个语音片段之间Q1A2具有关联关系。继而,基于特征信息520和关联关系522生成聚类模型530,该聚类模型530可以将具有关联关系的历史消息聚类至一个主题分组,而将不具有关联关系的历史消息聚类至不同分组。
在图5中还示出了基于所生成的聚类模型530来对来自通信应用的当前对话中的多个当前消息进行聚类的技术方案的框图。当前对话540例如是图4所示示例中的对话,该当前对话540可以包括多个当前消息,即当前消息1542至当前消息M544。此时,可以按照与上文中从历史消息1512至历史消息N514相同的方法,从当前消息1542至当前消息M544中提取特征信息550。继而,基于聚类模型530将特征信息550进行聚类,即可将与特征信息550相对应的当前消息1542至当前消息M544聚类至多个主题分组。例如,主题分组1560可以包括当前消息1542等,主题分组K562可以包括当前消息M544等。
由于从历史语音对话中提取的历史消息是连贯的并且通常具有明确的关联关系(例如,涉及相同主题),因而基于历史语音对话生成的聚类模型是较为准确的。在后续的操作中,通过使用生成的聚类模型来对来自当前对话的多个当前消息进行聚类,可以将多个当前消息聚类至相应的主题分组。
图6A示意性示出了根据本发明一个实施方式的用于生成聚类模型的方法的流程图600A。具体地,在步骤S602A中,响应于接收到来自历史语音对话中的多个历史消息,提取多个历史消息中的每个历史消息的特征信息。在此实施方式中,历史语音对话中的历史消息可以是语音格式,为了便于分析历史消息的内容,可以首先将语音格式的消息转换为文本格式的消息。本领域技术人员可以采取现有技术中已知或者将在未来开发的各种语音到文本的转换技术来进行转换,在本发明的上下文中将省略转换细节。
继而,针对转换后的文本消息进行处理。特征信息可以理解为使得一消息区别于其他消息的标识符,并且可以包括用于表示消息的多方面特征的多个维度,例如,消息的文本内容、消息的时间,等等。本领域技术人员可以基于具体应用环境的需要而定义特征信息的具体内容。例如,可以采用多维向量来表示历史消息的特征信息。
在步骤S604A中,获取多个历史消息之间的关联关系。由于语音对话是连贯的,语音对话中前后相继的数个历史消息通常讨论相同的主题,因而可以基于多个历史消息的时间顺序来获取多个历史消息之间的关联关系。应当注意,尽管在本发明的上下文中在步骤S602A和S604A中相继地示出了提取特征信息以及获取关联关系的步骤。在本发明的上下文中,可以以其他顺序来执行上述两个步骤,例如可以并行地执行、或者首先获取关联关系之后再提取特征信息。
在步骤S606A中,基于多个历史消息中的每个历史消息的特征信息和关联关系来生成将多个历史消息进行聚类的聚类模型。本领域技术人员可以采用现有技术中的用于生成聚类模型的方法来执行此步骤,例如,可以构造初始聚类模型,继而利用在步骤S602A和步骤S604A中获得的特征信息和关联关系作为训练数据,来训练初始聚类模型以获得最终的聚类模型。
应当理解,训练数据的选取是影响聚类模型的准确性的重要原因,在本发明中将历史语音对话作为训练数据的来源,可以在很大程度上确保训练数据本身是准确可靠的,因而根据本发明的实施方式的方法生成的聚类模型也是准确的。
在本发明的一个实施方式中,获取多个历史消息之间的关联关系包括:将多个历史消息中讨论相同主题的历史消息标识为具有关联关系。
应当注意,在历史语音对话中前后相继的两个历史消息通常讨论相同的主题。因而可以从历史语音对话中提取前后相继的两个历史消息并将其标识为具有关联关系。继续上文语音片段的示例,在语音片段S1S2Q1A2S1S2中,Q1和A2是前后相继的两个历史消息,并且分别表示用户1的提问和用户2的回答,此时这两个历史消息之间具有关联关系。
历史消息之间的关系可以包括两种类型:具有关联关系和不具有关联关系。继续上文语音片段的示例,假设在上文关于一个主题的第一语音片段S1S2Q1A2S1S2之后跟随有关于另一主题的第二语音片段Q1A2S1S2S1S2,则此时可以认为第一语音片段中的各个历史消息之间具有关联关系,而认为第一语音片段中的历史消息和第二语音片段中的历史消息之间不具有关联关系。例如,第一语音片段S1S2Q1A2S1S2中的A2和第二语音片段Q1A2S1S2S1S2中的Q1之间不具有关联关系。以此方式,可以构造两种类型的训练数据。
在本发明的一个实施方式中,基于多个历史消息中的每个历史消息的特征信息和关联关系来生成将多个历史消息进行聚类的聚类模型包括:基于特征信息和关联关系来训练聚类模型,使得聚类模型将具有关联关系的历史消息聚类至一个主题分组。
基于上文所述的步骤,已经提取了每个历史消息的特征信息,并且已经获取了各个历史消息之间的关联关系以标识各个历史消息是否涉及相同的主题,因而可以利用这些特征信息和关联关系来训练聚类模型,并使得具有关联关系的历史消息被聚类至一个主题分组。本发明的各个实施方式并不限制聚类模型的具体实施方式,而是本领域技术人员可以采用现有技术中已知的或者将在未来开发的各种聚类模型。
在本发明的一个实施方式中,响应于接收到来自历史语音对话中的多个历史消息,提取多个历史消息中的每个历史消息的特征信息包括:针对多个历史消息中的当前历史消息,获取当前历史消息的话题信息;获取当前历史消息的属性信息;以及集成话题信息和属性信息以形成历史消息的特征信息。
在本发明的一个实施方式中,消息的特征信息可以包括多方面的内容,例如可以包括话题信息,还可以包括消息自身的属性信息。通过集成上述两方面的内容,可以从多个角度描述消息的特征信息,进而使得特征信息可以更加准确地描述原始消息。在本发明的一个实施方式中,可以基于潜在语义分析(LatentSemanticAnalysis,LSA)来获得话题信息。
潜在语义分析是一种索引和检索方法。该方法基于传统向量空间模型(VectorSpaceModel)的原理,使用向量来表示term(词)和document(文档),并通过向量间的关系(如夹角)来判断term和document之间的关系。进一步,LSA可以将term和document映射到潜在语义空间,从而消除原始向量空间中的“噪音”,进而提高了信息检索的精确度。
在本发明的一个实施方式中,可以基于LSA的原理,将历史消息(对应于LSA中的document)和历史消息中的词语(对应于LSA中的term)映射至潜在语义空间,进而提取历史消息的话题信息。应当注意,在本发明的上下文中,话题信息是指从历史消息中提取的与语义相关的信息(例如,可以以多维向量方式表示),其不同于上文所述的有关天气、交通、教育、体育的主题信息。
在下文中将参见具体示例详细描述如何获取话题信息和属性信息。在本发明的一个实施方式中,获取当前历史消息的话题信息包括:获取描述历史消息的话题向量;以及将话题向量进行聚类以获取话题向量所属于的话题聚类指示符,话题信息包括话题聚类指示符。
具体地,可以针对多个历史消息进行分析以建立Term-Document矩阵,继而对Term-Document矩阵进行奇异值分解(SingularValueDecomposition,SVD),并对分解后的矩阵进行降维(即,低阶近似),最后使用降维后的矩阵构建潜在语义空间或重建Term-Document矩阵,进而获得话题向量。
在本发明的一个实施方式中,还可以基于现有的聚类模型将来自各个历史消息的话题向量进行聚类,并且将话题向量和该话题向量所属于的话题聚类指示符作为话题信息。在本发明的一个实施方式中,还可以单独地将话题向量和该话题向量所属于的话题聚类指示符中的任一项作为话题信息。
本领域技术人员可以基于潜在语义分析的一般原理来实现上述步骤,关于潜在语义分析的更多细节,本领域技术人员可以参见http://en.wikipedia.org/wiki/Latent_semantic_analysis,在本发明的上下文中将省略进一步的描述。应当注意,尽管在本发明的上下文中以潜在语义分析为具体示例描述了如何获取话题信息的具体实施方式,本领域技术人员还可以基于目前已知和/或将在未来开发的其他算法来获取话题信息,在本发明的上下文中将不再赘述。
在本发明的一个实施方式中,获取当前历史消息的属性信息包括:从对话中的多个历史消息的时序信息解析当前历史消息的属性信息,属性信息包括以下中的至少任一项:当前历史消息的时间以及当前历史消息与多个历史消息中的其他历史消息之间的距离。
属性信息可以包括当前历史消息的时间(例如,发送者发送当前历史消息的时间,或者通信应用的服务器接收到当前历史消息的时间,等等)。两个历史消息之间的时间差异可以描述两个历史消息属于同一主题的可能性。由于语音对话是两个用户之间的连续的对话,因而当一个用户提出问题时,另一用户通常会立刻回答问题,因而提问和回答之间的时间差通常很小。时间差异越大则两个历史消息属于相同主题的可能性越小。
属性信息可以包括当前历史消息与其他历史消息之间的距离。例如,多个历史消息的序列为M1-M6,则可以定义历史消息M1与历史消息M2之间的距离为1、历史消息M1与历史消息M3之间的距离为2、历史消息M2与历史消息M3之间的距离为1,以此类推。两个历史消息之间的距离也可以描述两个历史消息属于同一主题的可能性。例如,当一个用户提出问题之后,另一用户通常立刻进行回答,提问消息和回答消息之间的距离通常为1。因而,消息之间的距离越大(即,两个消息之间存在其他消息的数量越多),则两个消息属于同一主题的可能性越小。
在本发明的一个实施方式中,获取当前历史消息的属性信息包括:通过将当前历史消息的文本与多个历史消息中的其他历史消息的文本进行比较,获取当前历史消息的属性信息,属性信息包括以下中的至少任一项:语言学特征信息、基于n元语法(n-gram)的相似性信息、以及基于语义的相似性信息。在此实施方式中,还可以通过比较两个历史消息的文本内容,获取历史消息的不同方面的特征。本领域技术人员可以基于现有技术中已知的或者将在未来开发的算法,来提取各个历史消息的语言学特征信息、基于n元语法的相似性信息、以及基于语义的相似性信息。
在本发明的一个实施方式中,可以以如下多维向量来表示历史消息的特征信息:(话题向量,话题向量所属于的话题聚类指示符,时间,距离,语言学特征信息,基于n元语法的相似性信息,基于语义的相似性信息)。在本发明的一个实施方式中,基于具体应用环境的需求,特征信息还可以包括更多或者更少的维度。
在上文中已经参见附图描述了如何基于历史语音对话来生成聚类模型的详细步骤,在下文中将详细描述如何基于所生成的模型来将对话中的多个消息进行聚类。在本发明的一个实施方式中,提出了一种用于将当前对话中的多个当前消息进行聚类的方法,包括:响应于接收到当前对话中的多个当前消息,提取多个当前消息中的每个当前消息的特征信息;以及采用本发明的方法生成的聚类模型,基于多个当前消息的每个当前消息的特征信息,将多个当前消息聚类至至少一个主题分组。
图6B示意性示出了根据本发明一个实施方式的基于所生成的聚类模型将对话中的多个当前消息进行聚类的方法的流程图600B。在图6B中的对话是指利用各种通信应用(例如,微信等)进行的对话。具体地,在步骤S602B中,响应于接收到对话中的多个当前消息,提取多个当前消息中的每个当前消息的特征信息。在此步骤中,提取特征信息的方法与上文参见图6中的步骤S602A中所示的方法是相同的,因而不再赘述。
在步骤S604B中,采用本发明的方法生成的聚类模型,基于多个当前消息的每个当前消息的特征信息,将多个当前消息聚类至至少一个主题分组。在本发明的上下文中,该至少一个主题分组可以是与聚类模型相关联的主题分组。备选地,当当前对话涉及在聚类模型中不曾出现的主题时,根据具体的实施方式该至少一个主题分组还可以包括新创建的主题分组。
在此步骤中的聚类模型是基于历史语音对话生成的、可以较为可靠和准确的聚类模型,因而基于该聚类模型可以可靠并且准确地将当前对话中的多个当前消息聚类至至少一个主题分组。
在本发明的一个实施方式中,响应于接收到当前对话中的多个当前消息、提取多个当前消息中的每个当前消息的特征信息的方法,与根据本发明的响应于接收到来自历史语音对话中的多个历史消息、提取多个历史消息中的每个历史消息的特征信息的方法是相同的。
在本发明的一个实施方式中,多个当前消息包括文本消息和语音消息中的至少任一项。当当前消息是语音消息时,可以首先将语音消息转换至文本消息,继而针对转换后的文本消息进行处理。
在本发明的一个实施方式中,进一步包括以下中的至少任一项:按照预定义的显示模式显示至少一个主题分组中的消息;以及突出显示至少一个主题分组中的一个主题分组中的无响应消息。
在已经获得主题分组时,可以以不同的显示模式来显示不同主题分组中的消息。图7示意性示出了根据本发明一个实施方式的对聚类后的多个消息进行显示的界面的示意图700。图7中的消息401-409与图4所示的消息相同,不同之处在于通过使用如图6B的方法已经将消息401-409聚类至不同的主题分组(例如,折扣、促销、发货、号码等),因而可以以不同的显示模式来显示各个主题分组中的消息。
具体地,可以以如折扣732、促销734、发货736和号码738所示的显示模式来显示各个分组中的消息。例如,主题分组“折扣”可以包括消息401和405,因而可以以折扣732所示的显示模式来显示消息401和405。又例如,主题分组“促销”可以包括消息403和406,因而可以以促销734所示的显示模式来显示消息403和406。
在本发明的一个实施方式中,通过聚类还可以发现,在某个聚类分组中仅包括一个消息(例如,消息402),即,该消息是来自客户410的问题,然而商家420并未针对该问题给出任何回答。此时,可以突出显示至少一个主题分组中的一个主题分组中的无响应消息(例如,以附图标记740示出的星形表示)。
本领域技术人员应当理解,在本发明的上下文中的“无响应消息”并不仅限于问题类型的消息(例如,一个用户提出而另一用户没有回答的问题),而是还可以包括陈述类型的消息。例如,消息402的内容可以是“我希望指定UPS送货”,尽管该消息402并非问题类型的消息,由于此时商家420并没有对于该消息402做出任何响应,因而此时可以认为消息402是无响应消息。
图8示意性示出了根据本发明另一实施方式的对聚类后的多个消息进行显示的界面的示意图800。继续上文的示例,在已经获得了多个主题分组810-850的情况下,还可以集中地显示每个主题分组中的消息。例如,可以在与主题分组1810相关联的区域中显示消息401和405,在与主题分组2820相关联的区域中显示消息403和406,…,在与主题分组5850相关联的区域中显示消息402,等等。
本领域技术人员应当理解,尽管在本发明的上下文中以中文消息作为具体示例描述了本发明的各个实施方式,本发明的技术方案还可以应用于以其他语言编写的消息。在本发明的一个实施方式中,消息可以以中文、英文、法文或者其他国家的语言编写,此时,可以将以相应语言的历史语音对话作为训练数据的来源,并基于这些对话来生成特征信息和关联关系进而生成相应语言的训练模型。在本发明的一个实施方式中,消息还可以包括两种或者更多国家的语言,此时可以将该两种或者更多国家的语言作为训练数据的来源。
本领域技术人员应当理解,随着用户对话时间的增长,用户可能会不断开启新的主题并进行讨论。因而,随着新消息的到来,可以不断地执行本发明的聚类方法。例如对于图4所示的示例,当对话中仅包括消息401-406时,可以获得如下聚类分组:折扣、促销、发货和无响应消息;而当对话中包括消息401-409时,则可以获得更多的聚类分组。
本领域技术人员应当理解,采用上文所述的方法生成的聚类模型并非一成不变,而是可以例如基于对越来越多的消息进行聚类所形成的主题分组,来更新聚类模型。本领域技术人员可以采用现有技术中已知的或者将在未来开发的更新聚类模型的方法,来更新基于历史语音对话生成的聚类模型。
前面已经参考附图描述了实现本发明的方法的各个实施方式。本领域技术人员可以理解的是,上述方法既可以以软件方式实现,也可以以硬件方式实现,或者通过软件与硬件相结合的方式实现。并且,本领域技术人员可以理解,通过以软件、硬件或者软硬件相结合的方式实现上述方法中的各个步骤,可以提供一种基于相同发明构思的一种设备。即使该设备在硬件结构上与通用处理设备相同,由于其中所包含的软件的作用,使得该设备表现出区别于通用处理设备的特性,从而形成本发明的各个实施方式的设备。本发明中所述设备包括若干装置或模块,所述装置或模块被配置为执行相应步骤。本领域的所述技术人员通过阅读本说明书可以理解如何编写程序实现所述装置或模块执行的动作。由于所述设备与方法基于相同的发明构思,因此其中相同或相应的实现细节同样适用于与上述方法对应的装置或模块,由于其在上文中已经进行了详细和完整的描述,因此在下文中可能不再进行赘述。
图9A示意性示出了根据本发明一个实施方式的用于生成聚类模型的装置的框图900A。具体地,提供了一种用于生成聚类模型的装置,包括:提取模块910A,配置用于响应于接收到来自历史语音对话中的多个历史消息,提取多个历史消息中的每个历史消息的特征信息;获取模块920A,配置用于获取多个历史消息之间的关联关系;以及生成模块930A,配置用于基于多个历史消息中的每个历史消息的特征信息和关联关系来生成将多个历史消息进行聚类的聚类模型。
在本发明的一个实施方式中,获取模块920A包括:标识模块,配置用于将多个历史消息中讨论相同主题的历史消息标识为具有关联关系。
在本发明的一个实施方式中,生成模块930A包括:训练模块,配置用于基于特征信息和关联关系来训练聚类模型,使得聚类模型将具有关联关系的历史消息聚类至一个主题分组。
在本发明的一个实施方式中,提取模块910A包括:第一获取模块,配置用于针对多个历史消息中的当前历史消息,获取当前历史消息的话题信息;第二获取模块,配置用于获取当前历史消息的属性信息;以及集成模块,配置用于集成话题信息和属性信息以形成历史消息的特征信息。
在本发明的一个实施方式中,第一获取模块包括:向量获取模块,配置用于获取描述历史消息的话题向量;以及指示符获取模块,配置用于将话题向量进行聚类以获取话题向量所属于的话题聚类指示符,话题信息包括话题向量和话题聚类指示符。
在本发明的一个实施方式中,第二获取模块包括:解析模块,配置用于从对话中的多个历史消息的时序信息解析当前历史消息的属性信息,属性信息包括以下中的至少任一项:当前历史消息的时间以及当前历史消息与多个历史消息中的其他历史消息之间的距离。
在本发明的一个实施方式中,第二获取模块包括:比较模块,配置用于通过将当前历史消息与多个历史消息中的其他历史消息的文本进行比较,获取当前历史消息的属性信息,属性信息包括以下中的至少任一项:语言学特征信息、基于n元语法的相似性信息、以及基于语义的相似性信息。
图9B示意性示出了根据本发明一个实施方式的基于所生成的聚类模型将对当前话中的多个当前消息进行聚类的装置的框图900B。具体地,提供了一种用于将当前对话中的多个当前消息进行聚类的装置,包括:第一提取模块910B,配置用于响应于接收到当前对话中的多个当前消息,提取多个当前消息中的每个当前消息的特征信息;以及聚类模块920B,配置用于采用本发明的装置生成的聚类模型,基于多个当前消息的每个当前消息的特征信息,将多个当前消息聚类至至少一个主题分组。
在本发明的一个实施方式中,多个当前消息包括文本消息和语音消息中的至少任一项。
在本发明的一个实施方式中,进一步包括:显示模块,配置用于按照预定义的显示模式显示至少一个主题分组中的当前消息;以及突出显示模块,配置用于突出显示至少一个主题分组中的一个主题分组中的无响应消息。
本发明可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于使处理器实现本发明的各个方面的计算机可读程序指令。
计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
用于执行本发明操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如Smalltalk、C++等,以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施方式中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本发明的各个方面。
这里参照根据本发明实施方式的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本发明的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,从而生产出一种机器,使得这些指令在通过计算机或其他可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
也可以把计算机可读程序指令加载到计算机、其他可编程数据处理装置、或其他设备上,使得在计算机、其他可编程数据处理装置或其他设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其他可编程数据处理装置、或其他设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
附图中的流程图和框图显示了根据本发明的多个实施方式的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
以上已经描述了本发明的各实施方式,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施方式。在不偏离所说明的各实施方式的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施方式的原理、实际应用或对市场中的技术的技术改进,或者使本技术领域的其他普通技术人员能理解本文披露的各实施方式。
Claims (20)
1.一种用于生成聚类模型的方法,包括:
响应于接收到来自历史语音对话中的多个历史消息,提取所述多个历史消息中的每个历史消息的特征信息;
获取所述多个历史消息之间的关联关系;以及
基于所述多个历史消息中的每个历史消息的所述特征信息和所述关联关系来生成将所述多个历史消息进行聚类的聚类模型。
2.根据权利要求1所述的方法,其中所述获取所述多个历史消息之间的关联关系包括:
将所述多个历史消息中讨论相同主题的历史消息标识为具有所述关联关系。
3.根据权利要求2所述的方法,其中所述基于所述多个历史消息中的每个历史消息的所述特征信息和所述关联关系来生成将所述多个历史消息进行聚类的聚类模型包括:
基于所述特征信息和所述关联关系来训练所述聚类模型,使得所述聚类模型将具有所述关联关系的历史消息聚类至一个主题分组。
4.根据权利要求1-3中的任一项所述的方法,其中所述响应于接收到来自历史语音对话中的多个历史消息,提取所述多个历史消息中的每个历史消息的特征信息包括:针对所述多个历史消息中的当前历史消息,
获取所述当前历史消息的话题信息;
获取所述当前历史消息的属性信息;以及
集成所述话题信息和所述属性信息以形成所述历史消息的特征信息。
5.根据权利要求4所述的方法,其中所述获取所述当前历史消息的话题信息包括:
获取描述所述历史消息的话题向量;以及
将所述话题向量进行聚类以获取所述话题向量所属于的话题聚类指示符,所述话题信息包括所述话题向量和所述话题聚类指示符。
6.根据权利要求4所述的方法,其中获取所述当前历史消息的属性信息包括:
从所述对话中的所述多个历史消息的时序信息解析所述当前历史消息的所述属性信息,所述属性信息包括以下中的至少任一项:所述当前历史消息的时间以及所述当前历史消息与所述多个历史消息中的其他历史消息之间的距离。
7.根据权利要求4所述的方法,其中所述获取所述当前历史消息的属性信息包括:
通过将所述当前历史消息的文本与所述多个历史消息中的其他历史消息的文本进行比较,获取所述当前历史消息的所述属性信息,所述属性信息包括以下中的至少任一项:语言学特征信息、基于n元语法的相似性信息、以及基于语义的相似性信息。
8.一种用于将当前对话中的多个当前消息进行聚类的方法,包括:
响应于接收到所述对话中的所述多个当前消息,提取所述多个当前消息中的每个当前消息的特征信息;以及
采用根据权利要求1-7中的任一项所述的方法生成的聚类模型,基于所述多个当前消息的每个当前消息的所述特征信息,将所述多个当前消息聚类至至少一个主题分组。
9.根据权利要求8所述的方法,其中所述多个当前消息包括文本消息和语音消息中的至少任一项。
10.根据权利要求8所述的方法,进一步包括以下中的至少任一项:
按照预定义的显示模式显示所述至少一个主题分组中的当前消息;以及
突出显示所述至少一个主题分组中的一个主题分组中的无响应消息。
11.一种用于生成聚类模型的装置,包括:
提取模块,配置用于响应于接收到来自历史语音对话中的多个历史消息,提取所述多个历史消息中的每个历史消息的特征信息;
获取模块,配置用于获取所述多个历史消息之间的关联关系;以及
生成模块,配置用于基于所述多个历史消息中的每个历史消息的所述特征信息和所述关联关系来生成将所述多个历史消息进行聚类的聚类模型。
12.根据权利要求11所述的装置,其中所述获取模块包括:
标识模块,配置用于将所述多个历史消息中讨论相同主题的历史消息标识为具有所述关联关系。
13.根据权利要求12所述的装置,其中所述生成模块包括:
训练模块,配置用于基于所述特征信息和所述关联关系来训练所述聚类模型,使得所述聚类模型将具有所述关联关系的历史消息聚类至一个主题分组。
14.根据权利要求11-13中的任一项所述的装置,其中所述提取模块包括:
第一获取模块,配置用于针对所述多个历史消息中的当前历史消息,获取所述当前历史消息的话题信息;
第二获取模块,配置用于获取所述当前历史消息的属性信息;以及
集成模块,配置用于集成所述话题信息和所述属性信息以形成所述历史消息的特征信息。
15.根据权利要求14所述的装置,其中所述第一获取模块包括:
向量获取模块,配置用于获取描述所述历史消息的话题向量;以及
指示符获取模块,配置用于将所述话题向量进行聚类以获取所述话题向量所属于的话题聚类指示符,所述话题信息包括所述话题向量和所述话题聚类指示符。
16.根据权利要求14所述的装置,其中所述第二获取模块包括:
解析模块,配置用于从所述对话中的所述多个历史消息的时序信息解析所述当前历史消息的所述属性信息,所述属性信息包括以下中的至少任一项:所述当前历史消息的时间以及所述当前历史消息与所述多个历史消息中的其他历史消息之间的距离。
17.根据权利要求14所述的装置,其中所述第二获取模块包括:
比较模块,配置用于通过将所述当前历史消息与所述多个历史消息中的其他历史消息的文本进行比较,获取所述当前历史消息的所述属性信息,所述属性信息包括以下中的至少任一项:语言学特征信息、基于n元语法的相似性信息、以及基于语义的相似性信息。
18.一种用于将对话中的多个当前消息进行聚类的装置,包括:
第一提取模块,配置用于响应于接收到所述对话中的所述多个当前消息,提取所述多个当前消息中的每个当前消息的特征信息;以及
聚类模块,配置用于采用根据权利要求11-17中的任一项所述的装置生成的聚类模型,基于所述多个当前消息的每个当前消息的所述特征信息,将所述多个当前消息聚类至至少一个主题分组。
19.根据权利要求18所述的装置,其中所述多个当前消息包括文本消息和语音消息中的至少任一项。
20.根据权利要求18所述的装置,进一步包括:
显示模块,配置用于按照预定义的显示模式显示所述至少一个主题分组中的当前消息;以及
突出显示模块,配置用于突出显示所述至少一个主题分组中的一个主题分组中的无响应消息。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410373109.XA CN105450497A (zh) | 2014-07-31 | 2014-07-31 | 生成聚类模型以及基于该聚类模型进行聚类的方法和装置 |
US14/812,141 US20160034558A1 (en) | 2014-07-31 | 2015-07-29 | Generating a clustering model and clustering based on the clustering model |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410373109.XA CN105450497A (zh) | 2014-07-31 | 2014-07-31 | 生成聚类模型以及基于该聚类模型进行聚类的方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105450497A true CN105450497A (zh) | 2016-03-30 |
Family
ID=55180264
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410373109.XA Pending CN105450497A (zh) | 2014-07-31 | 2014-07-31 | 生成聚类模型以及基于该聚类模型进行聚类的方法和装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US20160034558A1 (zh) |
CN (1) | CN105450497A (zh) |
Cited By (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106202031A (zh) * | 2016-06-27 | 2016-12-07 | 东南大学 | 一种基于在线社交平台群聊数据对群成员进行关联的系统及方法 |
CN106302108A (zh) * | 2016-08-03 | 2017-01-04 | 努比亚技术有限公司 | 群消息管理方法和装置 |
CN107066450A (zh) * | 2017-05-27 | 2017-08-18 | 国家计算机网络与信息安全管理中心 | 一种基于学习的即时通信会话切分技术与方法 |
CN107562853A (zh) * | 2017-08-28 | 2018-01-09 | 武汉烽火普天信息技术有限公司 | 一种面向海量互联网文本数据的流式聚类及展现的方法 |
CN109039673A (zh) * | 2018-08-02 | 2018-12-18 | 北京工业大学 | 一种消息组织方法和服务器 |
CN110138645A (zh) * | 2019-03-29 | 2019-08-16 | 腾讯科技(深圳)有限公司 | 会话消息的显示方法、装置、设备及存储介质 |
CN110268428A (zh) * | 2017-02-20 | 2019-09-20 | 谷歌有限责任公司 | 基于主题的消息分组和概括 |
CN110413744A (zh) * | 2019-06-17 | 2019-11-05 | 阿里巴巴集团控股有限公司 | 即时通讯过程中的对话消息处理方法、装置及设备 |
CN110600040A (zh) * | 2019-09-19 | 2019-12-20 | 北京三快在线科技有限公司 | 声纹特征注册方法、装置、计算机设备及存储介质 |
CN110688466A (zh) * | 2018-07-05 | 2020-01-14 | 国际商业机器公司 | 在用户对话系统中集成多个领域问题解决 |
CN110730270A (zh) * | 2019-09-09 | 2020-01-24 | 上海凯京信达科技集团有限公司 | 一种短信分组方法、装置及计算机存储介质、电子设备 |
CN110781930A (zh) * | 2019-10-14 | 2020-02-11 | 西安交通大学 | 一种基于网络安全设备日志数据的用户画像分组及行为分析方法和系统 |
CN110795492A (zh) * | 2019-11-11 | 2020-02-14 | 国网山东省电力公司电力科学研究院 | 一种交易数据可视化展示参数多维度快速处理系统 |
CN111223477A (zh) * | 2018-11-23 | 2020-06-02 | 珠海格力电器股份有限公司 | 一种人机交互时话题上移的方法及设备 |
CN111698144A (zh) * | 2019-03-15 | 2020-09-22 | 钉钉控股(开曼)有限公司 | 通信方法、装置、设备以及群组创建方法、装置、设备 |
CN112183899A (zh) * | 2020-11-04 | 2021-01-05 | 北京嘀嘀无限科技发展有限公司 | 确定安全度预测模型的方法、装置、设备和存储介质 |
CN113052534A (zh) * | 2021-03-30 | 2021-06-29 | 上海东普信息科技有限公司 | 基于半监督聚类的地址分配方法、装置、设备及存储介质 |
CN113504860A (zh) * | 2021-07-23 | 2021-10-15 | 维沃移动通信(杭州)有限公司 | 消息回复方法和装置 |
CN114979754A (zh) * | 2022-04-11 | 2022-08-30 | 北京高途云集教育科技有限公司 | 一种信息显示方法、装置、设备以及存储介质 |
WO2022206698A1 (zh) * | 2021-04-01 | 2022-10-06 | 维沃移动通信(杭州)有限公司 | 消息显示方法、装置及电子设备 |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105335597B (zh) * | 2014-07-30 | 2019-04-16 | 国际商业机器公司 | 用于获取路线的轨迹模式的方法和系统 |
US20210065708A1 (en) * | 2018-02-08 | 2021-03-04 | Sony Corporation | Information processing apparatus, information processing system, information processing method, and program |
US10977289B2 (en) * | 2019-02-11 | 2021-04-13 | Verizon Media Inc. | Automatic electronic message content extraction method and apparatus |
US11762819B2 (en) | 2019-10-15 | 2023-09-19 | Target Brands, Inc. | Clustering model analysis for big data environments |
CN112131382B (zh) * | 2020-08-20 | 2024-05-10 | 彭涛 | 民生问题高发地的识别方法、装置及电子设备 |
CN113225676B (zh) * | 2021-05-25 | 2022-10-11 | 深圳市欢太数字科技有限公司 | 近场通信的设置方法、装置、移动终端及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101119326A (zh) * | 2006-08-04 | 2008-02-06 | 腾讯科技(深圳)有限公司 | 一种即时通信会话记录的管理方法及装置 |
US20080177538A1 (en) * | 2006-10-13 | 2008-07-24 | International Business Machines Corporation | Generation of domain models from noisy transcriptions |
US20120143871A1 (en) * | 2010-12-01 | 2012-06-07 | Google Inc. | Topic based user profiles |
CN102646134A (zh) * | 2012-03-29 | 2012-08-22 | 百度在线网络技术(北京)有限公司 | 一种用于确定消息记录中的消息会话的方法和设备 |
CN103078781A (zh) * | 2011-10-25 | 2013-05-01 | 国际商业机器公司 | 用于即时消息系统的方法和即时消息系统 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7130848B2 (en) * | 2000-08-09 | 2006-10-31 | Gary Martin Oosta | Methods for document indexing and analysis |
US6907436B2 (en) * | 2000-10-27 | 2005-06-14 | Arizona Board Of Regents, Acting For And On Behalf Of Arizona State University | Method for classifying data using clustering and classification algorithm supervised |
-
2014
- 2014-07-31 CN CN201410373109.XA patent/CN105450497A/zh active Pending
-
2015
- 2015-07-29 US US14/812,141 patent/US20160034558A1/en not_active Abandoned
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101119326A (zh) * | 2006-08-04 | 2008-02-06 | 腾讯科技(深圳)有限公司 | 一种即时通信会话记录的管理方法及装置 |
US20080177538A1 (en) * | 2006-10-13 | 2008-07-24 | International Business Machines Corporation | Generation of domain models from noisy transcriptions |
US20120143871A1 (en) * | 2010-12-01 | 2012-06-07 | Google Inc. | Topic based user profiles |
CN103078781A (zh) * | 2011-10-25 | 2013-05-01 | 国际商业机器公司 | 用于即时消息系统的方法和即时消息系统 |
CN102646134A (zh) * | 2012-03-29 | 2012-08-22 | 百度在线网络技术(北京)有限公司 | 一种用于确定消息记录中的消息会话的方法和设备 |
Cited By (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106202031A (zh) * | 2016-06-27 | 2016-12-07 | 东南大学 | 一种基于在线社交平台群聊数据对群成员进行关联的系统及方法 |
CN106302108B (zh) * | 2016-08-03 | 2019-11-05 | 努比亚技术有限公司 | 群消息管理方法和装置 |
CN106302108A (zh) * | 2016-08-03 | 2017-01-04 | 努比亚技术有限公司 | 群消息管理方法和装置 |
CN110268428A (zh) * | 2017-02-20 | 2019-09-20 | 谷歌有限责任公司 | 基于主题的消息分组和概括 |
CN107066450A (zh) * | 2017-05-27 | 2017-08-18 | 国家计算机网络与信息安全管理中心 | 一种基于学习的即时通信会话切分技术与方法 |
CN107562853A (zh) * | 2017-08-28 | 2018-01-09 | 武汉烽火普天信息技术有限公司 | 一种面向海量互联网文本数据的流式聚类及展现的方法 |
CN110688466B (zh) * | 2018-07-05 | 2023-06-23 | 国际商业机器公司 | 在用户对话系统中集成多个领域问题解决 |
CN110688466A (zh) * | 2018-07-05 | 2020-01-14 | 国际商业机器公司 | 在用户对话系统中集成多个领域问题解决 |
CN109039673A (zh) * | 2018-08-02 | 2018-12-18 | 北京工业大学 | 一种消息组织方法和服务器 |
CN111223477A (zh) * | 2018-11-23 | 2020-06-02 | 珠海格力电器股份有限公司 | 一种人机交互时话题上移的方法及设备 |
CN111698144A (zh) * | 2019-03-15 | 2020-09-22 | 钉钉控股(开曼)有限公司 | 通信方法、装置、设备以及群组创建方法、装置、设备 |
CN110138645B (zh) * | 2019-03-29 | 2021-06-18 | 腾讯科技(深圳)有限公司 | 会话消息的显示方法、装置、设备及存储介质 |
CN110138645A (zh) * | 2019-03-29 | 2019-08-16 | 腾讯科技(深圳)有限公司 | 会话消息的显示方法、装置、设备及存储介质 |
US11962548B2 (en) | 2019-03-29 | 2024-04-16 | Tencent Technologies (Shenzhen) Company Limited | Message display method and apparatus, device, and storage medium |
CN110413744A (zh) * | 2019-06-17 | 2019-11-05 | 阿里巴巴集团控股有限公司 | 即时通讯过程中的对话消息处理方法、装置及设备 |
CN110730270A (zh) * | 2019-09-09 | 2020-01-24 | 上海凯京信达科技集团有限公司 | 一种短信分组方法、装置及计算机存储介质、电子设备 |
CN110600040A (zh) * | 2019-09-19 | 2019-12-20 | 北京三快在线科技有限公司 | 声纹特征注册方法、装置、计算机设备及存储介质 |
CN110781930A (zh) * | 2019-10-14 | 2020-02-11 | 西安交通大学 | 一种基于网络安全设备日志数据的用户画像分组及行为分析方法和系统 |
CN110795492A (zh) * | 2019-11-11 | 2020-02-14 | 国网山东省电力公司电力科学研究院 | 一种交易数据可视化展示参数多维度快速处理系统 |
CN112183899A (zh) * | 2020-11-04 | 2021-01-05 | 北京嘀嘀无限科技发展有限公司 | 确定安全度预测模型的方法、装置、设备和存储介质 |
CN113052534A (zh) * | 2021-03-30 | 2021-06-29 | 上海东普信息科技有限公司 | 基于半监督聚类的地址分配方法、装置、设备及存储介质 |
CN113052534B (zh) * | 2021-03-30 | 2023-08-01 | 上海东普信息科技有限公司 | 基于半监督聚类的地址分配方法、装置、设备及存储介质 |
WO2022206698A1 (zh) * | 2021-04-01 | 2022-10-06 | 维沃移动通信(杭州)有限公司 | 消息显示方法、装置及电子设备 |
CN113504860A (zh) * | 2021-07-23 | 2021-10-15 | 维沃移动通信(杭州)有限公司 | 消息回复方法和装置 |
CN114979754A (zh) * | 2022-04-11 | 2022-08-30 | 北京高途云集教育科技有限公司 | 一种信息显示方法、装置、设备以及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
US20160034558A1 (en) | 2016-02-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105450497A (zh) | 生成聚类模型以及基于该聚类模型进行聚类的方法和装置 | |
US11455469B2 (en) | Personality based sentiment analysis of textual information written in natural language | |
US10599644B2 (en) | System and method for managing artificial conversational entities enhanced by social knowledge | |
CN113647067A (zh) | 跨通信信道维护机器语言模型状态 | |
US11374884B2 (en) | Managing and displaying online messages along timelines | |
US11178087B2 (en) | Aggregating redundant messages in a group chat | |
EP3543875A1 (en) | Conversation context management in a conversation agent | |
US11481442B2 (en) | Leveraging intent resolvers to determine multiple intents | |
US20210158203A1 (en) | Reinforcement learning for chatbots | |
CN105786593A (zh) | 用于重启上下文相关的应用集的方法和系统 | |
US20170061287A1 (en) | FAQs UPDATER AND GENERATOR FOR MULTI-COMMUNICATION CHANNELS | |
US20180365552A1 (en) | Cognitive communication assistant services | |
US11586677B2 (en) | Resolving user expression having dependent intents | |
CN111191013A (zh) | 生成和执行最优对话策略 | |
US10812417B2 (en) | Auto-incorrect in chatbot human-machine interfaces | |
US10691764B2 (en) | Search engine optimization techniques | |
US10831849B2 (en) | Detecting and grouping users in electronic communications | |
US10929412B2 (en) | Sharing content based on extracted topics | |
US20180144235A1 (en) | Cognitive online meeting assistant facility | |
US20170168870A1 (en) | Task status tracking and update system | |
CN105528365A (zh) | 用于管理可执行文件的方法和装置 | |
US9866504B2 (en) | Identifying end users in need of technical assistance | |
US20200218989A1 (en) | Conversational system management | |
US20220407731A1 (en) | Facilitating social events in web conferences | |
US20170076245A1 (en) | Automatic profile generator and scorer |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20160330 |