CN101421728B - 挖掘关于服务的数据 - Google Patents

挖掘关于服务的数据 Download PDF

Info

Publication number
CN101421728B
CN101421728B CN2007800127602A CN200780012760A CN101421728B CN 101421728 B CN101421728 B CN 101421728B CN 2007800127602 A CN2007800127602 A CN 2007800127602A CN 200780012760 A CN200780012760 A CN 200780012760A CN 101421728 B CN101421728 B CN 101421728B
Authority
CN
China
Prior art keywords
packet
voip
profile
content
client
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN2007800127602A
Other languages
English (en)
Other versions
CN101421728A (zh
Inventor
D·密尔斯汀
K·王
L·克里德尔
L-C·楚
M·D·马卢厄
S·C·福布斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Technology Licensing LLC
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of CN101421728A publication Critical patent/CN101421728A/zh
Application granted granted Critical
Publication of CN101421728B publication Critical patent/CN101421728B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/22Arrangements for supervision, monitoring or testing
    • H04M3/2281Call monitoring, e.g. for law enforcement purposes; Call tracing; Detection or prevention of malicious calls
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/30Network architectures or network communication protocols for network security for supporting lawful interception, monitoring or retaining of communications or communication related information
    • H04L63/306Network architectures or network communication protocols for network security for supporting lawful interception, monitoring or retaining of communications or communication related information intercepting packet switched data communications, e.g. Web, Internet or IMS communications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M7/00Arrangements for interconnection between switching centres
    • H04M7/006Networks other than PSTN/ISDN providing telephone service, e.g. Voice over Internet Protocol (VoIP), including next generation networks with a packet-switched transport layer

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Security & Cryptography (AREA)
  • Technology Law (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computer Hardware Design (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Telephonic Communication Services (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Exchange Systems With Centralized Control (AREA)

Abstract

一般而言,本发明提供了处理数字语音对话以标识包含感兴趣内容的数据分组并且进一步处理所标识的数据分组的能力。更具体而言,可以开发标识要被挖掘的特定类型的内容,并进一步标识当定位到包含此类内容的数据分组时要完成什么的挖掘简档。一系统可在数字语音对话中搜索包含该内容的数据分组并且一旦标识了该数据分组即对其执行处理。

Description

挖掘关于服务的数据
技术领域
本发明涉及挖掘数据,尤其,本发明涉及挖掘关于服务的数据。
背景技术
一般而言,因特网电话系统为用户提供了拥有一呼叫连接的机会,该呼叫连接与常规的电话系统相比具有增强的呼叫特征。在通常被称为网际协议语音(VoIP)的典型因特网电话系统中,音频信息被处理成称为分组的数据块序列,以便利用网际协议(IP)数据网络进行对话。在VoIP呼叫对话期间,数字化的语音被转换成小的语音数据帧并通过向发送和接收的语音数据帧添加IP头部来组装语音数据分组。
VoIP电话受到大家喜爱是因为其对话的灵活性和可移植性、建立和控制多媒体通信的能力等。VoIP技术很可能因其提供增强的呼叫特征和高级服务的能力而继续得到青睐。
发明内容
提供本概述以便以简化的形式介绍将在以下详细描述中进一步描述的一些概念。本概述并不旨在标识所要求保护的主题的关键特征,也不旨在用于帮助确定所要求保护的主题的范围。
一般而言,本发明提供了处理数字语音对话以标识包含该对话内且与该对话相关联的感兴趣内容的数据分组以便进一步处理所标识的数据分组的能力。更具体而言,可以开发标识要被挖掘的特定类型的内容,并进一步标识当定位到包含此类内容的数据分组时要完成什么的挖掘简档。一系统可在数字语音对话中搜索包含该内容的数据分组并且一旦标识了该数据分组即对其执行处理。
根据一方面,提供了一种用于从数字语音对话中挖掘数据分组的方法。可选择标识将要从该数字语音对话中挖掘的内容类型的挖掘简档。当客户设备中、服务提供方、服务器(内部部署或外部分机)或第三方中的任何一个或多个接收到数据分组时,该数据分组可被迅速检查以确定其是否可能包含值得挖掘的内容。例如,一数据分组可包含标识该数据分组是否包含值得挖掘的内容的头部。如果确定该数据分组可能包含值得挖掘的内容,则可分析该数据分组以确定其是否包含与挖掘简档相关的内容。
根据另一方面,提供了一种具有用于处理所挖掘的数据分组的计算机可执行组件的计算机可读介质。该计算机可读介质包括被配置成标识对话中与一个或多个挖掘简档相关的数据分组的所挖掘的数据分组管理组件。还可包括确定所挖掘的数据分组或其内容是否要被更改,以及如果是,则如何被更改的所挖掘的数据分组更改组件。另外,还包括被配置成对所挖掘的数据分组执行处理的所挖掘的数据分组处理组件。
根据另一方面,提供了一种用于提供与数字语音对话的内容相关的附加信息的方法。该方法包括处理对话的数据分组以标识与一挖掘简档相关的内容以及获得与所标识的内容相关的信息。例如,如果所标识的内容是关于“鞋”,则该方法可获得关于鞋的销售信息并实时地或在稍后的时刻提供该信息。
附图说明
当结合附图参考以下详细描述时,可以更容易领会并更好地理解本发明的上述方面和许多附加优点,附图中:
图1是说明根据本发明的一个方面的用于在各客户之间建立对话信道的VoIP环境的框图;
图2是说明根据本发明的一方面的对应于VoIP客户的各种VoIP设备的框图;
图3是说明根据本发明的一方面的与VoIP客户设备相关联的各组件的框图;
图4A和4B是说明根据本发明的一个方面的两个VoIP客户之间通过对话信道的数据交换的框图;
图5是在图1的VoIP环境中所建立的对话信道上使用的数据分组的框图;
图6是示出根据本发明的一方面的两个VoIP客户之间的用于传输由所标识的结构化分层结构定义的上下文信息的交互的框图;
图7是示出根据本发明的一个实施例的两个VoIP客户之间用于交换挖掘简档的交互的框图;
图8-12是说明根据本发明的一方面的对应于VoIP上下文信息的结构化分层结构的各属性和类的框图;以及
图13是根据本发明的一方面的用于挖掘数字语音对话的挖掘例程的流程图;以及
图14是根据本发明的一个实施例的用于处理已挖掘的数据分组的所挖掘的数据例程的流程图。
具体实施方式
一般而言,本发明涉及对包含在诸如网际协议语音(VoIP)对话等数字语音对话中的内容的标识、提取和进一步使用。更具体而言,本发明涉及从对话和/或与对话相关的信息中“挖掘”数据。如此处所使用的“挖掘”或“挖掘服务”是对对话的处理以标识感兴趣的数据(对话和/或上下文的)。挖掘可以在对话期间在交换数据时对数据执行。或者,挖掘可对历史的或储存的数据执行(此类数据可涉及在过去发生、当前正在发生或在将来将会发生的事件或动作)。所标识的数据此处称为“所挖掘的数据”,其可由其它服务或应用程序使用、储存、转发、从对话中提取、替换、用附加数据补充等。类似于挖掘,对所挖掘的数据的处理可以在对话期间实时完成。或者,或除此之外,所挖掘的数据可被储存并被后处理。
用于协助数据挖掘的一种技术是通过利用由“结构化分层结构”定义的类和属性,该结构化分层结构用于在网际协议(IP)网络环境中通过对话信道来表示上下文信息。此处使用的“结构化分层结构”是用于安排要在两个或更多VoIP设备之间交换的上下文信息的预定义的组织结构。例如,结构化分层结构可由诸如XML命名空间等各种类和属性的分层组织来定义。
参考图1,示出了用于在各“VoIP客户”之间提供IP电话服务的IP电话环境100的框图。此处使用的“VoIP客户”指的是具有一个或多个相关联的VoIP设备和唯一VoIP客户标识符的诸如个人、组织、公司等特定联系点。例如,单个个人、5个相关联的VoIP设备和唯一VoIP客户标识符共同构成VoIP客户。类似地,包括500个个人和超过1000个相关联的VoIP设备的公司也可以被统称为VoIP客户,并且可以用唯一VoIP客户标识符来标识该VoIP客户。此外,VoIP设备可以与多个VoIP客户相关联。例如,位于三个不同的个人(每一个人都与一单独的VoIP客户相关联)生活的住处的计算机(VoIP设备)可以与这三个VoIP客户中的每一个相关联。不论设备的组合如何,都可以在语音系统中使用该唯一VoIP客户标识符来达到该VoIP客户的联系点。
一般而言,IP电话环境100可以包括诸如因特网、广域网(“WAN”)、局域网(“LAN”)等IP数据网络108。IP电话环境100还可以包括向VoIP客户124、125、134提供VoIP服务的VoIP服务提供方126、132。VoIP呼叫对话可以作为对应于语音信息、媒体信息、和/或上下文信息的数据分组流来交换。如将在以下更详细讨论的,数据可由客户、客户设备、服务提供方、第三方服务或其任意组合从对话中挖掘。在一个实施例中,可对对话中的没有客户和/或对第三方(例如,服务提供方)定义一个或多个“挖掘简档”。“挖掘简档”指定了对客户和/或第三方感兴趣的数据/内容的类型以及一旦标识了则将对该数据/内容要完成什么。例如,客户可创建指示其对鞋感兴趣的挖掘简档。该语音简档可用于处理对话并挖掘包括关于鞋的讨论的数据分组。所挖掘的数据分组然后可被进一步处理以确定该对话是/曾经是关于
Figure GSB00000349511200041
鞋子的,并且可以获得并提供关于
Figure GSB00000349511200042
鞋子的附加信息(例如,
Figure GSB00000349511200043
鞋子的销售)。
IP电话环境100还可以包括第三方VoIP服务提供方140。VoIP服务提供方126、132、140可以提供各种呼叫特征,如来电过滤、文本数据、语音和媒体数据集成、挖掘服务、以及集成数据传输,作为VoIP呼叫对话的一部分。VoIP服务提供方126、132、140还可生成、维护并提供挖掘简档以供客户在呼叫对话中传送来帮助标识要挖掘的数据。作为替换,或除此之外,VoIP客户104、124、125、136可创建、维护和提供挖掘简档。
VoIP服务提供方132可以被耦合到诸如公司LAN 136等专用网络,从而向通信地连接到公司LAN 136的若干VoIP客户134提供IP电话服务(例如,该专用网络中的内部呼叫、该专用网络外的外部呼叫等)和多媒体数据服务。类似地,诸如VoIP服务提供方126等VoIP服务提供方可以被耦合到因特网服务供应商(ISP)122,从而向ISP 122的客户提供IP电话服务和VoIP服务。
在一实施例中,一个或多个ISP 106、122可被配置为向VoIP客户104、124、125提供因特网接入以使VoIP客户104、124、125可以维护在因特网上建立的对话信道。连接到ISP 106、122的VoIP客户104、124、125可以使用有线和/或无线通信线路。此外,每一VoIP客户104、124、125、134都可以与通信地连接到公共交换电话网(PSTN)112的普通老式电话业务(POTS)115进行通信。诸如PSTN网关等PSTN接口114可以在PSTN和IP数据网络108之间提供访问。PSTN接口114可以为PSTN将VoIP数据分组转换成电路交换语音话务,反之亦然。PSTN 112可以包括陆线设备116、移动设备117等。
诸如陆线116等常规的设备可以基于VoIP客户的唯一VoIP标识符来请求与该VoIP客户连接,然后将使用与该VoIP客户相关联的适当的VoIP设备来建立连接。在一示例中,与VoIP客户相关联的个人可以基于各种条件(例如,基于呼叫方、当天的时间等的连接)来指定在连接呼叫时要使用哪一设备。
应当理解,环境100中的上述配置仅仅是示例性的。本领域普通技术人员将认识到,具有各种VoIP实体的任何数目和组合的合适的配置都可以是环境100的一部分。例如,耦合到LAN 136的VoIP客户134可以能够使用或不使用VoIP服务提供方132或ISP 106、122来与其它VoIP客户104、124、125、134进行通信。此外,ISP 106、122还可以向其客户提供VoIP服务。
现参考图2,示出根据本发明的一实施例的包括若干VoIP设备和一唯一VoIP标识符的示例性VoIP客户200的框图。每一VoIP设备202、204、206都可以包括用来维护语音消息、地址簿、客户指定的规则、语音简档、挖掘简档等的存储。另选地或另外地,例如由服务提供方维护的独立存储可以与该VoIP客户相关联且可由包含涉及该VoIP客户的信息的每一VoIP设备访问。在一实施例中,诸如无线电话202和IP电话204、或具有适当的VoIP应用程序的计算机206等任何合适的VoIP设备都可以是VoIP客户200的一部分。VoIP客户200还维护一个或多个唯一客户标识符208。唯一客户标识符208可以是常量或可以随时间改变。例如,唯一标识符208在每次呼叫时都可以改变。该唯一VoIP标识符被用来标识客户并与同该VoIP客户相关联的联系点210进行连接。该唯一VoIP标识符可以在包括在该VoIP客户中的每一VoIP设备上进行维护和/或由包括与该VoIP客户中所包括的每一VoIP设备的关联的服务提供方来维护。在唯一VoIP标识符由服务提供方维护的情况中,该服务提供方可以包括关于每一相关联的VoIP设备的信息和关于要为传入的通信连接哪一(哪些)设备的知识。在替换实施例中,VoIP客户200可以维护多个客户标识符。在该实施例中,可以为每一呼叫会话向VoIP客户200临时分配唯一VoIP标识符。
该唯一VoIP标识符可类似于PSTN中的电话号码来使用。然而,取代拨打典型的电话号码来使诸如家庭电话等特定PSTN设备响铃,该唯一VoIP标识符被用来达到诸如个人或公司等与该VoIP客户相关联的联系点。基于客户的安排,将连接适当的设备来达到该联系点。在一实施例中,包括在VoIP客户中的每一VoIP设备还可以具有其自己的网络中的物理地址或唯一设备号码。例如,如果个人使用个人计算机(VoIP设备)给POTS客户打电话,则该VoIP客户标识号码连同该个人计算机的IP地址将最后一起被转换成在PSTN中可以识别的电话号码。
图3是可以与一个或多个VoIP客户相关联并与本发明的各实施例一起使用的VoIP设备300的框图。应该注意,VoIP设备300是作为示例来描述的。可以理解,具有各种其它组件的任何合适的设备都可以与本发明的各实施例一起使用。为利用VoIP服务,VoIP设备300可以包括适用于接收、发送和处理各种类型的数据分组的组件。例如,VoIP设备300可以包括多媒体输入/输出组件302和网络接口组件304。多媒体输入/输出组件302可以被配置为输入和/或输出多媒体数据(包括音频、视频等)、用户生物测定、文本、应用程序文件数据等。多媒体输入/输出组件302可以包括任何合适的用户输入/输出组件,如话筒、摄像机、显示屏、键盘、用户生物测定识别设备等。多媒体输入/输出组件302还可以经由网络接口组件304接收和发送多媒体数据。网络接口组件304可以支持诸如以太网接口、帧中继接口、电缆接口、DSL接口、令牌环接口、射频(空中接口)等接口。VoIP设备300可以包括含有诸如只读存储器设备(ROM)、随机存取存储器(RAM)、硬盘驱动器、光盘驱动器等永久的和/或可移动的存储的硬件组件306。该存储可被配置为存储用于控制操作系统和/或一个或多个应用程序的操作的程序指令,以及存储涉及与包括该设备的VoIP客户相关联的个人的上下文信息(例如,挖掘简档)。在一实施例中,硬件组件306可以包括允许非VoIP客户设备发送和接收VoIP对话的VoIP接口卡。
设备300还可以包括用于设备300的操作的软件应用程序组件310和用于支持各种VoIP服务的VoIP服务应用程序组件308。VoIP服务应用程序组件308可以包括诸如数据分组组装器/拆解器应用程序、结构化分层结构解析应用程序、音频编码器/解码器(CODEC)、视频CODEC和用于提供VoIP服务的其它合适的应用程序等应用程序。软件应用程序组件300还可包括利用一个或多个挖掘简档来从对话中挖掘数据的挖掘组件。客户可维护和使用一个以上挖掘简档。例如,可对个人、商业、家庭、朋友等建立,并基于对话选择和使用标识要挖掘的不同类型的内容的不同挖掘简档。挖掘组件可利用诸如但不限于,语音识别、关键字搜索、图像识别、语音识别、上下文数据搜索和/或分组分析等技术来从对话中挖掘数据。
参考图4A,示出说明根据本发明的一实施例的两个不同的VoIP客户的VoIP设备之间通过对话信道的对话流程400的框图。尽管此处提供的示例集中于两个VoIP客户之间的通信,但是可以理解,对话也可以是在任意数量的VoIP客户之间的。在连接建立阶段,第一VoIP客户406的VoIP设备请求启动与第二VoIP客户408的对话信道。在一个说明性实施例中,对于第一VoIP客户406的VoIP服务提供方402(提供方1)接收启动对话信道的请求,并将该请求转发给对于第二VoIP客户406的VoIP服务提供方404(提供方2)。
尽管该示例利用了两个VoIP服务提供方和两个VoIP客户,但是对本发明的实施例可以使用任意数量和组合的VoIP客户和/或服务提供方。例如,在建立该连接时可以只利用一个服务提供方。而在另一示例中,通过利用公共和专用线路,VoIP设备之间的通信可以是直接的,从而消除对VoIP服务提供方的需求。在对等上下文中,VoIP设备之间的通信也可以是直接的,而不涉及任何服务提供方。
有各种可被选择以供在各VoIP客户、各VoIP设备、和/或各VoIP服务提供方之间交换信息时使用的协议。例如,在选择会话发起协议(SIP)作为信令协议时,将通过SIP信令路径/信道来交换会话控制信息和消息,并通过实时传输协议(RTP)路径/信道来交换媒体流。出于讨论的目的,此处使用的通信信道一般指的是任何类型的数据或信号交换路径/信道。因此,可以理解,取决于协议,连接建立阶段和连接终止阶段可以在对话流程400中需要额外步骤。
为易于解释,将利用其中第一VoIP客户406和第二VoIP客户408各自都只包括一个VoIP设备的示例。因而,在此提供的讨论将涉及两个VoIP设备的连接。使用第一VoIP客户406的设备的个人可以选择或输入要被呼叫客户的唯一VoIP标识符。如果要由第一客户的设备完成挖掘,则可选择适当的挖掘简档。挖掘简档可以由个人手动选择。或者,挖掘简档可以基于例如所使用的设备、所呼叫的客户、进行呼叫的位置、一天中的时间等来自动选择。
提供方1402从第一VoIP客户408的设备接收该请求并基于包括在该请求中的唯一VoIP标识符来确定终止服务提供方(例如,第二VoIP客户408的提供方2 404)。另外,如果提供方1402要挖掘数据,则使用以上讨论的技术中的任一种来选择适当的挖掘简档。随后将该请求转发到提供方2 404。该呼叫发起将被转发给第二VoIP客户的设备。随后可以在第一VoIP客户406的设备和第二VoIP客户408的设备之间建立对话信道。如果提供方2404或第二VoIP客户中的任一个或两者要挖掘数据,则可对该对话标识关于第二客户的适当的挖掘简档。
在一说明性实施例中,在第一VoIP客户406和第二VoIP客户408的设备开始交换数据分组之前,可以交换上下文信息。如下更详细地讨论的,可以根据与该对话相关联的预定结构来将该上下文信息分组化。与第一VoIP客户406、第一VoIP客户406的服务提供方或不同的设备/服务提供方相关联的任何设备都可以基于该上下文信息的内容来确定该结构。在一实施例中,所交换的上下文信息可以包括涉及呼叫VoIP客户406、设备、和被呼叫VoIP客户408、以及可任选的第三方服务的信息。
可用媒体类型、呼叫客户和被呼叫客户的规则、呼叫客户和被呼叫客户的适当的挖掘简档等也可以是在连接建立阶段期间所交换的上下文信息的一部分。取决于该上下文信息的本质,该上下文信息可以由第一VoIP客户406的设备中的一个、第二VoIP客户408的设备中的一个、和/或由VoIP服务提供方(例如,提供方1402和提供方2404)来处理和收集。在一实施例中,VoIP服务提供方402、404在转发该客户的上下文信息之前,可以向/从该客户的上下文信息中添加和/或删除某些信息。
响应于发起对话信道的请求,第二VoIP客户408可以经由提供方2404接受建立对话信道的请求或执行诸如拒绝该请求等其它适当的动作。可以基于所获得的上下文信息来确定这些适当的动作。在建立了对话信道时,第一VoIP客户406的设备和第二VoIP客户408的设备开始通过交换数据分组来互相通信。如下将更详细地描述的,包括对话数据分组和上下文数据分组的这些数据分组通过已连接的设备之间已建立的对话信道来传送。所交换的数据分组中的某一些或全部可被挖掘以满足挖掘简档的数据匹配要求。
对话数据分组携带涉及对话的数据,例如,语音数据分组或多媒体数据分组。上下文数据分组携带涉及除对话数据之外的数据的信息。一旦建立了对话信道,或者第一VoIP客户406或者第二VoIP客户408都可以请求终止该对话信道。在终止之后,可以在第一VoIP客户406和第二VoIP客户408之间交换某些上下文信息。
图4B是说明根据本发明的一实施例在两个VoIP客户的设备之间经由若干服务提供方的对话流400的框图。如图4A一样,此处描述的示例将利用其中每个客户只有一个与之相关联的设备且连接发生在那两个设备之间的场景。在连接建立阶段,第一VoIP客户406的设备请求启动与第二VoIP客户408通信的对话信道。在一个说明性实施例中,对于第一VoIP客户406的VoIP服务提供方402(提供方1)接收启动对话信道的请求,并将该请求转发给对于第二VoIP客户408的VoIP服务提供方404(提供方2)。如同以上相对于图4A所描述的示例一样,第一VoIP客户406、提供方1402、提供方2404、和/或第二VoIP客户408中的任一个或多个可被指定来从对话挖掘数据。由此,设备可标识并可任选地交换关于与其它设备的对话的适当的挖掘简档。
在第一VoIP客户406的设备和第二VoIP客户408的设备开始交换语音数据分组之前,可以在第一VoIP客户406和第二VoIP客户408之间交换上下文信息。上下文信息可使用由第一VoIP客户406定义的结构化组织来交换。在一个实施例中,提供方1402可以标识提供方1402期望从第一VoIP客户406获得的特定上下文信息。第一VoIP客户406可以基于上下文信息的内容来指定对应的结构。用于交换信息的结构的标识以及附加上下文信息可以经由提供方2404和提供方1402发送到第二VoIP客户408。
取决于该上下文信息的本质,该上下文信息可以在第一VoIP客户的客户、第二VoIP客户的设备和/或VoIP服务提供方(例如,提供方1和提供方2)处处理和收集。例如,挖掘简档可由服务提供方402、404选择和接收,且仅临时提供给各设备。此外,第三方服务提供方410、412也可维护用于从对话挖掘数据的挖掘简档。例如,第一VoIP客户可以请求第三方提供方在所有对话中挖掘特定内容。类似地,服务提供方410、412可以是第一VoIP客户正从中作出呼叫的公司或第二VoIP客户408所处的公司。公司可具有用于从对话挖掘与该公司的贸易秘密信息相关的特定关键字的强制挖掘简档。在标识了包括这些关键字的对话之后,所挖掘的数据可被储存以供将来使用,并且可执行其它处理(例如,终止对话、在继续之前需要进一步的认证/许可设置等等)。在一个实施例中,提供方1402、提供方2404和第三方服务提供方410、412中的任一个可以在将上下文信息转发给包括其它服务提供方在内的下一VoIP设备之前添加、修改和/或删除上下文信息。
响应于发起对话信道的请求,第二VoIP客户408可以经由提供方2404接受建立对话信道的请求或拒绝该请求。在建立了对话信道时,第一VoIP客户406和第二VoIP客户408的设备如上所述开始通过交换数据分组来互相通信。在一个实施例中,上下文和/或对话数据分组可从提供方1402、提供方2404或从任一VoIP客户406、408转发到第三方服务提供方410、412。此外,所转发的上下文和/或对话数据分组可在各种第三方服务提供方410、412之中交换。VoIP客户406、408、服务提供方402、404或第三方服务提供方410、412中的任一个可以基于所选挖掘简档来挖掘上下文和/或对话数据分组。
图5是根据本发明的一实施例的在通信(对话)信道上使用的数据分组结构500的框图。数据分组结构500可以是用于适用于被利用来携带对话数据(例如,语音、多媒体数据等)或上下文数据(例如,涉及VoIP服务的信息等)的IP数据分组的数据分组结构。然而,可以利用任何其它合适的数据结构来携带对话数据或上下文数据。数据分组结构500包括头部502和净荷504。头部502可以包含将对应的数据分组传送到目的地所必需的信息。另外,头部502可以包括在对话的过程中所利用的信息。这一信息可以包括用于标识对话(例如,呼叫)的对话ID 506、诸如被呼叫的客户的唯一VoIP标识符等目的地ID508、源ID 510(呼叫客户的唯一VoIP标识符或设备标识符)、用于标识净荷类型的净荷ID 512(例如,对话或上下文)、用于标识该净荷可能包含值得挖掘的内容的挖掘ID 513、用于标识该对话数据所涉及的个人的个人ID(未示出)等。在一替换实施例中,头部502可以包含关于因特网协议版本和净荷长度的信息,以及其它信息。净荷504可以包括涉及所标识的对话的对话或上下文数据。本领域普通技术人员将认识到,可以将额外的头部用作更上层的头部,如TCP头部、UDP头部等。
在本发明的一实施例中,可以预定义一结构化分层结构以通过VoIP对话信道来传送上下文信息。该上下文信息可以包括涉及VoIP客户、VoIP客户设备、对话信道连接(例如,呼叫基础)、对话上下文(例如,呼叫上下文)等的任何信息更具体地,该上下文信息可以包括个人客户挖掘简档或挖掘简档标识符、客户规则、客户的位置(例如,用户的位置、设备位置等)、生物测定信息、用户的机密信息、VoIP客户设备功能、VoIP服务提供方信息、媒体类型、媒体参数、呼叫号码优先级、关键字、涉及应用程序文件的信息等。取决于该上下文数据的本质,可以在每一VoIP客户和/或VoIP服务提供方处处理和收集该上下文信息。
在一方面,VoIP服务提供方在转发该上下文信息之前可以添加、修改和/或删除VoIP客户的上下文数据。例如,VoIP客户的机密信息将被与该客户相关联的VoIP服务提供方删除,除非客户授权发送这一信息。在某些情况下,在内联网网络之外发送最小量的上下文信息。另外,如下所述,诸如办公室等某些内联网网络可以实现指示可从对话中挖掘什么以及可在对话中包括什么以供可能的挖掘的挖掘简档。
参考图6,示出了图解根据本发明的一实施例的两个VoIP客户之间的用于传输上下文信息的交互的框图600。如图4A和4B一样,此处描述的示例将利用其中每个客户只有一个与之相关联的设备且连接发生在那两个设备之间的场景。在一实施例中,VoIP客户606和VoIP客户608的设备已建立了VoIP对话信道。VoIP客户606可以标识将使用哪些结构化分层结构来携带特定上下文信息。关于所标识的结构化分层结构的信息可以包括关于哪些结构化分层结构被用来携带该上下文信息、如何标识结构化分层结构等的信息。在交换对应的上下文信息之前,将在VoIP客户606和VoIP客户608之间交换这一信息。在接收到关于将使用哪一结构化分层结构来携带上下文信息的信息时,VoIP客户608查找预定义的结构化分层结构(例如,XML命名空间等)以选择所标识的结构化分层结构。在一实施例中,可以全局地存储并在可从一组VoIP客户访问的集中式位置管理这些预定义的结构化分层结构。在该实施例中,该集中式位置的统一资源标识符(URI)地址可从VoIP客户606发送到VoIP客户608。
在另一实施例中,每一VoIP客户都可以具有存储在任何设备的本地存储或所有设备可以共享的专用本地存储中的一组预定义的结构化分层结构。在交换上下文信息之前,可以在VoIP客户之间声明这些预定义的结构化分层结构并对其达成一致。以此方式,可以消除对提供上下文数据分组的结构的需求,并因而减少对应于该上下文数据的所发送的数据分组的量。此外,通过利预定义的结构化分层结构,可以用硬件和/或软件无关的方式来发送数据分组。另外,对预定义的结构化分层结构的使用由于已知可能相关的信息的位置而增强了高效地挖掘数据的能力。
在检索所标识的结构化分层结构时,VoIP客户608期望接收数据流以便根据所标识的结构化分层结构来定义对应于该数据流的数据分组。VoIP客户606可以开始发送根据所标识的结构化分层结构来表示的上下文信息。在一实施例中,VoIP客户608开始关于该上下文信息的数据绑定过程。例如,可以用所接收到的上下文信息来构造所标识的结构化分层结构的实例。
参考图7,框图700示出了根据本发明的一实施例的两个VoIP之间用于建立对话信道并选择在从对话中挖掘数据时使用的挖掘简档的交互。在一个实施例中,VoIP客户606在请求与VoIP客户608的连接时可以选择将在该对话期间使用的挖掘简档。例如,如果VoIP客户608是个人朋友,则VoIP客户606可选择被创建来挖掘与两个朋友之间的感兴趣的共同项目有关的数据的挖掘简档。作为连接请求和对话信道建立的一部分,VoIP客户606经由提供方1602和提供方2604可将所选的挖掘简档提供给VoIP客户608。或者,如果客户先前已经交换了挖掘简档,则VoIP客户606可以只需通过发送挖掘简档标识符来标识所选的挖掘简档。类似地,VoIP客户608在呼叫建立期间或在呼叫期间的任何时刻可以向提供方604、602和VoIP客户606提供由VoIP客户608选择的用于在该对话期间挖掘数据的挖掘简档的挖掘简档(或其标识符)。
如以下所讨论的,挖掘简档可以被交换,因为一方或双方都可能希望在对话完成之后对数据执行进一步的后处理。各方可具有关于可执行的后处理的类型和范围的限制。这些限制可以被包含在交换的挖掘简档中,并被应用于被储存来进行后处理的数据分组。在一替换实施例中,挖掘简档可在提供方1602和提供方2604之间维护和交换,并且数据可被挖掘和/或储存以供提供方602、604进行稍后的后处理。再者,如果不执行后处理,则可以不交换挖掘简档。挖掘简档可在对话中的任一时刻选择、使用和交换。另外,挖掘简档可在对话期间被改变、替换或移除。在一个实施例中,在对话期间改变或替换挖掘简档之前可能需要参与对话的个人的批准。
在建立了对话信道之后,在对话期间,VoIP客户606、608和/或提供方602、604可挖掘所交换的对话和上下文数据分组以寻找与挖掘简档相关的内容。例如,如果挖掘简档之一指定要挖掘涉及“高尔夫”的对话,使用VoIP客户608的个人提及其将要在本周日下午的1:00在PebbIe海滩打高尔夫并且邀请使用VoIP客户606的个人加入他们,则可挖掘并进一步处理来自该数字语音对话的数据分组。例如,根据挖掘简档挖掘数据分组的设备可获得关于下午1:00加利福尼亚的Pebble海滩的天气信息,并在该对话期间将该信息提供给一个或多个VoIP客户。同样,可定义另一挖掘简档以标识日历项目。可挖掘涉及在周日下午1:00打高尔夫的请求的相同的数据分组并可激活日历程序。然后可向VoIP客户呈现对于周日下午1:00在Pebble海滩打高尔夫的日历请求,由此允许他们接受、修改或拒绝该请求并将其置于其日历上。
除了VoIP客户606和608和/或提供方602、604挖掘对话的数据分组之外,客户之一或两者也可请求或同意允许第三方提供方(未示出)从该对话中挖掘数据分组。例如,如果客户之一同意允许高尔夫商店从该对话中挖掘数据分组,则该第三方可挖掘相同的数据分组样本,并且作为响应,可在该呼叫期间和/或之后向客户提供关于高尔夫服装或装备的广告。由于挖掘对话的特定部分的能力,可提供聚焦的广告。例如,高尔夫商店还可执行关于周日下午1:00加利福尼亚州Pebble海滩的天气搜索,并确定在该时段可能下雨。结果,提供给客户的广告可包括关于下雨用具的信息。
可向一个对话应用多个挖掘简档,并且可实时挖掘并处理数据分组,且处理结果在对话期间提供给客户。也可对挖掘简档施加规则,由此修改可挖掘的数据的数量和/或类型。再者,可在稍后的时刻挖掘并处理数据分组(后处理)。
除了交换挖掘简档之外,如上所述,可指定结构化分层结构以便通过指定发送的数据的结构而在对话期间用于协助高效地挖掘数据分组。VoIP客户606还可定义预定义的结构化分层结构集的附加类和/或属性。例如,VoIP客户606可标识具有关于特定上下文信息的附加属性和类的结构化分层结构。VoIP客户606将对应于所标识的分层结构及其附加属性和类的信息发送给提供方1602。提供方1602将对应于所标识的结构化分层结构及其附加属性和类的信息转发给提供方2604。VoIP客户608从提供方2604接收关于所标识的结构化分层结构及其附加属性和类的信息。或者,提供方1602将此类信息转发给VoIP客户608。VoIP客户608基于附加属性和类信息来更新本地储存的结构化分层结构。结果,所标识的结构化分层结构在VoIP客户606和VoIP客户608处扩展。VoIP客户606开始向提供方1602发送根据所扩展的结构化分层结构表示的上下文信息,后者作为返回,向提供方2604发送所接收到的上下文信息。在一个实施例中,在从提供方2604接收到上下文信息之后,VoIP客户608通过构造所接收的上下文信息的所扩展的结构化分层结构的实例来处理所接收到的上下文信息。
在一实施例中,可以通过可扩展标记语言(XML)来定义结构化分层结构。然而,可以理解,可以通过适用于实现和维护可扩展结构化分层结构的任何语言来定义该结构化分层结构。一般而言,XML因为其是跨平台的、软件和硬件无关的发送信息的工具而众所周知。此外,XML将其数据作为分层地结构化的节点树来维护,每一节点包括可以包含描述性属性的标签。通常,提供XML命名空间来给予该命名空间一个唯一名字。在一些实例中,该命名空间可被用作指向包含关于该命名空间的默认信息的集中式位置的指针。
在一特定实施例中,VoIP客户606通过将XML命名空间属性置于发送元素的起始标签中来标识上下文信息的XML命名空间。在VoIP客户608接收到XML命名空间信息之后,VoIP客户606向VoIP客户608发送根据所标识的XML命名空间来定义的一组上下文数据分组。当命名空间在元素的起始标签中定义时,具有同一前缀的所有子元素都与该同一命名空间相关联。因此,VoIP客户608和VoIP客户606可以发送上下文信息而不必在所有子元素中包括前缀,从而减少对于该上下文信息的所发送的数据分组的量。可以理解,可对本发明的各实施例使用用于标识结构化分层结构的任何技术。通过起始标签来标识XML命名空间的示例是仅作为示例来提供的,并且不被认为是限制。
参考图8-12,示出了说明对应于VoIP上下文信息的结构化分层结构的各种类和属性的框图。如上所述,“结构化分层结构”是用于安排要在两个或更多VoIP设备之间交换的上下文信息的预定义的组织结构。结构化分层结构可通过重定义各种类和属性来定义、更新和/或修改。在各VoIP实体(例如,客户、服务提供方等)之间交换的VoIP上下文信息可以对应于VoIP命名空间800。在一实施例中,VoIP命名空间800被表示为分层地结构化的节点树,每一节点对应于与VoIP上下文信息的子集相对应的子类。例如,VoIP命名空间800可以被定义为分层地结构化的树,包括呼叫基础类802、呼叫上下文类810、设备类型类820、VoIP客户类830等。
参考图9,示出了呼叫基础类802的框图。在一说明性实施例中,呼叫基础类802可以对应于涉及对话信道连接(例如,PSTN呼叫连接、VoIP呼叫连接等)的VoIP上下文信息的子集。涉及对话信道连接的VoIP上下文信息的子集可以包括始发号码(例如,呼叫者的VoIP ID号码)、目的地号码(例如,被呼叫者的VoIP ID号码或电话号码)、呼叫连接时间、VoIP服务提供方相关信息、和/或诸如IP地址、MAC地址、命名空间信息等ISP相关信息等。另外,涉及对话信道连接的上下文信息可以包括呼叫优先级信息(其定义目的地号码的优先级)、呼叫类型信息等。呼叫类型信息可以指示该对话信道是否是为紧急通信、广播通信、计算机到计算机的通信、计算机到POTS设备的通信等建立的。在一实施例中,涉及对话信道连接的上下文信息可以包括表示情感、声音(例如,“啊”、“啊呀”、“哎唷”等)和图形符号形式的面部表情等预定义标识符。在一实施例中,呼叫基础类802可被定义为VoIP命名空间800的子树结构,其包括诸如呼叫优先级803、命名空间信息804、呼叫类型805、目的地号码806、服务提供方807、预定义标识符808等节点。
参考图10,示出了呼叫上下文类810的框图。在一实施例中,涉及对话上下文的VoIP上下文信息的子集可以对应于呼叫上下文类810。该涉及对话上下文的上下文信息可以包括诸如客户提供的关键字、从文档文件数据中标识的关键字、从对话数据分组中标识的关键字(例如,对话关键字)、作为对话的一部分交换的文档和/或多媒体文件的文件名、游戏相关信息(如游戏类型、特定游戏中的虚拟邻近性)、使用频率(包括涉及特定文件、特定主题和特定客户的呼叫的频率和持续时间)以及文件标识(如涉及对话的件号、事件号等等)等信息,以及许多其它信息。根据一说明性实施例,呼叫上下文类810可被定义为VoIP命名空间800的子树结构,其包括与文件标识812、客户提供的关键字813、对话关键字814、使用频率815、对话主题816等相对应的节点。
参考图11,描绘了设备类型类820的框图。在一实施例中,设备类型类820可以对应于涉及用于对话信道连接的VoIP客户设备的VoIP上下文信息的子集。该涉及VoIP客户设备的VoIP上下文信息的子集可以包括处理由该VoIP客户设备生成的音频数据可能需要的音频相关信息。该音频相关信息可以包括涉及设备的音频功能和能力的信息,如采样速率、机器类型、输入/输出类型、话筒、数字信号处理(DSP)卡信息等。该涉及VoIP客户设备的VoIP上下文信息的子集可以包括处理由该VoIP客户设备生成的视频数据可能需要的视频相关信息。该视频相关信息可以包括分辨率、刷新率、视频数据的类型和大小、图形卡信息等。另外,如果确定了系统不兼容,则可添加一转换层以重新配置所交换的信息以便允许不同类型的系统之间的通信。涉及VoIP客户设备的上下文信息还可以包括其它设备专用信息,如计算机系统的类型、处理器信息、网络带宽、无线/有线连接、该计算机系统的可移植性、该计算机系统的处理设置等。在一说明性实施例中,设备类型类820可被定义为VoIP命名空间800的子树结构,其包括与音频822、视频824、设备专用826等相对应的节点。
参考图12,描绘了VoIP客户类830的框图。根据一个说明性实施例,VoIP客户类830可以对应于涉及VoIP客户的上下文信息的子集。在一个实施例中,涉及VoIP客户的VoIP上下文信息的子集可以包括语音简档信息(例如,指定个人用户的声调和发音特性的信息的集合)、数字签名信息、生物测定信息、以及挖掘简档信息(例如,标识要在挖掘对话时使用的主要简档或挖掘简档集)。挖掘简档可包括关于要挖掘的内容的类型(挖掘要求)、如何挖掘数据分组(例如,语音识别、关键字搜索等)、何时挖掘数据分组(实时或储存并稍后挖掘)、要对所挖掘的数据分组完成的处理(例如,更新日志、生成任务、检索相关信息、生成广告等)、处理何时完成(实时或稍后)、以及允许从对话中挖掘的内容的类型的信息。
生物测定信息可以包括涉及生物测定认证的用户标识信息(例如,指纹)、用户压力程度、用户情绪等。另外,涉及VoIP客户的VoIP上下文信息的子集可以包括位置信息(包括客户定义的位置、VoIP定义的位置、GPS/三角测量位置、以及个人用户的逻辑/虚拟位置)、所分配的电话号码、用户联系信息(如名字、地址、公司等)、客户定义的规则、用户偏好、数字权限管理(DRM)、个人用户在一组织中的成员等级、与该成员等级相关联的优先级等。与该成员等级相关联的优先级可被用来向客户分配关于电话会议的优先级。在一实施例中,VoIP客户类830可被定义为VoIP命名空间800的子树结构,其包括与用户生物测定831、位置832、客户规则833、用户标识834、成员优先级835、用户偏好836、挖掘简档标识837等相对应的节点。
图13是根据本发明的一实施例的用于从数字语音对话中挖掘数据分组的挖掘例程的流程图。挖掘例程1300在框1301处开始。在框1303处,接收来自语音对话的数据分组。可以理解,挖掘例程130可使用单个数据分组或利用一组数据分组来执行。在判定框1305,确定是否要挖掘数据分组。如上所述,数据分组可在该数据分组的头部中包括标识该数据分组的净荷可包括值得挖掘的内容的挖掘标识符513(图5)。或者,可对本发明的各实施例利用用于标识数据分组可包括值得挖掘的内容的任何技术。例如,如果数据分组是特定大小,由此指示它可能包含值得挖掘的有用内容,则可在判定框1305处选择该数据分组来进行挖掘。
如果在判定框1305处确定所接收的数据分组要被挖掘,则在框1307处,确定用于挖掘的客户简档。如上所述,客户可创建在数字语音对话中使用的标识要挖掘的内容的类型的一个或多个简档。例如,客户可创建在个人对话中使用的个人挖掘简档。则以个人挖掘简档可包括标识要从对话本身中挖掘的内容的类型的话题或类别。例如,如果客户对鞋感兴趣,则个人挖掘简档可包括一标识符来搜索关键字或利用语音识别以标识包括对鞋或鞋类型的引用的对话的标识符。另外,可根据以上讨论的结构化分层结构以及用于确定数据分组的内容或结构是否包括对鞋的引用的上下文信息的相关部分来搜索对话的上下文信息。
在判定框1309处,确定要用于挖掘在框1303处接收到的数据分组的一个或多个客户挖掘简档是否存在。如果在框1309处确定一个或多个客户挖掘简档的确存在,则在框1311处,获得这些简档。在判定框1313,或者在框1311处获得了一个或多个简档之后,或者如果在判定框1309处确定不存在简档,确定要用于挖掘在框1303处接收到的数据分组的外部挖掘简档是否存在。外部简档可以是例如,但不限于,由客户生成的简档或要用于挖掘对话的其它简档。例如,客户可请求第三方在关于该个人的对话中挖掘特定的感兴趣内容。另外,外部挖掘简档可包括,但不限于,由服务提供方、政府、公司等管理的安全简档。
如果在判定框1313处确定要使用外部挖掘简档来挖掘所接收到的数据分组,则在框1315处,获得这些简档。在框1315处获得了这些外部挖掘简档之后,或者如果在框1313处确定没有外部挖掘简档,则在判定框1317处,确定是否有要被应用来挖掘的任何挖掘规则。挖掘规则可以是,例如,由从中生成呼叫的公司指定的规则。例如,如果一客户正在从公司进行呼叫,则该公司可以具有不允许对源自该公司的对话的任何挖掘或包括该公司内的对话的挖掘规则。或者,挖掘规则可指定何时可从诸如公司等特定位置进行呼叫。如果在判定框1317处确定存在挖掘规则,则在框1319处,基于这些挖掘规则来修改在框1311和框1315处获得的挖掘简档。
在框1321处,在于框1319处修改了所获得的挖掘简档之后,或者如果在框1317处确定没有挖掘规则,基于所获得的简档来挖掘在框1303处接收到的数据分组。例如,如果挖掘简档指定要使用语音识别和关键字搜索来挖掘数据分组(或一组数据分组),并且如果标识了包括相关关键字的内容,则该数据分组可被标记或以其它方式标识为要被进一步处理的“所挖掘的数据分组”。对所挖掘的数据分组的处理将参考图14来更详细地描述。
除了在对话期间挖掘数据分组之外,可以在判定框1323处确定是否要执行对对话或所挖掘的数据分组的任何后处理。如果在判定框1323处确定要执行后处理,则在判定框1325处,确定是否有任何后处理规则。如果在判定框1325处确定有后处理规则,则在框1327处将这些后处理规则应用于所挖掘的数据分组。后处理规则可以是,例如,关于要对数据分组执行什么类型的后处理、在后处理期间将对从数据分组挖掘的内容完成什么等的规则。然而,如果在判定框1325处确定没有后处理规则,或者在判定框1327处应用了后处理规则之后,应用在框1311和框1315处获得的、可能在框1319处修改的简档,并将其与要后处理的所挖掘的数据分组相关联。要被后处理的数据分组与挖掘简档和规则相关联,使得这些简档和规则可在对数据分组的后处理发生时被标识和获得。或者,可以不将挖掘简档应用于所挖掘的数据分组。在框1331处,保存所挖掘的数据分组、后处理规则和可任选的所应用的简档以供后处理。在于框1331处保存了数据分组和适当信息以供后处理之后,如果在判定框1323处确定不要实现后处理,或者如果在判决框1305处确定不要挖掘所接收到的数据分组,则VoIP挖掘例程1300完成,如框1333所示。
图14是根据本发明的一实施例的用于处理从数字语音对话挖掘到的数据分组的所挖掘的数据分组例程的流程图。所挖掘的数据分组例程1400在框1401处开始。在框1403处,标识从数字语音对话挖掘的数据分组。类似于图13,所挖掘的数据分组例程1400可以对单个数据分组或一组数据分组执行。另外,如以上所讨论的,所挖掘的数据分组可包含对话数据或上下文数据。在判定框1405,确定所挖掘的数据分组或所挖掘的数据分组的内容是否要被更改。如果在判定框1405处确定所挖掘的数据分组/内容要被更改,则在框1407处,更改所挖掘的数据分组/内容。所挖掘的数据分组或内容可基于应用于挖掘简档的规则和/或基于后处理规则来更改。例如,规则可指定所有包含涉及公司的贸易秘密信息的内容的所挖掘的数据分组要从对话中移除并转发给公司的官员。可对所挖掘的数据分组和/或这些分组的内容执行任何类型的更改,包括但不限于,从对话中移除数据分组、用其它内容替换数据分组的内容、储存数据分组以供将来使用、记录数据分组或数据分组的内容等。
在框1407处更改了所挖掘的数据分组或内容之后,或者如果在框1405处确定该数据分组或内容不要更改,则在框1409处,以各种方式中的任一种处理所挖掘的数据分组。所挖掘的数据分组可以用多种方式来处理以向客户提供附加服务。例如,来自所挖掘的数据分组的内容可用于反馈诸如日记、任务列表等可在稍后由客户访问来审阅该对话或获得附加信息的另一应用程序或服务。同样,来自所挖掘的数据分组的内容可用于获得涉及该内容的其它信息。例如,再次参考挖掘包含涉及鞋的内容的数据分组的示例,如果内容是关于
Figure GSB00000349511200201
鞋子的对话,则挖掘服务提供方可获得关于
Figure GSB00000349511200202
鞋子的附加信息。例如,附加信息可以是
Figure GSB00000349511200203
鞋子的销售、购买
Figure GSB00000349511200204
鞋子的位置、
Figure GSB00000349511200205
鞋子的质量等。该信息可以与对话一起储存以供稍后由客户查看和/或在对话期间提供给客户。
除了反馈其它应用程序之外,来自所挖掘的数据分组的内容可用于重定向特定对话的各部分。例如,如果内容涉及对话的个人部分并且是高质量视频,但是接收设备是没有视频能力的公司设备,则该对话的视频部分可被重新路由到提供必要能力的不同客户设备并被查看或储存以供稍后在该设备上查看。另外,网络可利用所挖掘的数据分组来进行负载平衡以便基于如由所挖掘的数据分组指定的对话的内容和大小来重新路由或重新处理这些对话。
相关领域的技术人员可以理解,存在可用于处理所挖掘的数据分组并向客户提供附加服务的无穷数量的处理技术和变体。因此,此处提供的示例仅用于说明,而不被解释为限制。
在于框1409处处理了所挖掘的数据分组之后,在判定框1411处,确定是否接收到要处理的额外的所挖掘的数据分组。如果在判定框1411处确定存在要处理的额外的所挖掘的数据分组,则例程1403返回到框1403并继续。然而,如果在判定框1411处确定没有要处理的额外的所挖掘的数据分组,则例程1400在框1413处完成。
尽管示出和描述了各说明性实施例,但可以理解,可在其中作出各种改变而不背离本发明的精神和范围。

Claims (18)

1.一种用于从数字语音对话中挖掘数据分组[500]的方法,包括:
选择用于从所述数字语音对话中挖掘数据分组的挖掘简档[1315],其中所述挖掘简档指定要从所述数字语音对话中挖掘的内容的类型,或,要对所述数据分组执行的处理的类型;
确定是否要挖掘所述数字语音对话的数据分组[1305];以及
处理所述数字语音对话的数据分组[1321]以确定所述数据分组是否包括涉及所述挖掘简档的内容。
2.如权利要求1所述的方法,其特征在于,还包括:
响应于确定所述数据分组包括涉及所述挖掘简档的内容,指示所述数据分组是所挖掘的数据分组。
3.如权利要求1所述的方法,其特征在于,还包括:
响应于确定所述数据分组涉及所述挖掘简档,进一步处理[1400]所述数据分组以获得涉及所述数据分组的内容的附加信息。
4.如权利要求1所述的方法,其特征在于,还包括:
确定挖掘规则[1317];以及
基于所述挖掘规则来修改所述挖掘简档[1319]。
5.如权利要求1所述的方法,其特征在于,还包括:
将所述数据分组与所述挖掘简档一起储存[1331]以供后处理。
6.如权利要求5所述的方法,其特征在于,还包括:
标识后处理规则[1325];以及
将所述后处理规则与所述挖掘简档和所述数据分组一起储存以供后处理[1331]。
7.如权利要求1所述的方法,其特征在于,选择挖掘简档包括选择多个挖掘简档。
8.一种用于从数字语音对话中挖掘数据分组[500]的系统,包括:
标识与挖掘简档相关的数据分组的所挖掘的数据分组管理组件[1300],其中所述挖掘简档指定要从所述数字语音对话中挖掘的内容的类型,或,要对所述数据分组执行的处理的类型;
确定所挖掘的数据分组是否要被更改的所挖掘的数据分组更改组件[1405];
对与挖掘简档相关的数据分组执行处理的所挖掘的数据分组处理组件[1409]。
9.如权利要求8所述的系统,其特征在于,所挖掘的数据分组更改组件基于应用于挖掘简档的规则[1407]来更改数据分组的内容。
10.如权利要求9所述的系统,其特征在于,所述规则由服务提供方[132]应用。
11.如权利要求8所述的系统,其特征在于,所挖掘的数据分组的内容可通过从数字语音对话中移除所述数据分组、储存所述数据分组、替换所述内容或转发所述数据分组来更改。
12.如权利要求8所述的系统,其特征在于,所述所挖掘的数据分组处理组件向个人提供涉及所述所挖掘的数据分组的内容的实时信息。
13.如权利要求8所述的系统,其特征在于,对所述所挖掘的数据分组的处理是实时完成的。
14.如权利要求8所述的系统,其特征在于,还包括;
用于将所挖掘的数据分组与后处理规则一起储存的后处理组件[1331]。
15.一种用于提供涉及数字语音对话的内容的附加信息的方法,包括:
处理所述对话的数据分组[1300]以标识所述数据分组内与挖掘简档相关的内容,其中所述挖掘简档指定要从所述数字语音对话中挖掘的内容的类型,或,要对所述数据分组执行的处理的类型;
获得与所标识的内容相关的附加信息[1409];以及
提供所述相关的附加信息。
16.如权利要求15所述的方法,其特征在于,所述处理是由第三方执行的。
17.如权利要求16所述的方法,其特征在于,所述第三方被请求来从数字语音对话中挖掘特定的内容项。
18.如权利要求15所述的方法,其特征在于,所述数据分组基于所述数据分组的头部被标识来进行处理。
CN2007800127602A 2006-04-10 2007-03-09 挖掘关于服务的数据 Active CN101421728B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US11/401,022 US9497314B2 (en) 2006-04-10 2006-04-10 Mining data for services
US11/401,022 2006-04-10
PCT/US2007/006241 WO2007123606A1 (en) 2006-04-10 2007-03-09 Mining data for services

Publications (2)

Publication Number Publication Date
CN101421728A CN101421728A (zh) 2009-04-29
CN101421728B true CN101421728B (zh) 2011-09-07

Family

ID=38575165

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2007800127602A Active CN101421728B (zh) 2006-04-10 2007-03-09 挖掘关于服务的数据

Country Status (8)

Country Link
US (1) US9497314B2 (zh)
EP (2) EP2005338B1 (zh)
JP (1) JP5072954B2 (zh)
KR (1) KR101344178B1 (zh)
CN (1) CN101421728B (zh)
AT (1) ATE555469T1 (zh)
RU (1) RU2433465C2 (zh)
WO (1) WO2007123606A1 (zh)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8842660B2 (en) * 2006-03-31 2014-09-23 Microsoft Corporation VoIP variable metadata
US8228824B2 (en) * 2006-04-06 2012-07-24 Microsoft Corporation VoIP contextual information processing
US20070253407A1 (en) * 2006-05-01 2007-11-01 Microsoft Corporation Enhanced VoIP services
US20070270126A1 (en) * 2006-05-18 2007-11-22 Microsoft Corporation Authentication of a digital voice conversation
US20070274293A1 (en) * 2006-05-26 2007-11-29 Microsoft Corporation Archiving VoIP conversations
JP4881075B2 (ja) * 2006-05-31 2012-02-22 株式会社東芝 認証システム、統合装置及びプログラム
US20070280225A1 (en) * 2006-05-31 2007-12-06 Microsoft Corporation Extended services and recommendations
US20070280254A1 (en) * 2006-05-31 2007-12-06 Microsoft Corporation Enhanced network communication
US8971217B2 (en) * 2006-06-30 2015-03-03 Microsoft Technology Licensing, Llc Transmitting packet-based data items
US9189791B2 (en) * 2006-11-22 2015-11-17 Nokia Technologies Oy System and method for pushing advertisements
US8006303B1 (en) * 2007-06-07 2011-08-23 International Business Machines Corporation System, method and program product for intrusion protection of a network
CN102158268B (zh) * 2011-01-19 2014-07-09 华为技术有限公司 分集发射及接收的方法、装置及系统
CN102522084B (zh) * 2011-12-22 2013-09-18 广东威创视讯科技股份有限公司 一种将语音数据转换为文本文件的方法和系统
US9401000B2 (en) * 2014-08-27 2016-07-26 Google Inc. Protecting content on a mobile device from mining
US9824691B1 (en) * 2017-06-02 2017-11-21 Sorenson Ip Holdings, Llc Automated population of electronic records

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1480876A (zh) * 2002-06-28 2004-03-10 ���´��ֹ�˾ 为便携音频设备存储在互联网上搜索的信息的系统和方法
CN1496522A (zh) * 2000-03-29 2004-05-12 �ʼҷ����ֵ������޹�˾ 用于定义和操作用户简档的具有人机工程机制的数据搜索界面
CN1691019A (zh) * 2004-04-15 2005-11-02 微软公司 检验关键字和Web站点内容之间的相关性

Family Cites Families (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0867003A2 (en) * 1995-12-12 1998-09-30 The Board of Trustees for the University of Illinois Method of and system for transmitting and/or retrieving real-time video and audio information over performance-limited transmission systems
US6829231B1 (en) * 1996-12-31 2004-12-07 Mci Communications Corporation Internet phone system and directory search engine using same
US6014647A (en) * 1997-07-08 2000-01-11 Nizzari; Marcia M. Customer interaction tracking
US20030154072A1 (en) * 1998-03-31 2003-08-14 Scansoft, Inc., A Delaware Corporation Call analysis
US6493702B1 (en) * 1999-05-05 2002-12-10 Xerox Corporation System and method for searching and recommending documents in a collection using share bookmarks
JP4478308B2 (ja) 1999-12-14 2010-06-09 甲賀電子株式会社 話中呼処理システム
US6834195B2 (en) 2000-04-04 2004-12-21 Carl Brock Brandenberg Method and apparatus for scheduling presentation of digital content on a personal communication device
US6411683B1 (en) * 2000-02-09 2002-06-25 At&T Corp. Automated telephone call designation system
JP2001237969A (ja) 2000-02-23 2001-08-31 Sony Corp 通信システム、通信管理装置及び方法
RU2257681C2 (ru) 2000-04-27 2005-07-27 Ракушин Александр Степанович Способ персонального вызова абонента телефонной сети (варианты)
JP3437151B2 (ja) 2000-07-18 2003-08-18 株式会社アド・ステップ 広告配信方法及び広告配信機能を備えた交換装置
JP2002218016A (ja) 2001-01-16 2002-08-02 Nec Saitama Ltd 携帯電話機及び携帯電話機を用いた翻訳方法
US6754626B2 (en) * 2001-03-01 2004-06-22 International Business Machines Corporation Creating a hierarchical tree of language models for a dialog system based on prompt and dialog context
US7039700B2 (en) * 2001-04-04 2006-05-02 Chatguard.Com System and method for monitoring and analyzing communications
US6848542B2 (en) * 2001-04-27 2005-02-01 Accenture Llp Method for passive mining of usage information in a location-based services system
US7318031B2 (en) * 2001-05-09 2008-01-08 International Business Machines Corporation Apparatus, system and method for providing speech recognition assist in call handover
US7953219B2 (en) * 2001-07-19 2011-05-31 Nice Systems, Ltd. Method apparatus and system for capturing and analyzing interaction based content
US20030023730A1 (en) * 2001-07-27 2003-01-30 Michael Wengrovitz Multiple host arrangement for multimedia sessions using session initiation protocol (SIP) communication
US6721704B1 (en) * 2001-08-28 2004-04-13 Koninklijke Philips Electronics N.V. Telephone conversation quality enhancer using emotional conversational analysis
WO2003021985A1 (en) 2001-09-06 2003-03-13 Tersync Ltd. System and method for providing two-way radio communications network transmissions over internet protocol
JP2003115951A (ja) 2001-10-09 2003-04-18 Casio Comput Co Ltd 話題情報提供システムおよび話題情報提供方法
EP1309208A1 (en) * 2001-10-24 2003-05-07 Agilent Technologies, Inc. (a Delaware corporation) Call monitoring method and system
US8214391B2 (en) * 2002-05-08 2012-07-03 International Business Machines Corporation Knowledge-based data mining system
US7010526B2 (en) * 2002-05-08 2006-03-07 International Business Machines Corporation Knowledge-based data mining system
AU2003246956A1 (en) * 2002-07-29 2004-02-16 British Telecommunications Public Limited Company Improvements in or relating to information provision for call centres
US7316031B2 (en) * 2002-09-06 2008-01-01 Capital One Financial Corporation System and method for remotely monitoring wireless networks
JP2004129168A (ja) 2002-10-07 2004-04-22 Yoshitaka Yamamoto 携帯電話を用いたデータ処理装置
US7191129B2 (en) * 2002-10-23 2007-03-13 International Business Machines Corporation System and method for data mining of contextual conversations
US20050010411A1 (en) * 2003-07-09 2005-01-13 Luca Rigazio Speech data mining for call center management
WO2006015344A2 (en) 2004-07-30 2006-02-09 Viseon, Inc. Method of advertising via ip video telephone
US7155207B2 (en) * 2004-09-09 2006-12-26 Nextel Communications Inc. System and method of analyzing communications between a calling party and a called party
RU44841U1 (ru) 2004-10-12 2005-03-27 Закрытое акционерное общество "ЛАБИ ЛАБС" СИСТЕМА УПРАВЛЕНИЯ ИНФОРМАЦИОННЫМ НАПОЛНЕНИЕМ СЕТИ (OSSr)
US7543232B2 (en) * 2004-10-19 2009-06-02 International Business Machines Corporation Intelligent web based help system
US20060149700A1 (en) * 2004-11-11 2006-07-06 Gladish Randolph J System and method for automatic geospatial web network generation via metadata transformation
US20060153357A1 (en) * 2005-01-08 2006-07-13 Arup Acharya Method and apparatus for providing contextual information with telephone calls
US8126136B2 (en) * 2005-04-19 2012-02-28 Cisco Technology, Inc. Method and system for automatic supervisor intervention in problematic calls in a call center
US7995717B2 (en) * 2005-05-18 2011-08-09 Mattersight Corporation Method and system for analyzing separated voice data of a telephonic communication between a customer and a contact center by applying a psychological behavioral model thereto
US8094790B2 (en) * 2005-05-18 2012-01-10 Mattersight Corporation Method and software for training a customer service representative by analysis of a telephonic interaction between a customer and a contact center
US8094803B2 (en) * 2005-05-18 2012-01-10 Mattersight Corporation Method and system for analyzing separated voice data of a telephonic communication between a customer and a contact center by applying a psychological behavioral model thereto
US7593927B2 (en) * 2006-03-10 2009-09-22 Microsoft Corporation Unstructured data in a mining model language
US7720681B2 (en) 2006-03-23 2010-05-18 Microsoft Corporation Digital voice profiles
US20090125332A1 (en) * 2007-11-12 2009-05-14 Magpie Healthcare, Llc Automated execution of health care protocols in an integrated communications infrastructure

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1496522A (zh) * 2000-03-29 2004-05-12 �ʼҷ����ֵ������޹�˾ 用于定义和操作用户简档的具有人机工程机制的数据搜索界面
CN1480876A (zh) * 2002-06-28 2004-03-10 ���´��ֹ�˾ 为便携音频设备存储在互联网上搜索的信息的系统和方法
CN1691019A (zh) * 2004-04-15 2005-11-02 微软公司 检验关键字和Web站点内容之间的相关性

Also Published As

Publication number Publication date
JP5072954B2 (ja) 2012-11-14
ATE555469T1 (de) 2012-05-15
EP2469428B1 (en) 2018-04-25
CN101421728A (zh) 2009-04-29
KR20090004934A (ko) 2009-01-12
EP2005338A4 (en) 2010-02-03
EP2469428A2 (en) 2012-06-27
EP2005338B1 (en) 2012-04-25
JP2009533953A (ja) 2009-09-17
WO2007123606A1 (en) 2007-11-01
US20070237149A1 (en) 2007-10-11
US9497314B2 (en) 2016-11-15
RU2433465C2 (ru) 2011-11-10
KR101344178B1 (ko) 2013-12-23
EP2469428A3 (en) 2012-10-03
EP2005338A1 (en) 2008-12-24
RU2008140138A (ru) 2010-04-20

Similar Documents

Publication Publication Date Title
CN101421728B (zh) 挖掘关于服务的数据
US8050255B2 (en) Routing a VoIP call with contextual information
US8483368B2 (en) Providing contextual information with a voicemail message
US20070280225A1 (en) Extended services and recommendations
US7747568B2 (en) Integrated user interface
US20080215323A1 (en) Method and System for Grouping Voice Messages
US20070253407A1 (en) Enhanced VoIP services
US8767718B2 (en) Conversation data accuracy confirmation
US20130226564A1 (en) Method and System for Providing an Audio Representation of a Name
US7502364B2 (en) Extensible metadata structure
US20080117897A1 (en) External data access information in a voip conversation
US7983247B2 (en) Metadata collection
US20070280433A1 (en) Voicemail message controls
RU2438246C2 (ru) Усовершенствованная передача по сети
CN101422003B (zh) VoIP客户信息
US8130679B2 (en) Individual processing of VoIP contextual information

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: MICROSOFT TECHNOLOGY LICENSING LLC

Free format text: FORMER OWNER: MICROSOFT CORP.

Effective date: 20150430

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20150430

Address after: Washington State

Patentee after: Micro soft technique license Co., Ltd

Address before: Washington State

Patentee before: Microsoft Corp.