CN103891271A - 用于提供在会议中产生的数据的方法和设备 - Google Patents

用于提供在会议中产生的数据的方法和设备 Download PDF

Info

Publication number
CN103891271A
CN103891271A CN201180074281.XA CN201180074281A CN103891271A CN 103891271 A CN103891271 A CN 103891271A CN 201180074281 A CN201180074281 A CN 201180074281A CN 103891271 A CN103891271 A CN 103891271A
Authority
CN
China
Prior art keywords
participant
meeting
duration
talk
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201180074281.XA
Other languages
English (en)
Other versions
CN103891271B (zh
Inventor
J.布里斯科恩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
RingCentral Inc
Original Assignee
Unification Ltd Liability LP
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Unification Ltd Liability LP filed Critical Unification Ltd Liability LP
Publication of CN103891271A publication Critical patent/CN103891271A/zh
Application granted granted Critical
Publication of CN103891271B publication Critical patent/CN103891271B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/02Details
    • H04L12/16Arrangements for providing special services to substations
    • H04L12/18Arrangements for providing special services to substations for broadcast or conference, e.g. multicast
    • H04L12/1813Arrangements for providing special services to substations for broadcast or conference, e.g. multicast for computer conferences, e.g. chat rooms
    • H04L12/1822Conducting the conference, e.g. admission, detection, selection or grouping of participants, correlating users to one or more conference sessions, prioritising transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/56Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities
    • H04M3/567Multimedia conference systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/02Details
    • H04L12/16Arrangements for providing special services to substations
    • H04L12/18Arrangements for providing special services to substations for broadcast or conference, e.g. multicast
    • H04L12/1813Arrangements for providing special services to substations for broadcast or conference, e.g. multicast for computer conferences, e.g. chat rooms
    • H04L12/1831Tracking arrangements for later retrieval, e.g. recording contents, participants activities or behavior, network status
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/42221Conversation recording systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/141Systems for two-way working between two video terminals, e.g. videophone
    • H04N7/147Communication arrangements, e.g. identifying the communication as a video-communication, intermediate storage of the signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/15Conference systems
    • H04N7/152Multipoint control units therefor
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/41Electronic components, circuits, software, systems or apparatus used in telephone systems using speaker recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/56Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities
    • H04M3/568Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities audio processing specific to telephonic conferencing, e.g. spatial distribution, mixing of participants
    • H04M3/569Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities audio processing specific to telephonic conferencing, e.g. spatial distribution, mixing of participants using the instant speaker's algorithm

Abstract

一种用于提供在会议中产生的数据的方法,其中会议的参与者的语音信号在会议桥中混合,所述方法包括:提供在会议的持续期上同时运行的时基并且当每个参与者在会议中说话时设立对该参与者的自动识别。该方法还包括:作为指配给会议中每个说话的参与者的说话持续期来检测每个说话的参与者对这些参与者在会议中所进行的谈话的谈话贡献,指配时间戳给说话持续期,并且通过统计地评估参与者的说话持续期来产生统计数据。

Description

用于提供在会议中产生的数据的方法和设备
技术领域
本发明涉及用于提供在会议中产生的数据的方法,其中会议的参与者的语音信号在会议桥中混合。本发明此外还涉及用于提供在这样的会议中产生的数据的会议桥以及使用用于实施这样的方法的终端单元。
背景技术
会议桥(如例如由西门子企业通信有限责任公司与合作两合公司的OpenScape统一通信系统提供的会议桥)除了会议的参与者的语音信号的真正混合之外实际上还给出少量增值功能,以用于会议支持。在下面将会议桥理解为如下单元,所述单元如此设立,使得用其可以对会议的参与者的语音信号进行混合。在此会议桥可以在个人计算机(简称PC)上以应用的形式实现。这样的PC也被称为媒体服务器或会议服务器。在这种情况下,会议桥在如下PC上实现为应用,该PC作为服务器从参与者的终端单元分别接收其语音信号并且将混合语音信号发送到参与者的终端单元。电话终端装置、IP电话或PC客户端可以用作参与者的终端单元,其中其他终端单元(例如移动电话或其他服务器)也是可能的。将会议(尤其是电话会议)理解为,其中会议的参与者没有如此停留在相同地点,使得他们可以彼此通信而无需使用技术手段。相反地,参与者的通信经由会议桥通过参与者的语音信号的混合来进行,其中这样的会议可以例如设计为电话会议或设计为视频会议。在电话会议的情况下,参与者仅通过交换语音进行通信,而与参与者的语音信号如何传输无关。因此,不但通过固网运行的电话会议可以称为电话会议,而且其中一个或多个参与者通过移动无线电网彼此通信的电话会议也可以称为电话会议。此外,视频会议形式的会议是可能的,其中,除了交换参与者的语音信号以外还将参与者的图像信号实时传输到其他参与者。然而,在下面还将会议理解为应用共享,其中除了交换参与者的语音信号和图像信号以外还与参与者交换例如以参与者之间数据传输形式的另外媒体。这些数据可以相对参与者的语音信号和/或图像信号实时地或相对这些信号延时地在屏幕(例如PC的屏幕)上显示。因为同时传输语音信号和/或图像信号和/或数据信号在传输时要求比在其中仅仅传送参与者的语音信号的常规电话会议的情况下更高的数据速率,所以,在应用共享的情况下经常将内联网或因特网用作传输媒体。在此,以数据分组形式的语音信号和/或图像信号和/或数据信号从一个参与者传输到其他参与者。当然还可以将常规电路交换的电信/交换设施或由电路交换网和分组交换网组成的组合用作由会议桥混合且在会议的框架中传输的语音信号的传输媒体。在电路交换网的情况下,可以采用例如ISDN(综合服务数字网,Integrated Services Digital Network)作为传输协议,其中在分组交换网的情况下,例如可以使用H.323或TCT/IP(传输控制协议/因特网协议)作为传输协议。
OpenScape统一通信系统所提供的、用于会议支持的增值功能是通过在会议的参与者列表上插入说话人名称而进行的说话人辨别。说话人辨别通过OpenScape统一通信系统的Web接口(也就是到因特网的接口)进行,其中在下面将说话人辨别理解为根据参与者的语音来自动识别会议参与者(也称为语音识别(Voice Recognition))。在OpenScape统一通信系统中,通过说话人辨别对说话的参与者的表示以这种方式进行:说话的参与者的名称在参与者列表上加粗印刷表示,其中参与者列表中其他参与者的名称以正常字体表示。此外,通过说话人辨别来辨别出的说话的参与者可以通过表示说话的参与者的图像来进行,该图像显像在会议的终端单元的用户界面上。
在会议支持的情况下,另外的增值功能是在会议的持续期之上的总谈话时间的显示。除了显示总谈话时间之外,在会议的持续期期间,当今的会议服务器不提供与进一步统计评估相关的增值。然而,会议上的许多参与者(例如律师事务所和/或广告公司)对评估合作者/项目相关信息感兴趣,其可以通过谈话时间检测以及从中得出统计谈话交互得以量化。已知记账应用仅能够实现:通过按压电话终端装置的按键向电话使用者的特定帐户指配单个谈话(Einzelgespräche)。
发明内容
从此出发,本发明以如下任务为基础:提供用于提供在会议中产生的数据的方法和设备,其避免了现有技术的缺点并且为会议的参与者提供了附加的增值功能。尤其是给出用于提供在会议中产生的数据的方法和设备,利用该方法和设备能够实现对会议内容的简单且相对现有技术进一步的评估。
根据用于提供在会议中产生的数据的本发明方法(其中会议的参与者的语音信号在会议桥中混合),提供在会议的持续期期间同时运行的时基,并且当每个参与者在会议中说话时设立对该参与者的自动识别。在会议的持续期期间同时运行的时基可以例如根据会议服务器、内联网或因特网的系统时间来提供,其中在最简单的情况下可以使用机械时钟、电时钟或电子时钟。当每个参与者在会议中说话时对该参与者的自动识别可以通过说话人辨别来实现,该说话人辨别如上述实施一样根据参与者的语音信号来辨别该参与者。此外,本发明的方法还包括:作为在会议中指配给每个说话的参与者的说话持续期,来检测每个说话的参与者对参与者在会议中所进行的谈话的谈话贡献。将说话持续期理解为如下持续期,在该持续期中仅会议的参与者之一说话。与说话持续期相比,将谈话持续期理解为其中会议的至少两个参与者同时说话的持续期。本发明的方法还包括指配时间戳给检测到的说话持续期以及通过统计地评估参与者的说话持续期来产生统计数据。因此,不仅执行总会议持续期的时间检测,而且当会议的参与者在会议中说话时,通过同时运行的时基利用对参与者的自动识别来识别会议的参与者在会议中所进行的谈话上的各个时间分量。通过该方法,对于可以在会议服务器上作为应用运转的会议桥,能够实现在参与者对会议中所进行谈话的各个贡献的层面上执行统计评估以及提供由参与者的说话持续期产生的统计数据。这些统计数据的产生可以在会议的运转期间实时地、相对会议的运转延时地或在会议结束之后执行。因为检测参与者对会议谈话的各个贡献,所以,在统计数据中,不仅参与者的说话持续期,而且说话人变更,也就是说一个说话的参与者到其他说话的参与者的变更,可以包含在统计评估中。此外,通过指配时间戳给每个说话持续期,来检测会议谈话的谈话进程,其中谈话进程同样可以包含在统计数据的产生中。这样可以产生并提供如下统计数据,其与会议的参与者相关或与会议的各个参与者彼此间的交互相关。
在本发明的改进方案中,检测在会议中指配给每个说话的参与者的说话持续期包括下列步骤:设置说话持续期的开始时间点在第一时间点,在第一时间点第一参与者开始说话;在下列条件中的至少一个满足时,设置说话持续期的结束时间点在第二时间点,在第二时间点第一参与者停止说话:在第二时间点其他参与者沉默并且在第二时间点之后出现第一谈话间歇,第一谈话间歇与规定的第一谈话间歇持续期一样长或比规定的第一谈话间歇持续期长;在第二时间点其他参与者沉默并且在第二时间点之后在第二谈话间歇内第二参与者开始说话,第二谈话间歇比第一谈话间歇持续期短;在第二时间点第二参与者说话并且在第二时间点之后出现第一参与者的说话间隙,该说话间隙比规定的第一说话间隙持续期长。因此,参与者的说话持续期通过如下时间间隔来定义,该时间间隔的开始时间点在第一时间点出现,并且该时间间隔的结束时间点在第二时间点出现,第二时间点在第一时间点之后。会议的参与者之一一开始说话,第一时间点就出现。无论何时识别到开始说话的参与者,对于这个参与者说话持续期开始,其中在参与者的说话的开始设置的第一时间点作为这个说话持续期的开始时间点。只有当在第二时间点其他参与者沉默并且在第二时间点之后出现与规定的第一谈话间歇持续期一样长或比其长的第一谈话间歇时,才将第二时间点设置为说话持续期的结束时间点。该条件的背景在于,在谈话间歇的情况下,即在没有会议的参与者说话时,参与者的说话持续期也必须在没有其他参与者终结谈话间歇时结束。这可以是如下情况:在参与者终结其对该谈话的贡献以及在该贡献结束后由相同参与者开始新贡献,例如开始新话题时。如果在第二时间点其他参与者沉默并且在第二时间点之后与直到那时说话的参与者所不同的其他参与者开始说话,给出设置贡献结束时间点的其他情况。在这种情况下,如果在第二时间点出现的结束时间点之后,其他参与者在比第一谈话间歇持续期短的第二谈话间歇内开始说话,则结束该参与者的贡献。这个条件考虑如下情况:当参与者的贡献结束后立即或在短谈话间歇内其他参与者开始说话。最终,根据本发明,如果在第二时间点其他参与者说话并且在第二时间点之后出现比规定的第一说话间隙持续期长的第一参与者的说话间隙,设置该参与者的说话持续期的结束时间点。因此,在该条件下,例如其他参与者打断说话的参与者,其中现在至少两个参与者同时说话并且首先说话的参与者终结其对会议谈话的贡献。第一说话间隙持续期(其如第一谈话间歇持续期由参与者、管理员或自动地例如根据用于参与者的谈话贡献的预定最大和/或最小持续期或通过采纳从以前会议已知的值,统一地或对于每个参与者单独确定和/或在会议期间可以改变)可以选择成比第一谈话间歇持续期更小。由此考虑如下状况:在进行讨论或进行谈话时参与者以比在谈话间歇(例如谈话中全部参与者的思考暂停)的情况下短的间隔回答彼此。可以根据会议参与者的说话的开始来同时检测多个说话持续期,其中这些参与者的说话持续期的起始时间点和结束时间点可以在不同时间点出现。
在第一谈话间歇持续期以会议的全体参与者沉默为前提条件的同时,如果检测到其贡献的各说话的参与者停止说话,则在第一说话间隙持续期的情况下其足够用于发生这个第一说话间隙持续期。通过如下方式第一说话间隙持续期不会在参与者说出的句子中发生:在参与者说出的句子的各个单词之间出现暂停。相反,第一说话间隙持续期应仅在如下情况下发生:当说出的句子终结并且没有其他说出的句子紧接在终结的句子之后时。在第一谈话间歇持续期的情况下,只要求在会议中进行的谈话停止。可能的背景噪声(其并非源自会议的参与者之一并且甚至可以盖过会议谈话的音强)不应引起参与者的谈话间歇因为存在噪声而不能被辨别。第一谈话间歇持续期和第一说话间隙持续期可以通过如下方式定义:达到和/或超过环境噪声和说话的参与者的说话噪声之间的音强差。对应的参数可以单独指配给第一谈话间歇持续期和第一说话间隙持续期。第一谈话间歇持续期和第一说话间隙持续期的这些参数的设定可以在时间上在会议前或在会议期间设定或变化。
在其他实施方式中,检测每个说话的参与者的每个谈话贡献来作为指配给每个说话的参与者的说话持续期并且根据时间戳的时间顺序重建参与者在会议中进行的谈话的时间上的谈话次序。通过检测每个说话的参与者的每个谈话贡献,可以重建在会议中进行的谈话的完整谈话进程,因此,尤其是可能识别很少或根本没有参加在会议中进行的谈话的参与者。因此,这样可以确定会议中的听众,其对在会议中进行的谈话仅做出很少贡献或根本没有做出贡献。
有利地,统计数据通过如下方式来形成:将至少一个指配给说话的参与者的说话持续期关于时间上的谈话次序与至少一个指配给其他说话的参与者说话持续期关联。这样,可以使不同参与者的相继贡献相互关联。因此,可以识别在会议中以紧接着的谈话次序(相互)说话的参与者对。
通过统计地评估参与者的说话持续期而产生的统计数据可以包括下列信息之一:哪个参与者以紧接着的谈话次序与哪个其他参与者在会议中说话多久;哪些参与者对多频繁地以紧接着的谈话次序在会议中说话;哪个参与者在会议中不以紧接着的谈话次序说话;哪个参与者在会议中说话多久,其中将指配给该参与者的说话持续期合计成与参与者有关的总说话持续期,其作为绝对值或作为该参与者相关于会议的持续期的总谈话时间分量输出。因此,这些统计数据可以包括绝对值(也就是例如以分和/或秒为单位的时间间隔或持续期),或相对值(也就是相关于其他时间间隔的时间间隔),例如由这些时间间隔形成的商,其可以作为百分比说明给出。此外,可以产生在会议中出现的、以紧接着的谈话次序在会议中说话的参与者对的数量。如果例如参与者B多次针对参与者A的贡献回答,则可以检测并输出在会议中这些说话人变更的数量,其中将说话人理解为说话的参与者。还可以检测并输出:参与者A多频繁地针对参与者B的贡献回答。哪个参与者针对哪些其他参与者做出谈话贡献的顺序因此可以包含到包括统计数据的信息中。将紧接着的谈话次序理解为,在参与者的贡献结束之后紧接着的是其他参与者的贡献。这种情况可以发生在当这些贡献之间出现说话间隙,在这些贡献之间不出现说话间隙或进行的贡献结束之前稍后的贡献开始。备选地,紧接着的谈话次序还可以理解为,一个参与者的贡献接着其他参与者的贡献。这样,当每个参与者在会议中说话时对这个参与者的自动识别与比其中多个参与者同时说话并且彼此分开识别的情况相比可以满足更低质量要求。
有利地,可以对于会议的规定的时间分量(其比会议的持续期短)产生统计数据。这样,可以由根据本发明的方法的使用者鉴于要产生的统计数据仅看到会议的持续期的特定的时间分量。尤其是,如果检测到每个说话的参与者的每个谈话贡献,可以将会议的规定的时间分量选为从会议的开始直到其结束的任意时间分量。统计数据的产生可以一般地或对于仅考虑会议上的规定的时间分量的情况从会议的开始实时进行。在这种情况下,统计数据产生的规定的时间分量的最晚结束时间点是当前会议时间点。以指配给每个说话的参与者的说话持续期形式的所产生数据(其分别设置有时间戳)和/或通过统计地评估参与者的说话持续期产生的统计数据可以实时在会议的参与者的终端单元的用户界面上(例如作为单独时间说明)以供使用。说话持续期和统计数据的产生可以通过会议服务器应用来进行。备选地,各个参与者的各个说话持续期或聚集说话持续期可以从会议档案一起或选择性获取。在这种情况下,说话持续期和/或统计数据的获取相对于会议延时地或在其结束之后进行。说话持续期和/或统计数据的实时表示也称作在线表示,其中说话持续期和/或统计数据的相对于会议延时的或在会议结束后的表示称为离线表示。可以输出、传递和/或保存说话持续期和/或统计数据。可选地,可以将会议的媒体流(也就是全体通过会议桥并且在会议的框架中传输的数据(例如语音数据、图像数据和/或文本数据))与统计数据一起输出、传递和/或保存。
在本发明的另外实施中,将参与者的说话持续期指配给特定的商业有关准则,尤其是为该参与者分配的清算帐户。除了参与者的单个说话持续期以外,还可以将多个说话持续期和/或统计数据分配给特定的商业相关准则。可以将特定的商业有关准则理解为尤其是清算帐户或成本中心。此外,记账应用还可以表示商业有关准则。用于对说话持续期和/或统计数据进行进一步加工和/或处理以便以成本目的检测会议中参与者的谈话贡献的其他功能可以形成特定的商业有关准则。如上文实施的一样可以在线或离线进行将用根据本发明的方法产生的说话持续期和/或统计数据指配到特定的商业有关准则。
在其他实施方式中,参与者的说话持续期向商业有关准则的指配在终端单元上通过按压按键、操作用户界面上的软键或通过借助于手势控制辨别的手势来触发。除了指配单个说话持续期以外,还可以借助于按键按压、软键操作或手势控制将多个说话持续期和/或统计数据指配给特定的商业有关准则。终端单元可以指配给会议的参与者或指配给自己没有参加会议的第三者,例如管理员或会议主办方。对说话持续期和/或统计数据的评估可以在终端单元上触发之后紧接着(也就是实时或在线)或相对于触发延时地(也就是跟随触发)进行。如已经提及的,终端单元可以电话终端装置、移动电话、IP电话或PC客户端。例如PC屏幕、电话终端装置、移动电话或PDA(个人数字助理)的触摸屏显示器很可能作为用户界面。可设想用户界面的其他扩充方案。为了借助于手势控制评估手势和接收手势,可以使用移动电话的光电单元、视频摄像头或其他光设备。手势控制可以在终端单元自身中或在传输速率足够的情况下在与终端单元空间分离的其他装置(例如会议服务器)中进行。
有利地,说话持续期和/或统计数据在参与者的终端单元上实时输出。在此,可以通过会议应用进行输出。说话持续期和/或统计数据的获取可以相对于会议延时地或在会议结束后通过会议档案进行,如上面提及的。
在本发明的其他实施中,说话持续期和/或统计数据传递到更高级的商业应用用于数据评估。在将说话持续期和/或统计数据传递到更高级的商业应用的框架中可以进行参与者的说话持续期向特定的商业有关准则的指配,如上面提及的。将说话持续期和/或统计数据传递到更高级的商业应用用于数据评估可以如说话持续期和/或统计数据的输出一样在终端单元上通过按压按键、操作用户界面上的软键或通过借助于手势控制辨别的手势来触发。更高级的商业应用(例如SAP模块)可以是与会议应用分离的应用,借助于会议应用中的链路实现或自身集成在会议应用中。将说话持续期和/或统计数据传递到更高级的商业应用用于数据评估可以如通常地输出、传递和/或存储这些数据那样通过会议桥的用户界面进行,以便设立和管理会议。会议桥的用户界面可以通过会议桥应用对使用者示出。
此外,还有利的是,根据统计数据确定如下信息:会议中哪个参与者供应最大谈话贡献,并且例如由基于存在的规则引擎评估这个信息,以便于决定,是否应对这个参与者实现到谈话伙伴的基于规程的呼叫转送。可以将最大谈话贡献理解为参与者的合计说话持续期的最长持续期或会议中参与者的最大数量的说话持续期。例如如果参与者的合计的说话持续期的持续期或参与者的这些说话持续期的数量与其他参与者的一样大,则可以设想最大谈话贡献的其他定义。备选地,可能的是,代替最大谈话贡献,最小或更小谈话贡献作为来自关于会议的相应参与者的统计数据的信息被确定并且该信息如此评估,使得由基于存在的规则引擎决定,是否应对该参与者禁止到谈话伙伴的基于规程的呼叫转送。会议的其他参与者或会议参与者的上级很可能作为谈话伙伴。说话持续期和/或统计数据到更高级的商业应用(基于存在的规则引擎的形式)的传递例如通过会议桥应用的程序接口进行。在说话持续期和/或统计数据到更高级的商业应用的传递前,可以在基于服务器的会议桥应用上、集中且自动地检测这些数据。
在其他实施方式中,将由其他非实时协作服务产生的数据包含在通过统计评估参与者的说话持续期而对统计数据的产生中。这样,可以将参与者的说话持续期(也称为说话人相关的时间配额)的统计评估(其可以在实时媒体服务器上进行)扩充到其他集中托管的非实时协作/会议服务,例如即时消息传递或聊天服务。将由其他非实时协作服务产生的数据包含到统计数据的产生中可以通过下列方式进行:对于非实时协作服务,不用考虑会议的时基并且会议的时基由非实时协作服务的参与者的贡献的线性次序来替代,并且每个贡献的贡献持续期由这个贡献所包括的符号数量替代。这个情况可以发生在应包含不包括自己的时基的“单纯”非实时服务时。然而,如果非实时协作服务在会议服务器上补充会议,则非实时协作服务作为会议会话的部分与会议的时基相关。例如,在时间上并行于视频会议发生的聊天可以作为非实时协作服务来补充该视频会议,其中该视频会议的时基保留。在这种情况下,会议会话的所有服务(因此还有聊天)可以与作为共同的时基的视频会议的时基相关。本发明的方法到非实时服务上的该扩充能实现单纯语音会议服务器到多媒体会议和协作服务器上的扩展。随后对统计数据的评估可以用与如下情况相同的方式进行:非实时协作服务产生的数据未包含在统计数据的产生中。如在即时消息传递或聊天服务的情况下所给出的,可以集中托管其他非实时协作服务。
在会议桥基于服务器来实施时,可以进行本发明方法的全部实施方式。在这种情况下,基于服务器来管理会议,其中为会议唯一地分配会议ID。此外,会议服务器可以以完整长度录下会议。基于在会议的持续期上同时运行的时基(其用于对参与者的说话持续期进行统计评估,也就是说,说话人和谈话时间的指配),各个参与者的聚集说话持续期可以被识别并且从在会议服务器上安装的会议档案选择性获取。例如,单个参与者的所有贡献、特定的参与者之间的所有谈话或参与者在会议的特定时间间隔中的所有聚集贡献可以舒适地通过会议服务器来获取。在将会议的媒体流和统计数据共同保存在会议服务器上时,可以舒适地一起评估这些数据。这样,可以例如合计各个参与者的说话持续期,将其作为统计数据示出并且作为会议的有效数据(Nutzdaten)播放。有效数据还称为有效载荷数据并且包括例如音频数据和/或视频数据。在会议服务器上,除会议的参与者的说话持续期以外,还可以有利地识别并聚集从其他非实时协作服务的数据产生的类似说话持续期。如上所述,在会议时在非实时协作服务的情况下参与者的说话持续期可以对应于在非实时协作服务的框架中贡献的符号数量或非实时协作服务的框架中贡献的持续期,其通过共同的时基来确定。会议中的谈话贡献或例如聊天中的贡献对应的这些时间分量可以因为其共同在会议服务器上保存而适宜地识别以及会议和非实时协作服务的媒体流的与这些贡献对应的部分可以通过会议的时基来选出并且获取。
本发明还涉及用于提供在会议中产生的数据的会议桥,其中会议的参与者的语音信号可在会议桥中混合,所述会议桥具有用于提供在会议的持续期上同时运行的时基的时基单元。会议桥还包括:说话人辨别单元,其用于当每个参与者在会议中说话时对该参与者进行自动识别;谈话贡献检测单元,其用于作为会议中指配给每个说话的参与者的说话持续期来检测每个说话的参与者对这些参与者在会议中进行的谈话的谈话贡献;时间戳指配单元,其用于指配时间戳给说话持续期;以及评估单元,其用于通过统计地评估说话持续期来产生统计数据。时基单元、说话人辨别单元、谈话贡献检测单元、时间戳指配单元以及评估单元可以在空间上单个或一起容纳在会议桥中或在空间上与会议桥分开布置。这些单元或这些单元中的单个单元还可以作为软件、作为硬件或作为软件和硬件的组合来实现。
优选地,会议桥的谈话贡献检测单元包括调度单元,其用于设置说话持续期的开始时间点在第一时间点,在第一时间点第一参与者开始说话,并且用于在下列条件的至少一个满足时设置说话持续期的结束时间点在第二时间点,在第二时间点第一参与者停止说话:在第二时间点其他参与者沉默并且在第二时间点之后出现规定的第一谈话间歇,第一谈话间歇与第一谈话间歇持续期一样长或比第一谈话间歇持续期长;在第二时间点其他参与者沉默并且在第二时间点之后在第二谈话间歇内第二参与者开始说话,第二谈话间歇比第一谈话间歇持续期短;在第二时间点第二参与者说话并且在第二时间点之后出现第一参与者的说话间隙,该说话间隙比规定的第一说话间隙持续期长。如此设计的谈话贡献检测单元以简单的方式确保:可以可靠地检测到参与者对在会议中所进行谈话的谈话贡献。有利地,会议桥是基于服务器的,其中,通过使用用于会议桥的会议服务器,实现相对对应方法描述的优点。
利用本发明的方法和本发明的会议桥,会议的参与者的谈话贡献以及该会议(例如语音会议或视频会议)的谈话伙伴之间的交互可以通过同时运行的时基来检测、统计地准备并且可在时间上进行量化。可识别并可量化与说话人相关的各个贡献时间配额或特定谈话运转的贡献配额。此外,参与者的非实时协作/会议服务(例如即时消息传递或聊天)(其在会议会话中由会议服务器托管)在会话中的贡献可以容纳在对该会议的数据进行的统计评估中。这样,通过会议的持续期上的绝对和/或相对时间分量,交互可以例如作为会议的参与者和非实时协作/会议服务的会话的交换的谈话贡献、图像、数据等来统计地评估。该统计评估尤其允许提供下列信息:谁与谁说话/互相作用多久;谁完全说话/互相作用多久;谁根本不说话/互相作用。此外,统计评估还允许会议参与者的实时交互和非实时交互的并入和/或相关(也就是说溶入(Inbezugsetzung))。该统计评估可以在会议桥自身中、例如以会议服务器应用的形式进行,或者还例如通过程序接口由商业应用进行,商业应用与会议服务器应用可以不同。参与者在会议中对话上的时间分量和/或从中产生的统计数据或其部分可以分配给专用清算帐户或其他商业应用。
根据本发明,终端单元(例如,诸如电话会议或视频会议等会议的参与者的电话终端装置、移动电话或PC客户端)用于实施本发明的方法或其实施方式,其中终端单元产生可由会议桥混合的语音信号。
附图说明
在下面根据附图描述本发明的其他实施例以及优点。为了改进清晰性,在附图中放弃成分量/或分量相符的表示。只要无不同说明,在附图中,相同参考符号示出具有相同意义的相同部件。其示出:
图1是具有三个参与者的会议中谈话的时间进程,
图2是通过会议服务器进行的具有三个参与者的会议的示意布置,
图3a是本发明会议应用的用户界面,其具有扩展的管理和评估功能,以及
图3b是本发明会议应用的其他用户界面,其针对帐户指配激活的情况具有扩展的管理功能。
具体实施方式
在图1中示出具有三个参与者Tl,T2,T3的会议6的时间进程5。会议在时间点tl开始,经过时间点t2到t9并且在时间点t10结束。时间点tl到t10在图1中在时间线t上从左到右描绘。全部时间点tl到t10通过在会议6的持续期5上同时运行的时基来引用。在会议中,进行参与者Tl,T2,T3的谈话,其中作为参与者Tl,T2,T3的说话持续期的各个贡献la,lc,lf,2,3以语音信号的形式在会议桥(未示出)中混合。此外,在会议的框架中提供对每个参与者Tl,T2,T3的自动识别,该自动识别当这些参与者Tl,T2,T3在会议6中说话时进行。现在假设,参与者Tl在会议中通过如下方式开始谈话:他做出谈话贡献la,其在时间点tl开始并且在时间点t2完结。因为参与者Tl在其谈话贡献期间例如由说话人辨别单元自动识别,所以,参与者Tl对会议6中所进行谈话的贡献作为说话持续期la来检测。在时间点t2参与者Tl停止说话,其中参与者Tl的说话间隙lb紧接着时间点t2。在时间点t2,其他参与者T2,T3沉默并且参与者Tl的说话间隙lb的持续期比规定的第一谈话间歇持续期Gl短。参与者T1的说话间隙lb例如为1秒到10秒,优选地1秒到5秒,并且特别优选地,1秒到3秒。第一谈话间歇持续期Gl例如为10秒到20秒,优选地5秒到10秒,并且特别优选地3秒到7秒。第一谈话间歇持续期的其他持续期是可能的。因为现在参与者T1的说话间隙lb比第一谈话间歇持续期短,所以,未出现检测到的参与者T1的谈话贡献的结束时间点(尽管参与者T1在持续期lb停止说话)。在时间点t3参与者T1再次开始说话,其中参与者Tl的第二贡献、说话持续期lc在时间点t5终结。在参与者Tl的说话持续期lc结束的时间点t5,参与者T2说话,其在时间点t4(位于t3和t5之间)已经开始说话。在时间点t5之后,参与者Tl在持续期le沉默直到时间点t7。因为参与者Tl的说话间隙le的持续期比规定的第一说话间隙持续期Sl长,所以,时间点t5作为参与者Tl的贡献la,lc的结束被检测到(尽管说话间隙le比第一谈话间歇持续期Gl短)。
因为在时间点t5另外的参与者(即T2)已经说话,所以,在时间点t2出现的条件不成立,根据该条件,在该时间点没有其他参与者说话。因为在时间点t5参与者T2说话,所以,根据第一说话间隙持续期Sl确定参与者Tl的贡献结束,并且根据第一谈话间歇持续期Gl未确定参与者Tl的贡献结束。因此,根据本发明检测到参与者T1的具有从tl延伸到t5的说话持续期ld的贡献(尽管该参与者Tl在t2和t3之间没说话)。在时间点t4开始的参与者T2的贡献在时间点t6结束。在该时间点其他参与者沉默,其中在时间点t7参与者Tl开始说话。因为在时间点t6开始并且在时间点t7停止的谈话间歇2c具有比第一谈话间歇持续期Gl短的持续期,所以,参与者T2的说话持续期2的结束时间点设置在时间点t6。因此,参与者T2的说话持续期2不仅在时间段t4到t5(其中参与者Tl,T2均说话)上检测到,而且在t5和t6之间的时间段上检测到,其中仅参与者T2说话。第一说话间隙持续期S1可以具有小于1秒,1秒到3秒或1到5秒的值。第一说话间隙持续期S1的其他值也是可能的。
在时间点t7开始的参与者Tl的贡献在时间点t8结束,其中在这个时间点之后接着是谈话间歇lg。因为谈话间歇lg的持续期比第一谈话间歇持续期Gl的持续期长,所以时间点t8检测为参与者Tl的贡献lf的结束时间点。
第三参与者T3在时间点t9开始其贡献。因为谈话间歇lg具有比第一谈话间歇持续期Gl长的持续期,时间点t8被检测为参与者Tl的说话持续期lf的结束时间点。如果第三参与者T3在位于第一谈话间歇持续期结束前的时间点开始其贡献3,则时间点t8会仍然作为参与者T1的贡献lf的结束时间点检测到。其原因在于,在时间点t8其他参与者T2,T3沉默并且在第二时间点之后参与者T3在如下谈话间歇内开始说话,该谈话间歇会比第一谈话间歇持续期Gl短。
这样,根据本发明检测由参与者Tl、T2、T3对在会议6中所进行谈话的贡献,其中参与者Tl的贡献检测为说话持续期ld,其包括说话持续期la,lc和谈话间歇lb。此外,检测到参与者T2的说话持续期2、参与者Tl的贡献lf和参与者T3的贡献3。除了检测到参与者Tl,T2,T3的说话持续期ld,lf,2,3,还将相应时间戳tl,t7,t4,t9指配给每个检测到的贡献ld,lf,2,3。例如,将时间戳tl指配给参与者Tl的说话持续期ld。此外,将具有时间点t7的时间戳指配给参与者Tl的说话持续期lf。最后,将在时间点t4的时间戳指配给参与者T2的作为说话持续期2的贡献,并且将在时间点t9的时间戳指配给参与者T3的说话持续期3。接着,通过统计评估参与者Tl,T2,T3的说话持续期ld,lf,2,3来产生统计数据。为根据时间戳tl,t4,t7,t9的时间顺序来构建参与者Tl,T2,T3在会议6中进行的谈话的时间上的谈话次序,每个说话的参与者Tl,T2,T3的每个说话持续期ld,lf,2,3作为指配给每个说话的参与者Tl,T2,T3的说话持续期ld,lf,2,3来检测。这样,可以例如统计地确定,参与者T3的说话持续期2接着参与者Tl的说话持续期ld(尽管参与者Tl的说话持续期ld在参与者T2的说话持续期2开始时未终结)。可以通过如下方式来形成参与者对Tl,T2,该参与者对以紧接着的谈话次序tl,t4在会议6中说话。这样,可如此形成统计数据,使得至少一个指配给说话的参与者Tl的说话持续期ld,lf关于时间上的谈话次序与至少一个指配给其他说话的参与者T2的说话持续期2关联。
从参与者单独的说话持续期ld,lf,2,3可以备选地确定,哪个参与者Tl,T2,T3在会议6中说话多久。例如统计评估可以得出,参与者Tl在说话持续期ld和lf的持续期在会议6中说话。通过合计指配给参与者Tl的说话持续期ld,lf,在统计评估中产生绝对值,其中备选地或附加地可能的是,与参与者相关的该总说话持续期ld,lf作为参与者Tl的相对于会议6的持续期5的总谈话时间分量来输出。此外,对参与者Tl,T2,T3的说话持续期ld,lf,2,3的统计评估可以得出,参与者Tl以紧接着的谈话次序在会议6中说话两次。参与者Tl在时间点tl第一次说话并且在时间点t7第二次说话。在检测每个说话的参与者Tl,T2,T3的每个谈话贡献时,该统计评估还可以示出,参与者Tl,T2,T3在会议6中是否未以紧接着的谈话次序说话。因此,在图1的时间进程中得出,每个参与者Tl,T2,T3对会议6中的谈话做出贡献,以便于没有参与者在会议6中未以紧接着的谈话次序说话。
作为对参与者Tl,T2,T3的说话持续期1d,lf,2,3进行统计评估的结果的统计数据并非必须在会议6的持续期5上收集。统计数据例如在时间段tl到t5上收集就足够了。在这种情况下,参与者2的说话持续期没有从t4达到t6,而是仅从t4达到t5。关于参与者T3的说话持续期3和参与者Tl的说话持续期lf的数据在考虑时间窗tl到t5的情况下隐没(ausblenden)。除了关于哪个参与者Tl,T2,T3以紧接着的谈话次序与哪个其他参与者Tl,T2,T3在会议中说话多久ld,lf,2,3、哪个参与者对Tl,T2多频繁(一次)以紧接着的谈话次序在会议6中说话、哪个参与者Tl,T2,T3在会议6中没有(未)以紧接着的谈话次序说话以及哪个参与者Tl,T2,T3在会议中说话多久ld,lf,2,3的统计数据的信息之外,还包括参与者Tl的各个说话持续期ld,lf。就此而言,参与者Tl,T2,T3的设置有时间戳tl,t4,t7,t9的说话持续期ld,2,lf,3已经表示统计数据。
在图2中示出具有参与者Tl,T2,T3的会议6的布置。会议6在数据网络9中借助于会议桥60接通。数据网络9可以是内联网或因特网。会议桥60可以在会议服务器上运转,其中会议桥通过会议桥应用(也称为会议应用)形成。在这种情况下,会议桥60通过会议应用形式的软件形成,其中会议服务器用作会议桥60的硬件。
参与者Tl通过终端单元11和/或屏幕12(也称为显示器)、连接单元10和终端单元31与会议桥60相连。对此,存在终端单元11和连接单元10之间的数据连接15,屏幕12和连接单元10之间的另外数据连接16,终端单元31和连接单元10之间的数据连接61以及终端单元31和会议桥60之间的数据连接63。在通过在会议服务器上的会议应用设计会议桥的情况下,连接单元10可以相对于会议服务器作为客户端出现。终端单元11可以由电话终端装置、移动电话、IP电话或PDA来形成。屏幕12可以是TFT(薄膜晶体管)屏幕形式的平面屏幕、等离子屏幕或传统电子管监视器。数据连接15,16,61和63可以是数据分组交换的数据传输线路。例如,数据网络9可以是因特网,其中终端单元11和/或屏幕12和会议桥60之间的数据借助于TCP/IP协议传送。终端单元11和/或屏幕12和会议桥60之间的传输路径的部分可以借助于电路交换网络进行。
以与参与者Tl类似的方式,另外的参与者T2也连接到会议桥60。参与者T2具有例如以电话终端装置、移动电话或PDA形式的终端单元21,和/或例如以平面屏幕或电子管监视器形式的屏幕22,其中终端单元21通过数据线路25连接到另外的连接单元20并且屏幕22通过数据线路26连接到另外的连接单元20。连接单元20通过数据线路62与第三参与者T3的终端单元31相连,终端单元31又通过数据线路63与会议桥60相连。在将会议桥设计为在会议服务器上的会议应用的情况下,连接单元20作为客户端出现。这个客户端可以安装在计算机(例如PC)上。具有终端单元31的参与者T3直接通过数据线路63与会议桥60相连。终端单元31可以是IP电话,例如OpenStage电话,该IP电话例如借助于基于XML的客户端服务器架构连接到会议桥60安装在其上的会议服务器。终端单元31包括具有显示器33的可旋转面板32,其中显示器33可以实施为触摸屏。在显示器33的上部区域中示出系统时间35和以星期和具有月份、日和年份的说明的日期形式的日期34。此外,面板32具有按键40,其中这些按键可以实施为接触敏感的按键。指配给每个按键40的功能通过占用显示器33中所显示的每个按键来确定。例如,按键41具有功能“Piconf”,该功能起作用以便将最新图像指配给自动根据参与者Tl,T2,T3的说话来辨别的参与者Tl,T2,T3。按键41在此指所谓的软键,可以依赖于显示器33上的屏幕显示向该软键指配不同功能。例如,当显示器33构造为触摸屏时,软键则还可以在显示器33上显像。在这种情况下,指配最新图像到说话人的功能可通过如下方式进行:在显示器33中显像的语句“Piconf”上轻击。这时假定,进行图像到会议6中说话的参与者Tl,T2,T3的指配,其中例如将图像50指配给参与者Tl并且将图像51指配给参与者T2,并且在显示器33中显示。
根据本发明规定,合计指配给参与者Tl,T2,T3的说话持续期并且在终端单元31的显示器33中作为以分钟为单位的绝对值显示。例如,对于作为图像50在显示器33中表示的参与者Tl,35分钟的聚集总说话持续期以说明52的形式在显示器33中参与者Tl的图像50上方表示。以类似的方式,对通过图像51在显示器33中表示的参与者T2指配75分钟的聚集总说话持续期作为在显示器33中图像51上方的显示53。以与参与者相关的总说话持续期形式对参与者Tl,T2,T3的时间上的谈话分量的显示52,53可以用按键激活地(例如借助于软键)来接通。当终端单元(例如设计为电话终端装置或PC客户端)直接具有对会议应用的访问权时,该显示可以实时进行,该会议应用显现对说话的参与者Tl,T2,T3的自动识别。该激活借助于按键可以备选地通过其他技术触发来进行,例如通过手势辨别单元辨别的手势。显示器33形成参与者T3的用户界面,在该用户界面上显示例如会议ID作为特定的会议6的辨别特征。在显示器33上还可以显示会议的总持续期5并且作为信息构成对参与者Tl,T2,T3的说话持续期的统计评估的基础。
附加地,在显示器33上作为功能将条目57“帐户#l”指配给软键47。以相同方式,将条目58“帐户#2”指配给软键48并且将条目59“帐户#3”指配给软键49。现在可以通过软键47到49将不同帐户分配给检测到的总说话持续期52,53。例如可以通过按压软键47将清算帐户“帐户#l”指配给参与者Tl的35分钟上的总说话持续期52。类似地,可以通过按压软键48将参与者T2的说话持续期指配给清算帐户“帐户#2”。参与者T3可以借助于按压按键49将其自有的说话持续期指配给其清算帐户“帐户#3”。清算帐户57,58,59通过更高级的商业应用来显像,在会议桥设计为会议应用的情况下,借助于程序接口将参与者Tl,T2,T3的说话持续期作为说话持续期和/或统计数据传递给该商业应用,以便进行数据评估。用于对参与者Tl,T2,T3的说话持续期进行数据评估的其他商业有关准则是可能的。如已提及的,参与者Tl,T2,T3的说话持续期到终端单元31的指配可以通过按压按键47,48,49,操作在显示器33的用户界面上的软键,借助于通过手势控制辨别的手势或根据鼠标点击进行。在通过评估参与者Tl,T2,T3的说话持续期而对统计数据进行评估后能够借助于操作在终端单元31上的软键40之一确定如下信息:哪个参与者Tl在会议6中供应最大谈话贡献,其中该信息由更高级的商业应用如此评估,使得基于存在的规则引擎可以决定,这个参与者Tl是否应当能够实现到谈话伙伴的基于规则的呼叫转送。这个决定可以紧接在会议6结束之后或甚至在会议6期间(也就是说,实时)已经进行。此外,在会议桥60基于服务器实施的情况下,以简单的方式可能的是,来自其他非实时协作服务(例如中央托管的即时消息传递或聊天服务)的数据包含在通过对参与者Tl,T2,T3的说话持续期进行统计评估而对统计数据的评估中。如果由非实时协作服务产生的数据可以不与会议6的时基35相关,则存在如下可能性:时基35由在非实时协作服务的会话中参与者Tl,T2,T3的贡献的线性次序替代以及在非实时协作服务的会话中参与者Tl,T2,T3的每个贡献的贡献持续期由该贡献所包括的符号数量替代。
在图3a中示出具有扩展的管理和评估功能的会议应用的用户界面100。在PC上,将“OpenScape Web客户端”101用作会议应用。用户界面100包括可以将分别作为会议6的制定者105出现的不同参与者106一起聚集到会议6的可能性。会议应用“OpenScape Web客户端”可以用于定义和编辑在图2中示出的软键40的种类和数量。会议桥60现在提供用于设立和管理会议6的用户界面110。会议6指配有一对一的会议ID 112,通过该会议ID可以通过统计评估参与者Tl,T2,T3的说话持续期来识别指配给这个会议6的统计数据。附加地,可以通过会议ID 112对这些说话持续期指配、选择并获取会议6的媒体流,该媒体流对应于参与者Tl,T2,T3的说话持续期。根据用户界面110,会议6包括可在电话号码123,124,125下到达的参与者的名称113,114,115。激活时间评估130,其中该时间评估设计成时间和说话人检测140的统计评估。除了以分钟为单位的总会议持续期5的显示141之外,该时间评估还包括会议参与者在会议6上的分量的显示142可能性。例如,参与者“Brieskorn”作为会议6上会议参与者的分量具有XX分钟146的总说话持续期。附加地,参与者“Brieskorn”在会议6上的谈话时间分量作为百分比说明143示出。会议的另外参与者“Kruse”在会议上具有YY分钟147的时间上的谈话分量,其对应于百分比的分量YY 144。最后的参与者“Monheimius”具有ZZ分钟148的时间上的谈话分量,其对应于在会议6中的百分比分量145“ZZ”。此外,在用户界面110上示出以紧接着的谈话次序的参与者对来作为以紧接着的谈话次序150的会议参与者。第一参与者对“Brieskorn/Kruse”以紧接着的谈话顺序具有对应于会议6中的百分比分量“XX”151的XX分钟154。此外,参与者对“Kruse/Monheimius”在会议6上具有对应于百分比分量152的YY分钟的谈话分量155。最后,参与者对“Monheimius/Brieskorn”在会议6上具有对应于百分比分量“ZZ”153的、以分钟为单位的谈话分量156。
在图3b中除了会议应用“OpenScape Web客户端”的用户界面100(其中可以将可以作为会议6的制定者105出现的参与者106一起聚集到会议6)之外,还示出在帐户分配激活的情况下用于管理的用户界面210。除了以会议ID形式的会议6的名称112以外,通过点击类别“参与选项”之下的对应功能131进行帐户分配211。用于会议6的参与者的清算帐户分别具有名称220,221,222,其中向每个帐户分配帐户ID。因此向帐户“#1”分配帐户ID 230,向帐户“#2”分配帐户ID 231并且向帐户“#3”分配帐户ID 232。会议6的管理员可以以这种方式向不同帐户分配不同帐户ID。考虑例如清算帐户或成本中心作为帐户。具有名称220,221,222和帐户ID 230,231,232的帐户的帐户管理不必通过作为会议应用101的部分的应用来进行。相反,同时还可能的是,可与会议应用分开实施的、用于对帐户220,221,222进行帐户管理的商业应用运转并且在用户界面210上仅示出这个商业应用的显像。这可以例如通过会议应用和商业应用之间的链接进行。除了帐户分配131以外(如其在用户界面210上所示),还可以通过相同用户界面210进行时间评估130,如在图3a中所示。
利用本发明可能的是,通过检测各个谈话贡献(向其分别指配这个贡献的参与者和时间戳)重建会议的谈话进程和谈话次序。这样,可以通过统计评估这个说话持续期来向会议的参与者和/或更高级的商业应用提供完全系列的增值功能。

Claims (21)

1. 一种用于提供在会议(6)中产生的数据(ld、lf、2、3、tl、t4、t7、t9)的方法,其中会议(6)的参与者(Tl、T2、T3)的语音信号(ld、lf、2、3)在会议桥(60)中混合,所述方法具有下列步骤:
- 提供在会议(6)的持续期(5)上同时运行的时基(35),
- 当每个参与者(Tl、T2、T3)在会议(6)中说话时,设立对所述参与者(Tl、T2、T3)的自动识别,
其特征在于
- 作为在会议(6)中指配给每个说话的参与者(Tl、T2、T3)的说话持续期(ld、lf、2、3)来检测每个说话的参与者(Tl、T2、T3)对这些参与者(Tl、T2、T3)在会议中所进行的谈话的谈话贡献,
- 指配时间戳(tl、t4、t7、t9)给说话持续期(ld、lf、2、3),以及
- 通过统计地评估参与者(Tl、T2、T3)的说话持续期(ld、lf、2、3)来产生统计数据(52、53、143-148、151-156)。
2. 如权利要求1所述的方法,其中检测在会议(6)中指配给每个说话的参与者(Tl、T2、T3)的说话持续期(ld、lf、2、3)包括下列步骤:
-将说话持续期(ld、lf、2)的开始时间点(tl、t4、t6)设置在第一时间点,在所述第一时间点第一参与者(Tl、T2)开始说话,
-在满足下列条件中的至少一个条件时,将说话持续期(ld、lf、2)的结束时间点(t5、t6、t8)设置在第二时间点,在所述第二时间点第一参与者(Tl、T2)停止说话:
  -在所述第二时间点(t8)其他参与者(T2、T3)沉默并且在所述第二时间点(t7)之后出现第一谈话间歇(lg),所述第一谈话间歇(lg)与规定的第一谈话间歇持续期(Gl)一样长或比规定的第一谈话间歇持续期(Gl)长,
  -在第二时间点(t6)其他参与者(Tl、T3)沉默并且在第二时间点(t6)之后在第二谈话间歇(2c)内第二参与者(Tl)开始说话,所述第二谈话间歇(2c)比第一谈话间歇持续期(Gl)短,
  -在所述第二时间点(t5)第二参与者(T2)说话并且在第二时间点之后出现第一参与者(Tl)的说话间隙(le),所述说话间隙(le)比规定的第一说话间隙持续期(Sl)长。
3. 如权利要求1或2所述的方法,其中
-每个说话的参与者(Tl、T2、T3)的每个谈话贡献作为指配给每个说话的参与者(Tl、T2、T3)的说话持续期(ld、lf、2、3)来检测,
-根据时间戳(tl、t4、t7、t9)的时间顺序来重建参与者(Tl、T2、T3)在会议(6)中所进行的谈话的时间上的谈话次序。
4. 如权利要求3所述的方法,其中统计数据通过如下方式形成:将至少一个指配给说话的参与者(Tl)的说话持续期(ld、lf)关于时间上的谈话次序与至少一个指配给其他说话的参与者(T2)的说话持续期(2)关联。
5. 如权利要求3或4所述的方法,其中统计数据包括下面信息的其中之一:
-哪个参与者(Tl、T2、T3)以紧接着的谈话次序与哪个其他参与者(Tl、T2、T3)在会议(6)中说话多久(151-156),
-哪些参与者对(Tl、T2)多频繁地以紧接着的谈话次序在会议(6)中说话,
-哪个参与者(Tl、T2、T3)在会议(6)中未以紧接着的谈话次序说话,
-哪个参与者(Tl、T2、T3)在会议(6)中说话多久(52、53),其中将指配给该参与者(Tl、T2、T3)的说话持续期(ld、lf、2、3)合计成与参与者相关的总说话持续期(ld、lf),所述总说话持续期作为绝对值(146、147、148)或作为该参与者(Tl、T2、T3)相对于会议(6)的持续期(5)的总谈话时间分量(143、144、145)输出。
6. 如权利要求4或5所述的方法,其中产生会议(6)的规定的时间分量(tl、t6)的统计数据,所述规定的时间分量比会议(6)的持续期(5、tl、t10)短。
7. 如前述权利要求中的任一项所述的方法,其中将参与者(Tl、T2、T3)的说话持续期(ld、lf、2、3)指配给特定的商业有关准则,尤其是分配给所述参与者(Tl、T2、T3)的清算帐户(220、221、222)。
8. 如权利要求7所述的方法,其中在终端单元(31)上通过按压按键(47、48、49),操作用户界面(33)上的软键(57、58、59)或通过借助于手势控制辨别的手势,来触发参与者(Tl、T2、T3)的说话持续期(ld、lf、2、3)到商业有关准则的指配。
9. 如前述权利要求中的任一项所述的方法,其中说话持续期(ld、lf、2、3、tl、t4、t7、t9)和/或统计数据(52、53、143-148、151-156)在参与者(Tl、T2)的终端单元(11、12、21、22、31)上通过会议应用实时输出。
10. 根据权利要求1–6中任一项所述的方法,其中说话持续期(ld、lf、2、3、tl、t4、t7、t9)和/或统计数据(52、53、143-148、151-156)传递到更高级的商业应用,以便进行数据评估。
11. 如权利要求10所述的方法,其中
- 根据统计数据(52、53、143-148、151-156)来确定信息:哪个参与者(Tl)在会议(6)中供应最大谈话贡献(ld、lf),以及
- 例如由基于存在的规则引擎评估所述信息,以便于决定:所述参与者(Tl)是否应能够实现到谈话伙伴的基于规程的呼叫转送。
12. 如前述权利要求中的任一项所述的方法,其中
由其他非实时协作服务产生的数据包含在通过统计地评估参与者(Tl、T2、T3)的说话持续期(ld、lf、2、3)对统计数据(52、53、143-148、151-156)的产生中。
13. 如权利要求12所述的方法,其中
-对于非实时协作服务,不用考虑会议(6)的时基(35),并且会议(6)的时基(35)由非实时协作服务的参与者(Tl、T2、T3)的贡献的线性次序来替代,以及
-每个贡献的贡献持续期由所述贡献所包括的符号数量来替代。
14. 如权利要求12所述的方法,其中
-非实时协作服务在会议服务器上补充会议(6),以及
-非实时协作服务作为会议会话的部分与作为共同的时基的会议(6)的时基(35)相关。
15. 如权利要求12所述的方法,其中其他非实时协作服务被集中托管并且是即时消息传递或聊天服务。
16. 如前述权利要求中的任一项所述的方法,其中会议桥(60)基于服务器来实施。
17. 一种用于提供在会议(6)中产生的数据(ld、lf、2、3、tl、t4、t7、t9)的会议桥(60),会议(6)的参与者(Tl、T2、T3)的语音信号(ld、lf、2、3)可在所述会议桥(60)中混合,所述会议桥(60)具有
-时基单元,其用于提供会议(6)的持续期(5)上同时运行的时基(35),
-说话人辨别单元,其用于当每个参与者(Tl、T2、T3)在会议(6)中说话时自动识别所述参与者(Tl、T2、T3),其特征在于
-谈话贡献检测单元,其用于作为会议(6)中指配给每个说话的参与者(Tl、T2、T3)的说话持续期(ld、lf、2、3)来检测每个说话的参与者(Tl、T2、T3)对这些参与者(Tl、T2、T3)在会议中所进行的谈话的谈话贡献,
-时间戳指配单元,其用于指配时间戳(tl、t4、t7、t9)给说话持续期(ld、lf、2、3),以及
-评估单元,其用于通过对参与者(Tl、T2、T3)的说话持续期(ld、lf、2、3)进行统计评估来产生统计数据(52、53、143-148、151-156)。
18. 如权利要求17所述的会议桥(60),其中所述谈话贡献检测单元包括:
-调度单元,其用于将说话持续期(ld、lf、2)的开始时间点(tl、t4、t6)设置在第一时间点,在所述第一时间点第一参与者(Tl、T2)开始说话,并且用于在满足至少一个下列条件时,将所述说话持续期(ld、lf、2)的结束时间点(t5、t6、t8)设置在第二时间点,在所述第二时间点第一参与者(Tl、T2)停止说话:
  -在所述第二时间点(t8)其他参与者(T2、T3)沉默并且在第二时间点(t7)之后出现规定的第一谈话间歇(lg),所述第一谈话间歇(lg)与第一谈话间歇持续期(Gl)一样长或比第一谈话间歇持续期(Gl)长,
  -在所述第二时间点(t6)其他参与者(Tl、T3)沉默并且在第二时间点(t6)之后第二参与者(Tl)在第二谈话间歇(2c)内开始说话,所述第二谈话间歇(2c)比第一谈话间歇持续期(Gl)短,
  -在所述第二时间点(t5)第二参与者(T2)说话并且在第二时间点之后出现第一参与者(Tl)的说话间隙(le),所述说话间隙(le)比规定的第一说话间隙持续期(Sl)长。
19. 如权利要求17或18所述的会议桥(60),其中
-谈话贡献检测单元如此设立,使得可作为指配给每个说话的参与者(Tl、T2、T3)的说话持续期(ld、lf、2、3)来检测每个说话的参与者(Tl、T2、T3)的每个谈话贡献,以及
-评估单元如此设立,使得根据时间戳(tl、t4、t7、t9)的时间顺序可重建参与者(Tl、T2、T3)在会议(6)中所进行的谈话的时间上的谈话次序。
20. 如权利要求17-19中的任一项所述的会议桥(60),其中会议桥(60)基于服务器。
21. 将会议(6)的参与者(Tl、T2、T3)的终端单元(11、12、21、22、31)用于实施权利要求1至16中任一项所述的方法,其中终端单元(11、12、21、22、31)产生可由会议桥(60)混合的语音信号(ld、lf、2、3)。
CN201180074281.XA 2011-10-18 2011-10-18 用于提供在会议中产生的数据的方法和设备 Active CN103891271B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/EP2011/005234 WO2013056721A1 (de) 2011-10-18 2011-10-18 Verfahren und vorrichtung zur bereitstellung von in einer konferenz erzeugten daten

Publications (2)

Publication Number Publication Date
CN103891271A true CN103891271A (zh) 2014-06-25
CN103891271B CN103891271B (zh) 2017-10-20

Family

ID=46724306

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201180074281.XA Active CN103891271B (zh) 2011-10-18 2011-10-18 用于提供在会议中产生的数据的方法和设备

Country Status (5)

Country Link
US (3) US20140258413A1 (zh)
EP (1) EP2769541A1 (zh)
CN (1) CN103891271B (zh)
BR (1) BR112014008457A2 (zh)
WO (1) WO2013056721A1 (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016022588A1 (en) * 2014-08-04 2016-02-11 Flagler Llc Voice tallying system
US11580501B2 (en) * 2014-12-09 2023-02-14 Samsung Electronics Co., Ltd. Automatic detection and analytics using sensors
JP6238246B2 (ja) * 2015-04-16 2017-11-29 本田技研工業株式会社 会話処理装置、および会話処理方法
JP6210239B2 (ja) * 2015-04-20 2017-10-11 本田技研工業株式会社 会話解析装置、会話解析方法及びプログラム
JP6703420B2 (ja) * 2016-03-09 2020-06-03 本田技研工業株式会社 会話解析装置、会話解析方法およびプログラム
JP6672114B2 (ja) * 2016-09-13 2020-03-25 本田技研工業株式会社 会話メンバー最適化装置、会話メンバー最適化方法およびプログラム
KR102444165B1 (ko) * 2017-01-20 2022-09-16 삼성전자주식회사 적응적으로 회의를 제공하기 위한 장치 및 방법
JP6543848B2 (ja) * 2017-03-29 2019-07-17 本田技研工業株式会社 音声処理装置、音声処理方法及びプログラム
CN111492638B (zh) * 2017-12-22 2022-05-31 英国电讯有限公司 管理多个用户设备之间的流式音频通信会话的方法和装置
US11277462B2 (en) * 2020-07-14 2022-03-15 International Business Machines Corporation Call management of 5G conference calls

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1386371A (zh) * 2000-08-01 2002-12-18 皇家菲利浦电子有限公司 使设备对准声源
CN1512744A (zh) * 2002-12-27 2004-07-14 �Ҵ���˾ 通过可视信息扩展电话会议呼叫的系统和方法
US20040263636A1 (en) * 2003-06-26 2004-12-30 Microsoft Corporation System and method for distributed meetings
CN101326801A (zh) * 2005-10-31 2008-12-17 艾利森电话股份有限公司 用于电话会议期间捕获语音的方法和装置
CN101371244A (zh) * 2006-01-13 2009-02-18 微软公司 在启用网络的会议中对发言者分类
US20090204399A1 (en) * 2006-05-17 2009-08-13 Nec Corporation Speech data summarizing and reproducing apparatus, speech data summarizing and reproducing method, and speech data summarizing and reproducing program
CN101518024A (zh) * 2006-09-21 2009-08-26 西门子通讯公司 用于自动会议发起的装置和方法
FR2949894A1 (fr) * 2009-09-09 2011-03-11 Saooti Procede de determination de la courtoisie d'un individu

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3185505B2 (ja) * 1993-12-24 2001-07-11 株式会社日立製作所 会議録作成支援装置
US6611281B2 (en) * 2001-11-13 2003-08-26 Koninklijke Philips Electronics N.V. System and method for providing an awareness of remote people in the room during a videoconference
US7319745B1 (en) * 2003-04-23 2008-01-15 Cisco Technology, Inc. Voice conference historical monitor
CN100412832C (zh) * 2003-09-02 2008-08-20 竺红卫 一种基于优先级调度的非均匀多媒体流传输调度方法
US7617457B2 (en) * 2004-01-07 2009-11-10 At&T Intellectual Property I, L.P. System and method for collaborative call management
US8204884B2 (en) * 2004-07-14 2012-06-19 Nice Systems Ltd. Method, apparatus and system for capturing and analyzing interaction based content
US9300790B2 (en) * 2005-06-24 2016-03-29 Securus Technologies, Inc. Multi-party conversation analyzer and logger
US20070133437A1 (en) * 2005-12-13 2007-06-14 Wengrovitz Michael S System and methods for enabling applications of who-is-speaking (WIS) signals
US8289363B2 (en) * 2006-12-28 2012-10-16 Mark Buckler Video conferencing
WO2008114811A1 (ja) * 2007-03-19 2008-09-25 Nec Corporation 情報検索システム、情報検索方法及び情報検索用プログラム
CN101689365B (zh) * 2007-09-13 2012-05-30 阿尔卡特朗讯 控制视频会议的方法
US8289362B2 (en) * 2007-09-26 2012-10-16 Cisco Technology, Inc. Audio directionality control for a multi-display switched video conferencing system
GB201017382D0 (en) * 2010-10-14 2010-11-24 Skype Ltd Auto focus
US9053750B2 (en) * 2011-06-17 2015-06-09 At&T Intellectual Property I, L.P. Speaker association with a visual representation of spoken content
US9179002B2 (en) * 2011-08-08 2015-11-03 Avaya Inc. System and method for initiating online social interactions based on conference call participation
US9601117B1 (en) * 2011-11-30 2017-03-21 West Corporation Method and apparatus of processing user data of a multi-speaker conference call

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1386371A (zh) * 2000-08-01 2002-12-18 皇家菲利浦电子有限公司 使设备对准声源
CN1512744A (zh) * 2002-12-27 2004-07-14 �Ҵ���˾ 通过可视信息扩展电话会议呼叫的系统和方法
US20040263636A1 (en) * 2003-06-26 2004-12-30 Microsoft Corporation System and method for distributed meetings
US7428000B2 (en) * 2003-06-26 2008-09-23 Microsoft Corp. System and method for distributed meetings
CN101326801A (zh) * 2005-10-31 2008-12-17 艾利森电话股份有限公司 用于电话会议期间捕获语音的方法和装置
CN101371244A (zh) * 2006-01-13 2009-02-18 微软公司 在启用网络的会议中对发言者分类
US20090204399A1 (en) * 2006-05-17 2009-08-13 Nec Corporation Speech data summarizing and reproducing apparatus, speech data summarizing and reproducing method, and speech data summarizing and reproducing program
CN101518024A (zh) * 2006-09-21 2009-08-26 西门子通讯公司 用于自动会议发起的装置和方法
FR2949894A1 (fr) * 2009-09-09 2011-03-11 Saooti Procede de determination de la courtoisie d'un individu

Also Published As

Publication number Publication date
US20170317843A1 (en) 2017-11-02
BR112014008457A2 (pt) 2017-04-11
US20140258413A1 (en) 2014-09-11
US20210328822A1 (en) 2021-10-21
EP2769541A1 (de) 2014-08-27
CN103891271B (zh) 2017-10-20
WO2013056721A1 (de) 2013-04-25

Similar Documents

Publication Publication Date Title
CN103891271A (zh) 用于提供在会议中产生的数据的方法和设备
CN102859981B (zh) 电视机
US8175242B2 (en) Voice conference historical monitor
CN101536511B (zh) 单一动作启动视频会议的系统和方法
US8051130B2 (en) Methods and apparatus for creating, combining, distributing and reproducing program content for groups of participating users
CN1989497B (zh) 用于即时消息自相关的方法和装置
CN101119221B (zh) 会议桥接服务器
US9426530B2 (en) Methods and apparatus for creating, combining, distributing and reproducing program content for groups of participating users
CN102474424B (zh) 用于在电话会议期间在计算机和演讲者之间转换音频传输的系统和方法
CN102379103A (zh) 用于使用周围音频在设备之间建立协同通信的方法和系统
CN100464514C (zh) 利用即时通信设备召开混合型电话会议的控制方法
CN102461140B (zh) 用于在电话会议期间经由VoIP装置传输计算机和语音会议音频的系统和方法
CN102594793B (zh) 生成示出情境中的应用工件的协作时间线的方法和系统
US20070156811A1 (en) System with user interface for sending / receiving messages during a conference session
US9094523B2 (en) Metric for meeting commencement in a voice conferencing system
CN105376516A (zh) 一种移动视频会议系统及其实现方法
TW200529640A (en) Method and system for integration of instant messaging and teleconferencing via a telephone network
JP2008537368A (ja) 生番組の最中に多数視聴者とリアルタイムの対話を行う方法及び装置
WO2007126652A2 (en) Network resource optimization in a video conference
WO2005094051A1 (en) Active speaker information in conferencing systems
FR2877791A1 (fr) Procede de production et/ou de commande automatique d'une conference de telecommunication avec une pluralite d'abonnes terminal de conference de telecommunication et serveur de conference de telecommunication.
CN103562956A (zh) 用于当进行通信服务时向客户终端提供信息的系统
EP0580397A2 (en) Conferencing apparatus
US20120259924A1 (en) Method and apparatus for providing summary information in a live media session
CN102404286A (zh) 主动式网络语音会议系统及其方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20211124

Address after: Munich, Germany

Patentee after: UNIFY PATENTE GmbH & Co.KG

Address before: Munich, Germany

Patentee before: UNIFY GmbH & Co.KG

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20220407

Address after: California, USA

Patentee after: RINGCENTRAL, Inc.

Address before: California, USA

Patentee before: Lingsheng intellectual property holding Co.

Effective date of registration: 20220407

Address after: California, USA

Patentee after: Lingsheng intellectual property holding Co.

Address before: Munich, Germany

Patentee before: UNIFY PATENTE GmbH & Co.KG

TR01 Transfer of patent right