CN103348730A - 语音服务的体验质量测量 - Google Patents
语音服务的体验质量测量 Download PDFInfo
- Publication number
- CN103348730A CN103348730A CN2011800672643A CN201180067264A CN103348730A CN 103348730 A CN103348730 A CN 103348730A CN 2011800672643 A CN2011800672643 A CN 2011800672643A CN 201180067264 A CN201180067264 A CN 201180067264A CN 103348730 A CN103348730 A CN 103348730A
- Authority
- CN
- China
- Prior art keywords
- network service
- tolerance
- qoe
- experience
- language material
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000005259 measurement Methods 0.000 title claims description 8
- 238000000034 method Methods 0.000 claims abstract description 40
- 239000000463 material Substances 0.000 claims description 100
- 239000000284 extract Substances 0.000 claims description 18
- 230000008921 facial expression Effects 0.000 claims description 8
- 206010027940 Mood altered Diseases 0.000 claims description 3
- 230000007510 mood change Effects 0.000 claims description 3
- 238000004891 communication Methods 0.000 abstract description 46
- 238000005516 engineering process Methods 0.000 abstract description 6
- 230000004087 circulation Effects 0.000 description 36
- 230000006870 function Effects 0.000 description 22
- 238000012545 processing Methods 0.000 description 21
- 238000003860 storage Methods 0.000 description 19
- 238000004364 calculation method Methods 0.000 description 13
- 230000006978 adaptation Effects 0.000 description 11
- 230000009467 reduction Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 8
- 238000004590 computer program Methods 0.000 description 7
- 230000008878 coupling Effects 0.000 description 6
- 238000010168 coupling process Methods 0.000 description 6
- 238000005859 coupling reaction Methods 0.000 description 6
- 230000008859 change Effects 0.000 description 5
- 230000009471 action Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 4
- 238000001914 filtration Methods 0.000 description 4
- 230000036651 mood Effects 0.000 description 4
- 208000019901 Anxiety disease Diseases 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 230000036506 anxiety Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000002093 peripheral effect Effects 0.000 description 3
- RZVAJINKPMORJF-UHFFFAOYSA-N Acetaminophen Chemical compound CC(=O)NC1=CC=C(O)C=C1 RZVAJINKPMORJF-UHFFFAOYSA-N 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000008447 perception Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000005856 abnormality Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 230000002996 emotional effect Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 210000004709 eyebrow Anatomy 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000007667 floating Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 238000001303 quality assessment method Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L65/00—Network arrangements, protocols or services for supporting real-time applications in data packet communication
- H04L65/80—Responding to QoS
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/09—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being zero crossing rates
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/60—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for measuring the quality of voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/63—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for estimating an emotional state
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/90—Pitch determination of speech signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/50—Network service management, e.g. ensuring proper service fulfilment according to agreements
- H04L41/5061—Network service management, e.g. ensuring proper service fulfilment according to agreements characterised by the interaction between service providers and their network customers, e.g. customer relationship management
- H04L41/5067—Customer-centric QoS measurements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
- H04L43/0852—Delays
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L65/00—Network arrangements, protocols or services for supporting real-time applications in data packet communication
- H04L65/1066—Session management
- H04L65/1083—In-session procedures
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/90—Pitch determination of speech signals
- G10L2025/906—Pitch tracking
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Computer Networks & Wireless Communication (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Business, Economics & Management (AREA)
- General Business, Economics & Management (AREA)
- Child & Adolescent Psychology (AREA)
- Psychiatry (AREA)
- General Health & Medical Sciences (AREA)
- Hospice & Palliative Care (AREA)
- Quality & Reliability (AREA)
- Environmental & Geological Engineering (AREA)
- Telephonic Communication Services (AREA)
- Monitoring And Testing Of Exchanges (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
总体上描述了用于确定网络通信的体验质量(QoE)的技术。在一些示例中,一种用于确定网络通信的QoE度量的方法包括以下步骤:从所述网络通信接收媒体信号。所述处理还包括以下步骤:从所述媒体信号提取体验指示符,其中,所述体验指示符对应于与所述网络通信的服务质量相关联的参与者的主观使用体验,以及基于所述体验指示符和所述网络通信的服务质量(QoS)度量来确定所述网络通信的所述QoE度量。
Description
背景技术
在计算机联网领域,评估网络通信性能的一个方法是收集网络通信的服务质量(QoS)或体验质量(QoE)度量。QoS可以包含在网络通信的会话期间从不同的网络层收集的诸如比特率、延迟和比特错误率的客观度量。然而,仅检查QoS度量可能不足以适当地解决与网络通信相关联的性能问题。
还可通过确定QoE度量来评估网络通信,所述QoE度量可以是推断终端用户或网络应用所体验的整体服务质量的途径。存在两个常规的QoE测量算法,即平均意见得分(MOS)和语音质量的感知评估(PESQ)。PESQ方法可以应用于利用VOIP、POTS、ISDN、GSM协议测量网络应用的质量,并且具有用于描述用户对网络通信的质量的满意度的处于-0.5(最坏)到4.5(最好)之间的值。MOS可以用诸如差、不太好、一般、好、很好的值来表示语音通话质量。然而,这些常规方法仍然是不考虑主观因素的客观测量。此外,这些常规方法难以实时执行。
发明内容
根据本公开的至少一些实施方式,呈现了一种用于确定网络通信的体验质量(QoE)度量的方法。在示例中,所述方法可以包括以下步骤:从所述网络通信接收媒体信号。所述方法还可以包括以下步骤:从所述媒体信号提取体验指示符,其中,所述体验指示符对应于与所述网络通信的服务质量相关联的参与者的主观使用体验;以及基于所述体验指示符和所述网络通信的服务质量(QoS)度量来确定所述网络通信的所述QoE度量。
根据本公开的其它实施方式,呈现了一种用于确定网络通信的质量的方法。在示例中,所述方法可以包括以下步骤:从所述网络通信接收媒体信号。所述方法还可以包括以下步骤:从所述媒体信号提取第一语料,其中,所述第一语料对应于与所述网络通信的服务质量相关联的参与者的主观使用体验;以及基于所述第一语料和所述网络通信的服务质量(QoS)度量来确定所述网络通信的第一QoE度量。
根据本公开的至少一些实施方式,机器可读介质可以包含一组指令,当所述一组指令被处理器执行时,使得所述处理器执行用于确定网络通信的体验质量(QoE)度量的方法。所述方法可以包括以下步骤:从所述网络通信接收媒体信号。所述方法还可以包括以下步骤:从所述媒体信号提取体验指示符,其中,所述体验指示符对应于与所述网络通信的服务质量相关联的参与者的主观使用体验;以及基于所述体验指示符和所述网络通信的服务质量(QoS)度量来确定所述网络通信的所述QoE度量。
以上的发明内容仅是例示性的并且不旨在以任何方式进行限制。除了上述的说明性方面、实施方式和特征以外,通过参照附图和下面的具体描述,其它的方面、实施方式和特征将变得明显。
附图说明
图1示出系统的例示性实施方式可以操作以确定网络通信的QoE度量的操作环境的框图;
图2示出用于确定网络通信的QoE度量的处理的例示性实施方式;
图3示出利用语料确定网络通信的QoE度量的处理的例示性实施方式的流程图;
图4示出利用体验指示符确定网络通信的QoE度量的处理的例示性实施方式的流程图;
图5示出根据本公开设置的示例计算机程序产品的例示性实施方式;以及
图6示出可以被设置为根据本公开的QoE系统的示例计算装置的例示性实施方式的框图。
具体实施方式
在下面的详细说明书中,参照构成说明书的一部分的附图。在附图中,除非上下文另外指出,否则类似的符号通常表示类似的部件。详细说明书、附图和权利要求书中描述的例示性实施方式不表示为限制性的。可以采用其它实施方式,并且在不脱离这里呈现的主题的精神或范围的情况下可以做出其它改变。将容易地理解,如这里一般描述和附图中示出的本公开的多个方面可以在各种不同的配置中被设置、替换、组合和设计,所有这些在这里被明确设想到。
本公开尤其被绘制为与计算网络通信的体验质量度量有关的方法、设备、计算机程序和系统。贯穿所述公开,术语“服务质量”或“QoS”可以广义地表示根据诸如带宽、信噪比、误码率、延迟、分组丢失或从各种网络段收集的其它测量(例如,接入、都市或核心段)的度量的网络通信的质量。术语“体验质量”或“QoE”可以表示用于描述来自网络通信参与者的观点的网络通信的性能。因此,QoE度量可以主观地指示是否以满意的方式执行网络通信,而QoS度量可以客观地提供与如何执行网络通信相关联的质量测量。
贯穿所述公开,术语“体验指示符”可以广义地表示与参与者的网络服务使用体验相关联的主观评价。参与者可以是电话装置、网络装置、网络应用、网络/电话服务用户(例如,电话用户)或积极参与网络通信的任何终端用户。当使用特定网络服务时,参与者能够基于其自身体验判断网络服务的质量,并且经由体验指示符来提供这种判断。例如,电话用户可以用口语来表达使用体验,或者用语音情绪、面部表情和/或身体姿态来表示使用体验。另外,体验指示符可以是测量值或分类的形式。例如,体验指示符可以是数值(例如,0-100之间的数值范围)测量值或参与者传达的好-一般-坏的分类。
图1示出系统的例示性实施方式可以操作以确定网络通信的QoE度量的操作环境的框图。如图1所述,客户机装置110可以被配置为经由网络120与另一客户机装置115交互。网络120可以由电信(Telco)服务提供商130提供和管理。体验质量(QoE)系统140可以与电信服务提供商130交互,以监测客户机装置110和115之间的网络通信,并且计算这些网络通信的QoE度量。
在一些实施方式中,客户机装置110和115可以被配置为在提供音频、视频和/或其它电信服务时与其它应用和/或装置交互。客户机装置110和115的一些示例可以包括(但不限于)常规的电话、蜂窝电话、智能电话、个人数字助理(PDA)、台式计算机、膝上型计算机、笔记本计算机或能够通过网络120进行通信的其它网络装置。客户机装置110和115可以是支持各种移动电信标准(例如,但不限于,全球移动通信系统(GSM)、码分多址(CDMA)或时分多址(TDMA))的移动装置。此外,客户机装置110和115可以发送显示多方视频会议的参与者的脸部和身体的视频信号。
在一些实施方式中,网络120可以是(但不限于)无线网络(例如,移动装置网络(例如,GSM、CDMA或TDMA)、无线局域网(WLAN)、无线城域网(WMAN)等或者其任何组合)。网络120还可以是有线网络(例如,电话线、局域网(LAN)、广域网(WAN)、城域网(MAN)、诸如互联网的全球区域网、光纤信道架构或者这些互连的任何组合)。
在一些实施方式中,客户机装置110和115可以通过网络120经由网络连接而连接在一起,并且可以参与双向或多向网络通信以发送语音和/或视频信号。网络通信可以是经由通过网络提供的网络连接而发送的网络消息。网络通信可以是电话通信、音频/视频通信、多媒体通信、SMS消息的形式和/或可以在连接到网络120的多个装置当中交换的任何类型的网络消息。
例如,可以经由电话线在两个客户机装置110和115之间建立网络连接,并且在电话通话期间讲话者的讲话可以被认为是网络通信。因此,客户机装置100可以将第一网络通信121发送给客户机装置115。并且客户机装置115可以用第二网络通信125应答客户机装置110。另选地,客户机装置115可以向客户机装置110发起第三网络通信125,并且客户机装置110可以用第四网络通信121进行应答。网络通信121和125可以是数字或模拟格式,并且可以包含人发出的语音信号或者显示人脸和身体部位的视频信号。在其它实施方式中,两个以上的客户机装置可以参与多向(例如,三向会议呼叫)网络通信。在这种情况下,客户机装置110可以同时向一个以上的目标客户机装置发送第一网络通信121,或者同时从一个以上的目标客户机装置接收第二网络通信121。
在一些实施方式中,电话服务提供商130可以负责管理网络120和在网络120上的装置之间建立网络连接。电话服务提供商130还可以与QoE系统140通信以确定与客户机装置110和115之间的网络通信121和125相关联的QoE度量。QoE系统140可以被配置为与电话服务提供商130连接的服务器或路由器或者被配置为电话服务提供商130的部件。此外,电话服务提供商130可以将网络通信(例如,网络通信121和125)作为实时输入流131发送给QoE系统140。
在一些实施方式中,QoE系统140可以评估从输入流131接收到的网络通信,以确定在客户机装置110和115之间进行的网络通信的质量。评估的结果可以是用于网络通信121和125的QoE度量,所述QoE度量可以针对例如状态报告、特征增强或调试目的作为输出流132被发送给电话服务提供商130和/或客户机装置110和115。下面进一步描述QoE系统140的细节。
在一些实施方式中,QoE系统140可以确定语音和视频网络通信的QoE度量。举例来说,下面的描述可以更强调用于语音信号的QoE度量。针对包含视频信号的网络通信,下面的处理和机制可以被类似地应用。为了处理网络通信中的语音信号,QoE系统140可以采用降噪模块141、语音检测器142、词汇识别器143、语料匹配器144、语音特征提取器145、语料数据库146、词汇数据库147、QoS检索器148和QoE计算器149等。
在一些实施方式中,降噪模块141可以从自输入流131中的网络通信提取的语音信号中滤除噪声。语音检测器142可以检测过滤后的语音信号中的人的语音,并且从语音信号提取语音段。语音检测器142还可以分配语音段的起始和结束时间。词汇识别器143可以将这些语音段与来自词汇数据库147的样本进行比较,并在这些语音段中识别出字。然后可以将这些字及其对应的起始时间和结束时间发送给语料匹配器144。
在一些实施方式中,语料是与特定QoE状况有关的话语。语料数据库146可以包含用于各种QoE状况的这种话语的集合。例如,当用户正体验网络延迟时,用户可能发出诸如(不限于)“你还在吗”和“你好”的一些常用短语。针对抖动状况,话语可以是“请再说一遍”、“抱歉”或“你能再说一次吗”。针对语音衰减状况,通常话语可以是“你能听见吗”或“你可以大声点儿吗”。语料匹配器144可以使用存储在语料数据库146中的样本话语以匹配从语音信号中检测到的字。如果找到语料,则可以指示网络通信的参与者正体验一些QoE问题。如果没有找到语料,则也可以表示参与者对网络通信的质量满意。
在一些实施方式中,语音特征提取器145可以从语音信号提取一个或更多个语音特征。诸如语调、语速(pacing)、音高(pitch)和音量的语音特征可以是参与者体验的网络通信的质量的指示。语音特征和语料可以被认为是体验指示符,所述体验指示符提供参与者体验的网络通信的质量的主观评估。如果体验指示符显示网络通信的质量可能欠佳,则QoE计算器149可以利用QoS检索器148来检索用于所述网络通信的QoS度量。QoE计算器149然后可以基于QoS度量和体验指示符来确定所述网络通信的QoE度量。
在一些实施方式中,QoE系统140可以用一个或更多个处理器150和存储器160来实现。处理器150通常可以控制QoE系统140在执行QoE计算时的操作,并且存储器160可以被配置为存储机器可读指令,如果所述机器可读指令被处理器150执行,则可以执行以上操作。下面进一步描述QoE系统140、处理器150和存储器160的细节。
图2示出用于确定网络通信的QoE度量的处理的例示性实施方式。如图2所述,网络通信220(与图1的网络通信121和/或125类似)可以在两个或更多个客户机装置之间进行。网络通信220可以包含模拟或数字媒体信号210,所述模拟或数字媒体信号210存储(不限于)语音、音频、图像和/或视频内容。实时地,网络通信220可以作为使用特定网络协议编码的一组分组被流传输到QoE系统。QoE系统然后可以从所述一组分组提取(221)媒体信号210,并且将媒体信号210发送给降噪模块141用于进一步处理。
在一些实施方式中,为了处理媒体信号210中的语音或音频信号,降噪模块141可以首先利用动态降噪方法从媒体信号210中滤除噪声,其中,所述动态降噪方法减少或去除不是由人产生的声音。降噪模块141然后可以将过滤后的媒体信号210发送给语音检测器142。语音检测器142可以从媒体信号210提取语音段。各个语音段可以是单音节声音单位。语音检测器142可以对媒体信号210中的元音和辅音进行标识,并基于元音和辅音边界来分割媒体信号210。
在一些实施方式中,语音检测器142可以基于过零率和音框(frame)能量来检测媒体信号210中的语音段,并且记录各个语音段的起始时间和结束时间。特别地,过零是媒体信号210中的不存在电压的点。通过计算媒体信号210的过零率,语音检测器142可以检测媒体信号210中的语音的存在及其频率。在一些实施方式中,作为在用于媒体信号210处理的连续音框之间的时间长度的音框平移可以是10毫秒。语音检测器142还可以记录各个网络通信的源和目的地,使得可以用于对语音段的源和目的地进行标识。
在一些实施方式中,QoE系统可以利用语音特征提取器145或者利用词汇识别器143和语料匹配器144来从媒体信号210提取一个或更多个体验指示符。QoE系统可以将由语音检测器142检测到的语音段发送给语音特征提取器145。语音特征提取器145可以从语音段提取语音特征作为体验指示符,并且将这些语音特征发送给QoE计算器149。另选地,QoE系统可以将语音段发送给词汇识别器143用于识别词汇。语料匹配器144可以对识别出的词汇中的语料进行标识,并且将匹配的语料发送给QoE计算器149用于进一步处理。
在一些实施方式中,媒体信号210可以包含图像或视频信号。并且QoE系统的附加部件(图2中未示出)可以使用面部识别来从视频信号提取面部表情或身体姿态。面部表情和/或身体姿态也可以被认为是体验指示符。例如,表示失望、生气和/或困惑的面部表情(例如,挑眉、张嘴)和身体姿态(例如,耸肩、举手)可以按照与语音特征类似的方式用于后续的QoE确定。
在一些实施方式中,语音特征提取器145可以从语音段提取振幅、时间和/或音高测量值。振幅表示语音段随时间的能量改变。不同的能量改变代表不同的情绪。例如,讲话中的能量改变可以显示讲话者所体验的焦虑或生气。可以针对特定时间范围内的这些能量改变来测量语音段,并且可以将结果记录为振幅测量值。
在一些实施方式中,语音特征提取器145可以在基于时间的分析的基础上评估语音段。例如,短时间过零分析可以是用于确定时间测量值的有效语音时域分析。特别地,可以使用短时间平均振幅函数来在语音段中找到第一音节和最后一个音节的大体位置。然后,可以利用零率扩展段的无声部分,以获得语音的准确结束点。时间测量值可以是指示讲话者讲话是快还是慢的语音速率。
在一些实施方式中,音高测量值表示感知到的声音的基频。音高周期是声带振动频率的倒数,其为准周期。语音特征提取器145可以利用短期平均值来估计语音段中的音高周期。音高测量值可以表示讲话者是否正提高其音高以与听者更好地交流并且克服差的网络通信状况。另选地,语音特征提取器145还可以使用多层感知来区分语音段中的不同的情绪状态(例如,生气和正常状态)并将其特征化。
在一些实施方式中,仅在讲话者的声音中存在焦虑或生气情绪可能不是网络通信的QoE不太好的明确指示,这是由于讲话者的情绪改变可能是由谈话的内容引起的,而不是由于网络通信的质量引起的。因此,QoE计算器149可以进一步评估客观的QoS度量以从参与者的观点来确定网络通信的质量。QoE计算器149可以使用QoS检索器148来实时测量QoS度量,或者从外部系统或装置检索历史QoS度量,所述外部系统和装置先前已经测量和记录了电话通信220的QoS度量。
在一些实施方式中,QoE计算器149可以针对显示焦虑或生气情绪的各个语音段向QoS检索器148请求QoS度量。如果QoS度量没有显示异常,则用户的情绪改变很可能与网络通信质量无关。然而,如果QoS度量显示延迟、分组丢失、抖动或任何其它服务不好的指示符,则QoE计算器149可以确定欠佳的网络通信质量可能是用户情绪改变的原因,并因此计算QoE度量。下面进一步描述QoE度量计算的细节。
在一些实施方式中,词汇识别器143可以尝试从语音段中对字进行标识。词汇识别器143可以将语音段单独或按顺序组合与存储在词汇数据库147中的样本字进行比较。如果在一系列语音段和样本字之间发现匹配,则词汇识别器143可以使用第一匹配的语音段的起始时间作为所识别的字的起始时间,并且使用最后匹配的语音段的结束时间作为所识别的字的结束时间。在一些实施方式中,词汇数据库147可以存储针对多种语言的字的样本发音。词汇识别器143然后可以将所识别的字与其起始时间和结束时间一起发送给语料匹配器144。
在一些实施方式中,语料匹配器144可以尝试将由词汇识别器143识别出的字与存储在语料数据库146中的已知语料进行比较。语料匹配器144可以尝试用这些已知语料来在所识别出的字中检测任何序列。一旦语料匹配器144在所识别出的字中检测到一个或更多个语料,则语料匹配器144还可以分配特定标记数以针对语料是属于延迟状况、抖动状况还是语音衰减状况进行分类。例如,标记数针对延迟状况可以是1、针对抖动状况可以是2并且针对语音衰减状况可以是3。利用语料中的第一个字的起始时间来分配语料的起始时间,并且利用语料中的最后一个字的结束时间来分配语料的结束时间。然后可以将语料、其起始时间和结束时间及其标记数发送给QoE计算器149用于进一步处理。
在一些实施方式中,QoE计算器149可以首先检查语料以确定是否检索QoS度量用于附加评估,并且基于语料和QoS度量来计算QoE度量。如果从媒体信号210提取的语料可以提供网络通信220的质量欠佳的指示,则QoE计算器149可以利用QoS检索器148来检索在与承载语料的特定网络通信220的传输类似的时间范围内收集的QoS度量。
在一些实施方式中,在讲话者的讲话中存在多个语料可以是如下情况的明确指示:讲话者正在体验欠佳的网络通信服务,而不是由于讲话者自身问题导致的。例如,当听到多个“请再说一遍”或“你可以大声点儿吗”时,可能表示讲话者可能实际上不能听到谈话的另一方,而不是因为讲话者自身听力问题。因此,QoE度量计算可以考虑讲话中的语料的量和频率。
在通常的双向通信中,第一个讲话者可以讲话一段时间,之后第二个讲话者进行后续讲话,之后可以是第一个讲话者的另一个讲话等。在这种情况下,讲话循环可以被定义为用于存储在一个讲话者停止讲话或者被另一个讲话者打断之前该讲话者所进行的讲话的逻辑单元。因此,两个讲话者之间的谈话可以被组织成两组讲话循环,各组讲话循环存储对应讲话者的讲话。通过评估网络通信220中的源和目的地信息,QoE系统可以将讲话者与各个语音段、字或语料关联。因此,QoE系统可以针对各个讲话循环容易地确定讲话者。
假定存在两个讲话者A和B。A的第一个讲话之后是B的第一个讲话,之后是A的第二个讲话,之后是B的第二个讲话等。然后,A的第一个讲话可以被存储为第一讲话循环,A的第二个讲话可以被存储为第二讲话循环,B的讲话可以被存储为与B的第一个讲话相对应的第一讲话循环以及与B的第二个讲话相对应的第二讲话循环。然后,QoE计算器149可以将这两个讲话者的讲话组织成两组讲话循环,并且针对对应组的讲话循环中的各个讲话循环分配序号。讲话循环之间的关系还可以被保持用于跟踪讲话循环的顺序。例如,可以在两组讲话循环之间建立链路,该链路显示A的第一讲话循环、B的第一讲话循环、A的第二讲话循环和B的第二讲话循环这样的讲话顺序。
在一些实施方式中,讲话循环的起始时间可以是特定讲话循环中的第一个所说的字的起始时间。可以利用另一讲话者的后续讲话循环的起始时间来确定讲话循环的结束时间。例如,可以使用B的第一讲话循环的起始时间作为A的第一讲话循环的结束时间。同样地,可以通过A的第二讲话循环的起始时间来设置B的第一讲话循环的结束时间。另选地,对方讲话者的之前的讲话循环的结束时间可以用作讲话者的当前讲话循环的起始时间。
在一些实施方式中,QoE计算器149可以确定语料和指示网络通信的质量可能欠佳的QoS度量。在这种情况下,QoE计算器149可以针对各个语料计算QoE度量。特别地,可以针对通过语料的起始时间和结束时间限定的特定时间间隔来计算QoE度量Q。换句话讲,Q(t1<=t<t2)表示针对时间间隔[t1,t2]的QoE度量,其中t1和t2表示特定语料的起始时间和结束时间。QoE度量基于度量函数f,所述度量函数f是时间t的分段函数,并且调节是基于先前语料的存在和频率的。所得到的QoE度量可以具有表示用户没有服务质量问题的最大值100和表示用户对服务质量完全不满意的最小值0。
假设在特定循环k中存在n个语料,则语料1…n的对应起始时间为:
Tk11,Tk12,…,Tk1i,…,Tk1n(1<=i<=n)。
n个语料的对应结束时间为:
Tk21,Tk22,…,Tk2i,…,Tk2n(1<=i<=n)。
n个语料的对应分类标记数为:
Ck1,Ck2,…Cki,...Ckn,(1<=i<=n)。
并且n个语料的对应循环序号为:
Sk1,Sk2,…,Ski,…,Skn(1<=i<=n)。
在一些实施方式中,特定语料的QoE度量可以基于利用如下定义的函数f计算的QoE基值:
如果C=1,则是延迟状况:f(C,S)=a*b(S-1);
如果C=2,则是衰减状况:f(C,S)=c*d(1-S);
如果C=3,则是抖动状况:f(C,S)=e*f(1-S);
a、b、c、d、e、f是用于值调节的正的常数,b>1,d>1,f>1。
因此,通过f函数产生的QoE基值取决于状况类型C以及特定循环中的语料的总数量和特定语料的位置。即,当在讲话循环中存在一个以上的语料时,如果是延迟状况,则稍后的语料可以具有比之前的语料大的QoE基值。换句话讲,讲话者等待对方的响应时间越长,讲话者变得越没耐心。因此,QoS基值可以随着延迟的序号的增加而以指数方式增加。在衰减和抖动状况下,讲话者可能对对方的语音质量不满意。然而,随着时间过去,讲话者可能习惯了衰减或抖动状况,并且可能随着时间过去而感觉较少的失望或没耐心。因此,f函数将不按指数方式增长,并且甚至可以针对后续语料略微减小。
在一些实施方式中,可以基于先前讲话循环中的最后一个语料的QoE度量来初始化特定讲话循环中的第一个语料的QoE度量。下面可以是计算公式的示例:
Q(T(k-1)2m<=t<Tk21)=50+Q(T(k-1)2(m-1)<=t<T(k-1)2m)/2,
假设在循环k-1中存在m个语料;
请注意,初始数“50”和除数“2”可以是可调节变量。
在一些实施方式中,QoE计算器149可以利用特定讲话循环中的先前语料的QoE度量来计算同一讲话循环中的任何后续语料的QoE度量。下面可以是计算公式的示例:
如果Q(Tk2i<=t<Tk2(i+1))-f(Ck(i+2),Sk(i+2))<0,
则Q(Tk2(i+1)<=t<Tk2(i+2))=0;其中1<=i<=(n-2)。
如果Q(Tk2i<=t<Tk2(i+1))-f(Ck(i+2),Sk(i+2))>=0,
则Q(Tk2(i+1)<=t<Tk2(i+2))
=Q(Tk2i<=t<Tk2(i+1))-f(Ck2(i+2),Sk(i+2));其中1<=i<=(n-2)。
因此,如果当前语料的QoE基值(其利用函数f计算)大于先前语料的QoE度量,则当前语料的QoE度量可以是先前语料的QoE度量和QoE基值的差。如果当前语料的QoE基值小于先前语料的QoE度量,则可以将当前语料的QoE度量设置为0。换句话讲,当网络通信质量改进时,即使客观质量测量值可能表现为欠佳状况,但是讲话者也可能感觉满意。
在一些实施方式中,从媒体信号提取的语音特征、面部表情或身体姿态也可以在确定QoE度量时类似地用作语料。例如,针对各个语音特征,可以产生基值,并且讲话循环中的语音特征的数量和频率可以用于计算语音特征的QoE度量。
图3示出使用语料来确定网络通信的QoE度量的处理301的例示性实施方式的流程图。处理301说明可以被描述为可以通过硬件、软件和/或固件执行的处理步骤、功能操作、事件和/或动作的各种功能块或动作。根据本公开的技术人员将认识到,对图3中示出的功能块的多个另选方案可以在各种实现中实践。在一些实施方式中,用于处理301的机器可执行指令可以存储在存储器中、由处理器执行和/或在QoE系统(例如,图1的QoE系统140)中实现。
在块310,QoE系统可以接收从双向或多向通信发起的网络通信。QoE系统可以从网络通信提取媒体信号。所述媒体信号可以包含由双向或多向通信的参与者中的一个进行的讲话。在块320,QoE系统的降噪模块可以从媒体信号中减少或去除噪声。在块330,QoE系统的语音检测器可以从媒体信号提取多个语音段。在一些实施方式中,多个语音段中的每一个可以是单音节声音。
在块340,QoE系统的词汇识别器可以基于存储在词汇数据库中的样本字来从多个语音段中识别多个字。在块350,QoE系统的语料匹配器可以利用存储在语料数据库中的样本语料来从多个字中标识语料。语料可以被认为是体验指示符。在块360,QoE系统可以对语料进行评估,并且确定指示网络通信的服务质量欠佳的语料。在这种情况下,QoE系统可以检索用于网络通信的QoS度量。如果QoS度量客观地指示网络通信的质量欠佳,则QoE系统可以进行到块370。否则,QoE系统可以进行到块310对附加媒体信号进行处理。
在块370,QoE系统可以基于语料和QoS度量来计算语料和网络通信的QoE度量。在一些实施方式中,QoE系统可以利用同一循环中的先前语料或先前循环中的语料的QoE度量来计算QoE度量。
图4示出使用体验指示符来确定网络通信的QoE度量的处理401的例示性实施方式的流程图。处理401说明可以被描述为可以通过硬件、软件和/或固件执行的处理步骤、功能操作、事件和/或动作的各种功能块或动作。根据本公开的技术人员将认识到,对图4中示出的功能块的多个另选方案可以在各种实现中实践。在一些实施方式中,用于处理401的机器可执行指令可以存储在存储器中、由处理器执行和/或在QoE系统(例如,图1的QoE系统140)中实现。
在块410,QoE系统可以接收网络通信,所述网络通信包含从双向或多向通信发起的媒体信号。在块420,QoE系统的降噪模块可以从媒体信号中减少或去除噪声。在块430,QoE系统的语音检测器可以从媒体信号提取体验指示符。所述体验指示符可以表示参与者对网络通信的服务质量的主观评估。在一些实施方式中,体验指示符可以是语料。另选地,体验指示符可以是语音特征、面部表情或身体姿态。
在块440,QoE系统可以评估体验指示符以了解其是否说明网络通信的服务质量欠佳。如果在块440的评估为“否”,则处理401可以进行到块410,以接收和处理附加媒体信号。如果在块440的评估为“是”,则处理401可以进行到块450。在块450,QoE系统可以检索网络通信的QoS度量。
在块460,QoE系统可以对QoS度量进行评估,并确定QoS度量是否指示网络通信的服务质量欠佳。如果块460确定返回“否”,则处理401可以进行到块410。如果块460确定返回“是”,则处理401可以进行到块470。在块470,QoE系统可以基于QoS度量和体验指示符来计算网络通信的QoE度量。
在一些实施方式中,QoE系统可以在计算网络通信的QoE度量之前从块460收集多个体验指示符。如上所述,可以基于QoS度量和特定循环中的多个体验指示符中的一些,或者可以基于多个循环中的多个经验指示符中的一些,来计算QoE度量。另选地,QoE系统可以基于QoS度量和多个体验指示符来计算多个QoE度量。
本领域技术人员将理解,针对这里公开的该处理和其它处理以及方法,处理和方法中执行的功能可以按不同的顺序实现。此外,概述的步骤和操作仅作为示例提供,所述步骤和操作中的一些可以是可选的,被组合成更少的步骤和操作,或者被扩展成附加步骤和操作,而不损害所公开的实施方式的本质。此外,概述的步骤和操作中的一个或更多个可以并行执行。
图5是实现用于确定在移动终端上执行的移动应用的服务质量的方法的计算机程序产品500的例示性实施方式的框图。计算机程序产品500可以包括信号承载介质502。信号承载介质502可以包括一组或更多组可执行指令504,当所述一组或更多组可执行指令504被例如处理器执行时,所述一组或更多组可执行指令504可以提供上述功能。因此,例如,参照图1的计算机系统,QoE系统140可以响应于通过信号承载介质502传送的指令504承担至少图3或图4中示出的操作中的一个或更多个。
在一些实施方式中,信号承载介质502可以包括非临时计算机可读介质506(例如,但不限于,硬盘驱动器、光盘(CD)、数字通用盘(DVD)、数字带、存储器等)。在一些实施方式中,信号承载介质502可以包括可读介质508(例如,但不限于,存储器、读/写(R/W)CD、R/W DVD等)。在一些实现中,信号承载介质502可以包括通信介质510(例如,但不限于,数字和/或模拟通信介质(例如,光缆、波导、有线通信链路、无线通信链路等))。因此,例如,参照图1的MMS113或AEMS140,计算机程序产品500可以通过信号承载介质502以无线方式传送给MMS113或AEMS140,其中,通过无线通信介质510(例如,遵循IEEE802.11标准的无线通信介质)传送所述信号承载介质502。计算机程序产品500可以被记录在非临时计算机可读介质506或另一类似的可读介质508上。
图6示出可以设置为根据本公开使用的QoE系统的示例计算装置600的例示性实施方式的框图。在非常基本的配置601中,计算装置600可以包括一个或更多个处理器610和系统内存620。内存总线630可以用于处理器610和系统内存620之间的通信。
根据期望的配置,处理器610可以是包括但不限于微处理器(μP)、微控制器(μC)、数字信号处理器(DSP)或以上部件的任何组合的任何类型。处理器601可以包括一个或更多个级别的缓存(例如,1级缓存611和2级缓存612、处理器核613和寄存器614)。处理器核613可以包括算术逻辑单元(ALU)、浮点单元(FPU)、数字信号处理核(DSP核)或者以上单元的任何组合。内存控制器615还可以与处理器610一起使用,或者在一些实现中,内存控制器615可以是处理器610的内部部件。
根据期望的配置,系统内存620可以是包括但不限于易失性存储器(例如,RAM)、非易失性存储器(例如,ROM、闪存等)或者以上部件的任何组合的任何类型。系统内存620可以包括操作系统621、一个或更多个应用622和程序数据624。应用622可以包括体验质量系统623,所述体验质量系统623被设置为执行这里所述的至少包括关于图3的处理301和图4的处理401描述的功能块和/或操作的功能和/或操作。程序数据624可以包括由体验质量系统623产生的体验质量度量625。在一些示例实施方式中,应用622可以被设置为在操作系统621上与程序数据624操作,使得移动应用服务质量确定的实现可以如这里所述提供。描述的该基本配置通过虚线601内的部件示出在图6中。
计算装置600可以具有附加的特征或功能以及附加接口,以便于基本配置601与任何所需装置和接口之间的通信。例如,可以使用总线/接口控制器640以便于经由存储装置接口总线641的基本配置601和一个或更多个数据存储装置650之间的通信。数据存储装置650可以是可移除存储装置651、不可移除存储装置652或二者的组合。举例来说,可移除存储装置和不可移除存储装置的示例包括磁盘装置(例如,柔性盘驱动器和硬盘驱动器(HDD))、光盘驱动器(例如,压缩盘(CD)驱动器或数字通用盘(DVD)驱动器)、固态驱动器(SSD)和带驱动器。示例计算机存储介质可以包括按照用于存储信息(例如,计算机可读指令、数据结构、程序模块或其它数据)的任何方法或技术实现的易失性和非易失性、可移除和不可移除介质。
系统内存620、可移除存储装置651和不可移除存储装置652都是计算机存储介质的示例。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其它存储技术、CD-ROM、数字通用盘(DVD)或其它光学存储装置、磁带盒、磁带、磁盘存储装置或其它磁性存储装置、或者可以用于存储期望的信息并且可以被计算装置600访问的任何其它介质。任何这种计算机存储介质可以是装置600的一部分。
计算装置600还可以包括接口总线642,所述接口总线642便于经由总线/接口控制器640从各种接口装置(例如,输出接口、外围接口和通信接口)到基本配置601的通信。示例输出接口660可以包括图形处理单元661和音频处理单元662,所述图形处理单元661和所述音频处理单元662可以被配置为经由一个或更多个A/V端口663与诸如显示器或扬声器的各种外部装置进行通信。示例外围接口660可以包括串行接口控制器671或并行接口控制器672,所述串行接口控制器671或所述并行接口控制器672可以被配置为经由一个或更多个I/O端口673与诸如输入装置(例如,键盘、鼠标、笔、语音输入装置、触摸输入装置等)的外部装置或其它外围装置(例如,打印机、扫描仪等)进行通信。示例通信装置680包括网络控制器681,所述网络控制器681可以被设置为便于经由一个或更多个通信端口682通过网络通信链路与一个或更多个其它计算装置690进行通信。
网络通信链路可以是通信介质的一个示例。通信介质通常可以由计算机可读指令、数据结构、程序模块或其它传输机制来实现,并且可以包括任何信息传送介质。举例来说,并且没有限制,通信介质可以包括有线介质(例如,有线网络或直接有线连接)和无线介质(例如,听觉、射频(RF)、红外(IR)和其它无线介质)。这里使用的术语计算机可读介质可以包括存储介质和通信介质这二者。
计算装置600可以被实现为小型因素便携式(或移动)电子装置(例如,蜂窝电话、个人数据助理(PDA)、个人媒体播放器装置、无线网络观看装置、个人头戴耳机装置、专用装置或包括以上功能中的任何一个的混合装置)。计算装置600还可以被实现为包括膝上型计算机和非膝上型计算机配置这二者的个人计算机。另外,计算装置600可以被实现为无线基站或其它无线系统或装置的一部分。
系统的多个方面的软件实现和硬件实现之间几乎没有区别;使用硬件或者软件总体上是代表成本相对于效率的权衡的设计选择(但并非总是这样,因为在特定的环境中硬件和软件之间的选择会变得重要)。存在可以实现本文所描述的处理和/或系统和/或其它技术的各种载体(例如,硬件、软件和/或固件),并且优选的载体将随着采用这些处理和/或系统和/或其它技术的环境而改变。例如,如果实施者确定速度和精度是最重要的,则实施者会主要选用硬件和/或固件载体;如果灵活性是最重要的,则实施者会主要选用软件实现方式;或者,再另选地,实施者可以选用硬件、软件和/或固件的某种组合。
通过使用框图、流程图和/或示例,以上详述已阐述了设备和/或处理的各种实施方式。在这样的框图、流程图和/或示例包含一个或更多个功能和/或操作的范围内,本领域技术人员将理解的是,可以由大范围的硬件、软件、固件或实际上其任何组合单独地和/或共同地实现这样的框图、流程图或示例内的各个功能和/或操作。在一些实施方式中,可以由专用集成电路(ASIC)、现场可编程门阵列(FPGA)、数字信号处理器(DSP)或其它集成的形式来实现本文所描述的主题的多个部分。然而,本领域技术人员将认识到,本文所公开的实施方式的某些方面可以作为在一个或更多个计算机上运行的一个或更多个计算机程序(例如,作为在一个或更多个计算机系统上运行的一个或更多个程序)、作为在一个或更多个处理器上运行的一个或更多个程序(例如,作为在一个或更多个微处理器上运行的一个或更多个程序)、作为固件、或者作为实际上它们的任何组合全部地或部分地等效地实现在集成电路中,并且将认识到,根据该公开,设计电路和/或针对软件或固件编写代码完全属于在本领域技术人员的技能之内。此外,本领域技术人员将理解的是,本文所描述的主题的机制能够被发布为各种形式的程序产品,并且,本文所描述的主题的示例性实施方式的应用与用于实际进行发布的信号承载介质的具体类型无关。信号承载介质的示例包括但不限于:诸如软盘、硬盘驱动器、光盘(CD)、数字通用光盘(DVD)、数字磁带、计算机存储器等这样的可记录型介质;以及诸如数字和/或模拟通信介质(例如,光缆、波导、有线通信链路、无线通信链路等)这样的传输型介质。
本领域技术人员将认识到,以本文所阐述的方式描述设备和/或处理并且其后使用工程实践将这样描述的设备和/或处理集成到数据处理系统中是本领域中常见的。也就是说,通过合理次数的实验,可以将本文描述的至少一部分设备和/或处理集成到数据处理系统中。本领域技术人员将认识到,典型的数据处理系统一般包括以下各项中的一个或更多个:系统单元壳体、视频显示设备、诸如易失性存储器和非易失性存储器这样的存储器、诸如微处理器和数字信号处理器这样的处理器、诸如操作系统、驱动器、图形用户界面和应用程序这样的计算实体、诸如触摸板或屏幕这样的一个或更多个交互设备和/或包括反馈回路和控制电机(例如感测位置和/或速度的反馈;移动和/或调节部件和/或数量的控制电机)的控制系统。可以利用任何适合的市售部件(诸如那些通常可以在数据计算/通信和/或网络计算/通信系统中找到的部件)来实现通常的数据处理系统。
本文所描述的主题有时例示了包含在不同的其它部件中的或与不同的其它部件相连接的不同的部件。应理解的是,所描述的这种架构仅仅是示例性的,并且实际上,可以实现许多获得了相同的功能的其它架构。在概念上,用于获得相同功能的部件的任何配置都是有效地“关联”的,使得获得期望的功能。因此,不考虑架构或中间部件,可以将本文中被组合以获得特定的功能的任何两个部件视为是彼此“相关联”的,使得期望的功能被实现。同样,如此相关联的任何两个部件也可以被视为彼此“可操作地连接”或“可操作地耦接”,以实现期望的功能,并且能够如此关联的任何两个部件也可以被视为彼此“可操作地可耦接”,以实现期望的功能。可操作地可耦接的具体示例包括但不限于物理上可匹配和/或物理上交互的部件和/或可无线地交互和/或无线地交互的部件和/或逻辑上交互和/或可逻辑上交互的部件。
针对在本文中基本上任何复数和/或单数术语的使用,本技术领域技术人员可以从复数转化为单数和/或从单数转化为复数以适合于上下文和/或应用。为了清楚起见,可以在此明确地阐述各种单数/复数的置换。
本领域技术人员将理解的是,一般来说,本文所使用的措词,特别是在所附权利要求(例如,所附权利要求的主体)中使用的措词,通常旨在是“开放式”措词(例如,措词“包括”应被理解为“包括但不限于”,措词“具有”应被理解为“至少具有”,措词“包含”应被理解为“包含但不限于”等)。本领域技术人员将进一步理解的是,如果所引入的权利要求记载中的特定的数目是有意图的,则这样的意图将在权利要求中明确地记载,并且在没有这样的记载时,不存在这样的意图。例如,作为对理解的辅助,下面所附的权利要求可以包含对“至少一个”和“一个或更多个”的引入性用语的使用,以引入权利要求记载。然而,即使当相同的权利要求包括引入性用语“一个或更多个”或者“至少一个”以及诸如“一”或“一个”的不定冠词(例如,“一”和/或“一个”应被解释为表示“至少一个”或“一个或更多个”)时,使用这样的用语也不应被解释为暗示由不定冠词“一”或“一个”所引入的权利要求记载将包含这种所引入的权利要求记载的任何特定的权利要求限制到仅包含一个这样的记载的发明;对于使用用于引入权利要求记载的定冠词来说也是如此。另外,即使明确地记载了所引入的权利要求记载的特定数目,本领域技术人员将理解的是,这样的记载通常也应该被理解为至少表示所记载的数目(例如,在没有其它修饰的情况下,“两个记载”的无修饰的记载通常表示至少两个记载或者两个或更多个记载)。此外,在使用与“A、B和C中的至少一个等”类似的常规表述的情况下,一般来说,这种结构旨在表示本领域技术人员将理解的该常规表述的含义(例如,“具有A、B和C中的至少一个的系统”将包括但不限于仅具有A的系统、仅具有B的系统、仅具有C的系统、具有A和B的系统、具有A和C的系统、具有B和C的系统和/或具有A、B和C的系统等)。在使用与“A、B或C中的至少一个等”类似的常规表述的情况下,一般来说,这种结构旨在表示本领域技术人员将理解的该常规表述的含义(例如,“具有A、B或C中的至少一个的系统”将包括但不限于仅具有A的系统、仅具有B的系统、仅具有C的系统、具有A和B的系统、具有A和C的系统、具有B和C的系统和/或具有A、B和C的系统等)。本领域技术人员将进一步理解的是,示出两个或更多个替代性措词的几乎任何转折词和/或短语,无论是在说明书、权利要求或附图中,都应被理解为考虑可能包括措词中的一个、措词中任一个或全部措词。例如,短语“A或B”将被理解为可能包括“A”或“B”或“A和B”。
从以上,将要理解的是,这里为了说明的目的已描述了本公开的各种实施方式,并且可以在不脱离本公开的范围和精神的情况下进行各种修改。因此,这里公开的各种实施方式并非旨在进行限制,以下的权利要求指示真实的范围和精神。
Claims (20)
1.一种用于确定网络通信的体验质量(QoE)度量的方法,该方法包括以下步骤:
从所述网络通信接收媒体信号;
从所述媒体信号提取体验指示符,其中,所述体验指示符对应于与所述网络通信的服务质量相关联的参与者的主观使用体验;以及
基于所述体验指示符和所述网络通信的服务质量(QoS)度量来确定所述网络通信的所述QoE度量。
2.根据权利要求1所述的方法,其中,确定所述QoE度量的步骤还包括以下步骤:
当确定所述体验指示符示出所述网络通信的所述服务质量欠佳时,检索所述网络通信的所述QoS度量;以及
当确定所述QoS度量示出所述网络通信的所述服务质量欠佳时,计算所述QoE度量。
3.根据权利要求1所述的方法,其中,所述体验指示符是描述所述网络通信的所述服务质量的语音特征。
4.根据权利要求1所述的方法,其中,所述语音特征是情绪改变振幅测量值。
5.根据权利要求1所述的方法,其中,所述语音特征是语速时间测量值。
6.根据权利要求1所述的方法,其中,所述语音特征是音量音高测量值。
7.根据权利要求1所述的方法,其中,所述体验指示符是描述所述网络通信的所述服务质量的语料。
8.根据权利要求1所述的方法,其中,所述体验指示符是描述所述网络通信的所述服务质量的面部表情。
9.根据权利要求1所述的方法,其中,所述体验指示符是描述所述网络通信的所述服务质量的身体姿态。
10.一种用于确定网络通信的质量的方法,该方法包括以下步骤:
从所述网络通信接收媒体信号;
从所述媒体信号提取第一语料,其中,所述第一语料对应于与所述网络通信的服务质量相关联的参与者的主观使用体验;以及
基于所述第一语料和所述网络通信的服务质量(QoS)度量来确定所述网络通信的第一QoE度量。
11.根据权利要求10所述的方法,其中,从所述媒体信号提取所述语料的步骤还包括以下步骤:
减少所接收到的媒体信号中的噪声;
从所述媒体信号提取多个语音段;
从所述多个语音段识别多个字;以及
基于所述多个字来对所述第一语料进行标识。
12.根据权利要求10所述的方法,其中,确定所述第一QoE度量的步骤还包括以下步骤:
检索第二语料的第二QoE度量,其中,在所述媒体信号中,所述第一语料在所述第二语料之后;以及
基于所述第二QoE度量、所述第一语料和所述网络通信的所述QoS度量来将所述第一QoE度量初始化。
13.根据权利要求10所述的方法,其中,确定所述第一QoE度量的步骤还包括以下步骤:
检索第二语料的第二QoE度量,其中,在所述媒体信号中,所述第一语料在所述第二语料之后;以及
基于所述第二QoE度量、所述第一语料和所述网络通信的所述QoS度量,来使所述第一QoE度量成指数增加。
14.根据权利要求10所述的方法,其中,确定所述第一QoE度量的步骤还包括以下步骤:
当确定所述语料示出所述网络通信的所述服务质量欠佳时,收集所述网络通信的所述QoS度量;以及
当确定所述QoS度量示出所述网络通信的所述服务质量欠佳时,计算所述QoE度量。
15.根据权利要求10所述的方法,其中,由所述第一语料指示的所述服务质量具有延迟状况、衰减状况或抖动状况。
16.一种机器可读介质,该机器可读介质具有一组指令,所述一组指令在被处理器执行时,使得所述处理器执行一种用于确定网络通信的体验质量(QoE)度量的方法,该方法包括以下步骤:
从所述网络通信接收媒体信号;
从所述媒体信号提取体验指示符,其中,所述体验指示符对应于与所述网络通信的服务质量相关联的参与者的主观使用体验;以及
基于所述体验指示符和所述网络通信的服务质量(QoS)度量来确定所述网络通信的所述QoE度量。
17.根据权利要求16所述的机器可读介质,其中,确定所述QoE度量的步骤还包括以下步骤:
当确定所述体验指示符示出所述网络通信的所述服务质量欠佳时,检索所述网络通信的所述QoS度量;以及
当确定所述QoS度量示出所述网络通信的所述服务质量欠佳时,计算所述QoE度量。
18.根据权利要求16所述的机器可读介质,其中,所述体验指示符是描述所述网络通信的所述服务质量的语音特征。
19.根据权利要求16所述的机器可读介质,其中,所述体验指示符是描述所述网络通信的所述服务质量的面部表情。
20.根据权利要求16所述的机器可读介质,其中,所述体验指示符是描述所述网络通信的所述服务质量的语料。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/CN2011/070903 WO2012106838A1 (en) | 2011-02-10 | 2011-02-10 | Quality-of-experience measurement for voice services |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103348730A true CN103348730A (zh) | 2013-10-09 |
CN103348730B CN103348730B (zh) | 2016-11-23 |
Family
ID=46638116
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201180067264.3A Expired - Fee Related CN103348730B (zh) | 2011-02-10 | 2011-02-10 | 语音服务的体验质量测量 |
Country Status (5)
Country | Link |
---|---|
US (2) | US9185005B2 (zh) |
EP (1) | EP2673980A4 (zh) |
JP (1) | JP5688475B2 (zh) |
CN (1) | CN103348730B (zh) |
WO (1) | WO2012106838A1 (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105141401A (zh) * | 2014-06-03 | 2015-12-09 | 西安中兴新软件有限责任公司 | 一种帧聚合方法及电子设备 |
CN105139860A (zh) * | 2014-06-05 | 2015-12-09 | 宝马股份公司 | 通信设备及其运行方法 |
WO2016055022A1 (en) * | 2014-10-10 | 2016-04-14 | Huawei Technologies Co., Ltd. | Method and device for requesting a quality of experience in a communications network |
CN107580155A (zh) * | 2017-08-31 | 2018-01-12 | 百度在线网络技术(北京)有限公司 | 网络电话质量确定方法、装置、计算机设备和存储介质 |
CN107800886A (zh) * | 2017-11-15 | 2018-03-13 | 珠海市魅族科技有限公司 | 终端控制方法、装置、计算机装置及计算机可读存储介质 |
CN107846520A (zh) * | 2017-10-26 | 2018-03-27 | 科大讯飞股份有限公司 | 单通检测方法及装置 |
Families Citing this family (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103348730B (zh) * | 2011-02-10 | 2016-11-23 | 英派尔科技开发有限公司 | 语音服务的体验质量测量 |
JP5651619B2 (ja) * | 2012-02-24 | 2015-01-14 | エヌ・ティ・ティ・コムウェア株式会社 | 通信システム、経路決定装置、経路決定方法及び経路決定プログラム |
US9438883B2 (en) | 2012-04-09 | 2016-09-06 | Intel Corporation | Quality of experience reporting for combined unicast-multicast/broadcast streaming of media content |
US10489389B2 (en) | 2012-06-07 | 2019-11-26 | Wormhole Labs, Inc. | Experience analytic objects, systems and methods |
WO2014040646A1 (en) | 2012-09-14 | 2014-03-20 | Huawei Technologies Co., Ltd. | Determining the function relating user-centric quality of experience and network performance based quality of service |
CN105075276B (zh) * | 2013-01-11 | 2019-04-16 | 瑞典爱立信有限公司 | 在广播通信网络中操作客户端设备和服务器设备的技术 |
US9609336B2 (en) * | 2013-04-16 | 2017-03-28 | Fastvdo Llc | Adaptive coding, transmission and efficient display of multimedia (acted) |
US9232048B2 (en) * | 2013-12-04 | 2016-01-05 | International Business Machines Corporation | Quality of experience determination for multi-party VoIP conference calls that account for focus degradation effects |
CN104575521A (zh) * | 2014-12-26 | 2015-04-29 | 大连理工大学 | 一种lte通信系统语音质量的评估方法 |
KR102076807B1 (ko) * | 2015-05-18 | 2020-02-13 | 전자부품연구원 | 공간행동 의미분석 시스템 |
US10200435B2 (en) * | 2015-09-22 | 2019-02-05 | Pathsolutions, Inc. | Network communications service quality monitor |
EP3261292A1 (en) * | 2016-06-21 | 2017-12-27 | Alcatel Lucent | Method and system for automating assessment of network quality of experience |
US10931107B2 (en) | 2016-10-06 | 2021-02-23 | Foresight Energy Ltd. | System and method for management of an electricity distribution grid |
US10708147B2 (en) | 2017-03-07 | 2020-07-07 | International Business Machines Corporation | Monitoring dynamic quality of service based on changing user context |
US10593351B2 (en) * | 2017-05-03 | 2020-03-17 | Ajit Arun Zadgaonkar | System and method for estimating hormone level and physiological conditions by analysing speech samples |
US11363345B2 (en) | 2019-03-26 | 2022-06-14 | Ssimwave Inc. | Unified end-to-end quality and latency measurement, optimization and management in multimedia communications |
US10970036B1 (en) | 2019-09-24 | 2021-04-06 | Facebook Technologies, Llc | Methods and system for controlling tactile content |
US10824390B1 (en) * | 2019-09-24 | 2020-11-03 | Facebook Technologies, Llc | Methods and system for adjusting level of tactile content when presenting audio content |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2003032563A1 (en) * | 2001-10-05 | 2003-04-17 | Verizon Laboratories Inc. | Systems and methods for automatic evaluation of subjective quality of packetized telecommunication signals while varying implementation parameters |
CN101621351A (zh) * | 2008-06-30 | 2010-01-06 | 华为技术有限公司 | 一种调节多媒体编码速率的方法、装置及系统 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE19861108C5 (de) | 1998-05-05 | 2011-02-03 | Vodafone Ag | Ermittlung der Dienstgüte von Telekommunikationsdiensten |
US7716321B2 (en) | 2006-11-01 | 2010-05-11 | Sony Corporation | Method and system for providing recommendations for internet content providers |
WO2008092473A1 (en) | 2007-01-31 | 2008-08-07 | Telecom Italia S.P.A. | Customizable method and system for emotional recognition |
CN101577631B (zh) | 2008-05-07 | 2012-04-25 | 华为技术有限公司 | 评价用户体验质量的方法、系统及网络装置 |
WO2010064138A1 (en) * | 2008-12-01 | 2010-06-10 | National University Singapore | Portable engine for entertainment, education, or communication |
JP5085526B2 (ja) | 2008-12-26 | 2012-11-28 | Kddi株式会社 | 品質情報収集装置 |
EP2633644B1 (en) * | 2010-10-29 | 2017-10-25 | Telefonaktiebolaget LM Ericsson (publ) | Service performance in communications network |
US9900256B2 (en) * | 2010-11-01 | 2018-02-20 | Thomson Licensing Dtv | Method and apparatus for quality of experience management for network services |
CN103348730B (zh) | 2011-02-10 | 2016-11-23 | 英派尔科技开发有限公司 | 语音服务的体验质量测量 |
-
2011
- 2011-02-10 CN CN201180067264.3A patent/CN103348730B/zh not_active Expired - Fee Related
- 2011-02-10 EP EP11858142.0A patent/EP2673980A4/en not_active Withdrawn
- 2011-02-10 WO PCT/CN2011/070903 patent/WO2012106838A1/en active Application Filing
- 2011-02-10 US US13/641,701 patent/US9185005B2/en not_active Expired - Fee Related
- 2011-02-10 JP JP2013552813A patent/JP5688475B2/ja not_active Expired - Fee Related
-
2015
- 2015-09-25 US US14/864,920 patent/US9407680B2/en not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2003032563A1 (en) * | 2001-10-05 | 2003-04-17 | Verizon Laboratories Inc. | Systems and methods for automatic evaluation of subjective quality of packetized telecommunication signals while varying implementation parameters |
CN101621351A (zh) * | 2008-06-30 | 2010-01-06 | 华为技术有限公司 | 一种调节多媒体编码速率的方法、装置及系统 |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105141401A (zh) * | 2014-06-03 | 2015-12-09 | 西安中兴新软件有限责任公司 | 一种帧聚合方法及电子设备 |
WO2015184733A1 (zh) * | 2014-06-03 | 2015-12-10 | 西安中兴新软件有限责任公司 | 一种帧聚合方法及电子设备 |
US10178013B2 (en) | 2014-06-03 | 2019-01-08 | Xi'an Zhongxing New Software Co., Ltd. | Frame aggregation method and electronic device |
CN105141401B (zh) * | 2014-06-03 | 2019-04-12 | 西安中兴新软件有限责任公司 | 一种帧聚合方法及电子设备 |
CN105139860A (zh) * | 2014-06-05 | 2015-12-09 | 宝马股份公司 | 通信设备及其运行方法 |
CN105139860B (zh) * | 2014-06-05 | 2020-12-01 | 宝马股份公司 | 通信设备及其运行方法 |
WO2016055022A1 (en) * | 2014-10-10 | 2016-04-14 | Huawei Technologies Co., Ltd. | Method and device for requesting a quality of experience in a communications network |
US10321361B2 (en) | 2014-10-10 | 2019-06-11 | Huawei Technologies Co., Ltd. | Method and device for requesting a quality of experience in a communications network |
CN107580155A (zh) * | 2017-08-31 | 2018-01-12 | 百度在线网络技术(北京)有限公司 | 网络电话质量确定方法、装置、计算机设备和存储介质 |
CN107580155B (zh) * | 2017-08-31 | 2020-09-11 | 百度在线网络技术(北京)有限公司 | 网络电话质量确定方法、装置、计算机设备和存储介质 |
CN107846520A (zh) * | 2017-10-26 | 2018-03-27 | 科大讯飞股份有限公司 | 单通检测方法及装置 |
CN107800886A (zh) * | 2017-11-15 | 2018-03-13 | 珠海市魅族科技有限公司 | 终端控制方法、装置、计算机装置及计算机可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
US20160014187A1 (en) | 2016-01-14 |
EP2673980A1 (en) | 2013-12-18 |
US20130051271A1 (en) | 2013-02-28 |
EP2673980A4 (en) | 2014-07-16 |
US9185005B2 (en) | 2015-11-10 |
US9407680B2 (en) | 2016-08-02 |
JP5688475B2 (ja) | 2015-03-25 |
CN103348730B (zh) | 2016-11-23 |
JP2014511592A (ja) | 2014-05-15 |
WO2012106838A1 (en) | 2012-08-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103348730A (zh) | 语音服务的体验质量测量 | |
US8731936B2 (en) | Energy-efficient unobtrusive identification of a speaker | |
JP6341092B2 (ja) | 表現分類装置、表現分類方法、不満検出装置及び不満検出方法 | |
Kim et al. | A comparison of online automatic speech recognition systems and the nonverbal responses to unintelligible speech | |
Savran et al. | Combining video, audio and lexical indicators of affect in spontaneous conversation via particle filtering | |
Lu et al. | Stresssense: Detecting stress in unconstrained acoustic environments using smartphones | |
WO2014069076A1 (ja) | 会話分析装置及び会話分析方法 | |
CN111009237A (zh) | 语音识别方法、装置、电子设备及存储介质 | |
Zezario et al. | STOI-Net: A deep learning based non-intrusive speech intelligibility assessment model | |
US20180260825A1 (en) | Automated feedback determination from attendees for events | |
CN114566187B (zh) | 操作包括电子装置的系统的方法、电子装置及其系统 | |
Dong et al. | A pyramid recurrent network for predicting crowdsourced speech-quality ratings of real-world signals | |
CN110349586B (zh) | 电信诈骗检测方法及装置 | |
US20230154457A1 (en) | Communication System And Related Methods | |
US20210327423A1 (en) | Method and system for monitoring content of a communication session over a network | |
CN114664328A (zh) | 语音指导系统及其操作方法 | |
Wyatt et al. | A Privacy-Sensitive Approach to Modeling Multi-Person Conversations. | |
JP2014123813A (ja) | オペレータ対顧客会話自動採点装置およびその動作方法 | |
WO2015019662A1 (ja) | 分析対象決定装置及び分析対象決定方法 | |
JPWO2014069121A1 (ja) | 会話分析装置及び会話分析方法 | |
WO2021258958A1 (zh) | 语音编码方法、装置、计算机设备和存储介质 | |
Sanchez et al. | Domain adaptation and compensation for emotion detection. | |
Rheault et al. | Multimodal techniques for the study of a ect in political videos | |
CN110125946B (zh) | 自动通话方法、装置、电子设备及计算机可读介质 | |
JP2019101399A (ja) | 好感度推定装置、好感度推定方法、プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20161123 Termination date: 20200210 |