CN103971688B - 一种语音数据采集服务系统及方法 - Google Patents

一种语音数据采集服务系统及方法 Download PDF

Info

Publication number
CN103971688B
CN103971688B CN201310040998.3A CN201310040998A CN103971688B CN 103971688 B CN103971688 B CN 103971688B CN 201310040998 A CN201310040998 A CN 201310040998A CN 103971688 B CN103971688 B CN 103971688B
Authority
CN
China
Prior art keywords
data
collection
message
voice
voice collecting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310040998.3A
Other languages
English (en)
Other versions
CN103971688A (zh
Inventor
刘学梁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Tencent Cloud Computing Beijing Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201310040998.3A priority Critical patent/CN103971688B/zh
Priority to PCT/CN2013/088037 priority patent/WO2014117585A1/en
Priority to US14/260,990 priority patent/US20140236987A1/en
Publication of CN103971688A publication Critical patent/CN103971688A/zh
Application granted granted Critical
Publication of CN103971688B publication Critical patent/CN103971688B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/683Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content

Abstract

本发明提出一种语音数据采集服务系统及方法,其中系统包括:采集装置,用于采集语音采集数据,将所述语音采集数据发送至采集服务代理;采集服务代理,用于接收来自一个以上采集装置的语音采集数据,将所述语音采集数据按照接收的先后顺序发送至数据采集服务器;数据采集服务器,用于对来自采集服务代理的语音采集数据进行处理或存储。本发明能够降低采集装置的复杂性和维护难度,并提高采集装置的服务质量。

Description

一种语音数据采集服务系统及方法
技术领域
本发明涉及语音采集服务技术领域,尤其涉及一种语音数据采集服务系统及方法。
背景技术
现有基于日志的语音采集服务系统通常采用二层服务框架。具体的,由位于采集层的采集装置(一般是语音处理单元)处理并记录语音信息,这些语音信息通常是线上数据,如语音识别云服务的语音信息;之后,采集装置将记录的语音信息按照预定的规则发送至位于存储管理层的数据采集服务器,实现语音数据的采集。
可见,现有的基于日志的语音采集服务系统中,语音数据的处理和采集都是由采集装置来完成的,这种方式导致采集装置的复杂性和维护难度较高;并且,由于语音数据的采集会延长采集装置的响应时间,导致采集装置的服务质量降低。
发明内容
本发明提供了一种语音数据采集服务系统,能够降低采集装置的复杂性和维护难度,并提高采集装置的服务质量。
本发明还提供了一种语音数据采集服务方法,能够降低采集装置的复杂性和维护难度,并提高采集装置的服务质量。
本发明的技术方案是这样实现的:
一种语音数据采集服务系统,包括:
采集装置,用于采集语音采集数据,将所述语音采集数据发送至采集服务代理;
采集服务代理,用于接收来自一个以上采集装置的语音采集数据,将所述语音采集数据按照接收的先后顺序发送至数据采集服务器;
数据采集服务器,用于对来自采集服务代理的语音采集数据进行处理或存储;其中所述语音采集数据包括:语音数据和语音元数据;所述数据采集服务器将所述语音数据和所述语音元数据分开存储,并通过文件路径将所述语音数据和所述语音元数据关联起来;
所述系统进一步包括代理接口,所述代理接口分别与采集装置和采集服务代理连接;所述代理接口向所述采集装置提供数据发送接口和配置接口;所述配置接口用于实现对所述采集装置的采集行为的控制,所述配置接口的配置项包括:所述采集服务代理的端口或地址信息、语音数据的采集比例或者采集到的语音类型信息;所述配置接口向所述采集装置提供所述采集服务代理的地址或端口信息、语音数据的采集比例或者采集到的语音类型信息;所述采集装置根据所述配置接口提供的所述信息采集语音采集数据,并将语音采集数据发送至代理接口;所述代理接口接收到语音采集数据后,按照预先设定的封装协议将所述语音采集数据封装为采集消息,将所述采集消息转发至采集服务代理;
所述采集服务代理建立与代理接口的连接,当监听到所述代理接口转发的采集消息时,接收所述采集消息,并将所述采集消息保存在消息队列中;当所述消息队列中保存的采集消息的数量达到预先设定的队列长度时,如果采集服务代理再次收到代理接口转发的采集消息,则丢弃该采集消息。
上述系统中,所述采集消息包括采集数据类型字段、数据长度字段及序列化的语音数据和语音元数据。
上述系统中,当消息队列中存在采集消息时,按照进入队列的先后顺序将队列中的采集消息依次发送至数据采集服务器,并将已发送的采集消息从消息队列中删除。
上述系统中,数据采集服务器可以包括分发模块和针对不同采集数据类型的多个处理模块;
分发模块接收来自采集服务代理的采集消息,根据所述采集消息中的采集数据类型字段将所述采集消息分发至对应的处理模块;
处理模块按照预先设定的封装协议将所述采集消息解封装为语音采集数据,对所述语音采集数据进行处理。
一种语音数据采集服务方法,包括:
采集装置采集语音采集数据,将所述语音采集数据发送至采集服务代理;
采集服务代理接收来自一个以上采集装置的语音采集数据,将所述语音采集数据按照接收的先后顺序发送至数据采集服务器;
数据采集服务器对来自采集服务代理的语音采集数据进行处理或存储;其中所述语音采集数据包括:语音数据和语音元数据;所述数据采集服务器将所述语音数据和所述语音元数据分开存储,并通过文件路径将所述语音数据和所述语音元数据关联起来;
其中,所述代理接口向所述采集装置提供数据发送接口和配置接口;所述配置接口用于实现对所述采集装置的采集行为的控制,所述配置接口的配置项包括:所述采集服务代理的端口或地址信息、语音数据的采集比例或者采集到的语音类型信息;所述采集装置将语音采集数据发送至采集服务代理的方式为:所述配置接口向所述采集装置提供所述采集服务代理的地址或端口信息、语音数据的采集比例或者采集到的语音类型信息;采集装置根据所述配置接口提供的所述信息采集语音采集数据,并将语音采集数据发送至代理接口,代理接口将接收到的语音采集数据转发至采集服务代理;
所述代理接口将接收到的语音采集数据转发至采集服务代理的方式为:按照预先设定的封装协议将所述语音采集数据封装为采集消息,将所述采集消息转发至采集服务代理;
所述采集服务代理接收来自一个以上采集装置的语音采集数据,将语音采集数据按照接收的先后顺序发送至数据采集服务器的方式为:
采集服务代理建立与代理接口的连接,当监听到所述代理接口转发的采集消息时,接收所述采集消息,并将所述采集消息保存在消息队列中;当所述消息队列中保存的采集消息的数量达到预先设定的队列长度时,如果采集服务代理再次收到代理接口转发的采集消息,则丢弃该采集消息。
上述方法中,所述采集消息包括采集数据类型字段、数据长度字段及序列化的语音数据和语音元数据。
上述方法中,当消息队列中存在采集消息时,按照进入队列的先后顺序将队列中的采集消息依次发送至数据采集服务器,并将已发送的采集消息从消息队列中删除。
上述方法中数据采集服务器对来自采集服务代理的语音采集数据进行处理或存储的方式可以为:所述数据采集服务器中的分发模块接收来自采集服务代理的采集消息,根据所述采集消息中的采集数据类型字段将所述采集消息分发至对应的处理模块;
处理模块按照预先设定的封装协议将所述采集消息解封装为语音采集数据,对所述语音采集数据进行处理。
可见,本发明提出的语音数据采集服务系统和方法中,在语音采集服务器系统中设置了采集服务代理,形成三层的服务架构,将语音数据的采集工作从采集装置中剥离出来,由采集服务代理实现,从而降低了采集装置的复杂性和维护难度,并提高了采集装置的服务质量。
附图说明
图1本发明提出的语音数据采集服务系统结构示意图;
图2为本发明实施例一中基于Agent的语音数据采集服务系统结构示意图;
图3为本发明实施例三中Agent的消息传递方式示意图;
图4为本发明实施例四中数据采集服务器的结构示意图;
图5本发明提出的语音数据采集服务系方法流程图。
具体实施方式
本发明提出一种语音数据采集服务系统,如图1为该系统的结构示意图,该系统包括:
采集装置101,用于采集语音采集数据,将所述语音采集数据发送至采集服务代理102;
采集服务代理102,用于接收来自一个以上采集装置101的语音采集数据,将所述语音采集数据按照接收的先后顺序发送至数据采集服务器103;
数据采集服务器103,用于对来自采集服务代理102的语音采集数据进行处理或存储。
上述系统可以进一步包括代理接口104,代理接口104设置于采集装置101和采集服务代理102之间,分别与二者连接。采集装置101通过调用代理接口104将语音采集数据发送至和采集服务代理102。具体地,采集装置101将语音采集数据发送至代理接口104,代理接口104将接收到的语音采集数据转发至采集服务代理102。
上述系统中,代理接口104可以向采集装置101提供采集服务代理102的地址或端口信息、语音数据的采集比例或者采集到的语音类型信息;这样,采集装置101就可以根据代理接口104提供的上述信息采集语音采集数据并发送至代理接口104,并通过代理接口104转发至采集服务代理102。
上述系统中,可以由代理接口104完成语音采集数据的封装。具体地,代理接口104接收到语音采集数据后,按照预先设定的封装协议将所述语音采集数据封装为采集消息,将所述采集消息转发至采集服务代理102;
上述语音采集数据可以包括语音数据和语音元数据;
上述采集消息可以包括采集数据类型字段、数据长度字段及序列化的语音数据和语音元数据。
上述系统中,采集服务代理102在实现转发时,建立与代理接口104的连接,当监听到代理接口104转发的采集消息时,接收该采集消息,并将该采集消息保存在消息队列中;
当消息队列中存在采集消息时,按照进入队列的先后顺序将队列中的采集消息依次发送至数据采集服务器103,并将已发送的采集消息从消息队列中删除;
当所述消息队列中保存的采集消息的数量达到预先设定的队列长度时,如果采集服务代理102再次收到代理接口104转发的采集消息,则丢弃该采集消息。
上述系统中,数据采集服务器103可以包括分发模块和针对不同采集数据类型的多个处理模块;
分发模块接收来自采集服务代理102的采集消息,根据所述采集消息中的采集数据类型字段将所述采集消息分发至对应的处理模块;
处理模块按照预先设定的封装协议将所述采集消息解封装为语音采集数据,对所述语音采集数据进行处理,将所述语音采集数据中的语音数据和语音元数据分别进行存储,并通过文件路径将语音数据与相关的语音元数据关联。
以下结合附图,举具体的实施例详细介绍。
实施例一:
本实施例介绍语音数据采集服务系统的整体架构,如图2为本发明实施例一中基于采集服务代理(Agent)的语音数据采集服务系统结构示意图,该系统包括三层框架:第一层为采集层,包括采集装置,具体可以为语音采集端或语音处理单元。第二层为代理层,包括Agent。采集装置与Agent之间存在代理接口,由于可以同时为采集装置提供多种接口,故在本实施例中将采集装置与Agent之间的接口称为代理接口库(AgentLib)。第三层为存储管理层,包括数据采集服务器,数据采集服务器分别与Mysql数据库和NFS文件系统存在连接,将处理之后的语音元数据和语音数据分别存储在Mysql数据库和NFS文件系统中。以下对各个层次分别介绍。
采集层:
采集层由语音采集端或语音处理单元组成,其主要职责是采集语音采集数据(包括语音数据和语音元数据),并通过调用AgentLib将采集到的语音采集数据发送给Agent。借助于AgentLib,采集层可以方便地将语音采集数据发送给Agent,这简化了语音采集端和语音处理单元的实现。
代理层:
代理层由Agent组成,它的主要职责是将多个语音采集端或者语音处理单元发送过来的语音采集数据转发给数据采集服务进行相应的处理。Agent除了转发外,还负责控制采集层的采集速度。当采集过快了,通过丢掉部分语音采集数据来减少对采集端的性能影响。
存储管理层:
存储管理层由数据采集服务器组成,数据采集服务器根据语音采集数据的类型,对其进行相应的处理和存储。将语音元数据存储在Mysql数据库中,将语音数据作为文件存储在NFS文件系统中,并通过文件路径将二者关联起来。
数据采集服务器中包括针对几种数据类型的默认处理模块,当默认处理模块不能满足采集要求时,还可以包括其他定制处理模块,实现对其他类型语音采集数据的处理。
实施例二:
本实施例介绍AgentLib的具体功能。
AgentLib是语音采集端或语音处理单元与Agent之间的接口库,AgentLib向语音采集端或语音处理单元提供两种接口:第一种是数据发送接口,通过调用此接口,语音采集端或语音处理单元可以将语音采集数据发送给Agent。第二种是配制接口,通过配制接口可以实现对采集行为的控制。配制接口中常用的配制项有Agent的端口或地址信息,语音数据的采集比例,采集到的语音类型信息等。
为了减少对语音处理单元的影响,Agent可以和语音处理单元部署在同一台服务器中;这样,AgentLib就可通过域socket快速地将采集数据发送给Agent。
语音元数据通常是结构化的,通过开源的protobuf可以方便地完成对语音采集数据的序列化和反序列化。
AgentLib与Agent之间可以遵循固定的通信协议来实现语音采集数据的发送。AgentLib采用该协议将语音采集数据封装为采集消息,并将采集消息发送至Agent。
上述通信协议可以具体如下:
采集消息包括:采集数据类型字段(四个字节整型)+数据长度字段(四个字节整型)+protobuf序列化的语音元数据和语音数据
上述采集消息的封装由AgentLib来自动完成,这样可以简化接口的调用。
另外,当采集需求比较简单时,AgentLib可以集成到语音采集端或语音处理单元中。
实施例三:
本实施例介绍Agent的具体功能。
Agent可以采用非阻塞的serversocket来实现与Agentlib的连接,可同时监听多个连接过来的Agentlib连接,完成对多个AgentLib发送过来的采集数据进行转发。
如图3为本发明实施例三中Agent的消息传递方式示意图。
Agent的监听socket监听来自AgentLib的连接socket,并把监听到的连接socket加入到自己的连接socket列表中,监听采集消息的到来。
当有新采集消息到来时,Agent将收到的采集消息插入到消息队列中。
当消息队列非空时,连接到数据采集服务器的socket从消息队列中提取采集消息,并发送给数据采集服务器处理。
为了减少对语音处理单元性能的影响,Agent采用定长的消息队列,当采集消息过多时自动丢弃采集消息,从而可以避免语音处理单元的等待。
实施例四:
本实施例介绍数据采集服务器。如图4为本发明实施例四中数据采集服务器的结构示意图。数据采集服务器可以包括分发模块和多个处理模块,每个处理模块对应不同类型的采集消息。文件操作模块和数据库操作模块可以作为共享模块,供不同的处理模块调用。
数据采集服务器采用插件的框架来实现,通过实现新的插件并将插件加入到配制文件可方便地对采集服务的功能进行拓展。
分发模块在采集服务启动时完成对配制文件的解析并加载配制中定义的插件,当接收到新的采集消息时,根据消息中的采集数据类型字段将采集消息分发至对应的处理模块,即调用采集数据类型所对应的处理模块进行处理。
数据采集服务器可以预先实现几种常见场景的采集任务对应的处理模块,满足常规的语音采集需求;当有特殊的采集需求时,语音处理单元与类型处理模块可以灵活地定义新的protobuf协议,通过实现新的类型处理模块来拓展原有数据采集服务器的功能。另外,如果仅需要支持少数几种类型,数据采集服务器也可以仅包括一个处理模块,该处理模块对多种类型的采集消息进行处理。
为了便于查找和管理,语音元数据可以存储在Mysql数据库中。为了突破单台存储机器的存储限制,语音数据可以作为文件存储在NFS中。
本发明还提出一种语音数据采集服务方法,如图5为该方法流程图,包括以下步骤:
步骤501:采集装置采集语音采集数据,将所述语音采集数据发送至采集服务代理;
步骤502:采集服务代理接收来自一个以上采集装置的语音采集数据,将所述语音采集数据按照接收的先后顺序发送至数据采集服务器;
步骤503:数据采集服务器对来自采集服务代理的语音采集数据进行处理或存储。
上述步骤501中,采集装置将语音采集数据发送至采集服务代理的方式可以为:采集装置将语音采集数据发送至代理接口,代理接口将接收到的语音采集数据转发至采集服务代理。
上述步骤501中,采集装置采集语音采集数据之前可以进一步包括:所述代理接口向采集装置提供采集服务代理的地址或端口信息、语音数据的采集比例或者采集到的语音类型信息;
这样,采集装置可以根据代理接口提供的所述信息采集语音采集数据并发送至代理接口。
上述方法中,代理接口将接收到的语音采集数据转发至采集服务代理的方式可以为:按照预先设定的封装协议将所述语音采集数据封装为采集消息,将所述采集消息转发至采集服务代理;
所述语音采集数据包括语音数据和语音元数据;
所述采集消息包括采集数据类型字段、数据长度字段及序列化的语音数据和语音元数据。
上述步骤502的具体方式可以为:
采集服务代理建立与代理接口的连接,当监听到所述代理接口转发的采集消息时,接收所述采集消息,并将所述采集消息保存在消息队列中;
当消息队列中存在采集消息时,按照进入队列的先后顺序将队列中的采集消息依次发送至数据采集服务器,并将已发送的采集消息从消息队列中删除。
进一步地,当所述消息队列中保存的采集消息的数量达到预先设定的队列长度时,如果采集服务代理再次收到代理接口转发的采集消息,则丢弃该采集消息。
上述步骤503中,数据采集服务器对来自采集服务代理的语音采集数据进行处理或存储的方式可以为:
数据采集服务器中的分发模块接收来自采集服务代理的采集消息,根据所述采集消息中的采集数据类型字段将所述采集消息分发至对应的处理模块;
处理模块按照预先设定的封装协议将所述采集消息解封装为语音采集数据,对所述语音采集数据进行处理,将所述语音采集数据中的语音数据和语音元数据分别进行存储,并通过文件路径将语音数据与相关的语音元数据关联。
综上所述,本发明提出的语音数据采集服务系统和方法,通过在语音采集服务器系统中设置Agent,形成三层的服务架构,将语音数据的采集工作从采集装置中剥离出来由Agent实现,从而降低了采集装置的复杂性和维护难度,并提高了采集装置的服务质量。Agent可以通过控制消息队列的长度,实现有效地控制语音采集的速度。将Agent部署在与被数据采集服务器相同的服务器上,可以采用域socket进行通信,从而缩短被采集系统的消息发送时间,减少对被采集系统的性能影响。将语音数据与语音元数据分开存储,便于查询和管理。数据采集服务器采用插件的框架,可以方便对采集服务的功能进行定制和拓展。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

Claims (8)

1.一种语音数据采集服务系统,其特征在于,所述系统包括:
采集装置,用于采集语音采集数据,将所述语音采集数据发送至采集服务代理;
采集服务代理,用于接收来自一个以上采集装置的语音采集数据,将所述语音采集数据按照接收的先后顺序发送至数据采集服务器;
数据采集服务器,用于对来自采集服务代理的语音采集数据进行处理或存储;其中所述语音采集数据包括:语音数据和语音元数据;所述数据采集服务器将所述语音数据和所述语音元数据分开存储,并通过文件路径将所述语音数据和所述语音元数据关联起来;
所述系统进一步包括代理接口,所述代理接口分别与采集装置和采集服务代理连接;所述代理接口向所述采集装置提供数据发送接口和配置接口;所述配置接口用于实现对所述采集装置的采集行为的控制,所述配置接口的配置项包括:所述采集服务代理的端口或地址信息、语音数据的采集比例或者采集到的语音类型信息;所述配置接口向所述采集装置提供所述采集服务代理的地址或端口信息、语音数据的采集比例或者采集到的语音类型信息;所述采集装置根据所述配置接口提供的所述信息采集语音采集数据,并将语音采集数据发送至代理接口;所述代理接口接收到语音采集数据后,按照预先设定的封装协议将所述语音采集数据封装为采集消息,将所述采集消息转发至采集服务代理;
所述采集服务代理建立与代理接口的连接,当监听到所述代理接口转发的采集消息时,接收所述采集消息,并将所述采集消息保存在消息队列中;当所述消息队列中保存的采集消息的数量达到预先设定的队列长度时,如果采集服务代理再次收到代理接口转发的采集消息,则丢弃该采集消息。
2.根据权利要求1所述的系统,其特征在于,所述采集消息包括采集数据类型字段、数据长度字段及序列化的语音数据和语音元数据。
3.根据权利要求2所述的系统,其特征在于,当消息队列中存在采集消息时,按照进入队列的先后顺序将队列中的采集消息依次发送至数据采集服务器,并将已发送的采集消息从消息队列中删除。
4.根据权利要求2所述的系统,其特征在于,所述数据采集服务器包括分发模块和针对不同采集数据类型的多个处理模块;
分发模块接收来自采集服务代理的采集消息,根据所述采集消息中的采集数据类型字段将所述采集消息分发至对应的处理模块;
处理模块按照预先设定的封装协议将所述采集消息解封装为语音采集数据,对所述语音采集数据进行处理。
5.一种语音数据采集服务方法,其特征在于,所述方法包括:
采集装置采集语音采集数据,将所述语音采集数据发送至采集服务代理;
采集服务代理接收来自一个以上采集装置的语音采集数据,将所述语音采集数据按照接收的先后顺序发送至数据采集服务器;
数据采集服务器对来自采集服务代理的语音采集数据进行处理或存储;其中所述语音采集数据包括:语音数据和语音元数据;所述数据采集服务器将所述语音数据和所述语音元数据分开存储,并通过文件路径将所述语音数据和所述语音元数据关联起来;
其中,所述代理接口向所述采集装置提供数据发送接口和配置接口;所述配置接口用于实现对所述采集装置的采集行为的控制,所述配置接口的配置项包括:所述采集服务代理的端口或地址信息、语音数据的采集比例或者采集到的语音类型信息;所述采集装置将语音采集数据发送至采集服务代理的方式为:所述配置接口向所述采集装置提供所述采集服务代理的地址或端口信息、语音数据的采集比例或者采集到的语音类型信息;采集装置根据所述配置接口提供的所述信息采集语音采集数据,并将语音采集数据发送至代理接口,代理接口将接收到的语音采集数据转发至采集服务代理;
所述代理接口将接收到的语音采集数据转发至采集服务代理的方式为:按照预先设定的封装协议将所述语音采集数据封装为采集消息,将所述采集消息转发至采集服务代理;
所述采集服务代理接收来自一个以上采集装置的语音采集数据,将语音采集数据按照接收的先后顺序发送至数据采集服务器的方式为:
采集服务代理建立与代理接口的连接,当监听到所述代理接口转发的采集消息时,接收所述采集消息,并将所述采集消息保存在消息队列中;当所述消息队列中保存的采集消息的数量达到预先设定的队列长度时,如果采集服务代理再次收到代理接口转发的采集消息,则丢弃该采集消息。
6.根据权利要求5所述的方法,其特征在于,所述采集消息包括采集数据类型字段、数据长度字段及序列化的语音数据和语音元数据。
7.根据权利要求6所述的方法,其特征在于,当消息队列中存在采集消息时,按照进入队列的先后顺序将队列中的采集消息依次发送至数据采集服务器,并将已发送的采集消息从消息队列中删除。
8.根据权利要求6所述的方法,其特征在于,所述数据采集服务器对来自采集服务代理的语音采集数据进行处理或存储的方式为:
所述数据采集服务器中的分发模块接收来自采集服务代理的采集消息,根据所述采集消息中的采集数据类型字段将所述采集消息分发至对应的处理模块;
处理模块按照预先设定的封装协议将所述采集消息解封装为语音采集数据,对所述语音采集数据进行处理。
CN201310040998.3A 2013-02-01 2013-02-01 一种语音数据采集服务系统及方法 Active CN103971688B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201310040998.3A CN103971688B (zh) 2013-02-01 2013-02-01 一种语音数据采集服务系统及方法
PCT/CN2013/088037 WO2014117585A1 (en) 2013-02-01 2013-11-28 System and method for audio signal collection and processing
US14/260,990 US20140236987A1 (en) 2013-02-01 2014-04-24 System and method for audio signal collection and processing

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310040998.3A CN103971688B (zh) 2013-02-01 2013-02-01 一种语音数据采集服务系统及方法

Publications (2)

Publication Number Publication Date
CN103971688A CN103971688A (zh) 2014-08-06
CN103971688B true CN103971688B (zh) 2016-05-04

Family

ID=51241106

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310040998.3A Active CN103971688B (zh) 2013-02-01 2013-02-01 一种语音数据采集服务系统及方法

Country Status (3)

Country Link
US (1) US20140236987A1 (zh)
CN (1) CN103971688B (zh)
WO (1) WO2014117585A1 (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106847300B (zh) * 2017-03-03 2018-06-22 北京捷思锐科技股份有限公司 一种语音数据处理方法及装置
US11182205B2 (en) * 2019-01-02 2021-11-23 Mellanox Technologies, Ltd. Multi-processor queuing model
CN113763932B (zh) * 2021-05-13 2024-02-13 腾讯科技(深圳)有限公司 语音处理方法、装置、计算机设备及存储介质
CN113938652B (zh) * 2021-10-12 2022-07-26 深圳蓝集科技有限公司 一种无线图像传输系统
CN114584481A (zh) * 2022-02-16 2022-06-03 广州市百果园信息技术有限公司 一种音频信息采集方法、装置、设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005062293A1 (ja) * 2003-12-05 2005-07-07 Kabushikikaisha Kenwood オーディオ機器制御装置、オーディオ機器制御方法及びプログラム
CN101227428A (zh) * 2008-01-30 2008-07-23 中兴通讯股份有限公司 一种应用服务器及其远程控制方法
WO2012033825A1 (en) * 2010-09-08 2012-03-15 Nuance Communications, Inc. Methods and apparatus for providing input to a speech-enabled application program
CN102417465A (zh) * 2011-10-27 2012-04-18 宫宁瑞 替加环素新晶型及其制备方法
CN102684962A (zh) * 2007-04-30 2012-09-19 华为技术有限公司 通信代理的方法及装置及系统

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6839321B1 (en) * 2000-07-18 2005-01-04 Alcatel Domain based congestion management
US7016847B1 (en) * 2000-12-08 2006-03-21 Ben Franklin Patent Holdings L.L.C. Open architecture for a voice user interface
US20030041047A1 (en) * 2001-08-09 2003-02-27 International Business Machines Corporation Concept-based system for representing and processing multimedia objects with arbitrary constraints
JP4516918B2 (ja) * 2003-12-05 2010-08-04 株式会社ケンウッド 機器制御装置、音声認識装置、エージェント装置、機器制御方法及びプログラム
US7475078B2 (en) * 2006-05-30 2009-01-06 Microsoft Corporation Two-way synchronization of media data
US8073854B2 (en) * 2007-04-10 2011-12-06 The Echo Nest Corporation Determining the similarity of music using cultural and acoustic information

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005062293A1 (ja) * 2003-12-05 2005-07-07 Kabushikikaisha Kenwood オーディオ機器制御装置、オーディオ機器制御方法及びプログラム
CN102684962A (zh) * 2007-04-30 2012-09-19 华为技术有限公司 通信代理的方法及装置及系统
CN101227428A (zh) * 2008-01-30 2008-07-23 中兴通讯股份有限公司 一种应用服务器及其远程控制方法
WO2012033825A1 (en) * 2010-09-08 2012-03-15 Nuance Communications, Inc. Methods and apparatus for providing input to a speech-enabled application program
CN102417465A (zh) * 2011-10-27 2012-04-18 宫宁瑞 替加环素新晶型及其制备方法

Also Published As

Publication number Publication date
CN103971688A (zh) 2014-08-06
US20140236987A1 (en) 2014-08-21
WO2014117585A1 (en) 2014-08-07

Similar Documents

Publication Publication Date Title
CN103971688B (zh) 一种语音数据采集服务系统及方法
JP2646385B2 (ja) 通話転送制御方法及び装置
US7366945B2 (en) Method of setting backup of home location register
JPH05506977A (ja) 電話網の応用を支えるためのデジタルコンピュータプラットホーム
CN101184128B (zh) 计算机电话集成设备与坐席接口实现多媒体信息传送方法
EP1632058A1 (en) System for defining an alternate channel routing mechanism in a messaging middleware environment
CN102316276A (zh) 一种信号切换矩阵系统
WO2020078381A1 (zh) 数据汇聚方法、装置、设备、存储介质和系统
CN103916526B (zh) 联系人信息处理方法、装置及移动终端
CN101458637A (zh) 一种实现进程通信的方法、装置及系统
CN110502572A (zh) 一种数据同步的方法及服务器
CN101800712A (zh) 网关设备、信息通信方法、信息通信程序和信息通信系统
CN102594918A (zh) 一种终端通讯录实现的方法、终端及系统
CN106027311A (zh) 基于sdn的灾备系统及其数据灾备方法
CN108600294A (zh) 一种云终端屏幕共享系统及方法
CN101436993A (zh) 一种抓包方法、设备及系统
CN101742701A (zh) 处理at命令的装置、方法及系统
CN101958919A (zh) 一种基于非ip数据隧道的多文件并行传输方法及系统
CN103944892B (zh) 一种动态虚拟局域网注册方法和设备
US7609683B2 (en) Communication system, connection management server apparatus, and recording medium on which program is recorded
CN101997635B (zh) 一种变换业务单板端口速率的方法和系统
CN104735097A (zh) 信息的收集方法和系统
CN104053132A (zh) 一种信息号码识别的方法及装置
JPS60229460A (ja) メ−ルボツクス通信方式
CN104796482A (zh) 一种智能融合通信系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20200821

Address after: 518057 Nanshan District science and technology zone, Guangdong, Zhejiang Province, science and technology in the Tencent Building on the 1st floor of the 35 layer

Co-patentee after: TENCENT CLOUD COMPUTING (BEIJING) Co.,Ltd.

Patentee after: TENCENT TECHNOLOGY (SHENZHEN) Co.,Ltd.

Address before: Shenzhen Futian District City, Guangdong province 518044 Zhenxing Road, SEG Science Park 2 East Room 403

Patentee before: TENCENT TECHNOLOGY (SHENZHEN) Co.,Ltd.

TR01 Transfer of patent right