CN113971956A - 一种信息处理方法、装置、电子设备和可读存储介质 - Google Patents
一种信息处理方法、装置、电子设备和可读存储介质 Download PDFInfo
- Publication number
- CN113971956A CN113971956A CN202111232923.6A CN202111232923A CN113971956A CN 113971956 A CN113971956 A CN 113971956A CN 202111232923 A CN202111232923 A CN 202111232923A CN 113971956 A CN113971956 A CN 113971956A
- Authority
- CN
- China
- Prior art keywords
- data
- audio data
- terminal
- voiceprint
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 25
- 238000003672 processing method Methods 0.000 title claims abstract description 15
- 238000000034 method Methods 0.000 claims description 35
- 238000004891 communication Methods 0.000 claims description 19
- 238000004458 analytical method Methods 0.000 claims description 7
- 238000006243 chemical reaction Methods 0.000 claims description 4
- 230000009286 beneficial effect Effects 0.000 abstract description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000003993 interaction Effects 0.000 description 3
- 238000004590 computer program Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000033764 rhythmic process Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/02—Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/56—Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities
- H04M3/568—Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities audio processing specific to telephonic conferencing, e.g. spatial distribution, mixing of participants
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明提供一种信息处理方法、装置、电子设备和可读存储介质。信息处理方法包括获取音频数据,并解析所述音频数据的声纹信息;接收第二终端发送的数据请求,其中,所述数据请求用于标识目标对象;将所述音频数据中的目标音频数据发送至所述第二终端,其中,所述目标音频数据的声纹信息与所述目标对象的声纹特征相匹配。这样,使用终端设备的用户可以仅接收其标识的目标对象的音频数据,从而不需要接收全部音频数据,而只接收用户关注的对象的音频数据,有助于区分会议内容,减少其他信息的干扰,更直接的获取用户关注的内容。
Description
技术领域
本发明涉及通信技术领域,尤其涉及一种信息处理方法、装置、电子设备和可读存储介质。
背景技术
随着通信技术的发展及智能设备的普及,各种智能设备被应用于办公中,而位于不同地区的工作人员基于智能设备参与远程会议也提高了工作的便利程度。然而由于实际情况限制,位于会议现场之外的人员可能不需要接收会议中的全部内容,而仅需要关注其中的部分内容,然而现有的远程会议方式难以区分会议内容。
发明内容
本发明实施例提供一种信息处理方法、装置、电子设备和可读存储介质,以解决现有的远程会议方式难以区分会议内容的问题。
第一方面,本发明实施例提供了一种信息处理方法,包括以下步骤:
获取音频数据,并解析所述音频数据的声纹信息;
接收第二终端发送的数据请求,其中,所述数据请求用于标识目标对象;
将所述音频数据中的目标音频数据发送至所述第二终端,其中,所述目标音频数据的声纹信息与所述目标对象的声纹特征相匹配。
在一些实施例中,所述接收第二终端发送的数据请求之前,所述方法还包括:
将所述多个对象的对象信息发送至所述第二终端,以供所述第二终端根据所述对象信息确定所述多个对象中的目标对象。
在一些实施例中,所述将所述多个对象的对象信息发送至所述第二终端之前,所述方法还包括:
接收第一终端发送的会议请求,所述会议请求携带有多个对象的对象信息;
在一些实施例中,所述将所述音频数据中的目标音频数据发送至所述第二终端之前,所述方法还包括:
对比所述音频数据的声纹信息和预设声纹数据,以确定所述音频数据对应的对象信息,其中,所述预设声纹数据包括所述目标对象的声纹特征;
在所述音频数据的声纹信息与所述目标对象的声纹特征匹配的情况下,将所述音频数据作为目标音频数据。
在一些实施例中,所述预设声纹数据还包括所述多个对象的对象信息与所述多个对象的声纹特征之间的对应关系;
所述对比所述音频数据的声纹信息和预设声纹数据之后,所述方法还包括:
在所述音频数据对应的对象信息与所述目标对象的对象信息不匹配的情况下,将所述音频数据转换为文本数据;
根据所述预设声纹数据确定所述文本数据对应的对象,并将所述文本数据及所述文本数据与所述对象的对应关系发送至所述第二终端。
在一些实施例中,所述接收第二终端发送的数据请求之前,所述方法还包括:
获取所述多个对象的语音数据;
解析所述语音数据获得各所述对象的声纹特征;
将所述多个对象的对象信息与声纹特征的对应关系保存为所述预设声纹数据。
在一些实施例中,所述方法应用于通信系统中的服务器,所述通信系统包括第一终端、所述服务器和第二终端,所述第一终端和所述第二终端均与所述服务器通信连接,所述方法包括以下步骤:
接收所述第一终端发送的多个对象的语音数据;
解析所述语音数据获得所述多个对象的声纹特征;
将所述多个对象的对象信息与声纹特征的对应关系保存为预设声纹数据;
向所述第二终端发送所述多个对象的对象信息;
接收所述第二终端发送的数据请求,所述数据请求标识了根据所述对象信息确定的目标对象;
接收所述第一终端发送的音频数据;
将所述音频数据的声纹信息与所述预设声纹数据对比以确定目标音频数据;
向所述第二终端发送所述目标音频数据。
第二方面,本发明实施例提供了一种信息处理装置,包括:
音频数据获取模块,用于获取音频数据,并解析所述音频数据的声纹信息;
数据请求接收模块,用于接收第二终端发送的数据请求,其中,所述数据请求用于标识目标对象;
发送模块,用于将所述音频数据中的目标音频数据发送至所述第二终端,其中,所述目标音频数据的声纹信息与所述目标对象的声纹特征相匹配。
第三方面,本发明实施例提供了一种信息处理装置,应用于通信系统,所述通信系统包括第一终端、服务器和第二终端,所述第一终端和所述第二终端均与所述服务器通信连接:
所述第一终端包括:语音数据发送模块,用于向所述服务器发送所获取的多个对象的语音数据;
所述服务器包括:解析模块,用于解析所述语音数据获得所述多个对象的声纹特征;
保存模块,用于将所述多个对象的对象信息与声纹特征的对应关系保存为预设声纹数据;
对象信息发送模块,用于向所述第二终端发送所述多个对象的对象信息;
所述第二终端还包括:标识模块,用于向所述服务器发送的数据请求,所述数据请求标识了根据所述对象信息确定的目标对象;
所述第一终端包括:音频数据发送模块,用于向服务器发送获取的音频数据;
所述服务器包括:目标音频数据确定模块,用于将所述音频数据的声纹信息与所述预设声纹数据对比以确定目标音频数据;
发送模块,用于向所述第二终端发送所述目标音频数据。
在一些实施例中,所述目标音频数据确定模块包括:
对比子模块,用于对比所述音频数据的声纹信息和预设声纹数据,以确定所述音频数据对应的对象信息,其中,所述预设声纹数据包括所述目标对象的声纹特征;
确定子模块,用于在所述音频数据的声纹信息与所述目标对象的声纹特征匹配的情况下,将所述音频数据作为目标音频数据。
在一些实施例中,所述服务器还包括:
文本转换模块,用于在所述音频数据对应的对象信息与所述目标对象的对象信息不匹配的情况下,将所述音频数据转换为文本数据;
匹配发送模块,用于根据所述预设声纹数据确定所述文本数据对应的对象,并将所述文本数据及所述文本数据与所述对象的对应关系发送至所述第二终端。
第四方面,本发明实施例还提供一种电子设备,包括:收发机、存储器、处理器及存储在所述存储器上并可在所述处理器上运行的程序;所述处理器,用于读取存储器中的程序实现如前述第一方面所述方法中的步骤。
第五方面,本发明实施例还提供一种可读存储介质,用于存储程序,所述程序被处理器执行时实现如前述第一方面所述方法中的步骤。
本发明实施例通过获取音频数据,并解析所述音频数据的声纹信息;接收第二终端发送的数据请求,其中,所述数据请求用于标识目标对象;将所述音频数据中的目标音频数据发送至所述第二终端,其中,所述目标音频数据的声纹信息与所述目标对象的声纹特征相匹配。这样,使用终端设备的用户可以仅接收其标识的目标对象的音频数据,从而不需要接收全部音频数据,而只接收用户关注的对象的音频数据,有助于区分会议内容,减少其他信息的干扰,更直接的获取用户关注的内容。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获取其他的附图。
图1是本发明一实施例中通信系统的结构示意图;
图2是本发明一实施例中信息处理方法的流程示意图;
图3是本发明一实施例中信息处理方法的又一流程示意图;
图4是本发明一实施例中信息处理方法的数据交互示意图;
图5是本发明一实施例中信息处理方装置的结构图;
图6是本发明一实施例中电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。不冲突的情况下,下述实施例及实施例中的特征可以相互组合。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获取的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供了一种信息处理方法。
如图1所示,本实施例的信息处理方法可以应用于通信系统,通信系统包括第一终端101、服务器102和第二终端103,第一终端101和第二终端103均与服务器102通信连接。
第一终端101指的是位于会议室中的会议设备,示例性的,可以是会议白板、计算机、智能手机、智能显示器等设备,该第一终端101用于采集会议现场的音频数据,在一些实施例中,该第一终端101还能够用于分享现场的图像、分享所展示的文档等。服务器102用于提供信息交互的支持及信息传输等。
第二终端103为远程参与会议的用户所使用的终端设备,示例性的,可以是远程会议室中的会议白板、计算机、智能显示器,也可以是用户的智能手机等终端设备,示例性的,用户可以利用自己的智能手机接入远程会议。
一般来说,第一终端101的数量可以是一个,也可以是多个,例如,在存在多个会议室同时进行会议时,可以设置多个第一终端101;第二终端103的数量可以是多个,例如,多个不同的用户均可以使用自己的智能手机等第二终端103接入会议。
应当理解的是,本实施例的技术方案不局限于远程会议,该方案还可以应用于其他需要进行信息交互的场景,此处不做进一步限定。
如图2所示,在一个实施例中,该方法包括以下步骤:
步骤201:获取音频数据,并解析所述音频数据的声纹信息。
本实施例以该方法应用于远程会议做示例性说明。
音频数据指的是会议现场的音频数据,示例性的,可以是上述第一终端101通过麦克风等音频采集数据采集到的会议现场的音频数据。在接收到该音频数据之后,解析该音频数据,获取其声纹信息。声纹信息具体可以包括频谱、倒频谱、共振峰、基音、反射系数、韵律、节奏、速度、语调、音量等声音特征中的一项或多项。
步骤202:接收第二终端发送的数据请求,其中,所述数据请求用于标识目标对象。
数据请求指的是第二终端接入远程会议的请求,基于该数据请求,允许第二终端接入远程会议,以实时获取会议内容。该数据请求还用于标识目标对象。需要理解的是,参与会议以及在会议上发言的对象可能有许多,如果全程收听该会议,可能由于注意力不集中或外接因素干扰等原因导致用户无法关注到希望收听到的目标对象的发言。
本实施例中,对于第二对象的标识是通过第二终端发送的。
示例性的,在一个实施例中,在上述步骤202之前,该方法还包括:将所述多个对象的对象信息发送至所述第二终端,以供所述第二终端根据所述对象信息确定所述多个对象中的目标对象。
本实施例中,在第二终端加入会议时,可以由第二终端在多个对象中标识选择目标对象,多个对象的信息是由服务器根据参会的对象信息发送至第二终端的。
相应的,在步骤201之前,该方法还包括:
接收第一终端发送的会议请求,所述会议请求携带有多个对象的对象信息;
第二终端可以通过不同的方式加入会议,示例性的,可以通过特定的账户密码登录会议系统以加入远程会议,也可以通过服务器提供的会议链接或会议入口加入远程会议等。
在会议开始之前,首先通过第一终端将参与会议的对象的对象信息发送至服务器,然后由服务器将该对象信息发送至第二终端。接下来,第二终端根据接收到的对象信息标识目标对象,并向服务器返回包括目标对象的数据请求。这样,就实现了对于参会对象中的目标对象的标识。
可以理解,目标对象可以为一个,也可以为多个,此处不对其数量做进一步限定。
步骤203:将所述音频数据中的目标音频数据发送至所述第二终端,其中,所述目标音频数据的声纹信息与所述目标对象的声纹特征相匹配。
在确定了目标对象之后,确定音频数据中的目标音频数据,这里,目标音频数据的声纹信息与目标对象的声纹特征相匹配,这样,第二终端接收到的目标音频数据可以理解为目标对象的发言。
这样,使用终端设备的用户可以仅接收其标识的目标对象的音频数据,从而不需要接收全部音频数据,而只接收用户关注的对象的音频数据,有助于区分会议内容,减少其他信息的干扰,更直接的获取用户关注的内容。
在其中一些实施例中,对于目标音频数据的确定可以通过以下步骤实现,具体的,在步骤203之前,该方法还包括:
对比所述音频数据的声纹信息和预设声纹数据,以确定所述音频数据对应的对象信息,其中,所述预设声纹数据包括所述目标对象的声纹特征;
在所述音频数据的声纹信息与所述目标对象的声纹特征匹配的情况下,将所述音频数据作为目标音频数据。
本实施例中,对音频数据的声纹信息和预设声纹数据进行对比。
音频数据的声纹信息可以通过解析来自第一终端的音频数据实现,预设声纹数据包括各对象的身份信息与声纹特征的对应关系。
在一些实施例中,可以通过以下步骤获得预设声纹数据:
获取所述多个对象的语音数据;
解析所述语音数据获得各所述对象的声纹特征;
将所述多个对象的对象信息与声纹特征的对应关系保存为所述预设声纹数据。
实施时,首先采集每一对象的语音数据,然后解析所获得的语音数据获得每一对象的声纹特征,将该声纹特征和每一对象的身份信息绑定并保存即可形成预设声纹数据。
可以理解,语音数据可以在每次会议之前采集,也可以在生成预设声纹数据后保存于服务器中并应用于后续的远程会议。当增加了新的参会对象时,可以参考上述过程采集其语音数据,并解析获得声纹特征,最后,将声纹特征与身份信息的对应结果新增至已经保存的预设声纹数据中,这样,能够实现动态更新每一次会议的参会人员。
可以理解,所生成的预设声纹数据可以保存在服务器中,也可以保存在第一终端中,并在需要进行会议时由第一终端上传至服务器,以节约服务器中的空间。
会议进行过程中,第一终端通过麦克风等音频采集设备采集实施音频信息流,或称作上述音频数据,采集到的音频数据实时传输至服务器,然后在服务器中提取音频数据的声纹信息,并将解析获得的声纹信息与预设声纹数据对比,从而确定发言的对象。
这样,当音频数据对应的对象信息与目标对象的对象信息匹配的情况下,说明当前发言的对象为所标识的目标对象,同时,将该音频数据作为目标音频数据,并发送至第二终端。
在一些实施例中,预设声纹数据包括目标对象的声纹特征,这样,通过将音频数据的声纹信息与预设声纹数据相对比,能够确定音频数据是否为目标对象的发言。
在一些实施例中,所述对比所述音频数据的声纹信息和预设声纹数据之后,所述方法还包括:
在所述音频数据对应的对象信息与所述目标对象的对象信息不匹配的情况下,将所述音频数据转换为文本数据;
根据所述预设声纹数据确定所述文本数据对应的对象,并将所述文本数据及所述文本数据与所述对象的对应关系发送至所述第二终端。
可以理解,虽然用户主要关注的是目标对象的发言,但是,其他对象的发言也可能包含一些重要信息,本实施例中,为了避免遗漏会议中的信息,将目标对象之外的对象的发言信息转换为文本数据,基于该文本数据,用户可以同时了解到其他对象的发言,以全面的了解会议内容。
,在一些实施例中,预设声纹数据还包括所述多个对象的对象信息与所述多个对象的声纹特征之间的对应关系。这样,在将预设声纹数据与音频数据的声纹信息对比时,能够确定音频数据包括的各发言对象的身份信息。
在一些实施例中,所发送的文本数据还包含与发言对象之间的对应关系,该对应关系可以基于上述预设声纹数据获得,从而能够清楚的生成会议记录的文本,以降低遗失会议内容的可能性。
在一些实施例中,还可能出现一些未记录在预设声纹数据中的对象,例如,可能出现临时参加现场会议的人员,此时,可以以新对象的方式记录这些声纹特征未保存在预设声纹数据中的对象,进一步的,用户可以在第一终端、服务器或第二终端添加这些新对象的备注,以确定发言对象,提高文本数据的条理性,也便于实时更新参会对象。
在一些实施例中,在向第二终端发送目标音频数据时,也可以同时将目标音频数据转换为文本数据,并同时向第二终端发送该目标音频数据,这样,同时结合文本数据和音频数据,能够更加全面的了解目标对象在会议上的发言内容。
如图3所示,本实施例的技术方案可以概括由以下步骤构成。
首先,进行声纹信息的采集,并生成预设声纹数据。
服务器102接收第一终端102发送的多个对象的语音数据;
服务器102解析语音数据获得多个对象的声纹特征;
服务器102将多个对象的对象信息与声纹特征的对应关系保存为预设声纹数据。
可以理解,预设声纹数据可以在每次会议前采集,也可以生成后作为数据库保存供后续会议使用。接下来,确定目标对象。
服务器102向第二终端103发送多个对象的对象信息;
服务器102接收第二终端103发送的数据请求,数据请求标识了根据对象信息确定的目标对象。
需要注意的是,第一终端101可以确定了参会对象后发起会议,然后将参会名单发送至服务器102,这里,参会名单实际上包括了参会对象的身份信息,再由服务器102转发至第二终端103的。
如图4所示,在进行会议时,第一终端101实时采集音频数据发送至服务器102,并在服务器102中,对音频数据和预设声纹数据对比分析。第二终端103设置接收目标对象的音频信息,服务器102筛选后,返回该目标对象对应的目标音频信息。
具体的,服务器102接收第一终端101发送的音频数据;
服务器102将音频数据的声纹信息与预设声纹数据对比以确定目标音频数据;
服务器102向第二终端103发送目标音频数据。
可以理解,在服务器102中,可以根据目标对象从预设声纹数据中索引目标对象的声纹特征,然后与音频数据的声纹信息进行对比以确定身份;实施时,还可以将音频数据的声纹信息与预设声纹数据一一进行对比,以确定音频数据与每一对象对应的部分。
最后,确定了目标音频数据之后,发送至第二终端103,以供通过第二终端103播放目标对象的发言。
本发明实施例还提供一种信息处理装置。
在一些实施例中,如图5所示,该信息处理装置500包括:
音频数据获取模块501,用于获取音频数据,并解析所述音频数据的声纹信息;
数据请求接收模块502,用于接收第二终端发送的数据请求,其中,所述数据请求用于标识目标对象;
发送模块503,用于将所述音频数据中的目标音频数据发送至所述第二终端,其中,所述目标音频数据的声纹信息与所述目标对象的声纹特征相匹配。
在一些实施例中,还包括:对象信息发送模块,用于将所述多个对象的对象信息发送至所述第二终端,以供所述第二终端根据所述对象信息确定所述多个对象中的目标对象。
在一些实施例中,还包括:会议请求接收模块,用于接收第一终端发送的会议请求,所述会议请求携带有多个对象的对象信息。
在一些实施例中,还包括:对比模块,用于对比所述音频数据的声纹信息和预设声纹数据,以确定所述音频数据对应的对象信息,其中,所述预设声纹数据包括所述目标对象的声纹特征;
目标音频数据确定模块,用于在所述音频数据的声纹信息与所述目标对象的声纹特征匹配的情况下,将所述音频数据作为目标音频数据。
在一些实施例中,所述预设声纹数据还包括所述多个对象的对象信息与所述多个对象的声纹特征之间的对应关系;
文本数据转换模块,用于在所述音频数据对应的对象信息与所述目标对象的对象信息不匹配的情况下,将所述音频数据转换为文本数据;
文本数据发送模块,用于根据所述预设声纹数据确定所述文本数据对应的对象,并将所述文本数据及所述文本数据与所述对象的对应关系发送至所述第二终端。
在一些实施例中,还包括:
语音数据获取模块,用于获取所述多个对象的语音数据;
声纹特征解析模块,用于解析所述语音数据获得各所述对象的声纹特征;
保存模块,用于将所述多个对象的对象信息与声纹特征的对应关系保存为所述预设声纹数据。
在一些实施例中,应用于通信系统中的服务器,所述通信系统包括第一终端、所述服务器和第二终端,所述第一终端和所述第二终端均与所述服务器通信连接,所述服务器具体包括:
语音数据获取模块,用于接收所述第一终端发送的多个对象的语音数据;
声纹特征解析模块,用于解析所述语音数据获得所述多个对象的声纹特征;
保存模块,用于将所述多个对象的对象信息与声纹特征的对应关系保存为预设声纹数据;
对象信息发送模块,用于向所述第二终端发送所述多个对象的对象信息;
数据请求接收模块502,用于接收所述第二终端发送的数据请求,所述数据请求标识了根据所述对象信息确定的目标对象;
音频数据获取模块501,用于接收所述第一终端发送的音频数据;
对比模块,用于将所述音频数据的声纹信息与所述预设声纹数据对比以确定目标音频数据;
发送模块503,用于向所述第二终端发送所述目标音频数据。
本发明实施例还提供一种信息处理装置,应用于通信系统,所述通信系统包括第一终端、服务器和第二终端,所述第一终端和所述第二终端均与所述服务器通信连接:
所述第一终端包括:
语音数据发送模块,用于向所述服务器发送所获取的多个对象的语音数据;
所述服务器包括:
解析模块,用于解析所述语音数据获得所述多个对象的声纹特征;
保存模块,用于将所述多个对象的对象信息与声纹特征的对应关系保存为预设声纹数据;
对象信息发送模块,用于向所述第二终端发送所述多个对象的对象信息;
所述第二终端还包括:
标识模块,用于向所述服务器发送的数据请求,所述数据请求标识了根据所述对象信息确定的目标对象;
所述第一终端包括:
音频数据发送模块,用于向服务器发送获取的音频数据;
所述服务器包括:
目标音频数据确定模块,用于将所述音频数据的声纹信息与所述预设声纹数据对比以确定目标音频数据;
发送模块,用于向所述第二终端发送所述目标音频数据。
在一些实施例中,所述目标音频数据确定模块包括:
对比子模块,用于对比所述音频数据的声纹信息和预设声纹数据,以确定所述音频数据对应的对象信息,其中,所述预设声纹数据包括所述目标对象的声纹特征;
确定子模块,用于在所述音频数据的声纹信息与所述目标对象的声纹特征匹配的情况下,将所述音频数据作为目标音频数据。
在一些实施例中,所述服务器还包括:
文本转换模块,用于在所述音频数据对应的对象信息与所述目标对象的对象信息不匹配的情况下,将所述音频数据转换为文本数据;
匹配发送模块,用于根据所述预设声纹数据确定所述文本数据对应的对象,并将所述文本数据及所述文本数据与所述对象的对应关系发送至所述第二终端。
本发明实施例还提供一种电子设备。请参见图6,电子设备可以包括处理器601、存储器602及存储在存储器602上并可在处理器601上运行的程序6021。
在电子设备为终端的情况下,程序6021被处理器601执行时可实现图1对应的方法实施例中的任意步骤及达到相同的有益效果,此处不再赘述。
在电子设备为网络侧设备的情况下,程序6021被处理器601执行时可实现图6对应的方法实施例中的任意步骤及达到相同的有益效果,此处不再赘述。
本领域普通技术人员可以理解实现上述实施例方法的全部或者部分步骤是可以通过程序指令相关的硬件来完成,所述的程序可以存储于一可读取介质中。
本发明实施例还提供一种可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时可实现上述图1对应的方法实施例中的任意步骤,且能达到相同的技术效果,为避免重复,这里不再赘述。
所述的存储介质,如只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等。
以上,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
Claims (13)
1.一种信息处理方法,其特征在于,包括以下步骤:
获取音频数据,并解析所述音频数据的声纹信息;
接收第二终端发送的数据请求,其中,所述数据请求用于标识目标对象;
将所述音频数据中的目标音频数据发送至所述第二终端,其中,所述目标音频数据的声纹信息与所述目标对象的声纹特征相匹配。
2.根据权利要求1所述的方法,其特征在于,所述接收第二终端发送的数据请求之前,所述方法还包括:
将所述多个对象的对象信息发送至所述第二终端,以供所述第二终端根据所述对象信息确定所述多个对象中的目标对象。
3.根据权利要求2所述的方法,其特征在于,所述将所述多个对象的对象信息发送至所述第二终端之前,所述方法还包括:
接收第一终端发送的会议请求,所述会议请求携带有多个对象的对象信息。
4.根据权利要求2所述的方法,其特征在于,所述将所述音频数据中的目标音频数据发送至所述第二终端之前,所述方法还包括:
对比所述音频数据的声纹信息和预设声纹数据,以确定所述音频数据对应的对象信息,其中,所述预设声纹数据包括所述目标对象的声纹特征;
在所述音频数据的声纹信息与所述目标对象的声纹特征匹配的情况下,将所述音频数据作为目标音频数据。
5.根据权利要求4所述的方法,其特征在于,所述预设声纹数据还包括所述多个对象的对象信息与所述多个对象的声纹特征之间的对应关系;
所述对比所述音频数据的声纹信息和预设声纹数据之后,所述方法还包括:
在所述音频数据对应的对象信息与所述目标对象的对象信息不匹配的情况下,将所述音频数据转换为文本数据;
根据所述预设声纹数据确定所述文本数据对应的对象,并将所述文本数据及所述文本数据与所述对象的对应关系发送至所述第二终端。
6.根据权利要求4所述的方法,其特征在于,所述接收第二终端发送的数据请求之前,所述方法还包括:
获取所述多个对象的语音数据;
解析所述语音数据获得各所述对象的声纹特征;
将所述多个对象的对象信息与声纹特征的对应关系保存为所述预设声纹数据。
7.根据权利要求1至6中任一项所述的方法,其特征在于,所述方法应用于通信系统中的服务器,所述通信系统包括第一终端、所述服务器和第二终端,所述第一终端和所述第二终端均与所述服务器通信连接,所述方法包括以下步骤:
接收所述第一终端发送的多个对象的语音数据;
解析所述语音数据获得所述多个对象的声纹特征;
将所述多个对象的对象信息与声纹特征的对应关系保存为预设声纹数据;
向所述第二终端发送所述多个对象的对象信息;
接收所述第二终端发送的数据请求,所述数据请求标识了根据所述对象信息确定的目标对象;
接收所述第一终端发送的音频数据;
将所述音频数据的声纹信息与所述预设声纹数据对比以确定目标音频数据;
向所述第二终端发送所述目标音频数据。
8.一种信息处理装置,其特征在于,包括:
音频数据获取模块,用于获取音频数据,并解析所述音频数据的声纹信息;
数据请求接收模块,用于接收第二终端发送的数据请求,其中,所述数据请求用于标识目标对象;
发送模块,用于将所述音频数据中的目标音频数据发送至所述第二终端,其中,所述目标音频数据的声纹信息与所述目标对象的声纹特征相匹配。
9.一种信息处理装置,其特征在于,应用于通信系统,所述通信系统包括第一终端、服务器和第二终端,所述第一终端和所述第二终端均与所述服务器通信连接:
所述第一终端包括:语音数据发送模块,用于向所述服务器发送所获取的多个对象的语音数据;
所述服务器包括:解析模块,用于解析所述语音数据获得所述多个对象的声纹特征;
保存模块,用于将所述多个对象的对象信息与声纹特征的对应关系保存为预设声纹数据;
对象信息发送模块,用于向所述第二终端发送所述多个对象的对象信息;
所述第二终端还包括:标识模块,用于向所述服务器发送的数据请求,所述数据请求标识了根据所述对象信息确定的目标对象;
所述第一终端包括:音频数据发送模块,用于向服务器发送获取的音频数据;
所述服务器包括:目标音频数据确定模块,用于将所述音频数据的声纹信息与所述预设声纹数据对比以确定目标音频数据;
发送模块,用于向所述第二终端发送所述目标音频数据。
10.根据权利要求9所述的装置,其特征在于,所述目标音频数据确定模块包括:
对比子模块,用于对比所述音频数据的声纹信息和预设声纹数据,以确定所述音频数据对应的对象信息,其中,所述预设声纹数据包括所述目标对象的声纹特征;
确定子模块,用于在所述音频数据的声纹信息与所述目标对象的声纹特征匹配的情况下,将所述音频数据作为目标音频数据。
11.根据权利要求10所述的装置,其特征在于,所述服务器还包括:
文本转换模块,用于在所述音频数据对应的对象信息与所述目标对象的对象信息不匹配的情况下,将所述音频数据转换为文本数据;
匹配发送模块,用于根据所述预设声纹数据确定所述文本数据对应的对象,并将所述文本数据及所述文本数据与所述对象的对应关系发送至所述第二终端。
12.一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的程序;其特征在于,所述处理器,用于读取存储器中的程序实现如权利要求1至7中任一项所述的信息处理方法的步骤。
13.一种可读存储介质,用于存储程序,其特征在于,所述程序被处理器执行时实现如权利要求1至7中任一项所述的信息处理方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111232923.6A CN113971956A (zh) | 2021-10-22 | 2021-10-22 | 一种信息处理方法、装置、电子设备和可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111232923.6A CN113971956A (zh) | 2021-10-22 | 2021-10-22 | 一种信息处理方法、装置、电子设备和可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113971956A true CN113971956A (zh) | 2022-01-25 |
Family
ID=79587987
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111232923.6A Pending CN113971956A (zh) | 2021-10-22 | 2021-10-22 | 一种信息处理方法、装置、电子设备和可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113971956A (zh) |
-
2021
- 2021-10-22 CN CN202111232923.6A patent/CN113971956A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107911646B (zh) | 一种会议分享、生成会议记录的方法及装置 | |
US8868657B2 (en) | Method and system for generating a collaboration timeline illustrating application artifacts in context | |
CN110049270A (zh) | 多人会议语音转写方法、装置、系统、设备及存储介质 | |
CN111739553B (zh) | 会议声音采集、会议记录以及会议记录呈现方法和装置 | |
US20100048235A1 (en) | Method and Device for Data Capture for Push Over Cellular | |
US20040064322A1 (en) | Automatic consolidation of voice enabled multi-user meeting minutes | |
US8280083B2 (en) | Positioning of speakers in a 3D audio conference | |
CN101689365A (zh) | 控制视频会议的方法 | |
CN109560941A (zh) | 会议记录方法、装置、智能终端及存储介质 | |
CN109417583A (zh) | 一种将音频信号实时转录为文本的系统和方法 | |
CN112102846A (zh) | 音频处理方法、装置、电子设备以及存储介质 | |
CN111710344A (zh) | 一种信号处理方法、装置、设备及计算机可读存储介质 | |
CN111199751B (zh) | 一种麦克风的屏蔽方法、装置和电子设备 | |
CN110460798B (zh) | 视频访谈服务处理方法、装置、终端与存储介质 | |
CN111626061A (zh) | 会议记录生成方法、装置、设备及可读存储介质 | |
CN110556114B (zh) | 基于注意力机制的通话人识别方法及装置 | |
CN110265038B (zh) | 一种处理方法及电子设备 | |
CN113971956A (zh) | 一种信息处理方法、装置、电子设备和可读存储介质 | |
CN112565668B (zh) | 一种网络会议共享声音的方法 | |
CN114724569A (zh) | 客服语音优化方法、装置、电子设备 | |
CN112634879B (zh) | 语音会议管理方法、装置、设备及介质 | |
CN115294987A (zh) | 一种会议记录生成方法、装置、设备及存储介质 | |
CN109559760B (zh) | 一种基于语音信息的情感分析方法及系统 | |
CN114257778A (zh) | 一种远程会议系统及多麦克风语音识别播放方法 | |
CN116472705A (zh) | 一种会议内容显示的方法、会议系统及会议设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |