CN110519070A

CN110519070A - 用于对聊天室内语音进行处理的方法、装置和服务器

Info

Publication number: CN110519070A
Application number: CN201810487553.2A
Authority: CN
Inventors: 张志亮
Original assignee: Hong Kong LiveMe Corp ltd
Current assignee: Zhuomi Private Ltd
Priority date: 2018-05-21
Filing date: 2018-05-21
Publication date: 2019-11-29

Abstract

本发明公开了一种用于对聊天室内语音进行处理的方法、装置、服务器和存储介质。其中方法包括：确定目标聊天室内讲话者的语言类型；确定目标聊天室内的非讲话者所属的地域信息，根据地域信息确定非讲话者的语言类型；判断讲话者的语言类型与非讲话者的语言类型是否一致；若否，则基于语音翻译技术，将讲话者的讲话语音翻译成与非讲话者的语言类型对应的语音；将与非讲话者的语言类型对应的语音发送给非讲话者的终端设备，以使终端设备将与非讲话者的语言类型对应的语音提供给非讲话者。该方法可以使得非讲话者能够听懂聊天室内讲话者的讲话内容，提升了用户的使用体验，进一步提高了用户与产品之间的粘性。

Description

用于对聊天室内语音进行处理的方法、装置和服务器

技术领域

本发明涉及语音处理技术领域，尤其涉及一种用于对聊天室内语音进行处理的方法、装置、服务器和计算机可读存储介质。

背景技术

随着互联网技术的快速发展，网络聊天室已经成为人们业余生活的消遣工具。例如，以网络直播平台为例，主播在网络直播平台上通过语音的方式向观众展现自己的才艺(如唱歌、聊天等)，粉丝观众可通过登录网络直播平台并进入该主播的直播间观看该主播直播的内容。

相关技术中，网络直播平台的服务端通常是将获得的主播端发送的语音信息直接转发给粉丝观众客户端以播放给观众。但是，这种主播端用什么语言表演，粉丝观众客户端就只能听到什么语言，会使得用户的使用体验变差，降低用户与产品之间的粘性。

发明内容

本发明的目的旨在至少在一定程度上解决上述的技术问题之一。

为此，本发明的第一个目的在于提出一种用于对聊天室内语音进行处理的方法。该方法可以提升用户的使用体验，并提高用户与产品之间的粘性。

本发明的第二个目的在于提出一种用于对聊天室内语音进行处理的装置。

本发明的第三个目的在于提出一种服务器。

本发明的第四个目的在于提出一种计算机可读存储介质。

为达到上述目的，本发明第一方面实施例提出的用于对聊天室内语音进行处理的方法，包括：确定目标聊天室内讲话者的语言类型；确定所述目标聊天室内的非讲话者所属的地域信息，根据所述地域信息确定所述非讲话者的语言类型；判断所述讲话者的语言类型与所述非讲话者的语言类型是否一致；若否，则基于语音翻译技术，将所述讲话者的讲话语音翻译成与所述非讲话者的语言类型对应的语音；将所述与所述非讲话者的语言类型对应的语音发送给所述非讲话者的终端设备，以使所述终端设备将所述与所述非讲话者的语言类型对应的语音提供给所述非讲话者。

根据本发明实施例的用于对聊天室内语音进行处理的方法，可先确定目标聊天室内讲话者的语言类型，并确定目标聊天室内的非讲话者所属的地域信息，根据地域信息确定非讲话者的语言类型，之后，判断讲话者的语言类型与非讲话者的语言类型是否一致，若否，则基于语音翻译技术，将讲话者的讲话语音翻译成与非讲话者的语言类型对应的语音，并将与非讲话者的语言类型对应的语音发送给非讲话者的终端设备，以使终端设备将与非讲话者的语言类型对应的语音提供给非讲话者。即根据聊天室内非讲话者所在的地域位置，将该聊天室内讲话者所讲的语言转换为该非讲话者所在地域位置的语言，使得非讲话者能够听懂聊天室内讲话者的讲话内容，提升了用户的使用体验，进一步提高了用户与产品之间的粘性。

根据本发明的一个实施例，所述确定目标聊天室内讲话者的语言类型，包括：获取所述目标聊天室内讲话者的讲话语音；根据所述讲话语音确定对应的语言类型。

根据本发明的一个实施例，所述目标聊天室为直播间，所述讲话者用于指示所述直播间的主播，所述非讲话者用于指示进入所述直播间并观看直播的观众；其中，所述获取所述目标聊天室内讲话者的讲话语音，包括：接收所述主播的终端设备发送的所述主播在所述直播间录入的语音；或者，接收所述非讲话者的终端设备发送的进入所述直播间并观看所述直播时播放的语音。

根据本发明的一个实施例，确定所述目标聊天室内的非讲话者所属的地域信息，包括：获取所述非讲话者的用户信息；根据所述用户信息确定所述非讲话者所属的地域信息；其中，所述用户信息包括手机号码、国籍信息、身份证信息和护照信息中的一种或多种。

根据本发明的一个实施例，确定所述目标聊天室内的非讲话者所属的地域信息，包括：基于定位技术，获取所述非讲话者的位置信息；根据所述位置信息确定所述非讲话者所属的地域信息；其中，所述地域信息为国家信息或行政区域信息。

为达到上述目的，本发明第二方面实施例提出的用于对聊天室内语音进行处理的装置，包括：第一确定模块，用于确定目标聊天室内讲话者的语言类型；第二确定模块，用于确定所述目标聊天室内的非讲话者所属的地域信息，根据所述地域信息确定所述非讲话者的语言类型；判断模块，用于判断所述讲话者的语言类型与所述非讲话者的语言类型是否一致；翻译模块，用于若否，则基于语音翻译技术，将所述讲话者的讲话语音翻译成与所述非讲话者的语言类型对应的语音；发送模块，用于将所述与所述非讲话者的语言类型对应的语音发送给所述非讲话者的终端设备，以使所述终端设备将所述与所述非讲话者的语言类型对应的语音提供给所述非讲话者。

根据本发明实施例的用于对聊天室内语音进行处理的装置，可根据聊天室内非讲话者所在的地域位置，将该聊天室内讲话者所讲的语言转换为该非讲话者所在地域位置的语言，使得非讲话者能够听懂聊天室内讲话者的讲话内容，提升了用户的使用体验，进一步提高了用户与产品之间的粘性。

根据本发明的一个实施例，所述第一确定模块包括：获取单元，用于获取所述目标聊天室内讲话者的讲话语音；确定单元，用于根据所述讲话语音确定对应的语言类型。

根据本发明的一个实施例，所述目标聊天室为直播间，所述讲话者用于指示所述直播间的主播，所述非讲话者用于指示进入所述直播间并观看直播的观众；其中，所述获取单元具体用于：接收所述主播的终端设备发送的所述主播在所述直播间录入的语音；或者，接收所述非讲话者的终端设备发送的进入所述直播间并观看所述直播时播放的语音。

根据本发明的一个实施例，所述第二确定模块具体用于：获取所述非讲话者的用户信息；根据所述用户信息确定所述非讲话者所属的地域信息；其中，所述用户信息包括手机号码、国籍信息、身份证信息和护照信息中的一种或多种。

根据本发明的一个实施例，所述第二确定模块具体用于：基于定位技术，获取所述非讲话者的位置信息；根据所述位置信息确定所述非讲话者所属的地域信息；其中，所述地域信息为国家信息或行政区域信息。

为达到上述目的，本发明第三方面实施例提出的服务器，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述程序时，实现本发明第一方面实施例所述的用于对聊天室内语音进行处理的方法。

为达到上述目的，本发明第四方面实施例提出的非临时性计算机可读存储介质，其上存储有计算机程序，所述程序被处理器执行时实现本发明第一方面实施例所述的用于对聊天室内语音进行处理的方法。

本发明附加的方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到。

附图说明

本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解，其中：

图1是根据本发明一个实施例的用于对聊天室内语音进行处理的方法的流程图；

图2是根据本发明一个具体实施例的用于对聊天室内语音进行处理的方法的流程图；

图3是根据本发明实施例的用于对聊天室内语音进行处理的方法的示例图；

图4是根据本发明一个实施例的用于对聊天室内语音进行处理的装置的结构示意图；

图5是根据本发明一个具体实施例的用于对聊天室内语音进行处理的装置的结构示意图；

图6是根据本发明一个实施例的服务器的结构示意图。

具体实施方式

下面详细描述本发明的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，旨在用于解释本发明，而不能理解为对本发明的限制。

下面参考附图描述本发明实施例的用于对聊天室内语音进行处理的方法、装置、服务器和计算机可读存储介质。

图1是根据本发明一个实施例的用于对聊天室内语音进行处理的方法的流程图。需要说明的是，本发明实施例的用于对聊天室内语音进行处理的方法可应用于本发明实施例的用于对聊天室内语音进行处理的装置，其中，该装置可被配置在服务器上。

如图1所示，该用于对聊天室内语音进行处理的方法可以包括：

S110，确定目标聊天室内讲话者的语言类型。

可以理解，聊天室内具有讲话者和非讲话者，而由于地域性差异，可能导致讲话者和非讲话者所使用的语言类型并不相同，为了能够保证聊天室内用户之间能够听懂彼此的语言，本发明可对讲话者的讲话语音进行翻译。首先，需先确定目标聊天室内讲话者的语言类型。例如，可通过讲话者的用户信息来确定讲话者所使用的语言类型，和/或，通过讲话者的语音来判定该讲话者所使用的语言类型。

作为一种示例，假设用户在使用聊天室时，需进行注册并完成注册信息的填写后可进入并使用聊天室进行聊天。其中，所述注册信息中可包括用户信息，该用户信息可包括但不限于手机号码、国籍信息、身份证信息和护照信息等中的一种或多种。这样，可通过获取讲话者的用户信息(如国籍信息、身份证信息和/或护照信息)以确定讲话者所使用的语言类型。

作为另一种示例，可获取目标聊天室内讲话者的讲话语音，并根据该讲话语音确定对应的语言类型。例如，可通过可以下两种方式来获取讲话者的实时讲话语音：接收讲话者的终端设备发送的讲话者在目标聊天室内录入的实时语音，或者，接收非讲话者的终端设备发送的进入所述目标聊天室内时正在播放的语音。也就是说，服务器可从讲话者端获取该讲话者当前所讲的讲话语音，或者，从非讲话者端获取非讲话者端进入所述目标聊天室内时正在播放的语音。这样，在获得讲话者的讲话语音之后，可基于多语言语音识别技术，对该讲话语音进行语音识别，以判定该讲话语音所对应的语言类型，从而得到该讲话者所使用的语言类型。由此，无需另外获得其他信息来确定该讲话者的语言类型，只需通过获得该讲话者在聊天室内讲话时的语音以自动识别出该讲话者讲话时所使用的语言类型，降低了信息获取的复杂度。

S120，确定目标聊天室内的非讲话者所属的地域信息，根据所述地域信息确定所述非讲话者的语言类型。

可选地，确定非讲话者所属的地域信息的实现方式可以有很多种：例如，可以通过获取所述非讲话者的用户信息以确定该非讲话者所属的地域信息，或者，还可通过定位的方式来确定非讲话者所属的地域信息。下面将给出两种不同示例的实现方式：

作为一种示例的实现方式，可获取非讲话者的用户信息，并根据该用户信息确定非讲话者所属的地域信息。其中，在本示例中，所述用户信息可包括但不限于手机号码、国籍信息、身份证信息和护照信息等中的一种或多种。

举例而言，假设用户在使用聊天室时，需进行注册并完成注册信息的填写后可进入并使用聊天室进行聊天。其中，所述注册信息中可包括用户信息，该用户信息可包括但不限于手机号码、国籍信息、身份证信息和护照信息等中的一种或多种。这样，可通过获取非讲话者的用户信息(如国籍信息、身份证信息或护照信息等)来确定该非讲话者所属的地域信息。其中，在本发明的实施例中，所述地域信息可为国家信息或行政区域信息。

例如，以地域信息是指国家信息为例，在非讲话者进入目标聊天室时，可获取该非讲话者的标识信息，并根据该标识信息从数据库中查询该非讲话者的用户信息，并从该用户信息中获取用以表示国籍信息的国籍码，通过该国籍码来确定该非讲话者来自于哪个国家。又如，以地域信息是指身份证信息为例，可从数据库中查询该非讲话者的用户信息，并从该用户信息中获取身份证信息，并从该身份证信息中的身份证号码进行分析，以确定该非讲话者来自于哪个行政区域。由此，通过非讲话者的用户信息(如国籍信息等)来获得该非讲话者所属的地域信息，提高了确定非讲话者的所属地域的准确度。

作为另一种示例的实现方式，可基于定位技术，获取所述非讲话者的位置信息，并根据所述位置信息确定所述非讲话者所属的地域信息。例如，可通过非讲话者的终端设备中的定位模块进行定位，获得该非讲话者当前的位置信息，进而根据该位置信息即可确定所述非讲话者所属的地域信息。由此，通过终端设备自身的定位功能即可确定该非讲话者所处的位置，进而可以得到该非讲话者说话时所使用的官方语言类型，充分地利用了终端设备的现有功能，可以无需要求非讲话者填写用户信息，简化了用户操作，提升了用户的使用体验。

可以理解，所述非讲话者所属的地域信息还可通过其他方式来确定，上述给出的两种示例仅是方便本领域技术人员的理解，不能作为是对本发明的具体限定。

S130，判断讲话者的语言类型与非讲话者的语言类型是否一致。

可选地，在确定讲话者的语言类型和非讲话者的语言类型之后，可判断讲话者的语言类型与非讲话者的语言类型是否一致。也就是说，需判断聊天室内讲话者和非讲话者是否讲同一种语言。

S140，若否，则基于语音翻译技术，将讲话者的讲话语音翻译成与非讲话者的语言类型对应的语音。

可选地，在讲话者的语言类型与非讲话者的语言类型不一致时，可基于语音翻译技术，将所述讲话者的终端设备发送的所述讲话者所讲的实时语音翻译成与所述非讲话者的语言类型对应的语音。可以理解，在本发明的实施例中，所述语音翻译技术支持多语言语音翻译。例如，假设讲话者使用英语，非讲话者使用汉语，在本步骤中，可基于现有技术中的语音翻译技术(如英译汉的语音翻译模型)，将讲话者所讲的英语语音翻译成对应的汉语语音。

S150，将与非讲话者的语言类型对应的语音发送给非讲话者的终端设备，以使终端设备将与非讲话者的语言类型对应的语音提供给非讲话者。

可选地，在非讲话者进入目标聊天室时，可获取该非讲话者的标识信息，这样，在将所述讲话者所讲的实时语音翻译成与非讲话者的语言类型对应的语音时，可根据所述非讲话者的标识信息将所述与非讲话者的语言类型对应的语音发送给该非讲话者的终端设备，这样，该终端设备在接收到该语音时，可将该语音播放给该非讲话者。

需要说明的是，在本发明的一个实施例中，当所述讲话者的语言类型与所述非讲话者的语言类型一致时，可将讲话者的终端设备发送的讲话者在目标聊天室内录入的实时语音，直接转发给所述非讲话者的终端设备进行播放。也就是说，当聊天室内讲话者和非讲话者讲同一种语言时，可直接将讲话者的语音转发给非讲话者的终端设备进行播放，无需再对该讲话者的实时语音进行翻译的操作。

图2是根据本发明一个具体实施例的用于对聊天室内语音进行处理的方法的流程图。需要说明的是，在本发明的实施例中，所述目标聊天室是指直播间，所述讲话者用于指示所述直播间的主播，所述非讲话者用于指示进入所述直播间并观看直播的观众。

如图2所示，该用于对聊天室内语音进行处理的方法可以包括：

S210，确定直播间内主播的语言类型。

可选地，通过主播的用户信息来确定该主播所使用的语言类型，和/或，通过主播所录入的语音来判定该主播所使用的语言类型。

作为一种示例，以网络直播为例，假设主播在使用网络直播进行直播时，需要在网络直播平台上完成注册即可为该主播分配一个直播间。其中，注册时所填写的信息可包括用户信息，该用户信息可包括但不限于手机号码、国籍信息、身份证信息和护照信息等中的一种或多种。这样，可通过主播的用户信息(如国籍信息、身份证信息和/或护照信息)以确定该主播所使用的语言类型。由此，通过主播的用户信息(如国籍信息、身份证信息和/或护照信息)即可准确的获得该主播讲话时所使用的语言类型。

作为另一种示例，可获取直播间内主播的讲话语音，并根据该讲话语音确定对应的语言类型。例如，可通过可以下两种方式来获取主播的实时讲话语音：接收所述主播的终端设备发送的所述主播在所述直播间录入的语音；或者，接收所述非讲话者的终端设备发送的进入所述直播间并观看所述直播时播放的语音。也就是说，服务器可从主播端获取该主播当前所讲的讲话语音，或者，从观众端获取该观众进入该直播间时正在播放的语音。这样，在获得主播的讲话语音之后，可基于多语言语音识别技术，对该讲话语音进行语音识别，以判定该讲话语音所对应语言类型，从而得到该主播所使用的语言类型。由此，无需另外获得其他信息来确定该主播的语言类型，只需在该主播直播时通过获得该主播直播时的讲话语音以自动识别出该主播讲话时所使用的语言类型，降低了信息获取的复杂度。

S220，确定进入所述直播间并观看直播的观众所属的地域信息，根据所述地域信息确定所述观众的语言类型。

可选地，确定所述观众所属的地域信息的实现方式可以有很多种：例如，可以通过获取所述观众的用户信息以确定该观众所属的地域信息，或者，通过定位的方式来确定该观众所属的地域信息。下面将给出两种不同示例的实现方式：

作为一种示例的实现方式，获取所述观众的用户信息，并根据所述用户信息确定所述观众所属的地域信息。其中，所述用户信息可包括但不限于手机号码、国籍信息、身份证信息和护照信息等中的一种或多种。

举例而言，以网络直播为例，假设观众在使用网络直播进行观看直播时，需要在网络直播平台上完成注册即可进入直播间观看直播。其中，注册时所填写的信息可包括用户信息，该用户信息可包括但不限于手机号码、国籍信息、身份证信息和护照信息等中的一种或多种。这样，可通过获取所述观众的用户信息(如国籍信息、身份证信息或护照信息等)来确定该观众所属的地域信息。其中，在本发明的实施例中，所述地域信息可为国家信息或行政区域信息。

作为另一种示例的实现方式，基于定位技术，获取所述观众的位置信息，并根据所述位置信息确定所述观众所属的地域信息。其中，所述地域信息为国家信息或行政区域信息。例如，可通过所述观众的终端设备中的定位模块进行定位，获得该观众当前的位置信息，进而根据该位置信息即可确定所述观众所属的地域信息。

可以理解，所述观众所属的地域信息还可通过其他方式来确定，上述给出的两种示例仅是方便本领域技术人员的理解，不能作为是对本发明的具体限定。

S230，判断所述主播的语言类型与所述观众的语言类型是否一致。

也就是说，需要判断直播间内主播和观众是否讲同一种语言。

S240，若否，则基于语音翻译技术，将所述主播的讲话语音翻译成与观众的语言类型对应的语音。

可选地，在主播的语言类型与观众的语言类型不一致时，可基于语音翻译技术，将主播的终端设备发送的该主播所讲的实时语音翻译成与观众的语言类型对应的语音。可以理解，在本发明的实施例中，所述语音翻译技术支持多语言语音翻译。例如，假设主播使用英语，观众使用汉语，在本步骤中，可基于现有技术中的语音翻译技术(如英译汉的语音翻译模型)，将主播所讲的英语语音翻译成对应的汉语语音。

S250，将所述与观众的语言类型对应的语音发送给所述观众的终端设备，以使所述终端设备将所述与观众的语言类型对应的语音提供给所述观众。

可选地，在观众进入所述直播间时，可获取该观众的标识信息，这样，在将主播所讲的实时语音翻译成与所述观众的语言类型对应的语音时，可根据所述观众的标识信息将该与观众的语言类型对应的语音发送给该观众的终端设备，这样，该终端设备在接收到该语音时，可将该语音播放给该观众。

需要说明的是，在本发明的一个实施例中，当主播的语言类型与观众的语言类型一致时，可将主播的终端设备发送的主播在直播间录入的实时语音，直接转发给观众的终端设备进行播放。也就是说，当直播间内主播和观众讲同一种语言时，可直接将主播的语音转发给观众的终端设备进行播放，无需再对该主播的实时语音进行翻译的操作。

举例而言，如图3所示，主播开启其直播间并开始直播时，主播端(如主播的终端设备)会将该主播的标识信息和直播间编号发送给服务器(S1)。服务器在接收到该主播开启其直播间并开始直播的通知信息时，可实时获取进入该主播直播间的所有观众的标识信息(S2)，并根据标识信息从数据库中找到这些观众所属的地域信息，比如所属哪个国家(S3)。同时，服务器从主播端获取该主播录入时的实时语音(S4)，并判断该实时语音对应的语言类型是否与当前观看该直播间的观众所使用的语言类型一致(S5)，如果不一致，则将主播端所录入的实时语音翻译成当前观众所使用的语言类型对应的语音，并将翻译后的语音发送给对应观众的终端设备(S6)，使得该终端设备将该翻译后的语音播放给该观众；如果该实时语音对应的语言类型与当前观看该直播间的观众所使用的语言类型一致，则直接将该实时语音转发给该观众的终端设备(S7)，使得该终端设备将该实时语音播放给该观众。

由此，根据直播间内当前观看该直播的观众所在的地域位置，将该直播间内主播所讲的语言转换为该观众所在地域位置的语言，使得观众能够听懂直播间内主播的讲话内容，大大提升了用户的使用体验，提高了用户与产品之间的粘性。

需要说明的是，在本发明的一个实施例中，还可获取所述观众选取的能够听懂的语言类型，这样，在检测到该观众进入直播间时，服务器可根据该观众所选择的语言类型，判断其是否与主播的语言类型一致，若不一致，则将主播在直播间录入的实时语音翻译成与所述选择的语言类型对应的语音，并将该语音提供给该观众的终端设备进行播放，进而可以使得该观众更能体验观看直播的乐趣，提升用户的使用体验。

与上述几种实施例提供的用于对聊天室内语音进行处理的方法相对应，本发明的一种实施例还提供一种用于对聊天室内语音进行处理的装置，由于本发明实施例提供的用于对聊天室内语音进行处理的装置与上述几种实施例提供的用于对聊天室内语音进行处理的方法相对应，因此在前述用于对聊天室内语音进行处理的方法的实施方式也适用于本实施例提供的用于对聊天室内语音进行处理的装置，在本实施例中不再详细描述。图4是根据本发明一个实施例的用于对聊天室内语音进行处理的装置的结构示意图。

如图4所示，该用于对聊天室内语音进行处理的装置400可以包括：第一确定模块410、第二确定模块420、判断模块430、翻译模块440和发送模块450。

具体地，第一确定模块410用于确定目标聊天室内讲话者的语言类型。作为一种示例，如图5所示，该第一确定模块410可以包括获取单元411和确定单元412。其中，获取单元411用于获取目标聊天室内讲话者的讲话语音；确定单元412用于根据讲话语音确定对应的语言类型。

需要说明的是，在本发明的一个实施例中，所述目标聊天室为直播间，所述讲话者用于指示所述直播间的主播，所述非讲话者用于指示进入所述直播间并观看直播的观众。其中，在本发明的实施例中，获取单元411可具体用于：接收所述主播的终端设备发送的所述主播在所述直播间录入的语音；或者，接收所述非讲话者的终端设备发送的进入所述直播间并观看所述直播时播放的语音。

第二确定模块420用于确定目标聊天室内的非讲话者所属的地域信息，根据地域信息确定非讲话者的语言类型。

可选地，第二确定模块420确定非讲话者所属的地域信息的实现方式可以有很多种：例如，可以通过获取所述非讲话者的用户信息以确定该非讲话者所属的地域信息，或者，还可通过定位的方式来确定非讲话者所属的地域信息。下面将给出两种不同示例的实现方式：

作为一种示例的实现方式，第二确定模块420可获取所述非讲话者的用户信息，并根据所述用户信息确定所述非讲话者所属的地域信息；其中，所述用户信息可包括但不限于手机号码、国籍信息、身份证信息和护照信息等中的一种或多种。

作为另一种示例的实现方式，第二确定模块420可基于定位技术，获取所述非讲话者的位置信息，并根据所述位置信息确定所述非讲话者所属的地域信息；其中，所述地域信息为国家信息或行政区域信息。

判断模块430用于判断讲话者的语言类型与非讲话者的语言类型是否一致。

翻译模块440用于若否，则基于语音翻译技术，将讲话者的讲话语音翻译成与非讲话者的语言类型对应的语音。

发送模块450用于将与非讲话者的语言类型对应的语音发送给非讲话者的终端设备，以使终端设备将与非讲话者的语言类型对应的语音提供给非讲话者。

为了实现上述实施例，本发明还提出了一种服务器。

图6是根据本发明一个实施例的服务器的结构示意图。如图6所示，该服务器600可以包括：存储器610、处理器620及存储在存储器610上并可在处理器620上运行的计算机程序630，处理器620执行所述程序630时，实现本发明上述任一个实施例所述的用于对聊天室内语音进行处理的方法。

为了实现上述实施例，本发明还提出了一种非临时性计算机可读存储介质，其上存储有计算机程序，所述程序被处理器执行时实现本发明上述任一个实施例所述的用于对聊天室内语音进行处理的方法。

在本发明的描述中，需要理解的是，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中，“多个”的含义是至少两个，例如两个，三个等，除非另有明确具体的限定。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且，描述的具体特征或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外，在不相互矛盾的情况下，本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为，表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分，并且本发明的优选实施方式的范围包括另外的实现，其中可以不按所示出或讨论的顺序，包括根据所涉及的功能按基本同时的方式或按相反的顺序，来执行功能，这应被本发明的实施例所属技术领域的技术人员所理解。

在流程图中表示或在此以其他方式描述的逻辑和/或步骤，例如，可以被认为是用于实现逻辑功能的可执行指令的定序列表，可以具体实现在任何计算机可读介质中，以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用，或结合这些指令执行系统、装置或设备而使用。就本说明书而言，"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下：具有一个或多个布线的电连接部(电子装置)，便携式计算机盘盒(磁装置)，随机存取存储器(RAM)，只读存储器(ROM)，可擦除可编辑只读存储器(EPROM或闪速存储器)，光纤装置，以及便携式光盘只读存储器(CDROM)。另外，计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质，因为可以例如通过对纸或其他介质进行光学扫描，接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序，然后将其存储在计算机存储器中。

应当理解，本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中，多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如，如果用硬件来实现，和在另一实施方式中一样，可用本领域公知的下列技术中的任一项或他们的组合来实现：具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路，具有合适的组合逻辑门电路的专用集成电路，可编程门阵列(PGA)，现场可编程门阵列(FPGA)等。

本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，该程序在执行时，包括方法实施例的步骤之一或其组合。

此外，在本发明各个实施例中的各功能单元可以集成在一个处理模块中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。

上述提到的存储介质可以是只读存储器，磁盘或光盘等。尽管上面已经示出和描述了本发明的实施例，可以理解的是，上述实施例是示例性的，不能理解为对本发明的限制，本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims

1.一种用于对聊天室内语音进行处理的方法，其特征在于，包括以下步骤：

确定目标聊天室内讲话者的语言类型；

确定所述目标聊天室内的非讲话者所属的地域信息，根据所述地域信息确定所述非讲话者的语言类型；

判断所述讲话者的语言类型与所述非讲话者的语言类型是否一致；

若否，则基于语音翻译技术，将所述讲话者的讲话语音翻译成与所述非讲话者的语言类型对应的语音；

将所述与所述非讲话者的语言类型对应的语音发送给所述非讲话者的终端设备，以使所述终端设备将所述与所述非讲话者的语言类型对应的语音提供给所述非讲话者。

2.如权利要求1所述的方法，其特征在于，所述确定目标聊天室内讲话者的语言类型，包括：

获取所述目标聊天室内讲话者的讲话语音；

根据所述讲话语音确定对应的语言类型。

3.如权利要求2所述的方法，其特征在于，所述目标聊天室为直播间，所述讲话者用于指示所述直播间的主播，所述非讲话者用于指示进入所述直播间并观看直播的观众；其中，所述获取所述目标聊天室内讲话者的讲话语音，包括：

接收所述主播的终端设备发送的所述主播在所述直播间录入的语音；或者，

接收所述非讲话者的终端设备发送的进入所述直播间并观看所述直播时播放的语音。

4.如权利要求1所述的方法，其特征在于，确定所述目标聊天室内的非讲话者所属的地域信息，包括：

获取所述非讲话者的用户信息；

根据所述用户信息确定所述非讲话者所属的地域信息；其中，所述用户信息包括手机号码、国籍信息、身份证信息和护照信息中的一种或多种。

5.如权利要求1所述的方法，其特征在于，确定所述目标聊天室内的非讲话者所属的地域信息，包括：

基于定位技术，获取所述非讲话者的位置信息；

根据所述位置信息确定所述非讲话者所属的地域信息；其中，所述地域信息为国家信息或行政区域信息。

6.一种用于对聊天室内语音进行处理的装置，其特征在于，包括：

第一确定模块，用于确定目标聊天室内讲话者的语言类型；

第二确定模块，用于确定所述目标聊天室内的非讲话者所属的地域信息，根据所述地域信息确定所述非讲话者的语言类型；

判断模块，用于判断所述讲话者的语言类型与所述非讲话者的语言类型是否一致；

翻译模块，用于若否，则基于语音翻译技术，将所述讲话者的讲话语音翻译成与所述非讲话者的语言类型对应的语音；

发送模块，用于将所述与所述非讲话者的语言类型对应的语音发送给所述非讲话者的终端设备，以使所述终端设备将所述与所述非讲话者的语言类型对应的语音提供给所述非讲话者。

7.如权利要求6所述的装置，其特征在于，所述第一确定模块包括：

获取单元，用于获取所述目标聊天室内讲话者的讲话语音；

确定单元，用于根据所述讲话语音确定对应的语言类型。

8.如权利要求7所述的装置，其特征在于，所述目标聊天室为直播间，所述讲话者用于指示所述直播间的主播，所述非讲话者用于指示进入所述直播间并观看直播的观众；其中，所述获取单元具体用于：

9.一种服务器，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时，实现如权利要求1至5中任一项所述的用于对聊天室内语音进行处理的方法。

10.一种非临时性计算机可读存储介质，其上存储有计算机程序，其特征在于，所述程序被处理器执行时实现如权利要求1至5中任一项所述的用于对聊天室内语音进行处理的方法。