CN113413613B - 一种游戏内语音聊天的优化方法、装置、电子设备及介质 - Google Patents
一种游戏内语音聊天的优化方法、装置、电子设备及介质 Download PDFInfo
- Publication number
- CN113413613B CN113413613B CN202110667424.3A CN202110667424A CN113413613B CN 113413613 B CN113413613 B CN 113413613B CN 202110667424 A CN202110667424 A CN 202110667424A CN 113413613 B CN113413613 B CN 113413613B
- Authority
- CN
- China
- Prior art keywords
- game
- voice
- input
- input voice
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 58
- 238000005457 optimization Methods 0.000 claims description 22
- 238000012545 processing Methods 0.000 claims description 17
- 230000004044 response Effects 0.000 claims description 17
- 238000003860 storage Methods 0.000 claims description 11
- 230000001960 triggered effect Effects 0.000 claims description 9
- 230000005540 biological transmission Effects 0.000 claims description 5
- 238000001514 detection method Methods 0.000 claims description 4
- 238000004590 computer program Methods 0.000 claims description 3
- 238000005520 cutting process Methods 0.000 description 6
- 238000006243 chemical reaction Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 239000012634 fragment Substances 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000009432 framing Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
Classifications
-
- A—HUMAN NECESSITIES
- A63—SPORTS; GAMES; AMUSEMENTS
- A63F—CARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
- A63F13/00—Video games, i.e. games using an electronically generated display having two or more dimensions
- A63F13/85—Providing additional services to players
- A63F13/87—Communicating with other players during game play, e.g. by e-mail or chat
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- A—HUMAN NECESSITIES
- A63—SPORTS; GAMES; AMUSEMENTS
- A63F—CARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
- A63F2300/00—Features of games using an electronically generated display having two or more dimensions, e.g. on a television screen, showing representations related to the game
- A63F2300/10—Features of games using an electronically generated display having two or more dimensions, e.g. on a television screen, showing representations related to the game characterized by input arrangements for converting player-generated signals into game device control signals
- A63F2300/1081—Input via voice recognition
-
- A—HUMAN NECESSITIES
- A63—SPORTS; GAMES; AMUSEMENTS
- A63F—CARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
- A63F2300/00—Features of games using an electronically generated display having two or more dimensions, e.g. on a television screen, showing representations related to the game
- A63F2300/50—Features of games using an electronically generated display having two or more dimensions, e.g. on a television screen, showing representations related to the game characterized by details of game servers
- A63F2300/57—Features of games using an electronically generated display having two or more dimensions, e.g. on a television screen, showing representations related to the game characterized by details of game servers details of game services offered to the player
- A63F2300/572—Communication between players during game play of non game information, e.g. e-mail, chat, file transfer, streaming of audio and streaming of video
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本申请提供了一种游戏内语音聊天的优化方法、装置、电子设备及介质,其中,游戏中包括玩家控制的第一游戏角色,第一游戏角色对应第一游戏客户端,该方法包括:响应针对游戏的第一语音输入指令,通过第一游戏客户端录制在当前游戏环境下的输入语音信号;实时检测每一帧输入语音信号中的语音特征是否包括与预先存储的标准语音特征不匹配的其他语音特征;若检测到其他语音特征,则停止输入语音信号的录制,并从已录制的输入语音信号中剔除包括其他语音特征的该帧输入语音信号,得到第一输入语音信号;响应针对游戏的语音发送指令,将第一输入语音信号发送给第二游戏角色对应的第二游戏客户端,可剔除游戏内语音聊天时的杂音,提升语音聊天的清晰度。
Description
技术领域
本申请涉及自然语言处理技术领域,尤其是涉及一种游戏内语音聊天的优化方法、装置、电子设备及介质。
背景技术
在目前的游戏中,例如倩女手游,玩家可以利用手机的语音功能,发送一段语音给到对方的玩家。并且,游戏内也可以将语音直接转化成文本,显示在游戏内。
现有技术中,玩家在语音录制过程中,可能会突然出现其他用户的声音,并且超过了一定的分贝,会影响对方玩家主要的信息获取。例如,其他用户的语音会听到;如果进行文字转换,也会将其他用户的语音转换成文字。
申请人在研究中发现,现有技术中在游戏内进行语音输入时可能会掺杂有其他用户的杂音,影响语音聊天的清晰度。
发明内容
有鉴于此,本申请的目的在于提供一种游戏内语音聊天的优化方法、装置、电子设备及介质,以剔除游戏内语音聊天时的杂音,提升语音聊天的清晰度。
第一方面,本申请实施例提供了一种游戏内语音聊天的优化方法,所述游戏中包括玩家控制的第一游戏角色,所述第一游戏角色对应第一游戏客户端,所述优化方法包括:
响应针对所述游戏的第一语音输入指令,通过所述第一游戏客户端录制在当前游戏环境下的输入语音信号;
针对所述输入语音信号,实时检测每一帧所述输入语音信号中的语音特征是否包括与预先存储的标准语音特征不匹配的其他语音特征;
若检测到所述其他语音特征,则停止所述输入语音信号的录制,并从已录制的输入语音信号中剔除包括所述其他语音特征的该帧输入语音信号,得到第一输入语音信号;
响应针对所述游戏的语音发送指令,将所述第一输入语音信号发送给第二游戏角色对应的第二游戏客户端。
在一种可能的实施方式中,在得到第一输入语音信号的步骤之后,所述优化方法还包括:
响应针对所述游戏的第二语音输入指令,在所述第一输入语音信号之后继续录制在当前游戏环境下的输入语音信号;
响应针对所述游戏的语音发送指令,将所述第一输入语音信号发送给第二游戏角色对应的第二游戏客户端的步骤,包括:
响应针对所述游戏的语音发送指令,确定包括所述第一输入语音信号和继续录制的第二输入语音信号的目标输入语音信号;其中,所述第二输入语音信号是对继续录制的输入语音信号进行优化处理后得到的;
将所述目标输入语音信号发送给第二游戏角色对应的第二游戏客户端。
在一种可能的实施方式中,响应针对所述游戏的第二语音输入指令的步骤之前,所述优化方法还包括:
响应停止所述输入语音信号的录制,提示剔除的包括所述其他语音特征的该帧输入语音信号的语音内容。
在一种可能的实施方式中,若检测到所述其他语音特征,则停止所述输入语音信号的录制,并从已录制的输入语音信号中剔除包括所述其他语音特征的该帧输入语音信号,得到第一输入语音信号的步骤,包括:
响应检测到所述其他语音特征,控制停止所述输入语音信号的录制;
响应通过图形用户界面触发的针对所述已录制的输入语音信号的裁剪操作,对所述已录制的输入语音信号进行裁剪处理,得到第一输入语音信号。
在一种可能的实施方式中,响应通过图形用户界面触发的针对所述已录制的输入语音信号的裁剪操作,对所述已录制的输入语音信号进行裁剪处理,得到第一输入语音信号的步骤,包括:
响应停止所述输入语音信号的录制,获取已录制的输入语音信号;
对所述已录制的输入语音信号进行识别处理,并显示识别处理后的每一帧输入语音信号对应的识别文本;所述识别文本表征了所述输入语音信号的语音内容;
响应通过图形用户界面触发的针对所述已录制的输入语音信号的裁剪操作,从所述已录制的输入语音信号中裁剪掉所述目标帧输入语音信号,得到第一输入语音信号;其中,所述目标帧输入语音信号是根据所述识别文本确定的。
在一种可能的实施方式中,所述优化方法还包括:
获取已录制的完整输入语音信号;其中,所述已录制的完整输入语音信号为未经过优化处理的输入语音信号;
根据预先存储的标准语音特征,从所述已录制的完整输入语音信号中提取匹配的第三输入语音信号,并将所述第三输入语音信号转换为目标文本;
响应针对所述游戏的文本发送指令,将所述目标文本发送给第二游戏角色对应的第二游戏客户端。
在一种可能的实施方式中,在将所述第三输入语音信号转换为目标文本的步骤之后,所述优化方法还包括:
基于所述游戏的预设词汇库,对所述目标文本进行校正;
响应针对所述游戏的文本发送指令,将所述目标文本发送给第二游戏角色对应的第二游戏客户端的步骤,包括:
响应针对所述游戏的文本发送指令,将校正后的所述目标文本发送给第二游戏角色对应的第二游戏客户端。
在一种可能的实施方式中,所述输入语音信号的音频源为所述第一游戏客户端的麦克风,或者所述输入语音信号的音频源为所述第一游戏客户端的麦克风和游戏内部音频。
在一种可能的实施方式中,所述优化方法还包括:
收集所述第一游戏客户端录制的历史语音聊天记录;
基于所述历史语音聊天记录提取所述第一游戏角色对应的标准语音特征;
将所述第一游戏角色对应的标准语音特征进行存储。
在一种可能的实施方式中,所述第一游戏角色对应的标准语音特征包括以下至少一项:声音音色、声音响度和语音内容。
第二方面,本申请实施例还提供一种游戏内语音聊天的优化装置,所述游戏中包括玩家控制的第一游戏角色,所述第一游戏角色对应第一游戏客户端,所述优化装置包括:
录制模块,用于响应针对所述游戏的第一语音输入指令,通过所述第一游戏客户端录制在当前游戏环境下的输入语音信号;
检测模块,用于针对所述输入语音信号,实时检测每一帧所述输入语音信号中的语音特征是否包括与预先存储的标准语音特征不匹配的其他语音特征;
剔除模块,用于若检测到所述其他语音特征,则停止所述输入语音信号的录制,并从已录制的输入语音信号中剔除包括所述其他语音特征的该帧输入语音信号,得到第一输入语音信号;
发送模块,用于响应针对所述游戏的语音发送指令,将所述第一输入语音信号发送给第二游戏角色对应的第二游戏客户端。
第三方面,本申请实施例还提供一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行上述第一方面,或第一方面中任一种可能的实施方式中的步骤。
第八方面,本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述第一方面,或第一方面中任一种可能的实施方式中的步骤。
本申请实施例提供的一种游戏内语音聊天的优化方法,其中,所述游戏中包括玩家控制的第一游戏角色,所述第一游戏角色对应第一游戏客户端。首先响应针对所述游戏的第一语音输入指令,通过所述第一游戏客户端录制在当前游戏环境下的输入语音信号;而后,由于当前游戏环境可能存在从第一游戏客户端的麦克风传入的其他用户的语音干扰、游戏内部的语音干扰等等,针对所述输入语音信号,实时检测每一帧所述输入语音信号中的语音特征是否包括与预先存储的标准语音特征不匹配的其他语音特征;若是,则停止所述输入语音信号的录制,并从已录制的输入语音信号中剔除包括所述其他语音特征的该帧输入语音信号,得到第一输入语音信号,从而可以剔除游戏内语音聊天时的杂音;最后,响应针对所述游戏的语音发送指令,将所述第一输入语音信号发送给第二游戏角色对应的第二游戏客户端。本申请实施例可以在游戏内语音聊天时实时检测语音录制过程中是否掺入杂音,一旦有杂音掺入,则停止语音的继续录制,同时剔除包含杂音的语音片段,可以剔除游戏内语音聊天时的杂音,提升语音聊天的清晰度。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本申请实施例所提供的一种游戏内语音聊天的优化方法的流程图;
图2示出了本申请实施例所提供的一种游戏内语音聊天的优化装置的结构示意图;
图3示出了本申请实施例所提供的一种电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
考虑到现有技术中,玩家在语音录制过程中,可能会突然出现其他用户的声音,并且超过了一定的分贝,会影响对方玩家主要的信息获取。例如,其他用户的语音会听到;如果进行文字转换,也会将其他用户的语音转换成文字。现有技术中在游戏内进行语音输入时可能会掺杂有其他用户的杂音,影响语音聊天的清晰度。基于此,本申请实施例提供了一种游戏内语音聊天的优化方法、装置、电子设备及介质,下面通过实施例进行描述。
为便于对本实施例进行理解,首先对本申请实施例所公开的一种游戏内语音聊天的优化方法进行详细介绍。
请参照图1,图1为本申请实施例所提供的一种游戏内语音聊天的优化方法的流程图。其中,所述游戏中包括玩家控制的第一游戏角色,所述第一游戏角色对应第一游戏客户端。如图1所示,所述优化方法可以包括以下步骤:
S101、响应针对所述游戏的第一语音输入指令,通过所述第一游戏客户端录制在当前游戏环境下的输入语音信号;
S102、针对所述输入语音信号,实时检测每一帧所述输入语音信号中的语音特征是否包括与预先存储的标准语音特征不匹配的其他语音特征;
S103、若检测到所述其他语音特征,则停止所述输入语音信号的录制,并从已录制的输入语音信号中剔除包括所述其他语音特征的该帧输入语音信号,得到第一输入语音信号;
S104、响应针对所述游戏的语音发送指令,将所述第一输入语音信号发送给第二游戏角色对应的第二游戏客户端。
步骤S101中,第一语音输入指令可以指单击语音按键或者长按语音按键所生成的指令。在当前游戏环境下,所述输入语音信号的音频源可以为所述第一游戏客户端的麦克风,或者所述输入语音信号的音频源为所述第一游戏客户端的麦克风和游戏内部音频。在具体实施中,所述输入语音信号的音频源可根据第一游戏客户端对于音频源的系统配置来确定。
在本步骤中,当玩家单击语音按键或者长按语音按键时,生成针对所述游戏的第一语音输入指令。响应所述第一语音输入指令,通过所述第一游戏客户端录制在当前游戏环境下来自麦克风的输入语音信号。或者,响应所述第一语音输入指令,通过所述第一游戏客户端录制在当前游戏环境下来自麦克风和游戏内部音频的输入语音信号。
步骤S102中,第一游戏角色对应的标准语音特征可以包括以下至少一项:声音音色、声音响度和语音内容,语音内容可以指重复次数较多的关键词,例如玩家的口头禅、常用语等。在本实施例中,第一游戏角色对应的标准语音特征可以基于第一游戏客户端录制的历史语音聊天记录来确定。具体地,收集所述第一游戏客户端录制的历史语音聊天记录;基于所述历史语音聊天记录提取所述第一游戏角色对应的标准语音特征;将所述第一游戏角色对应的标准语音特征进行存储。
在本步骤中,录制的输入语音信号经过分帧处理后,得到离散的语音信号。针对所述输入语音信号,实时检测每一帧所述输入语音信号中的语音特征是否包括与预先存储的标准语音特征不匹配的其他语音特征。若否,则该帧输入语音信号中未掺杂其他语音特征;若是,则该帧输入语音信号中掺杂有其他语音特征。
步骤S103中,由于当前游戏环境可能存在从第一游戏客户端的麦克风传入的其他用户的语音干扰、游戏内部的语音干扰等等,若检测到其他语音特征,表示有其他用户的干扰语音进入到游戏语音输入中,则停止输入语音信号的录制,并从已录制的输入语音信号中剔除包括所述其他语音特征的该帧输入语音信号,得到第一输入语音信号,从而可以剔除游戏内语音聊天时的杂音。
在本步骤中,系统可以自动从已录制的输入语音信号中剔除包括所述其他语音特征的该帧输入语音信号,还可以玩家手动对已录制的输入语音信号进行裁剪处理。
在一种可能的实施方式中,步骤S103包括:
S1031、响应检测到所述其他语音特征,控制停止所述输入语音信号的录制;
S1032、响应通过图形用户界面触发的针对所述已录制的输入语音信号的裁剪操作,对所述已录制的输入语音信号进行裁剪处理,得到第一输入语音信号。
步骤S1032中,响应停止所述输入语音信号的录制,获取已录制的输入语音信号;对所述已录制的输入语音信号进行识别处理,并显示识别处理后的每一帧输入语音信号对应的识别文本,每一帧输入语音信号指的是一个时间段的输入语音信号,比如,0-5s是一个时间段;所述识别文本表征了所述输入语音信号的语音内容;响应通过图形用户界面触发的针对所述已录制的输入语音信号的裁剪操作,从所述已录制的输入语音信号中裁剪掉所述目标帧输入语音信号,得到第一输入语音信号;其中,所述目标帧输入语音信号是根据所述识别文本确定的。在本步骤中,玩家可根据显示的每一帧输入语音信号对应的识别文本来确定需要裁剪掉的目标帧输入语音信号,然后手动从所述已录制的输入语音信号中裁剪掉所述目标帧输入语音信号,得到第一输入语音信号,可以提升游戏内语音聊天时杂音剔除的灵活性。
步骤S104中,第二游戏角色为玩家的队友或对手控制的游戏角色,所述第二游戏角色对应第二游戏客户端。响应针对所述游戏的语音发送指令,将所述第一输入语音信号或者所述第一输入语音信号的文本内容发送给第二游戏角色对应的第二游戏客户端。
在一种可能的实施方式中,在得到第一输入语音信号的步骤之后,所述优化方法还包括:响应针对所述游戏的第二语音输入指令,在所述第一输入语音信号之后继续录制在当前游戏环境下的输入语音信号;步骤S104包括:响应针对所述游戏的语音发送指令,确定包括所述第一输入语音信号和继续录制的第二输入语音信号的目标输入语音信号;其中,所述第二输入语音信号是对继续录制的输入语音信号进行优化处理后得到的;将所述目标输入语音信号发送给第二游戏角色对应的第二游戏客户端。在本实施例中,在其他用户的杂音停下时,玩家可以继续输入语音,即响应针对所述游戏的第二语音输入指令,在所述第一输入语音信号之后继续录制在当前游戏环境下的输入语音信号。在继续录制在当前游戏环境下的输入语音信号的过程中,可以采用上述步骤S101-S104的方法来优化,即对继续录制的输入语音信号进行优化处理后得到所述第二输入语音信号。响应针对所述游戏的语音发送指令,对所述第一输入语音信号和继续录制的第二输入语音信号进行拼接合并后,得到目标输入语音信号。然后将所述目标输入语音信号或所述目标输入语音信号的文本内容发送给第二游戏角色对应的第二游戏客户端。需要说明的是,在第二输入语音信号之后还可以继续录制当前游戏环境下的输入语音信号,并将继续录制的输入语音信号按照时间顺序拼接到第二输入语音信号之后,然后发送给第二游戏角色对应的第二游戏客户端。本实施例既剔除了语音聊天中的杂音,又保证了语音的连贯性和完整性。
可选地,上述响应针对所述游戏的第二语音输入指令的步骤之前,当等待的时间稍微长一些时,玩家可能会忘记上一段语音结束在哪一句语音,所述优化方法还包括:响应停止所述输入语音信号的录制,提示剔除的包括所述其他语音特征的该帧输入语音信号的语音内容。具体地,可以采用语音播放的方式和/或文本显示的方式,对剔除的包括所述其他语音特征的该帧输入语音信号的语音内容进行自动提示,以提示玩家上一段语音结束在哪一句语音。
在一种可能的实施方式中,所述优化方法还包括:获取已录制的完整输入语音信号;根据预先存储的标准语音特征,从所述已录制的完整输入语音信号中提取匹配的第三输入语音信号,并将所述第三输入语音信号转换为目标文本;响应针对所述游戏的文本发送指令,将所述目标文本发送给第二游戏角色对应的第二游戏客户端。在本实施例中,所述已录制的完整输入语音信号为未经过优化处理的输入语音信号,例如第一输入语音信号对应的未经过优化处理的输入语音信号,即未剔除包括所述其他语音特征的该帧输入语音信号的所述已录制的输入语音信号。针对已录制的完整输入语音信号,仅对与预先存储的标准语音特征匹配的第三输入语音信号进行文字转换,而不对掺入的杂音进行文字转换,从而可以剔除游戏内语音聊天时的杂音。需要说明的是,本实施例可以单独实施,也可以和前述实施例一起实施。
优选地,在上述将所述第三输入语音信号转换为目标文本的步骤之后,所述优化方法还包括:基于所述游戏的预设词汇库,对所述目标文本进行校正;响应针对所述游戏的文本发送指令,将所述目标文本发送给第二游戏角色对应的第二游戏客户端的步骤,包括:响应针对所述游戏的文本发送指令,将校正后的所述目标文本发送给第二游戏角色对应的第二游戏客户端。在本实施例中,由于在发送目标文本之前,基于所述游戏的预设词汇库,对所述目标文本进行校正,从而可以得到更符合游戏场景的目标文本,例如基于所述游戏的预设词汇库从读音相同的多个词汇中确定更符合游戏场景的词汇。
本申请实施例提供的一种游戏内语音聊天的优化方法,其中,所述游戏中包括玩家控制的第一游戏角色,所述第一游戏角色对应第一游戏客户端。首先响应针对所述游戏的第一语音输入指令,通过所述第一游戏客户端录制在当前游戏环境下的输入语音信号;而后,由于当前游戏环境可能存在从第一游戏客户端的麦克风传入的其他用户的语音干扰、游戏内部的语音干扰等等,针对所述输入语音信号,实时检测每一帧所述输入语音信号中的语音特征是否包括与预先存储的标准语音特征不匹配的其他语音特征;若是,则停止所述输入语音信号的录制,并从已录制的输入语音信号中剔除包括所述其他语音特征的该帧输入语音信号,得到第一输入语音信号,从而可以剔除游戏内语音聊天时的杂音;最后,响应针对所述游戏的语音发送指令,将所述第一输入语音信号发送给第二游戏角色对应的第二游戏客户端。本申请实施例可以在游戏内语音聊天时实时检测语音录制过程中是否掺入杂音,一旦有杂音掺入,则停止语音的继续录制,同时剔除包含杂音的语音片段,可以剔除游戏内语音聊天时的杂音,提升语音聊天的清晰度。
基于相同的技术构思,本申请实施例还提供一种游戏内语音聊天的优化装置、电子设备以及计算机存储介质等,具体可参见以下实施例。
请参照图2,图2为本申请实施例所提供的一种游戏内语音聊天的优化装置的结构示意图。其中,所述游戏中包括玩家控制的第一游戏角色,所述第一游戏角色对应第一游戏客户端。如图2所示,所述优化装置可以包括:
录制模块10,用于响应针对所述游戏的第一语音输入指令,通过所述第一游戏客户端录制在当前游戏环境下的输入语音信号;
检测模块20,用于针对所述输入语音信号,实时检测每一帧所述输入语音信号中的语音特征是否包括与预先存储的标准语音特征不匹配的其他语音特征;
剔除模块30,用于若检测到所述其他语音特征,则停止所述输入语音信号的录制,并从已录制的输入语音信号中剔除包括所述其他语音特征的该帧输入语音信号,得到第一输入语音信号;
发送模块40,用于响应针对所述游戏的语音发送指令,将所述第一输入语音信号发送给第二游戏角色对应的第二游戏客户端。
在一种可能的实施方式中,录制模块10还用于:在得到第一输入语音信号之后,响应针对所述游戏的第二语音输入指令,在所述第一输入语音信号之后继续录制在当前游戏环境下的输入语音信号;
发送模块40包括:
语音确定单元,用于响应针对所述游戏的语音发送指令,确定包括所述第一输入语音信号和继续录制的第二输入语音信号的目标输入语音信号;其中,所述第二输入语音信号是对继续录制的输入语音信号进行优化处理后得到的;
语音发送单元,用于将所述目标输入语音信号发送给第二游戏角色对应的第二游戏客户端。
在一种可能的实施方式中,剔除模块30还用于:响应针对所述游戏的第二语音输入指令之前,响应停止所述输入语音信号的录制,提示剔除的包括所述其他语音特征的该帧输入语音信号的语音内容。
在一种可能的实施方式中,剔除模块30包括:
录制控制单元,用于响应检测到所述其他语音特征,控制停止所述输入语音信号的录制;
语音裁剪单元,用于响应通过图形用户界面触发的针对所述已录制的输入语音信号的裁剪操作,对所述已录制的输入语音信号进行裁剪处理,得到第一输入语音信号。
在一种可能的实施方式中,语音裁剪单元具体用于:
响应停止所述输入语音信号的录制,获取已录制的输入语音信号;
对所述已录制的输入语音信号进行识别处理,并显示识别处理后的每一帧输入语音信号对应的识别文本;所述识别文本表征了所述输入语音信号的语音内容;
响应通过图形用户界面触发的针对所述已录制的输入语音信号的裁剪操作,从所述已录制的输入语音信号中裁剪掉所述目标帧输入语音信号,得到第一输入语音信号;其中,所述目标帧输入语音信号是根据所述识别文本确定的。
在一种可能的实施方式中,发送模块40还包括:
语音获取单元,用于获取已录制的完整输入语音信号;其中,所述已录制的完整输入语音信号为未经过优化处理的输入语音信号;
文本转换单元,用于根据预先存储的标准语音特征,从所述已录制的完整输入语音信号中提取匹配的第三输入语音信号,并将所述第三输入语音信号转换为目标文本;
文本发送单元,用于响应针对所述游戏的文本发送指令,将所述目标文本发送给第二游戏角色对应的第二游戏客户端。
在一种可能的实施方式中,发送模块40还包括:
文本校正单元,用于在将所述第三输入语音信号转换为目标文本之后,基于所述游戏的预设词汇库,对所述目标文本进行校正;
文本发送单元具体用于:响应针对所述游戏的文本发送指令,将校正后的所述目标文本发送给第二游戏角色对应的第二游戏客户端。
在一种可能的实施方式中,所述输入语音信号的音频源为所述第一游戏客户端的麦克风,或者所述输入语音信号的音频源为所述第一游戏客户端的麦克风和游戏内部音频。
在一种可能的实施方式中,检测模块20还包括:
语音收集单元,用于收集所述第一游戏客户端录制的历史语音聊天记录;
特征提取单元,用于基于所述历史语音聊天记录提取所述第一游戏角色对应的标准语音特征;
特征存储单元,用于将所述第一游戏角色对应的标准语音特征进行存储。
在一种可能的实施方式中,所述第一游戏角色对应的标准语音特征包括以下至少一项:声音音色、声音响度和语音内容。
请参阅图3,图3为本申请实施例提供的一种电子设备的结构示意图。如图3所示,包括:处理器301、存储器302和总线303,存储器302存储有处理器301可执行的机器可读指令,当电子设备运行时,处理器301与存储器302之间通过总线303通信,处理器301执行所述机器可读指令,以执行前面方法实施例中所述的方法,具体实现可参见方法实施例,在此不再赘述。
本申请实施例所提供的一种游戏内语音聊天的优化方法的计算机程序产品,包括存储了处理器可执行的非易失的程序代码的计算机可读存储介质,所述程序代码包括的指令可用于执行前面方法实施例中所述的方法,具体实现可参见方法实施例,在此不再赘述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应所述以权利要求的保护范围为准。
Claims (11)
1.一种游戏内语音聊天的优化方法,其特征在于,所述游戏中包括玩家控制的第一游戏角色,所述第一游戏角色对应第一游戏客户端,所述优化方法包括:
响应针对所述游戏的第一语音输入指令,通过所述第一游戏客户端录制在当前游戏环境下的输入语音信号;
针对所述输入语音信号,实时检测每一帧所述输入语音信号中的语音特征是否包括与预先存储的标准语音特征不匹配的其他语音特征;
若检测到所述其他语音特征,则停止所述输入语音信号的录制,并从已录制的输入语音信号中剔除包括所述其他语音特征的该帧输入语音信号,得到第一输入语音信号;
响应针对所述游戏的语音发送指令,将所述第一输入语音信号发送给第二游戏角色对应的第二游戏客户端;
若检测到所述其他语音特征,则停止所述输入语音信号的录制,并从已录制的输入语音信号中剔除包括所述其他语音特征的该帧输入语音信号,得到第一输入语音信号的步骤,包括:
响应检测到所述其他语音特征,控制停止所述输入语音信号的录制;
响应停止所述输入语音信号的录制,获取已录制的输入语音信号;
对所述已录制的输入语音信号进行识别处理,并显示识别处理后的每一帧输入语音信号对应的识别文本;所述识别文本表征了所述输入语音信号的语音内容;
响应通过图形用户界面触发的针对所述已录制的输入语音信号的裁剪操作,从所述已录制的输入语音信号中裁剪掉目标帧输入语音信号,得到第一输入语音信号;其中,所述目标帧输入语音信号是根据所述识别文本确定的。
2.根据权利要求1所述的方法,其特征在于,在得到第一输入语音信号的步骤之后,所述优化方法还包括:
响应针对所述游戏的第二语音输入指令,在所述第一输入语音信号之后继续录制在当前游戏环境下的输入语音信号;
响应针对所述游戏的语音发送指令,将所述第一输入语音信号发送给第二游戏角色对应的第二游戏客户端的步骤,包括:
响应针对所述游戏的语音发送指令,确定包括所述第一输入语音信号和继续录制的第二输入语音信号的目标输入语音信号;其中,所述第二输入语音信号是对继续录制的输入语音信号进行优化处理后得到的;
将所述目标输入语音信号发送给第二游戏角色对应的第二游戏客户端。
3.根据权利要求2所述的方法,其特征在于,响应针对所述游戏的第二语音输入指令的步骤之前,所述优化方法还包括:
响应停止所述输入语音信号的录制,提示剔除的包括所述其他语音特征的该帧输入语音信号的语音内容。
4.根据权利要求1所述的优化方法,其特征在于,所述优化方法还包括:
获取已录制的完整输入语音信号;其中,所述已录制的完整输入语音信号为未经过优化处理的输入语音信号;
根据预先存储的标准语音特征,从所述已录制的完整输入语音信号中提取匹配的第三输入语音信号,并将所述第三输入语音信号转换为目标文本;
响应针对所述游戏的文本发送指令,将所述目标文本发送给第二游戏角色对应的第二游戏客户端。
5.根据权利要求4所述的优化方法,其特征在于,在将所述第三输入语音信号转换为目标文本的步骤之后,所述优化方法还包括:
基于所述游戏的预设词汇库,对所述目标文本进行校正;
响应针对所述游戏的文本发送指令,将所述目标文本发送给第二游戏角色对应的第二游戏客户端的步骤,包括:
响应针对所述游戏的文本发送指令,将校正后的所述目标文本发送给第二游戏角色对应的第二游戏客户端。
6.根据权利要求1所述的优化方法,其特征在于,所述输入语音信号的音频源为所述第一游戏客户端的麦克风,或者所述输入语音信号的音频源为所述第一游戏客户端的麦克风和游戏内部音频。
7.根据权利要求1所述的优化方法,其特征在于,所述优化方法还包括:
收集所述第一游戏客户端录制的历史语音聊天记录;
基于所述历史语音聊天记录提取所述第一游戏角色对应的标准语音特征;
将所述第一游戏角色对应的标准语音特征进行存储。
8.根据权利要求3所述的方法,其特征在于,所述第一游戏角色对应的标准语音特征包括以下至少一项:声音音色、声音响度和语音内容。
9.一种游戏内语音聊天的优化装置,其特征在于,所述游戏中包括玩家控制的第一游戏角色,所述第一游戏角色对应第一游戏客户端,所述优化装置包括:
录制模块,用于响应针对所述游戏的第一语音输入指令,通过所述第一游戏客户端录制在当前游戏环境下的输入语音信号;
检测模块,用于针对所述输入语音信号,实时检测每一帧所述输入语音信号中的语音特征是否包括与预先存储的标准语音特征不匹配的其他语音特征;
剔除模块,用于若检测到所述其他语音特征,则停止所述输入语音信号的录制,并从已录制的输入语音信号中剔除包括所述其他语音特征的该帧输入语音信号,得到第一输入语音信号;
发送模块,用于响应针对所述游戏的语音发送指令,将所述第一输入语音信号发送给第二游戏角色对应的第二游戏客户端;
剔除模块包括:
录制控制单元,用于响应检测到所述其他语音特征,控制停止所述输入语音信号的录制;
语音裁剪单元,用于响应停止所述输入语音信号的录制,获取已录制的输入语音信号;
对所述已录制的输入语音信号进行识别处理,并显示识别处理后的每一帧输入语音信号对应的识别文本;所述识别文本表征了所述输入语音信号的语音内容;
响应通过图形用户界面触发的针对所述已录制的输入语音信号的裁剪操作,从所述已录制的输入语音信号中裁剪掉目标帧输入语音信号,得到第一输入语音信号;其中,所述目标帧输入语音信号是根据所述识别文本确定的。
10.一种电子设备,其特征在于,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述机器可读指令,以执行如权利要求1至8任一所述方法的步骤。
11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如权利要求1至8任一所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110667424.3A CN113413613B (zh) | 2021-06-17 | 2021-06-17 | 一种游戏内语音聊天的优化方法、装置、电子设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110667424.3A CN113413613B (zh) | 2021-06-17 | 2021-06-17 | 一种游戏内语音聊天的优化方法、装置、电子设备及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113413613A CN113413613A (zh) | 2021-09-21 |
CN113413613B true CN113413613B (zh) | 2024-06-25 |
Family
ID=77788772
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110667424.3A Active CN113413613B (zh) | 2021-06-17 | 2021-06-17 | 一种游戏内语音聊天的优化方法、装置、电子设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113413613B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114095548A (zh) * | 2021-11-18 | 2022-02-25 | 中国人民解放军陆军装甲兵学院士官学校 | 一种基于通讯网络的多人语音协同系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107115668A (zh) * | 2017-04-25 | 2017-09-01 | 合肥泽诺信息科技有限公司 | 基于语音识别的网络游戏在线交互系统 |
CN110516265A (zh) * | 2019-08-31 | 2019-11-29 | 青岛谷力互联科技有限公司 | 一种基于智能语音的单一识别实时翻译系统 |
CN112562681A (zh) * | 2020-12-02 | 2021-03-26 | 腾讯科技(深圳)有限公司 | 语音识别方法和装置、存储介质 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106683661B (zh) * | 2015-11-05 | 2021-02-05 | 阿里巴巴集团控股有限公司 | 基于语音的角色分离方法及装置 |
CN107068144A (zh) * | 2016-01-08 | 2017-08-18 | 王道平 | 一种语音识别中便于人工修改文字的方法 |
KR101818980B1 (ko) * | 2016-12-12 | 2018-01-16 | 주식회사 소리자바 | 다중 화자 음성 인식 수정 시스템 |
CN108831440A (zh) * | 2018-04-24 | 2018-11-16 | 中国地质大学(武汉) | 一种基于机器学习及深度学习的声纹降噪方法及系统 |
CN111105798B (zh) * | 2018-10-29 | 2023-08-18 | 宁波方太厨具有限公司 | 基于语音识别的设备控制方法 |
KR20190101325A (ko) * | 2019-08-12 | 2019-08-30 | 엘지전자 주식회사 | 지능적 음성 인식 방법, 음성 인식 장치 및 지능형 컴퓨팅 디바이스 |
CN112071329B (zh) * | 2020-09-16 | 2022-09-16 | 腾讯科技(深圳)有限公司 | 一种多人的语音分离方法、装置、电子设备和存储介质 |
-
2021
- 2021-06-17 CN CN202110667424.3A patent/CN113413613B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107115668A (zh) * | 2017-04-25 | 2017-09-01 | 合肥泽诺信息科技有限公司 | 基于语音识别的网络游戏在线交互系统 |
CN110516265A (zh) * | 2019-08-31 | 2019-11-29 | 青岛谷力互联科技有限公司 | 一种基于智能语音的单一识别实时翻译系统 |
CN112562681A (zh) * | 2020-12-02 | 2021-03-26 | 腾讯科技(深圳)有限公司 | 语音识别方法和装置、存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN113413613A (zh) | 2021-09-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6538846B2 (ja) | 音声情報を処理するための方法及び装置 | |
CN105657535B (zh) | 一种音频识别方法和装置 | |
US10270736B2 (en) | Account adding method, terminal, server, and computer storage medium | |
EP3309783A1 (en) | Communication method, and electronic device therefor | |
CN109979474B (zh) | 语音设备及其用户语速修正方法、装置和存储介质 | |
JP2017203808A (ja) | 対話処理プログラム、対話処理方法および情報処理装置 | |
US20210118464A1 (en) | Method and apparatus for emotion recognition from speech | |
CN111667835A (zh) | 语音识别方法、活体检测方法、模型训练方法及装置 | |
CN111343028A (zh) | 配网控制方法及装置 | |
JP6915637B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
CN113413613B (zh) | 一种游戏内语音聊天的优化方法、装置、电子设备及介质 | |
CN115150660B (zh) | 一种基于字幕的视频编辑方法和相关设备 | |
US20150310859A1 (en) | Method and Apparatus For Passive Data Acquisition In Speech Recognition and Natural Language Understanding | |
CN110503941B (zh) | 语言能力评测方法、装置、系统、计算机设备及存储介质 | |
CN112966090B (zh) | 对话音频数据处理方法、电子设备和计算机可读存储介质 | |
CN117238288A (zh) | 车辆控制方法和车辆 | |
CN110660393B (zh) | 语音交互方法、装置、设备及存储介质 | |
CN109271480B (zh) | 一种语音搜题方法及电子设备 | |
US20230245650A1 (en) | Using canonical utterances for text or voice communication | |
CN110661923A (zh) | 一种在会议中记录发言信息的方法和装置 | |
CN111968630B (zh) | 信息处理方法、装置和电子设备 | |
CN111986680A (zh) | 对象的口语评测方法和装置、存储介质和电子装置 | |
CN110838211A (zh) | 语音抢答方法、装置和系统 | |
CN117153185B (zh) | 通话处理方法、装置、计算机设备和存储介质 | |
CN115346533A (zh) | 基于声纹的账号判别方法、系统、电子设备和介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |