CN112771608A - 语音信息的处理方法、装置、存储介质及电子设备 - Google Patents

语音信息的处理方法、装置、存储介质及电子设备 Download PDF

Info

Publication number
CN112771608A
CN112771608A CN201880098316.5A CN201880098316A CN112771608A CN 112771608 A CN112771608 A CN 112771608A CN 201880098316 A CN201880098316 A CN 201880098316A CN 112771608 A CN112771608 A CN 112771608A
Authority
CN
China
Prior art keywords
target
spectrogram
voice information
preset
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201880098316.5A
Other languages
English (en)
Inventor
陈岩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Oppo Mobile Telecommunications Corp Ltd
Shenzhen Huantai Technology Co Ltd
Original Assignee
Guangdong Oppo Mobile Telecommunications Corp Ltd
Shenzhen Huantai Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Oppo Mobile Telecommunications Corp Ltd, Shenzhen Huantai Technology Co Ltd filed Critical Guangdong Oppo Mobile Telecommunications Corp Ltd
Publication of CN112771608A publication Critical patent/CN112771608A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/065Adaptation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/27Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Signal Processing (AREA)
  • Telephone Function (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本申请实施例公开了一种语音信息的处理方法、装置、存储介质及电子设备,该处理方法包括构建预设场景模型;训练生成场景识别模型;采集当前环境中的目标语音信息并分析得到相应的目标语谱图;将目标语谱图输入场景识别模型确定目标预设场景模型,并根据目标预设场景模型匹配相应的通话参数。提升了语音信息的处理效率。

Description

PCT国内申请,说明书已公开。

Claims (20)

  1. PCT国内申请,权利要求书已公开。
CN201880098316.5A 2018-11-20 2018-11-20 语音信息的处理方法、装置、存储介质及电子设备 Pending CN112771608A (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2018/116447 WO2020102979A1 (zh) 2018-11-20 2018-11-20 语音信息的处理方法、装置、存储介质及电子设备

Publications (1)

Publication Number Publication Date
CN112771608A true CN112771608A (zh) 2021-05-07

Family

ID=70773731

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201880098316.5A Pending CN112771608A (zh) 2018-11-20 2018-11-20 语音信息的处理方法、装置、存储介质及电子设备

Country Status (2)

Country Link
CN (1) CN112771608A (zh)
WO (1) WO2020102979A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113370923A (zh) * 2021-07-23 2021-09-10 深圳市元征科技股份有限公司 一种车辆配置的调整方法、装置、电子设备及存储介质

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102360187A (zh) * 2011-05-25 2012-02-22 吉林大学 语谱图互相关的驾驶员汉语语音控制系统及方法
US20130121495A1 (en) * 2011-09-09 2013-05-16 Gautham J. Mysore Sound Mixture Recognition
CN103632682A (zh) * 2013-11-20 2014-03-12 安徽科大讯飞信息科技股份有限公司 一种音频特征检测的方法
CN103903616A (zh) * 2012-12-25 2014-07-02 联想(北京)有限公司 一种信息处理的方法及电子设备
CN105208174A (zh) * 2015-09-06 2015-12-30 上海智臻智能网络科技股份有限公司 语音通信的方法、装置及拨号系统
CN105810197A (zh) * 2014-12-30 2016-07-27 联想(北京)有限公司 语音处理方法、语音处理装置和电子设备
CN105845131A (zh) * 2016-04-11 2016-08-10 乐视控股(北京)有限公司 远讲语音识别方法及装置
CN106201312A (zh) * 2016-06-30 2016-12-07 北京奇虎科技有限公司 一种应用处理方法、装置及终端
CN106558318A (zh) * 2015-09-24 2017-04-05 阿里巴巴集团控股有限公司 音频识别方法和系统
CN108764304A (zh) * 2018-05-11 2018-11-06 Oppo广东移动通信有限公司 场景识别方法、装置、存储介质及电子设备

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102360187A (zh) * 2011-05-25 2012-02-22 吉林大学 语谱图互相关的驾驶员汉语语音控制系统及方法
US20130121495A1 (en) * 2011-09-09 2013-05-16 Gautham J. Mysore Sound Mixture Recognition
CN103903616A (zh) * 2012-12-25 2014-07-02 联想(北京)有限公司 一种信息处理的方法及电子设备
CN103632682A (zh) * 2013-11-20 2014-03-12 安徽科大讯飞信息科技股份有限公司 一种音频特征检测的方法
CN105810197A (zh) * 2014-12-30 2016-07-27 联想(北京)有限公司 语音处理方法、语音处理装置和电子设备
CN105208174A (zh) * 2015-09-06 2015-12-30 上海智臻智能网络科技股份有限公司 语音通信的方法、装置及拨号系统
CN106558318A (zh) * 2015-09-24 2017-04-05 阿里巴巴集团控股有限公司 音频识别方法和系统
CN105845131A (zh) * 2016-04-11 2016-08-10 乐视控股(北京)有限公司 远讲语音识别方法及装置
CN106201312A (zh) * 2016-06-30 2016-12-07 北京奇虎科技有限公司 一种应用处理方法、装置及终端
CN108764304A (zh) * 2018-05-11 2018-11-06 Oppo广东移动通信有限公司 场景识别方法、装置、存储介质及电子设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113370923A (zh) * 2021-07-23 2021-09-10 深圳市元征科技股份有限公司 一种车辆配置的调整方法、装置、电子设备及存储介质
CN113370923B (zh) * 2021-07-23 2023-11-03 深圳市元征科技股份有限公司 一种车辆配置的调整方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
WO2020102979A1 (zh) 2020-05-28

Similar Documents

Publication Publication Date Title
US11798531B2 (en) Speech recognition method and apparatus, and method and apparatus for training speech recognition model
CN110544488B (zh) 一种多人语音的分离方法和装置
CN109087669B (zh) 音频相似度检测方法、装置、存储介质及计算机设备
CN110310623B (zh) 样本生成方法、模型训练方法、装置、介质及电子设备
CN107705778B (zh) 音频处理方法、装置、存储介质以及终端
WO2021135628A1 (zh) 语音信号的处理方法、语音分离方法
EP3528243A1 (en) System for processing user utterance and controlling method thereof
WO2021114847A1 (zh) 网络通话方法、装置、计算机设备及存储介质
CN111124108B (zh) 模型训练方法、手势控制方法、装置、介质及电子设备
CN111261144A (zh) 一种语音识别的方法、装置、终端以及存储介质
CN111063342A (zh) 语音识别方法、装置、计算机设备及存储介质
CN109885162B (zh) 振动方法及移动终端
CN110364156A (zh) 语音交互方法、系统、终端及可读存储介质
CN112751648A (zh) 一种丢包数据恢复方法和相关装置
KR20200094732A (ko) 시계열 데이터를 분류하기 위한 방법 및 시스템
CN111722696B (zh) 用于低功耗设备的语音数据处理方法和装置
CN111522592A (zh) 一种基于人工智能的智能终端唤醒方法和装置
CN113225624A (zh) 一种语音识别耗时确定方法和装置
CN112771608A (zh) 语音信息的处理方法、装置、存储介质及电子设备
CN109064720B (zh) 位置提示方法、装置、存储介质及电子设备
CN108922523B (zh) 位置提示方法、装置、存储介质及电子设备
US11862158B2 (en) Method and apparatus for controlling device, and readable storage medium
CN114708849A (zh) 语音处理方法、装置、计算机设备及计算机可读存储介质
CN114758672A (zh) 一种音频生成方法、装置以及电子设备
WO2020102943A1 (zh) 手势识别模型的生成方法、装置、存储介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination