CN106782517A - 一种语音音频关键词过滤方法及装置 - Google Patents

一种语音音频关键词过滤方法及装置 Download PDF

Info

Publication number
CN106782517A
CN106782517A CN201611163401.4A CN201611163401A CN106782517A CN 106782517 A CN106782517 A CN 106782517A CN 201611163401 A CN201611163401 A CN 201611163401A CN 106782517 A CN106782517 A CN 106782517A
Authority
CN
China
Prior art keywords
keyword
audio file
word
audio
speech audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201611163401.4A
Other languages
English (en)
Inventor
方磊
张燕鹏
陈学
田原
黄硕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
MIGU Digital Media Co Ltd
Original Assignee
MIGU Digital Media Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by MIGU Digital Media Co Ltd filed Critical MIGU Digital Media Co Ltd
Priority to CN201611163401.4A priority Critical patent/CN106782517A/zh
Publication of CN106782517A publication Critical patent/CN106782517A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/14Speech classification or search using statistical models, e.g. Hidden Markov Models [HMMs]
    • G10L15/142Hidden Markov Models [HMMs]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/54Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for retrieval

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Signal Processing (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了一种语音音频关键词过滤方法,包括:识别语音音频中是否存在预先设定的关键词;对识别出的语音音频关键词所对应的音频进行替换,并将替换的音频文件与原语音音频除关键词之外音频文件重新拼合为一个语音音频文件。本发明还公开了一种语音音频关键词过滤装置。

Description

一种语音音频关键词过滤方法及装置
技术领域
本发明涉及语音识别技术领域,尤其涉及一种语音音频关键词过滤方法及装置。
背景技术
目前,对有声数字内容出版作品的审查,一般是由人工进行审核内容的安全性,而这种方式需要耗费大量的人力成本;并且,人工审核容易受到审核人员编辑水平和能力的限制,而无法全部审核出不符合公开出版的关键词;即使检测出关键词后,还需要对该审核的出版作品进行再一次录音。显然,这种人工审核方法消耗了大量的人力和物力,效率不高。
发明内容
有鉴于此,本发明实施例期望提供一种语音音频关键词过滤方法及装置,能自动替换审查对象中的非法内容,减少审查过程中的工作量,提高审查效率。
为达到上述目的,本发明实施例提供了一种语音音频关键词过滤方法,所述方法包括:
识别语音音频中是否存在预先设定的关键词;
对识别出的语音音频关键词所对应的音频进行替换,并将替换的音频文件与原语音音频除关键词之外音频文件重新拼合为一个语音音频文件。
上述方案中,所述识别语音音频中是否存在预先设定的关键词包括:
将语音音频分割为单音节,识别转换为单个文字;
将所述单个文字与关键词库进行对比,识别出是否为关键词的首个字;
如果是,则将所述单个文字向后拓展为词,再与关键词库进行对比,识别出关键词;
如果不是,则将下一个音节转换为的单个文字与关键词库进行对比,识别出是否为关键词的首个字。
上述方案中,所述方法还包括:在将语音音频分割为单音节,识别转换为单个文字的过程中,将识别出来的文字和每个文字代表音节的起止时间进行标记。
上述方案中,所述对识别出的语音音频关键词所对应的音频进行替换,并将替换的音频文件与原语音音频除关键词之外音频文件重新拼合为一个语音音频文件包括:
将识别出的关键词在语音音频中起始时间位置和中止时间位置转换为数字记录文件并存储;
根据所述数字记录文件分割语音音频文件,针对每个关键词将原语音音频分为关键词前对应的音频文件、关键词对应的音频文件和关键词后对应的音频文件三段,将每个关键词分割出的音频文件用非自然音的音频文件替换;
将关键词前对应的音频文件、替换的音频文件、以及关键词后对应的音频文件拼合为一个语音音频文件。
本发明实施例还提供了一种语音音频关键词过滤装置,所述装置包括:
识别模块,用于识别语音音频中是否存在预先设定的关键词;
处理模块,用于对识别出的语音音频关键词进行替换,并将替换的音频文件与原语音音频除关键词之外音频文件重新拼合为一个语音音频文件。
上述方案中,所述识别模块还用于:
将语音音频分割为单音节,识别转换为单个文字;
将所述单个文字与关键词库进行对比,识别出是否为关键词的首个字;
如果是,则将所述单个文字向后拓展为词,再与关键词库进行对比,识别出关键词;
如果不是,则将下一个音节转换为的单个文字与关键词库进行对比,识别出是否为关键词的首个字。
上述方案中,还用于在将语音音频分割为单音节,识别转换为单个文字的过程中,将识别出来的文字和每个文字代表音节的起止时间进行标记。
上述方案中,所述处理模块,具体用于将识别出的关键词在语音音频中起始时间位置和中止时间位置转换为数字记录文件并存储;
根据所述数字记录文件分割语音音频文件,针对每个关键词将原语音音频分为关键词前对应的音频文件、关键词对应的音频文件和关键词后对应的音频文件三段,将每个关键词分割出的音频文件用非自然音的音频文件替换;
将关键词前对应的音频文件、替换的音频文件、以及关键词后对应的音频文件拼合为一个语音音频文件。
本发明实施例提供的语音音频关键词过滤方法及装置,通过识别语音音频中是否存在预先设定的关键词;对识别出的语音音频关键词进行替换,并将替换的音频文件与原语音音频除关键词之外音频文件重新拼合为一个语音音频文件。如此,能够自动替换审查对象中的非法内容,如审查出版作品中不符合公开出版的内容,从而可以大大减少数字出版作品审查过程中的审查工作量,缩短审查时间,提高审查效率。
附图说明
图1为本发明实施例语音音频关键词过滤方法实现流程示意图;
图2为本发明实施例语音音频关键词过滤装置结构示意图;
图3为本发明实施例识别语音关键词流程示意图;
图4为本发明实施例对语音音频分割和标记示意图;
图5为本发明实施例语音音频关键词过滤方法完整流程示意图。
具体实施方式
图1为本发明实施例语音音频关键词过滤方法实现流程示意图,如图1所示,本发明实施例语音音频关键词过滤方法包括以下步骤:
步骤101:识别语音音频中是否存在预先设定的关键词;
这里,可以将审查对象中可能存在的非法内容可能采用的关键词作为预先设定的关键词,比如出版作品中不符合公开出版的内容,这类内容通常会采用的常见关键词作为预先设定的关键词,用于识别内容是否为合法内容;若干个预先设定的关键词构成关键词库,可供查找,其中所述关键词可以是单字,也可以是多个字组成的词。
本步骤可采用现有的语音识别(Speech Recognize)技术识别语音音频,所谓语音识别技术,是让机器通过识别和理解过程使其能听懂人类语言的技术;语音识别技术是信息技术中人机交互的关键技术,目前已经在呼叫中心、电信增值业务、企业信息化系统中有了广泛的应用。随着语音识别在语音搜索、语音控制等全新应用领域的深入应用,语音识别技术被业界权威人士誉为有可能引发人机界面领域革命的关键技术。目前,语音识别技术已经可以进行针对长时间音频进行语音转换文字,再通过文字的信息服务特定的应用。
具体语音识别工具可以采用隐性马尔科夫(HMM,Hidden Markov Model)模型,HMM模型是语音识别领域广泛采用的统计学模型,能表示出语音信号的时变特征和随机特征,能适应各种变化的发音,进而适合非特定人的大词汇量连续语音的识别工作。
本步骤中,具体的,所述识别语音音频关键词包括:将语音音频分割为单音节,识别转换为单个文字;
将所述单个文字与关键词库进行对比,识别出是否为关键词的首个字;如果是,则将所述单个文字向后拓展为词,再与关键词库进行对比,识别出关键词;
如果不是,则将下一个音节转换为的单个文字与关键词库进行对比,识别出是否为关键词的首个字;
循环上述步骤,依次对语音音频转换成的文字进行逐个扫描。
步骤102:对识别出的语音音频关键词进行替换,并将替换的音频文件与原语音音频除关键词之外音频文件重新拼合为一个语音音频文件。
具体的,本步骤包括:将识别出的关键词在语音音频中起始时间位置和中止时间位置转换为数字记录文件并存储;
根据所述数字记录文件分割语音音频文件,针对每个关键词将原语音音频分为关键词前对应的音频文件、关键词对应的音频文件和关键词后对应的音频文件三段,将每个关键词分割出的音频文件用非自然音的音频文件替换;
之后,将关键词前对应的音频文件、替换的音频文件、以及关键词后对应的音频文件,根据各个关键词所在的位置重新拼合为一个新的语音音频文件。
图2为本发明实施例语音音频关键词过滤装置结构示意图,如图2所示,本发明实施例语音音频关键词过滤装置包括:识别模块201、处理模块202;其中,
识别模块201,识别语音音频中是否存在预先设定的关键词;
处理模块202,对识别出的语音音频关键词进行替换,并将替换的音频文件与原语音音频除关键词之外音频文件重新拼合为一个语音音频文件;
其中,所述识别模块201还用于:
将语音音频分割为单音节,识别转换为单个文字;
将所述单个文字与关键词库进行对比,识别出是否为关键词的首个字;
如果是,则将所述单个文字向后拓展为词,再与关键词库进行对比,识别出关键词;
如果不是,则将下一个音节转换为的单个文字与关键词库进行对比,识别出是否为关键词的首个字。
所述识别模块201,还用于在将语音音频分割为单音节,识别转换为单个文字的过程中,将识别出来的文字和每个文字代表音节的起止时间进行标记;
这里,所述起止时间包括起始时间和中止时间。
所述处理模块202,具体用于将识别出的关键词在语音音频中起始时间位置和中止时间位置转换为数字记录文件并存储;
根据所述数字记录文件分割语音音频文件,针对每个关键词将原语音音频分为关键词前对应的音频文件、关键词对应的音频文件和关键词后对应的音频文件三段,将每个关键词分割出的音频文件用非自然音的音频文件替换;
将关键词前对应的音频文件、替换的音频文件、以及关键词后对应的音频文件,根据各个关键词所在的位置重新拼合为一个语音音频文件。
图3为本发明实施例识别语音关键词流程示意图,如图3所示,本发明实施例识别语音关键词流程包括以下步骤:
步骤301:将语音音频分割为单音节,识别转换为单个文字;
这里,对于语音音频,每一个汉字都对应一个音节,将音节作为识别单位能让识别更加灵活和准确,通过对语音音频分割为单个的音节,再将音节与汉字相对应,这样便实现了语音转换为文字的过程,这是关键词检测的前提条件;
步骤302:将所述单个文字与关键词库进行对比,识别出是否为关键词的首个字,如果是,执行步骤303;如果否,则向后移动一个音节返回步骤302继续检测;
这里,首先对语音音频进行“字”级识别,若识别结果为关键词的首个字,执行步骤303;
步骤303:当前单个文字向后扩展为词;
步骤304:判断当前词是否为关键词,如果是,执行步骤305;如果否,向后移动N个音节,返回步骤302继续检测下一个单音节转换为的文字;
这里,对扩展后的音节再进行“词”级识别,进一步判断是否为关键词;
步骤305:标记检测出的关键词在音频中的时间位置,并返回步骤302继续检测;
这里,本发明实施例中使用语音分形维数(Fractal Dimension)参数,同时结合语音短时平均能量和短时平均过零率这两种参数对语音音频进行分割,实验表明使用上述参数可以对语音音频分割准确率达到85%以上,图4为本发明实施例对语音音频分割和标记示意图,如图4所示,使用上述参数对语音音频进行分割形成音节波形和起止时间标记;所述起止时间包括起始时间和中止时间。
图5为本发明实施例语音音频关键词过滤方法完整流程示意图,如图5所示,本发明实施例语音音频关键词过滤方法完整流程包括以下步骤:
步骤501:输入语音音频;
将语音音频输入到本发明实施例语音音频关键词过滤装置中;
步骤502:语音识别;
其中,语音识别过程包括:将语音音频分割为单音节,识别转换为单个文字;
在实际应用中,对语音音频进行语音识别过程可以使用了数据准备、模型训练、识别测试等方法进行识别;其中,
数据准备是用来将采集的语音文件转换成可以被系统处理的用于训练的数据文件,包含:语音特征参数提取过程,主要提取语音的梅尔倒谱系数(MFCC,Mel-scaleFrequency Cepstral Coefficients),其中,MFCC充分考虑的人耳的听觉特性,不仅能提高抗噪性能,而且能突出包含语音大部分信息的低频部分,有利于提高语音识别性能,对于动态性比较强的辅音,MFCC也可以能够进行很好的识别;
训练模型主要是基于Baum-Welch算法,在模型训练之前先确定隐马尔科夫模型(HMM,Hidden Markov Model)的拓扑结构,并以文本的形式进行保存,然后对语音识别模块建立HMM模型;
识别测试主要应用Viterbi算法在语音识别单元中队语音进行识别;
整个语音识别过程就是在语音数据转化之后,使用模型训练根据这些数据和相关的文本文件估计出HMM模型的参数,根据这些训练产生的模型利用识别模块将语音数据转换成相应的文字,供关键词识别使用;
步骤503:关键词识别;
其中,关键词识别过程包括:
将语音音频分割为单音节,识别转换为单个文字;
将所述单个文字与关键词库进行对比,识别出是否为关键词的首个字;
如果是,则将所述单个文字向后拓展为词,再与关键词库进行对比,识别出关键词;
如果不是,则将下一个音节转换为的单个文字与关键词库进行对比,识别出是否为关键词的首个字。
步骤504:关键词音频替换;
其中,关键词替换过程包括:将识别出的关键词在语音音频中起始和中止时间位置转换为数字记录文件并存储;根据所述数字记录文件分割语音音频文件,针对每个关键词将原语音音频分为关键词前对应的音频文件、关键词对应的音频文件和关键词后对应的音频文件三段,将每个关键词分割出的音频文件用非自然音(例如:嘀、哔等音频)的音频文件替换;
步骤505:音频拼合;
其中,音频合成过程包括:将关键词前对应的音频文件、替换的音频文件、以及关键词后对应的音频文件,根据各个关键词所在的位置重新拼合为一个语音音频文件;
步骤506:输出语音音频;
如此,获得的语音音频中的关键词自动被替换为非自然音;
通过上述步骤,先将语音音频进行文本识别后,将识别的文本与关键词库中的关键词进行匹配,并同时标记匹配文字相关的起止时间,将标记的音节进行非自然音替换;所述起止时间包括起始时间和中止时间。如此,能够降低数字出版作品审查的工作量,提高审查效率。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。

Claims (8)

1.一种语音音频关键词过滤方法,其特征在于,所述方法包括:
识别语音音频中是否存在预先设定的关键词;
对识别出的语音音频关键词所对应的音频进行替换,并将替换的音频文件与原语音音频除关键词之外音频文件重新拼合为一个语音音频文件。
2.根据权利要求1所述的方法,其特征在于,所述识别语音音频中是否存在预先设定的关键词包括:
将语音音频分割为单音节,识别转换为单个文字;
将所述单个文字与关键词库进行对比,识别出是否为关键词的首个字;
如果是,则将所述单个文字向后拓展为词,再与关键词库进行对比,识别出关键词;
如果不是,则将下一个音节转换为的单个文字与关键词库进行对比,识别出是否为关键词的首个字。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:在将语音音频分割为单音节,识别转换为单个文字的过程中,将识别出来的文字和每个文字代表音节的起止时间进行标记。
4.根据权利要求1、2或3所述的方法,其特征在于,所述对识别出的语音音频关键词所对应的音频进行替换,并将替换的音频文件与原语音音频除关键词之外音频文件重新拼合为一个语音音频文件包括:
将识别出的关键词在语音音频中起始时间位置和中止时间位置转换为数字记录文件并存储;
根据所述数字记录文件分割语音音频文件,针对每个关键词将原语音音频分为关键词前对应的音频文件、关键词对应的音频文件和关键词后对应的音频文件三段,将每个关键词分割出的音频文件用非自然音的音频文件替换;
将关键词前对应的音频文件、替换的音频文件、以及关键词后对应的音频文件拼合为一个语音音频文件。
5.一种语音音频关键词过滤装置,其特征在于,所述装置包括:
识别模块,用于识别语音音频中是否存在预先设定的关键词;
处理模块,用于对识别出的语音音频关键词进行替换,并将替换的音频文件与原语音音频除关键词之外音频文件重新拼合为一个语音音频文件。
6.根据权利要求5所述的装置,其特征在于,所述识别模块还用于:
将语音音频分割为单音节,识别转换为单个文字;
将所述单个文字与关键词库进行对比,识别出是否为关键词的首个字;
如果是,则将所述单个文字向后拓展为词,再与关键词库进行对比,识别出关键词;
如果不是,则将下一个音节转换为的单个文字与关键词库进行对比,识别出是否为关键词的首个字。
7.根据权利要求6所述的装置,其特征在于,所述识别模块,还用于在将语音音频分割为单音节,识别转换为单个文字的过程中,将识别出来的文字和每个文字代表音节的起止时间进行标记。
8.根据权利要求5、6或7所述的装置,其特征在于,所述处理模块,具体用于将识别出的关键词在语音音频中起始时间位置和中止时间位置转换为数字记录文件并存储;
根据所述数字记录文件分割语音音频文件,针对每个关键词将原语音音频分为关键词前对应的音频文件、关键词对应的音频文件和关键词后对应的音频文件三段,将每个关键词分割出的音频文件用非自然音的音频文件替换;
将关键词前对应的音频文件、替换的音频文件、以及关键词后对应的音频文件拼合为一个语音音频文件。
CN201611163401.4A 2016-12-15 2016-12-15 一种语音音频关键词过滤方法及装置 Pending CN106782517A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611163401.4A CN106782517A (zh) 2016-12-15 2016-12-15 一种语音音频关键词过滤方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611163401.4A CN106782517A (zh) 2016-12-15 2016-12-15 一种语音音频关键词过滤方法及装置

Publications (1)

Publication Number Publication Date
CN106782517A true CN106782517A (zh) 2017-05-31

Family

ID=58892698

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611163401.4A Pending CN106782517A (zh) 2016-12-15 2016-12-15 一种语音音频关键词过滤方法及装置

Country Status (1)

Country Link
CN (1) CN106782517A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107729441A (zh) * 2017-09-30 2018-02-23 北京酷我科技有限公司 一种音频文件的处理方法及系统
CN107919138A (zh) * 2017-11-30 2018-04-17 维沃移动通信有限公司 一种语音中的情绪处理方法及移动终端
CN109600299A (zh) * 2018-11-19 2019-04-09 维沃移动通信有限公司 一种消息发送方法及终端
CN110334244A (zh) * 2019-07-11 2019-10-15 出门问问信息科技有限公司 一种数据处理的方法、装置及电子设备
CN113179442A (zh) * 2021-04-20 2021-07-27 浙江工业大学 一种基于语音识别的视频中音频流替换方法
CN114999438A (zh) * 2021-05-08 2022-09-02 中移互联网有限公司 音频播放方法及装置

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1352450A (zh) * 2000-11-15 2002-06-05 中国科学院自动化研究所 中国人名、地名和单位名的语音识别方法
CN1504927A (zh) * 2002-11-28 2004-06-16 深圳麦士威科技有限公司 用于电子地图查询系统的智能检索方法
CN1703923A (zh) * 2002-10-18 2005-11-30 中国科学院声学研究所 一种便携式数字移动通讯设备及其语音控制方法和系统
CN101110077A (zh) * 2007-08-24 2008-01-23 新诺亚舟科技(深圳)有限公司 在手持学习终端上实现的联合搜索的方法
CN102122286A (zh) * 2010-04-01 2011-07-13 武汉福来尔科技有限公司 在手持学习终端上实现的聚合式搜索的方法
CN102298585A (zh) * 2010-06-24 2011-12-28 高德软件有限公司 一种地址切分及级别标注方法和地址切分及级别标注装置
CN102480561A (zh) * 2010-11-30 2012-05-30 希姆通信息技术(上海)有限公司 不雅语音屏蔽装置及其方法
CN102760436A (zh) * 2012-08-09 2012-10-31 河南省烟草公司开封市公司 一种语音词库筛选方法
CN103067608A (zh) * 2013-01-23 2013-04-24 广东欧珀移动通信有限公司 一种移动终端查找通话记录的方法及系统
CN103294776A (zh) * 2013-05-13 2013-09-11 浙江大学 一种智能手机通讯录模糊搜索的方法
CN103324722A (zh) * 2013-06-27 2013-09-25 苏州创智宏云信息科技有限公司 一种信息搜索系统
CN103793515A (zh) * 2014-02-11 2014-05-14 安徽科大讯飞信息科技股份有限公司 一种客服语音智能搜索和分析系统及方法
CN105843950A (zh) * 2016-04-12 2016-08-10 乐视控股(北京)有限公司 敏感词过滤方法及装置
CN106098063A (zh) * 2016-07-01 2016-11-09 海信集团有限公司 一种语音控制方法、终端设备和服务器

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1352450A (zh) * 2000-11-15 2002-06-05 中国科学院自动化研究所 中国人名、地名和单位名的语音识别方法
CN1703923A (zh) * 2002-10-18 2005-11-30 中国科学院声学研究所 一种便携式数字移动通讯设备及其语音控制方法和系统
CN1504927A (zh) * 2002-11-28 2004-06-16 深圳麦士威科技有限公司 用于电子地图查询系统的智能检索方法
CN101110077A (zh) * 2007-08-24 2008-01-23 新诺亚舟科技(深圳)有限公司 在手持学习终端上实现的联合搜索的方法
CN102122286A (zh) * 2010-04-01 2011-07-13 武汉福来尔科技有限公司 在手持学习终端上实现的聚合式搜索的方法
CN102298585A (zh) * 2010-06-24 2011-12-28 高德软件有限公司 一种地址切分及级别标注方法和地址切分及级别标注装置
CN102480561A (zh) * 2010-11-30 2012-05-30 希姆通信息技术(上海)有限公司 不雅语音屏蔽装置及其方法
CN102760436A (zh) * 2012-08-09 2012-10-31 河南省烟草公司开封市公司 一种语音词库筛选方法
CN103067608A (zh) * 2013-01-23 2013-04-24 广东欧珀移动通信有限公司 一种移动终端查找通话记录的方法及系统
CN103294776A (zh) * 2013-05-13 2013-09-11 浙江大学 一种智能手机通讯录模糊搜索的方法
CN103324722A (zh) * 2013-06-27 2013-09-25 苏州创智宏云信息科技有限公司 一种信息搜索系统
CN103793515A (zh) * 2014-02-11 2014-05-14 安徽科大讯飞信息科技股份有限公司 一种客服语音智能搜索和分析系统及方法
CN105843950A (zh) * 2016-04-12 2016-08-10 乐视控股(北京)有限公司 敏感词过滤方法及装置
CN106098063A (zh) * 2016-07-01 2016-11-09 海信集团有限公司 一种语音控制方法、终端设备和服务器

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107729441A (zh) * 2017-09-30 2018-02-23 北京酷我科技有限公司 一种音频文件的处理方法及系统
CN107919138A (zh) * 2017-11-30 2018-04-17 维沃移动通信有限公司 一种语音中的情绪处理方法及移动终端
CN107919138B (zh) * 2017-11-30 2021-01-08 维沃移动通信有限公司 一种语音中的情绪处理方法及移动终端
CN109600299A (zh) * 2018-11-19 2019-04-09 维沃移动通信有限公司 一种消息发送方法及终端
CN110334244A (zh) * 2019-07-11 2019-10-15 出门问问信息科技有限公司 一种数据处理的方法、装置及电子设备
CN110334244B (zh) * 2019-07-11 2020-06-09 出门问问信息科技有限公司 一种数据处理的方法、装置及电子设备
CN113179442A (zh) * 2021-04-20 2021-07-27 浙江工业大学 一种基于语音识别的视频中音频流替换方法
CN113179442B (zh) * 2021-04-20 2022-04-29 浙江工业大学 一种基于语音识别的视频中音频流替换方法
CN114999438A (zh) * 2021-05-08 2022-09-02 中移互联网有限公司 音频播放方法及装置
CN114999438B (zh) * 2021-05-08 2023-08-15 中移互联网有限公司 音频播放方法及装置

Similar Documents

Publication Publication Date Title
CN109410914B (zh) 一种赣方言语音和方言点识别方法
CN107369440B (zh) 一种针对短语音的说话人识别模型的训练方法及装置
CN106782517A (zh) 一种语音音频关键词过滤方法及装置
CN107680601B (zh) 一种基于语谱图和音素检索的身份同一性检验方法及装置
CN107945805B (zh) 一种智能化跨语言语音识别转化方法
CN105938716A (zh) 一种基于多精度拟合的样本复制语音自动检测方法
CN109192224B (zh) 一种语音评测方法、装置、设备及可读存储介质
US9495955B1 (en) Acoustic model training
CN106782508A (zh) 语音音频的切分方法和语音音频的切分装置
CN104464724A (zh) 一种针对刻意伪装语音的说话人识别方法
CN105374352A (zh) 一种语音激活方法及系统
JP5017534B2 (ja) 飲酒状態判定装置及び飲酒状態判定方法
CN111105785A (zh) 一种文本韵律边界识别的方法及装置
CN112614514B (zh) 有效语音片段检测方法、相关设备及可读存储介质
CN106653002A (zh) 一种文字直播方法及平台
CN105810205A (zh) 一种语音处理方法及装置
JP2012194245A (ja) 音声認識装置、音声認識方法及び音声認識プログラム
CN1841496A (zh) 测量语速的方法和装置以及录音设备
CN109300339A (zh) 一种英语口语的练习方法及系统
US20150058005A1 (en) Automatic Collection of Speaker Name Pronunciations
Shah et al. Effectiveness of PLP-based phonetic segmentation for speech synthesis
CN110019741A (zh) 问答系统答案匹配方法、装置、设备及可读存储介质
CN109074809B (zh) 信息处理设备、信息处理方法和计算机可读存储介质
CN115240655A (zh) 一种基于深度学习的中文语音识别系统及方法
CN112466287B (zh) 一种语音分割方法、装置以及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170531