CN109104258B - 一种基于关键词识别的无线电识别方法 - Google Patents
一种基于关键词识别的无线电识别方法 Download PDFInfo
- Publication number
- CN109104258B CN109104258B CN201810810283.4A CN201810810283A CN109104258B CN 109104258 B CN109104258 B CN 109104258B CN 201810810283 A CN201810810283 A CN 201810810283A CN 109104258 B CN109104258 B CN 109104258B
- Authority
- CN
- China
- Prior art keywords
- model
- radio
- language model
- establishing
- radio broadcast
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 33
- 241000252794 Sphinx Species 0.000 claims description 8
- 239000000758 substrate Substances 0.000 claims description 5
- 230000006870 function Effects 0.000 claims description 4
- 238000000605 extraction Methods 0.000 claims description 3
- 239000011159 matrix material Substances 0.000 claims description 3
- 230000005540 biological transmission Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04H—BROADCAST COMMUNICATION
- H04H20/00—Arrangements for broadcast or for distribution combined with broadcast
- H04H20/12—Arrangements for observation, testing or troubleshooting
- H04H20/14—Arrangements for observation, testing or troubleshooting for monitoring programmes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/247—Thesauruses; Synonyms
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04H—BROADCAST COMMUNICATION
- H04H60/00—Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
- H04H60/29—Arrangements for monitoring broadcast services or broadcast-related services
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Theoretical Computer Science (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Circuits Of Receivers In General (AREA)
Abstract
本发明公开了一种基于关键词识别的无线电识别方法,其包括以下步骤:S1、建立声学模型,将无线电广播识别为文字;S2、建立语言模型,提取所识别文字中的关键词;S3、根据提取的关键词判断该无线电广播是否合法。本发明的无线电识别可以实现自动化,极大的节省了成本、提升了效率;本方法针对无线电广播信号的特点,能够最大化的满足不同需求;本方法可以离线使用,特别适合于需要保密的项目中;并且能在存在背景音乐或其他噪声的情况下进行识别,便于应用于更广泛的场景当中。
Description
技术领域
本发明涉及无线电识别领域,具体涉及一种基于关键词识别的无线电识别方法。
背景技术
由于无线电广播技术自身的开放性,所有有发射需求的用户,只需要占据特定的频段,即可通过发射信号进行广播。因此,时常有出于不同目的用户,在批准发射的频率之外,擅自占据频段进行广播发射(俗称“黑广播”,即非法广播)。在这之中,出于经济目的非法广播发射尤为明显,其内容以售卖假冒伪劣产品居多,严重扰乱经济秩序。另外,即便是一些非主观恶意的私占频段发射(如无线电爱好者自行搭建平台),也会扰乱正常电子通讯的运转,在某些情况下甚至会干扰关键性通讯设备(如飞机飞航通讯频段),引发严重的安全隐患。因此,进行有效的无线电识别,进而便于无线电电磁频谱管控是一项意义重大的课题。
传统的无线电识别主要是基于人工收听并识别的方法,具有成本高、效率低、操作人员疲劳易引发失误等缺点。
现有语音识别模型通常针对整句识别、语义判定而设计的,其大部分只提供线上使用功能,无法离线使用,可以移植性差,且整句识别会使得识别成功率大大降低,存在噪声的情况下识别成功率也很低,不适用于无线电识别领域。
发明内容
针对现有技术中的上述不足,本发明提供的一种基于关键词识别的无线电识别方法解决了现有无线电识别方法成本高效率低的问题。
为了达到上述发明目的,本发明采用的技术方案为:
提供一种基于关键词识别的无线电识别方法,其包括以下步骤:
S1、建立声学模型,将无线电广播识别为文字;
S2、建立语言模型,提取所识别文字中的关键词;
S3、根据提取的关键词判断该无线电广播是否合法。
进一步地,步骤S1的具体方法为:
采用CMU sphinx模型的基础中文模型作为基底,通过逐句分音节标注样本信号,基于最大后验概率对该基底进行参数自适应操作,得到声学模型,其表达式如下:
其中x表示某一个音节;p(x)为输出某一个音节的概率;P(m)为高斯概率密度函数的权值;μm和σm 2是高斯分布的参数;P(x|m)为第m个模块下输出某一个音节的概率;M为基础中文模型的高斯子模型总数量;m为第m个基础中文模型的高斯子模型;I为单位矩阵;N(·)为多元高斯分布。
进一步地,步骤S2的具体方法为:
根据CMU sphinx词典及语言模型生成器建立语言模型,将样本词作为提取条件,提取与样本词相同的词作为关键词,其具体步骤为:
S2-1、建立文本文件,在文本文件的每一行中加入样本关键词;
S2-2、通过在线语言模型生成工具对文本文件进行语言模型及词典的生成,完成语言模型的建立;
S2-3、通过语言模型提取所识别文字中的关键词。
进一步地,步骤S3的具体方法为:
根据专家系统将样本词进行组合得到判断该无线电广播内容是否合法的判定条件,将关键词不符合判定条件的无线电广播作为非法广播,将关键词符合判定条件的无线电广播作为正常广播。
本发明的有益效果为:本发明基于人工智能发展的成果进行综合改进,使得无线电识别可以实现自动化,极大的节省了成本、提升了效率;本方法针对无线电广播信号的特点,能够最大化的满足不同需求;本方法可以离线使用,特别适合于需要保密的项目中;并且能在存在背景音乐或其他噪声的情况下进行识别,便于应用于更广泛的场景当中。
附图说明
图1为本发明的流程示意图。
具体实施方式
下面对本发明的具体实施方式进行描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。
如图1所示,该基于关键词识别的无线电识别方法包括以下步骤:
S1、建立声学模型,将无线电广播识别为文字;
S2、建立语言模型,提取所识别文字中的关键词;
S3、根据提取的关键词判断该无线电广播是否合法。
步骤S1的具体方法为:
采用CMU sphinx模型的基础中文模型作为基底,通过逐句分音节标注样本信号,其表达式如下:
其中x表示某一个音节;p(x)为输出某一个音节的概率;P(m)为高斯概率密度函数的权值;μm和σm 2是高斯分布的参数;P(x|m)为第m个模块下输出某一个音节的概率;M为基础中文模型的高斯子模型总数量;m为第m个基础中文模型的高斯子模型;I为单位矩阵;N(·)为多元高斯分布。
具体地,我们首先安装CMU sphinx的Sphinxbase环境,并在下载CMU sphinx的基础的中文识别模型zh_broadcastnews_ptm256_8000。值得注意的是,尽管基础模型从操作上来讲可以直接进行关键字识别,但其准确率会非常差。所以,这里我们需要进行模型改进。
声学模型改进需要提取无线电广播的内容,并逐句分音节标注样本。其具体操作为,截取50-100句3-5秒的广播录音,其内容需要较为清晰,存储为.wav格式;然后在与广播录音相同的路径下,建立句子描述文件(.transcript)、录音匹配文件(.field)和改进词典(.dic)。其中,句子描述文件记录了按词组拆分的句子,需要人工加入空格断句(如,现在是北京时间十一点应写为“现在是北京时间十一点”);录音匹配文件记录各句子对应的录音文件名(如RadioRecord1);而辞典则记录了录音匹配文件中每个词组的发音,其基本音节发音可以在完整的Sphinxbase辞典中寻找匹配。
在完成了上述工作后,可以根据CMU sphinx提供的接口(Pocketsphinx)将文件转码为相应的格式。首先,将所有的.wav文件转为mfc文件;而后,将原模型中的参数文件转换为文本;最后,统计所有的音频文档的信息,并根据句子描述文件、录音匹配文件和辞典分别进行匹配,从而得到mixw_counts、gauden_counts和tmat_counts三个获取了录音信息的文件。在完成了上述操作后,可以使用最大后验概率的方法对基础模型的参数进行调整。
步骤S2的具体方法为:根据CMU sphinx词典及语言模型生成器建立语言模型,将样本词作为提取条件,提取与样本词相同的词作为关键词,其具体步骤为:
S2-1、建立文本文件,在文本文件的每一行中加入样本关键词;
S2-2、通过在线语言模型生成工具对文本文件进行语言模型及词典的生成,完成语言模型的建立;
S2-3、通过语言模型提取所识别文字中的关键词。
步骤S3的具体方法为:
根据专家系统将样本词进行组合得到判断该无线电广播内容是否合法的判定条件,将关键词不符合判定条件的无线电广播作为非法广播,将关键词符合判定条件的无线电广播作为正常广播。
本发明基于人工智能发展的成果进行综合改进,使得无线电识别可以实现自动化,极大的节省了成本、提升了效率;本方法针对无线电广播信号的特点,实现可定制化,能够最大化的满足不同需求;本方法可以离线使用,特别适合于需要保密的项目中;并且能在存在背景音乐或其他噪声的情况下进行识别,便于应用于更广泛的场景当中。
Claims (2)
1.一种基于关键词识别的无线电识别方法,其特征在于:包括以下步骤:
S1、建立声学模型,将无线电广播识别为文字;
S2、建立语言模型,提取所识别文字中的关键词;
S3、根据提取的关键词判断该无线电广播是否合法;
所述步骤S1的具体方法为:
采用CMU sphinx模型的基础中文模型作为基底,通过逐句分音节标注样本信号,基于最大后验概率对该基底进行参数自适应操作,得到声学模型,其表达式如下:
其中x表示某一个音节;p(x)为输出某一个音节的概率;P(m)为高斯概率密度函数的权值;μm和σm 2是高斯分布的参数;P(x|m)为第m个模块下输出某一个音节的概率;M为基础中文模型的高斯子模型总数量;m为第m个基础中文模型的高斯子模型;I为单位矩阵;N(·)为多元高斯分布;
所述步骤S2的具体方法为:
根据CMU sphinx词典及语言模型生成器建立语言模型,将样本词作为提取条件,提取与样本词相同的词作为关键词,其具体步骤为:
S2-1、建立文本文件,在文本文件的每一行中加入样本关键词;
S2-2、通过在线语言模型生成工具对文本文件进行语言模型及词典的生成,完成语言模型的建立;
S2-3、通过语言模型提取所识别文字中的关键词。
2.根据权利要求1所述的基于关键词识别的无线电识别方法,其特征在于:所述步骤S3的具体方法为:
根据专家系统将样本词进行组合得到判断该无线电广播内容是否合法的判定条件,将关键词不符合判定条件的无线电广播作为非法广播,将关键词符合判定条件的无线电广播作为正常广播。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810810283.4A CN109104258B (zh) | 2018-07-23 | 2018-07-23 | 一种基于关键词识别的无线电识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810810283.4A CN109104258B (zh) | 2018-07-23 | 2018-07-23 | 一种基于关键词识别的无线电识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109104258A CN109104258A (zh) | 2018-12-28 |
CN109104258B true CN109104258B (zh) | 2020-09-18 |
Family
ID=64847197
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810810283.4A Active CN109104258B (zh) | 2018-07-23 | 2018-07-23 | 一种基于关键词识别的无线电识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109104258B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109995450B (zh) * | 2019-04-08 | 2020-09-29 | 南京航空航天大学 | 一种基于云技术语音识别与智能鉴别“黑广播”方法 |
CN110299133B (zh) * | 2019-07-03 | 2021-05-28 | 四川大学 | 基于关键字判定非法广播的方法 |
CN111782601A (zh) * | 2020-06-08 | 2020-10-16 | 北京海泰方圆科技股份有限公司 | 电子文件的处理方法、装置、电子设备及机器可读介质 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103365849B (zh) * | 2012-03-27 | 2016-06-15 | 富士通株式会社 | 关键词检索方法和设备 |
CN103914530B (zh) * | 2014-03-31 | 2017-02-15 | 北京中科模识科技有限公司 | 广播电视节目中违规广告的监测方法和系统 |
CN106100777B (zh) * | 2016-05-27 | 2018-08-17 | 西华大学 | 基于语音识别技术的广播保障方法 |
CN106504744B (zh) * | 2016-10-26 | 2020-05-01 | 科大讯飞股份有限公司 | 一种语音处理方法及装置 |
CN107295401A (zh) * | 2017-08-10 | 2017-10-24 | 四川长虹电器股份有限公司 | 一种检测自媒体音视频内容中的违规信息的方法 |
-
2018
- 2018-07-23 CN CN201810810283.4A patent/CN109104258B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN109104258A (zh) | 2018-12-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112804400B (zh) | 客服呼叫语音质检方法、装置、电子设备及存储介质 | |
CN101030368B (zh) | 在保持情感的同时跨通道进行通信的方法和系统 | |
CN109104258B (zh) | 一种基于关键词识别的无线电识别方法 | |
CN101727904B (zh) | 语音翻译方法和装置 | |
CN110335612A (zh) | 基于语音识别的会议记录生成方法、装置及存储介质 | |
CN107516509B (zh) | 用于新闻播报语音合成的语音库构建方法及系统 | |
CN111477216A (zh) | 一种用于对话机器人的音意理解模型的训练方法及系统 | |
CN111489765A (zh) | 一种基于智能语音技术的话务服务质检方法 | |
Kopparapu | Non-linguistic analysis of call center conversations | |
CN112133290A (zh) | 一种针对民航陆空通话领域的基于迁移学习的语音识别方法 | |
CN116665676B (zh) | 一种用于智能语音外呼系统的语义识别方法 | |
CN111489754A (zh) | 一种基于智能语音技术的话务数据分析方法 | |
CN105957517A (zh) | 基于开源api的语音数据结构化转换方法及其系统 | |
CN106710587A (zh) | 一种语音识别数据预处理方法 | |
CN112466287B (zh) | 一种语音分割方法、装置以及计算机可读存储介质 | |
CN117423339A (zh) | 一种基于多路音源输入的广播终端 | |
CN112614482A (zh) | 移动端外语翻译方法、系统及存储介质 | |
CN111798838A (zh) | 一种提高语音识别准确率的方法、系统、设备及存储介质 | |
Wu et al. | Tone recognition for continuous accented Mandarin Chinese | |
CN114707515A (zh) | 话术判别方法、装置、电子设备及存储介质 | |
CN103366732A (zh) | 语音播报方法及装置、车载系统 | |
CN106559759B (zh) | 一种在移动设备中拦截彩信的方法和装置 | |
CN111246026A (zh) | 一种基于卷积神经网络和连接性时序分类的录音处理方法 | |
Coats | A pipeline for the large-scale acoustic analysis of streamed content | |
CN111883169B (zh) | 一种音频文件切割位置处理方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |