CN113298994A - 一种门禁读卡器用语言识别对讲系统 - Google Patents

一种门禁读卡器用语言识别对讲系统 Download PDF

Info

Publication number
CN113298994A
CN113298994A CN202110583425.XA CN202110583425A CN113298994A CN 113298994 A CN113298994 A CN 113298994A CN 202110583425 A CN202110583425 A CN 202110583425A CN 113298994 A CN113298994 A CN 113298994A
Authority
CN
China
Prior art keywords
module
audio
input end
language
electrically connected
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110583425.XA
Other languages
English (en)
Inventor
姚启良
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan Chuguan Information Technology Co ltd
Original Assignee
Wuhan Chuguan Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan Chuguan Information Technology Co ltd filed Critical Wuhan Chuguan Information Technology Co ltd
Priority to CN202110583425.XA priority Critical patent/CN113298994A/zh
Publication of CN113298994A publication Critical patent/CN113298994A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G07CHECKING-DEVICES
    • G07CTIME OR ATTENDANCE REGISTERS; REGISTERING OR INDICATING THE WORKING OF MACHINES; GENERATING RANDOM NUMBERS; VOTING OR LOTTERY APPARATUS; ARRANGEMENTS, SYSTEMS OR APPARATUS FOR CHECKING NOT PROVIDED FOR ELSEWHERE
    • G07C9/00Individual registration on entry or exit
    • G07C9/20Individual registration on entry or exit involving the use of a pass
    • G07C9/22Individual registration on entry or exit involving the use of a pass in combination with an identity check of the pass holder
    • G07C9/25Individual registration on entry or exit involving the use of a pass in combination with an identity check of the pass holder using biometric data, e.g. fingerprints, iris scans or voice recognition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/005Language recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/18Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast
    • H04N7/183Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast for receiving images from a single remote source
    • H04N7/186Video door telephones

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • General Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Interconnected Communication Systems, Intercoms, And Interphones (AREA)

Abstract

本发明公开了一种门禁读卡器用语言识别对讲系统,具体涉及语言识别技术领域。通过设置复数的麦克风和录音模块以及音频收集模块,当麦克风接收到音频时,通过对应的录音模块将接收到的音频数据传输至音频收集模块内,此时音频收集模块会利用设置的频段分析模块对收集到的音频进行拆分解析,在拆分的同时对拆分后的音频数据进行相似分析,并最终将不同频段中的相似频段进行整合,使得该语音识别对讲系统能够通过采集复数的音频数据并对其进行拆分分析,避免了在采集过程中出现失真情况的同时,通过对不同频段的音频进行相似分析更能有效的保障所采集到的音频与发声源音频的高度吻合,提高了语音识别的效率。

Description

一种门禁读卡器用语言识别对讲系统
技术领域
本发明涉及语言识别技术领域,更具体地说,本发明涉及一种门禁读卡器用语言识别对讲系统。
背景技术
语音识别技术,也被称为自动语音识别技术,其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列,与说话人识别及说话人确认不同,后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。
现有的语音识别系统在使用的过程中无法有效的保障接收到的音频数据与发声源的音频之间的吻合性,大多仅通过设置单一的语音接收组件或是单数的麦克风对音频进行采集,且仅通过单一的声线辨别模块对音频数据进行分析,难以保障音频采集真实性的同时,降低了语音识别的效率。
发明内容
为了克服现有技术的上述缺陷,本发明提供了一种门禁读卡器用语言识别对讲系统,本发明所要解决的技术问题是:现有的语音识别系统在使用的过程中无法有效的保障接收到的音频数据与发声源的音频之间的吻合性,大多仅通过设置单一的语音接收组件或是单数的麦克风对音频进行采集,且仅通过单一的声线辨别模块对音频数据进行分析,难以保障音频采集真实性的同时,降低了语音识别的效率的问题。
为实现上述目的,本发明提供如下技术方案:一种门禁读卡器用语言识别对讲系统,包括音频收集模块,所述音频收集模块的输入端与三个录音模块的输出端电连接,三个录音模块的输入端分别与三个麦克风的输出端电连接,所述音频收集模块的输出端与音频放大模块的输入端电连接,所述音频放大模块的输出端与语音识别模块的输入端电连接,所述语音识别模块的输出端与对比模块的输入端电连接,所述对比模块的两个输出端分别与语言识别模块的输入端和纠错单元的输入端电连接,所述语言识别模块的两个输出端分别与对比模块的输入端和音频存储模块的输入端电连接,所述语言识别模块的另一个输入端与语言库的输出端电连接,所述纠错单元的输出端与对比模块的另一个输入端电连接,所述语音识别模块的输出端与综合处理模块的输入端电连接,所述综合处理模块的两个输出端分别与显示器的输入端和音频功放模块的输入端电连接。
作为本发明的进一步方案:所述音频收集模块包括频段分析模块和音频存储模块,所述频段分析模块是指当复数的麦克风采集到的音频,并通过录音模块传输至音频收集模块时,能够通过将复数的音频依据频段的不同对音频进行细致拆分,而在机械波中,频段是指声音频率和波长而言,其中人的语音频率范围大多集中在80Hz~12kHz之间,依据频段对采集到的音频数据进行拆分后再对其进行模拟分析,并得出结果。
所述音频存储模块是指在复数的麦克风采集到的音频,并通过录音模块传输至音频收集模块时,能够对采集到的的音频进行预存,并进行及时复制备份,为了避免音频在采集的过程中出现丢失或是模糊化的情况,且为语音识别提供数据支持。
作为本发明的进一步方案:所述音频放大模块是指将音频收集模块导出的音频数据进行放大处理,及在采集到的音频数据原件的基础上重建输入的音频信号,以达到重建的信号音量和功率级处于理想的状态。
作为本发明的进一步方案:所述语音识别模块是对音频放大模块导出的音频数据进行进一步的识别分析,同时将其导入对比模块中,而对比模块是指将语音识别模块接收到的音频数据与语言库中的数据进行对比分析,并利用纠错单元进行纠错,在对比完成后再将对比的记过传输至综合处理模块中。
作为本发明的进一步方案:所述纠错单元是指对对比模块中接收的音频与语言库中的数据进行对比后的结果进行纠错,在纠错之后再将纠错结果传回对比模块,并依据纠错结果的正误情况对对比模块下达相应的指令。
所述语言识别模块是指在语音识别模块接收到音频放大模块导出的音频数据,并对其进行处理时,通过与语言库进行数据连接并依据其内部的综合语言数据对音频进行类别判断,且通过与音频收集模块中的音频存储模块中备份的音频文件做综合判断,以达到提高判断准确性的目的。
作为本发明的进一步方案:所述综合处理模块是指将语音识别模块经过分析得出的最终结果进行进一步的可视化处理,并通过显示器组件将处理后的结果展示出来,同时利用音频功放模块对结果进行播放。
本发明的有益效果在于:
1、本发明通过设置复数的麦克风和录音模块以及音频收集模块,当麦克风接收到音频时,通过对应的录音模块将接收到的音频数据传输至音频收集模块内,此时音频收集模块会利用设置的频段分析模块对收集到的音频进行拆分解析,在拆分的同时对拆分后的音频数据进行相似分析,并最终将不同频段中的相似频段进行整合,然后利用音频存储模块进行预存,从而经过采取不同频段音频数据中相似的频段进而确保采集到的音频数据本身的真实性,使得该语音识别对讲系统能够通过采集复数的音频数据并对其进行拆分分析,避免了在采集过程中出现失真情况的同时,通过对不同频段的音频进行相似分析更能有效的保障所采集到的音频与发声源音频的高度吻合,提高了语音识别的效率。
2、本发明通过设置纠错单元和综合处理模块,当对比模块利用语言库中的数据对语音识别模块接收到得音频数据进行对比的同时,纠错单元同时对对比模块中对比得到的数据结果进行正误分析,并将得到的正误结果传输至对比模块中,通过下达相应的命令进而保障对比模块对比结果的准确性,并最终通过综合处理模块将结果利用显示器进行可视化处理,使得该语音识别对讲系统能够通过反复纠错进行保障识别结果准确性的同时,通过将数据结果可视化进而便利的通行人堆自身音频信息进行获取。
附图说明
图1为本发明的系统框图;
图中:1麦克风、2录音模块、3音频收集模块、301频段分析模块、302音频存储模块、4音频放大模块、5语音识别模块、6对比模块、7纠错单元、8语言识别模块、9语言库、10综合处理模块、11显示器、12音频功放模块。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图所示,本发明提供了一种门禁读卡器用语言识别对讲系统,包括音频收集模块3,音频收集模块3的输入端与三个录音模块2的输出端电连接,三个录音模块2的输入端分别与三个麦克风1的输出端电连接,音频收集模块3的输出端与音频放大模块4的输入端电连接,音频放大模块4的输出端与语音识别模块5的输入端电连接,语音识别模块5的输出端与对比模块6的输入端电连接,对比模块6的两个输出端分别与语言识别模块8的输入端和纠错单元7的输入端电连接,语言识别模块8的两个输出端分别与对比模块6的输入端和音频存储模块302的输入端电连接,语言识别模块8的另一个输入端与语言库9的输出端电连接,纠错单元7的输出端与对比模块6的另一个输入端电连接,语音识别模块5的输出端与综合处理模块10的输入端电连接,综合处理模块10的两个输出端分别与显示器11的输入端和音频功放模块12的输入端电连接。
音频收集模块3包括频段分析模块301和音频存储模块302,频段分析模块301是指当复数的麦克风1采集到的音频,并通过录音模块2传输至音频收集模块3时,能够通过将复数的音频依据频段的不同对音频进行细致拆分,而在机械波中,频段是指声音频率和波长而言,其中人的语音频率范围大多集中在80Hz~12kHz之间,依据频段对采集到的音频数据进行拆分后再对其进行模拟分析,并得出结果。
通过设置复数的麦克风1和录音模块2以及音频收集模块3,当麦克风1接收到音频时,通过对应的录音模块2将接收到的音频数据传输至音频收集模块3内,此时音频收集模块3会利用设置的频段分析模块301对收集到的音频进行拆分解析,在拆分的同时对拆分后的音频数据进行相似分析,并最终将不同频段中的相似频段进行整合,然后利用音频存储模块302进行预存,从而经过采取不同频段音频数据中相似的频段进而确保采集到的音频数据本身的真实性,使得该语音识别对讲系统能够通过采集复数的音频数据并对其进行拆分分析,避免了在采集过程中出现失真情况的同时,通过对不同频段的音频进行相似分析更能有效的保障所采集到的音频与发声源音频的高度吻合,提高了语音识别的效率。
音频存储模块302是指在复数的麦克风1采集到的音频,并通过录音模块2传输至音频收集模块3时,能够对采集到的的音频进行预存,并进行及时复制备份,为了避免音频在采集的过程中出现丢失或是模糊化的情况,且为语音识别提供数据支持。
音频放大模块4是指将音频收集模块3导出的音频数据进行放大处理,及在采集到的音频数据原件的基础上重建输入的音频信号,以达到重建的信号音量和功率级处于理想的状态。
语音识别模块5是对音频放大模块4导出的音频数据进行进一步的识别分析,同时将其导入对比模块6中,而对比模块6是指将语音识别模块5接收到的音频数据与语言库9中的数据进行对比分析,并利用纠错单元7进行纠错,在对比完成后再将对比的记过传输至综合处理模块10中。
纠错单元7是指对对比模块6中接收的音频与语言库9中的数据进行对比后的结果进行纠错,在纠错之后再将纠错结果传回对比模块6,并依据纠错结果的正误情况对对比模块6下达相应的指令。
通过设置纠错单元7和综合处理模块10,当对比模块6利用语言库9中的数据对语音识别模块5接收到得音频数据进行对比的同时,纠错单元7同时对对比模块6中对比得到的数据结果进行正误分析,并将得到的正误结果传输至对比模块6中,通过下达相应的命令进而保障对比模块6对比结果的准确性,并最终通过综合处理模块10将结果利用显示器11进行可视化处理,使得该语音识别对讲系统能够通过反复纠错进行保障识别结果准确性的同时,通过将数据结果可视化进而便利的通行人堆自身音频信息进行获取。
语言识别模块8是指在语音识别模块5接收到音频放大模块4导出的音频数据,并对其进行处理时,通过与语言库9进行数据连接并依据其内部的综合语言数据对音频进行类别判断,且通过与音频收集模块3中的音频存储模块302中备份的音频文件做综合判断,以达到提高判断准确性的目的。
通过设置语言识别模块8和综合处理模块10,当对比模块6对音频数据进行处理时,语言识别模块8通过与语言库9进行数据连接并依据其内部的综合语言数据对音频进行类别判断,且通过与音频收集模块3中的音频存储模块302中备份的音频文件做综合判断,以达到提高判断准确性的目的,而综合处理模块10的设置能够有效的对对比结果进行公示和播报,有助于用户对该语音识别对讲系统的处理结果进行获取,使得该语音识别对讲系统能够有效的对不同地区的方言或是语言种类进行综合分析,同时还能通过让用户只管的获取分析的结果,提高了用户的使用体验感。
综合处理模块10是指将语音识别模块5经过分析得出的最终结果进行进一步的可视化处理,并通过显示器11组件将处理后的结果展示出来,同时利用音频功放模块12对结果进行播放。
最后应说明的几点是:虽然,上文中已经用一般性说明及具体实施例对本发明作了详尽的描述,但在本发明的基础上,以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (6)

1.一种门禁读卡器用语言识别对讲系统,包括音频收集模块(3),其特征在于:所述音频收集模块(3)的输入端与三个录音模块(2)的输出端电连接,三个录音模块(2)的输入端分别与三个麦克风(1)的输出端电连接,所述音频收集模块(3)的输出端与音频放大模块(4)的输入端电连接,所述音频放大模块(4)的输出端与语音识别模块(5)的输入端电连接,所述语音识别模块(5)的输出端与对比模块(6)的输入端电连接,所述对比模块(6)的两个输出端分别与语言识别模块(8)的输入端和纠错单元(7)的输入端电连接,所述语言识别模块(8)的两个输出端分别与对比模块(6)的输入端和音频存储模块(302)的输入端电连接,所述语言识别模块(8)的另一个输入端与语言库(9)的输出端电连接,所述纠错单元(7)的输出端与对比模块(6)的另一个输入端电连接,所述语音识别模块(5)的输出端与综合处理模块(10)的输入端电连接,所述综合处理模块(10)的两个输出端分别与显示器(11)的输入端和音频功放模块(12)的输入端电连接。
2.根据权利要求1所述的一种门禁读卡器用语言识别对讲系统,其特征在于:所述音频收集模块(3)包括频段分析模块(301)和音频存储模块(302),所述频段分析模块(301)是指当复数的麦克风(1)采集到的音频,并通过录音模块(2)传输至音频收集模块(3)时,能够通过将复数的音频依据频段的不同对音频进行细致拆分,而在机械波中,频段是指声音频率和波长而言,其中人的语音频率范围大多集中在80Hz~12kHz之间,依据频段对采集到的音频数据进行拆分后再对其进行模拟分析,并得出结果;
所述音频存储模块(302)是指在复数的麦克风(1)采集到的音频,并通过录音模块(2)传输至音频收集模块(3)时,能够对采集到的的音频进行预存,并进行及时复制备份,为了避免音频在采集的过程中出现丢失或是模糊化的情况,且为语音识别提供数据支持。
3.根据权利要求1所述的一种门禁读卡器用语言识别对讲系统,其特征在于:所述音频放大模块(4)是指将音频收集模块(3)导出的音频数据进行放大处理,及在采集到的音频数据原件的基础上重建输入的音频信号,以达到重建的信号音量和功率级处于理想的状态。
4.根据权利要求1所述的一种门禁读卡器用语言识别对讲系统,其特征在于:所述语音识别模块(5)是对音频放大模块(4)导出的音频数据进行进一步的识别分析,同时将其导入对比模块(6)中,而对比模块(6)是指将语音识别模块(5)接收到的音频数据与语言库(9)中的数据进行对比分析,并利用纠错单元(7)进行纠错,在对比完成后再将对比的记过传输至综合处理模块(10)中。
5.根据权利要求1所述的一种门禁读卡器用语言识别对讲系统,其特征在于:所述纠错单元(7)是指对对比模块(6)中接收的音频与语言库(9)中的数据进行对比后的结果进行纠错,在纠错之后再将纠错结果传回对比模块(6),并依据纠错结果的正误情况对对比模块(6)下达相应的指令;
所述语言识别模块(8)是指在语音识别模块(5)接收到音频放大模块(4)导出的音频数据,并对其进行处理时,通过与语言库(9)进行数据连接并依据其内部的综合语言数据对音频进行类别判断,且通过与音频收集模块(3)中的音频存储模块(302)中备份的音频文件做综合判断,以达到提高判断准确性的目的。
6.根据权利要求1所述的一种门禁读卡器用语言识别对讲系统,其特征在于:所述综合处理模块(10)是指将语音识别模块(5)经过分析得出的最终结果进行进一步的可视化处理,并通过显示器(11)组件将处理后的结果展示出来,同时利用音频功放模块(12)对结果进行播放。
CN202110583425.XA 2021-05-27 2021-05-27 一种门禁读卡器用语言识别对讲系统 Pending CN113298994A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110583425.XA CN113298994A (zh) 2021-05-27 2021-05-27 一种门禁读卡器用语言识别对讲系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110583425.XA CN113298994A (zh) 2021-05-27 2021-05-27 一种门禁读卡器用语言识别对讲系统

Publications (1)

Publication Number Publication Date
CN113298994A true CN113298994A (zh) 2021-08-24

Family

ID=77325531

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110583425.XA Pending CN113298994A (zh) 2021-05-27 2021-05-27 一种门禁读卡器用语言识别对讲系统

Country Status (1)

Country Link
CN (1) CN113298994A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107862060A (zh) * 2017-11-15 2018-03-30 吉林大学 一种追踪目标人的语义识别装置及识别方法
CN110288996A (zh) * 2019-07-22 2019-09-27 厦门钛尚人工智能科技有限公司 一种语音识别装置和语音识别方法
CN111489733A (zh) * 2019-01-25 2020-08-04 黄登辉 一种基于智能可视对讲门禁的语音交互系统及装置
CN112489624A (zh) * 2020-12-21 2021-03-12 深圳市本顿科技有限公司 一种用于平板电脑的语音识别装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107862060A (zh) * 2017-11-15 2018-03-30 吉林大学 一种追踪目标人的语义识别装置及识别方法
CN111489733A (zh) * 2019-01-25 2020-08-04 黄登辉 一种基于智能可视对讲门禁的语音交互系统及装置
CN110288996A (zh) * 2019-07-22 2019-09-27 厦门钛尚人工智能科技有限公司 一种语音识别装置和语音识别方法
CN112489624A (zh) * 2020-12-21 2021-03-12 深圳市本顿科技有限公司 一种用于平板电脑的语音识别装置

Similar Documents

Publication Publication Date Title
JP6857699B2 (ja) 音声対話設備のウェイクアップ方法、装置、設備、記憶媒体、及びプログラム
CN106486130B (zh) 噪声消除、语音识别方法及装置
WO2017162017A1 (zh) 语音数据处理方法、装置和存储介质
CN109036382B (zh) 一种基于kl散度的音频特征提取方法
CN103117061B (zh) 一种基于语音的动物识别方法及装置
CN105989836B (zh) 一种语音采集方法、装置及终端设备
CN103151039A (zh) 一种基于向量机svm的说话者年龄段识别方法
CN103730112B (zh) 语音多信道模拟与采集方法
US9640193B2 (en) Systems and methods for enhancing place-of-articulation features in frequency-lowered speech
CN113823293B (zh) 一种基于语音增强的说话人识别方法及系统
CN111145763A (zh) 一种基于gru的音频中的人声识别方法及系统
CN111868823A (zh) 一种声源分离方法、装置及设备
CN110931019B (zh) 公安语音数据采集方法、装置、设备和计算机存储介质
CN112382302A (zh) 婴儿哭声识别方法及终端设备
CN110689885B (zh) 机器合成语音识别方法、装置、存储介质及电子设备
CN113298994A (zh) 一种门禁读卡器用语言识别对讲系统
CN110556114B (zh) 基于注意力机制的通话人识别方法及装置
CN111108553A (zh) 一种声音采集对象声纹检测方法、装置和设备
CN210606618U (zh) 一种实现语音文字记录的系统
CN111667837A (zh) 会议记录的获取方法、智能终端及具有存储功能的装置
CN115376501B (zh) 语音增强方法及装置、存储介质、电子设备
CN111933183B (zh) 一种商户用蓝牙设备的音频识别方法
CN116110373B (zh) 智能会议系统的语音数据采集方法及相关装置
CN111179942B (zh) 声纹识别方法、装置、设备及计算机可读存储介质
CN111508503B (zh) 一种识别同一说话人的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination