CN112151037A - 一种基于嵌入式软件的人机对话系统 - Google Patents

一种基于嵌入式软件的人机对话系统 Download PDF

Info

Publication number
CN112151037A
CN112151037A CN202011011861.1A CN202011011861A CN112151037A CN 112151037 A CN112151037 A CN 112151037A CN 202011011861 A CN202011011861 A CN 202011011861A CN 112151037 A CN112151037 A CN 112151037A
Authority
CN
China
Prior art keywords
unit
module
voice
data
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011011861.1A
Other languages
English (en)
Inventor
樊小勇
窦永明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu Xiaomeng Technology Co ltd
Original Assignee
Jiangsu Xiaomeng Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu Xiaomeng Technology Co ltd filed Critical Jiangsu Xiaomeng Technology Co ltd
Priority to CN202011011861.1A priority Critical patent/CN112151037A/zh
Publication of CN112151037A publication Critical patent/CN112151037A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/63Querying
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/54Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for retrieval

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Telephone Function (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明公开了一种基于嵌入式软件的人机对话系统,包括音频录入模块、语音识别模块、预处理模块、分析模块、映射模块、控制模块、语音识别模块、音频输出模块和移动终端,所述音频录入模块、语音识别模块、预处理模块、分析模块、映射模块、控制模块、语音识别模块、音频输出模块和移动终端依次连接,所述预处理模块包括语音检索单元、数据格式转换单元、数据拆分单元、无用数据剔除单元,所述分析模块包括有软件嵌入单元,所述控制模块包括语音交互单元、存储单元、切换单元、调取单元、计数单元、辨识单元和显示单元。本发明使得用户在进行语音交互的过程中,能够选择不同声音形式的语音软件包,以适应不同的应用场景,更加人性化。

Description

一种基于嵌入式软件的人机对话系统
技术领域
本发明涉及人机交互技术领域,尤其涉及一种基于嵌入式软件的人机对话系统。
背景技术
智能语音交互是基于语音输入的新一代交互模式,通过说话就可以得到反馈结果,语音助手就是其中典型的应用场景。然而在实际应用过程中,语音交互系统在与用户进行交互过程中,不能根据其发声进行对应分析,分析处理形式过于单一,导致应用场景受限,因此还存在一定的改进空间。
发明内容
基于背景技术存在的技术问题,本发明提出了一种基于嵌入式软件的人机对话系统。
本发明提出的一种基于嵌入式软件的人机对话系统,包括音频录入模块、语音识别模块、预处理模块、分析模块、映射模块、控制模块、语音识别模块、音频输出模块和移动终端,所述音频录入模块、语音识别模块、预处理模块、分析模块、映射模块、控制模块、语音识别模块、音频输出模块和移动终端依次连接,所述预处理模块包括语音检索单元、数据格式转换单元、数据拆分单元、无用数据剔除单元,所述分析模块包括有软件嵌入单元,所述控制模块包括语音交互单元、存储单元、切换单元、调取单元、计数单元、辨识单元和显示单元,所述移动终端包括有无线通信单元。
优选的,所述音频录入模块用于收集外界用户的声音信息并将该信息发送至语音识别模块,语音识别模块接收语音信息并转换为文字信息进行识别。
优选的,所述预处理模块用于对语音数据进行处理,所述语音检索单元用于检索接收到是语音数据,检索出清楚的语音数据,并将检索后的语音数据传输至数据格式转换单元中,所述数据格式转换单元用于将语音数据格式转换成常用数据格式,所述数据拆分单元用于将语音数据进行拆分,拆分后的数据信息传输至无用数据剔除单元,无用数据剔除单元用于将无用的数据信息进行剔除,所述预处理模块将处理后的数据传输至分析模块中。
优选的,所述分析模块用于处理文字信息,分析模块中嵌入软件嵌入单元,软件嵌入单元根据不同国家的文字信息进行软件分析处理,分析模块分析后的数据传输至映射模块中。
优选的,所述映射模块用于将文字信息映射到相应控制动作。
优选的,所述控制模块的语音交互单元用于根据接收的声音信息和语音数据并通过音频输出模块与用户进行语音交互,存储单元用于对语音数据进行存储。
优选的,所述调取单元用于调取存储单元中的语音数据,切换单元用于切换调取单元所调取的语音数据,所述计数单元用于统计数据信息调取单元所调取的每种语音数据的次数,辨识单元用于根据声音辨别发声对象,所述显示单元用于显示该语音数据所对应的文字信息。
优选的,所述音频输出模块输出音频数据并通过无线通信单元传输至移动终端中。
本发明中,所述一种基于嵌入式软件的人机对话系统,使得用户在进行语音交互的过程中,能够选择不同声音形式的语音软件包,以适应不同的应用场景,更加人性化。
附图说明
图1为本发明提出的一种基于嵌入式软件的人机对话系统的系统框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。
参照图1,一种基于嵌入式软件的人机对话系统,包括音频录入模块、语音识别模块、预处理模块、分析模块、映射模块、控制模块、语音识别模块、音频输出模块和移动终端,音频录入模块、语音识别模块、预处理模块、分析模块、映射模块、控制模块、语音识别模块、音频输出模块和移动终端依次连接,预处理模块包括语音检索单元、数据格式转换单元、数据拆分单元、无用数据剔除单元,分析模块包括有软件嵌入单元,控制模块包括语音交互单元、存储单元、切换单元、调取单元、计数单元、辨识单元和显示单元,移动终端包括有无线通信单元。
本发明中,音频录入模块用于收集外界用户的声音信息并将该信息发送至语音识别模块,语音识别模块接收语音信息并转换为文字信息进行识别。
本发明中,预处理模块用于对语音数据进行处理,语音检索单元用于检索接收到是语音数据,检索出清楚的语音数据,并将检索后的语音数据传输至数据格式转换单元中,数据格式转换单元用于将语音数据格式转换成常用数据格式,数据拆分单元用于将语音数据进行拆分,拆分后的数据信息传输至无用数据剔除单元,无用数据剔除单元用于将无用的数据信息进行剔除,预处理模块将处理后的数据传输至分析模块中。
本发明中,分析模块用于处理文字信息,分析模块中嵌入软件嵌入单元,软件嵌入单元根据不同国家的文字信息进行软件分析处理,分析模块分析后的数据传输至映射模块中。
本发明中,映射模块用于将文字信息映射到相应控制动作。
本发明中,控制模块的语音交互单元用于根据接收的声音信息和语音数据并通过音频输出模块与用户进行语音交互,存储单元用于对语音数据进行存储。
本发明中,调取单元用于调取存储单元中的语音数据,切换单元用于切换调取单元所调取的语音数据,计数单元用于统计数据信息调取单元所调取的每种语音数据的次数,辨识单元用于根据声音辨别发声对象,显示单元用于显示该语音数据所对应的文字信息。
本发明中,音频输出模块输出音频数据并通过无线通信单元传输至移动终端中。
本发明:音频录入模块用于收集外界用户的声音信息并将该信息发送至语音识别模块,语音识别模块接收语音信息并转换为文字信息进行识别。
本发明中,预处理模块用于对语音数据进行处理,语音检索单元用于检索接收到是语音数据,检索出清楚的语音数据,并将检索后的语音数据传输至数据格式转换单元中,数据格式转换单元用于将语音数据格式转换成常用数据格式,数据拆分单元用于将语音数据进行拆分,拆分后的数据信息传输至无用数据剔除单元,无用数据剔除单元用于将无用的数据信息进行剔除,预处理模块将处理后的数据传输至分析模块中。
本发明中,分析模块用于处理文字信息,分析模块中嵌入软件嵌入单元,软件嵌入单元根据不同国家的文字信息进行软件分析处理,分析模块分析后的数据传输至映射模块中,映射模块用于将文字信息映射到相应控制动作,控制模块的语音交互单元用于根据接收的声音信息和语音数据并通过音频输出模块与用户进行语音交互,存储单元用于对语音数据进行存储,调取单元用于调取存储单元中的语音数据,切换单元用于切换调取单元所调取的语音数据,计数单元用于统计数据信息调取单元所调取的每种语音数据的次数,辨识单元用于根据声音辨别发声对象,显示单元用于显示该语音数据所对应的文字信息,音频输出模块输出音频数据并通过无线通信单元传输至移动终端中。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

Claims (8)

1.一种基于嵌入式软件的人机对话系统,其特征在于,包括音频录入模块、语音识别模块、预处理模块、分析模块、映射模块、控制模块、语音识别模块、音频输出模块和移动终端,所述音频录入模块、语音识别模块、预处理模块、分析模块、映射模块、控制模块、语音识别模块、音频输出模块和移动终端依次连接,所述预处理模块包括语音检索单元、数据格式转换单元、数据拆分单元、无用数据剔除单元,所述分析模块包括有软件嵌入单元,所述控制模块包括语音交互单元、存储单元、切换单元、调取单元、计数单元、辨识单元和显示单元,所述移动终端包括有无线通信单元。
2.根据权利要求1所述的一种基于嵌入式软件的人机对话系统,其特征在于,所述音频录入模块用于收集外界用户的声音信息并将该信息发送至语音识别模块,语音识别模块接收语音信息并转换为文字信息进行识别。
3.根据权利要求1所述的一种基于嵌入式软件的人机对话系统,其特征在于,所述预处理模块用于对语音数据进行处理,所述语音检索单元用于检索接收到是语音数据,检索出清楚的语音数据,并将检索后的语音数据传输至数据格式转换单元中,所述数据格式转换单元用于将语音数据格式转换成常用数据格式,所述数据拆分单元用于将语音数据进行拆分,拆分后的数据信息传输至无用数据剔除单元,无用数据剔除单元用于将无用的数据信息进行剔除,所述预处理模块将处理后的数据传输至分析模块中。
4.根据权利要求1所述的一种基于嵌入式软件的人机对话系统,其特征在于,所述分析模块用于处理文字信息,分析模块中嵌入软件嵌入单元,软件嵌入单元根据不同国家的文字信息进行软件分析处理,分析模块分析后的数据传输至映射模块中。
5.根据权利要求1所述的一种基于嵌入式软件的人机对话系统,其特征在于,所述映射模块用于将文字信息映射到相应控制动作。
6.根据权利要求1所述的一种基于嵌入式软件的人机对话系统,其特征在于,所述控制模块的语音交互单元用于根据接收的声音信息和语音数据并通过音频输出模块与用户进行语音交互,存储单元用于对语音数据进行存储。
7.根据权利要求1所述的一种基于嵌入式软件的人机对话系统,其特征在于,所述调取单元用于调取存储单元中的语音数据,切换单元用于切换调取单元所调取的语音数据,所述计数单元用于统计数据信息调取单元所调取的每种语音数据的次数,辨识单元用于根据声音辨别发声对象,所述显示单元用于显示该语音数据所对应的文字信息。
8.根据权利要求1所述的一种基于嵌入式软件的人机对话系统,其特征在于,所述音频输出模块输出音频数据并通过无线通信单元传输至移动终端中。
CN202011011861.1A 2020-09-23 2020-09-23 一种基于嵌入式软件的人机对话系统 Pending CN112151037A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011011861.1A CN112151037A (zh) 2020-09-23 2020-09-23 一种基于嵌入式软件的人机对话系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011011861.1A CN112151037A (zh) 2020-09-23 2020-09-23 一种基于嵌入式软件的人机对话系统

Publications (1)

Publication Number Publication Date
CN112151037A true CN112151037A (zh) 2020-12-29

Family

ID=73896347

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011011861.1A Pending CN112151037A (zh) 2020-09-23 2020-09-23 一种基于嵌入式软件的人机对话系统

Country Status (1)

Country Link
CN (1) CN112151037A (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109065041A (zh) * 2018-08-09 2018-12-21 上海常仁信息科技有限公司 一种基于机器人的语音交互系统和方法
CN111048079A (zh) * 2019-10-09 2020-04-21 深圳软通动力信息技术有限公司 人机对话方法、系统、电子设备及存储介质
CN111402869A (zh) * 2018-12-13 2020-07-10 南京硅基智能科技有限公司 多人声模式人机对话系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109065041A (zh) * 2018-08-09 2018-12-21 上海常仁信息科技有限公司 一种基于机器人的语音交互系统和方法
CN111402869A (zh) * 2018-12-13 2020-07-10 南京硅基智能科技有限公司 多人声模式人机对话系统
CN111048079A (zh) * 2019-10-09 2020-04-21 深圳软通动力信息技术有限公司 人机对话方法、系统、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN109493850B (zh) 成长型对话装置
CN102111314B (zh) 一种基于蓝牙传输的智能家居语音控制系统及方法
CN102209143B (zh) 电话服务交互管理
CN101576901B (zh) 搜索请求的产生方法
CN111261162B (zh) 语音识别方法、语音识别装置及存储介质
JP2012103554A (ja) 音声言語識別装置の学習装置、音声言語の識別装置、及びそれらのためのプログラム
CN110992955A (zh) 一种智能设备的语音操作方法、装置、设备及存储介质
CN110570847A (zh) 一种多人场景的人机交互系统及方法
CN109754808B (zh) 语音转换文字的方法、装置、计算机设备及存储介质
CN105912725A (zh) 一种通过自然语言交互调用海量智慧应用的系统
CN112669842A (zh) 人机对话控制方法、装置、计算机设备及存储介质
CN101354886A (zh) 语音识别装置
CN109510891B (zh) 语音控制录音装置及方法
CN111739506A (zh) 一种应答方法、终端及存储介质
KR102666826B1 (ko) Stt를 활용한 화자구분 시스템
EP2913822A1 (en) Speaker recognition method
EP3059731A1 (en) Method and apparatus for automatically sending multimedia file, mobile terminal, and storage medium
CN112151037A (zh) 一种基于嵌入式软件的人机对话系统
CN107357859A (zh) 一种通过语音采集实现知识库自动显示的智能终端
CN111062729A (zh) 一种信息获取方法、装置和设备
CN103247316A (zh) 一种音频检索中构建索引的方法及系统
CN109817218A (zh) 医疗语音识别的方法及系统
CN113936655A (zh) 语音播报处理方法、装置、计算机设备和存储介质
CN114171000A (zh) 一种基于声学模型和语言模型的音频识别方法
CN113724698A (zh) 语音识别模型的训练方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination