CN113707139A - 一种人工智能机器人的语音沟通交流服务系统 - Google Patents
一种人工智能机器人的语音沟通交流服务系统 Download PDFInfo
- Publication number
- CN113707139A CN113707139A CN202010908282.0A CN202010908282A CN113707139A CN 113707139 A CN113707139 A CN 113707139A CN 202010908282 A CN202010908282 A CN 202010908282A CN 113707139 A CN113707139 A CN 113707139A
- Authority
- CN
- China
- Prior art keywords
- module
- voice
- database
- information
- digital audio
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004891 communication Methods 0.000 title claims abstract description 33
- 230000004044 response Effects 0.000 claims abstract description 28
- 238000012545 processing Methods 0.000 claims abstract description 6
- 238000012216 screening Methods 0.000 claims description 13
- 238000006243 chemical reaction Methods 0.000 claims description 9
- 238000000605 extraction Methods 0.000 claims description 8
- 239000003086 colorant Substances 0.000 claims description 7
- 238000005192 partition Methods 0.000 claims description 4
- 238000000034 method Methods 0.000 abstract description 5
- 238000010586 diagram Methods 0.000 description 4
- 239000000284 extract Substances 0.000 description 4
- 230000004075 alteration Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/20—Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/225—Feedback of the input speech
Abstract
本发明公开了一种人工智能机器人的语音沟通交流服务系统,包括AI芯片、语音接收模块、语音识别模块、语音分析模块、应答模块和播报模块,所述AI芯片用于控制语音接收模块、语音识别模块、语音分析模块、应答模块和播报模块处理结果的执行,所述语音接收模块接收来自用户的语音信息,所述语音识别模块用于接收来自语音接收模块的语音信息并进行识别,所述语音分析模块用于分析语音识别模块发送的语音信息的类别。本发明可以在机器人与用于沟通期间采用多种回答方法回答重复问题,且能够根据用户音色进行智能音色切换,提高亲和度,此外还能够根据用户周围环境截取有效音频信息,避免出现回答错误的情况。
Description
技术领域
本发明涉及人机交互领域,具体涉及一种人工智能机器人的语音沟通交流服务系统。
背景技术
人工智能机器人的语音沟通交流服务系统是一种用于机器人与用户对话的系统,其主要用于用户在办理业务时对业务疑问进行应答,以及用户与机器人之间的对话,采用AI智能控制,使用方便。
现有的人工智能机器人的语音沟通交流服务系统,在用户使用时,系统容易受到外界其他声音源的干扰,而导致系统会出现不能准确识别用户语音的情况,且系统在回答用户重复问题时回答方式单一,导致用户响应程度一般,系统音色比较单一,不能根据用户音色进行转换匹配,缺乏趣味性,导致整个人工智能机器人的语音沟通交流服务系统使用效果不够突出。
发明内容
本发明所要解决的技术问题在于:如何解决系统容易受到外界其他声音源的干扰,而导致系统会出现不能准确识别用户语音的情况,且系统在回答用户重复问题时回答方式单一,导致用户响应程度一般,系统音色比较单一,不能根据用户音色进行转换匹配,缺乏趣味性,导致整个人工智能机器人的语音沟通交流服务系统使用效果不够突出。
本发明是通过以下技术方案解决上述技术问题的,一种人工智能机器人的语音沟通交流服务系统,包括AI芯片、语音接收模块、语音识别模块、语音分析模块、应答模块和播报模块;
所述AI芯片用于控制语音接收模块、语音识别模块、语音分析模块、应答模块和播报模块处理结果的执行;
所述语音接收模块接收来自用户的语音信息;
所述语音识别模块用于接收来自语音接收模块的语音信息并进行识别;
所述语音分析模块用于分析语音识别模块发送的语音信息的类别;
所述应答模块根据语音分析模块分析接结果作出应答;
所述播报模块用于播报应答模块应答结果。
优选的,所述语音接收模块包括分贝识别模块、筛选模块和截取模块,分贝识别模块用于识别用户语音分贝大小,筛选模块用于筛选最大分贝的语音音频,截取模块用于截取出最大分贝的语音音频。
优选的,所述语音识别模块包括转换模块、音轨识别模块、音轨数据库和音色切换模块,转换模块用于将语音信息转换为数字音频信息,音轨识别模块用于识别转换后的数字音频信息所处的音轨区间,音轨数据库提供各类音轨区间的参数,音色切换模块根据音轨识别模块所识别的音轨区间进行音色切换;
优选的,所述应答模块包括答复数据库和提取模块,答复数据库用于各类答复信息的储存,提取模块针对所语音分析模块分析结果结合答复数据库比对提取答复数字音频信息。
优选的,所述答复数据库包括数据区间、分类单元、标记单元和循环单元,其中数据区间对各类数字音频信息进行分区,分类单元对各个区间每同一类数字音频信息进行分类,标记单元对每同一类数字音频信息进行标记,依次标记为YP1、YP2...YPN,循环单元根据同一类数字音频信息标记根据用户相同提问依照YP1、YP2...YPN顺序依次择取数字音频信息并循环,由提取模块按照顺序提取。
优选的,所述音色切换模块包括有内置音色数据库,音色数据库与音轨数据库相适配,音频识别模块根据音轨识别数据库识别的音轨与内置音色数据库匹配。
本发明相比现有技术具有以下优点:本发明通过设置分贝识别模块配合筛选模块和截取模块,分贝识别模块针对所识别的用户语音进行分别识别,并结合用户环境,对除用户语音外其他语音分别进行识别,筛序模块根据分贝识别模块所识别的用户语音分贝和其他语音分贝进行筛选,选出分贝最大的语音信息,截取模块对分贝最大的语音信息进行截取,从而可以正确的获取客户音频信息,减小外界环境中其他声音信息的干扰,导致机器人获取信息错误而出现误答的情况,极大的提高机器人与用户之间语音沟通的准确性;
通过设置音轨识别模块配合音色切换模块,音轨识别模块接收转换所转换的数字音频信息,并结合音轨数据库识别该数字音频信息所述的音轨区间,音色切换模块根据该数字音频信息所处的音轨区间对音色进行配置并切换,从而可以根据不同年龄段和不同音色的客户去匹配用户声音,从而使得机器人的生意更具有亲和力,音色自由切换,提高了该机器人的语音沟通交流服务系统的适用范围;
通过设置答复数据库配合提取模块,答复数据库中数据区间对各类数字音频信息进行分区,分类单元对各个区间每同一类数字音频信息进行分类,标记单元对每同一类数字音频信息进行标记,依次标记为YP1、YP2...YPN,循环单元根据同一类数字音频信息标记根据用户相同提问依照YP1、YP2...YPN顺序依次择取数字音频信息并循环,提取模块根据语音分析模块分析语音信息的类别提取来组答复数据库中相应答复并提交给播报模块,从而针对相同用户提出的同种问题该机器人的语音沟通交流服务系统可以做出不同的回答,提高了整个机器人的语音沟通交流服务系统趣味性,更能吸引用户的注意力。
附图说明
图1是本发明的系统框图;
图2是本发明中语音接收模块的系统框图;
图3是本发明中语音识别模块的系统框图;
图4是本发明中应答模块的系统框图。
具体实施方式
下面对本发明的实施例作详细说明,本实施例在以本发明技术方案为前提下进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。
如图1-4所示,本实施例提供一种技术方案:一种人工智能机器人的语音沟通交流服务系统,包括AI芯片、语音接收模块、语音识别模块、语音分析模块、应答模块和播报模块;
AI芯片用于控制语音接收模块、语音识别模块、语音分析模块、应答模块和播报模块处理结果的执行;
语音接收模块接收来自用户的语音信息;
语音识别模块用于接收来自语音接收模块的语音信息并进行识别;
语音分析模块用于分析语音识别模块发送的语音信息的类别;
应答模块根据语音分析模块分析接结果作出应答;
播报模块用于播报应答模块应答结果。
语音接收模块包括分贝识别模块、筛选模块和截取模块,分贝识别模块用于识别用户语音分贝大小,筛选模块用于筛选最大分贝的语音音频,截取模块用于截取出最大分贝的语音音频;
语音接收模块具体处理步骤如下:
步骤一:分贝识别模块针对所识别的用户语音进行分别识别,并结合用户环境,对除用户语音外其他语音分别进行识别;
步骤二:筛序模块根据分贝识别模块所识别的用户语音分贝和其他语音分贝进行筛选,选出分贝最大的语音信息;
步骤三:截取模块对分贝最大的语音信息进行截取,提取出分贝最大的语音信息并默认为用户语音信息。
语音识别模块包括转换模块、音轨识别模块、音轨数据库和音色切换模块,转换模块用于将语音信息转换为数字音频信息,音轨识别模块用于识别转换后的数字音频信息所处的音轨区间,音轨数据库提供各类音轨区间的参数,音色切换模块根据音轨识别模块所识别的音轨区间进行音色切换;
语音识别模块具体识别步骤如下:
S1:转换模块将来自语音接收模块最终识别的用户语音信息进行转换,于将语音信息转换为数字音频信息;
S2:音轨识别模块接收转换所转换的数字音频信息,并结合音轨数据库识别该数字音频信息所述的音轨区间;
S3:音色切换模块根据该数字音频信息所处的音轨区间对音色进行配置并切换。
应答模块包括答复数据库和提取模块,答复数据库用于各类答复信息的储存,提取模块针对所语音分析模块分析结果结合答复数据库比对提取答复数字音频信息。
答复数据库包括数据区间、分类单元、标记单元和循环单元,其中数据区间对各类数字音频信息进行分区,分类单元对各个区间每同一类数字音频信息进行分类,标记单元对每同一类数字音频信息进行标记,依次标记为YP1、YP2...YPN,循环单元根据同一类数字音频信息标记根据用户相同提问依照YP1、YP2...YPN顺序依次择取数字音频信息并循环,由提取模块按照顺序提取。
应答模块具体处理步骤如下:
A1:答复数据库中数据区间对各类数字音频信息进行分区,分类单元对各个区间每同一类数字音频信息进行分类,标记单元对每同一类数字音频信息进行标记,依次标记为YP1、YP2...YPN,循环单元根据同一类数字音频信息标记根据用户相同提问依照YP1、YP2...YPN顺序依次择取数字音频信息并循环;
A2:提取模块根据语音分析模块分析语音信息的类别提取来组答复数据库中相应答复并提交给播报模块。
音色切换模块包括有内置音色数据库,音色数据库与音轨数据库相适配,音频识别模块根据音轨识别数据库识别的音轨与内置音色数据库匹配。
综上,本发明在使用时,由AI芯片对整个语音沟通交流服务系统的执行进行控制,用户语音首先由语音接收模块进行接收,分贝识别模块针对所识别的用户语音进行分别识别,并结合用户环境,对除用户语音外其他语音分别进行识别,筛序模块根据分贝识别模块所识别的用户语音分贝和其他语音分贝进行筛选,选出分贝最大的语音信息,截取模块对分贝最大的语音信息进行截取,提取出分贝最大的语音信息并默认为用户语音信息,转换模块将来自语音接收模块最终识别的用户语音信息进行转换,于将语音信息转换为数字音频信息,音轨识别模块接收转换所转换的数字音频信息,并结合音轨数据库识别该数字音频信息所述的音轨区间,音色切换模块根据该数字音频信息所处的音轨区间对音色进行配置并切换,之后由语音识别模块进行识别,随后由语音分析模块对所识别的音频信息进行分析,识别出用户音频信息所属的类别,之后应答模块进行应答处理,答复数据库中数据区间对各类数字音频信息进行分区,分类单元对各个区间每同一类数字音频信息进行分类,标记单元对每同一类数字音频信息进行标记,依次标记为YP1、YP2...YPN,循环单元根据同一类数字音频信息标记根据用户相同提问依照YP1、YP2...YPN顺序依次择取数字音频信息并循环,提取模块根据语音分析模块分析语音信息的类别提取来组答复数据库中相应答复并提交给播报模块,最终由播报模块进行播报,整个操作过程结束。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (6)
1.一种人工智能机器人的语音沟通交流服务系统,其特征在于,包括AI芯片、语音接收模块、语音识别模块、语音分析模块、应答模块和播报模块;
所述AI芯片用于控制语音接收模块、语音识别模块、语音分析模块、应答模块和播报模块处理结果的执行;
所述语音接收模块接收来自用户的语音信息;
所述语音识别模块用于接收来自语音接收模块的语音信息并进行识别;
所述语音分析模块用于分析语音识别模块发送的语音信息的类别;
所述应答模块根据语音分析模块分析接结果作出应答;
所述播报模块用于播报应答模块应答结果。
2.根据权利要求1所述的一种人工智能机器人的语音沟通交流服务系统,其特征在于:所述语音接收模块包括分贝识别模块、筛选模块和截取模块,分贝识别模块用于识别用户语音分贝大小,筛选模块用于筛选最大分贝的语音音频,截取模块用于截取出最大分贝的语音音频。
3.根据权利要求1所述的一种人工智能机器人的语音沟通交流服务系统,其特征在于:所述语音识别模块包括转换模块、音轨识别模块、音轨数据库和音色切换模块,转换模块用于将语音信息转换为数字音频信息,音轨识别模块用于识别转换后的数字音频信息所处的音轨区间,音轨数据库提供各类音轨区间的参数,音色切换模块根据音轨识别模块所识别的音轨区间进行音色切换。
4.根据权利要求1所述的一种人工智能机器人的语音沟通交流服务系统,其特征在于:所述应答模块包括答复数据库和提取模块,答复数据库用于各类答复信息的储存,提取模块针对所语音分析模块分析结果结合答复数据库比对提取答复数字音频信息。
5.根据权利要求4所述的一种人工智能机器人的语音沟通交流服务系统,其特征在于:所述答复数据库包括数据区间、分类单元、标记单元和循环单元,其中数据区间对各类数字音频信息进行分区,分类单元对各个区间每同一类数字音频信息进行分类,标记单元对每同一类数字音频信息进行标记,依次标记为YP1、YP2...YPN,循环单元根据同一类数字音频信息标记根据用户相同提问依照YP1、YP2...YPN顺序依次择取数字音频信息并循环,由提取模块按照顺序提取。
6.根据权利要求3所述的一种人工智能机器人的语音沟通交流服务系统,其特征在于:所述音色切换模块包括有内置音色数据库,音色数据库与音轨数据库相适配,音频识别模块根据音轨识别数据库识别的音轨与内置音色数据库匹配。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010908282.0A CN113707139B (zh) | 2020-09-02 | 2020-09-02 | 一种人工智能机器人的语音沟通交流服务系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010908282.0A CN113707139B (zh) | 2020-09-02 | 2020-09-02 | 一种人工智能机器人的语音沟通交流服务系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113707139A true CN113707139A (zh) | 2021-11-26 |
CN113707139B CN113707139B (zh) | 2024-04-09 |
Family
ID=78646614
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010908282.0A Active CN113707139B (zh) | 2020-09-02 | 2020-09-02 | 一种人工智能机器人的语音沟通交流服务系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113707139B (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160103833A1 (en) * | 2012-06-01 | 2016-04-14 | Google Inc. | Ranking query results using biometric parameters |
CN105895101A (zh) * | 2016-06-08 | 2016-08-24 | 国网上海市电力公司 | 用于电力智能辅助服务系统的语音处理设备及处理方法 |
US20160247068A1 (en) * | 2013-11-01 | 2016-08-25 | Tencent Technology (Shenzhen) Company Limited | System and method for automatic question answering |
WO2016175354A1 (ko) * | 2015-04-29 | 2016-11-03 | 주식회사 아카인텔리전스 | 인공지능 대화 장치 및 방법 |
CN106128478A (zh) * | 2016-06-28 | 2016-11-16 | 北京小米移动软件有限公司 | 语音播报方法及装置 |
CN109473101A (zh) * | 2018-12-20 | 2019-03-15 | 福州瑞芯微电子股份有限公司 | 一种差异化随机问答的语音芯片结构和方法 |
US20190184569A1 (en) * | 2017-12-18 | 2019-06-20 | Bot3, Inc. | Robot based on artificial intelligence, and control method thereof |
CN110085220A (zh) * | 2018-01-26 | 2019-08-02 | 上海智臻智能网络科技股份有限公司 | 智能交互装置 |
-
2020
- 2020-09-02 CN CN202010908282.0A patent/CN113707139B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160103833A1 (en) * | 2012-06-01 | 2016-04-14 | Google Inc. | Ranking query results using biometric parameters |
US20160247068A1 (en) * | 2013-11-01 | 2016-08-25 | Tencent Technology (Shenzhen) Company Limited | System and method for automatic question answering |
WO2016175354A1 (ko) * | 2015-04-29 | 2016-11-03 | 주식회사 아카인텔리전스 | 인공지능 대화 장치 및 방법 |
CN105895101A (zh) * | 2016-06-08 | 2016-08-24 | 国网上海市电力公司 | 用于电力智能辅助服务系统的语音处理设备及处理方法 |
CN106128478A (zh) * | 2016-06-28 | 2016-11-16 | 北京小米移动软件有限公司 | 语音播报方法及装置 |
US20190184569A1 (en) * | 2017-12-18 | 2019-06-20 | Bot3, Inc. | Robot based on artificial intelligence, and control method thereof |
CN110085220A (zh) * | 2018-01-26 | 2019-08-02 | 上海智臻智能网络科技股份有限公司 | 智能交互装置 |
CN109473101A (zh) * | 2018-12-20 | 2019-03-15 | 福州瑞芯微电子股份有限公司 | 一种差异化随机问答的语音芯片结构和方法 |
Non-Patent Citations (1)
Title |
---|
马昭征;庄欣浩;: "基于AI的智能呼叫运营系统设计的与实现", 电信科学, no. 1, pages 235 - 241 * |
Also Published As
Publication number | Publication date |
---|---|
CN113707139B (zh) | 2024-04-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109065052B (zh) | 一种语音机器人 | |
CN110557451B (zh) | 对话交互处理方法、装置、电子设备和存储介质 | |
CN106356067A (zh) | 录音方法、装置及终端 | |
JP2019509523A (ja) | 音声データ処理の方法、装置及び記憶媒体 | |
CN109688276B (zh) | 一种基于人工智能技术的来电过滤系统及其方法 | |
CN111883168B (zh) | 一种语音处理方法及装置 | |
CN108172219B (zh) | 识别语音的方法和装置 | |
CN107729433A (zh) | 一种音频处理方法及设备 | |
CN108932947B (zh) | 语音控制方法及家电设备 | |
CN110570847A (zh) | 一种多人场景的人机交互系统及方法 | |
CN106205622A (zh) | 信息处理方法及电子设备 | |
CN111178081B (zh) | 语义识别的方法、服务器、电子设备及计算机存储介质 | |
CN106887231A (zh) | 一种识别模型更新方法及系统以及智能终端 | |
CN107742516B (zh) | 智能识别方法、机器人及计算机可读存储介质 | |
CN113449682B (zh) | 一种基于动态融合模型识别民航领域射频指纹的方法 | |
CN103778917A (zh) | 一种在电话满意度调查中检测身份冒充的系统与方法 | |
CN109783822B (zh) | 一种基于验证码的数据样本识别系统及其方法 | |
CN107910006A (zh) | 语音识别方法、装置和多信源语音区分识别系统 | |
CN113707139A (zh) | 一种人工智能机器人的语音沟通交流服务系统 | |
CN110262278B (zh) | 智能家电设备的控制方法及装置、智能电器设备 | |
CN110288996A (zh) | 一种语音识别装置和语音识别方法 | |
US11580974B2 (en) | Method for exiting a voice skill, apparatus, device and storage medium | |
CN115019788A (zh) | 语音交互方法、系统、终端设备及存储介质 | |
CN103929532A (zh) | 一种信息处理方法及电子设备 | |
CN114461842A (zh) | 生成劝阻话术的方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |