CN116434737A

CN116434737A - 一种基于语音控制的图像处理系统

Info

Publication number: CN116434737A
Application number: CN202310607478.XA
Authority: CN
Inventors: 纪检祥; 张青春; 岑晨; 张晨; 李华; 武莎莎; 陈帅; 孙梓夫
Original assignee: Huaiyin Institute of Technology
Current assignee: Huaiyin Institute of Technology
Priority date: 2023-05-26
Filing date: 2023-05-26
Publication date: 2023-07-14

Abstract

本发明涉及图像处理领域，具体涉及一种基于语音控制的图像处理系统，用于解决现有的全景影像系统操作方式不便捷，无法对驾驶员的驾驶提供帮助的问题；该图像处理系统首先利用车内语音和车外语音获得语音值，语音值用于衡量车内语音需要被调节的程度，最终获得唤醒语音，之后对唤醒语音进行语音识别，经过调节的车内语音能够大幅度提升语音识别精度和灵敏度，通过车机进行图像展示，之后对展示图像经过分析得到安全系数，安全系数用于衡量展示图像所展示的区域的行驶安全程度，最终将展示图像增加边框进行颜色展示，通过智能化场景分析代替驾驶员自主判断，提高了判断准确性，能够保证了行驶安全性，避免了驾驶事故的发生。

Description

一种基于语音控制的图像处理系统

技术领域

本发明涉及图像处理领域，具体涉及一种基于语音控制的图像处理系统。

背景技术

全景影像能够减少驾驶员视野盲区，被越来越多地应用在汽车上，随着汽车工业的发展和用户需求的提高，全景影像系统也在不断丰富其的附加功能，提升产品体验。

现有技术中，虽然大部分车辆已经安装有全景影像，但是大多数主机厂为车辆配置的全景影像系统需要通过空调面板或副仪表开关组上的按键进行控启动，导致进入全景影像系统不够方便，尤其是高速行驶过程中去调节仪表开关易于造成注意力分散，导致驾驶事故的发生，而且驾驶员进行变道时只能通过后视镜进行判断，对于新手驾驶员存在判断不准确，导致驾驶事故的发生，无法保证驾驶员的人身安全与财产安全。

如何改善现有的全景影像系统操作方式不便捷，无法对驾驶员的驾驶提供帮助是本发明的关键。

发明内容

为了克服上述的技术问题，本发明的目的在于提供了一种基于语音控制的图像处理系统：通过图像处理平台输入唤醒文字，并将唤醒文字与图像处理指令进行一一对应，通过语音调节模块根据车内语音和车外语音获得唤醒语音，通过语音识别模块根据唤醒语音后获得识别文字，将识别文字与唤醒文字进行对比，生成图像处理指令，通过图像采集模块接收到图像处理指令后并根据图像处理指令生成展示图像，通过图像展示模块接收到展示图像后利用车机进行图像展示，同时生成图像采集指令，通过图像采集模块接收到图像采集指令后根据展示图像获得安全参数，通过图像处理平台根据安全参数获得安全系数，并根据安全系数生成显示调节指令，通过图像展示模块接收到显示调节指令后将展示图像增加边框，且边框的颜色随着显示调节指令对应变化，解决了现有的全景影像系统操作方式不便捷，无法对驾驶员的驾驶提供帮助的问题。

本发明的目的可以通过以下技术方案实现：

一种基于语音控制的图像处理系统，包括：

图像处理平台，用于输入唤醒文字，并将唤醒文字与图像处理指令进行一一对应，并将唤醒文字发送至语音识别模块；还用于根据安全参数获得安全系数AX，并根据安全系数AX生成显示调节指令，并将显示调节指令发送至图像展示模块；

语音调节模块，用于根据车内语音和车外语音获得唤醒语音，并将唤醒语音发送至语音识别模块；

语音识别模块，用于根据唤醒语音后获得识别文字，将识别文字与唤醒文字进行对比，生成图像处理指令，并将图像处理指令发送至图像采集模块；

图像采集模块，接收到图像处理指令后并根据图像处理指令生成展示图像，并将展示图像发送至图像展示模块；还用于接收到图像采集指令后根据展示图像获得安全参数，并将安全参数发送至图像处理平台；其中，安全参数包括均距值JJ、障距值ZJ以及障速值ZS；

图像展示模块，用于接收到展示图像后利用车机进行图像展示，同时生成图像采集指令，并将图像采集指令发送至图像采集模块；还用于接收到显示调节指令后将展示图像增加边框，且边框的颜色随着显示调节指令对应变化。

作为本发明进一步的方案：所述图像处理平台获得安全系数AX的具体过程如下所示：

将均距值JJ、障距值ZJ以及障速值ZS代入公式

得到安全系数AX，其中，π、e均为数学常数，f1、f2以及f3分别为均距值JJ、障距值ZJ以及障速值ZS的预设权重系数，且f2＞f3＞f1＞1.62，取f1＝1.95，f2＝2.88，f3＝2.41；

将安全系数AX与安全分级进行比较并生成显示调节指令，并将显示调节指令发送至图像展示模块；其中，安全分级包括安全一级A1、安全二级A2以及安全三级A3；显示调节指令包括危险指令、较危险指令、较安全指令以及安全指令；

若安全系数AX＜安全一级A1，则生成危险指令；

若安全一级A1≤安全系数AX＜安全二级A2，则生成较危险指令；

若安全二级A2≤安全系数AX≤安全三级A3，则生成较安全指令；

若安全系数AX＞安全三级A3，则生成安全指令。

作为本发明进一步的方案：所述语音调节模块获得唤醒语音的具体过程如下所示：

实时采集车内语音和车外语音，并将车内语音标记为分析语音，将车外语音标记为影响语音；

获取分析语音与影响语音的声音强度，并将其分别标记为分音值FY和影音值YY，获取分音值FY和影音值YY之间的差值，并将其标记为音差值YC；

将分音值FY、音差值YC代入公式YZ＝a1×FY+a2×YC得到语音值YZ，其中，a1、a2分别为分音值FY、音差值YC的预设比例系数，且a1+a2＝1，0＜a1＜a2＜1，取a1＝0,37，a2＝0.53；

将语音值YZ与放大区间FD i(F_i，F_i+1]进行匹配，其中，F_i+1＞F_i，i＝1、……、n，n为自然数，每个放大区间FD i分别与一个预设的放大倍数对应；

若语音值YZ∈放大区间FD i(F_i，F_i+1]，则将放大区间FD i所对应的放大倍数标记为放大值FD；

获取分音值FY、放大值FD的乘积，并将乘积标记为扩音值KY，将分析语音的声音强度调节至扩音值KY，并将调节后的分析语音标记为唤醒语音，并将唤醒语音发送至语音识别模块。

作为本发明进一步的方案：所述图像采集模块获得安全参数的具体过程如下所示：

接收到图像采集指令后获取展示图像中的所有障碍物，障碍物包括车辆、行人、动物以及建筑和对应的位置，获取障碍物的数量并将其标记为障数值ZS，获取展示图像中的所有障碍物的位置，并将其依次标记为分析点j，j＝1、……、m，m为自然数，获取驾驶汽车的位置与分析点j之间的距离，并将其标记为点距值Dj，获取所有点距值Dj的平均值并将其标记为均距值JJ；

获取驾驶汽车所处的行驶车道，并将其标记为驾车道，将驾车道相邻的行驶车道标记为分析车道，获取分析车道中距离驾驶汽车最近的两个障碍物之间的距离，并将其标记为障距值ZJ；

获取分析车道中位于驾驶汽车后侧方距离驾驶汽车最近的障碍物的移动速度，并将其标记为障速值ZS；

将均距值JJ、障距值ZJ以及障速值ZS发送至图像处理平台。

作为本发明进一步的方案：所述图像处理系统进行图像处理的工作方法如下：

步骤A1：图像处理平台输入唤醒文字，并将唤醒文字与图像处理指令进行一一对应，并将唤醒文字发送至语音识别模块；其中，图像处理指令包括前方图像展示指令、后方图像展示指令、左侧图像展示指令以及右侧图像展示指令；

步骤A2：语音调节模块实时采集车内语音和车外语音，并将车内语音标记为分析语音，将车外语音标记为影响语音；

步骤A3：语音调节模块获取分析语音与影响语音的声音强度，并将其分别标记为分音值FY和影音值YY，获取分音值FY和影音值YY之间的差值，并将其标记为音差值YC；

步骤A4：语音调节模块将分音值FY、音差值YC代入公式YZ＝a1×FY+a2×YC得到语音值YZ，其中，a1、a2分别为分音值FY、音差值YC的预设比例系数，且a1+a2＝1，0＜a1＜a2＜1，取a1＝0,37，a2＝0.53；

步骤A5：语音调节模块将语音值YZ与放大区间FD i(F_i，F_i+1]进行匹配，其中，F_i+1＞F_i，i＝1、……、n，n为自然数，每个放大区间FD i分别与一个预设的放大倍数对应；若语音值YZ∈放大区间FD i(F_i，F_i+1]，则将放大区间FD i所对应的放大倍数标记为放大值FD；

步骤A6：语音调节模块获取分音值FY、放大值FD的乘积，并将乘积标记为扩音值KY，将分析语音的声音强度调节至扩音值KY，并将调节后的分析语音标记为唤醒语音，并将唤醒语音发送至语音识别模块；

步骤A7：语音识别模块接收到唤醒语音后利用语音识别技术将唤醒语音转换成文字，并将转换成的文字标记为识别文字，将识别文字与唤醒文字进行对比：若识别文字中存在唤醒文字，则生成唤醒文字所对应的图像处理指令，并将图像处理指令发送至图像采集模块；

步骤A8：图像采集模块接收到图像处理指令后并根据图像处理指令生成展示图像，并将展示图像发送至图像展示模块；其中，汽车前端、后端、左侧以及右侧均安装若干个高清摄像头；当接收到前方图像展示指令则启动汽车前端的高清摄像头进行拍摄视频，并将拍摄的视频标记为展示图像；当接收到后方图像展示指令则启动汽车后端的高清摄像头进行拍摄视频，并将拍摄的视频标记为展示图像；当接收到左侧图像展示指令则启动汽车左侧的高清摄像头进行拍摄视频，并将拍摄的视频标记为展示图像；当接收到右侧图像展示指令则启动汽车右侧的高清摄像头进行拍摄视频，并将拍摄的视频标记为展示图像；

步骤A9：图像展示模块接收到展示图像后利用车机进行图像展示，同时生成图像采集指令，并将图像采集指令发送至图像采集模块；

步骤A10：图像采集模块接收到图像采集指令后获取展示图像中的所有障碍物，障碍物包括车辆、行人、动物以及建筑和对应的位置，获取障碍物的数量并将其标记为障数值ZS，获取展示图像中的所有障碍物的位置，并将其依次标记为分析点j，j＝1、……、m，m为自然数，获取驾驶汽车的位置与分析点j之间的距离，并将其标记为点距值Dj，获取所有点距值Dj的平均值并将其标记为均距值JJ；

步骤A11：图像采集模块获取驾驶汽车所处的行驶车道，并将其标记为驾车道，将驾车道相邻的行驶车道标记为分析车道，获取分析车道中距离驾驶汽车最近的两个障碍物之间的距离，并将其标记为障距值ZJ；

步骤A12：图像采集模块获取分析车道中位于驾驶汽车后侧方距离驾驶汽车最近的障碍物的移动速度，并将其标记为障速值ZS；

步骤A13：图像采集模块将均距值JJ、障距值ZJ以及障速值ZS发送至图像处理平台；

步骤A14：图像处理平台将均距值JJ、障距值ZJ以及障速值ZS代入公式

步骤A15：图像处理平台将安全系数AX与安全分级进行比较并生成显示调节指令，并将显示调节指令发送至图像展示模块；其中，安全分级包括安全一级A1、安全二级A2以及安全三级A3；显示调节指令包括危险指令、较危险指令、较安全指令以及安全指令；

若安全系数AX＜安全一级A1，则生成危险指令；

若安全系数AX＞安全三级A3，则生成安全指令；

步骤A16：图像展示模块接收到显示调节指令后将展示图像增加边框，且边框的颜色随着显示调节指令对应变化。

本发明的有益效果：

本发明的一种基于语音控制的图像处理系统，通过图像处理平台输入唤醒文字，并将唤醒文字与图像处理指令进行一一对应，通过语音调节模块根据车内语音和车外语音获得唤醒语音，通过语音识别模块根据唤醒语音后获得识别文字，将识别文字与唤醒文字进行对比，生成图像处理指令，通过图像采集模块接收到图像处理指令后并根据图像处理指令生成展示图像，通过图像展示模块接收到展示图像后利用车机进行图像展示，同时生成图像采集指令，通过图像采集模块接收到图像采集指令后根据展示图像获得安全参数，通过图像处理平台根据安全参数获得安全系数，并根据安全系数生成显示调节指令，通过图像展示模块接收到显示调节指令后将展示图像增加边框，且边框的颜色随着显示调节指令对应变化；该图像处理系统首先利用车内语音和车外语音获得语音值，语音值用于衡量车内语音需要被调节的程度，当车内语音声音强度低或者车内语音和车外语音的声音强度相接近时，需要对车内语音进行调节，最终获得经过调节的唤醒语音，之后通过对唤醒语音进行语音识别，经过调节的车内语音能够大幅度提升语音识别精度和灵敏度，保证了语音识别在多种环境下均能够正常运行，提高其适用范围，之后通过车机进行图像展示，之后对展示图像经过分析得到均距值、障距值以及障速值，并利用三者获得安全系数，安全系数用于衡量展示图像所展示的区域的行驶安全程度，安全系数越大表示行驶安全程度越高，最终将展示图像增加边框进行颜色展示，通过智能化场景分析代替驾驶员自主判断，提高了判断准确性，向展示图像所展示的区域进行行驶时，利用高的安全系数能够保证了行驶安全性，进而能够对驾驶员的进行保护，避免了驾驶事故的发生。

附图说明

下面结合附图对本发明作进一步的说明。

图1是本发明中一种基于语音控制的图像处理系统的原理框图。

具体实施方式

下面将结合本发明实施例，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。

实施例1：

请参阅图1所示，本实施例为一种基于语音控制的图像处理系统，包括以下模块：图像处理平台、语音调节模块、语音识别模块、图像采集模块以及图像展示模块；

其中，图像处理平台用于输入唤醒文字，并将唤醒文字与图像处理指令进行一一对应，并将唤醒文字发送至语音识别模块；还用于根据安全参数获得安全系数AX，并根据安全系数AX生成显示调节指令，并将显示调节指令发送至图像展示模块；

其中，语音调节模块用于根据车内语音和车外语音获得唤醒语音，并将唤醒语音发送至语音识别模块；

其中，语音识别模块用于根据唤醒语音后获得识别文字，将识别文字与唤醒文字进行对比，生成图像处理指令，并将图像处理指令发送至图像采集模块；

其中，图像采集模块接收到图像处理指令后并根据图像处理指令生成展示图像，并将展示图像发送至图像展示模块；还用于接收到图像采集指令后根据展示图像获得安全参数，并将安全参数发送至图像处理平台；其中，安全参数包括均距值JJ、障距值ZJ以及障速值ZS；

其中，图像展示模块用于接收到展示图像后利用车机进行图像展示，同时生成图像采集指令，并将图像采集指令发送至图像采集模块；还用于接收到显示调节指令后将展示图像增加边框，且边框的颜色随着显示调节指令对应变化。

实施例2：

请参阅图1所示，本实施例为一种基于语音控制的图像处理系统的工作方法，包括如下步骤：

若安全系数AX＜安全一级A1，则生成危险指令；

若安全系数AX＞安全三级A3，则生成安全指令；

实施例3：

图像处理平台还用于向服务器发送危险指令或较危险指令以及对应的展示图像和位置；

服务器接收到危险指令或较危险指令以及对应的展示图像和位置后，获取位置所处区域内授权的车辆并将其标记为初选车辆；获取初选车辆的行驶路线；

将行驶路线内包含展示图像对应位置所处路段的初选车辆标记为待选车辆；

当待选车辆经过该路段的预设位置时，将危险指令或较危险指令以及对应的展示图像和位置发送至待选车辆对应图像处理平台，并进行相对应的图像显示和提醒；

服务器将在前车辆处理后的具有危险指令或较危险指令的展示图像反馈给待选车辆，以便于提供给将要经过该位置的车辆，进行相对应的图像显示和提醒，减少同一位置图像进行重新分析的次数，造成图像处理资源的浪费；

实施例4：

在实施例3的基础上，图像处理平台还用于监测图像采集模块接收到图像处理指令至反馈安全参数之间的时间差得到图像分析时长；当图像分析时长大于设定阈值时长时，生成图像辅助指令并反馈至服务器，服务器接收到图像辅助指令后，获取该车辆的行驶路线以及所处位置并将该车辆标记为辅助车辆，获取该辅助车辆所处位置对应的路段；

获取该路段内授权的车辆并将其标记为第一车辆，统计第一车辆的数量，当数量等于一时，将该第一车辆的图像处理平台与辅助车辆的图像处理平台进行通信连接，第一车辆的图像处理平台将辅助车辆当前位置与第一车辆当前位置之间所产生的展示图像以及对应安全参数反馈给辅助车辆对应的平台，当第一车辆与辅助车辆不在同一路段时，停止通信连接；服务器重新获取辅助车辆当前位置所处路段的授权车辆，直至辅助车辆取消或停止行驶；

当第一车辆的数量大于一时，获取第一车辆的车辆参数，其中，车辆参数包括车机芯片的型号、摄像头的型号以及车辆的车速数据和驾龄；车辆的车速数据包括车辆的行驶路线以及车速；

将车机芯片的型号、摄像头的型号与预存储的所有型号进行匹配，其中所有型号均对应一个预设的型号值，将匹配到的型号值进行求和得到型号总值；

获取辅助车辆所处路段对应的限速值，对车辆的车速数据进行车速提取，提取与该路段限速值一致的行驶路线的车速并将该车速标记为待分析车速；

将所有的待分析车速依据时间先后顺序进行排序，将所有的待分析车速进行平均值计算并提取平均值的数值，将其标记为车速均值；将所有的待分析车速与限速值进行比对，当限速值大于待分析车速时，计算两者之间的差值并标记为第一车速差；当限速值小于待分析车速时，计算两者之间的差值并标记为第二车速差；当限速值等于待分析车速时，直接取第三预设值；

将所有的第一车速差进行求和得到第一速差总值；将所有的第二车速差进行求和得到第二速差总值；将所有的第三预设值进行求和得到第三预设总值；将第一速差总值、第二速差总值以及第三预设总值进行归一化处理并取三者归一化处理后的数值并分别标记为SCa1、SCa2和SCa3，将其代入预设车速行载模型

得到车速行载值YC，其中bk1、bk2和bk3均为预设权重因子；

提取型号总值、驾龄以及车速行载值的数值，以型号总值、驾龄的数值为椭圆的长轴和短轴构建椭圆形，选取椭圆形的圆心，以该圆心为起始点作长度为车速行载值的直线，将椭圆形与该直线连接得到圆锥体，计算圆柱体的体积并提取体积的数值将其标记为车联优值；

将车联优值最大的第一车辆的图像处理平台与辅助车辆的图像处理平台进行通信连接，第一车辆的图像处理平台将辅助车辆当前位置与第一车辆当前位置之间所产生的展示图像以及对应安全参数反馈给辅助车辆对应的平台，当第一车辆与辅助车辆不在同一路段时，停止通信连接；服务器重新选取第一车辆，直至辅助车辆取消或停止行驶；

通过对车辆的参数进行分析处理，以便于合理的选取对应的车辆为辅助车辆进行图像辅助处理。

在本说明书的描述中，参考术语“一个实施例”、“示例”、“具体示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不一定指的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

以上内容仅仅是对本发明所作的举例和说明，所属本技术领域的技术人员对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代，只要不偏离发明或者超越本权利要求书所定义的范围，均应属于本发明的保护范围。

Claims

1.一种基于语音控制的图像处理系统，其特征在于，包括：

图像处理平台，用于输入唤醒文字，并将唤醒文字与图像处理指令进行一一对应，并将唤醒文字发送至语音识别模块；还用于根据安全参数获得安全系数，并根据安全系数生成显示调节指令，并将显示调节指令发送至图像展示模块；

图像采集模块，接收到图像处理指令后并根据图像处理指令生成展示图像，并将展示图像发送至图像展示模块；还用于接收到图像采集指令后根据展示图像获得安全参数，并将安全参数发送至图像处理平台；其中，安全参数包括均距值、障距值以及障速值；

2.根据权利要求1所述的一种基于语音控制的图像处理系统，其特征在于，所述图像处理平台获得安全系数的具体过程为：

将均距值、障距值以及障速值经过分析得到安全系数；

将安全系数与安全分级进行比较并生成显示调节指令，并将显示调节指令发送至图像展示模块。

3.根据权利要求1所述的一种基于语音控制的图像处理系统，其特征在于，所述语音调节模块获得唤醒语音的具体过程如下所示：

获取分析语音与影响语音的声音强度，并将其分别标记为分音值和影音值，获取分音值和影音值之间的差值，并将其标记为音差值；

将分音值、音差值经过分析得到语音值；

将语音值与放大区间进行匹配，每个放大区间分别与一个预设的放大倍数对应；

若语音值∈放大区间，则将放大区间所对应的放大倍数标记为放大值；

获取分音值、放大值的乘积，并将乘积标记为扩音值，将分析语音的声音强度调节至扩音值，并将调节后的分析语音标记为唤醒语音，并将唤醒语音发送至语音识别模块。

4.根据权利要求1所述的一种基于语音控制的图像处理系统，其特征在于，所述图像采集模块获得安全参数的具体过程如下所示：

接收到图像采集指令后获取展示图像中的所有障碍物，障碍物包括车辆、行人、动物以及建筑和对应的位置，获取障碍物的数量并将其标记为障数值，获取展示图像中的所有障碍物的位置，并将其依次标记为分析点，获取驾驶汽车的位置与分析点之间的距离，并将其标记为点距值，获取所有点距值的平均值并将其标记为均距值；

获取驾驶汽车所处的行驶车道，并将其标记为驾车道，将驾车道相邻的行驶车道标记为分析车道，获取分析车道中距离驾驶汽车最近的两个障碍物之间的距离，并将其标记为障距值；

获取分析车道中位于驾驶汽车后侧方距离驾驶汽车最近的障碍物的移动速度，并将其标记为障速值；

将均距值、障距值以及障速值发送至图像处理平台。

5.根据权利要求1所述的一种基于语音控制的图像处理系统，其特征在于，所述图像处理平台还用于向服务器发送危险指令或较危险指令以及对应的展示图像和位置；服务器接收到危险指令或较危险指令以及对应的展示图像和位置后并进行发送。

6.根据权利要求5所述的一种基于语音控制的图像处理系统，其特征在于，所述图像处理平台还用于监测图像采集模块接收到图像处理指令至反馈安全参数之间的时间差得到图像分析时长并生成图像辅助指令，将图像辅助指令反馈至服务器，服务器进行辅助处理。