CN114494267A - 一种变电站和电缆隧道场景语义构建系统和方法 - Google Patents

一种变电站和电缆隧道场景语义构建系统和方法 Download PDF

Info

Publication number
CN114494267A
CN114494267A CN202111440567.7A CN202111440567A CN114494267A CN 114494267 A CN114494267 A CN 114494267A CN 202111440567 A CN202111440567 A CN 202111440567A CN 114494267 A CN114494267 A CN 114494267A
Authority
CN
China
Prior art keywords
voice
instruction
semantic
voice control
command
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111440567.7A
Other languages
English (en)
Other versions
CN114494267B (zh
Inventor
吴琼
高方玉
刘铭
倪康婷
陈春梅
张彦峰
王茹
董孟军
王韦莹
孙永锋
王兴勋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Guowang Fuda Technology Development Co Ltd
Original Assignee
Beijing Guowang Fuda Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Guowang Fuda Technology Development Co Ltd filed Critical Beijing Guowang Fuda Technology Development Co Ltd
Priority to CN202111440567.7A priority Critical patent/CN114494267B/zh
Publication of CN114494267A publication Critical patent/CN114494267A/zh
Application granted granted Critical
Publication of CN114494267B publication Critical patent/CN114494267B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/63Querying
    • G06F16/635Filtering based on additional data, e.g. user or group profiles
    • G06F16/637Administration of user profiles, e.g. generation, initialization, adaptation or distribution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T17/00Three dimensional [3D] modelling, e.g. data description of 3D objects
    • G06T17/05Geographic models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/50Image enhancement or restoration using two or more images, e.g. averaging or subtraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10024Color image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10028Range image; Depth image; 3D point clouds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20212Image combination
    • G06T2207/20221Image fusion; Image merging

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Remote Sensing (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Geometry (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Computer Graphics (AREA)
  • Remote Monitoring And Control Of Power-Distribution Networks (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提出了一种变电站和电缆隧道场景语义构建系统和方法。所述方法包括:利用传感器采集所述变电站和电缆隧道环境,获得RGB‑D图像;对所述RGB‑D图像中的二维彩色图像进行目标分割,获得多个分割后的目标独立图像;获取目标独立图像对应的语义信息,并将语义信息赋值于目标独立图像,形成带有语义信息的目标图像;利用RGB‑D图像中的Depth图像建立所述变电站和电缆隧道环境对应的三维地图;将目标图像融合到三维地图中,形成三维语义地图;在形成三维语义地图后,利用变电站和电缆隧道中负责运行管理的运维管理人员的语音指令信息构建与所述三维语义地图对应的语音数据库。所述系统包括与所述方法步骤对应的模块。

Description

一种变电站和电缆隧道场景语义构建系统和方法
技术领域
本发明提出了一种变电站和电缆隧道场景语义构建系统和方法,属于语义构建技术领域。
背景技术
语义地图可以被广泛应用于机器人、导航和人机交互等领域。室内语义地图通常包括空间属性信息,例如建筑物的平面结构,房间分布等,以及包括语义属性信息,如各个房间属性和功能,以及房间内的物体类别和位置信息等。语义地图构建的目标是精确地在地图上标记语义信息。但是,现有三维语义地图并未应用到变电站和电缆隧道所处场景中,由于变电站和电缆隧道所处场景相对复杂,三维语义地图形成难度较大,易导致三维语义地图的语义准确度降低。
发明内容
本发明提供了一种变电站和电缆隧道场景语义构建系统和方法,用以解决现有变电站和电缆隧道场景下,三维语义地图的语义准确度较低的问题,所采取的技术方案如下:
一种变电站和电缆隧道场景语义构建方法,所述方法包括:
利用RGB-D传感器采集所述变电站和电缆隧道环境,获得RGB-D图像;
利用深度学习算法对所述RGB-D图像中的二维彩色图像进行目标分割,获得多个分割后的目标独立图像;
获取所述目标独立图像对应的语义信息,并将所述语义信息赋值于所述目标独立图像,形成带有语义信息的目标图像;
利用所述RGB-D图像中的Depth图像建立所述变电站和电缆隧道环境对应的三维地图;
将所述目标图像融合到所述三维地图中,形成三维语义地图;
在形成三维语义地图后,利用变电站和电缆隧道中负责运行管理的运维管理人员的语音指令信息构建与所述三维语义地图对应的语音数据库。
进一步地,所述将所述目标图像融合到所述三维地图中,形成三维语义地图包括:
在所述三维地图中获取所述变电站和电缆隧道环境中各目标对象对应的目标图像;
将所述三维地图进行坐标分割,获取所述目标图像对应的图像坐标信息;
提取每个目标图像的语义信息,将所述语音信息标注在所述目标图像上;
根据图像坐标信息将所述标注有语义信息的目标图像融合至所述三维地图中,形成三维语义地图。
进一步地,在形成三维语义地图后,利用变电站和电缆隧道中负责运行管理的运维管理人员的语音指令信息构建与所述三维语义地图对应的语音数据库,包括:
针对变电站和电缆隧道中负责运行管理的运维管理人员进行语音指令录制,形成每个管理人员对应的个人语音数据库;
建立每个管理人员的个人语音数据库中的每个语音指令与语音控制指令之间的对应关系;
将个人语音数据库中的每个语音指令按照每个语音指令与语音控制指令之间的对应关系与语音控制指令进行一一对应关联,当完成对应关联后,将所述语音控制指令形成与变电站和电缆隧道的三维可视化对应的语义库;
通过反复播放每个个人语音数据库中的语音指令录制信息获得每个个人语音数据库与语音控制指令之间的识别响应时间阈值,并利用识别响应时间阈值进行语音控制指令响应监控。
进一步地,针对变电站和电缆隧道中负责运行管理的运维管理人员进行语音指令录制,形成每个管理人员对应的个人语音数据库,包括:
设置语音控制指令列表,并且,语音控制指令列表中每个语音控制指令均标有唯一编号;
运维管理人员按照语音控制指令列表中的编号顺序依次读取语音控制指令,获取每个运维管理人员的语音指令;
利用每个运维管理人员的语音指令建立与每个运维管理人员对应的个人语音数据库。
进一步地,建立每个管理人员的个人语音数据库中的每个语音指令与语音控制指令之间的对应关系,包括:
将每个语音指令按照读取的先后顺序依次进行标记,获取每个语音指令的唯一标识码;
按照每个语音指令按照读取的先后顺序,依次将每个语音指令的唯一标识码与每个语音控制指令均标有的唯一编号进行一一对应,获得唯一标识码与唯一编号之间的对应关系。
进一步地,将个人语音数据库中的每个语音指令按照每个语音指令与语音控制指令之间的对应关系与语音控制指令进行一一对应关联,当完成对应关联后,将所述语音控制指令形成与变电站和电缆隧道的三维可视化对应的语义库,包括:
获取每个语音指令的唯一标识码与每个语音控制指令均标有的唯一编号之间的对应关系;
按照每个语音指令的唯一标识码与每个语音控制指令均标有的唯一编号之间的对应关系,将每个运维管理人员的个人语音数据库中的语音指令与语音控制指令之间进行对应关联。
进一步地,通过反复播放每个个人语音数据库中的语音指令录制信息获得每个个人语音数据库与语音控制指令之间的识别响应时间阈值,并利用识别响应时间阈值进行语音控制指令响应监控,包括:
反复播放每个个人语音数据库中的语音指令录制信息,用于进行个人语音数据库中的语音指令录制信息与语音控制指令之间对应关系的关联确认,并获得每个个人语音数据库与语音控制指令之间的识别响应时间阈值;
利用每个个人语音数据库与语音控制指令之间的识别响应时间阈值对变电站和电缆隧道场景中运维管理人员工作时所发出的语音指令进行响应时间监控。
进一步地,反复播放每个个人语音数据库中的语音指令录制信息,用于进行个人语音数据库中的语音指令录制信息与语音控制指令之间对应关系的关联确认,并获得每个个人语音数据库与语音控制指令之间的识别响应时间阈值,包括:
步骤1、反复三次播放每个个人语音数据库中的语音指令录制信息,
步骤2、根据每个语音指令与语音控制指令之间的对应关系,将语音指令转换为语音控制指令;
步骤3、按照语音指令对照表依次检测每一次语音指令所转换语音控制指令的转换结果是否正确;如果出现语音指令转换错误,则执行步骤4;如果全部正确,则执行步骤5;
步骤4、重新按照每个语音指令与语音控制指令之间的对应关系进行语音指令对应关联,并重复步骤1和步骤2直至所有语音指令转换结果均为正确结果;
步骤5、记录每次播放语音指令录制信息过程中,每个语音指令完成语音控制指令转换所用时间,并将每个语音指令完成语音控制指令转换所用时间即为单指令响应时间;
步骤6、利用每次播放语音指令录制信息过程中,每个语音指令完成语音控制指令转换的单指令响应时间获取每个语音指令完成语音控制指令转换的识别响应时间阈值。所述识别响应时间阈值通过如下公式获取:
Figure RE-GDA0003526507210000031
Figure RE-GDA0003526507210000032
其中,T表示识别响应时间阈值;Ti表示反复三次播放中第i次播放时,语音指令转换语音控制指令所用时间;T0表示系统建立过程中,语音指令转换为语音控制指令所用的理论相应时间;Tmax为反复三次播放中,每个语音指令转换语音控制指令对应所用的最长时间。
进一步地,利用每个个人语音数据库与语音控制指令之间的识别响应时间阈值对变电站和电缆隧道场景中运维管理人员工作时所发出的语音指令进行响应时间监控,包括:
当运维管理人员发送语音指令时,实时监控语音指令转换为语音控制指令的识别响应时间;
当监控语音指令转换为语音控制指令的识别响应时间超过识别响应时间阈值时,则针对超过识别响应时间阈值的语音指令,按照该语音指令与语音控制指令之间的对应关系与语音控制指令重新建立对应关联。
一种变电站和电缆隧道场景语义构建系统,所述系统包括:
采集模块,利用RGB-D传感器采集所述变电站和电缆隧道环境,获得RGB-D图像;
图像分割模块,用于利用深度学习算法对所述RGB-D图像中的二维彩色图像进行目标分割,获得多个分割后的目标独立图像;
语义获取模块,用于获取所述目标独立图像对应的语义信息,并将所述语义信息赋值于所述目标独立图像,形成带有语义信息的目标图像;
三维地图建立模块,用于利用所述RGB-D图像中的Depth图像建立所述变电站和电缆隧道环境对应的三维地图;
语义地图建立模块,用于将所述目标图像融合到所述三维地图中,形成三维语义地图;
语音语义建立模块,用于在形成三维语义地图后,利用变电站和电缆隧道中负责运行管理的运维管理人员的语音指令信息构建与所述三维语义地图对应的语音数据库;
其中,所述语义地图建立模块包括:
目标图像获取模块,用于在所述三维地图中获取所述变电站和电缆隧道环境中各目标对象对应的目标图像;
坐标获取模块,用于将所述三维地图进行坐标分割,获取所述目标图像对应的图像坐标信息;
提取模块,用于提取每个目标图像的语义信息,将所述语音信息标注在所述目标图像上;
地图形成模块,用于根据图像坐标信息将所述标注有语义信息的目标图像融合至所述三维地图中,形成三维语义地图。
进一步地,所述语音语义建立模块包括:
录音模块,用于针对变电站和电缆隧道中负责运行管理的运维管理人员进行语音指令录制,形成每个管理人员对应的个人语音数据库;
建立模块,用于建立每个管理人员的个人语音数据库中的每个语音指令与语音控制指令之间的对应关系;
关联模块,用于将个人语音数据库中的每个语音指令按照每个语音指令与语音控制指令之间的对应关系与语音控制指令进行一一对应关联,当完成对应关联后,将所述语音控制指令形成与变电站和电缆隧道的三维可视化对应的语义库;
监控模块,用于通过反复播放每个个人语音数据库中的语音指令录制信息获得每个个人语音数据库与语音控制指令之间的识别响应时间阈值,并利用识别响应时间阈值进行语音控制指令响应监控。
进一步地,所述录音模块包括:
设置模块,用于设置语音控制指令列表,并且,语音控制指令列表中每个语音控制指令均标有唯一编号;
语音收录模块,用于运维管理人员按照语音控制指令列表中的编号顺序依次读取语音控制指令,获取每个运维管理人员的语音指令;
数据库建立模块,用于利用每个运维管理人员的语音指令建立与每个运维管理人员对应的个人语音数据库。
进一步地,所述建立模块包括:
标记模块,用于将每个语音指令按照读取的先后顺序依次进行标记,获取每个语音指令的唯一标识码;
对应模块,用于按照每个语音指令按照读取的先后顺序,依次将每个语音指令的唯一标识码与每个语音控制指令均标有的唯一编号进行一一对应,获得唯一标识码与唯一编号之间的对应关系;
所述关联模块包括:
获取模块,用于获取每个语音指令的唯一标识码与每个语音控制指令均标有的唯一编号之间的对应关系;
对应关联模块,用于按照每个语音指令的唯一标识码与每个语音控制指令均标有的唯一编号之间的对应关系,将每个运维管理人员的个人语音数据库中的语音指令与语音控制指令之间进行对应关联;
所述监控模块包括:
播放模块,用于反复播放每个个人语音数据库中的语音指令录制信息,用于进行个人语音数据库中的语音指令录制信息与语音控制指令之间对应关系的关联确认,并获得每个个人语音数据库与语音控制指令之间的识别响应时间阈值;
时间监控模块,用于利用每个个人语音数据库与语音控制指令之间的识别响应时间阈值对变电站和电缆隧道场景中运维管理人员工作时所发出的语音指令进行响应时间监控。
其中,所述播放模块的运行过程包括:
步骤1、反复三次播放每个个人语音数据库中的语音指令录制信息,
步骤2、根据每个语音指令与语音控制指令之间的对应关系,将语音指令转换为语音控制指令;
步骤3、按照语音指令对照表依次检测每一次语音指令所转换语音控制指令的转换结果是否正确;如果出现语音指令转换错误,则执行步骤4;如果全部正确,则执行步骤5;
步骤4、重新按照每个语音指令与语音控制指令之间的对应关系进行语音指令对应关联,并重复步骤1和步骤2直至所有语音指令转换结果均为正确结果;
步骤5、记录每次播放语音指令录制信息过程中,每个语音指令完成语音控制指令转换所用时间,并将每个语音指令完成语音控制指令转换所用时间即为单指令响应时间;
步骤6、利用每次播放语音指令录制信息过程中,每个语音指令完成语音控制指令转换的单指令响应时间获取每个语音指令完成语音控制指令转换的识别响应时间阈值。所述识别响应时间阈值通过如下公式获取:
Figure RE-GDA0003526507210000061
Figure RE-GDA0003526507210000062
其中,T表示识别响应时间阈值;Ti表示反复三次播放中第i次播放时,语音指令转换语音控制指令所用时间;T0表示系统建立过程中,语音指令转换为语音控制指令所用的理论相应时间;Tmax为反复三次播放中,每个语音指令转换语音控制指令对应所用的最长时间。
其中,所述时间监控模块包括:
响应时间监控模块,用于当运维管理人员发送语音指令时,实时监控语音指令转换为语音控制指令的识别响应时间;
重联模块,用于当监控语音指令转换为语音控制指令的识别响应时间超过识别响应时间阈值时,则针对超过识别响应时间阈值的语音指令,按照该语音指令与语音控制指令之间的对应关系与语音控制指令重新建立对应关联。
本发明有益效果:
本发明提出的一种变电站和电缆隧道场景语义构建系统和方法,能够有效提高变电站和电缆隧道场景的三维语义地图的语义表示准确性,同时,通过语音语义库的构建能够有效配合三维语义地图对变电站和电缆隧道场景工作的运维机器人进行更准确的控制,并能够针对工作人员的任何带有地方口音的语音指令进行有效识别,有效提高语音指令识别的准确性。同时,不同于传统方言语音识别的方言至普通话的语音算法,本发明采用工作人员发出语音指令与语音控制指令之间进行编号对应关联的方式,进行口音语音或方言语音至语音控制指令之间的对应识别,能够有效降低语音识别算法复杂度和难度,有效提高语音识别处理速度和相应速度,进而极大程度上提高语音识别效率,使更符合针对变电站和电缆隧道场景这种环境恶劣需要及时进行操作反应的工作场景。
附图说明
图1为本发明所述方法的流程图一;
图2为本发明所述方法的流程图二;
图3为本发明所述方法的流程图三;
图4为本发明所述系统的系统框图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
本发明实施例提出了一种变电站和电缆隧道场景语义构建方法,如图1所示,所述方法包括:
S1、利用RGB-D传感器采集所述变电站和电缆隧道环境,获得RGB-D图像;
S2、利用深度学习算法对所述RGB-D图像中的二维彩色图像进行目标分割,获得多个分割后的目标独立图像;
S3、获取所述目标独立图像对应的语义信息,并将所述语义信息赋值于所述目标独立图像,形成带有语义信息的目标图像;
S4、利用所述RGB-D图像中的Depth图像建立所述变电站和电缆隧道环境对应的三维地图;
S5、将所述目标图像融合到所述三维地图中,形成三维语义地图;
S6、在形成三维语义地图后,利用变电站和电缆隧道中负责运行管理的运维管理人员的语音指令信息构建与所述三维语义地图对应的语音数据库。
其中,所述将所述目标图像融合到所述三维地图中,形成三维语义地图包括:
S501、在所述三维地图中获取所述变电站和电缆隧道环境中各目标对象对应的目标图像;
将所述三维地图进行坐标分割,获取所述目标图像对应的图像坐标信息;
S502、提取每个目标图像的语义信息,将所述语音信息标注在所述目标图像上;
S503、根据图像坐标信息将所述标注有语义信息的目标图像融合至所述三维地图中,形成三维语义地图。
上述技术方案的工作原理为:首先,利用RGB-D传感器采集所述变电站和电缆隧道环境,获得RGB-D图像;然后,利用深度学习算法对所述RGB-D图像中的二维彩色图像进行目标分割,获得多个分割后的目标独立图像;之后,获取所述目标独立图像对应的语义信息,并将所述语义信息赋值于所述目标独立图像,形成带有语义信息的目标图像;随后,利用所述 RGB-D图像中的Depth图像建立所述变电站和电缆隧道环境对应的三维地图;然后,将所述目标图像融合到所述三维地图中,形成三维语义地图;最后,在形成三维语义地图后,利用变电站和电缆隧道中负责运行管理的运维管理人员的语音指令信息构建与所述三维语义地图对应的语音数据库。
上述技术方案的效果为:能够有效提高变电站和电缆隧道场景的三维语义地图的语义表示准确性,同时,通过语音语义库的构建能够有效配合三维语义地图对变电站和电缆隧道场景工作的运维机器人进行更准确的控制。
本发明的一个实施例,如图2所示,在形成三维语义地图后,利用变电站和电缆隧道中负责运行管理的运维管理人员的语音指令信息构建与所述三维语义地图对应的语音数据库,包括:
S601、针对变电站和电缆隧道中负责运行管理的运维管理人员进行语音指令录制,形成每个管理人员对应的个人语音数据库;
S602、建立每个管理人员的个人语音数据库中的每个语音指令与语音控制指令之间的对应关系;
S603、将个人语音数据库中的每个语音指令按照每个语音指令与语音控制指令之间的对应关系与语音控制指令进行一一对应关联,当完成对应关联后,将所述语音控制指令形成与变电站和电缆隧道的三维可视化对应的语义库;
S604、通过反复播放每个个人语音数据库中的语音指令录制信息获得每个个人语音数据库与语音控制指令之间的识别响应时间阈值,并利用识别响应时间阈值进行语音控制指令响应监控。
上述技术方案的工作原理为:首先,针对变电站和电缆隧道中负责运行管理的运维管理人员进行语音指令录制,形成每个管理人员对应的个人语音数据库;然后,建立每个管理人员的个人语音数据库中的每个语音指令与语音控制指令之间的对应关系;之后,将个人语音数据库中的每个语音指令按照每个语音指令与语音控制指令之间的对应关系与语音控制指令进行一一对应关联,当完成对应关联后,将所述语音控制指令形成与变电站和电缆隧道的三维可视化对应的语义库;最后,通过反复播放每个个人语音数据库中的语音指令录制信息获得每个个人语音数据库与语音控制指令之间的识别响应时间阈值,并利用识别响应时间阈值进行语音控制指令响应监控。
上述技术方案的效果:本实施例提出的一种变电站和电缆隧道场景语义构建方法能够针对工作人员的任何带有地方口音的语音指令进行有效识别,有效提高语音指令识别的准确性。同时,不同于传统方言语音识别的方言至普通话的语音算法,本实施例采用工作人员发出语音指令与语音控制指令之间进行编号对应关联的方式,进行口音语音或方言语音至语音控制指令之间的对应识别,能够有效降低语音识别算法复杂度和难度,有效提高语音识别处理速度和相应速度,进而极大程度上提高语音识别效率,使更符合针对变电站和电缆隧道场景这种环境恶劣需要及时进行操作反应的工作场景。
本发明的一个实施例,针对变电站和电缆隧道中负责运行管理的运维管理人员进行语音指令录制,形成每个管理人员对应的个人语音数据库,包括:
S6011、设置语音控制指令列表,并且,语音控制指令列表中每个语音控制指令均标有唯一编号;
S6012、运维管理人员按照语音控制指令列表中的编号顺序依次读取语音控制指令,获取每个运维管理人员的语音指令;
S6013、利用每个运维管理人员的语音指令建立与每个运维管理人员对应的个人语音数据库。
上述技术方案的工作原理为:首先,设置语音控制指令列表,并且,语音控制指令列表中每个语音控制指令均标有唯一编号;然后,运维管理人员按照语音控制指令列表中的编号顺序依次读取语音控制指令,获取每个运维管理人员的语音指令;最后,利用每个运维管理人员的语音指令建立与每个运维管理人员对应的个人语音数据库。
上述技术方案的效果:通过上述方式能够有效获取每个管理人员的个人语音信息,形成每个工作人员的专属个人语音信息库,使每个管理人员的语音信息进行有效区分,有效提高后续语音指令向语音控制指令转换的准确性和效率。
本发明的一个实施例,建立每个管理人员的个人语音数据库中的每个语音指令与语音控制指令之间的对应关系,包括:
S6021、将每个语音指令按照读取的先后顺序依次进行标记,获取每个语音指令的唯一标识码;
S6022、按照每个语音指令按照读取的先后顺序,依次将每个语音指令的唯一标识码与每个语音控制指令均标有的唯一编号进行一一对应,获得唯一标识码与唯一编号之间的对应关系。
上述技术方案的工作原理为:首先,将每个语音指令按照读取的先后顺序依次进行标记,获取每个语音指令的唯一标识码;然后,按照每个语音指令按照读取的先后顺序,依次将每个语音指令的唯一标识码与每个语音控制指令均标有的唯一编号进行一一对应,获得唯一标识码与唯一编号之间的对应关系。
上述技术方案的效果:通过设置每个语音指令对应的唯一标识码的方式有效提高后续语音指令向语音控制指令转换的准确性和效率。
本发明的一个实施例,将个人语音数据库中的每个语音指令按照每个语音指令与语音控制指令之间的对应关系与语音控制指令进行一一对应关联,当完成对应关联后,将所述语音控制指令形成与变电站和电缆隧道的三维可视化对应的语义库,包括:
S6031、获取每个语音指令的唯一标识码与每个语音控制指令均标有的唯一编号之间的对应关系;
S60232、按照每个语音指令的唯一标识码与每个语音控制指令均标有的唯一编号之间的对应关系,将每个运维管理人员的个人语音数据库中的语音指令与语音控制指令之间进行对应关联。
上述技术方案的工作原理为:首先,获取每个语音指令的唯一标识码与每个语音控制指令均标有的唯一编号之间的对应关系;然后,按照每个语音指令的唯一标识码与每个语音控制指令均标有的唯一编号之间的对应关系,将每个运维管理人员的个人语音数据库中的语音指令与语音控制指令之间进行对应关联。
上述技术方案的效果:通过上述方式有效提高工作人员发出的语音指令与系统设置的语音控制指令之间的对应准确性,进而有效提高后续语音指令向语音控制指令转换的准确性和效率。
本发明的一个实施例,通过反复播放每个个人语音数据库中的语音指令录制信息获得每个个人语音数据库与语音控制指令之间的识别响应时间阈值,并利用识别响应时间阈值进行语音控制指令响应监控,包括:
S6041、反复播放每个个人语音数据库中的语音指令录制信息,用于进行个人语音数据库中的语音指令录制信息与语音控制指令之间对应关系的关联确认,并获得每个个人语音数据库与语音控制指令之间的识别响应时间阈值;
S6042、利用每个个人语音数据库与语音控制指令之间的识别响应时间阈值对变电站和电缆隧道场景中运维管理人员工作时所发出的语音指令进行响应时间监控。
上述技术方案的工作原理为:首先,反复播放每个个人语音数据库中的语音指令录制信息,用于进行个人语音数据库中的语音指令录制信息与语音控制指令之间对应关系的关联确认,并获得每个个人语音数据库与语音控制指令之间的识别响应时间阈值;然后,利用每个个人语音数据库与语音控制指令之间的识别响应时间阈值对变电站和电缆隧道场景中运维管理人员工作时所发出的语音指令进行响应时间监控。
上述技术方案的效果为:本实施例采用工作人员发出语音指令与语音控制指令之间进行编号对应关联的方式,进行口音语音或方言语音至语音控制指令之间的对应识别,能够有效降低语音识别算法复杂度和难度,有效提高语音识别处理速度和相应速度,进而极大程度上提高语音识别效率,使更符合针对变电站和电缆隧道场景这种环境恶劣需要及时进行操作反应的工作场景。另一方面,通过上述方式能够在运维工作实施过程中,针对每个语音指令的识别和转换进行独立监控,有效提高每个语音指令的监控力度,并针对存在识别响应时间过长的语音指令进行重新对应关联,进而提高每个语音指令的识别准确性、独立监控性以及独立纠错性。
本发明的一个实施例,如图3所示,反复播放每个个人语音数据库中的语音指令录制信息,用于进行个人语音数据库中的语音指令录制信息与语音控制指令之间对应关系的关联确认,并获得每个个人语音数据库与语音控制指令之间的识别响应时间阈值,包括:
步骤1、反复三次播放每个个人语音数据库中的语音指令录制信息,
步骤2、根据每个语音指令与语音控制指令之间的对应关系,将语音指令转换为语音控制指令;
步骤3、按照语音指令对照表依次检测每一次语音指令所转换语音控制指令的转换结果是否正确;如果出现语音指令转换错误,则执行步骤4;如果全部正确,则执行步骤5;
步骤4、重新按照每个语音指令与语音控制指令之间的对应关系进行语音指令对应关联,并重复步骤1和步骤2直至所有语音指令转换结果均为正确结果;
步骤5、记录每次播放语音指令录制信息过程中,每个语音指令完成语音控制指令转换所用时间,并将每个语音指令完成语音控制指令转换所用时间即为单指令响应时间;
步骤6、利用每次播放语音指令录制信息过程中,每个语音指令完成语音控制指令转换的单指令响应时间获取每个语音指令完成语音控制指令转换的识别响应时间阈值。所述识别响应时间阈值通过如下公式获取:
Figure RE-GDA0003526507210000121
Figure RE-GDA0003526507210000122
其中,T表示识别响应时间阈值;Ti表示反复三次播放中第i次播放时,语音指令转换语音控制指令所用时间;T0表示系统建立过程中,语音指令转换为语音控制指令所用的理论相应时间;Tmax为反复三次播放中,每个语音指令转换语音控制指令对应所用的最长时间。
上述技术方案的效果为:通过上述方式能够有效提高语音指令与语音控制指令对应关系确定的准确性。同时,通过上述方式能够在运维工作实施过程中,针对每个语音指令的识别和转换进行独立监控,有效提高每个语音指令的监控力度,并针对存在识别响应时间过长的语音指令进行重新对应关联,进而提高每个语音指令的识别准确性、独立监控性以及独立纠错性。另一方面,通过上述公式获取识别响应时间阈值,能够结合每个工作人员个人因素和个人数据库中的每个语音指令的不同特点,针对每个语音指令设置不同的,专属的识别响应时间阈值,能够有效提高每个语音指令识别转换过程的监控力度。同时,通过上述公式获取的识别响应时间阈值能够有效提高语音识别时间阈值设置的合理性,防止统一不变的阈值时间设置无法针对不同工作人员的声音和口音特点进行针对性设置,而导致语音识别速度监控准确率降低的问题发生。
本发明的一个实施例,利用每个个人语音数据库与语音控制指令之间的识别响应时间阈值对变电站和电缆隧道场景中运维管理人员工作时所发出的语音指令进行响应时间监控,包括:
步骤一、当运维管理人员发送语音指令时,实时监控语音指令转换为语音控制指令的识别响应时间;
步骤二、当监控语音指令转换为语音控制指令的识别响应时间超过识别响应时间阈值时,则针对超过识别响应时间阈值的语音指令,按照该语音指令与语音控制指令之间的对应关系与语音控制指令重新建立对应关联。
上述技术方案的工作原理为:首先,当运维管理人员发送语音指令时,实时监控语音指令转换为语音控制指令的识别响应时间;然后,当监控语音指令转换为语音控制指令的识别响应时间超过识别响应时间阈值时,则针对超过识别响应时间阈值的语音指令,按照该语音指令与语音控制指令之间的对应关系与语音控制指令重新建立对应关联。
上述技术方案的效果:通过上述方式能够在运维工作实施过程中,针对每个语音指令的识别和转换进行独立监控,有效提高每个语音指令的监控力度,并针对存在识别响应时间过长的语音指令进行重新对应关联,进而提高每个语音指令的识别准确性、独立监控性以及独立纠错性。
本发明实施例一种变电站和电缆隧道场景语义构建系统,如图4所示,所述系统包括:
采集模块,利用RGB-D传感器采集所述变电站和电缆隧道环境,获得RGB-D图像;
图像分割模块,用于利用深度学习算法对所述RGB-D图像中的二维彩色图像进行目标分割,获得多个分割后的目标独立图像;
语义获取模块,用于获取所述目标独立图像对应的语义信息,并将所述语义信息赋值于所述目标独立图像,形成带有语义信息的目标图像;
三维地图建立模块,用于利用所述RGB-D图像中的Depth图像建立所述变电站和电缆隧道环境对应的三维地图;
语义地图建立模块,用于将所述目标图像融合到所述三维地图中,形成三维语义地图;
语音语义建立模块,用于在形成三维语义地图后,利用变电站和电缆隧道中负责运行管理的运维管理人员的语音指令信息构建与所述三维语义地图对应的语音数据库;
其中,所述语义地图建立模块包括:
目标图像获取模块,用于在所述三维地图中获取所述变电站和电缆隧道环境中各目标对象对应的目标图像;
坐标获取模块,用于将所述三维地图进行坐标分割,获取所述目标图像对应的图像坐标信息;
提取模块,用于提取每个目标图像的语义信息,将所述语音信息标注在所述目标图像上;
地图形成模块,用于根据图像坐标信息将所述标注有语义信息的目标图像融合至所述三维地图中,形成三维语义地图。
上述技术方案的工作原理为:首先,利用RGB-D传感器采集所述变电站和电缆隧道环境,获得RGB-D图像;然后,利用深度学习算法对所述RGB-D图像中的二维彩色图像进行目标分割,获得多个分割后的目标独立图像;之后,获取所述目标独立图像对应的语义信息,并将所述语义信息赋值于所述目标独立图像,形成带有语义信息的目标图像;随后,利用所述 RGB-D图像中的Depth图像建立所述变电站和电缆隧道环境对应的三维地图;然后,将所述目标图像融合到所述三维地图中,形成三维语义地图;最后,在形成三维语义地图后,利用变电站和电缆隧道中负责运行管理的运维管理人员的语音指令信息构建与所述三维语义地图对应的语音数据库。
上述技术方案的效果为:能够有效提高变电站和电缆隧道场景的三维语义地图的语义表示准确性,同时,通过语音语义库的构建能够有效配合三维语义地图对变电站和电缆隧道场景工作的运维机器人进行更准确的控制。
本发明的一个实施例,所述语音语义建立模块包括:
录音模块,用于针对变电站和电缆隧道中负责运行管理的运维管理人员进行语音指令录制,形成每个管理人员对应的个人语音数据库;
建立模块,用于建立每个管理人员的个人语音数据库中的每个语音指令与语音控制指令之间的对应关系;
关联模块,用于将个人语音数据库中的每个语音指令按照每个语音指令与语音控制指令之间的对应关系与语音控制指令进行一一对应关联,当完成对应关联后,将所述语音控制指令形成与变电站和电缆隧道的三维可视化对应的语义库;
监控模块,用于通过反复播放每个个人语音数据库中的语音指令录制信息获得每个个人语音数据库与语音控制指令之间的识别响应时间阈值,并利用识别响应时间阈值进行语音控制指令响应监控。
上述技术方案的工作原理为:首先,通过录音模块针对变电站和电缆隧道中负责运行管理的运维管理人员进行语音指令录制,形成每个管理人员对应的个人语音数据库;然后,利用建立模块建立每个管理人员的个人语音数据库中的每个语音指令与语音控制指令之间的对应关系;之后,采用关联模块将个人语音数据库中的每个语音指令按照每个语音指令与语音控制指令之间的对应关系与语音控制指令进行一一对应关联,当完成对应关联后,将所述语音控制指令形成与变电站和电缆隧道的三维可视化对应的语义库;最后,利用监控模块通过反复播放每个个人语音数据库中的语音指令录制信息获得每个个人语音数据库与语音控制指令之间的识别响应时间阈值,并利用识别响应时间阈值进行语音控制指令响应监控。
上述技术方案的效果为:本实施例提出的一种变电站和电缆隧道场景语义构建系统能够针对工作人员的任何带有地方口音的语音指令进行有效识别,有效提高语音指令识别的准确性。同时,不同于传统方言语音识别的方言至普通话的语音算法,本实施例采用工作人员发出语音指令与语音控制指令之间进行编号对应关联的方式,进行口音语音或方言语音至语音控制指令之间的对应识别,能够有效降低语音识别算法复杂度和难度,有效提高语音识别处理速度和相应速度,进而极大程度上提高语音识别效率,使更符合针对变电站和电缆隧道场景这种环境恶劣需要及时进行操作反应的工作场景。
本发明的一个实施例,所述录音模块包括:
设置模块,用于设置语音控制指令列表,并且,语音控制指令列表中每个语音控制指令均标有唯一编号;
语音收录模块,用于运维管理人员按照语音控制指令列表中的编号顺序依次读取语音控制指令,获取每个运维管理人员的语音指令;
数据库建立模块,用于利用每个运维管理人员的语音指令建立与每个运维管理人员对应的个人语音数据库。
上述技术方案的工作原理为:首先,通过设置模块设置语音控制指令列表,并且,语音控制指令列表中每个语音控制指令均标有唯一编号;然后,利用语音收录模块在运维管理人员按照语音控制指令列表中的编号顺序依次读取语音控制指令时,依次录取工作人员读取的语音指令,获取每个运维管理人员的语音指令;最后,通过数据库建立模块利用每个运维管理人员的语音指令建立与每个运维管理人员对应的个人语音数据库。
上述技术方案的效果为:通过上述方式能够有效获取每个管理人员的个人语音信息,形成每个工作人员的专属个人语音信息库,使每个管理人员的语音信息进行有效区分,有效提高后续语音指令向语音控制指令转换的准确性和效率。
本发明的一个实施例,所述建立模块包括:
标记模块,用于将每个语音指令按照读取的先后顺序依次进行标记,获取每个语音指令的唯一标识码;
对应模块,用于按照每个语音指令按照读取的先后顺序,依次将每个语音指令的唯一标识码与每个语音控制指令均标有的唯一编号进行一一对应,获得唯一标识码与唯一编号之间的对应关系。
上述技术方案的工作原理为:首先,通过标记模块将每个语音指令按照读取的先后顺序依次进行标记,获取每个语音指令的唯一标识码;然后,利用对应模块按照每个语音指令按照读取的先后顺序,依次将每个语音指令的唯一标识码与每个语音控制指令均标有的唯一编号进行一一对应,获得唯一标识码与唯一编号之间的对应关系。
上述技术方案的效果:通过设置每个语音指令对应的唯一标识码的方式有效提高后续语音指令向语音控制指令转换的准确性和效率。
本发明的一个实施例,所述关联模块包括:
获取模块,用于获取每个语音指令的唯一标识码与每个语音控制指令均标有的唯一编号之间的对应关系;
对应关联模块,用于按照每个语音指令的唯一标识码与每个语音控制指令均标有的唯一编号之间的对应关系,将每个运维管理人员的个人语音数据库中的语音指令与语音控制指令之间进行对应关联。
上述技术方案的工作原理为:首先,通过获取模块获取每个语音指令的唯一标识码与每个语音控制指令均标有的唯一编号之间的对应关系;然后,利用对应关联模块按照每个语音指令的唯一标识码与每个语音控制指令均标有的唯一编号之间的对应关系,将每个运维管理人员的个人语音数据库中的语音指令与语音控制指令之间进行对应关联。
上述技术方案的效果:通过上述方式有效提高工作人员发出的语音指令与系统设置的语音控制指令之间的对应准确性,进而有效提高后续语音指令向语音控制指令转换的准确性和效率。
本发明的一个实施例,所述监控模块包括:
播放模块,用于反复播放每个个人语音数据库中的语音指令录制信息,用于进行个人语音数据库中的语音指令录制信息与语音控制指令之间对应关系的关联确认,并获得每个个人语音数据库与语音控制指令之间的识别响应时间阈值;
时间监控模块,用于利用每个个人语音数据库与语音控制指令之间的识别响应时间阈值对变电站和电缆隧道场景中运维管理人员工作时所发出的语音指令进行响应时间监控。
其中,所述播放模块的运行过程包括:
步骤1、反复三次播放每个个人语音数据库中的语音指令录制信息,
步骤2、根据每个语音指令与语音控制指令之间的对应关系,将语音指令转换为语音控制指令;
步骤3、按照语音指令对照表依次检测每一次语音指令所转换语音控制指令的转换结果是否正确;如果出现语音指令转换错误,则执行步骤4;如果全部正确,则执行步骤5;
步骤4、重新按照每个语音指令与语音控制指令之间的对应关系进行语音指令对应关联,并重复步骤1和步骤2直至所有语音指令转换结果均为正确结果;
步骤5、记录每次播放语音指令录制信息过程中,每个语音指令完成语音控制指令转换所用时间,并将每个语音指令完成语音控制指令转换所用时间即为单指令响应时间;
步骤6、利用每次播放语音指令录制信息过程中,每个语音指令完成语音控制指令转换的单指令响应时间获取每个语音指令完成语音控制指令转换的识别响应时间阈值。所述识别响应时间阈值通过如下公式获取:
Figure RE-GDA0003526507210000171
Figure RE-GDA0003526507210000172
其中,T表示识别响应时间阈值;Ti表示反复三次播放中第i次播放时,语音指令转换语音控制指令所用时间;T0表示系统建立过程中,语音指令转换为语音控制指令所用的理论相应时间;Tmax为反复三次播放中,每个语音指令转换语音控制指令对应所用的最长时间。
上述技术方案的效果为:本实施例采用工作人员发出语音指令与语音控制指令之间进行编号对应关联的方式,进行口音语音或方言语音至语音控制指令之间的对应识别,能够有效降低语音识别算法复杂度和难度,有效提高语音识别处理速度和相应速度,进而极大程度上提高语音识别效率,使更符合针对变电站和电缆隧道场景这种环境恶劣需要及时进行操作反应的工作场景。另一方面,通过上述方式能够在运维工作实施过程中,针对每个语音指令的识别和转换进行独立监控,有效提高每个语音指令的监控力度,并针对存在识别响应时间过长的语音指令进行重新对应关联,进而提高每个语音指令的识别准确性、独立监控性以及独立纠错性。另一方面,通过上述公式获取识别响应时间阈值,能够结合每个工作人员个人因素和个人数据库中的每个语音指令的不同特点,针对每个语音指令设置不同的,专属的识别响应时间阈值,能够有效提高每个语音指令识别转换过程的监控力度。同时,通过上述公式获取的识别响应时间阈值能够有效提高语音识别时间阈值设置的合理性,防止统一不变的阈值时间设置无法针对不同工作人员的声音和口音特点进行针对性设置,而导致语音识别速度监控准确率降低的问题发生。
其中,所述时间监控模块包括:
响应时间监控模块,用于当运维管理人员发送语音指令时,实时监控语音指令转换为语音控制指令的识别响应时间;
重联模块,用于当监控语音指令转换为语音控制指令的识别响应时间超过识别响应时间阈值时,则针对超过识别响应时间阈值的语音指令,按照该语音指令与语音控制指令之间的对应关系与语音控制指令重新建立对应关联。
上述技术方案的工作效果为:首先,通过响应时间监控模块当运维管理人员发送语音指令时,实时监控语音指令转换为语音控制指令的识别响应时间;然后,利用重联模块在当监控语音指令转换为语音控制指令的识别响应时间超过识别响应时间阈值时,则针对超过识别响应时间阈值的语音指令,按照该语音指令与语音控制指令之间的对应关系与语音控制指令重新建立对应关联。
上述技术方案的效果:通过上述方式能够在运维工作实施过程中,针对每个语音指令的识别和转换进行独立监控,有效提高每个语音指令的监控力度,并针对存在识别响应时间过长的语音指令进行重新对应关联,进而提高每个语音指令的识别准确性、独立监控性以及独立纠错性。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (10)

1.一种变电站和电缆隧道场景语义构建方法,其特征在于,所述方法包括:
利用RGB-D传感器采集所述变电站和电缆隧道环境,获得RGB-D图像;
利用深度学习算法对所述RGB-D图像中的二维彩色图像进行目标分割,获得多个分割后的目标独立图像;
获取所述目标独立图像对应的语义信息,并将所述语义信息赋值于所述目标独立图像,形成带有语义信息的目标图像;
利用所述RGB-D图像中的Depth图像建立所述变电站和电缆隧道环境对应的三维地图;
将所述目标图像融合到所述三维地图中,形成三维语义地图;
在形成三维语义地图后,利用变电站和电缆隧道中负责运行管理的运维管理人员的语音指令信息构建与所述三维语义地图对应的语音数据库。
2.根据权利要求1所述语义构建方法,其特征在于,所述将所述目标图像融合到所述三维地图中,形成三维语义地图包括:
在所述三维地图中获取所述变电站和电缆隧道环境中各目标对象对应的目标图像;
将所述三维地图进行坐标分割,获取所述目标图像对应的图像坐标信息;
提取每个目标图像的语义信息,将所述语音信息标注在所述目标图像上;
根据图像坐标信息将所述标注有语义信息的目标图像融合至所述三维地图中,形成三维语义地图。
3.根据权利要求1所述语义构建方法,其特征在于,在形成三维语义地图后,利用变电站和电缆隧道中负责运行管理的运维管理人员的语音指令信息构建与所述三维语义地图对应的语音数据库,包括:
针对变电站和电缆隧道中负责运行管理的运维管理人员进行语音指令录制,形成每个管理人员对应的个人语音数据库;
建立每个管理人员的个人语音数据库中的每个语音指令与语音控制指令之间的对应关系;
将个人语音数据库中的每个语音指令按照每个语音指令与语音控制指令之间的对应关系与语音控制指令进行一一对应关联,当完成对应关联后,将所述语音控制指令形成与变电站和电缆隧道的三维可视化对应的语义库;
通过反复播放每个个人语音数据库中的语音指令录制信息获得每个个人语音数据库与语音控制指令之间的识别响应时间阈值,并利用识别响应时间阈值进行语音控制指令响应监控。
4.根据权利要求3所述语义构建方法,其特征在于,针对变电站和电缆隧道中负责运行管理的运维管理人员进行语音指令录制,形成每个管理人员对应的个人语音数据库,包括:
设置语音控制指令列表,并且,语音控制指令列表中每个语音控制指令均标有唯一编号;
运维管理人员按照语音控制指令列表中的编号顺序依次读取语音控制指令,获取每个运维管理人员的语音指令;
利用每个运维管理人员的语音指令建立与每个运维管理人员对应的个人语音数据库。
5.根据权利要求1所述语义构建方法,其特征在于,建立每个管理人员的个人语音数据库中的每个语音指令与语音控制指令之间的对应关系,包括:
将每个语音指令按照读取的先后顺序依次进行标记,获取每个语音指令的唯一标识码;
按照每个语音指令按照读取的先后顺序,依次将每个语音指令的唯一标识码与每个语音控制指令均标有的唯一编号进行一一对应,获得唯一标识码与唯一编号之间的对应关系。
6.根据权利要求1所述语义构建方法,其特征在于,将个人语音数据库中的每个语音指令按照每个语音指令与语音控制指令之间的对应关系与语音控制指令进行一一对应关联,当完成对应关联后,将所述语音控制指令形成与变电站和电缆隧道的三维可视化对应的语义库,包括:
获取每个语音指令的唯一标识码与每个语音控制指令均标有的唯一编号之间的对应关系;
按照每个语音指令的唯一标识码与每个语音控制指令均标有的唯一编号之间的对应关系,将每个运维管理人员的个人语音数据库中的语音指令与语音控制指令之间进行对应关联。
7.根据权利要求1所述语义构建方法,其特征在于,通过反复播放每个个人语音数据库中的语音指令录制信息获得每个个人语音数据库与语音控制指令之间的识别响应时间阈值,并利用识别响应时间阈值进行语音控制指令响应监控,包括:
反复播放每个个人语音数据库中的语音指令录制信息,用于进行个人语音数据库中的语音指令录制信息与语音控制指令之间对应关系的关联确认,并获得每个个人语音数据库与语音控制指令之间的识别响应时间阈值;
利用每个个人语音数据库与语音控制指令之间的识别响应时间阈值对变电站和电缆隧道场景中运维管理人员工作时所发出的语音指令进行响应时间监控。
8.根据权利要求5所述语义构建方法,其特征在于,反复播放每个个人语音数据库中的语音指令录制信息,用于进行个人语音数据库中的语音指令录制信息与语音控制指令之间对应关系的关联确认,并获得每个个人语音数据库与语音控制指令之间的识别响应时间阈值,包括:
步骤1、反复三次播放每个个人语音数据库中的语音指令录制信息,
步骤2、根据每个语音指令与语音控制指令之间的对应关系,将语音指令转换为语音控制指令;
步骤3、按照语音指令对照表依次检测每一次语音指令所转换语音控制指令的转换结果是否正确;如果出现语音指令转换错误,则执行步骤4;如果全部正确,则执行步骤5;
步骤4、重新按照每个语音指令与语音控制指令之间的对应关系进行语音指令对应关联,并重复步骤1和步骤2直至所有语音指令转换结果均为正确结果;
步骤5、记录每次播放语音指令录制信息过程中,每个语音指令完成语音控制指令转换所用时间,并将每个语音指令完成语音控制指令转换所用时间即为单指令响应时间;
步骤6、利用每次播放语音指令录制信息过程中,每个语音指令完成语音控制指令转换的单指令响应时间获取每个语音指令完成语音控制指令转换的识别响应时间阈值。
9.根据权利要求5所述语义构建方法,其特征在于,利用每个个人语音数据库与语音控制指令之间的识别响应时间阈值对变电站和电缆隧道场景中运维管理人员工作时所发出的语音指令进行响应时间监控,包括:
当运维管理人员发送语音指令时,实时监控语音指令转换为语音控制指令的识别响应时间;
当监控语音指令转换为语音控制指令的识别响应时间超过识别响应时间阈值时,则针对超过识别响应时间阈值的语音指令,按照该语音指令与语音控制指令之间的对应关系与语音控制指令重新建立对应关联。
10.一种变电站和电缆隧道场景语义构建系统,其特征在于,所述系统包括:
采集模块,利用RGB-D传感器采集所述变电站和电缆隧道环境,获得RGB-D图像;
图像分割模块,用于利用深度学习算法对所述RGB-D图像中的二维彩色图像进行目标分割,获得多个分割后的目标独立图像;
语义获取模块,用于获取所述目标独立图像对应的语义信息,并将所述语义信息赋值于所述目标独立图像,形成带有语义信息的目标图像;
三维地图建立模块,用于利用所述RGB-D图像中的Depth图像建立所述变电站和电缆隧道环境对应的三维地图;
语义地图建立模块,用于将所述目标图像融合到所述三维地图中,形成三维语义地图;
语音语义建立模块,用于在形成三维语义地图后,利用变电站和电缆隧道中负责运行管理的运维管理人员的语音指令信息构建与所述三维语义地图对应的语音数据库;
其中,所述语义地图建立模块包括:
目标图像获取模块,用于在所述三维地图中获取所述变电站和电缆隧道环境中各目标对象对应的目标图像;
坐标获取模块,用于将所述三维地图进行坐标分割,获取所述目标图像对应的图像坐标信息;
提取模块,用于提取每个目标图像的语义信息,将所述语音信息标注在所述目标图像上;
地图形成模块,用于根据图像坐标信息将所述标注有语义信息的目标图像融合至所述三维地图中,形成三维语义地图;
所述语音语义建立模块包括:
录音模块,用于针对变电站和电缆隧道中负责运行管理的运维管理人员进行语音指令录制,形成每个管理人员对应的个人语音数据库;
建立模块,用于建立每个管理人员的个人语音数据库中的每个语音指令与语音控制指令之间的对应关系;
关联模块,用于将个人语音数据库中的每个语音指令按照每个语音指令与语音控制指令之间的对应关系与语音控制指令进行一一对应关联,当完成对应关联后,将所述语音控制指令形成与变电站和电缆隧道的三维可视化对应的语义库;
监控模块,用于通过反复播放每个个人语音数据库中的语音指令录制信息获得每个个人语音数据库与语音控制指令之间的识别响应时间阈值,并利用识别响应时间阈值进行语音控制指令响应监控。
CN202111440567.7A 2021-11-30 2021-11-30 一种变电站和电缆隧道场景语义构建系统和方法 Active CN114494267B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111440567.7A CN114494267B (zh) 2021-11-30 2021-11-30 一种变电站和电缆隧道场景语义构建系统和方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111440567.7A CN114494267B (zh) 2021-11-30 2021-11-30 一种变电站和电缆隧道场景语义构建系统和方法

Publications (2)

Publication Number Publication Date
CN114494267A true CN114494267A (zh) 2022-05-13
CN114494267B CN114494267B (zh) 2022-11-04

Family

ID=81493080

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111440567.7A Active CN114494267B (zh) 2021-11-30 2021-11-30 一种变电站和电缆隧道场景语义构建系统和方法

Country Status (1)

Country Link
CN (1) CN114494267B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104778946A (zh) * 2014-01-10 2015-07-15 中国电信股份有限公司 语音控制方法和系统
CN111340939A (zh) * 2020-02-21 2020-06-26 广东工业大学 一种室内三维语义地图构建方法
CN111609852A (zh) * 2019-02-25 2020-09-01 北京奇虎科技有限公司 语义地图构建方法、扫地机器人及电子设备
CN111679661A (zh) * 2019-02-25 2020-09-18 北京奇虎科技有限公司 基于深度相机的语义地图构建方法及扫地机器人
CN111695546A (zh) * 2020-06-28 2020-09-22 北京京东乾石科技有限公司 用于无人车的交通信号灯识别方法和装置
WO2020248614A1 (zh) * 2019-06-10 2020-12-17 商汤集团有限公司 地图生成方法、驾驶控制方法、装置、电子设备及系统
CN112489654A (zh) * 2020-11-17 2021-03-12 深圳康佳电子科技有限公司 一种语音交互方法、装置、智能终端及存储介质
WO2021135604A1 (zh) * 2019-12-31 2021-07-08 华为技术有限公司 语音控制方法、装置、服务器、终端设备及存储介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104778946A (zh) * 2014-01-10 2015-07-15 中国电信股份有限公司 语音控制方法和系统
CN111609852A (zh) * 2019-02-25 2020-09-01 北京奇虎科技有限公司 语义地图构建方法、扫地机器人及电子设备
CN111679661A (zh) * 2019-02-25 2020-09-18 北京奇虎科技有限公司 基于深度相机的语义地图构建方法及扫地机器人
WO2020248614A1 (zh) * 2019-06-10 2020-12-17 商汤集团有限公司 地图生成方法、驾驶控制方法、装置、电子设备及系统
WO2021135604A1 (zh) * 2019-12-31 2021-07-08 华为技术有限公司 语音控制方法、装置、服务器、终端设备及存储介质
CN111340939A (zh) * 2020-02-21 2020-06-26 广东工业大学 一种室内三维语义地图构建方法
CN111695546A (zh) * 2020-06-28 2020-09-22 北京京东乾石科技有限公司 用于无人车的交通信号灯识别方法和装置
CN112489654A (zh) * 2020-11-17 2021-03-12 深圳康佳电子科技有限公司 一种语音交互方法、装置、智能终端及存储介质

Also Published As

Publication number Publication date
CN114494267B (zh) 2022-11-04

Similar Documents

Publication Publication Date Title
CN110580723B (zh) 一种利用深度学习和计算机视觉进行精准定位的方法
CN110909898B (zh) 基于ar眼镜的银行机房故障诊断维修指导系统及方法
CN110544293A (zh) 一种多无人机视觉协同的建筑场景识别方法
CN110097574A (zh) 一种已知刚体的实时位姿估计方法
CN111813126A (zh) 一种基于神经网络的智能避障控制系统及其方法
CN112163447B (zh) 基于Attention和SqueezeNet的多任务实时手势检测和识别方法
CN114693908A (zh) 一种基于YOLOv5的工业二维码定位方法
WO2021103558A1 (zh) 基于rgb-d数据融合的机器人视觉引导方法和装置
CN111126414A (zh) 一种基于深度学习的装修图内图块识别方法
CN113657573A (zh) 一种情景记忆引导下基于元学习的机器人技能获取方法
CN112329605A (zh) 一种城市容貌乱贴乱画行为识别方法,存储装置及服务器
CN114494267B (zh) 一种变电站和电缆隧道场景语义构建系统和方法
CN113076808B (zh) 一种通过图像算法精准获取双向人流量的方法
CN116442219B (zh) 一种智能机器人控制系统及方法
CN111413691A (zh) 一种采用分布式结构的语义定位和建图的方法
CN115493596A (zh) 一种移动机器人语义地图构建与导航方法
JP2001351104A (ja) パターン認識方法及びパターン認識装置、並びにパターン照合方法及びパターン照合装置
CN106055244A (zh) 一种基于Kincet和语音的人机交互方法
CN113420839B (zh) 用于堆叠平面目标物体的半自动标注方法及分割定位系统
CN115688805A (zh) 基于元-多任务学习的电力虚拟调度方法及调度系统
CN112116195B (zh) 基于实例分割的铁路梁生产工序识别方法
CN115063448A (zh) 一种面向油田作业场景的多目标追踪方法
CN111353509B (zh) 一种视觉slam系统的关键点提取器生成方法
CN111125395B (zh) 一种基于双分支深度学习的cad图纸检索方法及系统
CN109918997B (zh) 一种基于多示例学习的行人目标跟踪方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant