CN111895991B - 一种结合语音识别的室内定位导航方法 - Google Patents
一种结合语音识别的室内定位导航方法 Download PDFInfo
- Publication number
- CN111895991B CN111895991B CN202010764992.0A CN202010764992A CN111895991B CN 111895991 B CN111895991 B CN 111895991B CN 202010764992 A CN202010764992 A CN 202010764992A CN 111895991 B CN111895991 B CN 111895991B
- Authority
- CN
- China
- Prior art keywords
- positioning
- sound
- basic
- correcting
- signals
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01C—MEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
- G01C21/00—Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
- G01C21/005—Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 with correlation of navigation data from several sources, e.g. map or contour matching
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01C—MEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
- G01C21/00—Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
- G01C21/20—Instruments for performing navigational calculations
- G01C21/206—Instruments for performing navigational calculations specially adapted for indoor navigation
Landscapes
- Engineering & Computer Science (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- Automation & Control Theory (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Position Fixing By Use Of Radio Waves (AREA)
- Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
- Navigation (AREA)
Abstract
本发明公开了一种结合语音识别的室内定位导航方法,涉及室内定位技术领域。包括:采用将设备终端采集到的声音信号转换成位置信号,并同时对基础定位的结果进行修正和标记的方法,并运用深度学习算法辅助训练基础定位,修正异常定位区域,具体包括如下步骤:(1)从声音信号中提取出位置信号;(2)对位置信号的有效性进行判断;(3)利用位置信号对基础定位结果进行修正和标记;(4)利用深度学习算法对基础定位的离线数据进行训练,并应用于后期的基础定位。本发明的方法能够对基础定位就行修正的同时,还能够对基础定位的离线数据进行标记、训练,提升没有声音信息时的基础定位的精准度。
Description
技术领域
本发明涉及室内定位技术领域,尤其一种结合语音识别的室内定位导航方法。
背景技术
随着网络技术的进步和发展,基于室内空间信号的定位技术也越来受到重视。室内空间信号通常包括,例如, WiFi、蓝牙、BLE、地磁、气压计等。室内定位的原理,是基于以上信号在全空间的分布规律,生成空间指纹,匹配用户当前位置的空间信号,找出最大相似度的位置,实现定位能力。但是在实际过程中,随着环境的变化,空间信号会改变。局部定位精度会下降。重新采集空间的信号的成本比较大,难以快速低成本的解决局部精度下降的问题。
因此,为解决上述技术问题,需要提出一种新的技术方案来解决这个问题。尤其是提供一种结合语音识别的室内定位导航方法。
发明内容
本发明为解决市场上现有的室内定位技术定位效果可能存在异常情况且若定位的离线数据不及时更新将出现定位异常的技术问题,提供了一种可以修正基础定位且能够对离线数据进行修正和标记的结合语音识别的室内定位导航方法。
为实现上述目的提供了如下技术方案:一种结合语音识别的室内定位导航方法,采用将设备终端采集到的声音信号转换成位置信号,并同时对基础定位的结果进行修正和标记的方法,并运用深度学习算法辅助训练基础定位,修正异常定位区域,具体包括如下步骤:
第一步 从声音信号中提取位置信号
(1.1) 声音信号的采集
在设备终端增加声音采集模块,支持声音的录入,将声音信号采集为数字数据;
(1.2)声音信号的筛选
从采集到的声音信号中去除无关信号,去除环境音、噪音、爆破音和用户无用的语音,留下人声;
(1.3)声音信号的识别
对去除无关信号的纯净声音信号通过云端语音识别算法,将声音数据转换成文本数据;
(1.4)利用文本数据得到位置信号
通过文本数据与云端数据库中的POI数据库进行匹配,识别出包含现场POI信息的内容,并通过贝叶斯分析器转换成位置信号;
第二步 判断声音信号中位置信号数据的有效性
(2.1)将声音信号中的位置信号上传至云端服务器
将第一步中从声音信号中提取到的位置信号转换成定位指令并将定位指令送达至云端服务器;
(2.2)定位结果对比
云端服务器将声音信号中的定位指令与前一段时间内基础定位的结果进行对比,当声音定位的精准度高于基础定位结果的精准度时,判断为定位指令有效;当声音定位的精准度低于基础定位结果的精准度时,判断为定位指令无效;
第三步 对基础定位结果进行修正和标记
(3.1)对基础定位的结果进行修正
利用有效的定位指令对基础定位的结果进行修正,定义有效的定位指令对应的坐标作为初始位置,重新启动室内定位算法进行修正;
(3.2)对基础定位结果进行标记
利用有效的定位指令对基础定位的结果进行标记;
第四步 利用深度学习算法对基础定位进行训练,修正基础定位
(4.1)数据回传至深度学习训练模块
将修正数据信息回传至云端服务器,送入深度学习训练模块;
(4.2)通过深度学习训练模块对基础定位进行训练、修正
通过修正后的数据对空间信号打标签,进行深度训练后,修正定位算法模型。
优选地,所述云端语音识别算法包括卷积神经网络CNN算法。
优选地,所述深度学习算法为卷积神经网络CNN算法。
优选地,所述设备终端包括:智能手机、平板电脑。
优选地,所述采集模块包括麦克风。
优选地,所述基础定位包括:wifi定位、地磁定位、蓝牙定位、角向量定位、超声波定位、RFID定位、红外线定位。
本发明的优点:本发明结合语音识别技术可以及时发现用户使用定位导航功能时的定位错误,并修正。这种方法打破了传统的通用模型定位的方式,可以实时收集用户的定位反馈,在定位过程中就能修正问题。
本方法有效的修正可以反馈到定位模型的训练过程,减少了重新去现场采集信号的成本。用户在使用过程中可以和应用交互,我们也可以在产品全流程支持语音识别和语音控制功能,增加产品的智能化程度。
附图说明
图1是本发明的步骤流程示意框图。
具体实施方式
下面将结合附图对本发明的技术方案进行清楚、完整地描述。
如图1所示,本发明的方法流程如下:(1)从声音信号中提取出位置信号;(2)对位置信号的有效性进行判断;(3)利用位置信号对基础定位结果进行修正和标记;(4)利用深度学习算法对基础定位的离线数据进行训练,并应用于后期的基础定位。
具体包括:一种结合语音识别的室内定位导航方法,采用将设备终端采集到的声音信号转换成位置信号,并同时对基础定位的结果进行修正和标记的方法,并运用深度学习算法辅助训练基础定位,修正异常定位区域,具体包括如下步骤:
第一步 从声音信号中提取位置信号
(1.1) 声音信号的采集
在设备终端增加声音采集模块,支持声音的录入,将声音信号采集为数字数据;该采集模块用于对声音的采集作用,可以是最简单的麦克风设备;
(1.2)声音信号的筛选
从采集到的声音信号中去除无关信号,去除环境音、噪音、爆破音和用户无用的语音,留下人声,去除其他的杂声留下人声。
人声识别分为训练和预测两个部分。训练指的是生成预测模型,预测是利用模型产生预测结果。
训练的过程,分为以下三个部分:
(1.2.1) 基于梅尔倒频谱算法,提取声音特征,并将其转换成频谱图片;
(1.2.2) 将人声频谱作为正样本,动物声音和杂音等非人声作为负样本,交由神经网络模型训练;
(1.2.3) 基于训练产生的文件,生成端上可运行的预测模型。
人声识别训练的流程分为三个部分,提取声音特征,模型训练和生成端上模型。最后,是人声识别的部分:先提取声音特征,然后加载训练模型即可获得预测结果。识别出人声后去除人声以外的其他无用语音。
(1.3)声音信号的识别
对去除无关信号的纯净声音信号通过云端语音识别算法,将声音数据转换成文本数据;
(1.4)利用文本数据得到位置信号
通过文本数据与云端数据库中的POI数据库进行匹配,识别出包含现场POI信息的内容,并通过贝叶斯分析器转换成位置信号。
第二步 判断声音信号中位置信号数据的有效性
(2.1)将声音信号中的位置信号上传至云端服务器
将第一步中从声音信号中提取到的位置信号转换成定位指令并将定位指令送达至云端服务器;
(2.2)定位结果对比
云端服务器将声音信号中的定位指令与前一段时间内(具体时间为1分钟内)基础定位的结果进行对比,当声音定位的精准度高于基础定位结果的精准度时,判断为定位指令有效;当声音定位的精准度低于基础定位结果的精准度时,判断为定位指令无效。
定位结果有accuracy参数,用于衡量定位精度。声音定位使用贝叶斯分类器计算结果的精准度。基础定位结果使用空间信号与指纹地图的匹配误差判断的精准度。两个取值都是[0-1],直接比大小。
第三步 对基础定位结果进行修正和标记
(3.1)对基础定位的结果进行修正
利用有效的定位指令对基础定位的结果进行修正,定义有效的定位指令对应的坐标作为初始位置,重新启动室内定位算法进行修正;
(3.2)对基础定位结果进行标记
利用有效的定位指令对基础定位的结果进行标记。具体的标记方法为如果语音定位结果修正到2楼,并对这组空间信号打个2楼的标签。
第四步 利用深度学习算法对基础定位进行训练,修正基础定位
(4.1)数据回传至云端服务器
将修正数据信息回传至云端服务器,送入深度学习训练模块;
(4.2)通过深度学习训练模块对基础定位进行训练、修正
通过修正后的数据对空间信号打标签,进行深度训练后,修正定位算法模型。
如果没有声音信号,定位结果是错误的位置,有声音信号帮助训练算法模型后,定位结果就更加准确。
本发明的云端语音识别算法包括卷积神经网络CNN算法。深度学习算法为卷积神经网络CNN算法。设备终端包括:智能手机、平板电脑等智能信息采集设备,其他智能穿戴件也可以。采集模块包括麦克风。基础定位采用现有的定位方式包括:wifi定位、地磁定位、蓝牙定位、角向量定位、超声波定位、RFID定位和红外线定位。
本发明通过室内定位过程中大量的音频片段,作为云端通过深度学习算法的隐藏层,对空间信号做更好的线性划分,缩小定位范围,提升定位精度。这种做法的好处是,当环境改变,比如距离采集时间有一年了,wifi/beacon信号都换了,定位的时候空间信号就会变少,那么定位精度也会降低。如果有音频信号的话,我们就可以给这段已经变少的信号打个标签,这样之后再有人走到这里定位,就会变准。
在声音采集阶段通过麦克风采集声音。对于手机的录音过程,简单地讲,需要经过三个阶段,两个环节。三个环节是:“声音——模拟电信号——数字电信号”。两个环节是:“麦克风”和“ADC(analog digital converter/数字模拟转换器)”。麦克风负责把“声音”转化为“模拟电信号”,ADC负责把“模拟电信号”转化为“数字电信号”。所以说,麦克风和ADC的品质直接决定录音功能的品质。如果产品端没有ADC模块,需要在云端进行降噪处理。在低频(<80Hz)和高频段(>1.4Hz)做相应的降噪处理,只保留和人声频段。
在声音信号的筛选阶段需要筛选掉环境音、用户的无效语音。需要结合该室内场景的基本信息,如地址,楼层,店铺名称,店铺分布情况,生成搜索文本库。系统解决方案,使用搜索引擎Elasticsearch,对上述数据做倒排索引,实现快速的搜索。
对声音信息进行判断其有效性是因为采集到的声音信号并非一定准确,要结合之前一段时间的使用情况来做辅助判断。例如:如果这个人定位一直在3楼,而且在3楼的定位精确度(定位精确度是室内定位算法计算结果的基础参数)高达99%。但采集到的语音语义为我在2楼,这样我们认为这段语音表义不准确。再例如,如果一个人在3楼的置信度只有60%,或者在2楼和3楼来回切换,那我们会相信语音的表义。讲定位结果修正到2楼,并对这组空间信号打个2楼的标签。
以上实施方式仅用于说明本发明,而并非对本发明的限制,有关技术领域的普通技术人员,在不脱离本发明的精神和范围的情况下,还可以做出各种变化和变型,因此所有等同的技术方案也属于本发明的范畴,本发明的专利保护范围应由权利要求限定。
Claims (6)
1.一种结合语音识别的室内定位导航方法,其特征在于,采用将设备终端采集到的声音信号转换成位置信号,并同时对基础定位的结果进行修正和标记的方法,并运用深度学习算法辅助训练基础定位,修正异常定位区域,具体包括如下步骤:
第一步 从声音信号中提取位置信号
(1.1) 声音信号的采集
在设备终端增加声音采集模块,支持声音的录入,将声音信号采集为数字数据;
(1.2)声音信号的筛选
从采集到的声音信号中去除无关信号,去除环境音、噪音、爆破音和用户无用的语音,留下人声;
(1.3)声音信号的识别
对去除无关信号的纯净声音信号通过云端语音识别算法,将声音数据转换成文本数据;
(1.4)利用文本数据得到位置信号
通过文本数据与云端数据库中的POI数据库进行匹配,识别出包含现场POI信息的内容,并通过贝叶斯分析器转换成位置信号;
第二步 判断声音信号中位置信号数据的有效性
(2.1)将声音信号中的位置信号上传至云端服务器
将第一步中从声音信号中提取到的位置信号转换成定位指令并将定位指令送达至云端服务器;
(2.2)定位结果对比
云端服务器将声音信号中的定位指令与前一段时间内基础定位的结果进行对比,当声音定位的精准度高于基础定位结果的精准度时,判断为定位指令有效;当声音定位的精准度低于基础定位结果的精准度时,判断为定位指令无效;
第三步 对基础定位结果进行修正和标记
(3.1)对基础定位的结果进行修正
利用有效的定位指令对基础定位的结果进行修正,定义有效的定位指令对应的坐标作为初始位置,重新启动室内定位算法进行修正;
(3.2)对基础定位结果进行标记
利用有效的定位指令对基础定位的结果进行标记;
第四步 利用深度学习算法对基础定位进行训练,修正基础定位
(4.1)数据回传至深度学习训练模块
将修正数据信息回传至云端服务器,送入深度学习训练模块;
(4.2)通过深度学习训练模块对基础定位进行训练、修正
通过修正后的数据对空间信号打标签,进行深度训练后,修正定位算法模型。
2.如权利要求1所述的一种结合语音识别的室内定位导航方法,其特征在于:所述云端语音识别算法包括卷积神经网络CNN算法。
3.如权利要求1所述的一种结合语音识别的室内定位导航方法,其特征在于:所述深度学习算法为卷积神经网络CNN算法。
4.如权利要求1所述的一种结合语音识别的室内定位导航方法,其特征在于:所述设备终端包括:智能手机、平板电脑。
5.如权利要求1所述的一种结合语音识别的室内定位导航方法,其特征在于:所述采集模块包括麦克风。
6.如权利要求1所述的一种结合语音识别的室内定位导航方法,其特征在于:所述基础定位包括:wifi定位、地磁定位、蓝牙定位、角向量定位、超声波定位、RFID定位、红外线定位。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010764992.0A CN111895991B (zh) | 2020-08-03 | 2020-08-03 | 一种结合语音识别的室内定位导航方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010764992.0A CN111895991B (zh) | 2020-08-03 | 2020-08-03 | 一种结合语音识别的室内定位导航方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111895991A CN111895991A (zh) | 2020-11-06 |
CN111895991B true CN111895991B (zh) | 2022-03-29 |
Family
ID=73183918
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010764992.0A Active CN111895991B (zh) | 2020-08-03 | 2020-08-03 | 一种结合语音识别的室内定位导航方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111895991B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112863493A (zh) * | 2021-01-14 | 2021-05-28 | 北京天行汇通信息技术有限公司 | 语音数据标注方法和装置,电子设备 |
CN113608449B (zh) * | 2021-08-18 | 2023-09-15 | 四川启睿克科技有限公司 | 一种智慧家庭场景下语音设备定位系统及自动定位方法 |
CN117357880B (zh) * | 2023-12-07 | 2024-02-09 | 深圳失重魔方网络科技有限公司 | 一种基于智能设备的运动状态识别方法及系统 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9270807B2 (en) * | 2011-02-23 | 2016-02-23 | Digimarc Corporation | Audio localization using audio signal encoding and recognition |
CN107094319B (zh) * | 2016-02-17 | 2021-06-04 | 王庆文 | 一种高精度室内外融合定位系统和方法 |
CN107566980B (zh) * | 2017-10-27 | 2020-10-23 | 深圳市鹏京科技有限公司 | 一种移动终端的定位方法和移动终端 |
CN109001679B (zh) * | 2018-06-14 | 2020-05-12 | 河北工业大学 | 一种基于卷积神经网络的室内声源区域定位方法 |
CN110767226B (zh) * | 2019-10-30 | 2022-08-16 | 山西见声科技有限公司 | 具有高准确度的声源定位方法、装置、语音识别方法、系统、存储设备及终端 |
-
2020
- 2020-08-03 CN CN202010764992.0A patent/CN111895991B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN111895991A (zh) | 2020-11-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111895991B (zh) | 一种结合语音识别的室内定位导航方法 | |
CN110599557B (zh) | 图像描述生成方法、模型训练方法、设备和存储介质 | |
CN110364144B (zh) | 一种语音识别模型训练方法及装置 | |
CN107240395B (zh) | 一种声学模型训练方法和装置、计算机设备、存储介质 | |
CN111933110A (zh) | 视频生成方法、生成模型训练方法、装置、介质及设备 | |
US20110190008A1 (en) | Systems, methods, and apparatuses for providing context-based navigation services | |
CN111798834B (zh) | 多音字的识别方法、装置、可读介质和电子设备 | |
US20140324745A1 (en) | Method, an apparatus and a computer software for context recognition | |
CN110853617B (zh) | 一种模型训练的方法、语种识别的方法、装置及设备 | |
CN110972112B (zh) | 地铁运行方向的确定方法、装置、终端及存储介质 | |
CN111862944B (zh) | 语音识别装置、方法、电子设备和计算机可读存储介质 | |
KR20150126214A (ko) | 음성 인식 장치 및 방법, 잡음-음성 인식 모델 생성 장치 및 방법 | |
KR20210044475A (ko) | 대명사가 가리키는 객체 판단 방법 및 장치 | |
CN114353819A (zh) | 车辆的导航方法、装置、设备、存储介质及程序产品 | |
CN114255740A (zh) | 语音识别方法、装置、计算机设备和存储介质 | |
CN108922520A (zh) | 语音识别方法、装置、存储介质及电子设备 | |
CN113793620B (zh) | 基于场景分类的语音降噪方法、装置、设备及存储介质 | |
US20210327407A1 (en) | Speech synthesizer using artificial intelligence, method of operating speech synthesizer and computer-readable recording medium | |
CN110875053A (zh) | 语音处理的方法、装置、系统、设备和介质 | |
CN109064720B (zh) | 位置提示方法、装置、存储介质及电子设备 | |
CN115147248B (zh) | 一种基于大数据的旅游信息咨询系统和方法 | |
WO2003102816A1 (fr) | Systeme fournisseur de donnees | |
CN111755015B (zh) | 一种用户画像构建方法及装置 | |
CN114510473A (zh) | 医疗问卷的验证方法、装置、计算机设备及存储介质 | |
KR102642617B1 (ko) | 인공 지능을 이용한 음성 합성 장치, 음성 합성 장치의 동작 방법 및 컴퓨터로 판독 가능한 기록 매체 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |