CN113792726A

CN113792726A - 一种基于视觉图像快速生成poi的方法及系统

Info

Publication number: CN113792726A
Application number: CN202111351120.2A
Authority: CN
Inventors: 任轶; 徐长江; 刘明; 潘袁园; 方子杰; 范前达
Original assignee: Beijing Changlong Iflytek Technology Co ltd
Current assignee: Anhui Yucheng Data Technology Co ltd
Priority date: 2021-11-16
Filing date: 2021-11-16
Publication date: 2021-12-14
Anticipated expiration: 2041-11-16
Also published as: CN113792726B

Abstract

本发明公开了一种基于视觉图像快速生成POI的方法及系统，所述方法包括：通过基于所述图像摄取装置，生成第一目标位置图像；根据自然场景文字识别技术，生成第一目标位置的初识化文字信息；根据语义结构分析数据库，生成第一目标位置的文字结构信息；对初识化文字信息和文字结构信息进行数据特征融合，生成第一目标位置的主名称信息；基于所述目标定位装置，获取第一目标位置的第一位置信息；根据所述声音传感装置，生成第一声音强度信息；将主名称信息、第一位置信息以及第一声音强度信息输入POI自动生成模型进行训练，生成第一POI信息。解决了现有技术中存在无法基于视觉图像信息智能化形成对应POI兴趣点的技术问题。

Description

一种基于视觉图像快速生成POI的方法及系统

技术领域

本申请涉及计算机技术领域，尤其涉及一种基于视觉图像快速生成POI的方法及系统。

背景技术

本世纪初爆发的互联网革命本质上是信息化革命，即大量信息被产生、传播和分析，然而在本次信息革命中，空间属性信息的信息化革命程度远远低于其他信息数据。究其原因在于空间属性信息依然需要采用传统测绘的方式采集，举例如桥在哪里、路有多宽等信息，且测绘行业属于劳动密集型产业。因此，极度依赖人力的空间信息，其生产速度已经远远落后于信息化产业的需求。利用计算机应用技术，智能化对图像信息进行识别判断，从而确定合理的目标位置名称，进一步结合目标位置的位置信息和声音信息，生成对应位置的POI兴趣点，对降低空间属性信息的人力采集成本、提高空间属性信息化发展具有重要的现实意义。

本申请发明人在实现本申请实施例中技术方案的过程中，发现上述技术至少存在如下技术问题：

现有技术中存在无法基于视觉图像信息智能化形成对应POI兴趣点的技术问题。

发明内容

本申请的目的是提供一种基于视觉图像快速生成POI的方法及系统，用以解决现有技术中存在无法基于视觉图像信息智能化形成对应POI兴趣点的技术问题。

鉴于上述问题，本申请实施例提供了一种基于视觉图像快速生成POI的方法及系统。

第一方面，本申请提供了一种基于视觉图像快速生成POI的方法，所述方法通过一种基于视觉图像快速生成POI的系统实现，其中，所述方法包括：通过基于图像摄取装置，对第一区域的第一目标位置进行图像采集，生成第一目标位置图像；根据自然场景文字识别技术，对所述第一目标位置图像进行文字识别，生成所述第一目标位置的初识化文字信息；根据语义结构分析数据库，对所述初识化文字信息进行语义结构分析，生成所述第一目标位置的文字结构信息；对所述初识化文字信息和所述文字结构信息进行数据特征融合，生成所述第一目标位置的主名称信息；基于目标定位装置，获取所述第一目标位置的第一位置信息；根据声音传感装置，对所述第一区域的预定距离范围内的声音强度进行信息采集，生成第一声音强度信息；将所述主名称信息、所述第一位置信息以及所述第一声音强度信息输入POI自动生成模型进行训练，生成所述第一目标位置的第一POI信息。

另一方面，本申请还提供了一种基于视觉图像快速生成POI的系统，用于执行如第一方面所述的一种基于视觉图像快速生成POI的方法，其中，所述系统包括：第一生成单元：所述第一生成单元用于基于所述图像摄取装置，对第一区域的第一目标位置进行图像采集，生成第一目标位置图像；第二生成单元：所述第二生成单元用于根据自然场景文字识别技术，对所述第一目标位置图像进行文字识别，生成所述第一目标位置的初识化文字信息；第三生成单元：所述第三生成单元用于根据语义结构分析数据库，对所述初识化文字信息进行语义结构分析，生成所述第一目标位置的文字结构信息；第四生成单元：所述第四生成单元用于对所述初识化文字信息和所述文字结构信息进行数据特征融合，生成所述第一目标位置的主名称信息；第一获得单元：所述第一获得单元用于基于所述目标定位装置，获取所述第一目标位置的第一位置信息；第五生成单元：所述第五生成单元用于根据所述声音传感装置，对所述第一区域的预定距离范围内的声音强度进行信息采集，生成第一声音强度信息；第六生成单元：所述第六生成单元用于将所述主名称信息、所述第一位置信息以及所述第一声音强度信息输入POI自动生成模型进行训练，生成所述第一目标位置的第一POI信息。

第三方面，本申请实施例还提供了一种基于视觉图像快速生成POI的系统，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其中，所述处理器执行所述程序时实现上述第一方面所述方法的步骤。

本申请实施例中提供的一个或多个技术方案，至少具有如下技术效果或优点：

1.通过基于所述图像摄取装置，对第一区域的第一目标位置进行图像采集，生成第一目标位置图像；根据自然场景文字识别技术，对所述第一目标位置图像进行文字识别，生成所述第一目标位置的初识化文字信息；根据语义结构分析数据库，对所述初识化文字信息进行语义结构分析，生成所述第一目标位置的文字结构信息；对所述初识化文字信息和所述文字结构信息进行数据特征融合，生成所述第一目标位置的主名称信息；基于所述目标定位装置，获取所述第一目标位置的第一位置信息；根据所述声音传感装置，对所述第一区域的预定距离范围内的声音强度进行信息采集，生成第一声音强度信息；将所述主名称信息、所述第一位置信息以及所述第一声音强度信息输入POI自动生成模型进行训练，生成所述第一目标位置的第一POI信息。达到了基于目标位置的视觉图像，自动识别图像中的文字信息，进一步结合文字语义结构分析，确定目标位置对应的主名称，最终综合目标位置信息、目标声音信息智能化得到对应的POI兴趣点，通过基于视觉图像信息，智能化生成对应POI兴趣点，从而提高了POI兴趣点的生成速度，进一步推动了空间属性信息化的发展，最终达到促进万物互联的技术效果。

2.通过对所述POI自动生成模型进行数据训练，使得所述POI自动生成模型处理输入数据更加准确，通过较强的分析计算，使得输出的所述第一POI信息也更加准确，达到了准确获得数据信息，高效数据分析后，达到POI兴趣点的智能化生成准确而高效的技术效果。

3.通过所述历史POI管理数据库，实现了智能化对各POI信息匹配合适类别的目标，进而经过系统类别标记，并将标记结果渲染到目标POI信息中，达到了智能化对各POI兴趣点进行分类，方便用户快速查找、使用的技术效果。

上述说明仅是本申请技术方案的概述，为了能够更清楚了解本申请的技术手段，而可依照说明书的内容予以实施，并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂，以下特举本申请的具体实施方式。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是示例性的，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1为本申请实施例一种基于视觉图像快速生成POI的方法的流程示意图；

图2为本申请实施例一种基于视觉图像快速生成POI的方法中生成所述初识化文字信息的流程示意图；

图3为本申请实施例一种基于视觉图像快速生成POI的方法中获得所述POI自动生成模型的输出信息的流程示意图；

图4为本申请实施例一种基于视觉图像快速生成POI的方法中对所述第一类别信息进行类别标记，并将标记类别渲染到所述第一POI信息的流程示意图；

图5为本申请实施例一种基于视觉图像快速生成POI的系统的结构示意图；

图6为本申请实施例示例性电子设备的结构示意图。

附图标记说明：

第一生成单元11，第二生成单元12，第三生成单元13，第四生成单元14，第一获得单元15，第五生成单元16，第六生成单元17，总线300，接收器301，处理器302，发送器303，存储器304，总线接口305。

具体实施方式

本申请实施例通过提供一种基于视觉图像快速生成POI的方法及系统，解决了现有技术中存在无法基于视觉图像信息智能化形成对应POI兴趣点的技术问题。达到了基于目标位置的视觉图像，自动识别图像中的文字信息，进一步结合文字语义结构分析，确定目标位置对应的主名称，最终综合目标位置信息、目标声音信息智能化得到对应的POI兴趣点，通过基于视觉图像信息，智能化生成对应POI兴趣点，从而提高了POI兴趣点的生成速度，进一步推动了空间属性信息化的发展，最终达到促进万物互联的技术效果。

下面，将参考附图对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅是本申请的一部分实施例，而不是本申请的全部实施例，应理解，本申请不受这里描述的示例实施例的限制。基于本申请的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。另外还需要说明的是，为了便于描述，附图中仅示出了与本申请相关的部分而非全部。

申请概述

针对上述技术问题，本申请提供的技术方案总体思路如下：

本申请提供了一种基于视觉图像快速生成POI的方法，所述方法应用于一种基于视觉图像快速生成POI的系统，其中，所述方法包括：通过基于所述图像摄取装置，对第一区域的第一目标位置进行图像采集，生成第一目标位置图像；根据自然场景文字识别技术，对所述第一目标位置图像进行文字识别，生成所述第一目标位置的初识化文字信息；根据语义结构分析数据库，对所述初识化文字信息进行语义结构分析，生成所述第一目标位置的文字结构信息；对所述初识化文字信息和所述文字结构信息进行数据特征融合，生成所述第一目标位置的主名称信息；基于所述目标定位装置，获取所述第一目标位置的第一位置信息；根据所述声音传感装置，对所述第一区域的预定距离范围内的声音强度进行信息采集，生成第一声音强度信息；将所述主名称信息、所述第一位置信息以及所述第一声音强度信息输入POI自动生成模型进行训练，生成所述第一目标位置的第一POI信息。

在介绍了本申请基本原理后，下面将结合说明书附图来具体介绍本申请的各种非限制性的实施方式。

实施例一

请参阅附图1，本申请实施例提供了一种基于视觉图像快速生成POI的方法，其中，所述方法应用于一种基于视觉图像快速生成POI的系统，所述方法具体包括如下步骤：

步骤S100：基于所述图像摄取装置，对第一区域的第一目标位置进行图像采集，生成第一目标位置图像；

具体而言，所述一种基于视觉图像快速生成POI的方法应用于所述一种基于视觉图像快速生成POI的系统，即POI生成系统，可以基于目标位置的视觉图像，自动识别图像中的文字信息，进一步结合文字语义结构分析，确定目标位置对应的主名称，最终综合目标位置信息、目标声音信息智能化得到对应的POI兴趣点，通过基于视觉图像信息，智能化生成对应POI兴趣点，从而提高了POI兴趣点的生成速度，进一步推动了空间属性信息化的发展，最终达到促进万物互联的技术效果。其中，所述POI全称为Point of Interest，意为兴趣点。所述图像摄取装置是指可以自动或手动对目标位置进行不同角度、不同距离图像采集的智能设备，包括高清摄像头、智能相机等。所述第一区域是指任一利用POI生成系统进行POI兴趣点智能生成的区域。所述第一目标位置是指所述第一区域范围内任一待生成POI兴趣点的目标所在位置。

通过所述图像摄取装置对第一目标位置进行图像信息采集，且自动实时将采集到的目标位置图像信息传输给POI生成系统，即所述POI生成系统自动实时得到所述第一目标位置图像，达到了智能化获取目标位置相关图像信息，为后续智能分析和POI兴趣点的生成提供图像基础的技术效果。

步骤S200：根据自然场景文字识别技术，对所述第一目标位置图像进行文字识别，生成所述第一目标位置的初识化文字信息；

具体而言，所述文字识别技术简单来说就是从一张图片中，找到里面的文本，并给出正确的字符，举例如OCR光学字符识别，主要面向高质量的文档图像。与文档图像中文字识别不同的是，所述自然场景文字识别技术是面向图像背景复杂、分辨率低、字体多样、分布随意等情况下的图像文字识别，包括自然场景图像中的文字检测和文字识别，举例如街边门店的门牌文字识别等。通过利用自然场景文字识别技术，对待识别位置图像中的文字进行智能识别判断，从而生成该位置对应的图像文字识别结果，即为所述第一目标位置的初识化文字信息。举例如POI生成系统自动识别到某目标位置图像信息中包括“李记、石味先、石锅菜、手工水饺、凉菜”等文字内容。通过智能化识别目标位置图像中所有文字信息，进一步达到了为后续POI兴趣点名称的生成提供对应文字基础的技术效果。

步骤S300：根据语义结构分析数据库，对所述初识化文字信息进行语义结构分析，生成所述第一目标位置的文字结构信息；

具体而言，所述语义结包含成分和成分结构两方面，包括施事、受事、谓词等成分，与句法结构是两种独立结构。所述语义结构分析数据库中收集有所有语义结构信息，利用所述语义结构分析数据库，可以对自然场景文字识别后得到的所述初识化文字信息自动进行属性判定，进一步语义结构分析生成所述第一目标位置的文字结构信息。达到了为后续判断目标位置文字的属性提供相关判定技术指导的的技术效果。

步骤S400：对所述初识化文字信息和所述文字结构信息进行数据特征融合，生成所述第一目标位置的主名称信息；

具体而言，对所述初识化文字信息和所述文字结构信息进行数据特征融合，即排除掉所述初识化文字信息中与POI明显无关的文本信息，仅保留与POI兴趣点名称有关的文字信息，进而计算保留下来的文字信息之间的关系，最终进行结构化的输出，即生成所述第一目标位置的主名称信息。举例如某目标位置图像信息中包括“李记、石味先、石锅菜、手工水饺、凉菜”等文字内容，经过POI生成系统对各文字信息进行属性判断后，去掉了与POI兴趣点名称无关的“石锅菜、手工水饺、凉菜”文字，进而对保留的“李记、石味先”文字进行结构化输出，即得到“李记石味先”文字信息，将其作为目标位置POI兴趣点的主名称。达到了智能化获取目标位置POI兴趣点名称，同时提高POI生成系统自动生成兴趣点名称的准确性的技术效果。

步骤S500：基于所述目标定位装置，获取所述第一目标位置的第一位置信息；

步骤S600：根据所述声音传感装置，对所述第一区域的预定距离范围内的声音强度进行信息采集，生成第一声音强度信息；

具体而言，基于与所述POI生成系统通信连接的所述目标定位装置，智能化获取所述第一目标位置对应的位置信息，即所述第一位置信息，进一步实时传输第一位置信息给所述POI生成系统。同样的，基于与所述POI生成系统通信连接的所述声音传感装置，智能化对所述第一区域的预定距离范围内的声音强度进行信息采集，从而生成第一目标位置对应的声音强度信息，即所述第一声音强度信息。其中，所述预定距离是指POI生成系统基于目标位置实际区域面积等信息综合分析后，预先设置的距离值。通过所述目标定位装置和所述声音传感装置，达到了快速、准确地获取所述第一目标位置对应的位置信息和声音强度信息的技术效果。

步骤S700：将所述主名称信息、所述第一位置信息以及所述第一声音强度信息输入POI自动生成模型进行训练，生成所述第一目标位置的第一POI信息。

具体而言，所述POI自动生成模型为神经网络模型，具有神经网络模型的特性。通过将所述第一目标位置的主名称信息、第一位置信息以及第一声音强度信息输入POI自动生成模型，所述POI自动生成模型不断地自我的修正，当所述POI自动生成模型的输出信息达到预定的准确率/收敛状态时，则监督学习过程结束。通过对所述POI自动生成模型进行数据训练，使得所述POI自动生成模型处理输入数据更加准确。经过POI自动生成模型训练后，自动生成所述第一目标位置的所述第一POI信息。通过基于目标位置信息、目标声音信息智能化得到对应的POI兴趣点，从而提高了POI兴趣点的生成速度，进一步推动了空间属性信息化的发展，最终达到促进万物互联的技术效果。

进一步的，如附图2所示，本申请实施例步骤S200还包括：

步骤S210：将所述第一目标位置图像输入单字符识别模型进行训练，获得单字符文字信息；

步骤S220：基于语义生成模型，对所述单字符文字信息进行遍历的拆分重构，生成所述单字符文字信息的语义重构集合；

步骤S230：将所述第一目标位置图像输入文本序列识别模型进行训练，获得文本序列文字信息；

步骤S240：对所述文本序列文字信息进行文本纠错，获得文本文字信息；

步骤S250：对所述语义重构集合和所述文本文字信息进行数据拟合处理，生成所述初识化文字信息。

具体而言，将图像摄取装置采集到的所述第一目标位置图像输入单字符识别模型中进行训练，从而智能化获得第一目标位置图像中所有单字符文字信息。其中，所述字符是指类字形单位或符号，包括字母、数字、运算符号、标点符号和其他符号，以及一些功能性符号，是电子计算机或无线电通信中字母、数字、符号的统称。所述单字符识别模型是一个可以智能识别所有字符的网络模型。

进一步的，利用所述语义生成模型，按照一定的搜索线路对所述单字符文字信息中的所有字符进行拆离分组和重新组构，从而生成所述单字符文字信息的语义重构集合。其中，所述语义生成模型可以智能化对字符信息进行拆分和重构，从而生成人类理解的语义信息。此外，将所述第一目标位置图像输入文本序列识别模型进行训练，从而获得文本序列文字信息。其中，所述文本序列文字信息是指将所述第一目标位置图像中的所有文字信息按顺序排列。举例如attention layer的LSTM技术可对不同的字体、不同方向、甚至不同语言进行有效识别。人工对所述文本序列文字信息进行判断，对于错误的文本进行人工修改，从而得到所述第一目标位置图像中正确的文字信息，即为所述文本文字信息。最后，将所述语义重构集合和所述文本文字信息进行数据拟合处理，生成所述初识化文字信息。

通过智能化识别目标位置图像中字符，进而对所有字符进行语义重构，经过人工判断后得到正确的文本文字信息，达到了为后续POI兴趣点名称的生成提供对应文字基础的技术效果。

进一步的，本申请实施例步骤S250还包括：

步骤S251：对所述语义重构集合进行数据分布式处理，获得分布式语义集合；

步骤S252：对所述文本文字信息进行数据分布式处理，获得分布式文本集合；

步骤S253：获得所述分布式文本集合中的第一分布式文本信息的第一文本架构信息；

步骤S254：基于所述第一文本架构信息，对所述分布式语义集合进行筛选，获得匹配文本语义信息；

步骤S255：基于所述第一文本架构信息和所述匹配文本语义信息，构建第一映射关系；

步骤S256：根据所述分布式语义集合、所述分布式文本集合以及所述第一映射关系，构建所述第一目标位置的POI文本离散分布空间。

具体而言，通过对所述语义重构集合和所述文本文字信息进行数据分布式处理，分别得到对应的分布式语义集合和分布式文本集合。其中，所述分布式处理是指将待处理信息分解成许多小的部分，各小部分分别同时处理，从而起到节约整体处理时间，提高处理效率的效果。所述第一文本架构信息是指所述分布式文本集合中的任一分布式文本信息对应的文本架构。基于所述第一文本架构信息，对所述分布式语义集合进行筛选，从而得到与所述第一文本架构信息相匹配的文本语义。进而基于第一文本架构信息和匹配文本语义信息，构建文本架构和文本语义间的映射关系，即所述第一映射关系。最后根据所述分布式语义集合、所述分布式文本集合以及所述第一映射关系，构建所述第一目标位置的POI文本离散分布空间。达到了提高目标位置图像中文字识别效率和准确率，从而提高POI兴趣点生成速度的技术效果。

进一步的，本申请实施例步骤S256还包括：

步骤S2561：将所述语义重构集合中的数据定义为P个样本点，所述文本文字信息中的数据定义为Q个样本点；

步骤S2562：基于所述POI文本离散分布空间，对所述P个样本点和所述Q个样本点进行两两距离运算，获得样本点距离集合；

步骤S2563：根据所述样本点距离集合，获得目标距离集合，所述目标距离集合为所述样本点距离集合中的最小距离集合；

步骤S2564：根据所述目标距离集合，获得所述P个样本点和所述Q个样本点中的语义重构-文本文字映射集合；

步骤S2565：基于所述语义重构-文本文字映射集合，对所述语义重构集合和所述文本文字信息进行数据拟合处理。

具体而言，首先将所述语义重构集合中的所有数据均匀拆分，并定义为P个样本点，同样的，将所述文本文字信息中的数据均匀拆分，并定义为Q个样本点。基于所述POI文本离散分布空间，对所述P个样本点和所述Q个样本点两两进行距离运算，所有样本点之间的距离组成所述样本点距离集合。进而基于所述样本点距离集合，获得目标距离集合。其中，所述目标距离集合为所述样本点距离集合中的最小距离集合。根据所述目标距离集合，获得样本点距离最小的样本点P和样本点Q之间的的语义重构-文本文字映射信息，从而得到所述语义重构-文本文字映射集合。最后基于所述语义重构-文本文字映射集合，对所述语义重构集合和所述文本文字信息进行数据拟合处理。达到了提高数据拟合准确率，从而提高图像文字识别效果的技术效果。

进一步的，如附图3所示，本申请实施例步骤S700还包括：

步骤S710：将所述主名称信息、所述第一位置信息以及所述第一声音强度信息作为输入信息，输入POI自动生成模型进行训练；

步骤S720：所述POI自动生成模型通过多组训练数据训练所得，所述多组训练数据中的每一组训练数据均包括：所述主名称信息、所述第一位置信息、所述第一声音强度信息以及用来标识第一POI信息的标识信息；

步骤S730：获得所述POI自动生成模型的输出信息，所述输出信息包括所述第一目标位置的第一POI信息。

具体而言，所述POI自动生成模型为神经网络模型，具有神经网络模型的特性。神经网络由大量的节点（或称神经元）之间相互连接构成，每个节点代表一种特定的输出函数称为激励函数，每两个节点之间的连接都代表一个对于通过该连接信号的加权值，称之为权重，基于神经网络模型建立的所述POI自动生成模型能够输出准确的所述第一目标位置的第一POI信息。此外能根据训练数据进行不断的自我训练学习，所述多组训练数据中每组数据均包括所述主名称信息、所述第一位置信息、所述第一声音强度信息以及用来标识第一POI信息的标识信息，所述POI自动生成模型不断地自我的修正，当所述POI自动生成模型的输出信息达到预定的准确率/收敛状态时，则监督学习过程结束。

通过对所述POI自动生成模型进行数据训练，使得所述POI自动生成模型处理输入数据更加准确，通过较强的分析计算，使得输出的所述第一POI信息也更加准确，达到了准确获得数据信息，高效数据分析后，达到POI兴趣点的智能化生成准确而高效的技术效果。

进一步的，如附图4所示，本申请实施例还包括步骤S800：

步骤S810：构建历史POI管理数据库；

步骤S820：对所述历史POI管理数据库进行类别整理，获得POI管理类别集合；

步骤S830：将所述第一POI信息输入所述POI管理类别集合，获得所述第一POI信息的第一类别信息；

步骤S840：对所述第一类别信息进行类别标记，并将标记类别渲染到所述第一POI信息。

具体而言，所述历史POI管理数据库是指基于现有POI兴趣点相关数据信息构建而成的数据库。通过对所述历史POI管理数据库中的所有POI兴趣点进行分类整理，从而得到现有所有POI兴趣点的类别信息，进一步得到所述POI管理类别集合。举例如服饰、美食、住宿、出行等类别。通过将所述第一POI信息输入所述POI管理类别集合中遍历匹配，可以智能化得到所述第一POI信息对应的类别，即所述第一类别信息。对所述第一类别信息进行类别标记，进一步将标记类别信息渲染到所述第一POI信息中。举例如匹配得到某POI信息为出行类别后，系统自动对该POI兴趣点进行出行类的对应标记，并将标记结果整合到对应的信息中。

通过所述历史POI管理数据库，实现了智能化对各POI信息匹配合适类别的目标，进而经过系统类别标记，并将标记结果渲染到目标POI信息中，达到了智能化对各POI兴趣点进行分类，方便用户快速查找、使用的技术效果。

进一步的，本申请实施例步骤S830还包括：

步骤S831：根据所述第一POI信息，构建POI分布特征卷积核；

步骤S832：根据所述POI管理类别集合，构建POI管理分布卷积矩阵；

步骤S833：对所述POI分布特征卷积核和所述POI管理分布卷积矩阵进行卷积运算，获得POI分布特征图；

步骤S834：对所述POI分布特征图进行类别特征匹配，获得所述第一POI信息的第一类别信息。

具体而言，首先基于所述第一POI信息构建POI分布特征卷积核，同时，基于所述POI管理类别集合构建POI管理分布卷积矩阵。然后对所述POI分布特征卷积核和所述POI管理分布卷积矩阵进行卷积运算，得到对应的POI分布特征图。最后对所述POI分布特征图进行类别特征匹配后，得到所述第一POI信息的类别，即所述第一类别信息。达到了智能化对POI信息进行分类，提高POI兴趣点生成速度的技术效果。

综上所述，本申请实施例所提供的一种基于视觉图像快速生成POI的方法具有如下技术效果：

实施例二

基于与前述实施例中一种基于视觉图像快速生成POI的方法，同样发明构思，本发明还提供了一种基于视觉图像快速生成POI的系统，请参阅附图5，所述系统包括：

第一生成单元11，所述第一生成单元11用于基于图像摄取装置，对第一区域的第一目标位置进行图像采集，生成第一目标位置图像；

第二生成单元12，所述第二生成单元12用于根据自然场景文字识别技术，对所述第一目标位置图像进行文字识别，生成所述第一目标位置的初识化文字信息；

第三生成单元13，所述第三生成单元13用于根据语义结构分析数据库，对所述初识化文字信息进行语义结构分析，生成所述第一目标位置的文字结构信息；

第四生成单元14，所述第四生成单元14用于对所述初识化文字信息和所述文字结构信息进行数据特征融合，生成所述第一目标位置的主名称信息；

第一获得单元15，所述第一获得单元15用于基于目标定位装置，获取所述第一目标位置的第一位置信息；

第五生成单元16，所述第五生成单元16用于根据声音传感装置，对所述第一区域的预定距离范围内的声音强度进行信息采集，生成第一声音强度信息；

第六生成单元17，所述第六生成单元17用于将所述主名称信息、所述第一位置信息以及所述第一声音强度信息输入POI自动生成模型进行训练，生成所述第一目标位置的第一POI信息。

进一步的，所述系统还包括：

第二获得单元，所述第二获得单元用于将所述第一目标位置图像输入单字符识别模型进行训练，获得单字符文字信息；

第七生成单元，所述第七生成单元用于基于语义生成模型，对所述单字符文字信息进行遍历的拆分重构，生成所述单字符文字信息的语义重构集合；

第三获得单元，所述第三获得单元用于将所述第一目标位置图像输入文本序列识别模型进行训练，获得文本序列文字信息；

第四获得单元，所述第四获得单元用于对所述文本序列文字信息进行文本纠错，获得文本文字信息；

第八生成单元，所述第八生成单元用于对所述语义重构集合和所述文本文字信息进行数据拟合处理，生成所述初识化文字信息。

进一步的，所述系统还包括：

第五获得单元，所述第五获得单元用于对所述语义重构集合进行数据分布式处理，获得分布式语义集合；

第六获得单元，所述第六获得单元用于对所述文本文字信息进行数据分布式处理，获得分布式文本集合；

第七获得单元，所述第七获得单元用于获得所述分布式文本集合中的第一分布式文本信息的第一文本架构信息；

第八获得单元，所述第八获得单元用于基于所述第一文本架构信息，对所述分布式语义集合进行筛选，获得匹配文本语义信息；

第一构建单元，所述第一构建单元用于基于所述第一文本架构信息和所述匹配文本语义信息，构建第一映射关系；

第二构建单元，所述第二构建单元用于根据所述分布式语义集合、所述分布式文本集合以及所述第一映射关系，构建所述第一目标位置的POI文本离散分布空间。

进一步的，所述系统还包括：

第一设置单元，所述第一设置单元用于将所述语义重构集合中的数据定义为P个样本点，所述文本文字信息中的数据定义为Q个样本点；

第九获得单元，所述第九获得单元用于基于所述POI文本离散分布空间，对所述P个样本点和所述Q个样本点进行两两距离运算，获得样本点距离集合；

第十获得单元，所述第十获得单元用于根据所述样本点距离集合，获得目标距离集合，所述目标距离集合为所述样本点距离集合中的最小距离集合；

第十一获得单元，所述第十一获得单元用于根据所述目标距离集合，获得所述P个样本点和所述Q个样本点中的语义重构-文本文字映射集合；

第一执行单元，所述第一执行单元用于基于所述语义重构-文本文字映射集合，对所述语义重构集合和所述文本文字信息进行数据拟合处理。

进一步的，所述系统还包括：

第一输入单元，所述第一输入单元用于将所述主名称信息、所述第一位置信息以及所述第一声音强度信息作为输入信息，输入POI自动生成模型进行训练；

第十二获得单元，所述第十二获得单元用于所述POI自动生成模型通过多组训练数据训练所得，所述多组训练数据中的每一组训练数据均包括：所述主名称信息、所述第一位置信息、所述第一声音强度信息以及用来标识第一POI信息的标识信息；

第十三获得单元，所述第十三获得单元用于获得所述POI自动生成模型的输出信息，所述输出信息包括所述第一目标位置的第一POI信息。

进一步的，所述系统还包括：

第三构建单元，所述第三构建单元用于构建历史POI管理数据库；

第十四获得单元，所述第十四获得单元用于对所述历史POI管理数据库进行类别整理，获得POI管理类别集合；

第十五获得单元，所述第十五获得单元用于将所述第一POI信息输入所述POI管理类别集合，获得所述第一POI信息的第一类别信息；

第二执行单元，所述第二执行单元用于对所述第一类别信息进行类别标记，并将标记类别渲染到所述第一POI信息。

进一步的，所述系统还包括：

第四构建单元，所述第四构建单元用于根据所述第一POI信息，构建POI分布特征卷积核；

第五构建单元，所述第五构建单元用于根据所述POI管理类别集合，构建POI管理分布卷积矩阵；

第十六获得单元，所述第十六获得单元用于对所述POI分布特征卷积核和所述POI管理分布卷积矩阵进行卷积运算，获得POI分布特征图；

第十七获得单元，所述第十七获得单元用于对所述POI分布特征图进行类别特征匹配，获得所述第一POI信息的第一类别信息。

本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，前述图1实施例一中的一种基于视觉图像快速生成POI的方法和具体实例同样适用于本实施例的一种基于视觉图像快速生成POI的系统，通过前述对一种基于视觉图像快速生成POI的方法的详细描述，本领域技术人员可以清楚的知道本实施例中一种基于视觉图像快速生成POI的系统，所以为了说明书的简洁，在此不再详述。对于实施例公开的装置而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。

对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下，在其它实施例中实现。因此，本申请将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

示例性电子设备

下面参考图6来描述本申请实施例的电子设备。

图6图示了根据本申请实施例的电子设备的结构示意图。

基于与前述实施例中一种基于视觉图像快速生成POI的方法的发明构思，本发明还提供一种基于视觉图像快速生成POI的系统，其上存储有计算机程序，该程序被处理器执行时实现前文所述一种基于视觉图像快速生成POI的方法的任一方法的步骤。

其中，在图6中，总线架构（用总线300来代表），总线300可以包括任意数量的互联的总线和桥，总线300将包括由处理器302代表的一个或多个处理器和存储器304代表的存储器的各种电路链接在一起。总线300还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路链接在一起，这些都是本领域所公知的，因此，本文不再对其进行进一步描述。总线接口305在总线300和接收器301和发送器303之间提供接口。接收器301和发送器303可以是同一个元件，即收发机，提供用于在传输介质上与各种其他装置通信的单元。

处理器302负责管理总线300和通常的处理，而存储器304可以被用于存储处理器302在执行操作时所使用的数据。

本申请提供了一种基于视觉图像快速生成POI的方法，所述方法应用于一种基于视觉图像快速生成POI的系统，其中，所述方法包括：通过基于所述图像摄取装置，对第一区域的第一目标位置进行图像采集，生成第一目标位置图像；根据自然场景文字识别技术，对所述第一目标位置图像进行文字识别，生成所述第一目标位置的初识化文字信息；根据语义结构分析数据库，对所述初识化文字信息进行语义结构分析，生成所述第一目标位置的文字结构信息；对所述初识化文字信息和所述文字结构信息进行数据特征融合，生成所述第一目标位置的主名称信息；基于所述目标定位装置，获取所述第一目标位置的第一位置信息；根据所述声音传感装置，对所述第一区域的预定距离范围内的声音强度进行信息采集，生成第一声音强度信息；将所述主名称信息、所述第一位置信息以及所述第一声音强度信息输入POI自动生成模型进行训练，生成所述第一目标位置的第一POI信息。解决了现有技术中存在无法基于视觉图像信息智能化形成对应POI兴趣点的技术问题。达到了基于目标位置的视觉图像，自动识别图像中的文字信息，进一步结合文字语义结构分析，确定目标位置对应的主名称，最终综合目标位置信息、目标声音信息智能化得到对应的POI兴趣点，通过基于视觉图像信息，智能化生成对应POI兴趣点，从而提高了POI兴趣点的生成速度，进一步推动了空间属性信息化的发展，最终达到促进万物互联的技术效果。

本领域内的技术人员应明白，本申请的实施例可提供为方法、装置、或计算机程序产品。因此，本申请可采用完全软件实施例、完全硬件实施例、或结合软件和硬件方面实施例的形式。此外，本申请为可以在一个或多个包含有计算机可用程序代码的计算机可用存储介质上实施的计算机程序产品的形式。而所述的计算机可用存储介质包括但不限于：U盘、移动硬盘、只读存储器、随机存取存储器、磁盘存储器、只读光盘（Compact Disc Read-Only Memory，简称CD-ROM）、光学存储器等各种可以存储程序代码的介质。

本发明是参照本发明实施例的方法、设备（系统）、和计算机程序产品的流程图和／或方框图来描述的。应理解可由计算机程序指令实现流程图和／或方框图中的每一流程和／或方框、以及流程图和／或方框图中的流程和／或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和／或方框图一个方框或多个方框中指定的功能的系统。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理。尽管已描述了本发明的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例作出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

Claims

1.一种基于视觉图像快速生成POI的方法，其中，所述方法应用于POI生成系统，所述系统与图像摄取装置、目标定位装置以及声音传感装置通信连接，所述方法包括：

基于所述图像摄取装置，对第一区域的第一目标位置进行图像采集，生成第一目标位置图像；

根据自然场景文字识别技术，对所述第一目标位置图像进行文字识别，生成所述第一目标位置的初识化文字信息；

根据语义结构分析数据库，对所述初识化文字信息进行语义结构分析，生成所述第一目标位置的文字结构信息；

对所述初识化文字信息和所述文字结构信息进行数据特征融合，生成所述第一目标位置的主名称信息；

基于所述目标定位装置，获取所述第一目标位置的第一位置信息；

根据所述声音传感装置，对所述第一区域的预定距离范围内的声音强度进行信息采集，生成第一声音强度信息；

将所述主名称信息、所述第一位置信息以及所述第一声音强度信息输入POI自动生成模型进行训练，生成所述第一目标位置的第一POI信息。

2.如权利要求1所述的方法，其中，所述对所述第一目标位置图像进行文字识别，包括：

将所述第一目标位置图像输入单字符识别模型进行训练，获得单字符文字信息；

基于语义生成模型，对所述单字符文字信息进行遍历的拆分重构，生成所述单字符文字信息的语义重构集合；

将所述第一目标位置图像输入文本序列识别模型进行训练，获得文本序列文字信息；

对所述文本序列文字信息进行文本纠错，获得文本文字信息；

对所述语义重构集合和所述文本文字信息进行数据拟合处理，生成所述初识化文字信息。

3.如权利要求2所述的方法，其中，所述对所述语义重构集合和所述文本文字信息进行数据拟合处理，包括：

对所述语义重构集合进行数据分布式处理，获得分布式语义集合；

对所述文本文字信息进行数据分布式处理，获得分布式文本集合；

获得所述分布式文本集合中的第一分布式文本信息的第一文本架构信息；

基于所述第一文本架构信息，对所述分布式语义集合进行筛选，获得匹配文本语义信息；

基于所述第一文本架构信息和所述匹配文本语义信息，构建第一映射关系；

根据所述分布式语义集合、所述分布式文本集合以及所述第一映射关系，构建所述第一目标位置的POI文本离散分布空间。

4.如权利要求3所述的方法，其中，所述方法包括：

将所述语义重构集合中的数据定义为P个样本点，所述文本文字信息中的数据定义为Q个样本点；

基于所述POI文本离散分布空间，对所述P个样本点和所述Q个样本点进行两两距离运算，获得样本点距离集合；

根据所述样本点距离集合，获得目标距离集合，所述目标距离集合为所述样本点距离集合中的最小距离集合；

根据所述目标距离集合，获得所述P个样本点和所述Q个样本点中的语义重构-文本文字映射集合；

基于所述语义重构-文本文字映射集合，对所述语义重构集合和所述文本文字信息进行数据拟合处理。

5.如权利要求1所述的方法，其中，所述将所述主名称信息、所述第一位置信息以及所述第一声音强度信息输入POI自动生成模型进行训练，包括：

将所述主名称信息、所述第一位置信息以及所述第一声音强度信息作为输入信息，输入POI自动生成模型进行训练；

所述POI自动生成模型通过多组训练数据训练所得，所述多组训练数据中的每一组训练数据均包括：所述主名称信息、所述第一位置信息、所述第一声音强度信息以及用来标识第一POI信息的标识信息；

获得所述POI自动生成模型的输出信息，所述输出信息包括所述第一目标位置的第一POI信息。

6.如权利要求1所述的方法，其中，所述方法包括：

构建历史POI管理数据库；

对所述历史POI管理数据库进行类别整理，获得POI管理类别集合；

将所述第一POI信息输入所述POI管理类别集合，获得所述第一POI信息的第一类别信息；

对所述第一类别信息进行类别标记，并将标记类别渲染到所述第一POI信息。

7.如权利要求6所述的方法，其中，所述获得所述第一POI信息的第一类别信息，包括：

根据所述第一POI信息，构建POI分布特征卷积核；

根据所述POI管理类别集合，构建POI管理分布卷积矩阵；

对所述POI分布特征卷积核和所述POI管理分布卷积矩阵进行卷积运算，获得POI分布特征图；

对所述POI分布特征图进行类别特征匹配，获得所述第一POI信息的第一类别信息。

8.一种基于视觉图像快速生成POI的系统，其中，所述系统包括：

第一生成单元：所述第一生成单元用于基于图像摄取装置，对第一区域的第一目标位置进行图像采集，生成第一目标位置图像；

第二生成单元：所述第二生成单元用于根据自然场景文字识别技术，对所述第一目标位置图像进行文字识别，生成所述第一目标位置的初识化文字信息；

第三生成单元：所述第三生成单元用于根据语义结构分析数据库，对所述初识化文字信息进行语义结构分析，生成所述第一目标位置的文字结构信息；

第四生成单元：所述第四生成单元用于对所述初识化文字信息和所述文字结构信息进行数据特征融合，生成所述第一目标位置的主名称信息；

第一获得单元：所述第一获得单元用于基于目标定位装置，获取所述第一目标位置的第一位置信息；

第五生成单元：所述第五生成单元用于根据声音传感装置，对所述第一区域的预定距离范围内的声音强度进行信息采集，生成第一声音强度信息；

第六生成单元：所述第六生成单元用于将所述主名称信息、所述第一位置信息以及所述第一声音强度信息输入POI自动生成模型进行训练，生成所述第一目标位置的第一POI信息。

9.一种基于视觉图像快速生成POI的系统，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其中，所述处理器执行所述程序时实现权利要求1~7任一项所述方法的步骤。