CN113255347A - 实现数据融合的方法和设备及实现无人驾驶设备的识别方法 - Google Patents

实现数据融合的方法和设备及实现无人驾驶设备的识别方法 Download PDF

Info

Publication number
CN113255347A
CN113255347A CN202010084111.0A CN202010084111A CN113255347A CN 113255347 A CN113255347 A CN 113255347A CN 202010084111 A CN202010084111 A CN 202010084111A CN 113255347 A CN113255347 A CN 113255347A
Authority
CN
China
Prior art keywords
information
control information
image information
platforms
knowledge graph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010084111.0A
Other languages
English (en)
Other versions
CN113255347B (zh
Inventor
许冉
金仲明
黄建强
华先胜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN202010084111.0A priority Critical patent/CN113255347B/zh
Publication of CN113255347A publication Critical patent/CN113255347A/zh
Application granted granted Critical
Publication of CN113255347B publication Critical patent/CN113255347B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/28Quantising the image, e.g. histogram thresholding for discrimination between background and foreground patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • G06V20/625License plates

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种实现数据融合的方法和设备及实现无人驾驶设备的识别方法,本申请利用业务场景中的实时操作图片即实时场景图像作为输入,利用控制键盘、鼠标等自动化操作,实现了跨平台的信息采集,避免了数据、功能融合过程中出现的需要打通底层数据库的问题,实现了多个平台间的协作、数据互通,而且有效融合了业务功能。进一步地,本申请利用强化学习算法对知识图谱进行业务功能实现路径的优化,减少了非必要的跨平台操作,提高了自动化操作的效率。

Description

实现数据融合的方法和设备及实现无人驾驶设备的识别方法
技术领域
本申请涉及但不限于数据库处理技术,尤指一种实现数据融合的方法和设备及实现无人驾驶设备的识别方法。
背景技术
为了实现多个平台间的协作、数据互通以及业务功能的融合,相关技术中多采用底层数据库互通的方法来实现平台间数据融合功能,但是,难以实现多个平台间的协作,数据互通困难,而且业务功能无法有效融合。
发明内容
本申请提供一种实现数据融合的方法和设备及实现无人驾驶设备的识别方法,能够实现多个平台间的协作,数据互通,而且有效融合业务功能。
本发明实施例提供了一种实现数据融合的方法,包括:
根据用户需求从多个平台获取对应的图像信息和控制信息;
根据获得的图像信息和控制信息进行业务操作。
在一种示例性实例中,所述根据用户需求从多个平台获取对应的图像信息,包括:
根据所述用户需求,提取各个平台实际业务操作过程中的实时场景图像;
对提取的实时场景图像进行图像预处理以采集信息;
对采集到的信息中与所述用户需求相关的信息进行识别和定位以获得所述图像信息。
在一种示例性实例中,所述与所述用户需求相关的信息为文字信息;
通过光学字符识别OCR对所述采集到的图像信息中的文字信息进行识别和定位。
在一种示例性实例中,所述根据用户需求从多个平台获取对应的控制信息,包括:
利用自然语言处理NLP对输入的所述业务逻辑信息进行解析;
根据解析的结果并利用强化学习和知识图谱生成所述控制信息。
在一种示例性实例中,所述利用NLP对输入的业务逻辑信息进行解析,包括:
根据用户需求中的搜索条件和搜索目标获取业务逻辑信息;
利用自然语言处理NLP的分词技术,对业务逻辑信息进行分词,提取出搜索条件和搜索目标。
在一种示例性实例中,所述根据解析的结果并利用强化学习和知识图谱生成业务控制信息,包括:
根据所述解析的结果从知识图谱中搜索到从所述解析的结果中的条件到所述解析的结果中的目标的路径信息;
利用强化学习对得到的路径信息进行处理以生成按照路径信息中的平台进行控制以搜索到所述解析的结果中的目标的所述业务控制信息。
在一种示例性实例中,所述根据获得的图像信息和控制信息进行业务操作,包括:
利用NLP从获得的所述图像信息中提取其中的实体、逻辑关系信息;
根据所述控制信息和知识图谱,对提取出的实体、逻辑关系信息进行控制。
在一种示例性实例中,所述方法之前还包括:
按照不同平台的已有信息和所述已有信息在各平台间的关联关系生成所述知识图谱的初始信息。
在一种示例性实例中,所述根据用户需求获取对应的图像信息和控制信息之后,所述根据获得的图像信息和控制信息进行业务操作之前,还包括:
根据获得的所述控制信息判断所述业务操作是否能实现,如果能实现,继续执行所述根据获得的图像信息和控制信息进行业务操作的步骤;如果不能实现,返回执行所述根据用户需求获取对应的图像信息和控制信息的步骤。
在一种示例性实例中,所述方法还包括:
根据获得的所述图像信息和所述控制信息中的可执行步骤信息,对基础业务功能进行模块化处理,记录所述可执行步骤,并整合成功能模块库。
在一种示例性实例中,所述方法还包括:
利用强化学习算法,对所述知识图谱进行业务功能实现路径的优化。
本申请还提供了一种计算机可读存储介质,存储有计算机可执行指令,所述计算机可执行指令用于执行上述任一项所述实现数据融合的方法。
本申请还提供了一种实现数据融合的设备,包括存储器和处理器,其中,存储器中存储有以下可被处理器执行的指令:用于执行上述任一项所述实现数据融合的方法的步骤。
本申请又提供了一种实现数据融合的方法,包括:
根据用户需求提取出相关的多个平台;
分别获取所述相关的多个平台对应的图像信息和控制信息;
根据获得的图像信息和控制信息进行业务操作,并建立所述相关的多个平台所包括的字段信息的知识图谱。
本申请再提供了一种实现无人驾驶设备的识别方法,包括:
采集无人驾驶设备的标识信息;
根据获得的标识信息,提取与该无人驾驶设备相关的平台的图像信息和控制信息;
根据获得的图像信息和控制信息进行操作。
本申请利用业务场景中的实时操作图片即实时场景图像作为输入,利用如控制键盘、鼠标等自动化操作,实现了跨平台的信息采集,避免了数据、功能融合过程中出现的需要打通底层数据库的问题,实现了多个平台间的协作、数据互通,而且有效融合了业务功能。
在一种示例性实例中,本申请利用强化学习算法对知识图谱进行业务功能实现路径的优化,减少了非必要的跨平台操作,提高了自动化操作的效率。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
附图说明
附图用来提供对本申请技术方案的进一步理解,并且构成说明书的一部分,与本申请的实施例一起用于解释本申请的技术方案,并不构成对本申请技术方案的限制。
图1为本申请实现数据融合的方法的流程图;
图2为本申请知识图谱的示意图;
图3为本申请实现数据融合的方法的实施例的示意图;
图4为本申请实现数据融合的应用场景示例示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚明白,下文中将结合附图对本申请的实施例进行详细说明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。
在本申请一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flashRAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括非暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行。并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
相关技术中,一方面,数据融合平台首先依赖于各个平台的底层数据库的打通,存在数据权限的问题,无法形成数据闭环,比如:个人手机中不同应用(App)之间的数据互通很难通过打通底层数据库的方法实现,个人应用数据难以形成闭环,无法很好地进行个人数据挖掘;另一方面,很多平台开发年代较为久远,底层数据库没有很好的文档支持,即使有了数据互通的权限,也无法得知如何对数据进行处理如合并、去重等操作以建立一个统一的数据库,比如:在某系统中,如果业务平台的开发公司不复存在,这些平台数据也没有完善的文档说明材料,那么,数据库中包含的数据内容和具体含义将无从得知,也就无法建立起统一的底层大数据库;再者,即使存在完善的数据文档,单纯的数据库字段定义并不能提供相关的业务功能逻辑,也是无法实现从业务功能层面对各个平台进行资源整合的。
图1为本申请实现数据融合的方法的流程图,如图1所示,包括:
步骤100:根据用户需求从多个平台获取对应的图像信息和控制信息。
在一种示例性实例中,本步骤中的用户需求可以包含:提供的原始的搜索条件,以及搜索目标等。举例来看,搜索主体:某人(以例如,应用标识或手机号等标识信息)、搜索时间段:近期(如一个月),搜搜内容:是否在某指定范围内活动过等。
根据用户需求,提取各个平台的实际业务操作过程中的实时场景图像(可参见图3中的步骤3001),比如电脑屏幕截图等;
对提取的实时场景图像进行图像预处理(可参见图3中的步骤3011)以采集信息;
对采集到的信息中与用户需求相关的信息进行识别和定位以获得与用户需求对应的业务场景的所述图像信息(可参见图3中的步骤3021)。
在一种示例性实例中,各个平台包括搜索过程中使用到的所有平台,也就是说,使用到的平台是与用户需求中的搜索条件或搜索目标相关的。本申请实施例中,通过用户需求中的搜索条件或搜索目标实现了自动地确定需要使用到的平台,并从知识图谱中获取对应的平台名称并进行搜索,换句话说,本申请不需要指定具体的平台而实现了多个平台间的协作。
在一种示例性实例中,与用户需求相关的信息可以包括实时场景图像中的任何信息,比如:文字、图片、声音、图像等。
在一种示例性实例中,可以通过光学字符识别(OCR,OpticalCharacterRecognition)对采集到的图像信息中的文字信息进行识别和定位。
OCR是指针对印刷体等光学字符,对其中的文字进行识别,转化为文本格式以进行后续编辑加工的技术。早期OCR处理过程一般包括:图像输入→图像预处理→二值化→字符切割→文字识别等。随着深度学习技术的崛起,出现越来越多的端到端的利用深度神经网络的实现字符识别的方法,这类方法多将OCR拆分为两个技术环节,即文本定位和文字识别。文本定位环节输入为图像,输出为图像中文字的位置框。文字识别环节输入为定位环节输出的文字位置框的图像切片,输出为该图像切片中的具体文字内容。
在一种示例性实例中,图像预处理可以包括如OCR中的索贝尔(sobel)边缘检测算法、膨胀(dilation)、腐蚀(erosion)等操作。其中,dilation和腐蚀erosion是两种形态学运算方法,简单来讲,膨胀会让图像的高亮区域变大,腐蚀会让图像的高亮区域变小。边缘检测算法是图像处理中最为基本的问题,其目的是标志出图像亮度变化明显的点,从而反映出图像中的重要变化,Sobel算子是像素图像边缘检测中最重要的算子之一。
本申请实施例中,在利用OCR技术实现对文字的定位的处理中,通过采用基于sobel边缘检测的传统计算机视觉算法,这样,避免了深度学习算法带来的计算耗时,保证了系统运行的实时性。
通过本步骤中根据用户需求从多个平台获取对应业务场景的图像信息的方式,利用图像信息进行信息挖掘,无需开放不同平台的底层数据权限,解决了各平台间底层数据权限不开放的问题。本申请中,只要平台的使用者具有观察数据的权限即可。
在一种示例性实例中,本步骤中的根据用户需求从多个平台获取对应的控制信息,包括:
利用自然语言处理(NLP,Neuro-Linguistic Programming)对输入的业务逻辑信息进行解析(可参见图3中的步骤3001和步骤3012);根据解析的结果并利用强化学习和知识图谱生成对业务的控制信息(可参见图3中的步骤30221和步骤30222)。
在一种示例性实例中,业务的控制信息包括但不限于如:可执行逻辑、是否完成业务的判定标准等。
在一种示例性实例中,利用NLP对输入的业务逻辑信息进行解析,包括:
根据用户需求中的搜索条件和搜索目标获取业务逻辑信息;比如:搜索条件和搜索目标包括:搜索主体:某人(以例如,应用标识或手机号等标识)、搜索时间段:近期(如一个月),搜搜内容:是否在某指定范围内活动过等,那么,业务逻辑信息包括:某人(以例如,应用标识或手机号等标识)近期(一个月)是否在某指定范围内活动过。
利用NLP的分词技术,对业务逻辑信息进行分词,提取出搜索条件和搜索目标。如上一段中的实施例,解析的结果可以包括:条件:例如,应用标识或手机号;目标:某指定范围。
在一种示例性实例中,根据解析的结果并利用强化学习和知识图谱生成业务控制信息,包括:
根据解析的结果从知识图谱中搜索到从解析的结果中的条件到解析的结果中的目标的路径信息;
利用强化学习对得到的路径信息进行处理以生成按照路径信息中的平台进行控制以搜索到解析的结果中的目标的控制信息。
需要说明的是,这里的路径信息可以包括一条或一条以上的路径。对得到的路径信息进行处理包括分别对每一条路径进行处理,生成针对每一条路劲的业务控制信息。
举例来看,假设NLP解析完的结果包括:条件:例如,应用标识或手机号;目标:某范围。假设从知识图谱中搜索到一条手机号->某范围的最短路径为:系统A->系统B->系统F,那么,生成的控制信息包括:鼠标和键盘自动控制,首先,打开系统A->输入手机号->获得第一搜索结果如地址信息(第一搜索结果利用手机号过滤得到),然后,打开系统B->输入第一搜索结果中的住址->获得第二搜索结果如身份标识(第二搜索结果利用手机号+地址信息综合过滤得到),之后,打开系统F->输入第二搜索结果中的身份标识->第三搜索结果如某范围地(第三搜索结果利用身份标识+手机号+地址信息综合过滤得到)。
在一种示例性实例中,强化学习的方法可以采用如:深度Q-Learning(Deep Q-Learning)等,其中,Q-Learning算法是一种使用时序差分求解强化学习控制问题的方法。
知识图谱(Knowledge Graph),在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,采用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。
在一种示例性实例中,知识图谱的初始信息是预先按照各平台的已有信息和这些信息在各平台间的关联关系生成的,比如可以通过上述步骤100中的基于图像的自动化操作流程如利用OCR技术对图像中信息的识别等,提取出各个平台所包含的字段信息,配合平台上拥有商(客户)已有的文本文档,基于Neo4j进行知识图谱的搭建生成。其中,Neo4j是一个高性能的NoSQL图形数据库,Neo4j将结构化数据存储在网络上而不是表中。其中,NoSQL是Not only SQL的缩写,译为不仅仅是SQL,是一种非关系型的数据库。Neo4j是一个嵌入式的、基于磁盘的、具备完全的事务特性的Java持久化引擎,但是Neo4j将结构化数据存储在网络(从数学角度叫做图)上而不是表中。Neo4j也可以被看作是一个高性能的图引擎,该引擎具有成熟数据库的所有特性。
本申请实施例中的知识图是以业务功能为关联的知识图谱,通过知识图谱形成了各平台业务功能互通的融合系统。如图2所示的知识图谱示意图,空心圆点表示不同的平台,与空心圆点连接的黑色圆点为该空心圆点表示的平台上的信息,黑色圆点之间的连接表示不同平台上的信息之间的关联关系,而这些关联关系也是信息间相互查找的“路径”。
步骤101:根据获得的图像信息和控制信息进行业务操作。
在一种示例性实例中,步骤101可以包括:
利用NLP从获得的图像信息中提取其中的实体、逻辑关系等信息(可参见图3中的步骤304);
根据控制信息和知识图谱,对提取出的实体、逻辑关系等信息进行控制。比如:根据知识图谱和提取的实体、逻辑关系等信息,找到自动控制鼠标或键盘进行相应的移动、浏览、点击、复制、搜索等操作。
在一种示例性实例中,实体、逻辑关系等信息可以包括如属性信息——姓名、性别、籍贯等。
仍以上文的实施例为例,假设搜索条件和搜索目标包括:搜索主体:某人(以例如,应用标识或手机号等标识)、搜索时间段:近期(如一个月),搜搜内容:是否在某指定范围内活动过等,那么,业务逻辑信息包括:某人(以例如,应用标识或手机号等标识)近期(一个月)是否在某指定范围内活动过。NLP解析完的结果包括:条件:例如,应用标识或手机号;目标:某指定范围。假设从知识图谱中搜索到一条手机号->某范围的最短路径为:系统A->系统B->系统F,此时,鼠标和键盘自动控制,首先,打开系统A->输入手机号->获得第一搜索结果如地址信息(第一搜索结果利用手机号过滤得到),然后,打开系统B->输入第一搜索结果中的地址->获得第二搜索结果如身份标识(第二搜索结果利用手机号+地址信息综合过滤得到),之后,打开系统F->输入第二搜索结果中的身份标识->第三搜索结果如某范围地(第三搜索结果利用身份标识+手机号+地址信息综合过滤得到)。
在一种示例性实例中,在步骤100之后,步骤101之前,还包括:
根据获得的控制信息判断业务操作是否能实现(可参见图3中的步骤305),如果能实现(即根据NLP解析完的结果中的条件能找到NLP解析完的结果中的目标),继续执行步骤101;如果不能实现(即根据NLP解析完的结果中的条件不能找到NLP解析完的结果中的目标),返回步骤100继续按照用户需求进行处理。
本申请实施例利用业务逻辑辅助理解信息的真实含义,通过对当前业务操作能否实现的判断,解决了数据定义不清的问题,以及数据定义和业务逻辑断裂的问题。
本申请实现数据融合的方法,利用业务场景中的实时操作图片即实时场景图像作为输入(如电脑、手机屏幕实时画面等),利用控制键盘、鼠标等自动化操作,实现了跨平台的信息采集,避免了数据、功能融合过程中出现的需要打通底层数据库的问题,实现了多个平台间的协作、数据互通,而且有效融合了业务功能。
在一种示例性实例中,本申请实现数据融合的方法,还包括:
根据步骤100和步骤101获得的信息(如业务场景图像信息和业务控制信息中的可执行步骤信息),将基础业务功能进行模块化处理(可参见图3中的步骤303),记录详细的可执行步骤,并整合成功能模块库以供调用,同时通过业务功能将各个平台紧密关联。通过本步骤实现了业务功能的模块化,自动记录了输入的业务功能及其最终的实现步骤,形成了基础业务功能模块,提升了用户使用效率,同时使得系统具有自生长性。
在一种示例性实例中,本申请实现数据融合的方法,还包括:
根据步骤100和步骤101整合出的信息和业务功能关系,从执行步骤中提取出各个子平台并结合对应的功能实现,更新以业务功能为关联的知识图谱,以完善各平台业务功能互通的融合系统。举例来看,以步骤100中根据解析的结果并利用强化学习和知识图谱生成业务控制信息的实例来看,系统A返回的住址信息是存在“精度”问题的,假设系统A中的地址信息只精确到住在某个区。如果在搜索到的另一条路径上,系统G返回的地址信息精确到门牌号。也就是说,即使是同样的“地址信息”字段,不同平台存储的数据有可能是不同的,类似系统A和系统G这样的情况。这种情况下,本申请实施例会根据整合出的信息如本实施例中的精度更高的地址信息,对知识图谱进行优化更新。
本申请实施例不仅通过信息融合各个子平台,同时通过强化学习的方法获取不同平台的信息间的语义关联,明确了各个平台擅长处理的问题、知识和信息,建立了不同平台间基于业务功能层面的知识图谱,最终形成了以业务逻辑为导向的指挥中枢。
举例来看,知识图谱的生成过程包括:将各平台对应的系统所包括的字段信息(如姓名、性别、常去地址、住址等)整理成知识图谱,不同系统的相同字段默认互通;在自动实现用户需求的操作过程中:会根据补充新的互通字段,比如子系统A的“住址”字段和子系统B的“常去地址”字段可以互通(操作过程中实现)。另一方面:对初始化过程中默认连通的不同子系统的相同字段进行修正,比如子系统C的“AA”字段和子系统D的“BB”字段在初始化的知识图谱里是连通的,但在实际操作过程中,发现不能互通(有可能C系统保存的是aa、D系统保存的是aa’),这个时候对初始图谱进行修正。随着业务操作的增多,知识图谱会越来越完善,并且体现真实的系统间的信息互通情况。(附:知识图谱针对的是各个子系统保存的字段信息(属性)以及各个子系统的通过存储的字段信息可以进行联通的情况,是系统之间的关联,并非是某个具体的人为主体)。
在一种示例性实例中,知识图谱的生成过程可以包括:将各平台对应的系统所包括的字段信息(如姓名、性别、常去地址等)整理成知识图谱,不同系统的相同字段默认互通;在本申请中自动实现用户需求的操作过程中:会补充新的互通字段,比如步骤101的实例中,系统A的“住址信息”字段和系统B的“常去地址”字段可以互通(操作过程中实现)。另外,对初始化过程中默认连通的不同系统的相同字段进行修正,比如:假设系统C的“AA”字段和系统D的“BB”字段在初始化的知识图谱中是连通的,但是,在实际操作过程中,发现不能互通(有可能系统C中保存的是aa、而系统D中保存的是aa’),此时,会对初始知识图谱进行修正。这样,随着业务操作的增多,知识图谱会越来越完善,并且体现真实的系统间的信息互通情况。需要说明的是,知识图谱针对的是各平台中保存的字段信息(或属性)以及各平台间通过存储的字段信息可以进行联通的情况,是系统之间的关联,并非是某个具体的人为主体。
在一种示例性实例中,本申请实现数据融合的方法,还包括:
利用强化学习算法如Deep Q-Learning等,对本申请的知识图谱进行业务功能实现路径的优化,这样,减少了非必要的跨平台操作,提高了自动化操作的效率。本申请实施例中,运用强化学习的算法对知识图谱中业务功能的实现路径的优化,缩短了跨平台操作的时间,提高了自动化效率。
随着知识图谱的复杂度增高,从系统A连接到系统F的路径可能有多条,比如路径1:系统A->系统B->系统D->系统F,路径2:系统A->系统B->系统C->系统D->系统E->系统F。强化学习可以优化找到一条最短路径,具体使用的技术可以是如Q-Learning等。具体实现可以包括:将各个平台对应的系统作为节点,系统之间如果有超过3个字段互通,则认为两个系统是可以互通的,以这样的方式构建图;然后,再通过Q-Learning获得任意两个系统间的最短路径。这样,在实际操作过程中,因为是基于视觉的纯自动化,较短的路径也就意味着打开较少的系统,节约了时间,提高了搜索效率。图3中的结构化数据(可参见图3中的步骤306)就是用于构建知识图谱的数据,比如:体现系统A和系统B通过哪些字段互通的数据等。
本申请还提供一种计算机可读存储介质,存储有计算机可执行指令,所述计算机可执行指令用于执行上述任一项的实现数据融合的方法。
本申请再提供一种实现数据融合的设备,包括存储器和处理器,其中,存储器中存储有以下可被处理器执行的指令:用于执行上任一项所述实现数据融合的方法的步骤。
以利用本申请方法园区安全系统实现数据融合为例,本申请还提供一种实现数据融合的方法,包括:根据用户需求提取出相关的多个平台;分别获取所述相关的多个平台对应的图像信息和控制信息;根据获得的图像信息和控制信息进行业务操作,并建立所述相关的多个平台所包括的字段信息的知识图谱。图4为本申请实现数据融合的应用场景示例示意图,如图4所示,假设根据用户需求,比如以用户标识信息为线索,以搜索该人最近一个月是否在某小区内活动过为目标,提取出相关的三个平台:平台1(进行人员信息查阅的住户系统)、平台3(进行人脸比对的人脸系统)和平台5(进行车辆卡口信息查询的园区门卫系统),并通过控制键盘、鼠标等自动化操作在这些平台中进行信息的查询,最后建立各平台所包括的字段信息的知识图谱,比如平台1的用户标识信息字段与平台3的人像关联匹配字段之间的联系,平台3的人像关联匹配字段与平台5的过车查询字段之间的联系等等。
在一种示例性实例中,本申请可以应用于对无人驾驶设备的识别,本申请实现无人驾驶设备的识别方法可以包括:采集无人驾驶设备的标识信息(比如利用图像识别技术实现),如车牌号等;根据获得的标识信息,提取与该无人驾驶设备相关的平台的图像信息和控制信息;根据获得的图像信息和控制信息进行操作。
进一步地,根据获得的标识信息,提取与该无人驾驶设备相关的平台的图像信息,可以包括:
提取与该无人驾驶设备相关的平台的实际业务操作过程中的实时场景图像,比如电脑屏幕截图等;对提取的实时场景图像进行图像预处理以采集信息;对采集到的信息中与该无人驾驶设备相关的信息进行识别和定位以获得与该无人驾驶设备对应的业务场景的所述图像信息。在一种示例性实例中,识别和定位出的信息可以包括但不限于如:该无人驾驶设备所在地区如归属地等、这片区域的道路管制情况如开放、关闭、临时关闭等、以及限行信息如什么时间段内哪些牌照的车辆可以通行,哪些不能通行等。
进一步地,根据获得的标识信息,提取与该无人驾驶设备相关的平台的控制信息,可以包括:
进一步地,根据获得的图像信息和控制信息进行操作,可以包括:
利用NLP从获得的所述图像信息中提取其中的实体、逻辑关系信息;
根据所述控制信息和知识图谱,对提取出的实体、逻辑关系信息进行控制。比如:对于正在导航的路线进行合理规划以避开关闭路段等等;再如:如果当前按无人驾驶设备正处于对其不开放的路段,会发出警告或更改路线等控制。
本实施例中根据待识别无人驾驶设备的标识信息从相关平台获取对应业务场景的图像信息的方式,利用图像信息进行信息挖掘,无需开放不同平台的底层数据权限,实现了对无人驾驶设备的智能识别及控制。
虽然本申请所揭露的实施方式如上,但所述的内容仅为便于理解本申请而采用的实施方式,并非用以限定本申请。任何本申请所属领域内的技术人员,在不脱离本申请所揭露的精神和范围的前提下,可以在实施的形式及细节上进行任何的修改与变化,但本申请的专利保护范围,仍须以所附的权利要求书所界定的范围为准。

Claims (15)

1.一种实现数据融合的方法,包括:
根据用户需求从多个平台获取对应的图像信息和控制信息;
根据获得的图像信息和控制信息进行业务操作。
2.根据权利要求1所述的方法,其中,所述根据用户需求从多个平台获取对应的图像信息,包括:
根据所述用户需求,提取各个平台实际业务操作过程中的实时场景图像;
对提取的实时场景图像进行图像预处理以采集信息;
对采集到的信息中与所述用户需求相关的信息进行识别和定位以获得所述图像信息。
3.根据权利要求2所述的方法,其中,所述与所述用户需求相关的信息为文字信息;
通过光学字符识别OCR对所述采集到的图像信息中的文字信息进行识别和定位。
4.根据权利要求1所述的方法,其中,所述根据用户需求从多个平台获取对应的控制信息,包括:
利用自然语言处理NLP对输入的所述业务逻辑信息进行解析;
根据解析的结果并利用强化学习和知识图谱生成所述控制信息。
5.根据权利要求4所述的方法,其中,所述利用NLP对输入的业务逻辑信息进行解析,包括:
根据用户需求中的搜索条件和搜索目标获取业务逻辑信息;
利用自然语言处理NLP的分词技术,对业务逻辑信息进行分词,提取出搜索条件和搜索目标。
6.根据权利要求4所述的方法,其中,所述根据解析的结果并利用强化学习和知识图谱生成业务控制信息,包括:
根据所述解析的结果从知识图谱中搜索到从所述解析的结果中的条件到所述解析的结果中的目标的路径信息;
利用强化学习对得到的路径信息进行处理以生成按照路径信息中的平台进行控制以搜索到所述解析的结果中的目标的所述业务控制信息。
7.根据权利要求1所述的方法,其中,所述根据获得的图像信息和控制信息进行业务操作,包括:
利用NLP从获得的所述图像信息中提取其中的实体、逻辑关系信息;
根据所述控制信息和知识图谱,对提取出的实体、逻辑关系信息进行控制。
8.根据权利要求4或7所述的方法,所述方法之前还包括:
按照不同平台的已有信息和所述已有信息在各平台间的关联关系生成所述知识图谱的初始信息。
9.根据权利要求1所述的方法,所述根据用户需求获取对应的图像信息和控制信息之后,所述根据获得的图像信息和控制信息进行业务操作之前,还包括:
根据获得的所述控制信息判断所述业务操作是否能实现,如果能实现,继续执行所述根据获得的图像信息和控制信息进行业务操作的步骤;如果不能实现,返回执行所述根据用户需求获取对应的图像信息和控制信息的步骤。
10.根据权利要求1所述的方法,所述方法还包括:
根据获得的所述图像信息和所述控制信息中的可执行步骤信息,对基础业务功能进行模块化处理,记录所述可执行步骤,并整合成功能模块库。
11.根据权利要求8所述的方法,所述方法还包括:
利用强化学习算法,对所述知识图谱进行业务功能实现路径的优化。
12.一种计算机可读存储介质,存储有计算机可执行指令,所述计算机可执行指令用于执行权利要求1~权利要求11任一项所述实现数据融合的方法。
13.一种实现数据融合的设备,包括存储器和处理器,其中,存储器中存储有以下可被处理器执行的指令:用于执行权利要求1~权利要求11任一项所述实现数据融合的方法的步骤。
14.一种实现数据融合的方法,包括:
根据用户需求提取出相关的多个平台;
分别获取所述相关的多个平台对应的图像信息和控制信息;
根据获得的图像信息和控制信息进行业务操作,并建立所述相关的多个平台所包括的字段信息的知识图谱。
15.一种实现无人驾驶设备的识别方法,包括:
采集无人驾驶设备的标识信息;
根据获得的标识信息,提取与该无人驾驶设备相关的平台的图像信息和控制信息;
根据获得的图像信息和控制信息进行操作。
CN202010084111.0A 2020-02-10 2020-02-10 实现数据融合的方法和设备及实现无人驾驶设备的识别方法 Active CN113255347B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010084111.0A CN113255347B (zh) 2020-02-10 2020-02-10 实现数据融合的方法和设备及实现无人驾驶设备的识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010084111.0A CN113255347B (zh) 2020-02-10 2020-02-10 实现数据融合的方法和设备及实现无人驾驶设备的识别方法

Publications (2)

Publication Number Publication Date
CN113255347A true CN113255347A (zh) 2021-08-13
CN113255347B CN113255347B (zh) 2022-11-15

Family

ID=77219366

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010084111.0A Active CN113255347B (zh) 2020-02-10 2020-02-10 实现数据融合的方法和设备及实现无人驾驶设备的识别方法

Country Status (1)

Country Link
CN (1) CN113255347B (zh)

Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101739601A (zh) * 2008-11-12 2010-06-16 长春工程学院 一种用于开发强化学习系统的框架及方法
CN104284162A (zh) * 2014-10-29 2015-01-14 广州中国科学院软件应用技术研究所 一种视频检索方法和系统
CN106713083A (zh) * 2016-11-24 2017-05-24 海信集团有限公司 基于知识图谱的智能家居设备控制方法、装置及系统
WO2017219319A1 (zh) * 2016-06-23 2017-12-28 驭势科技(北京)有限公司 车辆自动驾驶方法和车辆自动驾驶系统
CN108092804A (zh) * 2017-12-08 2018-05-29 国网安徽省电力有限公司信息通信分公司 基于Q-learning的电力通信网效用最大化资源分配策略生成方法
CN108447041A (zh) * 2018-01-30 2018-08-24 中国航天电子技术研究院 一种基于增强学习的多源图像融合方法
CN108924262A (zh) * 2018-08-17 2018-11-30 嘉善力通信息科技股份有限公司 一种基于云平台的智安小区管控系统
CN109063870A (zh) * 2018-07-24 2018-12-21 海南大学 基于q学习的组合服务策略优化方法及系统
CN109241291A (zh) * 2018-07-18 2019-01-18 华南师范大学 基于深度强化学习的知识图谱最优路径查询系统及其方法
CN109532847A (zh) * 2018-11-19 2019-03-29 百度在线网络技术(北京)有限公司 用于控制无人驾驶车辆的方法和装置
CN109726676A (zh) * 2018-12-28 2019-05-07 苏州大学 自动驾驶系统的规划方法
CN110381541A (zh) * 2019-05-28 2019-10-25 中国电力科学研究院有限公司 一种基于强化学习的智能电网切片分配方法及装置
CN110457403A (zh) * 2019-08-12 2019-11-15 南京星火技术有限公司 图网络决策系统、方法及知识图谱的构建方法
CN110597075A (zh) * 2019-09-09 2019-12-20 珠海格力电器股份有限公司 一种检测控制冲突的方法、装置、电子设备及存储介质
CN110727805A (zh) * 2019-10-11 2020-01-24 北京明略软件系统有限公司 社区知识图谱构建方法及系统

Patent Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101739601A (zh) * 2008-11-12 2010-06-16 长春工程学院 一种用于开发强化学习系统的框架及方法
CN104284162A (zh) * 2014-10-29 2015-01-14 广州中国科学院软件应用技术研究所 一种视频检索方法和系统
WO2017219319A1 (zh) * 2016-06-23 2017-12-28 驭势科技(北京)有限公司 车辆自动驾驶方法和车辆自动驾驶系统
CN106713083A (zh) * 2016-11-24 2017-05-24 海信集团有限公司 基于知识图谱的智能家居设备控制方法、装置及系统
CN108092804A (zh) * 2017-12-08 2018-05-29 国网安徽省电力有限公司信息通信分公司 基于Q-learning的电力通信网效用最大化资源分配策略生成方法
CN108447041A (zh) * 2018-01-30 2018-08-24 中国航天电子技术研究院 一种基于增强学习的多源图像融合方法
CN109241291A (zh) * 2018-07-18 2019-01-18 华南师范大学 基于深度强化学习的知识图谱最优路径查询系统及其方法
CN109063870A (zh) * 2018-07-24 2018-12-21 海南大学 基于q学习的组合服务策略优化方法及系统
CN108924262A (zh) * 2018-08-17 2018-11-30 嘉善力通信息科技股份有限公司 一种基于云平台的智安小区管控系统
CN109532847A (zh) * 2018-11-19 2019-03-29 百度在线网络技术(北京)有限公司 用于控制无人驾驶车辆的方法和装置
CN109726676A (zh) * 2018-12-28 2019-05-07 苏州大学 自动驾驶系统的规划方法
CN110381541A (zh) * 2019-05-28 2019-10-25 中国电力科学研究院有限公司 一种基于强化学习的智能电网切片分配方法及装置
CN110457403A (zh) * 2019-08-12 2019-11-15 南京星火技术有限公司 图网络决策系统、方法及知识图谱的构建方法
CN110597075A (zh) * 2019-09-09 2019-12-20 珠海格力电器股份有限公司 一种检测控制冲突的方法、装置、电子设备及存储介质
CN110727805A (zh) * 2019-10-11 2020-01-24 北京明略软件系统有限公司 社区知识图谱构建方法及系统

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
刘成健 等: "基于参数融合的Q学习交通信号控制方法", 《计算机技术与发展》 *
刘成健 等: "基于参数融合的Q学习交通信号控制方法", 《计算机技术与发展》, vol. 28, no. 11, 30 November 2018 (2018-11-30), pages 48 - 51 *
林强: "《机器学习、深度学习与强化学习》", 31 May 2019, 知识产权出版社, pages: 14 - 15 *
赵婕: "《图像特征提取与语义分析》", 30 June 2015, 重庆大学出版社, pages: 78 - 79 *

Also Published As

Publication number Publication date
CN113255347B (zh) 2022-11-15

Similar Documents

Publication Publication Date Title
Kavasidis et al. A saliency-based convolutional neural network for table and chart detection in digitized documents
KR102103902B1 (ko) 컴포넌트 기반의 머신러닝 자동화 예측 장치 및 방법
KR102592551B1 (ko) Ar장치를 위한 객체 인식 처리 장치 및 방법
CN106294520B (zh) 使用从文档提取的信息来标识关系
CN111427968A (zh) 一种基于知识图谱的重点人员全息档案构建方法及装置
CN111538794B (zh) 一种数据融合方法、装置及设备
CN113221181B (zh) 具有隐私保护的表格类信息抽取系统及方法
CN116049397B (zh) 基于多模态融合的敏感信息发现并自动分类分级方法
US20140236991A1 (en) Parsing and Rendering Structured Images
Walton et al. Landscape analysis for the specimen data refinery
CN115238081B (zh) 一种文物智能识别方法、系统及可读存储介质
Lin et al. Face detection and segmentation with generalized intersection over union based on mask R-CNN
Cao et al. An end-to-end neural network for multi-line license plate recognition
Kumar et al. Adversarial adaptation of scene graph models for understanding civic issues
CN113255347B (zh) 实现数据融合的方法和设备及实现无人驾驶设备的识别方法
CN117313141A (zh) 一种异常检测方法、装置、设备及可读存储介质
CN114842482B (zh) 一种图像分类方法、装置、设备和存储介质
CN112306985A (zh) 一种数字视网膜多模态特征联合精准检索方法
Yao et al. Invoice detection and recognition system based on deep learning
Ali et al. Detecting anomalous behaviour using heterogeneous data
CN112732845A (zh) 一种基于端到端的大型知识图谱构建和存储方法和系统
Spinnato et al. Explaining crash predictions on multivariate time series data
CN111723177A (zh) 信息提取模型的建模方法、装置及电子设备
CN116050517B (zh) 一种面向公共安全领域的多模态数据管理方法及系统
CN113676465B (zh) 一种面向工业企业网络的图像过滤方法、存储器和处理器

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant