CN111783454A - 地理信息的识别与录入方法及设备、电子设备和介质 - Google Patents

地理信息的识别与录入方法及设备、电子设备和介质 Download PDF

Info

Publication number
CN111783454A
CN111783454A CN202010623258.2A CN202010623258A CN111783454A CN 111783454 A CN111783454 A CN 111783454A CN 202010623258 A CN202010623258 A CN 202010623258A CN 111783454 A CN111783454 A CN 111783454A
Authority
CN
China
Prior art keywords
geographic
information
word
matched
template
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010623258.2A
Other languages
English (en)
Other versions
CN111783454B (zh
Inventor
贾乐乐
韩磊
夏帅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN202010623258.2A priority Critical patent/CN111783454B/zh
Publication of CN111783454A publication Critical patent/CN111783454A/zh
Application granted granted Critical
Publication of CN111783454B publication Critical patent/CN111783454B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Remote Sensing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开提供一种地理信息的识别与录入方法及设备、电子设备和介质,涉及自然语言处理、智能交通、语音交互以及深度学习领域。地理信息的识别与录入方法包括:获取输入的包含地理信息和事件信息的文本;提取文本中的分别标识地理信息和事件信息的词槽并标记词槽的名称;根据词槽的名称匹配相应的语义模板,其中语义模板包括地理信息语义模板和事件信息语义模板;以及根据匹配到的地理信息语义模板以及匹配的词槽实现地理位置定位以输出该地理位置的坐标信息,并输出匹配到的事件信息语义模板中的词槽内容。

Description

地理信息的识别与录入方法及设备、电子设备和介质
技术领域
本公开涉及地理信息的识别与录入方法及设备、电子设备和介质。
背景技术
在紧急电话110、120、地图APP信息上报等需要快速定位到相关地理位置的应用场景下,会遇到大量用户上报位置信息的情况,现有的工作方式大量依赖人工的处理,使用者一般具备地理位置检索系统,当收到用户上报的地理位置信息描述时,一般需要经历以下步骤:利用地理位置检索系统,手动输入相关信息;筛选结果数据,标记用户所表达的区域;录入已有的信息处理系统,发布数据或进一步处理。但是,在这些场景下,时间往往对事态的发展起到至关重要的作用。现有的基于人工处理的方案主要有以下缺点:(1)时效性差:信息的解读需要依赖人对已有系统的操作,例如通过位置检索系统进行位置搜寻;(2)自动化程度低:信息的查找与录入需要依赖人工操作才能完成;(3)准确性低:判断依赖人对相关区域的熟悉程度和地理位置的理解程度。
在此部分中描述的方法不一定是之前已经设想到或采用的方法。除非另有指明,否则不应假定此部分中描述的任何方法仅因其包括在此部分中就被认为是现有技术。类似地,除非另有指明,否则此部分中提及的问题不应认为在任何现有技术中已被公认。
发明内容
根据本公开的一个方面,提供了一种基于地理信息的信息识别与录入方法,包括:获取输入的包含地理信息和事件信息的文本;提取文本中的分别标识地理信息和事件信息的词槽并标记词槽的名称;根据词槽的名称匹配相应的语义模板,其中语义模板包括地理信息语义模板和事件信息语义模板;以及根据匹配到的地理信息语义模板以及匹配的词槽实现地理位置定位以输出地理位置的坐标信息,并输出匹配到的事件信息语义模板中的词槽内容。
根据本公开的另一个方面,提供了一种基于地理信息的信息识别与录入设备,包括:文本获取单元,被配置为获取输入的包含地理信息和事件信息的文本;词槽提取单元,被配置为提取文本中的分别标识地理信息和事件信息的词槽并标记词槽的名称;匹配单元,被配置为根据词槽的名称匹配相应的语义模板,其中语义模板包括地理信息语义模板和事件信息语义模板;以及信息处理单元,被配置为根据匹配到的地理信息语义模板以及匹配的词槽实现地理位置定位以输出地理位置的坐标信息,并输出匹配到的事件信息语义模板中的词槽内容。
根据本公开的另一个方面,提供了一种电子设备,包括:处理器;以及存储程序的存储器,该程序包括指令,该指令在由处理器执行时使处理器执行本公开中所述的构建方法。
根据本公开的另一个方面,提供了一种存储程序的计算机可读存储介质,该程序包括指令,该指令在由电子设备的处理器执行时,致使电子设备执行本公开中所述的构建方法。
根据本公开的一个方面,一种基于地理信息的信息识别与录入方法摒弃了传统的依赖人工录入位置信息的工作方式,能够自动将用户想表达的信息在地理信息系统中进行标识与展示,极大的提高了相关工作的时效性与准确性。
根据在下文中所描述的实施例,本公开的这些和其它方面将是清楚明白的,并且将参考在下文中所描述的实施例而被阐明。
附图说明
附图示例性地示出了实施例并且构成说明书的一部分,与说明书的文字描述一起用于讲解实施例的示例性实施方式。所示出的实施例仅出于例示的目的,并不限制权利要求的范围。在所有附图中,相同的附图标记指代类似但不一定相同的要素。
图1是示出示例性实施例的基于地理信息的信息识别与录入方法的流程图;
图2是示出示例性实施例的基于点状的位置信息描述的示意图;
图3是示出示例性实施例的基于线状的位置信息描述的示意图;
图4是示出示例性实施例的基于面状的位置信息描述的示意图;
图5是示出示例性实施例的基于地理信息的信息识别与录入设备的示意图;以及
图6是示出能够应用于示例性实施例的示例性计算设备的结构框图。
具体实施方式
在本公开中,除非另有说明,否则使用术语“第一”、“第二”等来描述各种要素不意图限定这些要素的位置关系、时序关系或重要性关系,这种术语只是用于将一个元件与另一元件区分开。在一些示例中,第一要素和第二要素可以指向该要素的同一实例,而在某些情况下,基于上下文的描述,它们也可以指代不同实例。
在本公开中对各种所述示例的描述中所使用的术语只是为了描述特定示例的目的,而并非旨在进行限制。除非上下文另外明确地表明,如果不特意限定要素的数量,则该要素可以是一个也可以是多个。此外,本公开中所使用的术语“和/或”涵盖所列出的项目中的任何一个以及全部可能的组合方式。
在例如交警的日常工作中,会遇到大量用户上报位置信息的场景,例如:用户上报A路B位置发生交通事故、用户上报从A桥到B桥有严重的交通拥堵、用户上报C附近500米辐射范围内交通设施故障等。本公开能够将用户上报信息快速定位至地理信息系统并为已有的相关预警系统提供位置数据,为后续的决策提供辅助支撑。
图1是示出示例性实施例的基于地理信息的信息识别与录入方法的流程图。如图1所示,该方法包括:获取输入的包含地理信息和事件信息的文本(步骤110);提取文本中的分别标识地理信息和事件信息的词槽并标记词槽的名称(步骤120);根据词槽的名称匹配相应的语义模板,其中语义模板包括地理信息语义模板和事件信息语义模板(步骤130);以及根据匹配到的地理信息语义模板以及匹配的词槽实现地理位置定位以输出地理位置的坐标信息,并输出匹配到的事件信息语义模板中的词槽内容(步骤140)。
在步骤110中,获取输入的包含地理信息和事件信息的文本。
根据一些实施例,获取输入的包含地理信息和事件信息的文本包括:获取输入的包含地理信息和事件信息的语音;以及通过语音文本转换算法将所述语音转换为对应的文本。
根据一些实施例,地理信息为可以指示相关地理位置、方位、范围等的路网数据,而事件信息为可以指示发生了何种事件以及该事件类型、状态等的信息,例如交通事件。例如,在示例性文本信息“京沪高速进京方向马驹桥至大羊坊路段K11+300处交通事故现场已处理完毕,恢复正常通行”中,“京沪高速进京方向马驹桥至大羊坊路段K11+300处”为其包含的地理信息,“交通事故现场已处理完毕,恢复正常通行”为其包含的事件信息。
根据一些实施例,首先获取用户输入的语音信息,该语音信息包含相应的地理信息和事件信息。将所获取的语音信息通过语音识别模型转换为相应的文本信息。该语音识别模型包括但不限于LSTM模型、DNN-HMM模型、BLSTM模型、DFSMN模型等等,在此不作限制。
在步骤120中,提取文本中的分别标识地理信息和事件信息的词槽并标记词槽的名称。
根据一些实施例,该词槽以及词槽名称等的相关示例如表1所示。其中表1中示出了该词槽名称的部分示例,但应当理解,其具体内容不限于此。
表1
Figure BDA0002563802800000041
Figure BDA0002563802800000051
根据一些实施例,提取文本中的分别标识地理信息和事件信息的词槽并标记词槽的名称包括:对文本进行NLP分词解析,以识别出标识地理信息和事件信息的词槽。
根据一些实施例,对所述文本进行NLP分词解析之前,还包括:构建多个地理信息词表和事件词表,其中所有词表构成词典;构建多个话术模板,该话术模板包括一个或多个词槽名称;以及根据词典和话术模板对NLP处理模块进行训练,以通过训练后的NLP处理模块对文本进行NLP分词解析。
根据一些实施例,地理信息词表包括下列的一个或多个:道路名称词表、POI名称词表、收费站名称词表、方向词表、桩号词表。
根据一些实施例,事件词表包括下列的一个或多个:事件类型词表、事件状态词表和拥堵状态词表。
根据一些实施例,构建基于地理信息(路网数据)和事件(例如交通事件)的词表,主要包括:道路名称词表、POI名称词表、收费站名称词表、事件类型词表、事件状态词表、拥堵状态词表、方向词表、桩号词表等,所有词表构成词典。基于行业经验总结出常用话术模板,由若干片段组成,如下所示:
[D:user_start][D:user_subway_exit][D:kw_zhi][D:user_arrival]
[D:user_direction]
[D:user_event_status]
[D:user_event_type]
[D:user_pile]
[D:user_poi]
[D:user_poi_sub_term]
[D:user_traffic_status]
[D:user_start][D:user_poi_sub_term][D:kw_zhi][D:user_arrival]
[D:user_poi]
[D:user_poi_sub_term]
[D:user_direction]
[D:user_event_status]
[D:user_event_type]
[D:user_pile]
[D:user_subway_exit]
[D:user_traffic_status]
应当理解,上述示出的话术模板仅仅是示例的,其并不限制于此。
根据一些实施例,在地理信息系统中,POI(point of information)位置数据,是地图上任何非地理意义的有意义的点,比如商店、酒吧、加油站,POI是地图的一个基本要素。在地图表达中,一个POI可代表一栋大厦、一家商铺、一处景点等等。通过POI搜索,完成找餐馆、找景点等等的功能。桩号为一种位置的表示方法,通常用于道路、渠道之类需要取得一定关联度场所,常见于高速公路。公路桩号是对公路沿线技术属性定位的重要依据,更是公路管理工作的基础。
根据一些实施例,通过上述词典和话术模板对NLP处理模块进行训练可以基于深度学习算法、人工神经网络算法等,在此不做限制。
在步骤130中,根据词槽的名称匹配相应的语义模板,其中语义模板包括地理信息语义模板和事件信息语义模板。
根据一些实施例,设定多个语义模板,该语义模板包括一个或多个词槽名称。示例地,将所获取的词槽区分为地理信息词槽和事件信息词槽,将区分为地理信息词槽的词槽根据其名称依次到地理信息语义模板数据库中筛选对应的模板,直到找到与所有的地理信息词槽的名称均对应的地理信息语义模板;相似地,将区分为事件信息词槽的词槽根据其名称依次到事件信息语义模板数据库中筛选对应的模板,直到找到与所有的事件信息词槽的名称均对应的事件信息语义模板。
在步骤140中,根据匹配到的地理信息语义模板以及匹配的词槽实现地理位置定位以输出地理位置的坐标信息,并输出匹配到的事件信息语义模板中的词槽内容。
根据一些实施例,根据匹配到的地理信息语义模板以及匹配的词槽实现地理位置定位以输出地理位置的坐标信息包括:根据匹配到的地理语义模板所对应的地理场景以及与模板匹配的词槽实现与词槽相对应的地理位置的定位,其中地理场景是点状地理场景、线状地理场景以及面状地理场景中的一者。
根据一些实施例,根据匹配到的地理语义模板所对应的地理场景以及与模板匹配的词槽实现与词槽相对应的地理位置的定位包括:响应于地理场景为点状地理场景,根据与模板相匹配的表示点状位置的词槽定位该点状位置的坐标点;以及根据匹配的模板中的其他词槽对该点状位置的坐标点进行校正。
根据一些实施例,基于点状的位置信息描述如图2所示,利用单点位置检索结合方向偏移实现点位置的定位,常用的基于点状场景的地理信息语义匹配模板如下所示:
单POI+方向词槽:user_poi+user_direction
单POI+桩号词槽:user_poi+user_pile
单POI+方向+桩号词槽:user_poi+user_direction+user_pile
单POI+POI方向词槽:user_poi+user_poi_sub_term
单POI+出入口词槽:user_poi+user_subway_exit
应当理解,上述对应于点状地理场景的模板仅仅是示例的,其并不限制于此。
根据一些实施例,根据匹配到的基于点状的地理信息语义匹配模板,例如匹配到模板:单POI+方向词槽user_poi+user_direction。首先定位单POI词槽所表示的地理位置,并获取该位置的坐标点,然后基于方向词槽对该坐标点进行校正。具体地,定位与上述所获取坐标点相对应的其逆向位置(例如双向车道的另一车道)的坐标点,根据该方向词槽确定哪一个坐标点为该点状的地理信息所对应的坐标信息。
根据一些实施例,根据匹配到的地理语义模板所对应的地理场景以及与模板匹配的词槽实现与该词槽相对应的地理位置的定位包括:响应于地理场景为线状地理场景,根据与模板相匹配的所有表示点状位置的词槽定位所有点状位置的坐标点;获取与定位到的坐标点相对应的表示其逆向位置的坐标点;计算该点状位置的坐标点和表示其逆向位置的坐标点与其他点状位置的坐标点和表示其逆向位置的坐标点之间的距离;以及选取各点状位置之间距离最短的路径,以实现与所述词槽相对应的线状地理位置的定位。
根据一些实施例,基于线状的位置信息描述如图3所示,根据语义模板匹配的结果,通过路线规划的方式,进一步转化为最优的地理信息位置,具体实现方法为:根据词槽匹配结果提取点信息,包括起点、终点、途经点等;利用单点检索方式获取每个位置点的具体坐标信息;利用路线规划,计算各个位置点的坐标与其他位置点的坐标点之间的距离、该位置点的坐标与表示其他位置点的逆向位置的坐标点之间的距离、表示该位置点的逆向位置的坐标点与其他位置点的坐标点之间的距离、表示该位置点的逆向位置的坐标点与表示其他位置点的逆向位置的坐标点之间的距离,选取上述距离中最短的路径作为线状位置信息的最终匹配结果。
常用的基于线状场景的地理信息语义匹配模板如下所示:
起点+途经点+终点:user_start+user_passby+user_arrival
起点+终点:user_start+user_arrival
应当理解,上述对应于线状地理场景的模板仅仅是示例的,其并不限制于此。
根据一些实施例,根据匹配到的地理语义模板所对应的地理场景以及与模板匹配的词槽实现与该词槽相对应的地理位置的定位包括:响应于地理场景为面状地理场景,根据与模板相匹配的表示点状位置的词槽定位该点状位置的坐标点;以及根据与模板相匹配的表示范围的词槽并基于该点状位置的坐标点实现与该词槽相对应的面状地理位置的定位。
根据一些实施例,基于面状的位置信息描述如图4所示,利用单点位置检索结合空间范围描述实现面位置的定位,常用的基于面状场景的地理信息语义匹配模板如下所示:
点匹配模板+范围:<点匹配模板>+user_range
应当理解,上述对应于面状地理场景的模板仅仅是示例的,其并不限制于此。
根据一些实施例,事件类型识别的常用事件信息语义模板可以如下所示:事件类型、事件状态、事件导致的现象相结合。
事件类型+事件状态+现象:user_event_type+user_event_status+user_traffic_status
事件类型+事件状态:user_event_type+user_event_status
应当理解,上述事件信息语义模板仅仅是示例的,其并不限制于此。
根据一些实施例,还包括:根据输出的坐标信息和词槽内容在相应的地理信息系统中进行位置定位和事件描述。
根据一些实施例,根据识别出的地理位置信息,以3种不同的形式(点状、线状和面状)在已有的地理信息系统中进行绘制和定位;进一步结合识别出的事件信息,针对各种使用场景(交通事件上报、110警情追踪、急救车呼叫等),关联已有的业务系统进行自动的数据录入。例如,在交通事件上报的场景中,在交通地理信息系统中进行位置定位,并描述事件信息,例如在定位后输出事件信息描述如下所示:
事件类型:交通设施损坏
事件状态:发生
本公开摒弃了传统的依赖人工录入位置信息的工作方式,通过例如语音识别的方式直接将用户想表达的信息在地理信息系统中进行标识与展示,极大的提高了相关工作的时效性与准确性。具体地,通过针对地理信息词表和事件信息词表的处理,增强了NLP处理与语义分析的准确性;通过建立自动文本解析与不同场景的分析与映射,提高了信息识别与录入的时效性。
根据本公开的另一方面,如图5所示,还提供一种基于地理信息的信息识别与录入设备,包括:文本获取单元510,被配置为获取输入的包含地理信息和事件信息的文本;词槽提取单元520,被配置为提取所述文本中的分别标识所述地理信息和事件信息的词槽并标记所述词槽的名称;匹配单元530,被配置为根据所述词槽的名称匹配相应的语义模板,其中所述语义模板包括地理信息语义模板和事件信息语义模板;以及信息处理单元540,被配置为根据匹配到的地理信息语义模板以及匹配的词槽实现地理位置定位以输出所述地理位置的坐标信息,并输出匹配到的事件信息语义模板中的词槽内容。
这里,信息识别与录入设备500的上述各单元510~540的操作分别与前面描述的步骤110~140的操作类似,在此不再赘述。
根据本公开的另一方面,还提供一种电子设备,可以包括:处理器;以及存储程序的存储器,所述程序包括指令,所述指令在由所述处理器执行时使所述处理器执行根据上述的基于地理信息的信息识别与录入方法。
根据本公开的另一方面,还提供一种存储程序的计算机可读存储介质,所述程序包括指令,所述指令在由电子设备的处理器执行时,致使所述电子设备执行根据上述的基于地理信息的信息识别与录入方法。
参见图6所示,现将描述计算设备2000,其是可以应用于本公开的各方面的硬件设备(电子设备)的示例。计算设备2000可以是被配置为执行处理和/或计算的任何机器,可以是但不限于工作站、服务器、台式计算机、膝上型计算机、平板计算机、个人数字助理、机器人、智能电话、车载计算机或其任何组合。上述基于地理信息的信息识别与录入方法可以全部或至少部分地由计算设备2000或类似设备或系统实现。
计算设备2000可以包括(可能经由一个或多个接口)与总线2002连接或与总线2002通信的元件。例如,计算设备2000可以包括总线2002、一个或多个处理器2004、一个或多个输入设备2006以及一个或多个输出设备2008。一个或多个处理器2004可以是任何类型的处理器,并且可以包括但不限于一个或多个通用处理器和/或一个或多个专用处理器(例如特殊处理芯片)。输入设备2006可以是能向计算设备2000输入信息的任何类型的设备,并且可以包括但不限于鼠标、键盘、触摸屏、麦克风和/或遥控器。输出设备2008可以是能呈现信息的任何类型的设备,并且可以包括但不限于显示器、扬声器、视频/音频输出终端、振动器和/或打印机。计算设备2000还可以包括非暂时性存储设备2010或者与非暂时性存储设备2010连接,非暂时性存储设备可以是非暂时性的并且可以实现数据存储的任何存储设备,并且可以包括但不限于磁盘驱动器、光学存储设备、固态存储器、软盘、柔性盘、硬盘、磁带或任何其他磁介质,光盘或任何其他光学介质、ROM(只读存储器)、RAM(随机存取存储器)、高速缓冲存储器和/或任何其他存储器芯片或盒、和/或计算机可从其读取数据、指令和/或代码的任何其他介质。非暂时性存储设备2010可以从接口拆卸。非暂时性存储设备2010可以具有用于实现上述方法和步骤的数据/程序(包括指令)/代码。计算设备2000还可以包括通信设备2012。通信设备2012可以是使得能够与外部设备和/或与网络通信的任何类型的设备或系统,并且可以包括但不限于调制解调器、网卡、红外通信设备、无线通信设备和/或芯片组,例如蓝牙TM设备、1302.11设备、WiFi设备、WiMax设备、蜂窝通信设备和/或类似物。
计算设备2000还可以包括工作存储器2014,其可以是可以存储对处理器2004的工作有用的程序(包括指令)和/或数据的任何类型的工作存储器,并且可以包括但不限于随机存取存储器和/或只读存储器设备。
软件要素(程序)可以位于工作存储器2014中,包括但不限于操作系统2016、一个或多个应用程序2018、驱动程序和/或其他数据和代码。用于执行上述方法和步骤的指令可以被包括在一个或多个应用程序2018中,并且上述基于地理信息的信息识别与录入方法可以通过由处理器2004读取和执行一个或多个应用程序2018的指令来实现。更具体地,上述基于地理信息的信息识别与录入方法中,步骤110~步骤140可以例如通过处理器2004执行具有步骤110~步骤140的指令的应用程序2018而实现。此外,上述基于地理信息的信息识别与录入方法中的其它步骤可以例如通过处理器2004执行具有执行相应步骤中的指令的应用程序2018而实现。软件要素(程序)的指令的可执行代码或源代码可以存储在非暂时性计算机可读存储介质(例如上述存储设备2010)中,并且在执行时可以被存入工作存储器2014中(可能被编译和/或安装)。软件要素(程序)的指令的可执行代码或源代码也可以从远程位置下载。
还应该理解,可以根据具体要求而进行各种变型。例如,也可以使用定制硬件,和/或可以用硬件、软件、固件、中间件、微代码,硬件描述语言或其任何组合来实现特定元件。例如,所公开的方法和设备中的一些或全部可以通过使用根据本公开的逻辑和算法,用汇编语言或硬件编程语言(诸如VERILOG,VHDL,C++)对硬件(例如,包括现场可编程门阵列(FPGA)和/或可编程逻辑阵列(PLA)的可编程逻辑电路)进行编程来实现。
还应该理解,前述方法可以通过服务器-客户端模式来实现。例如,客户端可以接收用户输入的数据并将所述数据发送到服务器。客户端也可以接收用户输入的数据,进行前述方法中的一部分处理,并将处理所得到的数据发送到服务器。服务器可以接收来自客户端的数据,并且执行前述方法或前述方法中的另一部分,并将执行结果返回给客户端。客户端可以从服务器接收到方法的执行结果,并例如可以通过输出设备呈现给用户。
还应该理解,计算设备2000的组件可以分布在网络上。例如,可以使用一个处理器执行一些处理,而同时可以由远离该一个处理器的另一个处理器执行其他处理。计算系统2000的其他组件也可以类似地分布。这样,计算设备2000可以被解释为在多个位置执行处理的分布式计算系统。
虽然已经参照附图描述了本公开的实施例或示例,但应理解,上述的方法、系统和设备仅仅是示例性的实施例或示例,本发明的范围并不由这些实施例或示例限制,而是仅由授权后的权利要求书及其等同范围来限定。实施例或示例中的各种要素可以被省略或者可由其等同要素替代。此外,可以通过不同于本公开中描述的次序来执行各步骤。进一步地,可以以各种方式组合实施例或示例中的各种要素。重要的是随着技术的演进,在此描述的很多要素可以由本公开之后出现的等同要素进行替换。

Claims (14)

1.一种基于地理信息的信息识别与录入方法,包括:
获取输入的包含地理信息和事件信息的文本;
提取所述文本中的分别标识所述地理信息和事件信息的词槽并标记所述词槽的名称;
根据所述词槽的名称匹配相应的语义模板,其中所述语义模板包括地理信息语义模板和事件信息语义模板;以及
根据匹配到的地理信息语义模板以及匹配的词槽实现地理位置定位以输出所述地理位置的坐标信息,并输出匹配到的事件信息语义模板中的词槽内容。
2.如权利要求1所述的方法,获取输入的包含地理信息和事件信息的文本包括:
获取输入的包含地理信息和事件信息的语音;以及
通过语音文本转换算法将所述语音转换为对应的文本。
3.如权利要求1所述的方法,提取所述文本中的分别标识所述地理信息和事件信息的词槽并标记所述词槽的名称包括:对所述文本进行NLP分词解析,以识别出标识所述地理信息和事件信息的词槽。
4.如权利要求3所述的方法,其中,对所述文本进行NLP分词解析之前,还包括:
构建多个地理信息词表和事件词表,其中所有所述词表构成词典;
构建多个话术模板,所述话术模板包括一个或多个所述词槽名称;以及
根据所述词典和所述话术模板对NLP处理模块进行训练,以通过训练后的所述NLP处理模块对所述文本进行NLP分词解析。
5.如权利要求4所述的方法,所述地理信息词表包括下列的一个或多个:道路名称词表、POI名称词表、收费站名称词表、方向词表、桩号词表。
6.如权利要求4所述的方法,所述事件词表包括下列的一个或多个:事件类型词表、事件状态词表和拥堵状态词表。
7.如权利要求1所述的方法,根据匹配到的地理信息语义模板以及匹配的词槽实现地理位置定位以输出所述地理位置的坐标信息包括:
根据匹配到的地理语义模板所对应的地理场景以及与所述模板匹配的词槽实现与所述词槽相对应的地理位置的定位,其中所述地理场景是点状地理场景、线状地理场景以及面状地理场景中的一者。
8.如权利要求7所述的方法,根据匹配到的地理语义模板所对应的地理场景以及与所述模板匹配的词槽实现与所述词槽相对应的地理位置的定位包括:
响应于所述地理场景为点状地理场景,根据与所述模板相匹配的表示点状位置的词槽定位该点状位置的坐标点;以及
根据所述匹配的模板中的其他词槽对所述点状位置的坐标点进行校正。
9.如权利要求7所述的方法,根据匹配到的地理语义模板所对应的地理场景以及与所述模板匹配的词槽实现与所述词槽相对应的地理位置的定位包括:
响应于所述地理场景为线状地理场景,根据与所述模板相匹配的所有表示点状位置的词槽定位所有点状位置的坐标点;
获取与所述定位到的坐标点相对应的表示其逆向位置的坐标点;
计算所述点状位置的坐标点和表示其逆向位置的坐标点与其他点状位置的坐标点和表示其逆向位置的坐标点之间的距离;以及
选取各点状位置之间距离最短的路径,以实现与所述词槽相对应的线状地理位置的定位。
10.如权利要求7所述的方法,根据匹配到的地理语义模板所对应的地理场景以及与所述模板匹配的词槽实现与所述词槽相对应的地理位置的定位包括:
响应于所述地理场景为面状地理场景,根据与所述模板相匹配的表示点状位置的词槽定位所述点状位置的坐标点;以及
根据与所述模板相匹配的表示范围的词槽并基于所述点状位置的坐标点实现与所述词槽相对应的面状地理位置的定位。
11.如权利要求1所述的方法,还包括:
根据所述输出的坐标信息和词槽内容在相应的地理信息系统中进行位置定位和事件描述。
12.一种基于地理信息的信息识别与录入设备,包括:
文本获取单元,被配置为获取输入的包含地理信息和事件信息的文本;
词槽提取单元,被配置为提取所述文本中的分别标识所述地理信息和事件信息的词槽并标记所述词槽的名称;
匹配单元,被配置为根据所述词槽的名称匹配相应的语义模板,其中所述语义模板包括地理信息语义模板和事件信息语义模板;以及
信息处理单元,被配置为根据匹配到的地理信息语义模板以及匹配的词槽实现地理位置定位以输出所述地理位置的坐标信息,并输出匹配到的事件信息语义模板中的词槽内容。
13.一种电子设备,包括:
处理器;以及
存储程序的存储器,所述程序包括指令,所述指令在由所述处理器执行时使所述处理器执行根据权利要求1-11中任一项所述的构建方法。
14.一种存储程序的计算机可读存储介质,所述程序包括指令,所述指令在由电子设备的处理器执行时,致使所述电子设备执行根据权利要求1-11中任一项所述的构建方法。
CN202010623258.2A 2020-06-30 2020-06-30 地理信息的识别与录入方法及设备、电子设备和介质 Active CN111783454B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010623258.2A CN111783454B (zh) 2020-06-30 2020-06-30 地理信息的识别与录入方法及设备、电子设备和介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010623258.2A CN111783454B (zh) 2020-06-30 2020-06-30 地理信息的识别与录入方法及设备、电子设备和介质

Publications (2)

Publication Number Publication Date
CN111783454A true CN111783454A (zh) 2020-10-16
CN111783454B CN111783454B (zh) 2024-03-15

Family

ID=72760565

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010623258.2A Active CN111783454B (zh) 2020-06-30 2020-06-30 地理信息的识别与录入方法及设备、电子设备和介质

Country Status (1)

Country Link
CN (1) CN111783454B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112836146A (zh) * 2021-03-09 2021-05-25 威创集团股份有限公司 一种基于网络消息的地理空间坐标信息获取方法及装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150278298A1 (en) * 2012-11-06 2015-10-01 Nokia Corporation Apparatus and method for displaying image-based representations of geographical locations in an electronic text
US20170177715A1 (en) * 2015-12-21 2017-06-22 Adobe Systems Incorporated Natural Language System Question Classifier, Semantic Representations, and Logical Form Templates
CN106933807A (zh) * 2017-03-20 2017-07-07 北京光年无限科技有限公司 备忘录事件提醒方法及系统
CN109918673A (zh) * 2019-03-14 2019-06-21 湖北亿咖通科技有限公司 语义仲裁方法、装置、电子设备和计算机可读存储介质
CN110674314A (zh) * 2019-09-27 2020-01-10 北京百度网讯科技有限公司 语句识别方法及装置
CN110674259A (zh) * 2019-09-27 2020-01-10 北京百度网讯科技有限公司 意图理解方法和装置
CN110705267A (zh) * 2019-09-29 2020-01-17 百度在线网络技术(北京)有限公司 语义解析方法、装置及存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150278298A1 (en) * 2012-11-06 2015-10-01 Nokia Corporation Apparatus and method for displaying image-based representations of geographical locations in an electronic text
US20170177715A1 (en) * 2015-12-21 2017-06-22 Adobe Systems Incorporated Natural Language System Question Classifier, Semantic Representations, and Logical Form Templates
CN106933807A (zh) * 2017-03-20 2017-07-07 北京光年无限科技有限公司 备忘录事件提醒方法及系统
CN109918673A (zh) * 2019-03-14 2019-06-21 湖北亿咖通科技有限公司 语义仲裁方法、装置、电子设备和计算机可读存储介质
CN110674314A (zh) * 2019-09-27 2020-01-10 北京百度网讯科技有限公司 语句识别方法及装置
CN110674259A (zh) * 2019-09-27 2020-01-10 北京百度网讯科技有限公司 意图理解方法和装置
CN110705267A (zh) * 2019-09-29 2020-01-17 百度在线网络技术(北京)有限公司 语义解析方法、装置及存储介质

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
ANDREAS BILDSTEIN等: "Combining Channel Theory and Semantic Web Technology to build up a Production Capability Matching Framework", 《PROCEDIA CIRP》 *
杨继文;樊红;李怀远;: "利用地名语义实现Web地震事件空间信息提取", 测绘地理信息, no. 06 *
陈通;: "基于语义模板的地震应急态势图自动标绘技术", 中国科技信息, no. 18 *
黄际洲等: "面向搜索引擎的实体推荐综述", 《计算机学报》, vol. 42, no. 7 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112836146A (zh) * 2021-03-09 2021-05-25 威创集团股份有限公司 一种基于网络消息的地理空间坐标信息获取方法及装置
CN112836146B (zh) * 2021-03-09 2024-05-14 威创集团股份有限公司 一种基于网络消息的地理空间坐标信息获取方法及装置

Also Published As

Publication number Publication date
CN111783454B (zh) 2024-03-15

Similar Documents

Publication Publication Date Title
CN110008300B (zh) Poi别名的确定方法、装置、计算机设备和存储介质
US20100299138A1 (en) Apparatus and method for language expression using context and intent awareness
EP1087207B1 (en) A point retrieval output system by a telephone number, and a memory medium
JP7042240B2 (ja) ナビゲーション方法、ナビゲーション装置、機器及び媒体
GB2522733A (en) User content analysis
CN105677793A (zh) 地点数据库的建立和候选乘车地点的推荐方法及装置
JPWO2005066882A1 (ja) 文字認識装置、移動通信システム、移動端末装置、固定局装置、文字認識方法および文字認識プログラム
DE102007029547A1 (de) Routenplanungssystem und entsprechende Triggerverfahren
CN101079262A (zh) 导航终端的目的地设置方法及设备
US20080051991A1 (en) Route planning systems and trigger methods thereof
JP4950508B2 (ja) 施設情報管理システム、施設情報管理装置、施設情報管理方法および施設情報管理プログラム
CN111292752A (zh) 一种用户意图识别方法、装置、电子设备及存储介质
US20120130704A1 (en) Real-time translation method for mobile device
CN110019617B (zh) 地址标识的确定方法和装置、存储介质、电子装置
US7020612B2 (en) Facility retrieval apparatus and method
CN111210036A (zh) 一种确定推荐上车点的方法和系统
CN106595686A (zh) 一种车载导航系统、方法、车载设备及车辆
CN108304411B (zh) 地理位置语句的语义识别方法和装置
CN112699318A (zh) 一种快速搜索停车场的人机交互系统和方法
CN111783454B (zh) 地理信息的识别与录入方法及设备、电子设备和介质
CN114118582A (zh) 目的地预测方法、装置、电子终端及存储介质
KR101786826B1 (ko) 음성 인식 기반 경로 안내 서비스 제공 장치 및 방법
US20210302190A1 (en) Information provision system, information provision device, and computer program
JP2017073115A (ja) 路線図表示システム、路線図表示方法、コンピュータプログラム
CN115103314A (zh) 基于定位系统的救援方法、设备、存储介质及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant