CN111291150A - 一种待搜索信息的确定方法、确定装置及可读存储介质 - Google Patents

一种待搜索信息的确定方法、确定装置及可读存储介质 Download PDF

Info

Publication number
CN111291150A
CN111291150A CN202010157007.XA CN202010157007A CN111291150A CN 111291150 A CN111291150 A CN 111291150A CN 202010157007 A CN202010157007 A CN 202010157007A CN 111291150 A CN111291150 A CN 111291150A
Authority
CN
China
Prior art keywords
alarm
field
data
target
searched
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010157007.XA
Other languages
English (en)
Other versions
CN111291150B (zh
Inventor
张�杰
周芳伊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Zhizhi Heshu Technology Co ltd
Original Assignee
Beijing Mininglamp Software System Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Mininglamp Software System Co ltd filed Critical Beijing Mininglamp Software System Co ltd
Priority to CN202010157007.XA priority Critical patent/CN111291150B/zh
Publication of CN111291150A publication Critical patent/CN111291150A/zh
Application granted granted Critical
Publication of CN111291150B publication Critical patent/CN111291150B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/313Selection or weighting of terms for indexing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3334Selection or weighting of terms from queries, including natural language queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Telephonic Communication Services (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供了一种待搜索信息的确定方法、确定装置及可读存储介质,其中,所述确定方法包括:获取数据库中的多条警情数据,以及每一条警情数据对应的警情编号和事件信息;针对每一条警情数据,根据预设的待提取字段的特征,从该警情数据的事件信息中提取出符合待提取字段的特征的至少一个目标字段;将至少一个目标字段与该警情数据的警情编号进行合并,得到以警情编号作为标识的该警情数据的待搜索信息。这样,能够根据警情编号确定出与警情编号对应的目标字段及事件信息,可以避免遗漏目标字段,有助于提高后续对警情数据的处理效率。

Description

一种待搜索信息的确定方法、确定装置及可读存储介质
技术领域
本申请涉及文本挖掘技术领域,尤其是涉及一种待搜索信息的确定方法、确定装置及可读存储介质。
背景技术
随着网络时代的到来,用户能够以多种形式获取各类文本信息,构成了一个异常庞大的具有异构性、开放性特点的分布式数据库,而这个数据库中存放的是非结构化的文本数据,给信息的提取带来了困难。文本挖掘技术是利用计算机处理技术从文本数据中抽取有价值的信息,通过文本挖掘可以将文本信息转化为便于处理的构型,有助于后续对文本信息的快速分析处理。
以警情数据为例,警情信息通常是由各地负责接警、处警的警务人员录入,虽然有基本的录入要求,每条警情数据包括时间、地点、事件、人物等关键信息,但由于每个人录入信息的习惯不同,警情数据的结构多样,并且每条警情信息中可能包含不止一个关键字段,导致无法获取关键字段或遗漏关键字段,影响后续对警情信息的处理效果。
发明内容
有鉴于此,本申请的目的在于提供一种待搜索信息的确定方法、确定装置及可读存储介质,通过获取每条警情数据的目标字段,并与警情编号进行合并,得到待搜索信息,这样,能够根据警情编号确定出与警情编号对应的目标字段及事件信息,可以避免遗漏目标字段,有助于提高后续对警情数据的处理效率。
第一方面,本申请实施例提供了一种待搜索信息的确定方法,所述确定方法包括:
获取数据库中的多条警情数据,以及每一条警情数据对应的警情编号和事件信息;
针对每一条警情数据,根据预设的待提取字段的特征,从该警情数据的事件信息中提取出符合所述待提取字段的特征的至少一个目标字段;
将所述至少一个目标字段与该警情数据的警情编号进行合并,得到以所述警情编号作为标识的该警情数据的待搜索信息。
结合第一方面,本申请实施例提供了第一方面的第一种可能的实施方式,其中,所述待提取字段包括多个关键字、多个关键词和人员身份标识中的一个或者多个。
结合第一方面的第一种可能的实施方式,本申请实施例提供了第一方面的第二种可能的实施方式,其中,当所述待提取字段包括多个关键词时,所述针对每一条警情数据,根据预设的待提取字段的特征,从该警情数据的事件信息中提取出符合所述待提取字段的特征的至少一个目标字段,包括:
获取该警情数据的事件信息,以及预设的多个关键词;
将所述事件信息与预设的多个关键词中的每一个关键词进行匹配,针对每一个关键词,判断所述事件信息是否包括该关键词,在所述事件信息包括该关键词的情况下,将该关键词确定为该警情数据的目标字段。
结合第一方面的第一种可能的实施方式,本申请实施例提供了第一方面的第三种可能的实施方式,其中,当所述待提取字段包括人员身份标识时,所述针对每一条警情数据,根据预设的待提取字段的特征,从该警情数据的事件信息中提取出符合所述待提取字段的特征的至少一个目标字段,包括:
获取该警情数据的事件信息,以及预设的人员身份标识;
根据所述人员身份标识,确定出所述人员身份标识的特征;
将所述事件信息中符合所述特征的字段,确定为该警情数据的目标字段。
结合第一方面的第三种可能的实施方式,本申请实施例提供了第一方面的第四种可能的实施方式,其中,所述人员身份标识的特征包括人员身份标识中连续数字的个数,以及用于表示人员身份标识的标志性字符。
结合第一方面,本申请实施例提供了第一方面的第五种可能的实施方式,其中,所述确定方法还包括:
当待搜索信息的目标字段的数目超过预设阈值时,对目标字段进行拆分,并与该警情数据的警情编号进行合并存储。
结合第一方面,本申请实施例提供了第一方面的第六种可能的实施方式,其中,所述确定方法还包括:
获取用户输入的搜索字段;
当所述搜索字段为所述待搜索信息中的任一目标字段时,确定与所述搜索字段相关联的目标警情编号;
向所述用户发送所述目标警情编号对应的事件信息,以及与所述目标警情编号相关联的待搜索信息中除所述搜索字段之外的其它目标字段。
第二方面,本申请实施例提供了一种待搜索信息的确定装置,所述确定装置包括:
获取模块,用于获取数据库中的多条警情数据,以及每一条警情数据对应的警情编号和事件信息;
提取模块,用于针对每一条警情数据,根据预设的待提取字段的特征,从该警情数据的事件信息中提取出符合所述待提取字段的特征的至少一个目标字段;
合并模块,用于将所述至少一个目标字段与该警情数据的警情编号进行合并,得到以所述警情编号作为标识的该警情数据的待搜索信息,其中,所述待搜索信息包括至少一个目标字段。
结合第二方面,本申请实施例提供了第二方面的第一种可能的实施方式,其中,所述待提取字段包括多个关键字、多个关键词和人员身份标识中的一个或者多个。
结合第二方面的第一种可能的实施方式,本申请实施例提供了第二方面的第二种可能的实施方式,其中,当所述待提取字段包括多个关键词时,所述提取模块包括:
第一获取单元,用于获取该警情数据的事件信息,以及预设的多个关键词;
匹配单元,用于将所述事件信息与预设的多个关键词中的每一个关键词进行匹配,针对每一个关键词,判断所述事件信息是否包括该关键词,在所述事件信息包括该关键词的情况下,将该关键词确定为该警情数据的目标字段。
结合第二方面的第一种可能的实施方式,本申请实施例提供了第二方面的第三种可能的实施方式,其中,当所述待提取字段包括人员身份标识时,所述提取模块包括:
第二获取单元,用于获取该警情数据的事件信息,以及预设的人员身份标识;
第一确定单元,用于根据所述人员身份标识,确定出所述人员身份标识的特征;
第二确定单元,用于将所述事件信息中符合所述特征的字段,确定为该警情数据的目标字段。
结合第二方面的第三种可能的实施方式,本申请实施例提供了第二方面的第四种可能的实施方式,其中,所述人员身份标识的特征包括人员身份标识中连续数字的个数,以及用于表示人员身份标识的标志性字符。
结合第二方面,本申请实施例提供了第二方面的第五种可能的实施方式,其中,所述确定装置还包括:
拆分模块,用于当待搜索信息的目标字段的数目超过预设阈值时,对目标字段进行拆分,并与该警情数据的警情编号进行合并存储。
结合第二方面,本申请实施例提供了第二方面的第六种可能的实施方式,其中,所述确定装置还包括:
字段获取模块,用于获取用户输入的搜索字段;
确定模块,用于当所述搜索字段为所述待搜索信息中的任一目标字段时,确定与所述搜索字段相关联的目标警情编号;
发送模块,用于向所述用户发送所述目标警情编号对应的事件信息,以及与所述目标警情编号相关联的待搜索信息中除所述搜索字段之外的其它目标字段。
第三方面,本申请实施例提供了一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如上述的一种待搜索信息的确定的步骤。
第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如上述的一种待搜索信息的确定方法的步骤。
本申请实施例提供的一种待搜索信息的确定方法、确定装置及可读存储介质,获取数据库中的多条警情数据,以及每一条警情数据对应的警情编号和事件信息;针对每一条警情数据,根据预设的待提取字段的特征,从该警情数据的事件信息中提取出符合所述待提取字段的特征的至少一个目标字段;将所述至少一个目标字段与该警情数据的警情编号进行合并,得到以所述警情编号作为标识的该警情数据的待搜索信息。
这样,从每条警情数据中提取出符合预设的待提取字段的特征的目标字段,并将目标字段与警情编号进行合并,得到以警情编号作为标识的待搜索信息,这样,能够根据警情编号确定出与警情编号对应的目标字段及事件信息,可以避免遗漏目标字段,有助于提高后续对警情数据的处理效率。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了一种可能的应用场景下的系统结构图;
图2示出了本申请实施例所提供的一种待搜索信息的确定方法的流程图;
图3示出了本申请另一实施例所提供的一种待搜索信息的确定方法的流程图;
图4示出了本申请另一实施例所提供的一种待搜索信息的确定方法的流程图;
图5示出了本申请实施例所提供的一种待搜索信息的确定装置的结构示意图之一;
图6示出了本申请实施例所提供的一种待搜索信息的确定装置的结构示意图之二;
图7示出了本申请实施例所提供的一种电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的每个其他实施例,都属于本申请保护的范围。
首先,对本申请可适用的应用场景进行介绍。本申请可应用于文本挖掘技术领域,根据预设的待提取字段的特征,从数据库中的每一条警情数据中提取至少一个目标字段,并将至少一个目标字段与警情编号进行合并,得到以警情编号作为标识的待搜索信息,这样,能够根据警情编号确定出与警情编号对应的目标字段及事件信息,可以避免遗漏目标字段,有助于提高后续对警情数据的处理效率。请参阅图1,图1示出了一种可能的应用场景下的系统结构图,如图1中所示,所述系统包括数据库和确定装置,所述数据库中存储有多条警情数据,每条警情数据对应有警情编号和事件信息,所述确定装置在获取到多条警情数据后,将每一条警情数据的事件信息中符合预设的待提取字段的特征的目标字段提取出来,并与警情数据对应的警情编号进行合并,得到以警情编号作为标识的待搜索信息。
经研究发现,现阶段,接处警平台所存储的警情数据通常采用人工录入的方式,文本长度一般在几十到几百个字符。对于每条警情数据,虽然有基本的录入内容要求,如包括时间、地点、姓名、身份证号、基本情况描述等内容,但由于每个警务人员录入的用语、习惯、风格各异,导致警情信息的结构多样,加之,数据量巨大,且每条警情信息中可能包括任意多个关键字段,导致无法获取每条警情数据中的全部关键字段,影响后续对警情信息的处理效果。
基于此,本申请实施例提供了一种待搜索信息的确定方法,根据预设的待提取字段的特征,从每条警情数据中提取目标字段,并将目标字段与警情编号合并,得到以警情编号作为标识的待搜索信息,这样,能够根据警情编号确定出与警情编号对应的目标字段及事件信息,可以避免遗漏目标字段,有助于提高后续对警情数据的处理效率。
请参阅图2,图2示出了本申请实施例所提供的一种待搜索信息的确定方法的流程图。如图2中所示,本申请实施例提供的确定方法,包括:
步骤201,获取数据库中的多条警情数据,以及每一条警情数据对应的警情编号和事件信息。
本申请实施例中,获取数据库中由各地负责接警、处警的警务人员录入的多条警情数据,例如,J001、李某(手机号为12345678900)和赵某(手机号为12345678901)于2020年1月3日在街头打架,并扬言杀人,已被警方给予警告处分;J002、2020年1月3日晚,某居民楼发生大火,经查证,涉案人员为李某(手机号为12345678900);S001、网络诈骗,涉案人员为李某,网络账号li123,其中的为警情编号,每条警情数据对应唯一的警情编号,每条警情数据包括用于描述警情的事件信息。
步骤202,针对每一条警情数据,根据预设的待提取字段的特征,从该警情数据的事件信息中提取出符合所述待提取字段的特征的至少一个目标字段。
本申请实施例中,首先获取待提取字段,然后根据待提取字段的特征,从每条警情数据的事件信息中提取符合特征的目标字段。需要说明的是,每条警情数据的事件信息可能包括任意多个目标字段,每条警情数据对应的文本信息中的字段只要符合待提取字段的特征,就将符合预设特征的字段确定为目标字段,并从文本信息中提取出目标字段。
本申请实施例中,作为一可选实施例,待提取字段包括多个关键字、多个关键词和人员身份标识中的一个或者多个。
本申请实施例中,待提取字段可以是多个关键字,例如,杀、骗、偷等,可以是多个关键词,例如,扬言、放火、诈骗等,可以是人员身份标识,例如,登录账号、手机号、身份证号等,也可以同时包括关键字、关键词和人员身份标识中的一个或者多个。
本申请实施例中,作为一可选实施例,当所述待提取字段包括多个关键词时,所述针对每一条警情数据,根据预设的待提取字段的特征,从该警情数据的事件信息中提取出符合所述待提取字段的特征的至少一个目标字段,包括:
A211,获取该警情数据的事件信息,以及预设的多个关键词。
本申请实施例中,获取警情数据的事件信息和预先设定的关键词,例如,警情数据:J001、李某(手机号为12345678900)和赵某(手机号为12345678901)于2020年1月3日在街头打架,并扬言杀人,已被警方给予警告处分,预先设定的关键词为打架、扬言和诈骗。
A212,将所述事件信息与预设的多个关键词中的每一个关键词进行匹配,针对每一个关键词,判断所述事件信息是否包括该关键词,在所述事件信息包括该关键词的情况下,将该关键词确定为该警情数据的目标字段。
本申请实施例中,将事件信息与预先设定的关键词中的每一个关键词进行匹配,若事件信息中包括预先设定的关键词,则将关键词提取出来,并将提取出的关键词确定为事件信息的目标字段,例如,对于J001这条警情数据而言,预设的多个关键词为打架、扬言和诈骗,该条警情数据的事件信息中包括“打架”和“扬言”,则将“打架”和“扬言”作为J001这条警情数据的目标字段。
本申请实施例中,作为一可选实施例,当所述待提取字段包括人员身份标识时,所述针对每一条警情数据,根据预设的待提取字段的特征,从该警情数据的事件信息中提取出符合所述待提取字段的特征的至少一个目标字段,包括:
A221,获取该警情数据的事件信息,以及预设的人员身份标识。
本申请实施例中,获取待处理的警情数据,从警情数据对应的事件信息进行识别,以及预设的人员身份标识。
A222,根据所述人员身份标识,确定出所述人员身份标识的特征。
本申请实施例中,根据待提取的人员身份标识,确定出人员身份标识的特征,以J001这条警情数据为例,当待提取的人员身份标识为手机号时,手机号由11位数字组成,人员身份标识的特征则是连续11位的数字。
A223,将所述事件信息中符合所述特征的字段,确定为该警情数据的目标字段。
本申请实施例中,根据待提取的人员身份标识的特征,从获取的事件信息中提取出人员身份标识,例如,从J001这条警情数据的事件中提取连续11位数字的字段,这样,可以提取出“12345678900”和“12345678900”两个目标字段。
本申请实施例中,作为一可选实施例,人员身份标识的特征包括人员身份标识中连续数字的个数,以及用于表示人员身份标识的标志性字符。
本申请实施例中,人员身份标识的特征可以时连续数字的个数,也可以是用于表示人员身份标识的标志性字符,例如,身份证号可以由连续的18位数字组成,也可以由17位数字和标志性字符“X”组成;邮箱的标志性字符“@”等。
步骤203,将所述至少一个目标字段与该警情数据的警情编号进行合并,得到以所述警情编号作为标识的该警情数据的待搜索信息。
本申请实施例中,将提取出的至少一个目标字段与警情编号进行合并,例如,预设的待提取字段为打架、扬言、放火、诈骗,手机号,分别从警情编号为J001、J002和S001的警情数据中提取出关键字段,J001对应的关键字段为“12345678900”、“12345678901”、“打架”、“扬言”;J002对应的关键字段为“12345678900”;S001对应的关键字段为“诈骗”。将提取出的目标字段与对应的警情编号进行合并,得到(J001,打架,扬言,12345678900,12345678901)、(J002,12345678900)和(S001,诈骗)。
需要说明的是,对于J002这条警情数据对应的事件信息为“发生大火,涉案人员为李某”,由于录入习惯,事件信息不包括预先设定的“放火”,此时,可以预设与“放火”表示相同含义的关键词,例如,“大火”,也可以预设关键字“火”,这样,当事件信息中包括“引发火灾”、“发生大火”等时,可以从中提取出关键字“火”,便可以将警情数据所描述的事件确定为与“放火”有关。
本申请实施例提供的一种待搜索信息的确定方法,获取数据库中的多条警情数据,以及每一条警情数据对应的警情编号和事件信息;针对每一条警情数据,根据预设的待提取字段的特征,从该警情数据的事件信息中提取出符合所述待提取字段的特征的至少一个目标字段;将所述至少一个目标字段与该警情数据的警情编号进行合并,得到以所述警情编号作为标识的该警情数据的待搜索信息。
这样,从每条警情数据中提取出符合预设的待提取字段的特征的目标字段,并将目标字段与警情编号进行合并,得到以警情编号作为标识的待搜索信息,这样,能够根据警情编号确定出与警情编号对应的目标字段及事件信息,可以避免遗漏目标字段,有助于提高后续对警情数据的处理效率。
请参阅图3,图3示出了本申请另一实施例所提供的一种待搜索信息的确定方法的流程图。如图3中所示,本申请实施例提供的确定方法,包括:
步骤301,获取数据库中的多条警情数据,以及每一条警情数据对应的警情编号和事件信息。
步骤302,针对每一条警情数据,根据预设的待提取字段的特征,从该警情数据的事件信息中提取出符合所述待提取字段的特征的至少一个目标字段。
步骤303,将所述至少一个目标字段与该警情数据的警情编号进行合并,得到以所述警情编号作为标识的该警情数据的待搜索信息。
其中,步骤301至步骤303的描述可以参照步骤201至步骤203的描述,并且能达到相同的技术效果,对此不做赘述。
步骤304,当待搜索信息的目标字段的数目超过预设阈值时,对目标字段进行拆分,并与该警情数据的警情编号进行合并存储。
本申请实施例中,当提取出的待搜索信息的目标字段的数目超过预设阈值时,可以对目标字段进行拆分,然后与警情编号进行合并存储。通常情况下,将警情数据的人员特征标识与关键词或关键字进行拆分,并分别与警情编号进行合并存储,例如,对于J001这条警情数据而言,得到(J001,打架,扬言)和(J001,12345678900,12345678901),为了对非管控人员的行为预测或对管控人员的行为预警,当从一条警情数据中提取出两个或多个人员身份标识时,通常对人员身份标识进行拆分,并分别与警情编号进行合并存储,例如,(J001,12345678900)和(J001,12345678901)。
这样,当查询12345678901时,可以获取警情编号J001,关键字段“打架”,“扬言”,以及事件信息。
本申请实施例提供的一种待搜索信息的确定方法,获取数据库中的多条警情数据,以及每一条警情数据对应的警情编号和事件信息;针对每一条警情数据,根据预设的待提取字段的特征,从该警情数据的事件信息中提取出符合所述待提取字段的特征的至少一个目标字段;将所述至少一个目标字段与该警情数据的警情编号进行合并,得到以所述警情编号作为标识的该警情数据的待搜索信息;当待搜索信息的目标字段的数目超过预设阈值时,对目标字段进行拆分,并与该警情数据的警情编号进行合并存储。
这样,从每条警情数据中提取出符合预设的待提取字段的特征的目标字段,并将目标字段与警情编号进行合并,得到以警情编号作为标识的待搜索信息,进而,用户在对待搜索信息进行搜索时,可以根据警情编号获取到与待搜索信息对应的其它目标字段及事件信息,避免遗漏目标字段,有助于提高后续对警情数据的处理效率。进一步的,通过对目标字段进行拆分,并分别与警情编号进行合并存储,有助于提高警情数据的可读性。
请参阅图4,图4示出了本申请实施例所提供的一种待搜索信息的确定方法的流程图。如图4中所示,本申请实施例提供的确定方法,包括:
步骤401,获取数据库中的多条警情数据,以及每一条警情数据对应的警情编号和事件信息。
步骤402,针对每一条警情数据,根据预设的待提取字段的特征,从该警情数据的事件信息中提取出符合所述待提取字段的特征的至少一个目标字段。
步骤403,将所述至少一个目标字段与该警情数据的警情编号进行合并,得到以所述警情编号作为标识的该警情数据的待搜索信息。
其中,步骤401至步骤403的描述可以参照步骤201至步骤203的描述,并且能达到相同的技术效果,对此不做赘述。
步骤404,获取用户输入的搜索字段。
本申请实施例中,接收用户的搜索请求,从搜索请求中识别出用户输入的搜索字段。
步骤405,当所述搜索字段为所述待搜索信息中的任一目标字段时,确定与所述搜索字段相关联的目标警情编号;
本申请实施例中,当搜索字段为待搜索信息中的任一目标字段时,将于搜索字段相关联的目标警情编号筛选出来。
步骤406,向所述用户发送所述目标警情编号对应的事件信息,以及与所述目标警情编号相关联的待搜索信息中除所述搜索字段之外的其它目标字段。
本申请实施例中,将与目标警情编号关联的其它目标字段发送给用户,例如,当搜索字段为12345678900时,返回的目标字段为“打架”、“扬言”“火”、“12345678901”,以及J001、J002的事件信息。
本申请实施例提供的一种待搜索信息的确定方法,获取数据库中的多条警情数据,以及每一条警情数据对应的警情编号和事件信息;针对每一条警情数据,根据预设的待提取字段的特征,从该警情数据的事件信息中提取出符合所述待提取字段的特征的至少一个目标字段;将所述至少一个目标字段与该警情数据的警情编号进行合并,得到以所述警情编号作为标识的该警情数据的待搜索信息;获取用户输入的搜索字段;当所述搜索字段为所述待搜索信息中的任一目标字段时,确定与所述搜索字段相关联的目标警情编号;向所述用户发送所述目标警情编号对应的事件信息,以及与所述目标警情编号相关联的待搜索信息中除所述搜索字段之外的其它目标字段。
这样,从每条警情数据中提取出符合预设的待提取字段的特征的目标字段,并将目标字段与警情编号进行合并,得到以警情编号作为标识的待搜索信息,这样,能够根据警情编号确定出与警情编号对应的目标字段及事件信息,可以避免遗漏目标字段,有助于提高后续对警情数据的处理效率。进一步的,通过获取用户输入的搜索字段,并向用户返回与搜索字段具有相同警情编号的目标字段及事件信息,有助于提高信息获取效率。
请参阅图5和图6,图5示出了本申请实施例所提供的一种待搜索信息的确定装置的结构示意图之一,图6示出了本申请实施例所提供的一种待搜索信息的确定装置的结构示意图之二。如图5中所示,所述确定装置500包括:
获取模块510,用于获取数据库中的多条警情数据,以及每一条警情数据对应的警情编号和事件信息。
提取模块520,用于针对每一条警情数据,根据预设的待提取字段的特征,从该警情数据的事件信息中提取出符合所述待提取字段的特征的至少一个目标字段。
本申请实施例中,作为一可选实施例,所述待提取字段包括多个关键字、多个关键词和人员身份标识中的一个或者多个。
本申请实施例中,作为一可选实施例,当所述待提取字段包括多个关键词时,所述提取模块520包括:
第一获取单元,用于获取该警情数据的事件信息,以及预设的多个关键词;
匹配单元,用于将所述事件信息与预设的多个关键词中的每一个关键词进行匹配,针对每一个关键词,判断所述事件信息是否包括该关键词,在所述事件信息包括该关键词的情况下,将该关键词确定为该警情数据的目标字段。
本申请实施例中,作为一可选实施例,当所述待提取字段包括人员身份标识时,所述提取模块520包括:
第二获取单元,用于获取该警情数据的事件信息,以及预设的人员身份标识;
第一确定单元,用于根据所述人员身份标识,确定出所述人员身份标识的特征;
第二确定单元,用于将所述事件信息中符合所述特征的字段,确定为该警情数据的目标字段。
本申请实施例中,作为一可选实施例,所述人员身份标识的特征包括人员身份标识中连续数字的个数,以及用于表示人员身份标识的标志性字符。
合并模块530,用于将所述至少一个目标字段与该警情数据的警情编号进行合并,得到以所述警情编号作为标识的该警情数据的待搜索信息,其中,所述待搜索信息包括至少一个目标字段。
本申请实施例中,作为一可选实施例,如图6中所示,所述确定装置500还包括:
拆分模块540,用于当待搜索信息的目标字段的数目超过预设阈值时,对目标字段进行拆分,并与该警情数据的警情编号进行合并存储。
本申请实施例中,作为一可选实施例,所述确定装置500还包括:
字段获取模块550,用于获取用户输入的搜索字段。
确定模块560,用于当所述搜索字段为所述待搜索信息中的任一目标字段时,确定与所述搜索字段相关联的目标警情编号。
发送模块570,用于向所述用户发送所述目标警情编号对应的事件信息,以及与所述目标警情编号相关联的待搜索信息中除所述搜索字段之外的其它目标字段。
本申请实施例提供的一种待搜索信息的确定装置,获取数据库中的多条警情数据,以及每一条警情数据对应的警情编号和事件信息;针对每一条警情数据,根据预设的待提取字段的特征,从该警情数据的事件信息中提取出符合所述待提取字段的特征的至少一个目标字段;将所述至少一个目标字段与该警情数据的警情编号进行合并,得到以所述警情编号作为标识的该警情数据的待搜索信息。
这样,从每条警情数据中提取出符合预设的待提取字段的特征的目标字段,并将目标字段与警情编号进行合并,得到以警情编号作为标识的待搜索信息,这样,能够根据警情编号确定出与警情编号对应的目标字段及事件信息,可以避免遗漏目标字段,有助于提高后续对警情数据的处理效率。
请参阅图7,图7为本申请实施例所提供的一种电子设备的结构示意图。如图7中所示,所述电子设备700包括处理器710、存储器720和总线730。
所述存储器720存储有所述处理器710可执行的机器可读指令,当电子设备700运行时,所述处理器710与所述存储器720之间通过总线730通信,所述机器可读指令被所述处理器710执行时,可以执行如上述图2、图3以及图4所示方法实施例中的一种待搜索信息的确定方法的步骤,具体实现方式可参见方法实施例,在此不再赘述。
本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时可以执行如上述上述图2、图3以及图4所示方法实施例中的一种待搜索信息的确定方法的步骤,具体实现方式可参见方法实施例,在此不再赘述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种待搜索信息的确定方法,其特征在于,所述确定方法包括:
获取数据库中的多条警情数据,以及每一条警情数据对应的警情编号和事件信息;
针对每一条警情数据,根据预设的待提取字段的特征,从该警情数据的事件信息中提取出符合所述待提取字段的特征的至少一个目标字段;
将所述至少一个目标字段与该警情数据的警情编号进行合并,得到以所述警情编号作为标识的该警情数据的待搜索信息。
2.根据权利要求1所述的确定方法,其特征在于,所述待提取字段包括多个关键字、多个关键词和人员身份标识中的一个或者多个。
3.根据权利要求2所述的确定方法,其特征在于,当所述待提取字段包括多个关键词时,所述针对每一条警情数据,根据预设的待提取字段的特征,从该警情数据的事件信息中提取出符合所述待提取字段的特征的至少一个目标字段,包括:
获取该警情数据的事件信息,以及预设的多个关键词;
将所述事件信息与预设的多个关键词中的每一个关键词进行匹配,针对每一个关键词,判断所述事件信息是否包括该关键词,在所述事件信息包括该关键词的情况下,将该关键词确定为该警情数据的目标字段。
4.根据权利要求2所述的确定方法,其特征在于,当所述待提取字段包括人员身份标识时,所述针对每一条警情数据,根据预设的待提取字段的特征,从该警情数据的事件信息中提取出符合所述待提取字段的特征的至少一个目标字段,包括:
获取该警情数据的事件信息,以及预设的人员身份标识;
根据所述人员身份标识,确定出所述人员身份标识的特征;
将所述事件信息中符合所述特征的字段,确定为该警情数据的目标字段。
5.根据权利要求4所述的确定方法,其特征在于,所述人员身份标识的特征包括人员身份标识中连续数字的个数,以及用于表示人员身份标识的标志性字符。
6.根据权利要求1所述的确定方法,其特征在于,所述确定方法还包括:
当待搜索信息的目标字段的数目超过预设阈值时,对目标字段进行拆分,并与该警情数据的警情编号进行合并存储。
7.根据权利要求1所述的确定方法,其特征在于,所述确定方法还包括:
获取用户输入的搜索字段;
当所述搜索字段为所述待搜索信息中的任一目标字段时,确定与所述搜索字段相关联的目标警情编号;
向所述用户发送所述目标警情编号对应的事件信息,以及与所述目标警情编号相关联的待搜索信息中除所述搜索字段之外的其它目标字段。
8.一种待搜索信息的确定装置,其特征在于,所述确定装置包括:
获取模块,用于获取数据库中的多条警情数据,以及每一条警情数据对应的警情编号和事件信息;
提取模块,用于针对每一条警情数据,根据预设的待提取字段的特征,从该警情数据的事件信息中提取出符合所述待提取字段的特征的至少一个目标字段;
合并模块,用于将所述至少一个目标字段与该警情数据的警情编号进行合并,得到以所述警情编号作为标识的该警情数据的待搜索信息,其中,所述待搜索信息包括至少一个目标字段。
9.一种电子设备,其特征在于,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如权利要求1至7中任一项所述的一种待搜索信息的确定方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如权利要求1至7中任一项所述的一种待搜索信息的确定方法的步骤。
CN202010157007.XA 2020-03-09 2020-03-09 一种待搜索信息的确定方法、确定装置及可读存储介质 Active CN111291150B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010157007.XA CN111291150B (zh) 2020-03-09 2020-03-09 一种待搜索信息的确定方法、确定装置及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010157007.XA CN111291150B (zh) 2020-03-09 2020-03-09 一种待搜索信息的确定方法、确定装置及可读存储介质

Publications (2)

Publication Number Publication Date
CN111291150A true CN111291150A (zh) 2020-06-16
CN111291150B CN111291150B (zh) 2023-08-25

Family

ID=71030199

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010157007.XA Active CN111291150B (zh) 2020-03-09 2020-03-09 一种待搜索信息的确定方法、确定装置及可读存储介质

Country Status (1)

Country Link
CN (1) CN111291150B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113377898A (zh) * 2021-08-16 2021-09-10 南京东大智能化系统有限公司 一种基于海量离散数据的分析方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105302827A (zh) * 2014-06-30 2016-02-03 华为技术有限公司 一种事件的搜索方法和设备
US20160224643A1 (en) * 2015-01-30 2016-08-04 Splunk Inc. Extracting From Extracted Event Fields
CN109213831A (zh) * 2018-08-14 2019-01-15 阿里巴巴集团控股有限公司 事件检测方法和装置、计算设备及存储介质
CN110532292A (zh) * 2019-08-20 2019-12-03 深圳追一科技有限公司 警情串并方法、装置、设备及存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105302827A (zh) * 2014-06-30 2016-02-03 华为技术有限公司 一种事件的搜索方法和设备
US20160224643A1 (en) * 2015-01-30 2016-08-04 Splunk Inc. Extracting From Extracted Event Fields
CN109213831A (zh) * 2018-08-14 2019-01-15 阿里巴巴集团控股有限公司 事件检测方法和装置、计算设备及存储介质
CN110532292A (zh) * 2019-08-20 2019-12-03 深圳追一科技有限公司 警情串并方法、装置、设备及存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113377898A (zh) * 2021-08-16 2021-09-10 南京东大智能化系统有限公司 一种基于海量离散数据的分析方法

Also Published As

Publication number Publication date
CN111291150B (zh) 2023-08-25

Similar Documents

Publication Publication Date Title
KR100996311B1 (ko) 스팸 ucc를 감지하기 위한 방법 및 시스템
CN110099059B (zh) 一种域名识别方法、装置及存储介质
JP5990284B2 (ja) キャラクター・ヒストグラムを用いるスパム検出のシステムおよび方法
CN106713579B (zh) 一种电话号码识别方法及装置
CN108092963B (zh) 网页识别方法、装置、计算机设备及存储介质
CN106844685B (zh) 用于识别网站的方法、装置及服务器
CN108304426B (zh) 标识的获取方法及装置
CN108600172B (zh) 撞库攻击检测方法、装置、设备及计算机可读存储介质
CN111368619A (zh) 可疑人员的检测方法、装置及设备
CN111783138A (zh) 敏感数据检测方法、装置、计算机设备及存储介质
CN112804210A (zh) 数据关联方法、装置、电子设备和计算机可读存储介质
CN109896374B (zh) 电梯屏幕展示方法及系统
CN110688455A (zh) 基于人工智能过滤无效评论的方法、介质及计算机设备
CN111723293B (zh) 一种文章内容的推荐方法、装置、电子设备及存储介质
CN110557466A (zh) 一种数据处理方法、装置、电子设备及存储介质
CN110765760A (zh) 一种法律案件分配方法、装置、存储介质和服务器
CN111241402A (zh) 一种信息推送方法、装置、电子设备及可读存储介质
CN111291150A (zh) 一种待搜索信息的确定方法、确定装置及可读存储介质
CN113704569A (zh) 信息的处理方法、装置及电子设备
CN112818317A (zh) 一种浏览过程的监控方法、监控装置及可读存储介质
CN108334778B (zh) 病毒检测方法、装置、存储介质及处理器
CN107332856B (zh) 地址信息的检测方法、装置、存储介质和电子装置
CN110633915A (zh) 一种高危场所识别方法及装置
CN115766215A (zh) 一种异常流量检测方法及装置
CN112802482B (zh) 一种声纹串并的识别方法、单兵系统及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20210915

Address after: 100000 room 650, 6th floor, building 11, Huashan Garden Cultural Media Industrial Park, 1376 folk culture street, Gaobeidian village, Gaobeidian Township, Chaoyang District, Beijing

Applicant after: Beijing Zhizhi Heshu Technology Co.,Ltd.

Address before: A1002, 10th floor, building 1, yard 1, Zhongguancun East Road, Haidian District, Beijing

Applicant before: MININGLAMP SOFTWARE SYSTEMS Co.,Ltd.

GR01 Patent grant
GR01 Patent grant