CN111291171B - 一种危大工程风险数据搜索方法 - Google Patents

一种危大工程风险数据搜索方法 Download PDF

Info

Publication number
CN111291171B
CN111291171B CN202010072329.4A CN202010072329A CN111291171B CN 111291171 B CN111291171 B CN 111291171B CN 202010072329 A CN202010072329 A CN 202010072329A CN 111291171 B CN111291171 B CN 111291171B
Authority
CN
China
Prior art keywords
engineering
search
keywords
risk
dangerous
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010072329.4A
Other languages
English (en)
Other versions
CN111291171A (zh
Inventor
袁太平
汪飞
彭飞
万井洲
柯伟
洪巧章
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Energy Development Research Institute of China Southern Power Grid Co Ltd
Original Assignee
Energy Development Research Institute of China Southern Power Grid Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Energy Development Research Institute of China Southern Power Grid Co Ltd filed Critical Energy Development Research Institute of China Southern Power Grid Co Ltd
Priority to CN202010072329.4A priority Critical patent/CN111291171B/zh
Publication of CN111291171A publication Critical patent/CN111291171A/zh
Application granted granted Critical
Publication of CN111291171B publication Critical patent/CN111291171B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3325Reformulation based on results of preceding query

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种危大工程风险数据搜索方法,包括:建立危大工程词库;所述危大工程词库用于储存不同危大工程类型的自定义关键词;所述危大工程类型至少包括基坑支护与降水工程、土方开挖工程、模板工程、起重吊装工程、脚手架工程和拆除爆破工程;接收客户端输入的文字信息;对所述文字信息进行处理得到搜索关键词,将所述搜索关键词与所述危大工程词库中的自定义关键词进行对比,将对比一致的所述自定义关键词所对应的危大工程类型作为所述搜索关键词的搜索风险类型;采用所述搜索关键词在风险库中对应的所述搜索风险类型的储存区域进行数据搜索,得到搜索结果;本发明可以实现对危大工程项目中的风险项目数据进行精准搜索。

Description

一种危大工程风险数据搜索方法
技术领域
本发明涉及数据处理技术领域,尤其涉及一种危大工程风险数据搜索方法。
背景技术
随着互联网、大数据技术的不断发展,对海量用户数据的收集、统计、分析变得越来越重要。在电力领域中,工作人员将项目工程相关的风险数据传输存储在风险库中,以便继续后续的统计和分析工作;在需要对风险数据进行分析的时候,直接在风险库中对所需风险项目资料的关键词进行搜索,从而提取相关的风险项目资料。
由于电力行业中不同类型的风险项目数据特征相似度较高,特别是对危大工程项目的风险数据,其相似度非常高。传统的数据搜索方式直接将客户端输入的关键词作为搜索要点进行直接搜索,得到的搜索结果往往是不同类型的多种风险数据,并不能做到精准搜索,严重影响工作效率。
因此,目前市面上极需一种针对危大工程项目的应用风险项目数据的数据搜索方案。
发明内容
本发明提供了一种危大工程风险数据搜索方法,可以实现对危大工程项目中的风险项目数据进行精准搜索。
为了解决上述技术问题,本发明实施例提供了一种危大工程风险数据搜索方法,包括:
建立危大工程词库;所述危大工程词库用于储存不同危大工程类型的自定义关键词;所述危大工程类型至少包括基坑支护与降水工程、土方开挖工程、模板工程、起重吊装工程、脚手架工程和拆除爆破工程;
接收客户端输入的文字信息;
对所述文字信息进行处理得到搜索关键词,将所述搜索关键词与所述危大工程词库中的自定义关键词进行对比,将对比一致的所述自定义关键词所对应的危大工程类型作为所述搜索关键词的搜索风险类型;
采用所述搜索关键词在风险库中对应的所述搜索风险类型的储存区域进行数据搜索,得到搜索结果。
作为优选方案,所述对所述文字信息进行处理得到搜索关键词,将所述搜索关键词与所述危大工程词库中的自定义关键词进行对比,将对比一致的所述自定义关键词所对应的危大工程类型作为所述搜索关键词的搜索风险类型的具体步骤,包括:
对所述文字信息进行处理,至少得到第一搜索关键词和第二搜索关键词;
将所述第一搜索关键词与所述危大工程词库中的自定义关键词进行对比,将对比一致的所述自定义关键词所对应的危大工程类型作为所述第一搜索关键词的第一风险类型;
将所述第二搜索关键词与所述危大工程词库中的自定义关键词进行对比,将对比一致的所述自定义关键词所对应的危大工程类型作为所述第二搜索关键词的第二风险类型;
判断所述第一风险类型与所述第二风险类型是否一致,当确定一致时,确定所述搜索关键词的搜索风险类型。
作为优选方案,所述对所述文字信息进行处理的方法为:
通过分词算法对所述文字信息进行分词处理,得到多个语块;
对所述语块进行字符类型判断,根据预设的规则从所述语块中确定搜索关键词。
作为优选方案,所述通过分词算法对所述文字信息进行分词处理,得到多个语块的具体步骤,包括:
通过分词算法对所述文字信息进行分段处理,得到多段语段;
对所述多段语段进行词语识别,进行词语切割,得到多个语块。
作为优选方案,所述字符类型包括项目名词、专业术语、项目数值和标点符号。
作为优选方案,所述预设的规则具体为:
当判断确定多个语块中的任一语块的字符类型为项目名词时,将所述项目名词作为搜索关键词;
当判断确定多个语块中的任一语块的字符类型为专业术语时,将所述专业术语作为搜索关键词;
当判断确定多个语块中的任一语块的字符类型为项目数值时,判断多个语块中是否存在字符类型为项目名词或专业术语的语块,若存在,则将所述字符类型为项目数值的语块进行删除,否则将所述项目数值作为搜索关键词;
当判断确定多个语块中的任一语块的字符类型为标点符号时,将所述字符类型为标点符号的语块删除。
作为优选方案,所述分词算法为NLP分词算法。
本发明实施例还提供了一种危大工程风险数据搜索装置,包括:
词库建立模块,用于建立危大工程词库;所述危大工程词库用于储存不同危大工程类型的自定义关键词;所述危大工程类型至少包括基坑支护与降水工程、土方开挖工程、模板工程、起重吊装工程、脚手架工程和拆除爆破工程;
信息接收模块,用于接收客户端输入的文字信息;
关键词确定模块,用于对所述文字信息进行处理得到搜索关键词,将所述搜索关键词与所述危大工程词库中的自定义关键词进行对比,将对比一致的所述自定义关键词所对应的危大工程类型作为所述搜索关键词的搜索风险类型;
信息搜索模块,用于采用所述搜索关键词在风险库中对应的所述搜索风险类型的储存区域进行数据搜索,得到搜索结果。
作为优选方案,所述关键词确定模块包括:
信息处理单元,用于对所述文字信息进行处理,至少得到第一搜索关键词和第二搜索关键词;
第一对比单元,用于将所述第一搜索关键词与所述危大工程词库中的自定义关键词进行对比,将对比一致的所述自定义关键词所对应的危大工程类型作为所述第一搜索关键词的第一风险类型;
第二对比单元,用于将所述第二搜索关键词与所述危大工程词库中的自定义关键词进行对比,将对比一致的所述自定义关键词所对应的危大工程类型作为所述第二搜索关键词的第二风险类型;
关键词确定单元,用于判断所述第一风险类型与所述第二风险类型是否一致,当确定一致时,确定所述搜索关键词的搜索风险类型。
作为优选方案,所述对所述文字信息进行处理的方法为:
通过分词算法对所述文字信息进行分词处理,得到多个语块;
对所述语块进行字符类型判断,根据预设的规则从所述语块中确定搜索关键词。
作为优选方案,所述通过分词算法对所述文字信息进行分词处理,得到多个语块的具体步骤,包括:
通过分词算法对所述文字信息进行分段处理,得到多段语段;
对所述多段语段进行词语识别,进行词语切割,得到多个语块。
作为优选方案,所述字符类型包括项目名词、专业术语、项目数值和标点符号。
作为优选方案,所述预设的规则具体为:
当判断确定多个语块中的任一语块的字符类型为项目名词时,将所述项目名词作为搜索关键词;
当判断确定多个语块中的任一语块的字符类型为专业术语时,将所述专业术语作为搜索关键词;
当判断确定多个语块中的任一语块的字符类型为项目数值时,判断多个语块中是否存在字符类型为项目名词或专业术语的语块,若存在,则将所述字符类型为项目数值的语块进行删除,否则将所述项目数值作为搜索关键词;
当判断确定多个语块中的任一语块的字符类型为标点符号时,将所述字符类型为标点符号的语块删除。
作为优选方案,所述分词算法为NLP分词算法。
本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质包括存储的计算机程序;其中,所述计算机程序在运行时控制所述计算机可读存储介质所在的设备执行如上述任一项所述的危大工程风险数据搜索方法。
本发明实施例还提供了一种终端设备,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器在执行所述计算机程序时实现如上述任一项所述的危大工程风险数据搜索方法。
相比于现有技术,本发明实施例具有如下有益效果:
1、本发明通过将搜索关键词与危大工程词库中的自定义关键词进行对比确定搜索风险类型,再针对搜索风险类型确定搜索的储存区域,进行精准搜索,可以实现对危大工程项目中的风险项目数据进行精准搜索,提高工作效率。
2、对多个搜索关键词的类型进行判断一致性,可以进一步提高确定搜索风险类型的准确率,使得对风险项目数据的搜索工作更精准。
3、通过分词技术对文字信息进行处理,得到准确的搜索关键词,从侧面进一步提高搜索风险类型的准确率,使得对风险项目数据的搜索工作更精准。
附图说明
图1:为本发明实施例中的危大工程风险数据搜索方法的步骤流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参照图1,本发明优选实施例提供了一种危大工程风险数据搜索方法,包括:
S1,建立危大工程词库;所述危大工程词库用于储存不同危大工程类型的自定义关键词;所述危大工程类型至少包括基坑支护与降水工程、土方开挖工程、模板工程、起重吊装工程、脚手架工程和拆除爆破工程;具体地,根据用户实际需求进行自定义关键词,该关键词可以是专业术语,项目名词等等,主要用于区分不同危大工程类型的关键词。应当说明的是,风险类也可以根据实际需求进行不同类型的设置归类,例如基坑支护与降水工程、土方开挖工程、模板工程、起重吊装工程、脚手架工程、拆除爆破工程和其他工程等等,还可以根据风险的等级进行不同程度的设置,例如高风险、中风险或低风险等。
S2,接收客户端输入的文字信息;具体地,用户通过客户端输入需要搜索的关键词文字信息,通过网络通信数据连接服务对该文字信息进行获取。应当说明的是,本步骤描述的从客户端接收的文字信息仅仅是指代从另一终端接收的信息数据,该客户端可以是PC端,个人计算机或智能手机等移动终端,该客户端的具体设备型号、规格等设备信息不对本发明技术方案产生任何的保护范围限制。
S3,对所述文字信息进行处理得到搜索关键词,将所述搜索关键词与所述危大工程词库中的自定义关键词进行对比,将对比一致的所述自定义关键词所对应的危大工程类型作为所述搜索关键词的搜索风险类型;具体地,对得到的搜索关键词语自定义的关键词进行对比,该对比步骤可以是完全一致的对比,也可以是根据预设阈值的相似对比,可以根据用户的实际需求进行变换。
S4,采用所述搜索关键词在风险库中对应的所述搜索风险类型的储存区域进行数据搜索,得到搜索结果。具体地,在风险库建立时,必然会对风险库的储存区域进行相应的分类动作,例如分类上传数据,再分来储存;甚至是在风险库中建立多区域的储存空间,对不同类型的风险数据进行分类储存。
本发明通过将搜索关键词与危大工程词库中的自定义关键词进行对比确定搜索风险类型,再针对搜索风险类型确定搜索的储存区域,进行精准搜索,可以实现对危大工程项目中的风险项目数据进行精准搜索,提高工作效率。
在另一实施例中,所述步骤S3包括:
S31,对所述文字信息进行处理,至少得到第一搜索关键词和第二搜索关键词;具体地,设置多个搜索关键词的方案是为了避免用户在输入文字信息时,顺带输入部分实际与搜索意图无关的文字信息,以使搜索错误率增大,因此,在本实施例中对搜索关键词的数量值进行了限制。
S32,将所述第一搜索关键词与所述危大工程词库中的自定义关键词进行对比,将对比一致的所述自定义关键词所对应的危大工程类型作为所述第一搜索关键词的第一风险类型;
S33,将所述第二搜索关键词与所述危大工程词库中的自定义关键词进行对比,将对比一致的所述自定义关键词所对应的危大工程类型作为所述第二搜索关键词的第二风险类型;
具体地,通过步骤S32和步骤S33的执行过程,可以确定用户输入的文字信息的具体真实意图,对多个关键词的危大工程类型进行确定,当多个关键词同时触发该危大工程类型时,将该危大工程类型确定为搜索风险类型。
S34,判断所述第一风险类型与所述第二风险类型是否一致,当确定一致时,确定所述搜索关键词的搜索风险类型。
本实施例对多个搜索关键词的类型进行判断一致性,可以进一步提高确定搜索风险类型的准确率,使得对风险项目数据的搜索工作更精准。
在另一实施例中,所述对所述文字信息进行处理的方法为:
步骤1,通过分词算法对所述文字信息进行分词处理,得到多个语块;在优选实施例中,所述步骤1包括:步骤11,通过分词算法对所述文字信息进行分段处理,得到多段语段;步骤12,对所述多段语段进行词语识别,进行词语切割,得到多个语块。
步骤2,对所述语块进行字符类型判断,根据预设的规则从所述语块中确定搜索关键词。在本实施例中,所述字符类型包括项目名词、专业术语、项目数值和标点符号。
在优选实施例中,所述预设的规则具体为:
当判断确定多个语块中的任一语块的字符类型为项目名词时,将所述项目名词作为搜索关键词;
当判断确定多个语块中的任一语块的字符类型为专业术语时,将所述专业术语作为搜索关键词;
当判断确定多个语块中的任一语块的字符类型为项目数值时,判断多个语块中是否存在字符类型为项目名词或专业术语的语块,若存在,则将所述字符类型为项目数值的语块进行删除,否则将所述项目数值作为搜索关键词;
当判断确定多个语块中的任一语块的字符类型为标点符号时,将所述字符类型为标点符号的语块删除。
本实施例通过分词技术对文字信息进行处理,得到准确的搜索关键词,从侧面进一步提高搜索风险类型的准确率,使得对风险项目数据的搜索工作更精准。
应当说明的是,在上述实施例中,所述分词算法为NLP分词算法。
相应地,本发明实施例还提供了一种危大工程风险数据搜索装置,包括:
词库建立模块,用于建立危大工程词库;所述危大工程词库用于储存不同危大工程类型的自定义关键词;所述危大工程类型至少包括基坑支护与降水工程、土方开挖工程、模板工程、起重吊装工程、脚手架工程和拆除爆破工程;
信息接收模块,用于接收客户端输入的文字信息;
关键词确定模块,用于对所述文字信息进行处理得到搜索关键词,将所述搜索关键词与所述危大工程词库中的自定义关键词进行对比,将对比一致的所述自定义关键词所对应的危大工程类型作为所述搜索关键词的搜索风险类型;
信息搜索模块,用于采用所述搜索关键词在风险库中对应的所述搜索风险类型的储存区域进行数据搜索,得到搜索结果。
在另一实施例中,所述关键词确定模块包括:
信息处理单元,用于对所述文字信息进行处理,至少得到第一搜索关键词和第二搜索关键词;
第一对比单元,用于将所述第一搜索关键词与所述危大工程词库中的自定义关键词进行对比,将对比一致的所述自定义关键词所对应的危大工程类型作为所述第一搜索关键词的第一风险类型;
第二对比单元,用于将所述第二搜索关键词与所述危大工程词库中的自定义关键词进行对比,将对比一致的所述自定义关键词所对应的危大工程类型作为所述第二搜索关键词的第二风险类型;
关键词确定单元,用于判断所述第一风险类型与所述第二风险类型是否一致,当确定一致时,确定所述搜索关键词的搜索风险类型。
在另一实施例中,所述对所述文字信息进行处理的方法为:
通过分词算法对所述文字信息进行分词处理,得到多个语块;
对所述语块进行字符类型判断,根据预设的规则从所述语块中确定搜索关键词。
在优选实施例中,所述通过分词算法对所述文字信息进行分词处理,得到多个语块的具体步骤,包括:
通过分词算法对所述文字信息进行分段处理,得到多段语段;
对所述多段语段进行词语识别,进行词语切割,得到多个语块。
在本实施例中,所述字符类型包括项目名词、专业术语、项目数值和标点符号。
在优选实施例中,所述预设的规则具体为:
当判断确定多个语块中的任一语块的字符类型为项目名词时,将所述项目名词作为搜索关键词;
当判断确定多个语块中的任一语块的字符类型为专业术语时,将所述专业术语作为搜索关键词;
当判断确定多个语块中的任一语块的字符类型为项目数值时,判断多个语块中是否存在字符类型为项目名词或专业术语的语块,若存在,则将所述字符类型为项目数值的语块进行删除,否则将所述项目数值作为搜索关键词;
当判断确定多个语块中的任一语块的字符类型为标点符号时,将所述字符类型为标点符号的语块删除。
在本实施例中,所述分词算法为NLP分词算法。
本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质包括存储的计算机程序;其中,所述计算机程序在运行时控制所述计算机可读存储介质所在的设备执行上述任一实施例所述的危大工程风险数据搜索方法。
本发明实施例还提供了一种终端设备,所述终端设备包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器在执行所述计算机程序时实现上述任一实施例所述的危大工程风险数据搜索方法。
优选地,所述计算机程序可以被分割成一个或多个模块/单元(如计算机程序、计算机程序),所述一个或者多个模块/单元被存储在所述存储器中,并由所述处理器执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序在所述终端设备中的执行过程。
所述处理器可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等,通用处理器可以是微处理器,或者所述处理器也可以是任何常规的处理器,所述处理器是所述终端设备的控制中心,利用各种接口和线路连接所述终端设备的各个部分。
所述存储器主要包括程序存储区和数据存储区,其中,程序存储区可存储操作系统、至少一个功能所需的应用程序等,数据存储区可存储相关数据等。此外,所述存储器可以是高速随机存取存储器,还可以是非易失性存储器,例如插接式硬盘,智能存储卡(SmartMedia Card,SMC)、安全数字(Secure Digital,SD)卡和闪存卡(Flash Card)等,或所述存储器也可以是其他易失性固态存储器件。
需要说明的是,上述终端设备可包括,但不仅限于,处理器、存储器,本领域技术人员可以理解,上述终端设备仅仅是示例,并不构成对终端设备的限定,可以包括更多或更少的部件,或者组合某些部件,或者不同的部件。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步的详细说明,应当理解,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围。特别指出,对于本领域技术人员来说,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (5)

1.一种危大工程风险数据搜索方法,其特征在于,包括:
建立危大工程词库;所述危大工程词库用于储存不同危大工程类型的自定义关键词;所述危大工程类型至少包括基坑支护与降水工程、土方开挖工程、模板工程、起重吊装工程、脚手架工程和拆除爆破工程;
接收客户端输入的文字信息;
对所述文字信息进行处理得到搜索关键词,将所述搜索关键词与所述危大工程词库中的自定义关键词进行对比,将对比一致的所述自定义关键词所对应的危大工程类型作为所述搜索关键词的搜索风险类型;
采用所述搜索关键词在风险库中对应的所述搜索风险类型的储存区域进行数据搜索,得到搜索结果;
所述对所述文字信息进行处理得到搜索关键词,将所述搜索关键词与所述危大工程词库中的自定义关键词进行对比,将对比一致的所述自定义关键词所对应的危大工程类型作为所述搜索关键词的搜索风险类型的具体步骤,包括:
对所述文字信息进行处理,至少得到第一搜索关键词和第二搜索关键词;
将所述第一搜索关键词与所述危大工程词库中的自定义关键词进行对比,将对比一致的所述自定义关键词所对应的危大工程类型作为所述第一搜索关键词的第一风险类型;
将所述第二搜索关键词与所述危大工程词库中的自定义关键词进行对比,将对比一致的所述自定义关键词所对应的危大工程类型作为所述第二搜索关键词的第二风险类型;
判断所述第一风险类型与所述第二风险类型是否一致,当确定一致时,确定所述搜索关键词的搜索风险类型;
所述对所述文字信息进行处理的方法为:
通过分词算法对所述文字信息进行分词处理,得到多个语块;
对所述语块进行字符类型判断,根据预设的规则从所述语块中确定搜索关键词;
所述通过分词算法对所述文字信息进行分词处理,得到多个语块的具体步骤,包括:
通过分词算法对所述文字信息进行分段处理,得到多段语段;
对所述多段语段进行词语识别,进行词语切割,得到多个语块;
所述字符类型包括项目名词、专业术语、项目数值和标点符号;
所述预设的规则具体为:
当判断确定多个语块中的任一语块的字符类型为项目名词时,将所述项目名词作为搜索关键词;
当判断确定多个语块中的任一语块的字符类型为专业术语时,将所述专业术语作为搜索关键词;
当判断确定多个语块中的任一语块的字符类型为项目数值时,判断多个语块中是否存在字符类型为项目名词或专业术语的语块,若存在,则将所述字符类型为项目数值的语块进行删除,否则将所述项目数值作为搜索关键词;
当判断确定多个语块中的任一语块的字符类型为标点符号时,将所述字符类型为标点符号的语块删除。
2.如权利要求1所述的危大工程风险数据搜索方法,其特征在于,所述分词算法为NLP分词算法。
3.一种危大工程风险数据搜索装置,其特征在于,包括:
词库建立模块,用于建立危大工程词库;所述危大工程词库用于储存不同危大工程类型的自定义关键词;所述危大工程类型至少包括基坑支护与降水工程、土方开挖工程、模板工程、起重吊装工程、脚手架工程和拆除爆破工程;
信息接收模块,用于接收客户端输入的文字信息;
关键词确定模块,用于对所述文字信息进行处理得到搜索关键词,将所述搜索关键词与所述危大工程词库中的自定义关键词进行对比,将对比一致的所述自定义关键词所对应的危大工程类型作为所述搜索关键词的搜索风险类型;
信息搜索模块,用于采用所述搜索关键词在风险库中对应的所述搜索风险类型的储存区域进行数据搜索,得到搜索结果;
所述对所述文字信息进行处理得到搜索关键词,将所述搜索关键词与所述危大工程词库中的自定义关键词进行对比,将对比一致的所述自定义关键词所对应的危大工程类型作为所述搜索关键词的搜索风险类型,包括:
对所述文字信息进行处理,至少得到第一搜索关键词和第二搜索关键词;
将所述第一搜索关键词与所述危大工程词库中的自定义关键词进行对比,将对比一致的所述自定义关键词所对应的危大工程类型作为所述第一搜索关键词的第一风险类型;
将所述第二搜索关键词与所述危大工程词库中的自定义关键词进行对比,将对比一致的所述自定义关键词所对应的危大工程类型作为所述第二搜索关键词的第二风险类型;
判断所述第一风险类型与所述第二风险类型是否一致,当确定一致时,确定所述搜索关键词的搜索风险类型;
所述对所述文字信息进行处理,包括:
通过分词算法对所述文字信息进行分词处理,得到多个语块;
对所述语块进行字符类型判断,根据预设的规则从所述语块中确定搜索关键词;
所述通过分词算法对所述文字信息进行分词处理,得到多个语块,包括:
通过分词算法对所述文字信息进行分段处理,得到多段语段;
对所述多段语段进行词语识别,进行词语切割,得到多个语块;
所述字符类型包括项目名词、专业术语、项目数值和标点符号;
所述预设的规则具体为:
当判断确定多个语块中的任一语块的字符类型为项目名词时,将所述项目名词作为搜索关键词;
当判断确定多个语块中的任一语块的字符类型为专业术语时,将所述专业术语作为搜索关键词;
当判断确定多个语块中的任一语块的字符类型为项目数值时,判断多个语块中是否存在字符类型为项目名词或专业术语的语块,若存在,则将所述字符类型为项目数值的语块进行删除,否则将所述项目数值作为搜索关键词;
当判断确定多个语块中的任一语块的字符类型为标点符号时,将所述字符类型为标点符号的语块删除。
4.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的计算机程序;其中,所述计算机程序在运行时控制所述计算机可读存储介质所在的设备执行如权利要求1~2任一项所述的危大工程风险数据搜索方法。
5.一种终端设备,其特征在于,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器在执行所述计算机程序时实现如权利要求1~2任一项所述的危大工程风险数据搜索方法。
CN202010072329.4A 2020-01-21 2020-01-21 一种危大工程风险数据搜索方法 Active CN111291171B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010072329.4A CN111291171B (zh) 2020-01-21 2020-01-21 一种危大工程风险数据搜索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010072329.4A CN111291171B (zh) 2020-01-21 2020-01-21 一种危大工程风险数据搜索方法

Publications (2)

Publication Number Publication Date
CN111291171A CN111291171A (zh) 2020-06-16
CN111291171B true CN111291171B (zh) 2023-05-16

Family

ID=71027527

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010072329.4A Active CN111291171B (zh) 2020-01-21 2020-01-21 一种危大工程风险数据搜索方法

Country Status (1)

Country Link
CN (1) CN111291171B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103353894A (zh) * 2013-07-19 2013-10-16 武汉睿数信息技术有限公司 一种基于语义分析的数据搜索方法和系统
CN104268175A (zh) * 2014-09-15 2015-01-07 乐视网信息技术(北京)股份有限公司 一种数据搜索的装置及其方法
CN104281702A (zh) * 2014-10-22 2015-01-14 国家电网公司 基于电力关键词分词的数据检索方法及装置
CN107180093A (zh) * 2017-05-15 2017-09-19 北京奇艺世纪科技有限公司 信息搜索方法及装置和时效性查询词识别方法及装置
CN107577755A (zh) * 2017-08-31 2018-01-12 江西博瑞彤芸科技有限公司 一种搜索方法
CN107632986A (zh) * 2016-07-18 2018-01-26 阿里巴巴集团控股有限公司 搜索方法及装置
CN110287325A (zh) * 2019-06-28 2019-09-27 南方电网科学研究院有限责任公司 一种基于智能语音分析的电网客服业务推荐方法及装置
CN110413645A (zh) * 2019-06-19 2019-11-05 平安普惠企业管理有限公司 数据搜索方法、装置、终端及计算机可读存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW201214163A (en) * 2010-09-21 2012-04-01 Inventec Corp Searching system and method thereof with generating extending keywords according to input keywords

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103353894A (zh) * 2013-07-19 2013-10-16 武汉睿数信息技术有限公司 一种基于语义分析的数据搜索方法和系统
CN104268175A (zh) * 2014-09-15 2015-01-07 乐视网信息技术(北京)股份有限公司 一种数据搜索的装置及其方法
CN104281702A (zh) * 2014-10-22 2015-01-14 国家电网公司 基于电力关键词分词的数据检索方法及装置
CN107632986A (zh) * 2016-07-18 2018-01-26 阿里巴巴集团控股有限公司 搜索方法及装置
CN107180093A (zh) * 2017-05-15 2017-09-19 北京奇艺世纪科技有限公司 信息搜索方法及装置和时效性查询词识别方法及装置
CN107577755A (zh) * 2017-08-31 2018-01-12 江西博瑞彤芸科技有限公司 一种搜索方法
CN110413645A (zh) * 2019-06-19 2019-11-05 平安普惠企业管理有限公司 数据搜索方法、装置、终端及计算机可读存储介质
CN110287325A (zh) * 2019-06-28 2019-09-27 南方电网科学研究院有限责任公司 一种基于智能语音分析的电网客服业务推荐方法及装置

Also Published As

Publication number Publication date
CN111291171A (zh) 2020-06-16

Similar Documents

Publication Publication Date Title
TW202020691A (zh) 特徵詞的確定方法、裝置和伺服器
CN105955950A (zh) 新词发现方法及装置
CN107102993B (zh) 一种用户诉求分析方法和装置
CN108932320B (zh) 文章搜索方法、装置及电子设备
CN111325023B (zh) 一种风险项目信息数据搜索方法
CN114780746A (zh) 基于知识图谱的文档检索方法及其相关设备
CN112148305A (zh) 一种应用检测方法、装置、计算机设备和可读存储介质
CN112989235A (zh) 基于知识库的内链构建方法、装置、设备和存储介质
CN112784720A (zh) 基于银行回单的关键信息提取方法、装置、设备及介质
CN110688540B (zh) 一种作弊账户筛选方法、装置、设备及介质
CN111291171B (zh) 一种危大工程风险数据搜索方法
CN106407332B (zh) 基于人工智能的搜索方法和装置
WO2023125336A1 (en) Methods and devices for generating sensitive text detectors
CN112417875A (zh) 配置信息的更新方法、装置、计算机设备及介质
CN110399464B (zh) 一种相似新闻判别方法、系统及电子设备
CN117171296A (zh) 信息获取方法、装置和电子设备
CN111752958A (zh) 智能关联标签方法、装置、计算机设备及存储介质
CN110728146A (zh) 舆情发现方法、装置、终端设备以及存储介质
CN110990834A (zh) 一种android恶意软件的静态检测方法、系统及介质
CN115859273A (zh) 一种数据库异常访问的检测方法、装置、设备及存储介质
CN114491038A (zh) 一种基于会话场景的流程挖掘方法、装置及设备
CN112528644B (zh) 实体挂载的方法、装置、设备以及存储介质
CN110807082A (zh) 质量抽检项目确定方法、系统、电子设备及可读存储介质
CN115374849A (zh) 企业相关专利检索方法、装置、设备及介质
CN113407495A (zh) 一种基于simhash的文件相似度判定方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant