CN112528665A - 一种基于语义理解的信息提取方法 - Google Patents

一种基于语义理解的信息提取方法 Download PDF

Info

Publication number
CN112528665A
CN112528665A CN201910811080.1A CN201910811080A CN112528665A CN 112528665 A CN112528665 A CN 112528665A CN 201910811080 A CN201910811080 A CN 201910811080A CN 112528665 A CN112528665 A CN 112528665A
Authority
CN
China
Prior art keywords
document
keywords
characters
keyword
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910811080.1A
Other languages
English (en)
Inventor
梁慧冰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Angu Information Technology Co ltd
Original Assignee
Guangzhou Angu Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Angu Information Technology Co ltd filed Critical Guangzhou Angu Information Technology Co ltd
Priority to CN201910811080.1A priority Critical patent/CN112528665A/zh
Publication of CN112528665A publication Critical patent/CN112528665A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/16File or folder operations, e.g. details of user interfaces specifically adapted to file systems
    • G06F16/164File meta data generation
    • G06F16/166File name conversion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3334Selection or weighting of terms from queries, including natural language queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3346Query execution using probabilistic model

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Probability & Statistics with Applications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Abstract

本发明涉及一种基于语义理解的信息提取方法,包括:获取用户上传的文档,基于所述文档中的段落文字进行语义分析,从中获取段落文字的指向关键词,在所述文档的段落文字中定位寻找字母组合,从所述字母组合中提取所述文档的产品型号,根据所述指向关键词及产品型号,对文档进行重命名。本发明的方法用以保障集中文件管理时的命名规范一致,确保工作协同中得以准确查找文件,获取工作中需要的知识内容。

Description

一种基于语义理解的信息提取方法
技术领域
本发明涉及一种基于语义理解的信息提取方法、装置、电子设备及计算机可读存储介质。
背景技术
现有技术中,对大量的设备说明书进行集中文件管理时,文件的上传人员对文件命名有可能存在不准确或是不规范的因素,导致工作协同中,难以准确地查找文件,获取工作中需要的知识内容。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的基于语义理解的信息提取方法。
依据本发明的一个方面,提供了一种基于语义理解的信息提取方法,包括:
文档获取步骤,其获取用户上传的文档;
关键词提取步骤,其基于所述文档中的段落文字进行语义分析,从中获取段落文字的指向关键词;
型号提取步骤,其在所述文档的段落文字中定位寻找字母组合,从所述字母组合中提取所述文档的产品型号;
重命名步骤,其根据所述指向关键词及产品型号,对文档进行重命名。
优选地,在文档获取步骤中,对于用户上传的文档,先将文档的命名清空,按下载时间进行预命名。
优选地,所述关键词提取步骤包括:对所述文档中的段落文字进行文本分词,并对分词后的每个词汇计算权重,基于所述权重提取所述指向关键词。
优选地,所述文本分词的具体方式是:对段落文字中的每个词汇进行词条检索,在词库中找到相应匹配的所有词条,将各个词条以词网格形式进行表示,并在其中基于统计语言模型做路径搜索,找到最优路径,根据最优路径决定最优的切分结果。
优选地,所述计算权重的具体方式是:对分词后的每个词汇以词频为度量,基于Tf-Idf为每个词汇计算一个权重。
优选地,所述基于所述权重提取所述指向关键词,进一步包括:对权重超过设定阈值的词汇进行关键词提取,基于bidword和高频query建立多模式匹配树,利用多模式匹配树筛选出关键词作为所诉指向关键词。
优选地,所述型号提取步骤包括:所述字母组合包括数字、字母和字符,对所述文档中的段落文字进行数字、字母和字符检索从而定位寻找字母组合,将字母组合与所确定的指向关键词进行释义匹配,将匹配成功的字母组合确定为所述产品型号。
优选地,所述重命名步骤包括:根据所述指向关键词查询系统中的文档分类,在文档分类中无指向关键词对应类别的情况下,以指向关键词作为新类别创建文件夹,并将重命名后的文档自动存储至该文件夹下。
依据本发明的另一个方面,提供了一种基于语义理解的信息提取装置,包括:
文档获取模块,其获取用户上传的文档;
关键词提取模块,其基于所述文档中的段落文字进行语义分析,从中获取段落文字的指向关键词;
型号提取模块,其在所述文档的段落文字中定位寻找字母组合,从所述字母组合中提取所述文档的产品型号;
重命名模块,其根据所述指向关键词及产品型号,对文档进行重命名。
优选地,在文档获取模块中,对于用户上传的文档,先将文档的命名清空,按下载时间进行预命名。
优选地,所述关键词提取模块包括:对所述文档中的段落文字进行文本分词,并对分词后的每个词汇计算权重,基于所述权重提取所述指向关键词。
优选地,所述文本分词的具体方式是:对段落文字中的每个词汇进行词条检索,在词库中找到相应匹配的所有词条,将各个词条以词网格形式进行表示,并在其中基于统计语言模型做路径搜索,找到最优路径,根据最优路径决定最优的切分结果。
优选地,所述计算权重的具体方式是:对分词后的每个词汇以词频为度量,基于Tf-Idf为每个词汇计算一个权重。
优选地,所述基于所述权重提取所述指向关键词,进一步包括:对权重超过设定阈值的词汇进行关键词提取,基于bidword和高频query建立多模式匹配树,利用多模式匹配树筛选出关键词作为所诉指向关键词。
优选地,所述型号提取模块包括:所述字母组合包括数字、字母和字符,对所述文档中的段落文字进行数字、字母和字符检索从而定位寻找字母组合,将字母组合与所确定的指向关键词进行释义匹配,将匹配成功的字母组合确定为所述产品型号。
优选地,所述重命名模块包括:根据所述指向关键词查询系统中的文档分类,在文档分类中无指向关键词对应类别的情况下,以指向关键词作为新类别创建文件夹,并将重命名后的文档自动存储至该文件夹下。
依据本发明的另一个方面,提供了一种电子设备,其中,该电子设备包括:
处理器;以及,
被安排成存储计算机可执行指令的存储器,可执行指令在被执行时使处理器执行上述的方法。
依据本发明的另一个方面,提供了一种计算机可读存储介质,其中,计算机可读存储介质存储一个或多个程序,一个或多个程序当被处理器执行时,实现上述的方法。
有益效果:
本发明利用文档中的段落文字进行语义分析,自动获取段落文字的指向关键词,并在文档的段落文字中定位寻找字母组合,从字母组合中提取所述文档的产品型号,然后根据所述指向关键词及产品型号对文档进行重命名,以此保障集中文件管理时的命名规范一致,确保工作协同中得以准确查找文件,获取工作中需要的知识内容。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了根据本发明一个实施例的基于语义理解的信息提取方法的流程示意图;
图2示出了根据本发明一个实施例的基于语义理解的信息提取装置的结构示意图;
图3示出了根据本发明一个实施例的电子设备的结构示意图;
图4示出了根据本发明一个实施例的计算机可读存储介质的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
图1示出了根据本发明一个实施例的基于语义理解的信息提取方法的流程示意图。如图1所示,本发明实施例的基于语义理解的信息提取方法包括:
步骤S11:获取用户上传的文档;
具体地,从网上下载的有关电器说明书的资料,将资料导入到系统。
步骤S12:基于所述文档中的段落文字进行语义分析,从中获取段落文字的指向关键词;
具体地,获取电器说明书中的段落文字后,对段落文字中的每个词汇进行词条检索,从而在词库中找到相应匹配的所有词条,将各个词条以词网格(word lattices)形式进行表示,并在其中基于n-gram统计语言模型做路径搜索,从而找到最优路径,根据最优路径决定最优的切分结果,自此完成对电器说明书中段落文字进行分词;
对文本分词后,接下来对分词后的每个词汇以“词频”为度量,基于Tf-Idf为每个词汇计算一个权重,然后取一定阈值,对权重超过阈值的词汇进行关键词提取,然后基于bidword和高频query建立多模式匹配树,利用多模式匹配树筛选出优质关键词,以该关键词作为电器说明书的指向关键词。
步骤S13:在所述文档的段落文字中定位寻找字母组合,从所述字母组合中提取所述文档的产品型号;
具体地,产品型号通常由数字、字母和字符组成,藉此,可对电器说明书中内容进行数字、字母和字符检索,在字符串中定位寻找字母组合,将字母组合与所确定的指向关键词进行释义匹配,将匹配成功的字母组合确定为电器说明书中的产品型号。
步骤S14:根据所述指向关键词及产品型号,对文档进行重命名;
具体地,用指向关键词及产品型号对电器说明书进行重命名,例如对主要讲互感器的电器说明书,根据步骤S3获取其指向关键词互感器后,系统将设备名为互感器的设备型号一并理解并提取,并自动生成新的文件名。
进一步地,在实际工作中,对大量的设备说明书进行集中文件管理时,文件的上传人员对文件命名有可能存在不准确或是不规范的因素,导致工作协同中,难以准确地查找文件,获取工作中需要的知识内容,藉此,对于导入到系统的电器说明书,先将文件的命名清空,按下载的时间进行预命名。
进一步地,根据步骤S3获取的指向关键词查询系统中的文档分类,在文档分类中无指向关键词对应类别的情况下,系统以指向关键词作为新类别来创建文件夹,并将重命名后的电器说明书自动存储至该文件夹下,实现文档管理。
本实施例的方法利用文档中的段落文字进行语义分析,自动获取段落文字的指向关键词,并在文档的段落文字中定位寻找字母组合,从字母组合中提取所述文档的产品型号,然后根据所述指向关键词及产品型号对文档进行重命名,以此保障集中文件管理时的命名规范一致,确保工作协同中得以准确查找文件,获取工作中需要的知识内容。
图2示出了根据本发明一个实施例的基于语义理解的信息提取装置的结构示意图。如图2所示,本发明实施例的基于语义理解的信息提取装置包括:
文档获取模块21,其获取用户上传的文档;
关键词提取模块22,其基于所述文档中的段落文字进行语义分析,从中获取段落文字的指向关键词;
型号提取模块23,其在所述文档的段落文字中定位寻找字母组合,从所述字母组合中提取所述文档的产品型号;
重命名模块24,其根据所述指向关键词及产品型号,对文档进行重命名。
优选地,在文档获取模块21中,对于用户上传的文档,先将文档的命名清空,按下载时间进行预命名。
优选地,所述关键词提取模块22包括:对所述文档中的段落文字进行文本分词,并对分词后的每个词汇计算权重,基于所述权重提取所述指向关键词。
优选地,所述文本分词的具体方式是:对段落文字中的每个词汇进行词条检索,在词库中找到相应匹配的所有词条,将各个词条以词网格形式进行表示,并在其中基于统计语言模型做路径搜索,找到最优路径,根据最优路径决定最优的切分结果。
优选地,所述计算权重的具体方式是:对分词后的每个词汇以词频为度量,基于Tf-Idf为每个词汇计算一个权重。
优选地,所述基于所述权重提取所述指向关键词,进一步包括:对权重超过设定阈值的词汇进行关键词提取,基于bidword和高频query建立多模式匹配树,利用多模式匹配树筛选出关键词作为所诉指向关键词。
优选地,所述型号提取模块23包括:所述字母组合包括数字、字母和字符,对所述文档中的段落文字进行数字、字母和字符检索从而定位寻找字母组合,将字母组合与所确定的指向关键词进行释义匹配,将匹配成功的字母组合确定为所述产品型号。
优选地,所述重命名模块24包括:根据所述指向关键词查询系统中的文档分类,在文档分类中无指向关键词对应类别的情况下,以指向关键词作为新类别创建文件夹,并将重命名后的文档自动存储至该文件夹下。
本发明实施例的基于语义理解的信息提取装置可以用于执行上述方法实施例,其原理和技术效果类似,此处不再赘述。
需要说明的是:
在此提供的算法和显示不与任何特定计算机、虚拟装置或者其它设备固有相关。各种通用装置也可以与基于在此的示教一起使用。根据上面的描述,构造这类装置所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的检测电子设备的佩戴状态的装置中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
例如,图3示出了根据本发明一个实施例的电子设备的结构示意图。该电子设备传统上包括处理器31和被安排成存储计算机可执行指令(程序代码)的存储器32。存储器32可以是诸如闪存、EEPROM(电可擦除可编程只读存储器)、EPROM、硬盘或者ROM之类的电子存储器。存储器32具有存储用于执行图1所示的以及各实施例中的任何方法步骤的程序代码34的存储空间33。例如,用于程序代码的存储空间33可以包括分别用于实现上面的方法中的各种步骤的各个程序代码34。这些程序代码可以从一个或者多个计算机程序产品中读出或者写入到这一个或者多个计算机程序产品中。这些计算机程序产品包括诸如硬盘,紧致盘(CD)、存储卡或者软盘之类的程序代码载体。这样的计算机程序产品通常为例如图4所述的计算机可读存储介质。该计算机可读存储介质可以具有与图3的电子设备中的存储器32类似布置的存储段、存储空间等。程序代码可以例如以适当形式进行压缩。通常,存储单元存储有用于执行根据本发明的方法步骤的程序代码41,即可以由诸如31之类的处理器读取的程序代码,当这些程序代码由电子设备运行时,导致该电子设备执行上面所描述的方法中的各个步骤。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

Claims (10)

1.一种基于语义理解的信息提取方法,其特征在于,包括:
文档获取步骤,其获取用户上传的文档;
关键词提取步骤,其基于所述文档中的段落文字进行语义分析,从中获取段落文字的指向关键词;
型号提取步骤,其在所述文档的段落文字中定位寻找字母组合,从所述字母组合中提取所述文档的产品型号;
重命名步骤,其根据所述指向关键词及产品型号,对文档进行重命名。
2.根据权利要求1所述的方法,其特征在于:在文档获取步骤中,对于用户上传的文档,先将文档的命名清空,按下载时间进行预命名。
3.根据权利要求1所述的方法,其特征在于所述关键词提取步骤包括:对所述文档中的段落文字进行文本分词,并对分词后的每个词汇计算权重,基于所述权重提取所述指向关键词。
4.根据权利要求3所述的方法,其特征在于所述文本分词的具体方式是:对段落文字中的每个词汇进行词条检索,在词库中找到相应匹配的所有词条,将各个词条以词网格形式进行表示,并在其中基于统计语言模型做路径搜索,找到最优路径,根据最优路径决定最优的切分结果。
5.根据权利要求3或4所述的方法,其特征在于所述计算权重的具体方式是:对分词后的每个词汇以词频为度量,基于Tf-Idf为每个词汇计算一个权重。
6.根据权利要求5所述的方法,其特征在于,所述基于所述权重提取所述指向关键词,进一步包括:对权重超过设定阈值的词汇进行关键词提取,基于bidword和高频query建立多模式匹配树,利用多模式匹配树筛选出关键词作为所诉指向关键词。
7.根据权利要求1所述的方法,其特征在于所述型号提取步骤包括:所述字母组合包括数字、字母和字符,对所述文档中的段落文字进行数字、字母和字符检索从而定位寻找字母组合,将字母组合与所确定的指向关键词进行释义匹配,将匹配成功的字母组合确定为所述产品型号。
8.根据权利要求1所述的方法,其特征在于所述重命名步骤包括:根据所述指向关键词查询系统中的文档分类,在文档分类中无指向关键词对应类别的情况下,以指向关键词作为新类别创建文件夹,并将重命名后的文档自动存储至该文件夹下。
9.一种电子设备,其中,该电子设备包括:
处理器;以及,
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行根据权利要求1~8中任一项所述的方法。
10.一种计算机可读存储介质,其中,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被处理器执行时,实现权利要求1~8中任一项所述的方法。
CN201910811080.1A 2019-08-30 2019-08-30 一种基于语义理解的信息提取方法 Pending CN112528665A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910811080.1A CN112528665A (zh) 2019-08-30 2019-08-30 一种基于语义理解的信息提取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910811080.1A CN112528665A (zh) 2019-08-30 2019-08-30 一种基于语义理解的信息提取方法

Publications (1)

Publication Number Publication Date
CN112528665A true CN112528665A (zh) 2021-03-19

Family

ID=74974052

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910811080.1A Pending CN112528665A (zh) 2019-08-30 2019-08-30 一种基于语义理解的信息提取方法

Country Status (1)

Country Link
CN (1) CN112528665A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113126936A (zh) * 2021-04-23 2021-07-16 深圳市爱商在线科技有限公司 一种适配多种文档类型的打印控件
CN114973259A (zh) * 2022-03-03 2022-08-30 北京电解智科技有限公司 信息抽取方法、装置和计算机可读存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150081281A1 (en) * 2013-09-18 2015-03-19 International Business Machines Corporation Using Renaming Directives to Bootstrap Industry-Specific Knowledge and Lexical Resources
CN105045927A (zh) * 2015-08-26 2015-11-11 广东中建普联科技有限公司 建设工程工料机数据自动编码方法及系统
CN109600428A (zh) * 2018-11-27 2019-04-09 深圳市关运通科技有限公司 一种自动化上传附件并匹配关联的方法和装置
CN109902288A (zh) * 2019-01-17 2019-06-18 深圳壹账通智能科技有限公司 智能条款分析方法、装置、计算机设备及存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150081281A1 (en) * 2013-09-18 2015-03-19 International Business Machines Corporation Using Renaming Directives to Bootstrap Industry-Specific Knowledge and Lexical Resources
CN105045927A (zh) * 2015-08-26 2015-11-11 广东中建普联科技有限公司 建设工程工料机数据自动编码方法及系统
CN109600428A (zh) * 2018-11-27 2019-04-09 深圳市关运通科技有限公司 一种自动化上传附件并匹配关联的方法和装置
CN109902288A (zh) * 2019-01-17 2019-06-18 深圳壹账通智能科技有限公司 智能条款分析方法、装置、计算机设备及存储介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113126936A (zh) * 2021-04-23 2021-07-16 深圳市爱商在线科技有限公司 一种适配多种文档类型的打印控件
CN113126936B (zh) * 2021-04-23 2022-04-12 深圳市爱商在线科技有限公司 一种适配多种文档类型的打印控件
CN114973259A (zh) * 2022-03-03 2022-08-30 北京电解智科技有限公司 信息抽取方法、装置和计算机可读存储介质

Similar Documents

Publication Publication Date Title
CN108460014B (zh) 企业实体的识别方法、装置、计算机设备及存储介质
CN110765770B (zh) 一种合同自动生成方法及装置
CN106649818B (zh) 应用搜索意图的识别方法、装置、应用搜索方法和服务器
US8775442B2 (en) Semantic search using a single-source semantic model
CN111104526A (zh) 一种基于关键词语义的金融标签提取方法及系统
US11651014B2 (en) Source code retrieval
CN109145110B (zh) 标签查询方法和装置
US10387456B2 (en) Systems and methods for records tagging based on a specific area or region of a record
CN111522901B (zh) 文本中地址信息的处理方法及装置
CN110110577B (zh) 识别菜名的方法及装置、存储介质、电子装置
CN107085583B (zh) 一种基于内容的电子文档管理方法及装置
CN106033416A (zh) 一种字符串处理方法及装置
CN110019669B (zh) 一种文本检索方法及装置
CN103559313B (zh) 搜索方法及装置
CN109522275B (zh) 基于用户生产内容的标签挖掘方法、电子设备及存储介质
CN112256845A (zh) 意图识别方法、装置、电子设备和计算机可读存储介质
CN111125543A (zh) 书籍推荐排序模型的训练方法、计算设备及存储介质
CN106844482B (zh) 一种基于搜索引擎的检索信息匹配方法及装置
CN108170293A (zh) 输入联想的个性化推荐方法及装置
CN110968664A (zh) 一种文书检索方法、装置、设备及介质
US9652997B2 (en) Method and apparatus for building emotion basis lexeme information on an emotion lexicon comprising calculation of an emotion strength for each lexeme
CN106611029B (zh) 提高网站站内搜索效率的方法和装置
CN108345694B (zh) 一种基于主题数据库的文献检索方法及系统
CN112528665A (zh) 一种基于语义理解的信息提取方法
CN113468339A (zh) 基于知识图谱的标签提取方法、系统、电子设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20210319