CN115563949A - 一种文本报告自动生成方法及系统 - Google Patents
一种文本报告自动生成方法及系统 Download PDFInfo
- Publication number
- CN115563949A CN115563949A CN202211254952.7A CN202211254952A CN115563949A CN 115563949 A CN115563949 A CN 115563949A CN 202211254952 A CN202211254952 A CN 202211254952A CN 115563949 A CN115563949 A CN 115563949A
- Authority
- CN
- China
- Prior art keywords
- report
- picture
- content
- effective
- template
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 26
- 238000000605 extraction Methods 0.000 claims abstract description 15
- 230000001502 supplementing effect Effects 0.000 claims abstract description 9
- 238000013329 compounding Methods 0.000 claims description 5
- 230000015572 biosynthetic process Effects 0.000 claims description 3
- 238000010276 construction Methods 0.000 claims description 3
- 238000003384 imaging method Methods 0.000 claims description 2
- 230000002194 synthesizing effect Effects 0.000 claims 1
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/186—Templates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/335—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/10—Protecting distributed programs or content, e.g. vending or licensing of copyrighted material ; Digital rights management [DRM]
- G06F21/16—Program or content traceability, e.g. by watermarking
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Multimedia (AREA)
- Technology Law (AREA)
- Computer Hardware Design (AREA)
- Computer Security & Cryptography (AREA)
- Editing Of Facsimile Originals (AREA)
Abstract
一种文本报告自动生成方法及系统,包括如下步骤:获取报告模板和原始数据;根据报告模板所需内容从原始数据当中提取有效内容;将有效内容补充到报告模板当中形成报告。本申请以报告模板作为提取的模板和要求,采用原始数据作为基础,将需要的数据提取之后放入到报告模板当中,最终快速形成一个符合要求的报告。
Description
技术领域
本申请涉及一种文本报告自动生成方法及系统。
背景技术
在数据处理过程中,报告是最常见的展示形式。现在的报告多是采用模板类型的设置模式。但是现在的自动化报告的信息获取的精准度比较差,在生成报告时,容易发生数据获取上的错误,另外则是在数据发生错误时,现有的模板无法起到预检测作用,而且现有的模板是一种固定模板,在出现额外的有效数据时,也无法体现在报告当中,这实际上缩减了模板自身的有效性和可拓展性。
发明内容
为了解决上述问题,本申请一方面公开了一种文本报告自动生成方法,包括如下步骤:获取报告模板和原始数据;根据报告模板所需内容从原始数据当中提取有效内容;将有效内容补充到报告模板当中形成报告。本申请以报告模板作为提取的模板和要求,采用原始数据作为基础,将需要的数据提取之后放入到报告模板当中,最终快速形成一个符合要求的报告。
优选的,对于原始数据进行有效内容的提取时,若无法得到有效内容,则对于原始数据的整体进行检索分析,得到与报告模板当中所需内容接近的内容作为次有效内容,对次有效内容进行解构得到解构内容,并将解构内容作为有效替代内容。本申请在进行原始内容提取时,若无法得到有效内容,还会自动进行拓展,从而保证最终报告内容在内容本身的提取对象和被提取内容具有可靠性的基础上,也具有一定的实质内容。
优选的,所述次有效内容按照如下方式进行分析得到:
获取报告模板对于所需内容的要求;
提取报告模板对于所需内容的要求中的关键词;
拓展关键词得到关键词组;
以该关键词组作为匹配要素,在原始数据当中进行匹配检索,得到匹配度超过匹配阈值的检索对象,将检索对象综合得到次有效内容;
所述检索对象以段落为提取起止点。
优选的,所述解构内容按照如下方式得到:
将检索对象按照匹配度从高到低进行排序;
将检索对象中有效信息按照匹配度的排序进行汇总,若从次级的检索对象得到的有效信息低于有效阈值,则停止进行解构内容的汇总;
按照匹配度最高的检索对象作为解构内容进行拓展描述,作为在不存在有效内容情况下的有效替代内容。优选的,在得到有效替代内容之后,将有效替代内容的构成形式作为备用模板写入到报告模板当中;
备用模板用于在原有报告模板无法得到对应的有效内容时,采用备用模板的要求再次进行有效内容的获取,若能够得到有效内容,则进入到下一部分有效内容的获取,若无法得到有效内容,则再进行有效替代内容的获取。
优选的,所述报告模板包括Api参数和SQL参数;所述Api参数包括参数类型、参数名称、参数描述、访问地址;所述SQL参数包括数据库信息、数据库地址、用户名、密码及查询语句。
优选的,所述Api参数采用占位符的方式在报告模板中形成可变参数;所述SQL参数用于与Api参数配合,根据Api参数从原始数据当中得到有效内容
优选的,还包括将报告进行图片化和附加水印的过程,包括如下步骤:
将报告转化为报告图片;
在报告图片上设置水印。本申请对于原报告图片进行双重的水印处理,第一方面是将溯源信息,即图片的基本信息引入其中,第二方面则是将客户端信息,也就是浏览该图片人员的信息也加入其中,通过双重水印的引入,可以在报告图片当中得到报告图片的制作人和浏览人,从而如果报告图片被外传,可以进行该报告图片被泄露情况以及其原有信息的溯源。
优选的,按照如下方式在图片上设置水印:
S1获取报告图片的溯源信息;
所述溯源信息包括单位名称、用户、主机MAC、报告图片的形成时间;
S2将溯源信息转化为第一隐形水印,基于报告图片将第一隐形水印融入到报告图片当中得到溯源图片;
将溯源信息经国密SM4加密算法转换为第一隐形水印;溯源信息按照如下方式得到第一隐形水印并将第一隐形水印与报告图片复合得到溯源图片:
确定第一隐形水印的位置,将第一隐形水印中的字符排列为方形设置的第一字符块,然后将第一字符块进行图片化处理,使得第一字符块中的线条宽度所占的像素数不少于10个;
获取报告图片的像素值,并将该像素值的R或G或B上检测到有第一字符块的线条的位置加1,然后对比加1前后颜色变化,若观测颜色变化超过变化阈值,所述变化阈值为像素颜色对应光波长的变化5%,则恢复原值,将第一字符块铺满报告图片,然后得到溯源图片。
溯源信息按照如下方式得到:
对比溯源图片和报告图片得到图片上像素的变化,并提取加1的像素的位置,得到带有第一字符块的灰度图片,然后将灰度图片进行文字提取得到第一隐形水印,然后经国密SM4加密算法得到溯源信息。
S3获取浏览的客户端信息;
所述客户端信息包括系统用户名、客户端IP、浏览时间;
S4将客户端信息转化为第二隐形水印,基于报告图片和第一隐形水印将第二隐形水印融入到报告图片当中得到档案图片。
将客户端信息经RSA算法转化为第二隐形水印。客户端信息按照如下方式得到第二隐形水印并将第二隐形水印与报告图片复合得到档案图片:
将第二隐形水印中的字符排列为条形设置的第二字符块,然后将第二字符块进行图片化处理,使得第二字符块中的线条宽度所占的像素数不少于2个;
获取第一字符块,将第二字符块中的线条部分按照第一字符块的线条长度切割后与第一字符块进行复合;
获取报告图片的像素值,并将该像素值的R或G或B上检测到有第一字符块的线条的位置加1,然后对比加1前后颜色变化,若观测颜色变化超过变化阈值,所述变化阈值为像素颜色对应光波长的变化5%,则恢复原值,然后得到档案图片;若检测到具有第一字符块线条的同时,还具有第二字符块线条,像素值则保持不变。
对于附加第一隐形水印和第二隐形水印的图片,所述档案信息和溯源信息按照如下方式得到:
对比档案图片和报告图片得到图片上像素的变化,并提取加1的像素的位置,得到带有第一字符块的灰度图片,然后将灰度图片进行文字提取得到第一隐形水印,然后经国密SM4加密算法得到溯源信息;将第一字符块上线条位置的文字进行文字提取得到第二隐形水印,并通过RSA算法得到客户端信息。
另一方面,本申请还公开了一种文本报告自动生成系统,包括如下模块:
拓展模块,用于获取报告模板和原始数据;
内容提取模块,用于根据报告模板所需内容从原始数据当中提取有效内容;
报告生成模块,用于将有效内容补充到报告模板当中形成报告。
模板补充模块,用于将有效替代内容的构成形式作为备用模板写入到报告模板当中。
本申请能够带来如下有益效果:
1.本申请以报告模板作为提取的模板和要求,采用原始数据作为基础,将需要的数据提取之后放入到报告模板当中,最终快速形成一个符合要求的报告。
2.本申请在进行原始内容提取时,若无法得到有效内容,还会自动进行拓展,从而保证最终报告内容在内容本身的提取对象和被提取内容具有可靠性的基础上,也具有一定的实质内容。
3.本申请对于报告图片进行双重的水印处理,第一方面是将溯源信息,即图片的基本信息引入其中,第二方面则是将客户端信息,也就是浏览该图片人员的信息也加入其中,通过双重水印的引入,可以在报告图片当中得到报告图片的制作人和浏览人,从而如果报告图片被外传,可以进行该报告图片被泄露情况以及其原有信息的溯源。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为实施例1的示意图;
图2为实施例2的示意图。
具体实施方式
为能清楚说明本方案的技术特点,下面通过具体实施方式,对本申请进行详细阐述。
在第一个实施例中,如图1所示,一种文本报告自动生成方法,包括如下步骤:
S101获取报告模板和原始数据;\
所述报告模板包括Api参数和SQL参数;所述Api参数包括参数类型、参数名称、参数描述、访问地址;所述SQL参数包括数据库信息、数据库地址、用户名、密码及查询语句。
所述Api参数采用占位符的方式在报告模板中形成可变参数;所述SQL参数用于与Api参数配合,根据Api参数从原始数据当中得到有效内容
S102根据报告模板所需内容从原始数据当中提取有效内容;
在对于原始数据进行有效内容的提取时,若无法得到有效内容,则对于原始数据的整体进行检索分析,得到与报告模板当中所需内容接近的内容作为次有效内容,对次有效内容进行解构得到解构内容,并将解构内容作为有效替代内容。
所述次有效内容按照如下方式进行分析得到:
获取报告模板对于所需内容的要求;
提取报告模板对于所需内容的要求中的关键词;
拓展关键词得到关键词组;
以该关键词组作为匹配要素,在原始数据当中进行匹配检索,得到匹配度超过匹配阈值的检索对象,将检索对象综合得到次有效内容;
所述检索对象以段落为提取起止点。
所述解构内容按照如下方式得到:
将检索对象按照匹配度从高到低进行排序;
将检索对象中有效信息按照匹配度的排序进行汇总,若从次级的检索对象得到的有效信息低于有效阈值,则停止进行解构内容的汇总;
按照匹配度最高的检索对象作为解构内容进行拓展描述,作为在不存在有效内容情况下的有效替代内容。S103得到有效替代内容之后,将有效替代内容的构成形式作为备用模板写入到报告模板当中
备用模板用于在原有报告模板无法得到对应的有效内容时,采用备用模板的要求再次进行有效内容的获取,若能够得到有效内容,则进入到下一部分有效内容的获取,若无法得到有效内容,则再进行有效替代内容的获取。
S104将有效内容、有效替代内容补充到报告模板当中形成报告。
S105将报告进行图片化和附加水印。
包括如下步骤:
将报告转化为报告图片;
在报告图片上设置水印。
按照如下方式在图片上设置水印:
S1获取报告图片的溯源信息;
所述溯源信息包括单位名称、用户、主机MAC、报告图片的形成时间;
S2将溯源信息转化为第一隐形水印,基于报告图片将第一隐形水印融入到报告图片当中得到溯源图片;
将溯源信息经国密SM4加密算法转换为第一隐形水印;溯源信息按照如下方式得到第一隐形水印并将第一隐形水印与报告图片复合得到溯源图片:
确定第一隐形水印的位置,将第一隐形水印中的字符排列为方形设置的第一字符块,然后将第一字符块进行图片化处理,使得第一字符块中的线条宽度所占的像素数不少于10个;
获取报告图片的像素值,并将该像素值的R或G或B上检测到有第一字符块的线条的位置加1,然后对比加1前后颜色变化,若观测颜色变化超过变化阈值,所述变化阈值为像素颜色对应光波长的变化5%,则恢复原值,将第一字符块铺满报告图片,然后得到溯源图片。
溯源信息按照如下方式得到:
对比溯源图片和报告图片得到图片上像素的变化,并提取加1的像素的位置,得到带有第一字符块的灰度图片,然后将灰度图片进行文字提取得到第一隐形水印,然后经国密SM4加密算法得到溯源信息。
S3获取浏览的客户端信息;
所述客户端信息包括系统用户名、客户端IP、浏览时间;
S4将客户端信息转化为第二隐形水印,基于报告图片和第一隐形水印将第二隐形水印融入到报告图片当中得到档案图片。
将客户端信息经RSA算法转化为第二隐形水印。客户端信息按照如下方式得到第二隐形水印并将第二隐形水印与报告图片复合得到档案图片:
将第二隐形水印中的字符排列为条形设置的第二字符块,然后将第二字符块进行图片化处理,使得第二字符块中的线条宽度所占的像素数不少于2个;
获取第一字符块,将第二字符块中的线条部分按照第一字符块的线条长度切割后与第一字符块进行复合;
获取报告图片的像素值,并将该像素值的R或G或B上检测到有第一字符块的线条的位置加1,然后对比加1前后颜色变化,若观测颜色变化超过变化阈值,所述变化阈值为像素颜色对应光波长的变化5%,则恢复原值,然后得到档案图片;若检测到具有第一字符块线条的同时,还具有第二字符块线条,像素值则保持不变。
对于附加第一隐形水印和第二隐形水印的图片,所述档案信息和溯源信息按照如下方式得到:
对比档案图片和报告图片得到图片上像素的变化,并提取加1的像素的位置,得到带有第一字符块的灰度图片,然后将灰度图片进行文字提取得到第一隐形水印,然后经国密SM4加密算法得到溯源信息;将第一字符块上线条位置的文字进行文字提取得到第二隐形水印,并通过RSA算法得到客户端信息。
在第二实施例中,如图2所示,一种文本报告自动生成系统,包括如下模块:
拓展模块201,用于获取报告模板和原始数据;
内容提取模块202,用于根据报告模板所需内容从原始数据当中提取有效内容;
报告生成模块203,用于将有效内容补充到报告模板当中形成报告。
模板补充模块204,用于将有效替代内容的构成形式作为备用模板写入到报告模板当中。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
Claims (10)
1.一种文本报告自动生成方法,其特征在于:包括如下步骤:
获取报告模板和原始数据;
根据报告模板所需内容从原始数据当中提取有效内容;
将有效内容补充到报告模板当中形成报告。
2.根据权利要求1所述的一种文本报告自动生成方法,其特征在于:在对于原始数据进行有效内容的提取时,若无法得到有效内容,则对于原始数据的整体进行检索分析,得到与报告模板当中所需内容接近的内容作为次有效内容,对次有效内容进行解构得到解构内容,并将解构内容作为有效替代内容。
3.根据权利要求2所述的一种文本报告自动生成方法,其特征在于:所述次有效内容按照如下方式进行分析得到:
获取报告模板对于所需内容的要求;
提取报告模板对于所需内容的要求中的关键词;
拓展关键词得到关键词组;
以该关键词组作为匹配要素,在原始数据当中进行匹配检索,得到匹配度超过匹配阈值的检索对象,将检索对象综合得到次有效内容;
所述检索对象以段落为提取起止点。
4.根据权利要求3所述的一种文本报告自动生成方法,其特征在于:所述解构内容按照如下方式得到:
将检索对象按照匹配度从高到低进行排序;
将检索对象中有效信息按照匹配度的排序进行汇总,若从次级的检索对象得到的有效信息低于有效阈值,则停止进行解构内容的汇总;
按照匹配度最高的检索对象作为解构内容进行拓展描述,作为在不存在有效内容情况下的有效替代内容。
5.根据权利要求4所述的一种文本报告自动生成方法,其特征在于:在得到有效替代内容之后,将有效替代内容的构成形式作为备用模板写入到报告模板当中;
备用模板用于在原有报告模板无法得到对应的有效内容时,采用备用模板的要求再次进行有效内容的获取,若能够得到有效内容,则进入到下一部分有效内容的获取,若无法得到有效内容,则再进行有效替代内容的获取。
6.根据权利要求1所述的一种文本报告自动生成方法,其特征在于:所述报告模板包括Api参数和SQL参数;所述Api参数包括参数类型、参数名称、参数描述、访问地址;所述SQL参数包括数据库信息、数据库地址、用户名、密码及查询语句。
7.根据权利要求6所述的一种文本报告自动生成方法,其特征在于:所述Api参数采用占位符的方式在报告模板中形成可变参数;所述SQL参数用于与Api参数配合,根据Api参数从原始数据当中得到有效内容。
8.根据权利要求1所述的一种文本报告自动生成方法,其特征在于:还包括将报告进行图片化和附加水印的过程,包括如下步骤:
将报告转化为报告图片;
在报告图片上设置水印。
9.根据权利要求8所述的一种文本报告自动生成方法,其特征在于:按照如下方式在图片上设置水印:
S1获取报告图片的溯源信息;
所述溯源信息包括单位名称、用户、主机MAC、报告图片的形成时间;
S2将溯源信息转化为第一隐形水印,基于报告图片将第一隐形水印融入到报告图片当中得到溯源图片;
将溯源信息经国密SM4加密算法转换为第一隐形水印;溯源信息按照如下方式得到第一隐形水印并将第一隐形水印与报告图片复合得到溯源图片:
确定第一隐形水印的位置,将第一隐形水印中的字符排列为方形设置的第一字符块,然后将第一字符块进行图片化处理,使得第一字符块中的线条宽度所占的像素数不少于10个;
获取报告图片的像素值,并将该像素值的R或G或B上检测到有第一字符块的线条的位置加1,然后对比加1前后颜色变化,若观测颜色变化超过变化阈值,所述变化阈值为像素颜色对应光波长的变化5%,则恢复原值,将第一字符块铺满报告图片,然后得到溯源图片。
溯源信息按照如下方式得到:
对比溯源图片和报告图片得到图片上像素的变化,并提取加1的像素的位置,得到带有第一字符块的灰度图片,然后将灰度图片进行文字提取得到第一隐形水印,然后经国密SM4加密算法得到溯源信息。
S3获取浏览的客户端信息;
所述客户端信息包括系统用户名、客户端IP、浏览时间;
S4将客户端信息转化为第二隐形水印,基于报告图片和第一隐形水印将第二隐形水印融入到报告图片当中得到档案图片。
将客户端信息经RSA算法转化为第二隐形水印。客户端信息按照如下方式得到第二隐形水印并将第二隐形水印与报告图片复合得到档案图片:
将第二隐形水印中的字符排列为条形设置的第二字符块,然后将第二字符块进行图片化处理,使得第二字符块中的线条宽度所占的像素数不少于2个;
获取第一字符块,将第二字符块中的线条部分按照第一字符块的线条长度切割后与第一字符块进行复合;
获取报告图片的像素值,并将该像素值的R或G或B上检测到有第一字符块的线条的位置加1,然后对比加1前后颜色变化,若观测颜色变化超过变化阈值,所述变化阈值为像素颜色对应光波长的变化5%,则恢复原值,然后得到档案图片;若检测到具有第一字符块线条的同时,还具有第二字符块线条,像素值则保持不变。
对于附加第一隐形水印和第二隐形水印的图片,所述档案信息和溯源信息按照如下方式得到:
对比档案图片和报告图片得到图片上像素的变化,并提取加1的像素的位置,得到带有第一字符块的灰度图片,然后将灰度图片进行文字提取得到第一隐形水印,然后经国密SM4加密算法得到溯源信息;将第一字符块上线条位置的文字进行文字提取得到第二隐形水印,并通过RSA算法得到客户端信息。
10.一种文本报告自动生成系统,其特征在于:包括如下模块:
拓展模块,用于获取报告模板和原始数据;
内容提取模块,用于根据报告模板所需内容从原始数据当中提取有效内容;
报告生成模块,用于将有效内容补充到报告模板当中形成报告。
模板补充模块,用于将有效替代内容的构成形式作为备用模板写入到报告模板当中。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211254952.7A CN115563949A (zh) | 2022-10-13 | 2022-10-13 | 一种文本报告自动生成方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211254952.7A CN115563949A (zh) | 2022-10-13 | 2022-10-13 | 一种文本报告自动生成方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115563949A true CN115563949A (zh) | 2023-01-03 |
Family
ID=84745512
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211254952.7A Pending CN115563949A (zh) | 2022-10-13 | 2022-10-13 | 一种文本报告自动生成方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115563949A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116089570A (zh) * | 2023-04-07 | 2023-05-09 | 北京大学深圳研究生院 | 报告生成方法、装置、系统及存储介质 |
-
2022
- 2022-10-13 CN CN202211254952.7A patent/CN115563949A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116089570A (zh) * | 2023-04-07 | 2023-05-09 | 北京大学深圳研究生院 | 报告生成方法、装置、系统及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6178417B1 (en) | Method and means of matching documents based on text genre | |
WO2015143970A1 (zh) | 一种基于二维码的信息采集系统及其方法 | |
US7746341B2 (en) | System and method for parsing point-cloud data | |
CN102411582B (zh) | 图片搜索方法、装置及客户端 | |
CN109272440B (zh) | 一种联合文本和图像内容的缩略图生成方法及系统 | |
CN102045268B (zh) | 一种电子邮件数据恢复方法及装置 | |
CN115563949A (zh) | 一种文本报告自动生成方法及系统 | |
CN105373590A (zh) | 知识数据的处理方法及装置 | |
CN102508901A (zh) | 基于内容的海量图像检索方法和系统 | |
Joshi et al. | Web document text and images extraction using DOM analysis and natural language processing | |
CN112364114A (zh) | 地址标准化方法、装置、计算机设备和存储介质 | |
CN105989125A (zh) | 对无结果词进行标签识别的搜索方法和系统 | |
CN110414518A (zh) | 网址识别方法、装置、计算机设备和存储介质 | |
CN113821608A (zh) | 服务搜索方法、装置和计算机设备以及存储介质 | |
CN112417195A (zh) | 基于移动端的商标查询系统、方法及存储介质 | |
CN112464907A (zh) | 一种文档处理系统及方法 | |
CN112470154B (zh) | 检测web网页安全性的方法和装置 | |
CN108460116B (zh) | 搜索方法、装置、计算机设备、存储介质及搜索系统 | |
CN106844553A (zh) | 基于样本数据的数据探测和扩充方法及装置 | |
CN207037679U (zh) | 一种快捷扫描发票信息的系统 | |
CN115186240A (zh) | 基于关联性信息的社交网络用户对齐方法、装置、介质 | |
CN101739432A (zh) | 图形元件查找系统及方法 | |
CN115618038A (zh) | 一种含隐形水印json格式的资产管理方法及系统 | |
KR20000049411A (ko) | 검색사이트의 검색결과 광고장치 및 그 방법 | |
CN111158497A (zh) | 一种输入法的常用词词库识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |