CN116226526A - 一种知识产权智能检索平台及方法 - Google Patents

一种知识产权智能检索平台及方法 Download PDF

Info

Publication number
CN116226526A
CN116226526A CN202310195777.7A CN202310195777A CN116226526A CN 116226526 A CN116226526 A CN 116226526A CN 202310195777 A CN202310195777 A CN 202310195777A CN 116226526 A CN116226526 A CN 116226526A
Authority
CN
China
Prior art keywords
search
module
user
retrieval
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202310195777.7A
Other languages
English (en)
Inventor
田鑫
武月
张涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hui Yan Intellectual Property Service Co ltd
Original Assignee
Hui Yan Intellectual Property Service Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hui Yan Intellectual Property Service Co ltd filed Critical Hui Yan Intellectual Property Service Co ltd
Priority to CN202310195777.7A priority Critical patent/CN116226526A/zh
Publication of CN116226526A publication Critical patent/CN116226526A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3322Query formulation using system suggestions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/53Querying
    • G06F16/535Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • G06F16/90344Query processing by using string matching techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/18Legal services
    • G06Q50/184Intellectual property management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Computational Linguistics (AREA)
  • Tourism & Hospitality (AREA)
  • Technology Law (AREA)
  • Operations Research (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及智能检索技术领域,具体公开了一种知识产权智能检索平台及方法,对在知识产权智能检索平台注册的用户进行管理,对检索用户进行画像,得到用户侧写,并对检索内容进行分类,得到检索内容类型;通过对检索内容类型判定后,利用关键词提取模块和图像信息提取模块对检索内容进行信息提取,并将提取到的内容信息发送至信息处理模块,进行处理,得到所有可能的检索结果;结合所有检索结果以及用户侧写,利用检索推荐模块对检索结果进行筛选,得到最佳检索结果,并利用检索报告生成模块,对检索推荐模块得到的检索结果进行整理分析,得到检索报告。解决了现有技术中独权能解决检索过程中存在干扰,检索不够全面,检索速度较慢的问题。

Description

一种知识产权智能检索平台及方法
技术领域
本发明涉及智能检索技术领域,尤其涉及一种知识产权智能检索平台及方法。
背景技术
知识产权,是“基于创造成果和工商标记依法产生的权利的统称”。最主要的三种知识产权是著作权、专利权和商标权。
知识产权智能检索是新兴事物,在初期使用时,经常会有不适和迷茫感,智能检索的四种方法有布尔检索、先布尔检索后语义排序、语义检索、先语义后布尔。
对于知识产权检索的方法有很多,中国发明专利申请号CN202110131651.4,公开了一种知识产权检索系统及方法,主要包括:检索平台和检索终端,所述检索终端为检索平台使用的载体,所述检索平台包括用户管理模块、专利检索模块、检索类型选择模块、检索关键词输入模块、同义词转化模块、翻译转化模块、数据采集模块、数据处理模块、专利检索报告生成模块和数据库,所述用户管理模块用于登陆使用,所述数据采集模块与数据库连接,所述数据采集模块将采集到的公开内容存入至数据库内,所述专利检索模块与检索类型选择模块、检索关键词输入模块连接,所述检索关键词输入模块还与同义词转化模块、翻译转化模块连接以及数据处理模块连接,所述专利检索报告生成模块与数据处理模块连接。
但上述技术至少存在如下问题:检索过程中存在干扰,检索不够全面,检索速度较慢。
发明内容
本发明通过提供一种知识产权智能检索平台及方法,解决了现有技术中独权能解决检索过程中存在干扰,检索不够全面,检索速度较慢的技术问题,实现了多用户之间查询检索互不干扰、全面快速检索的技术效果。
本发明具体包括以下技术方案:
一种知识产权智能检索平台,包括以下部分:
用户管理模块,用户画像模块,检索分类模块,知识产权数据库,关键词提取模块,图像信息提取模块,信息处理模块,检索推荐模块,检索报告生成模块;
所述用户管理模块,指对在知识产权智能检索平台进行注册的用户进行管理以及用户信息管理;
所述用户画像模块,针对所述用户管理模块中所含的用户信息以及用户历史检索行为分析,对用户进行画像,得到用户画像侧写,推测用户检索相关知识产权信息;
所述检索分类模块,针对输入检索信息的不同类型,进行分类,并根据分类后的信息类型进行对应的检索;
所述知识产权数据库,包含所有知识产权信息,以及知识产权关键词对应词典;
所述关键词提取模块,根据所述检索分类模块得到的文字类型检索内容,进行关键词提取,得到检索关键词信息;
所述图像信息提取模块,根据所述检索分类模块得到的图像类型检索内容,进行图像处理以及特征提取,得到图像数据信息;
所述信息处理模块,对所述关键词提取模块以及所述图像信息提取模块得到的信息,进行处理,得到最大可能检索内容信息,并调用知识产权数据库中信息,得到所有可能的检索结果;
所述检索推荐模块,结合用户侧写对所述信息处理模块得到的所有检索见过进行筛查筛选,对用户检索结果进行推荐,得到最佳检索内容;
所述检索报告生成模块,对所述检索推荐模块得到的检索内容进行整理分析,得到检索报告。
一种知识产权智能检索方法,包括以下步骤:
步骤S1. 通过用户管理模块对在知识产权智能检索平台注册的用户进行管理,以及用户画像模块对检索用户进行画像,得到用户侧写,并利用检索分类模块对检索内容进行分类,得到检索内容类型;
步骤S2. 通过对检索内容类型判定后,利用关键词提取模块和图像信息提取模块对检索内容进行信息提取,并将提取到的内容信息发送至信息处理模块,进行处理,得到所有可能的检索结果;
步骤S3. 结合所有检索结果以及用户侧写,利用检索推荐模块对检索结果进行筛选,得到最佳检索结果,并利用检索报告生成模块,对检索推荐模块得到的检索结果进行整理分析,得到检索报告。
进一步,所述步骤S1具体包括:
通过用户信息以及用户检索历史行为构建用户画像模型得到用户侧写,为后续检索内容推荐进行铺垫,同时利用检索分类模块对检索内容进行分类,得到用户提交的检索内容类型。
进一步,所述步骤S1还包括:
构建用户画像模型对用户进行侧写,具体模型构建如下:
Figure SMS_1
其中,
Figure SMS_2
表示用户账号集合,
Figure SMS_3
表示用户信息集合,
Figure SMS_4
表示用户历史行为信息集合,
Figure SMS_5
表示用户历史行为分析结果集合,
Figure SMS_6
表示模型输出,即用户侧写。
进一步,所述步骤S2具体包括:
利用关键词提取模块和图像信息提取模块对检索内容进行信息提取,得到检索内容的文本信息和图像信息,并将提取到的内容信息发送至信息处理模块,针对文本信息利用最大似然匹配法进行信息处理,得到所有可能的检索结果。
进一步,所述步骤S2还包括:
构建以零点为原点,以声母、韵母、音调、笔画为坐标轴的空间坐标系,并在所述空间坐标系中利用最大似然匹配算法计算检索内容与知识产权数据库d对比计算得出最短欧式距离,进一步得到知识产权数据库中与检索内容相匹配的检索结果。
进一步,所述步骤S2还包括:
在计算最短欧式距离时,分别针对关键词单一检索、关键词组合检索以及长句检索进行讨论计算。
进一步,所述步骤S3具体包括:
根据所有可能检索结果以及用户侧写,构建检索推荐模型对检索结果进行筛选,得到最佳检索结果,并利用检索报告生成模块,对检索推荐模块得到的检索结果进行整理分析,得到检索报告。
进一步,所述步骤S3还包括:
构建检索推荐模型对检索结果进行筛选,具体构建过程如下:
Figure SMS_7
其中,
Figure SMS_8
表示信息处理模块得到的所有可能检索结果集合,
Figure SMS_9
表示用户画像模块对用户的侧写集合,
Figure SMS_10
表示模型的输出,即最佳检索结果。
本发明至少具有如下技术效果或优点:
1、本发明通过利用用户信息以及用户历史检索行为分析构建用户画像模型完成对用户的侧写,为后续检索内容推荐奠定基础,以得到更满足用户需求的检索结果,并对检索内容进行分类,更全面高效准确地对检索内容进行分析,进一步得到检索结果。
2、本发明通过构建以声母、韵母、音调、笔画为坐标轴,零点为原点的空间坐标系,对所有可能出现的字符进行坐标定位,并利用最大似然匹配法计算检索内容与知识产权库中所含信息的最小欧式距离,准确定位到检索结果,进一步更高效准确地完成知识产权智能检索。
3、本发明通过构建检索推荐模型对检索结果进行筛选,降低了检索结果的冗余性,剔除相关性较小的检索结果,进一步得到最佳检索结果,更高效更准确全面地实现知识产权智能检索。
附图说明
图1为本发明所述一种知识产权智能检索平台框图;
图2为本发明所述一种知识产权智能检索方法的流程图。
具体实施方式
本申请实施例通过提供一种知识产权智能检索平台及方法,解决了现有技术中检索过程中存在干扰,检索不够全面,检索速度较慢的技术问题,总体思路如下:
通过用户管理模块对在知识产权智能检索平台注册的用户进行管理,以及用户画像模块对检索用户进行画像,得到用户侧写,并利用检索分类模块对检索内容进行分类,得到检索内容类型;通过对检索内容类型判定后,利用关键词提取模块和图像信息提取模块对检索内容进行信息提取,并将提取到的内容信息发送至信息处理模块,进行处理,得到所有可能的检索结果;结合所有检索结果以及用户侧写,利用检索推荐模块对检索结果进行筛选,得到最佳检索结果,并利用检索报告生成模块,对检索推荐模块得到的检索结果进行整理分析,得到检索报告。通过利用用户信息以及用户历史检索行为分析构建用户画像模型完成对用户的侧写,为后续检索内容推荐奠定基础,以得到更满足用户需求的检索结果,并对检索内容进行分类,更全面高效准确地对检索内容进行分析,进一步得到检索结果;通过构建以声母、韵母、音调、笔画为坐标轴,零点为原点的空间坐标系,对所有可能出现的字符进行坐标定位,并利用最大似然匹配法计算检索内容与知识产权库中所含信息的最小欧式距离,准确定位到检索结果,进一步更高效准确地完成知识产权智能检索;通过构建检索推荐模型对检索结果进行筛选,降低了检索结果的冗余性,剔除相关性较小的检索结果,进一步得到最佳检索结果,更高效更准确全面地实现知识产权智能检索。
为了更好的理解上述技术方案,下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明。
参照附图1,本发明所述的一种知识产权智能检索平台包括以下部分:
用户管理模块010,用户画像模块020,检索分类模块030,知识产权数据库040,关键词提取模块050,图像信息提取模块060,信息处理模块070,检索推荐模块080,检索报告生成模块090;
所述用户管理模块,指对在知识产权智能检索平台进行注册的用户进行管理以及用户信息管理;
所述用户画像模块,针对用户管理模块中所含的用户信息以及用户历史检索行为分析,对用户进行画像,得到用户画像侧写,推测用户检索相关知识产权信息;
所述检索分类模块,针对输入检索信息的不同类型,进行分类,并根据分类后的信息类型进行对应的检索;所述信息类型,包括文字类型、图像类型;
所述知识产权数据库,包含所有知识产权信息,以及知识产权关键词对应词典;
所述关键词提取模块,根据检索分类模块得到的文字类型检索内容,进行关键词提取,得到检索关键词信息;
所述图像信息提取模块,根据检索分类模块得到的图像类型检索内容,进行图像处理以及特征提取,得到图像数据信息;
所述信息处理模块,对关键词提取模块以及图像信息提取模块得到的信息,进行处理,得到最大可能检索内容信息,并调用知识产权数据库中信息,得到所有可能的检索结果;
所述检索推荐模块,结合用户侧写对信息处理模块得到的所有检索见过进行筛查筛选,对用户检索结果进行推荐,得到最佳检索内容;
所述检索报告生成模块,对检索推荐模块得到的检索内容进行整理分析,得到检索报告;
具体的,用户在知识产权智能检索平台进行注册,得到用户的信息,同时利用用户画像模块,针对用户信息以及用户历史检索行为分析,对用户进行画像,得到用户画像侧写,推测用户检索相关知识产权信息;利用检索分类模块对用户检索内容进行分类,得到所述检索内容的信息类型,针对检索内容的信息类型利用关键词提取模块和图像信息提取模块进行信息提取,根据提取到的信息与知识产权数据库对比经信息处理模块处理得到所有可能的检索结果;最后利用检索推荐模块,结合用户侧写对信息处理模块得到的所有检索见过进行筛查筛选,得到最佳检索内容并通过检索报告生成模块得到检索报告;
参照附图2,本发明所述一种知识产权智能检索方法包括以下步骤:
S1. 通过用户管理模块对在知识产权智能检索平台注册的用户进行管理,以及用户画像模块对检索用户进行画像,得到用户侧写,并利用检索分类模块对检索内容进行分类,得到检索内容类型。
S11. 用户在知识产权智能检索平台进行注册,利用用户管理模块对用户信息进行管理,并通过用户画像模块根据用户信息以及用户检索历史行为进行用户侧写。
通过在知识产权智能检索平台注册,得到用户独有的账号,通过账号可准确定位到账号所属用户,记用户账号集合为
Figure SMS_11
,集合中的任意一个元素可用
Figure SMS_12
表示,
Figure SMS_13
表示第k个用户账号,N表示用户总数,通过在用户注册的信息中,得到用户的关注领域,年龄信息,公司业务范围,专业信息以及其他用户信息,在所述知识产权检索平台中用户账号的独有性可有效地避免在检索过程中的干扰。
对于注册过的老用户记录每次检索信息并完成对历史搜索行为的分析,具体地分析为通过历史搜索行为得到用户历史搜索信息内容以及信息内容对应的行业领域,进一步通过构建画像模型对用户进行画像,得到用户的侧写,具体模型构建如下:
Figure SMS_14
其中,
Figure SMS_15
表示用户账号集合,
Figure SMS_16
表示用户信息集合,
Figure SMS_17
表示用户历史行为信息集合,
Figure SMS_18
表示用户历史行为分析结果集合,
Figure SMS_19
表示模型输出,即用户侧写。
具体地,用户信息集合可通过用户管理模块获取,用户历史行为信息集合可通过用户管理模块对用户历史行为进行搜集获取,用户历史行为分析结果集合为由通过对用户历史行为信息集合处理得到用户的历史搜索内容信息以及内容信息对应的行业领域组成,通过对用户信息集合以及历史行为分析结果集合取交集得到用户侧写即用户最关注领域有哪些领域,为用户检索内容推荐提供有效建议。
S12. 通过利用检索分类模块对用户检索内容进行分类,得到检索内容类型。
在提交检索内容时,针对检索内容的信息类型不同,分别设置两个搜索按钮,即文本搜索和图片搜索,根据用户提交的检索内容的具体操作,将对应的检索内容送至关键词提取模块和图像信息模块,进行下一步的处理。
本发明通过利用用户信息以及用户历史检索行为分析构建用户画像模型完成对用户的侧写,为后续检索内容推荐奠定基础,以得到更满足用户需求的检索结果,并对检索内容进行分类,更全面高效准确地对检索内容进行分析,进一步得到检索结果。
S2. 通过对检索内容类型判定后,利用关键词提取模块和图像信息提取模块对检索内容进行信息提取,并将提取到的内容信息发送至信息处理模块,进行处理,得到所有可能的检索结果。
S21. 根据检索内容的信息类型,利用关键词提取模块和图像信息提取模块对检索内容进行信息提取。
针对用户提交的检索内容,在关键词提取模块以及图像信息提取模块中均采用现有技术进行操作处理,得到对应的关键词信息以及图像特征信息,所述关键词信息为检索内容的关键词、关键词组合和关键句。
S22. 根据提取到的内容信息,结合知识产权数据库定位检索目标,得到所有可能的检索结果。
针对文字类型的检索内容,首先在知识产权数据库中对所有领域中的关键词进行字典序处理,构建以声母、韵母、音调、笔画为坐标轴,零点为原点的空间坐标系集合Space,根据检索内容的长度大小来确定空间坐标系集合Space的长度,同时针对集合Space的大小来确定检索类型,所述检索类型包括单一检索、组合检索、长句检索;
所述单一检索,指仅含有一个关键词的检索,具体检索过程如下:
首先根据关键词确定其对应的空间坐标系集合S
Figure SMS_20
,集合中任意一个元素可用
Figure SMS_23
表示,
Figure SMS_25
表示第i个字符,l表示字符个数,且每个字符根据其声母、韵母、音调、笔画来确定字符坐标
Figure SMS_22
,从知识产权数据库中提取到所有可能关键词组成的集合为W
Figure SMS_24
M表示集合长度,
Figure SMS_26
表示第M个关键词,由
Figure SMS_27
个字符组成,即
Figure SMS_21
;利用最大似然估计匹配法对检索内容与知识产权数据库中所有可能进行匹配,得到最有可能的匹配项,具体计算过程如下:
第一步:从集合W中筛选出与检索关键词长度l相同的关键词构成集合
Figure SMS_28
,其中
Figure SMS_29
K表示集合
Figure SMS_30
的元素个数;
第二步:计算
Figure SMS_31
其中,
Figure SMS_32
表示集合
Figure SMS_33
中第j个关键词中任意一个字符对应于空间坐标系中的坐标。
通过第二步中的计算公式可以找到集合
Figure SMS_34
中与检索内容最为匹配的关键词位置,并准确定位到对应于知识产权库中关键词对应的检索结果P
作为一个具体实施例,当检索关键词为“网络”时,l取值为2,
Figure SMS_35
为网,
Figure SMS_36
为络;
所述组合检索,指针对多个关键词组合检索,具体检索过程如下:
首先根据关键词确定其对应的空间坐标系集合
Figure SMS_39
,其中,n表示关键词个数,集合中的任意一个关键词可由
Figure SMS_42
表示,
Figure SMS_45
Figure SMS_40
中任意一个字符元素可用
Figure SMS_43
表示,
Figure SMS_46
表示第k个关键词中的第i个字符,
Figure SMS_48
表示第k个关键词中字符个数,且每个字符根据其声母、韵母、音调、笔画来确定字符坐标
Figure SMS_37
,从知识产权数据库中提取到所有可能关键词组成的集合为W
Figure SMS_41
M表示集合长度,
Figure SMS_44
表示第M个关键词,由
Figure SMS_47
个字符组成,即
Figure SMS_38
;利用最大似然估计匹配法对检索内容与知识产权数据库中所有可能进行匹配,得到最有可能的匹配项,具体计算过程如下:
第一步:从集合W中筛选出与检索关键词组合长度相同的关键词构成集合
Figure SMS_49
,其中,集合中的任意一个元素可用
Figure SMS_50
表示,
Figure SMS_51
Figure SMS_52
第二步:计算
Figure SMS_53
通过第二步中的计算公式可以找到集合
Figure SMS_54
中与检索内容最为匹配的关键词位置,并准确定位到对应于知识产权库中关键词对应的检索结果P
所述长句检索,指的是检索内容为多个关键词并添加一定的定语进行组合的句搜索,具体检索过程如下:
首先根据检索内容的长句逐字确定其对应的空间坐标系集合
Figure SMS_55
Figure SMS_56
,其中,m表示字符个数,每个字符根据其声母、韵母、音调、笔画来确定字符坐标
Figure SMS_57
,从知识产权数据库中提取到所有可能长句组成的集合为LW
Figure SMS_58
p表示集合长度,
Figure SMS_59
表示第p个可能的长句,由
Figure SMS_60
个字符组成,即
Figure SMS_61
;利用最大似然估计匹配法对检索内容与知识产权数据库中所有可能进行匹配,得到最有可能的匹配项,具体计算过程如下:
第一步:从集合LW中筛选出与检索关键词组合长度相同的关键词构成集合
Figure SMS_62
,其中,集合中的任意一个元素可用
Figure SMS_63
表示,
Figure SMS_64
Figure SMS_65
第二步:计算
Figure SMS_66
通过第二步中的计算公式可以找到集合
Figure SMS_67
中与检索内容最为匹配的长句位置,并准确定位到对应于知识产权库中关键词对应的检索结果P
在信息处理模块中对检索内容信息为图片类型的处理采用现有技术进行处理。
本发明通过构建以声母、韵母、音调、笔画为坐标轴,零点为原点的空间坐标系,对所有可能出现的字符进行坐标定位,并利用最大似然匹配法计算检索内容与知识产权库中所含信息的最小欧式距离,准确定位到检索结果,进一步更高效准确地完成知识产权智能检索。
S3. 结合所有检索结果以及用户侧写,利用检索推荐模块对检索结果进行筛选,得到最佳检索结果,并利用检索报告生成模块,对检索推荐模块得到的检索结果进行整理分析,得到检索报告。
S31. 根据所有可能的检索结果以及用户侧写,构建检索推荐模型对检索结果进行筛选,得到最佳检索结果。
构建检索推荐模型对信息处理模块得到的检索结果进行筛选,具体模型构建如下:
Figure SMS_68
其中,
Figure SMS_69
表示信息处理模块得到的所有可能检索结果集合,
Figure SMS_70
表示用户画像模块对用户的侧写集合,
Figure SMS_71
表示模型的输出,即最佳检索结果。
具体的,对所有可能检索结果集合P进行领域分组,得到分组集合FP
Figure SMS_72
Figure SMS_73
,q表示分组集合的组数,根据步骤S2中计算检索内容的欧式距离计算得到每个分组领域的权重集合得到权重集合
Figure SMS_74
Figure SMS_75
,得到权重分组集合
Figure SMS_76
Figure SMS_77
,根据用户画像模块对用户的侧写集合CX获得的用户相对关注领域,对集合
Figure SMS_78
以及侧写集合CX取交集,即得到模型输出,最佳检索结果。
S32. 在检索报告生成模块中,根据步骤S31中得到的最佳检索结果,利用字典排序法生成对应的检索报告,已完成知识产权的智能检索过程。
本发明通过构建检索推荐模型对检索结果进行筛选,降低了检索结果的冗余性,剔除相关性较小的检索结果,进一步得到最佳检索结果,更高效更准确全面地实现知识产权智能检索。
综上所述,便完成了本发明所述的一种知识产权智能检索平台及方法。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (9)

1.一种知识产权智能检索平台,其特征在于,包括以下部分:
用户管理模块,用户画像模块,检索分类模块,知识产权数据库,关键词提取模块,图像信息提取模块,信息处理模块,检索推荐模块,检索报告生成模块;
所述用户管理模块,指对在知识产权智能检索平台进行注册的用户进行管理以及用户信息管理;
所述用户画像模块,针对所述用户管理模块中所含的用户信息以及用户历史检索行为分析,对用户进行画像,得到用户画像侧写,推测用户检索相关知识产权信息;
所述检索分类模块,针对输入检索信息的不同类型,进行分类,并根据分类后的信息类型进行对应的检索;
所述知识产权数据库,包含所有知识产权信息,以及知识产权关键词对应词典;
所述关键词提取模块,根据所述检索分类模块得到的文字类型检索内容,进行关键词提取,得到检索关键词信息;
所述图像信息提取模块,根据所述检索分类模块得到的图像类型检索内容,进行图像处理以及特征提取,得到图像数据信息;
所述信息处理模块,对所述关键词提取模块以及所述图像信息提取模块得到的信息,进行处理,得到最大可能检索内容信息,并调用知识产权数据库中信息,得到所有可能的检索结果;
所述检索推荐模块,结合用户侧写对所述信息处理模块得到的所有检索见过进行筛查筛选,对用户检索结果进行推荐,得到最佳检索内容;
所述检索报告生成模块,对所述检索推荐模块得到的检索内容进行整理分析,得到检索报告。
2.一种知识产权智能检索方法,其特征在于,包括以下步骤:
步骤S1. 通过用户管理模块对在知识产权智能检索平台注册的用户进行管理,以及用户画像模块对检索用户进行画像,得到用户侧写,并利用检索分类模块对检索内容进行分类,得到检索内容类型;
步骤S2. 通过对检索内容类型判定后,利用关键词提取模块和图像信息提取模块对检索内容进行信息提取,并将提取到的内容信息发送至信息处理模块,进行处理,得到所有可能的检索结果;
步骤S3. 结合所有检索结果以及用户侧写,利用检索推荐模块对检索结果进行筛选,得到最佳检索结果,并利用检索报告生成模块,对检索推荐模块得到的检索结果进行整理分析,得到检索报告。
3.根据权利要求2所述的一种知识产权智能检索方法,其特征在于,所述步骤S1具体包括:
通过用户信息以及用户检索历史行为构建用户画像模型得到用户侧写,为后续检索内容推荐进行铺垫,同时利用检索分类模块对检索内容进行分类,得到用户提交的检索内容类型。
4.根据权利要求3所述的一种知识产权智能检索方法,其特征在于,所述步骤S1还包括:
构建用户画像模型对用户进行侧写,具体模型构建如下:
Figure QLYQS_1
其中,
Figure QLYQS_2
表示用户账号集合,
Figure QLYQS_3
表示用户信息集合,
Figure QLYQS_4
表示用户历史行为信息集合,
Figure QLYQS_5
表示用户历史行为分析结果集合,
Figure QLYQS_6
表示模型输出,即用户侧写。
5.根据权利要求2所述的一种知识产权智能检索方法,其特征在于,所述步骤S2具体包括:
利用关键词提取模块和图像信息提取模块对检索内容进行信息提取,得到检索内容的文本信息和图像信息,并将提取到的内容信息发送至信息处理模块,针对文本信息利用最大似然匹配法进行信息处理,得到所有可能的检索结果。
6.根据权利要求5所述的一种知识产权智能检索方法,其特征在于,所述步骤S2还包括:
构建以零点为原点,以声母、韵母、音调、笔画为坐标轴的空间坐标系,并在所述空间坐标系中利用最大似然匹配算法计算检索内容与知识产权数据库d对比计算得出最短欧式距离,进一步得到知识产权数据库中与检索内容相匹配的检索结果。
7.根据权利要求6所述的一种知识产权智能检索方法,其特征在于,所述步骤S2还包括:
在计算最短欧式距离时,分别针对关键词单一检索、关键词组合检索以及长句检索进行讨论计算。
8.根据权利要求2所述的一种知识产权智能检索方法,其特征在于,所述步骤S3具体包括:
根据所有可能检索结果以及用户侧写,构建检索推荐模型对检索结果进行筛选,得到最佳检索结果,并利用检索报告生成模块,对检索推荐模块得到的检索结果进行整理分析,得到检索报告。
9.根据权利要求8所述的一种知识产权智能检索方法,其特征在于,所述步骤S3还包括:
构建检索推荐模型对检索结果进行筛选,具体构建过程如下:
Figure QLYQS_7
其中,
Figure QLYQS_8
表示信息处理模块得到的所有可能检索结果集合,
Figure QLYQS_9
表示用户画像模块对用户的侧写集合,
Figure QLYQS_10
表示模型的输出,即最佳检索结果。
CN202310195777.7A 2023-03-03 2023-03-03 一种知识产权智能检索平台及方法 Withdrawn CN116226526A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310195777.7A CN116226526A (zh) 2023-03-03 2023-03-03 一种知识产权智能检索平台及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310195777.7A CN116226526A (zh) 2023-03-03 2023-03-03 一种知识产权智能检索平台及方法

Publications (1)

Publication Number Publication Date
CN116226526A true CN116226526A (zh) 2023-06-06

Family

ID=86587077

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310195777.7A Withdrawn CN116226526A (zh) 2023-03-03 2023-03-03 一种知识产权智能检索平台及方法

Country Status (1)

Country Link
CN (1) CN116226526A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116795789A (zh) * 2023-08-24 2023-09-22 卓望信息技术(北京)有限公司 自动生成专利检索报告的方法及装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116795789A (zh) * 2023-08-24 2023-09-22 卓望信息技术(北京)有限公司 自动生成专利检索报告的方法及装置

Similar Documents

Publication Publication Date Title
CN108959431B (zh) 标签自动生成方法、系统、计算机可读存储介质及设备
CN104199965B (zh) 一种语义信息检索方法
CN110457672B (zh) 关键词确定方法、装置、电子设备及存储介质
CN112035599B (zh) 基于垂直搜索的查询方法、装置、计算机设备及存储介质
JP2020521210A (ja) 情報処理方法及び端末、コンピュータ記憶媒体
CN111475603A (zh) 企业标识识别方法、装置、计算机设备及存储介质
CN114238573A (zh) 基于文本对抗样例的信息推送方法及装置
CN111291210A (zh) 图像素材库生成方法、图像素材推荐方法及相关装置
CN112163424A (zh) 数据的标注方法、装置、设备和介质
CN110321437B (zh) 一种语料数据处理方法、装置、电子设备及介质
CN112818093A (zh) 基于语义匹配的证据文档检索方法、系统及存储介质
CN108073576A (zh) 智能搜索方法、搜索装置以及搜索引擎系统
CN113515600B (zh) 一种基于元数据的空间分析自动计算方法
CN111462752A (zh) 基于注意力机制、特征嵌入及bi-lstm的客户意图识别方法
CN109948154B (zh) 一种基于邮箱名的人物获取及关系推荐系统和方法
CN111625621A (zh) 一种文档检索方法、装置、电子设备及存储介质
CN110941702A (zh) 一种法律法规和法条的检索方法及装置、可读存储介质
CN116881430A (zh) 一种产业链识别方法、装置、电子设备及可读存储介质
CN116226526A (zh) 一种知识产权智能检索平台及方法
CN112199958A (zh) 概念词序列生成方法、装置、计算机设备及存储介质
CN114141384A (zh) 用于检索医学数据的方法、设备和介质
CN112163415A (zh) 针对反馈内容的用户意图识别方法、装置及电子设备
CN114842982B (zh) 一种面向医疗信息系统的知识表达方法、装置及系统
CN116226108A (zh) 可实现不同治理程度的数据治理方法及系统
CN112328743A (zh) 代码搜索方法、装置、可读存储介质和电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20230606

WW01 Invention patent application withdrawn after publication