CN116521626A - 一种基于内容检索的个人知识管理方法及系统 - Google Patents
一种基于内容检索的个人知识管理方法及系统 Download PDFInfo
- Publication number
- CN116521626A CN116521626A CN202310317241.8A CN202310317241A CN116521626A CN 116521626 A CN116521626 A CN 116521626A CN 202310317241 A CN202310317241 A CN 202310317241A CN 116521626 A CN116521626 A CN 116521626A
- Authority
- CN
- China
- Prior art keywords
- picture
- text
- description
- file
- search
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000007726 management method Methods 0.000 title claims abstract description 18
- 238000005516 engineering process Methods 0.000 claims abstract description 20
- 238000000034 method Methods 0.000 claims abstract description 20
- 238000004590 computer program Methods 0.000 claims description 10
- 238000000605 extraction Methods 0.000 claims description 6
- 238000013136 deep learning model Methods 0.000 claims description 5
- 238000004458 analytical method Methods 0.000 claims description 4
- 238000012163 sequencing technique Methods 0.000 claims description 4
- 230000006870 function Effects 0.000 description 10
- 238000012015 optical character recognition Methods 0.000 description 8
- 238000003058 natural language processing Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000013523 data management Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/14—Details of searching files based on file metadata
- G06F16/144—Query formulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/14—Details of searching files based on file metadata
- G06F16/148—File search processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/14—Details of searching files based on file metadata
- G06F16/156—Query results presentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/3332—Query translation
- G06F16/3334—Selection or weighting of terms from queries, including natural language queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/53—Querying
- G06F16/532—Query formulation, e.g. graphical querying
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/413—Classification of content, e.g. text, photographs or tables
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Library & Information Science (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种基于内容检索的个人知识管理方法及系统,该方法包括:获取用户保存的文件,并解析文档文件及视频文件;通过语音识别得到所有音频对应的文字内容,并通过OCR技术提取所有图片中的文字内容;通过NLP技术提取文本关键词,通过AI识别生成图片的文字描述,并提取图片特征描述子,将文件关键词、图片文字描述以及图片特征描述子保存至数据库中;当用户输入检索词后,将检索词分别与文件名称、文本关键词、图片文字描述匹配,输出匹配的文件;当用户输入检索图片后,将检索图片特征描述与数据库中图片的特征描述子匹配,输出对应的图片或视频文件。通过该方案不仅可以实现文件的内容检索,而且能够保障检索的准确性和效率。
Description
技术领域
本发明属于数据管理技术领域,尤其涉及一种基于内容检索的个人知识管理方法及系统。
背景技术
随着个人电子设备存储的文档、图片、视频等越来越多,需要查找某个特定文件也变得越来越困难。虽然通过设备自带的搜索功能可以进行查找,但这些搜索方式大多是基于文件名称进行检索,当用户需要想要查找特定内容的文件,如查找雪山场景,就要一张张查找图片或阅读文档、观看视频来确定对应的文件,致使实际内容检索效率和准确率较低。
发明内容
有鉴于此,本发明实施例提供了一种基于内容检索的个人知识管理方法及系统,用于解决现有内容检索效率和准确率低的问题。
在本发明实施例的第一方面,提供了一种基于内容检索的个人知识管理方法,包括:
获取用户保存的文件,解析文档文件,得到相应的文本和图片,解析视频文件得到相应的音频和图片;
通过语音识别得到所有音频对应的文字内容,并通过OCR技术提取所有图片中的文字内容;
通过NLP技术提取文本和文字内容中的关键词,通过AI识别生成图片的文字描述,并提取图片特征描述子,将文本和文字内容对应的关键词、图片文字描述以及图片特征描述子保存至数据库中;
当用户输入检索词后,将检索词分别与文件名称、文本关键词、图片文字描述匹配,输出匹配的文件;
当用户输入检索图片后,将检索图片特征描述与数据库中图片的特征描述子匹配,输出对应的图片或视频文件。
在本发明实施例的第二方面,提供了一种基于内容检索的个人知识管理系统,包括:
解析模块,用于获取用户保存的文件,解析文档文件,得到相应的文本和图片,解析视频文件得到相应的音频和图片;
识别模块,用于通过语音识别得到所有音频对应的文字内容,并通过OCR技术提取所有图片中的文字内容;
内容提取模块,用于通过NLP技术提取文本和文字内容中的关键词,通过AI识别生成图片的文字描述,并提取图片特征描述子,将文本和文字内容对应的关键词、图片文字描述以及图片特征描述子保存至数据库中;
第一检索模块,用于当用户输入检索词后,将检索词分别与文件名称、文本关键词、图片文字描述匹配,输出匹配的文件;
第二检索模块,用于当用户输入检索图片后,将检索图片特征描述与数据库中图片的特征描述子匹配,输出对应的图片或视频文件。
在本发明实施例的第三方面,提供了一种电子设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器运行的计算机程序,所述处理器执行所述计算机程序时实现如本发明实施例第一方面所述方法的步骤。
在本发明实施例的第四方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现本发明实施例第一方面提供的所述方法的步骤。
本发明实施例中,通过对用户文件中的文档、图片、录音、视频等文件进行内容提取、转换,将文本内容的关键词、图片文字描述以及图片特征描述子保存至数据库中,根据用户输入的关键词或图片进行内容检索。从而不仅能实现文件内容检索,而且提高文件检索的准确率和效率,避免只对文件名称进行检索。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单介绍,显而易见地,下面描述的附图仅仅是本发明的一些实施例,对本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获取其他附图。
图1为本发明一个实施例提供的一种基于内容检索的个人知识管理方法的流程示意图;
图2为本发明一个实施例提供的一种基于内容检索的个人知识管理方法的另一流程示意图;
图3为本发明一个实施例提供的一种基于内容检索的个人知识管理系统的结构示意图;
图4为本发明的一个实施例提供的一种电子设备的结构示意图。
具体实施方式
为使得本发明的发明目的、特征、优点能够更加的明显和易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,下面所描述的实施例仅仅是本发明一部分实施例,而非全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
应当理解,本发明的说明书或权利要求书及上述附图中的术语“包括”以及其他相近意思表述,意指覆盖不排他的包含,如包含一系列步骤或单元的过程、方法或系统、设备没有限定于已列出的步骤或单元。此外,“第一”“第二”用于区分不同对象,并非用于描述特定顺序。
个人知识管理是指将用户拥有的资料文件进行管理,一般包括创建、分类、索引、检索等,资料查询检索作为个人知识管理软件或系统的重要功能,其检索的准确性、可靠性对于软件或系统是关键的性能指标。
请参阅图1,本发明实施例提供的一种基于内容检索的个人知识管理方法的流程示意图,包括:
S101、获取用户保存的文件,解析文档文件,得到相应的文本和图片,解析视频文件得到相应的音频和图片;
所述文件为存储至用户电子设备上的文件,可以包括文档、图片、音频和视频等。对于文档文件,其中可能包含有文本和图片,需要进行解析提取其中的文本和图片;对于视频文件,其包含有图片(视频帧)和音频数据,需要对其进行解析处理。
S102、通过语音识别得到所有音频对应的文字内容,并通过OCR技术提取所有图片中的文字内容;
语音识别的音频不仅包含视频解析得到的音频,还包含有用户保存独立的音频文件,如音乐、录音等。对所有的音频数据,通过语音识别模型转换为文本内容。
对于用户保存图片、文档解析得到的图片以及视频解析得到的图片,均可以通过OCR(Optical Character Recognition,即光学字符识别)技术识别图片对应的文字内容。
S103、通过NLP技术提取文本和文字内容中的关键词,通过AI识别生成图片的文字描述,并提取图片特征描述子,将文本和文字内容对应的关键词、图片文字描述以及图片特征描述子保存至数据库中;
对于文档中的文本以及语音识别的文字内容、图片提取的文字内容均可以通过NLP(Natural Language Processing)技术提取对应的关键词。
具体的,通过TF-IDF技术提取文本和文字内容中的关键词。
所述AI识别生成图片的文字描述是通过图像生成文字技术实现,其基于深度学习模型对图片进行特征提取,结合语义模型,构造图片内容对应的文字描述,如clip-interrogator等模型,可以实现图片的文字描述。
在一个实施例中,请参考图2,对于文本和文字内容,在提取关键词后,可以对文本及文字内容进行分类。其中,对于图片的文字描述,同样进行关键词提取及分类,并保存至文件数据库中,以便根据关键词检索到对应的图片。
S104、当用户输入检索词后,将检索词分别与文件名称、文本关键词、图片文字描述匹配,输出匹配的文件;
所述检索词为用户需要检索的关键词,该检索词可以为文件名称、文档中出现的词语或图片的内容描述词。通过将检索词与文本关键词、图片文字描述匹配,可以实现文件内容检索。
可选的,将检索词依次与文件名称、文本关键词、图片文字描述匹配,当检索到对应文件则数据匹配结果,否则,将检索词的同义词分别与文件名称、文本关键词、图片文字描述匹配。
S105、当用户输入检索图片后,将检索图片特征描述与数据库中图片的特征描述子匹配,输出对应的图片或视频文件。
通过将图片特征与数据库中已有的特征描述子匹配,可以实现图片检索功能。当检索到的图片属于文档文件,可以输出图片或文档文件名称。
其中,当用户输入检索图片后,通过深度学习模型提取检索图片的特征描述,将检索图片特征描述与数据库中图片的特征描述子匹配,并计算检索图片与数据库中图片的相似度;
将检索图片与数据库中图片的相似度排序,将相似度高于预定值的图片或视频输出。
本实施例中,通过对文件进行解析、转换及提取,将文本关键词、图片描述及图片特征保存至数据库,根据用户输入关键词或图片进行内容检索。从而可以避免只对文件名称进行检索,实现文件内容检索;通过检索同义词对检索词进行扩展,可以检索出与检索条件高度相关的内容,从而提高检索召回率;根据图片检索相似图片增强检索功能,实现了多样化检索。
应理解,上述实施例中各步骤的序号大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
图3为本发明实施例提供的一种基于内容检索的个人知识管理系统的结构示意图,该系统包括:
解析模块310,用于获取用户保存的文件,解析文档文件,得到相应的文本和图片,解析视频文件得到相应的音频和图片;
识别模块320,用于通过语音识别得到所有音频对应的文字内容,并通过OCR技术提取所有图片中的文字内容;
内容提取模块330,用于通过NLP技术提取文本和文字内容中的关键词,通过AI识别生成图片的文字描述,并提取图片特征描述子,将文本和文字内容对应的关键词、图片文字描述以及图片特征描述子保存至数据库中;
其中,提取图片文字描述的关键词,并将图片文字描述的关键词存储至数据库。
第一检索模块340,用于当用户输入检索词后,将检索词分别与文件名称、文本关键词、图片文字描述匹配,输出匹配的文件;
可选的,所述第一检索模块340包括:
同义词检索单元,用于当检索词未匹配到对应的文件,则将检索词的同义词分别与文件名称、文本关键词、图片文字描述匹配。
第二检索模块350,用于当用户输入检索图片后,将检索图片特征描述与数据库中图片的特征描述子匹配,输出对应的图片或视频文件。
具体的,当用户输入检索图片后,通过深度学习模型提取检索图片的特征描述,将检索图片特征描述与数据库中图片的特征描述子匹配,并计算检索图片与数据库中图片的相似度;
将检索图片与数据库中图片的相似度排序,将相似度高于预定值的图片或视频输出。
所述领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和模块的具体工作过程可以参考前述方法实施例中对应的过程,在此不再赘述。
图4是本发明一实施例提供的一种电子设备的结构示意图。所述电子设备用于实现个人知识的内容检索。如图4所示,该实施例的电子设备4包括:存储器410、处理器420以及系统总线430,所述存储器410包括存储其上的可运行的程序4101,本领域技术人员可以理解,图4中示出的电子设备结构并不构成对电子设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
下面结合图4对电子设备的各个构成部件进行具体的介绍:
存储器410可用于存储软件程序以及模块,处理器420通过运行存储在存储器410的软件程序以及模块,从而执行电子设备的各种功能应用以及数据处理。存储器410可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据电子设备的使用所创建的数据(比如缓存数据)等。此外,存储器410可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
在存储器410上包含网络请求方法的可运行程序4101,所述可运行程序4101可以被分割成一个或多个模块/单元,所述一个或多个模块/单元被存储在所述存储器410中,并由处理器420执行,以进行内容检索等,所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序4101在所述电子设备4中的执行过程。例如,所述计算机程序4101可以被分割为解析模块、识别模块、内容提取模块、第一检索模块和第二检索模块等功能模块。
处理器420是电子设备的控制中心,利用各种接口和线路连接整个电子设备的各个部分,通过运行或执行存储在存储器410内的软件程序和/或模块,以及调用存储在存储器410内的数据,执行电子设备的各种功能和处理数据,从而对电子设备进行整体状态监控。可选的,处理器420可包括一个或多个处理单元;优选的,处理器420可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器420中。
系统总线430是用来连接计算机内部各功能部件,可以传送数据信息、地址信息、控制信息,其种类可以是例如PCI总线、ISA总线、CAN总线等。处理器420的指令通过总线传递至存储器410,存储器410反馈数据给处理器420,系统总线430负责处理器420与存储器410之间的数据、指令交互。当然系统总线430还可以接入其他设备,例如网络接口、显示设备等。
在本发明实施例中,该电子设备所包括的处理420执行的可运行程序包括:
获取用户保存的文件,解析文档文件,得到相应的文本和图片,解析视频文件得到相应的音频和图片;
通过语音识别得到所有音频对应的文字内容,并通过OCR技术提取所有图片中的文字内容;
通过NLP技术提取文本和文字内容中的关键词,通过AI识别生成图片的文字描述,并提取图片特征描述子,将文本和文字内容对应的关键词、图片文字描述以及图片特征描述子保存至数据库中;
当用户输入检索词后,将检索词分别与文件名称、文本关键词、图片文字描述匹配,输出匹配的文件;
当用户输入检索图片后,将检索图片特征描述与数据库中图片的特征描述子匹配,输出对应的图片或视频文件。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、设备和模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种基于内容检索的个人知识管理方法,其特征在于,包括:
获取用户保存的文件,解析文档文件,得到相应的文本和图片,解析视频文件得到相应的音频和图片;
通过语音识别得到所有音频对应的文字内容,并通过OCR技术提取所有图片中的文字内容;
通过NLP技术提取文本和文字内容中的关键词,通过AI识别生成图片的文字描述,并提取图片特征描述子,将文本和文字内容对应的关键词、图片文字描述以及图片特征描述子保存至数据库中;
当用户输入检索词后,将检索词分别与文件名称、文本关键词、图片文字描述匹配,输出匹配的文件;
当用户输入检索图片后,将检索图片特征描述与数据库中图片的特征描述子匹配,输出对应的图片或视频文件。
2.根据权利要求1所述的方法,其特征在于,所述将文本和文字内容对应的关键词、图片文字描述以及图片特征描述子保存至数据库中包括:
提取图片文字描述的关键词,并将图片文字描述的关键词存储至数据库。
3.根据权利要求1所述的方法,其特征在于,所述当用户输入检索词后,将检索词分别与文件名称、文本关键词、图片文字描述匹配,输出匹配的文件包括:
将检索词依次与文件名称、文本关键词、图片文字描述匹配,当检索到对应文件则数据匹配结果,否则,将检索词的同义词分别与文件名称、文本关键词、图片文字描述匹配。
4.根据权利要求1所述的方法,其特征在于,所述当用户输入检索图片后,将检索图片特征描述与数据库中图片的特征描述子匹配,输出对应的图片或视频文件包括:
当用户输入检索图片后,通过深度学习模型提取检索图片的特征描述,将检索图片特征描述与数据库中图片的特征描述子匹配,并计算检索图片与数据库中图片的相似度;
将检索图片与数据库中图片的相似度排序,将相似度高于预定值的图片或视频输出。
5.一种基于内容检索的个人知识管理系统,其特征在于,包括:
解析模块,用于获取用户保存的文件,解析文档文件,得到相应的文本和图片,解析视频文件得到相应的音频和图片;
识别模块,用于通过语音识别得到所有音频对应的文字内容,并通过OCR技术提取所有图片中的文字内容;
内容提取模块,用于通过NLP技术提取文本和文字内容中的关键词,通过AI识别生成图片的文字描述,并提取图片特征描述子,将文本和文字内容对应的关键词、图片文字描述以及图片特征描述子保存至数据库中;
第一检索模块,用于当用户输入检索词后,将检索词分别与文件名称、文本关键词、图片文字描述匹配,输出匹配的文件;
第二检索模块,用于当用户输入检索图片后,将检索图片特征描述与数据库中图片的特征描述子匹配,输出对应的图片或视频文件。
6.根据权利要求5所述的系统,其特征在于,所述将文本和文字内容对应的关键词、图片文字描述以及图片特征描述子保存至数据库中包括:
提取图片文字描述的关键词,并将图片文字描述的关键词存储至数据库。
7.根据权利要求5所述的系统,其特征在于,所述当用户输入检索词后,将检索词分别与文件名称、文本关键词、图片文字描述匹配,输出匹配的文件包括:
将检索词依次与文件名称、文本关键词、图片文字描述匹配,当检索到对应文件则数据匹配结果,否则,将检索词的同义词分别与文件名称、文本关键词、图片文字描述匹配。
8.根据权利要求5所述的系统,其特征在于,所述当用户输入检索图片后,将检索图片特征描述与数据库中图片的特征描述子匹配,输出对应的图片或视频文件包括:
当用户输入检索图片后,通过深度学习模型提取检索图片的特征描述,将检索图片特征描述与数据库中图片的特征描述子匹配,并计算检索图片与数据库中图片的相似度;
将检索图片与数据库中图片的相似度排序,将相似度高于预定值的图片或视频输出。
9.一种电子设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至4任一项所述的一种基于内容检索的个人知识管理方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被执行时实现如权利要求1至4任一项所述的一种基于内容检索的个人知识管理方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310317241.8A CN116521626A (zh) | 2023-03-24 | 2023-03-24 | 一种基于内容检索的个人知识管理方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310317241.8A CN116521626A (zh) | 2023-03-24 | 2023-03-24 | 一种基于内容检索的个人知识管理方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116521626A true CN116521626A (zh) | 2023-08-01 |
Family
ID=87400181
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310317241.8A Pending CN116521626A (zh) | 2023-03-24 | 2023-03-24 | 一种基于内容检索的个人知识管理方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116521626A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117688162A (zh) * | 2024-01-16 | 2024-03-12 | 广东铭太信息科技有限公司 | 一种基于ocr识别的全文检索方法及系统 |
-
2023
- 2023-03-24 CN CN202310317241.8A patent/CN116521626A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117688162A (zh) * | 2024-01-16 | 2024-03-12 | 广东铭太信息科技有限公司 | 一种基于ocr识别的全文检索方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110928994B (zh) | 相似案例检索方法、相似案例检索装置和电子设备 | |
US8126897B2 (en) | Unified inverted index for video passage retrieval | |
US9092420B2 (en) | Apparatus and method for automatically generating grammar for use in processing natural language | |
US10078632B2 (en) | Collecting training data using anomaly detection | |
CN111046656B (zh) | 文本处理方法、装置、电子设备及可读存储介质 | |
JP6909832B2 (ja) | オーディオにおける重要語句を認識するための方法、装置、機器及び媒体 | |
CN102253930B (zh) | 一种文本翻译的方法及装置 | |
US8280721B2 (en) | Efficiently representing word sense probabilities | |
JP2013541793A (ja) | マルチモード検索クエリー入力手法 | |
CN109145110B (zh) | 标签查询方法和装置 | |
CN105045852A (zh) | 一种教学资源的全文搜索引擎系统 | |
US20160071511A1 (en) | Method and apparatus of smart text reader for converting web page through text-to-speech | |
EP3706014A1 (en) | Methods, apparatuses, devices, and storage media for content retrieval | |
CN113934869A (zh) | 一种数据库构建方法、多媒体文件的检索方法及装置 | |
CN116521626A (zh) | 一种基于内容检索的个人知识管理方法及系统 | |
CN111859950A (zh) | 一种自动化生成讲稿的方法 | |
US20150178387A1 (en) | Method and system of audio retrieval and source separation | |
CN111090668B (zh) | 数据检索方法及装置、电子设备和计算机可读存储介质 | |
CN111881695A (zh) | 一种审计知识的检索方法及装置 | |
US20230061773A1 (en) | Automated systems and methods for generating technical questions from technical documents | |
WO2019231635A1 (en) | Method and apparatus for generating digest for broadcasting | |
CN109710844A (zh) | 基于搜索引擎的快速准确定位文件的方法和设备 | |
TWI636370B (zh) | Establishing chart indexing method and computer program product by text information | |
CN114625889A (zh) | 一种语义消歧方法、装置、电子设备及存储介质 | |
Tarawneh et al. | a hybrid approach for indexing and searching the holy Quran |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |