CN117539829A - 文件的查询方法、装置、电子设备及计算机可读存储介质 - Google Patents
文件的查询方法、装置、电子设备及计算机可读存储介质 Download PDFInfo
- Publication number
- CN117539829A CN117539829A CN202311498495.0A CN202311498495A CN117539829A CN 117539829 A CN117539829 A CN 117539829A CN 202311498495 A CN202311498495 A CN 202311498495A CN 117539829 A CN117539829 A CN 117539829A
- Authority
- CN
- China
- Prior art keywords
- text
- file
- query
- target
- content
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 107
- 230000004044 response Effects 0.000 claims abstract description 8
- 230000011218 segmentation Effects 0.000 claims description 11
- 239000012634 fragment Substances 0.000 claims description 10
- 230000008569 process Effects 0.000 abstract description 24
- 238000004364 calculation method Methods 0.000 abstract description 6
- 238000012545 processing Methods 0.000 description 18
- 238000013473 artificial intelligence Methods 0.000 description 17
- 238000000605 extraction Methods 0.000 description 15
- 238000011161 development Methods 0.000 description 13
- 230000018109 developmental process Effects 0.000 description 13
- 238000004891 communication Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 10
- 238000007405 data analysis Methods 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 8
- 238000003058 natural language processing Methods 0.000 description 5
- 230000009471 action Effects 0.000 description 4
- 238000013507 mapping Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 230000006835 compression Effects 0.000 description 3
- 238000007906 compression Methods 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 238000007726 management method Methods 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 241000723345 Chrysophyllum Species 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000003909 pattern recognition Methods 0.000 description 2
- 244000141359 Malus pumila Species 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 235000021016 apples Nutrition 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000013523 data management Methods 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000012015 optical character recognition Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/14—Details of searching files based on file metadata
- G06F16/148—File search processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/13—File access structures, e.g. distributed indices
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/16—File or folder operations, e.g. details of user interfaces specifically adapted to file systems
- G06F16/164—File meta data generation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Library & Information Science (AREA)
- Human Computer Interaction (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请涉及一种文件的查询方法、装置、电子设备及计算机可读存储介质,属于信息检索领域,包括:响应于查询端发出的查询请求,通过所述查询请求获得查询文本;将所述查询文本与查询数据库中预设的描述文本匹配,获取与查询文本匹配的目标描述文本;所述查询数据库中还建立有描述文本和文件的对应关系;所述描述文本用以通过文字解释文件的具体内容;根据所述目标描述文本和所述对应关系,获取与所述目标描述文本对应的目标文件,并将所述目标文件作为查询结果发送至所述查询端。解决了在检索过程中,需要耗费大量的时间与算力,无法快速反馈检索结果,导致的检索等待时间长,无法及时响应的问题。
Description
技术领域
本申请属于信息检索领域,具体涉及一种文件的查询方法、装置、电子设备及计算机可读存储介质。
背景技术
数据的有效检索对于提高用户获取信息的效率和质量,以及满足用户多样化的需求和偏好等方面具有重要意义。因此,对不同类型的数据进行统一的检索和定位是数据管理的重要内容。
目前,数据的检索和定位主要依赖于文本挖掘、自然语言处理、信息抽取等技术,在检索时针对特定的信息对既有文件进行分析、挖掘与匹配。
这些方式造成了在检索时需要耗费大量的时间与算力,难以快速反馈检索结果,导致检索等待时间长,无法及时响应。
发明内容
本申请旨在提供一种文件的查询方法、装置、电子设备及计算机可读存储介质,至少解决在检索过程中,需要耗费大量的时间与算力,无法快速反馈检索结果,导致的检索等待时间长,无法及时响应的问题。
第一方面,本申请实施例公开了一种文件的查询方法,包括:响应于查询端发出的查询请求,通过所述查询请求获得查询文本;所述查询文本是一段具有含义的文字;将所述查询文本与查询数据库中预设的描述文本匹配,获取与查询文本匹配的目标描述文本;所述查询数据库中还建立有描述文本和文件的对应关系;所述描述文本用以通过文字解释文件的具体内容;根据所述目标描述文本和所述对应关系,获取与所述目标描述文本对应的目标文件,并将所述目标文件作为查询结果发送至所述查询端。
第二方面,本申请实施例还公开了一种文件的查询装置,包括:查询模块,用于响应于查询端发出的查询请求,通过所述查询请求获得查询文本;所述查询文本是一段具有含义的文字;匹配模块,用于将所述查询文本与查询数据库中预设的描述文本匹配,获取与查询文本匹配的目标描述文本;所述查询数据库中还建立有描述文本和文件的对应关系;所述描述文本用以通过文字解释文件的具体内容;输出模块,用于根据所述目标描述文本和所述对应关系,获取与所述目标描述文本对应的目标文件,并将所述目标文件作为查询结果发送至所述查询端。
第三方面,本申请实施例还公开了一种电子设备,包括处理器和存储器、所述存储器存储可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如第一方面所述的方法的步骤。
第四方面,本申请实施例还公开了一种可读存储介质,所述可读存储介质上存储有程序或指令,所述程序或指令被处理器执行时实现如第一方面所述的方法的步骤。
综上,在本申请实施例中,通过将查询请求文本化获得查询文本,以将查询请求的转化为与数据库中存储的查询文本类型一致的数据类型,进而通过文本匹配获得目标描述文本,只要数据库中有相应的描述文本,就可以实现文件的查询和定位,不需要对原始文件进行数据分析和处理,而是直接利用数据库中已经建立的描述文本和文件的对应关系,从而快速定位到目标文件,以此利用查询数据库中建立好的描述文本和文件的对应关系,最终确定查询请求所指向的目标文件,使得用户可以在查询数据时仅通过文本匹配及关系映射就确定目标文件,将不同类型的文件的查询检索,简化为对文本文件的查询检索,这样用户只需要输入一段具有含义的文字,就可以获得所需的文件,而不需要了解文件的具体类型和格式,避免了对于数据库中的原始文件的数据分析过程。由此,基于本申请实施例的方法,将对于不同数据类型的文件的查询检索,统一化为对文本文件的查询检索,降低了检索过程的复杂性,解决了检索过程中,需要耗费大量的时间与算力,无法快速反馈检索结果,导致的检索等待时间长,无法及时响应的问题。
附图说明
在附图中:
图1是本实施例提供的一种文件的查询方法的步骤流程图;
图2为本申请实施例提供的另一种文件的查询方法的步骤流程图;
图3为本申请实施例提供的基于一种文件的查询方法的服务器架构图;
图4是本申请实施例提供的一种文件的查询装置的框图;
图5是本申请实施例提供的一个实施例的电子设备的框图;
图6是本申请实施例提供的另一个实施例的电子设备的框图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施,且“第一”、“第二”等所区分的对象通常为一类,并不限定对象的个数,例如第一对象可以是一个,也可以是多个。此外,说明书以及权利要求中“和/或”表示所连接对象的至少其中之一,字符“/”,一般表示前后关联对象是一种“或”的关系。
图1是本实施例提供的一种文件的查询方法。
方法可以包括如下步骤:
步骤101,响应于查询端发出的查询请求,通过所述查询请求获得查询文本;所述查询文本是一段具有含义的文字。
在本申请的一些实施例中,为了根据用户的需求和意图,从查询数据库中检索和定位目标文件,需要通过查询请求获得查询文本。例如,可以利用自然语言处理、语音识别、文本标准化等技术,从查询请求中提取出关键的信息,去除无关的信息,组织成查询文本。查询文本的转化的目的是为了使查询请求和描述文本的数据类型和格式一致,便于后续的匹配和比较。
通过本步骤,可以实现对查询请求的转化和获取,以及查询文本的生成和存储,为后续的匹配和定位提供了便利。这样,可以将不同类型的文件的查询检索,简化为对文本文件的查询检索,实现了文件的快速查询和定位。
步骤102,将所述查询文本与查询数据库中预设的描述文本匹配,获取与查询文本匹配的目标描述文本;所述查询数据库中还建立有描述文本和文件的对应关系;所述描述文本用以通过文字解释文件的具体内容。
在本申请的一些实施例中,为了从查询数据库中检索和定位目标文件,需要将查询文本与描述文本进行匹配,获取与查询文本匹配的目标描述文本。
其中匹配的方法可以有多种,例如,可以利用文本相似度、文本分类、文本检索、文本聚类等技术,从查询数据库中选择出与查询文本最相似或最相关的描述文本。匹配的结果可以有多个,即可以有多个描述文本与查询文本匹配,也可以有多个文件与查询文本匹配。匹配的目的是为了从查询数据库中缩小目标文件的范围,提高定位的效率和准确性。
通过本步骤,可以实现对查询文本和描述文本的匹配,以及目标描述文本的获取,为后续的定位和获取提供了便利。这样,可以将不同类型的文件的查询检索,简化为对文本文件的查询检索,实现了文件的快速查询和定位。
步骤103,根据所述目标描述文本和所述对应关系,获取与所述目标描述文本对应的目标文件,并将所述目标文件作为查询结果发送至所述查询端。
在本申请的一些实施例中,为了从查询数据库中检索和定位目标文件,需要根据目标描述文本和对应关系,获取与目标描述文本对应的目标文件。
获取的方法可以有多种,例如,可以利用文件索引、文件路径、文件标识符、文件链接等方式,从查询数据库中定位和读取与目标描述文本对应的文件。获取的结果可以有多个,即可以有多个文件与目标描述文本对应,也可以有多个文件与查询文本对应。获取的目的是为了从查询数据库中提取出目标文件,作为查询结果的一部分,方便用户查看和下载。
通过本步骤,通过这个步骤,可以实现对目标描述文本和对应关系的利用,以及目标文件的获取和发送,为用户提供了完整的查询结果。这样,可以将不同类型的文件的查询检索,简化为对文本文件的查询检索,实现了文件的快速查询和定位。
综上,在本申请实施例中,通过将查询请求文本化获得查询文本,以将查询请求的转化为与数据库中存储的查询文本类型一致的数据类型,进而通过文本匹配获得目标描述文本,只要数据库中有相应的描述文本,就可以实现文件的查询和定位,不需要对原始文件进行数据分析和处理,而是直接利用数据库中已经建立的描述文本和文件的对应关系,从而快速定位到目标文件,以此利用查询数据库中建立好的描述文本和文件的对应关系,最终确定查询请求所指向的目标文件,使得用户可以在查询数据时仅通过文本匹配及关系映射就确定目标文件,将不同类型的文件的查询检索,简化为对文本文件的查询检索,这样用户只需要输入一段具有含义的文字,就可以获得所需的文件,而不需要了解文件的具体类型和格式,避免了对于数据库中的原始文件的数据分析过程。由此,基于本申请实施例的方法,将对于不同数据类型的文件的查询检索,统一化为对文本文件的查询检索,降低了检索过程的复杂性,解决了检索过程中,需要耗费大量的时间与算力,无法快速反馈检索结果,导致的检索等待时间长,无法及时响应的问题。
图2为申请实施例提供的另一种文件的查询方法,参照图2,方法可以包括如下步骤:
步骤201,获取存入的文件的描述文本,并在所述查询数据库中建立所述描述文本与存入的所述文件的对应关系。
在本申请的一些实施例中,为了方便后续的查询和匹配,需要对存入的文件进行描述文本的生成和存储。描述文本的生成可以通过人工或自动的方式进行。
例如,可以利用自然语言处理、信息抽取、文本摘要等技术,从文件中提取出有用的信息,组织成描述文本。描述文本的存储可以通过建立一个查询数据库来实现,查询数据库中存储了描述文本和文件的对应关系,即每个描述文本都对应一个或多个文件,每个文件都有一个或多个描述文本。查询数据库可以采用关系型数据库、文档型数据库、图数据库等不同的数据结构和模型,以满足不同的查询需求和性能。
通过本步骤,可以实现对存入的文件的描述文本的获取和存储,以及描述文本和文件的对应关系的建立,为后续的查询和匹配提供了便利。这样,可以将不同类型的文件的查询检索,简化为对文本文件的查询检索,降低了检索过程的复杂性,提高了检索效率和准确性。
可选的,所述文件为文本格式文件,步骤201中获取存入的文件的描述文本的步骤包含如下子步骤:
子步骤2011,提取所述文本格式文件中的所有字符文本,并由所述字符文本生成所述描述文本。
在本申请的一些实施例中,为了方便后续的查询和匹配,需要对存入的文本格式文件进行描述文本的生成。
文本格式文件是指以文本为主要内容的文件,例如,文本格式(text,TXT)、文档格式(document,DOC)、可携带文件格式(PortableDocumentFormat,PDF)等格式的文件。字符文本是指文本格式文件中的可读的文字信息,例如,标题、正文、页码、引用等。描述文本是一段用以通过文字解释文件的具体内容的文本,可以包括文件的类型、格式、主题、作者、日期、摘要、关键词等信息。提取是指从文本格式文件中读取和分析字符文本的过程,用以获取文件的内容和信息。生成是指根据提取的字符文本,组织和编写描述文本的过程,用以表达文件的内容和信息。提取和生成的方法可以有多种,例如,可以利用自然语言处理、信息抽取、文本摘要等技术,从文本格式文件中提取出有用的信息,组织成描述文本。提取和生成的目的是为了使文件的内容用文字表达出来,方便用户理解和检索。
通过本步骤,可以实现对存入的文本格式文件的描述文本的生成,为后续的查询和匹配提供了便利。这样,可以将文件的内容用文字表达出来,方便用户理解和检索。
可选的,所述文件为非文本格式文件,步骤201中获取存入的文件的描述文本的步骤包含如下子步骤:
子步骤2012,获取所述非文本格式文件的语义文本,并由所述语义文本生成所述描述文本;所述语义文本用以描述所述非文本格式文件。
在本申请的一些实施例中,为了方便后续的查询和匹配,需要对存入的非文本格式文件进行描述文本的生成。
非文本格式文件是指以非文本为主要内容的文件,例如,联合图像专家组格式(JointPhotographicExpertsGroup,JPG)、动态影像专家压缩标准音频层面3格式(MovingPictureExpertsGroupAudioLayerIII,MP3)、动态图像专家组格式(MovingPictureExpertsGroup4,MP4)等格式的文件。语义文本是指用以描述非文本格式文件的内容和信息的文本,例如,图片的主题、音频的歌名、视频的简介等。描述文本是一段用以通过文字解释文件的具体内容的文本,可以包括文件的类型、格式、主题、作者、日期、摘要、关键词等信息。获取是指从非文本格式文件中提取和分析语义文本的过程,用以获取文件的内容和信息。生成是指根据获取的语义文本,组织和编写描述文本的过程,用以表达文件的内容和信息。获取和生成的方法可以有多种,例如,可以利用计算机视觉、语音识别、视频分析等技术,从非文本格式文件中提取出有用的信息,组织成语义文本。获取和生成的目的是为了使文件的内容用文字表达出来,方便用户理解和检索。
通过本步骤,可以实现对存入的非文本格式文件的描述文本的生成,为后续的查询和匹配提供了便利。这样,可以将文件的内容用文字表达出来,方便用户理解和检索。
可选的,所述子步骤2012包括如下子步骤:
子步骤20121,在所述非文本格式文件中包含语言内容的情况下,通过识别器识别所述非文本格式文件,获得用于反映所述语言内容的语义文本,并将所述语义文本确定为所述描述文本。
在本申请的一些实施例中,为了方便后续的查询和匹配,需要对存入的非文本格式文件进行描述文本的生成。
非文本格式文件是指以非文本为主要内容的文件,例如,JPG、MP3、MP4等格式的文件。语义文本是指用以描述非文本格式文件的内容和信息的文本,例如,图片的主题、音频的歌名、视频的简介等。描述文本是一段用以通过文字解释文件的具体内容的文本,可以包括文件的类型、格式、主题、作者、日期、摘要、关键词等信息。
在某些情况下,非文本格式文件中可能包含语言内容,即文件中有可读的文字信息,例如,一张带有文字的图片,一段带有歌词的音频,一段带有字幕的视频等。在这种情况下,可以从非文本格式文件中提取和分析语言内容,需要通过识别器识别非文本格式文件,获取用于反映语言内容的语义文本。识别器是一种利用机器学习、深度学习、模式识别等技术,从非文本格式文件中识别出文字信息的工具,例如,可以利用光学字符识别、语音识别、视频字幕识别等技术,构建和训练识别器。识别器的目的是为了从非文本格式文件中获取有用的信息,用以表达文件的内容和信息。根据识别器识别出的文字信息,可以获得用于反映语言内容的语义文本,即根据文字信息生成一段描述文件内容的文本。
通过本步骤,可以实现对存入的非文本格式文件的描述文本的生成,为后续的查询和匹配提供了便利。这样,可以将文件的内容用文字表达出来,方便用户理解和检索。
子步骤20122,在所述非文本格式文件中不包含语言内容的情况下,通过分类器确定所述非文本格式文件的内容类别,获得用于反映所述内容类别的语义文本,并将所述语义文本确定为所述描述文本。
在本申请的一些实施例中,为了方便后续的查询和匹配,需要对存入的非文本格式文件进行描述文本的生成。
非文本格式文件是指以非文本为主要内容的文件,例如,JPG、MP3、MP4等格式的文件。语义文本是指用以描述非文本格式文件的内容和信息的文本,例如,图片的主题、音频的歌名、视频的简介等。描述文本是一段用以通过文字解释文件的具体内容的文本,可以包括文件的类型、格式、主题、作者、日期、摘要、关键词等信息。在某些情况下,非文本格式文件中可能不包含语言内容,即文件中没有可读的文字信息,例如,一张纯色的图片,一段无声的音频,一段无字幕的视频等。在这种情况下,无法从非文本格式文件中提取和分析语义文本,需要通过其他的方式生成描述文本。一种可能的方式是通过分类器确定非文本格式文件的内容类别,即根据文件的特征和属性,将文件归类到某个预定义的类别中,例如,图片的颜色、音频的频率、视频的动作等。根据分类器确定的内容类别,可以获得用于反映内容类别的语义文本,即根据类别的名称或标签,生成一段描述文件内容的文本,例如,图片的颜色为红色,音频的频率为440赫兹,视频的动作为跳舞等。语义文本的生成可以通过人工或自动的方式进行,例如,可以利用自然语言生成、模板填充、规则生成等技术,从类别的名称或标签中生成语义文本。语义文本的生成的目的是为了使文件的内容用文字表达出来,方便用户理解和检索。将获得的语义文本确定为描述文本,即将语义文本作为描述文本的一部分,用以通过文字解释文件的具体内容。
通过本步骤,可以实现对存入的非文本格式文件的描述文本的生成,为后续的查询和匹配提供了便利。这样,可以将文件的内容用文字表达出来,方便用户理解和检索。
可选的,所述文件包括文本片段和非文本片段,步骤201中获取存入的文件的描述文本的步骤包含如下可选的子步骤:
子步骤2013,提取所述文件中所述文字片段的所有字符文本,并由所述字符文本生成所述描述文本。
在本申请的一些实施例中,为了方便后续的查询和匹配,需要对存入的文件进行描述文本的生成。
文本片段是指文件中的可读的文字信息,例如,标题、正文、页码、引用等。非文本片段是指文件中的非文字信息,例如,图片、音频、视频等。描述文本是一段用以通过文字解释文件的具体内容的文本,可以包括文件的类型、格式、主题、作者、日期、摘要、关键词等信息。提取是指从文件中读取和分析文本片段的过程,用以获取文件的内容和信息。
通过本步骤,可以实现对存入的文件的描述文本的生成,为后续的查询和匹配提供了便利。这样,可以将文件的内容用文字表达出来,方便用户理解和检索。
子步骤2014,获取所述非文本格式文件的语义文本,并由所述语义文本生成所述描述文本;所述语义文本用以描述所述文件中的所述非文字片段。
在本申请的一些实施例中,为了方便后续的查询和匹配,需要对存入的非文本格式文件进行描述文本的生成。
非文本格式文件是指以非文本为主要内容的文件,例如,JPG、MP3、MP4等格式的文件。非文字片段是指文件中的非文字信息,例如,图形、纯音乐等。
例如,可以利用计算机视觉、语音识别、视频分析等技术,从非文字片段中提取出有用的信息,组织成语义文本。获取和生成的目的是为了使非文字片段的内容用文字表达出来,方便用户理解和检索。
通过本步骤,可以实现对存入的非文本格式文件的描述文本的生成,为后续的查询和匹配提供了便利。这样,可以使非文字片段的内容用文字表达出来,方便用户理解和检索。
可选的,子步骤2014包含以下子步骤:
子步骤20141,在所述非文本格式文件中包含语言内容的情况下,通过识别器识别所述非文本格式文件,获得用于反映所述语言内容的语义文本,并将所述语义文本确定为所述描述文本。
在本申请的一些实施例中,为了方便后续的查询和匹配,需要对存入的非文本格式文件进行描述文本的生成。
非文本格式文件是指以非文本为主要内容的文件,例如,JPG、MP3、MP4等格式的文件。语言内容是指文件中的可读的文字信息,例如,图片中的文字、音频中的歌词、视频中的字幕等。在这种情况下,可以从非文本格式文件中提取和分析语言内容,需要通过识别器识别非文本格式文件,获取用于反映语言内容的语义文本。
根据识别器识别出的文字信息,可以获得用于反映语言内容的语义文本,即根据文字信息生成一段描述文件内容的文本。语义文本的生成可以通过人工或自动的方式进行,例如,可以利用自然语言生成、模板填充、规则生成等技术,从文字信息中生成语义文本。语义文本的生成的目的是为了使文件的内容用文字表达出来,方便用户理解和检索。将获得的语义文本确定为描述文本,即将语义文本作为描述文本的一部分,用以通过文字解释文件的具体内容。
通过本步骤,可以实现对存入的非文本格式文件的描述文本的生成,为后续的查询和匹配提供了便利。这样,可以使文件的内容用文字表达出来,方便用户理解和检索。
可选的,在所述非文本格式文件为图像文件,且所述图像文件的画面中包含字符内容的情况下,子步骤20141中通过识别器识别所述非文本格式文件,获得用于反映所述语言内容的语义文本的步骤包含以下子步骤:
子步骤201411,通过图像识别器识别所述图像文件的画面中的字符内容,将所述字符内容作为语义文本。
在本申请的一些实施例中,为了方便后续的查询和匹配,需要对存入的图像文件进行描述文本的生成。
图像文件是指以图像为主要内容的文件,例如,JPG、便携式网络图形格式(PortableNetworkGraphics,PNG)、地理信息系统格式(GraphicInterchangeFormat,GIF)等格式的文件。字符内容是指图像文件的画面中的可读的文字信息,例如,图片中的标语、广告、标签等。语义文本是指用以描述字符内容的内容和信息的文本,可以包括文件的类型、格式、主题、作者、日期、摘要、关键词等信息。在某些情况下,图像文件的画面中可能包含字符内容,即文件中有可读的文字信息。
通过本步骤,可以实现对存入的图像文件的描述文本的生成,为后续的查询和匹配提供了便利。这样,可以使文件的内容用文字表达出来,方便用户理解和检索。
可选的,在所述非文本格式文件为音频文件,且所述音频文件中包含语言对白的情况下,子步骤20141中通过识别器识别所述非文本格式文件,获得用于反映所述语言内容的语义文本的步骤包含以下子步骤:
子步骤201412,通过音频识别器识别所述音频文件中的语言对白,将所述语言对白作为语义文本。
在本申请的一些实施例中,为了方便后续的查询和匹配,需要对存入的音频文件进行描述文本的生成。
音频文件是指以音频为主要内容的文件,例如,MP3、波形声音文件格式(wave,WAV)、音讯压缩格式(oggVorbis,OGG)等格式的文件。语言对白是指音频文件中的可听的文字信息,例如,音频中的对话、讲话、歌词等。语义文本是指用以描述语言对白的内容和信息的文本。描述文本是一段用以通过文字解释文件的具体内容的文本,可以包括文件的类型、格式、主题、作者、日期、摘要、关键词等信息。
在某些情况下,音频文件中可能包含语言对白,即文件中有可听的文字信息,例如,一段带有对话的音频,一段带有讲话的音频,一段带有歌词的音频等。在这种情况下,可以从音频文件中提取和分析语言对白,需要通过音频识别器识别音频文件,获取用于反映语言对白的语义文本。音频识别器是一种利用机器学习、深度学习、模式识别等技术,从音频文件中识别出文字信息的工具,例如,可以利用语音识别、语音转文字、歌词识别等技术,构建和训练音频识别器。
音频识别器的目的是为了从音频文件中获取有用的信息,用以表达文件的内容和信息。例如,可以利用自然语言生成、模板填充、规则生成等技术,从文字信息中生成语义文本。语义文本的生成的目的是为了使文件的内容用文字表达出来,方便用户理解和检索。将获得的语义文本确定为描述文本,即将语义文本作为描述文本的一部分,用以通过文字解释文件的具体内容。
通过本步骤,可以实现对存入的音频文件的描述文本的生成,为后续的查询和匹配提供了便利。这样,可以使文件的内容用文字表达出来,方便用户理解和检索。
子步骤20142,在所述非文本格式文件中不包含语言内容的情况下,通过分类器确定所述非文本格式文件的内容类别,获得用于反映所述内容类别的语义文本,并将所述语义文本确定为所述描述文本。
在本申请的一些实施例中,为了方便后续的查询和匹配,需要对存入的非文本格式文件进行描述文本的生成。
非文本格式文件是指以非文本为主要内容的文件,例如,JPG、MP3、MP4等格式的文件。语义文本是指用以描述非文本格式文件的内容和信息的文本,例如,图片的主题、音频的歌名、视频的简介等。描述文本是一段用以通过文字解释文件的具体内容的文本,可以包括文件的类型、格式、主题、作者、日期、摘要、关键词等信息。
在某些情况下,非文本格式文件中可能不包含语言内容,即文件中没有可读或可听的文字信息,例如,一张纯色的图片,一段无声的音频,一段无字幕的视频等。在这种情况下,无法从非文本格式文件中提取和分析语言内容,需要通过其他的方式生成描述文本。一种可能的方式是通过分类器确定非文本格式文件的内容类别,即根据文件的特征和属性,将文件归类到某个预定义的类别中,例如,图片的颜色、音频的频率、视频的动作等。
语义文本的生成可以通过人工或自动的方式进行,例如,可以利用自然语言生成、模板填充、规则生成等技术,从类别的名称或标签中生成语义文本。语义文本的生成的目的是为了使文件的内容用文字表达出来,方便用户理解和检索。将获得的语义文本确定为描述文本,即将语义文本作为描述文本的一部分,用以通过文字解释文件的具体内容。
通过本步骤,可以实现对存入的非文本格式文件的描述文本的生成,为后续的查询和匹配提供了便利。这样,可以将文件的内容用文字表达出来,方便用户理解和检索。
可选的,在所述非文本格式文件为图像文件,且所述图像文件的画面中不包含字符内容的情况下,子步骤20142中通过分类器确定所述非文本格式文件的内容类别,获得用于反映所述内容类别的语义文本的步骤包括以下子步骤:
子步骤201421通过分类器确定所述图像文件的画面内容类别,获得用于反映所述画面内容类别的语义文本。
在本申请的一些实施例中,为了方便后续的查询和匹配,需要对存入的图像文件进行描述文本的生成。
图像文件是指以图像为主要内容的文件,例如,JPG、PNG、GIF等格式的文件。画面内容类别是指图像文件的画面中的主要内容的类别,例如,风景、人物、动物、建筑等。语义文本是指用以描述画面内容类别的内容和信息的文本,例如,图片的主题为“秋天的公园”,图片的内容为“一片金黄的树叶,一条清澈的小溪,一对老夫妻手牵手走在林间小路上”。描述文本是一段用以通过文字解释文件的具体内容的文本,可以包括文件的类型、格式、主题、作者、日期、摘要、关键词等信息。
在某些情况下,图像文件的画面中可能不包含字符内容,即文件中没有可读的文字信息,例如,一张纯色的图片,一张风景的图片,一张动物的图片等。在这种情况下,无法从图像文件的画面中提取和分析字符内容,需要通过其他的方式生成描述文本。一种可能的方式是通过分类器确定图像文件的画面内容类别,即根据文件的特征和属性,将文件归类到某个预定义的类别中,例如,图片的颜色、形状、纹理、风格等。
根据分类器确定的画面内容类别,可以获得用于反映画面内容类别的语义文本,即根据类别的名称或标签,生成一段描述文件内容的文本,例如,图片的类别为风景,图片的主题为“秋天的公园”,图片的内容为“一片金黄的树叶,一条清澈的小溪,一对老夫妻手牵手走在林间小路上”。
语义文本的生成可以通过人工或自动的方式进行,例如,可以利用自然语言生成、模板填充、规则生成等技术,从类别的名称或标签中生成语义文本。语义文本的生成的目的是为了使文件的内容用文字表达出来,方便用户理解和检索。将获得的语义文本确定为描述文本,即将语义文本作为描述文本的一部分,用以通过文字解释文件的具体内容。
通过本步骤,可以实现对存入的图像文件的描述文本的生成,为后续的查询和匹配提供了便利。这样,可以使文件的内容用文字表达出来,方便用户理解和检索。
可选的,在所述非文本格式文件为音频文件,且所述音频文件中不包含语言对白的情况下,子步骤20142中通过分类器确定所述非文本格式文件的内容类别,获得用于反映所述内容类别的语义文本的步骤包括以下子步骤:
子步骤201422,通过分类器确定所述音频文件的音频内容类别,获得用于反映所述音频内容类别的语义文本。
在本申请的一些实施例中,为了方便后续的查询和匹配,需要对存入的音频文件进行描述文本的生成。
音频文件是指以音频为主要内容的文件,例如,MP3、WAV、OGG等格式的文件。音频内容类别是指音频文件中的主要内容的类别,例如,音乐、声音、噪音等。一种可能的方式是通过分类器确定音频文件的音频内容类别,即根据文件的特征和属性,将文件归类到某个预定义的类别中,例如,音频的频率、节奏、音色、风格等。
根据分类器确定的音频内容类别,可以获得用于反映音频内容类别的语义文本,即根据类别的名称或标签,生成一段描述文件内容的文本,例如,音频的类别为音乐,音频的歌名为“小苹果”,音频的风格为“流行”。
语义文本的生成可以通过人工或自动的方式进行,例如,可以利用自然语言生成、模板填充、规则生成等技术,从类别的名称或标签中生成语义文本。语义文本的生成的目的是为了使文件的内容用文字表达出来,方便用户理解和检索。将获得的语义文本确定为描述文本,即将语义文本作为描述文本的一部分,用以通过文字解释文件的具体内容。
通过本步骤,可以实现对存入的音频文件的描述文本的生成,为后续的查询和匹配提供了便利。这样,可以使文件的内容用文字表达出来,方便用户理解和检索。
可选的,在子步骤2011和子步骤2013中,所述由所述字符文本生成所述描述文本的步骤具体包括以下子步骤:
子步骤20111:提取所述字符文本中的关键词,所述关键词是用于描述所述文件的文字。
在本申请的一些实施例中,为了方便后续的查询和匹配,需要对存入的文件进行描述文本的生成。文件是指以电子形式存储的数据或信息,可以包括文本片段和非文本片段。
文本片段是指文件中的可读的文字信息,例如,标题、正文、页码、引用等。非文本片段是指文件中的非文字信息,例如,图片、音频、视频等。描述文本是一段用以通过文字解释文件的具体内容的文本,可以包括文件的类型、格式、主题、作者、日期、摘要、关键词等信息。提取是指从文件中读取和分析文本片段的过程,用以获取文件的内容和信息。
提取和生成的方法可以有多种,例如,可以利用自然语言处理、信息抽取、文本摘要等技术,从文件中提取出有用的信息,组织成描述文本。提取和生成的目的是为了使文件的内容用文字表达出来,方便用户理解和检索。关键词是指用于描述文件的文字,可以反映文件的主要内容和信息,例如,标题、主题、作者、日期、摘要、关键词等。关键词的提取是指从文本片段中选取出有代表性的文字的过程,用以获取文件的内容和信息。
关键词的提取的方法可以有多种,例如,可以利用词频、词权重、词向量、词聚类等技术,从文本片段中提取出有用的关键词。关键词的提取的目的是为了使文件的内容用文字表达出来,方便用户理解和检索。将提取的关键词作为描述文本的一部分,用以通过文字解释文件的具体内容。
通过本步骤,可以实现对存入的文件的描述文本的生成,为后续的查询和匹配提供了便利。这样,可以将文件的内容用文字表达出来,方便用户理解和检索。
子步骤20112:将所述关键词确定为所述描述文本。
在本申请的一些实施例中,为了方便后续的查询和匹配,需要对存入的文件进行描述文本的生成。
确定的方法可以有多种,例如,可以利用自然语言生成、模板填充、规则生成等技术,从关键词中生成描述文本。确定的目的是为了使文件的内容用文字表达出来,方便用户理解和检索。
通过本步骤,可以实现对存入的文件的描述文本的生成,为后续的查询和匹配提供了便利。这样,可以将文件的内容用文字表达出来,方便用户理解和检索。
步骤202,响应于查询端发出的查询请求,通过所述查询请求获得查询文本;所述查询文本是一段具有含义的文字。
本步骤所示方法,在步骤101中已作说明,此处不再赘述。
步骤203,将所述查询文本与查询数据库中预设的描述文本匹配,获取与查询文本匹配的目标描述文本;所述查询数据库中还建立有描述文本和文件的对应关系;所述描述文本用以通过文字解释文件的具体内容。
本步骤所示方法,在步骤102中已作说明,此处不再赘述。
可选的,步骤203包括以下子步骤:
子步骤2031,对所述查询文本进行分词,获得多个分词。
在本申请的一些实施例中,为了方便后续的查询和匹配,需要对输入的查询文本进行分词。
查询文本是指用户输入的用于检索文件的文字,例如,“人工智能的发展与应用”。分词是指将查询文本中的文字按照一定的规则切分成多个有意义的单元的过程,例如,“人工智能”、“的”、“发展”、“与”、“应用”。分词的目的是为了提取出查询文本中的关键词,用以表达用户的检索意图。分词的方法可以有多种,例如,可以利用词典、统计、机器学习、深度学习等技术,从查询文本中切分出有用的分词。分词的结果是多个分词,可以反映查询文本的内容和信息,例如,“人工智能”、“发展”、“应用”等。将获得的分词作为查询文本的一部分,用以通过文字检索文件的具体内容。
通过本步骤,可以实现对输入的查询文本的分词,为后续的查询和匹配提供了便利。这样,可以将查询文本的内容用文字表达出来,方便用户理解和检索。
子步骤2032,查找所述对应关系中包含所述分词的候选描述文本。
在本申请的一些实施例中,为了方便后续的查询和匹配,需要从对应关系中查找包含分词的候选描述文本。
对应关系是指存储在数据库中的文件与描述文本之间的关联,例如,文件“人工智能的发展与应用.pdf”与描述文本“这是一篇包含图片的报告,采用PDF格式,标题是‘人工智能的发展与应用’,作者是王刚,日期是2023年4月1日,摘要是‘本报告分析了人工智能的发展历程、现状和趋势,以及人工智能在各个领域的应用和影响,包含了两张图片,分别是人工智能的发展历程的时间线图和人工智能在医疗领域的应用案例的示意图’,关键词是‘报告、人工智能、发展、应用、图片’”之间的对应关系。将获得的候选描述文本作为查询结果的一部分,用以通过文字展示文件的具体内容。
通过本步骤,可以实现从对应关系中查找包含分词的候选描述文本,为后续的查询和匹配提供了便利。这样,可以将文件的内容用文字表达出来,方便用户理解和检索。
子步骤2033,在所述候选描述文本中包含的所述分词的数量大于预设阈值的情况下,将所述候选描述文本确定为目标描述文本。
在本申请的一些实施例中,为了方便后续的查询和匹配,需要从候选描述文本中确定目标描述文本。
候选描述文本是指从对应关系中查找出的包含分词的描述文本,可以反映文件的主要内容和信息,例如,“这是一篇包含图片的报告,采用PDF格式,标题是‘人工智能的发展与应用’,作者是王刚,日期是2023年4月1日,摘要是‘本报告分析了人工智能的发展历程、现状和趋势,以及人工智能在各个领域的应用和影响,包含了两张图片,分别是人工智能的发展历程的时间线图和人工智能在医疗领域的应用案例的示意图’,关键词是‘报告、人工智能、发展、应用、图片’”是一个候选描述文本。
通过本步骤,可以实现从候选描述文本中确定目标描述文本,为后续的查询和匹配提供了便利。这样,可以将文件的内容用文字表达出来,方便用户理解和检索。
步骤204,根据所述目标描述文本和所述对应关系,获取与所述目标描述文本对应的目标文件,并将所述目标文件作为查询结果发送至所述查询端。
本步骤所示方法,在步骤103中已作说明,此处不再赘述。
可选的,步骤204中将所述目标文件作为查询结果发送至所述查询端的步骤包括以下子步骤:
子步骤2041,在所述目标文件为文本格式文件的情况下,将所述目标文件发送至所述查询端。
在本申请的一些实施例中,为了方便用户查看和下载查询结果,需要将目标文件发送至查询端。
目标文件是指从候选描述文本中确定出的最符合用户检索意图的文件,可以反映文件的主要内容和信息,例如,“人工智能的发展与应用.pdf”是一个目标文件。发送是指将目标文件通过网络传输的方式,从服务器端发送到用户的查询端的过程,用以展示文件的具体内容。
发送的方法可以有多种,例如,可以利用超文本传输协议(HypertextTransferProtocol,HTTP)、文件传输协议(FileTransferProtocol,FTP)、简单邮件传输协议(SimpleMailTransferProtocal,SMTP)等协议,从服务器端发送目标文件到用户的查询端。发送的目的是为了将目标文件展示给用户,方便用户查看和下载。查询端是指用户用于输入查询文本和接收查询结果的设备,例如,电脑、手机、平板等。查询端的功能是为了使用户能够与服务器端进行交互,方便用户检索和查看。
在某些情况下,目标文件可能是文本格式文件,即文件的主要内容是文字信息,例如,TXT、DOC、PDF等格式的文件。在这种情况下,可以直接将目标文件发送至查询端,无需进行转换或压缩。将发送的目标文件作为查询结果的一部分,用以通过文字展示文件的具体内容。
通过本步骤,可以实现将目标文件发送至查询端,为用户查看和下载查询结果提供了便利。这样,可以将文件的内容用文字表达出来,方便用户查看和下载。
子步骤2042,在所述目标文件为非文本格式文件的情况下,将所述目标文件与所述目标描述文本共同发送至所述查询端。
在本申请的一些实施例中,为了方便用户查看和下载查询结果,需要将目标文件与目标描述文本共同发送至查询端。
目标文件是指从候选描述文本中确定出的最符合用户检索意图的文件,可以反映文件的主要内容和信息,例如,“风声.wav”是一个目标文件。目标描述文本是指从候选描述文本中确定出的最符合用户检索意图的描述文本,可以反映文件的主要内容和信息。
通过本步骤,可以实现将目标文件与目标描述文本共同发送至查询端,为用户查看和下载查询结果提供了便利。这样,可以将文件的内容用文字和非文字表达出来,方便用户查看和下载。
子步骤2043,在所述目标文件包括文本片段和非文本片段的情况下,将所述目标文件与所述目标描述文本共同发送至所述查询端。
在本申请的一些实施例中,为了方便用户查看和下载查询结果,需要将目标文件与目标描述文本共同发送至查询端。
例如,可以利用HTTP、FTP、SMTP等协议,从服务器端发送目标文件和目标描述文本到用户的查询端。发送的目的是为了将目标文件和目标描述文本展示给用户,方便用户查看和下载。
通过本步骤,可以实现将目标文件与目标描述文本共同发送至查询端,为用户查看和下载查询结果提供了便利。这样,可以将文件的内容用文字和非文字表达出来,方便用户查看和下载。
在本申请的一个实施例中,基于本申请的文件的查询方法,建立了如图3所示的文件查询服务器:通过集群服务器对文本格式的文件,非文本格式的文件,以及包括文本片段和非文本片段的文件进行存储,其中通过识别器和分类器对非文本格式的文件做出一定的处理,这种处理可以是对图片或音频文件的文字提取或大意概括,也可以是对压缩文件的解压提取等,集群服务器的数据通过描述文本处理模型以提取前述多种类型数据的描述文本,提取的方法可以利用数据清洗等手段;在用户侧用户可以利用检索引擎对存储于内存存储服务器中的数据进行检索查询,同时检索引擎还可以提供热点数据存储与定时同步脚本功能,查询手段包括但不限于用户数据详情检索、用户查询检索及统计查询。
综上,在本申请实施例中,通过将查询请求文本化获得查询文本,以将查询请求的转化为与数据库中存储的查询文本类型一致的数据类型,进而通过文本匹配获得目标描述文本,只要数据库中有相应的描述文本,就可以实现文件的查询和定位,不需要对原始文件进行数据分析和处理,而是直接利用数据库中已经建立的描述文本和文件的对应关系,从而快速定位到目标文件,以此利用查询数据库中建立好的描述文本和文件的对应关系,最终确定查询请求所指向的目标文件,使得用户可以在查询数据时仅通过文本匹配及关系映射就确定目标文件,将不同类型的文件的查询检索,简化为对文本文件的查询检索,这样用户只需要输入一段具有含义的文字,就可以获得所需的文件,而不需要了解文件的具体类型和格式,避免了对于数据库中的原始文件的数据分析过程。由此,基于本申请实施例的方法,将对于不同数据类型的文件的查询检索,统一化为对文本文件的查询检索,降低了检索过程的复杂性,解决了检索过程中,需要耗费大量的时间与算力,无法快速反馈检索结果,导致的检索等待时间长,无法及时响应的问题。
参考图4,其示出了本申请实施例提供的一种文件的查询装置30,包括:
查询模块301,用于响应于查询端发出的查询请求,通过所述查询请求获得查询文本;所述查询文本是一段具有含义的文字;
匹配模块302,用于将所述查询文本与查询数据库中预设的描述文本匹配,获取与查询文本匹配的目标描述文本;所述查询数据库中还建立有描述文本和文件的对应关系;所述描述文本用以通过文字解释文件的具体内容;
输出模块303,用于根据所述目标描述文本和所述对应关系,获取与所述目标描述文本对应的目标文件,并将所述目标文件作为查询结果发送至所述查询端。
可选的,所述装置还包括:
描述模块,用于获取存入的文件的描述文本,并在所述查询数据库中建立所述描述文本与存入的所述文件的对应关系。
可选的,所述文件为文本格式文件,所述描述模块包括:
结构子模块,用于提取所述文本格式文件中的所有字符文本,并由所述字符文本生成所述描述文本。
可选的,所述文件为非文本格式文件,所述描述模块包括:
非结构子模块,用于获取所述非文本格式文件的语义文本,并由所述语义文本生成所述描述文本;所述语义文本用以描述所述非文本格式文件。
可选的,所述文件包括文本片段和非文本片段,所述描述模块包括:
第一半结构子模块,用于提取所述文件中所述文字片段的所有字符文本,并由所述字符文本生成所述描述文本;
或,第二半结构子模块,用于获取所述文件中所述非文字片段的语义文本,并由所述语义文本生成所述描述文本;所述语义文本用以描述所述文件中的所述非文字片段。
可选的,所述结构子模块和/或第一半结构子模块和/或第二半结构子模块包括:
关键词单元,用于提取所述字符文本中的关键词,所述关键词是用于描述所述文件的文字;
将所述关键词确定为所述描述文本。
可选的,非结构子模块包括:
识别单元,用于在所述非文本格式文件中包含语言内容的情况下,通过识别器识别所述非文本格式文件,获得用于反映所述语言内容的语义文本,并将所述语义文本确定为所述描述文本;
分类单元,用于在所述非文本格式文件中不包含语言内容的情况下,通过分类器确定所述非文本格式文件的内容类别,获得用于反映所述内容类别的语义文本,并将所述语义文本确定为所述描述文本。
可选的,在所述非文本格式文件为图像文件,且所述图像文件的画面中包含字符内容的情况下,所述识别单元包括:
第一识别子单元,用于通过图像识别器识别所述图像文件的画面中的字符内容,将所述字符内容作为语义文本;
在所述非文本格式文件为图像文件,且所述图像文件的画面中不包含字符内容的情况下,所述分类单元包括:
第一分类子单元,用于通过分类器确定所述图像文件的画面内容类别,获得用于反映所述画面内容类别的语义文本。
可选的,在所述非文本格式文件为音频文件,且所述音频文件中包含语言对白的情况下,所述识别单元包括:
第二识别子单元,用于通过音频识别器识别所述音频文件中的语言对白,将所述语言对白作为语义文本;
在所述非文本格式文件为音频文件,且所述音频文件中不包含语言对白的情况下,所述分类单元包括:
第二识别子单元,用于通过分类器确定所述音频文件的音频内容类别,获得用于反映所述音频内容类别的语义文本。
可选的,匹配模块302包括:
分词子模块,用于对所述查询文本进行分词,获得多个分词;
查找子模块,用于查找所述对应关系中包含所述分词的候选描述文本;
选取子模块,用于在所述候选描述文本中包含的所述分词的数量大于预设阈值的情况下,将所述候选描述文本确定为目标描述文本。
可选的,输出模块303包括:
结构输出子模块,用于在所述目标文件为文本格式文件的情况下,将所述目标文件发送至所述查询端;
非结构输出子模块,用于在所述目标文件为非文本格式文件的情况下,将所述目标文件与所述目标描述文本共同发送至所述查询端;
半结构输出子模块,用于在所述目标文件包括文本片段和非文本片段的情况下,将所述目标文件与所述目标描述文本共同发送至所述查询端。
综上,在本申请实施例中,通过将查询请求文本化获得查询文本,以将查询请求的转化为与数据库中存储的查询文本类型一致的数据类型,进而通过文本匹配获得目标描述文本,只要数据库中有相应的描述文本,就可以实现文件的查询和定位,不需要对原始文件进行数据分析和处理,而是直接利用数据库中已经建立的描述文本和文件的对应关系,从而快速定位到目标文件,以此利用查询数据库中建立好的描述文本和文件的对应关系,最终确定查询请求所指向的目标文件,使得用户可以在查询数据时仅通过文本匹配及关系映射就确定目标文件,将不同类型的文件的查询检索,简化为对文本文件的查询检索,这样用户只需要输入一段具有含义的文字,就可以获得所需的文件,而不需要了解文件的具体类型和格式,避免了对于数据库中的原始文件的数据分析过程。由此,基于本申请实施例的方法,将对于不同数据类型的文件的查询检索,统一化为对文本文件的查询检索,降低了检索过程的复杂性,解决了检索过程中,需要耗费大量的时间与算力,无法快速反馈检索结果,导致的检索等待时间长,无法及时响应的问题。
参照图5,电子设备500可以包括以下一个或多个组件:处理组件502,存储器505,电源组件506,多媒体组件508,音频组件510,输入/输出(I/O)接口512,传感器组件514,以及通信组件516。
处理组件502通常控制电子设备500的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件502可以包括一个或多个处理器520来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件502可以包括一个或多个模块,便于处理组件502和其他组件之间的交互。例如,处理组件502可以包括多媒体模块,以方便多媒体组件508和处理组件502之间的交互。
存储器504用于存储各种类型的数据以支持在电子设备500的操作。这些数据的示例包括用于在电子设备500上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,多媒体等。存储器504可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件506为电子设备500的各种组件提供电力。电源组件506可以包括电源管理系统,一个或多个电源,及其他与为电子设备500生成、管理和分配电力相关联的组件。
多媒体组件508包括在电子设备500和用户之间的提供一个输出接口的界面。在一些实施例中,界面可以包括液晶显示器(LCD)和触摸面板(TP)。如果界面包括触摸面板,界面可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。触摸传感器可以不仅感测触摸或滑动动作的分界,而且还检测与触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件508包括一个前置摄像头和/或后置摄像头。当电子设备500处于操作模式,如拍摄模式或多媒体模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件510用于输出和/或输入音频信号。例如,音频组件510包括一个麦克风(MIC),当电子设备500处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风用于接收外部音频信号。所接收的音频信号可以被进一步存储在存储器504或经由通信组件516发送。在一些实施例中,音频组件510还包括一个扬声器,用于输出音频信号。
输入/输出I/O接口512为处理组件502和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件514包括一个或多个传感器,用于为电子设备500提供各个方面的状态评估。例如,传感器组件515可以检测到电子设备500的打开/关闭状态,组件的相对定位,例如组件为电子设备500的显示器和小键盘,传感器组件514还可以检测电子设备500或电子设备500一个组件的位置改变,用户与电子设备500接触的存在或不存在,电子设备500方位或加速/减速和电子设备500的温度变化。传感器组件514可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件515还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件514还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件516用于便于电子设备500和其他设备之间有线或无线方式的通信。电子设备500可以接入基于通信标准的无线网络,如WiFi,运营商网络(如2G、3G、4G或5G),或它们的组合。在一个示例性实施例中,通信组件516经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,通信组件516还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,电子设备500可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于实现本申请实施例提供的一种显示控制方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器504,上述指令可由电子设备500的处理器520执行以完成上述方法。例如,非临时性存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
图6是本发明另一个实施例的电子设备600的框图。例如,电子设备600可以被提供为一服务器。参照图6,电子设备600包括处理组件622,其进一步包括一个或多个处理器,以及由存储器632所代表的存储器资源,用于存储可由处理组件622的执行的指令,例如应用程序。存储器632中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件622被配置为执行指令,以执行本申请实施例提供的一种显示控制方法。
电子设备600还可以包括一个电源组件626被配置为执行电子设备600的电源管理,一个有线或无线网络接口650被配置为将电子设备600连接到网络,和一个输入/输出(I/O)接口658。电子设备600可以操作基于存储在存储器632的操作系统,例如WindowsServerTM,MacOSXTM,UnixTM,LinuxTM,FreeBSDTM或类似。
本领域技术人员在考虑说明书及实践这里公开的申请后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本申请的真正范围和精神由下面的权利要求指出。
应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求来限制。
Claims (14)
1.一种文件的查询方法,其特征在于,包括:
响应于查询端发出的查询请求,通过所述查询请求获得查询文本;所述查询文本是一段具有含义的文字;
将所述查询文本与查询数据库中预设的描述文本匹配,,获取与查询文本匹配的目标描述文本;所述查询数据库中还建立有描述文本和文件的对应关系;所述描述文本用以通过文字解释文件的具体内容;;
根据所述目标描述文本和所述对应关系,获取与所述目标描述文本对应的目标文件,并将所述目标文件作为查询结果发送至所述查询端。
2.如权利要求1所述的方法,其特征在于,在所述响应于查询端发出的查询请求,通过所述查询请求获得查询文本之前,所述方法还包括:
获取存入的文件的描述文本,并在所述查询数据库中建立所述描述文本与存入的所述文件的对应关系。
3.如权利要求2所述的方法,其特征在于,所述文件为文本格式文件,所述获取存入的文件的描述文本,包括:
提取所述文本格式文件中的所有字符文本,并由所述字符文本生成所述描述文本。
4.如权利要求2所述的方法,其特征在于,所述文件为非文本格式文件,所述获取存入的文件的描述文本,包括:
获取所述非文本格式文件的语义文本,并由所述语义文本生成所述描述文本;所述语义文本用以描述所述非文本格式文件。
5.如权利要求2所述的方法,其特征在于,所述文件包括文本片段和非文本片段,所述获取存入的文件的描述文本,包括:
提取所述文件中所述文字片段的所有字符文本,并由所述字符文本生成所述描述文本;
或,获取所述文件中所述非文字片段的语义文本,并由所述语义文本生成所述描述文本;所述语义文本用以描述所述文件中的所述非文字片段。
6.如权利要求3或5所述的方法,其特征在于,所述由所述字符文本生成所述描述文本,包括:
提取所述字符文本中的关键词,所述关键词是用于描述所述文件的文字;
将所述关键词确定为所述描述文本。
7.如权利要求4所述的方法,其特征在于,所述获取所述非文本格式文件的语义文本,并由所述语义文本生成所述描述文本,包括:
在所述非文本格式文件中包含语言内容的情况下,通过识别器识别所述非文本格式文件,获得用于反映所述语言内容的语义文本,并将所述语义文本确定为所述描述文本;
在所述非文本格式文件中不包含语言内容的情况下,通过分类器确定所述非文本格式文件的内容类别,获得用于反映所述内容类别的语义文本,并将所述语义文本确定为所述描述文本。
8.如权利要求7所述的方法,其特征在于,在所述非文本格式文件为图像文件,且所述图像文件的画面中包含字符内容的情况下,所述通过识别器识别所述非文本格式文件,获得用于反映所述语言内容的语义文本,包括:
通过图像识别器识别所述图像文件的画面中的字符内容,将所述字符内容作为语义文本;
在所述非文本格式文件为图像文件,且所述图像文件的画面中不包含字符内容的情况下,所述通过分类器确定所述非文本格式文件的内容类别,获得用于反映所述内容类别的语义文本,包括:
通过分类器确定所述图像文件的画面内容类别,获得用于反映所述画面内容类别的语义文本。
9.如权利要求7所述的方法,其特征在于,在所述非文本格式文件为音频文件,且所述音频文件中包含语言对白的情况下,所述通过识别器识别所述非文本格式文件,获得用于反映所述语言内容的语义文本,包括:
通过音频识别器识别所述音频文件中的语言对白,将所述语言对白作为语义文本;
在所述非文本格式文件为音频文件,且所述音频文件中不包含语言对白的情况下,所述通过分类器确定所述非文本格式文件的内容类别,获得用于反映所述内容类别的语义文本,包括:
通过分类器确定所述音频文件的音频内容类别,获得用于反映所述音频内容类别的语义文本。
10.如权利要求1所述的方法,其特征在于,所述将所述查询文本与查询数据库中预设的描述文本匹配,获取与查询文本匹配的目标描述文本,包括:
对所述查询文本进行分词,获得多个分词;
查找所述对应关系中包含所述分词的候选描述文本;
在所述候选描述文本中包含的所述分词的数量大于预设阈值的情况下,将所述候选描述文本确定为目标描述文本。
11.如权利要求1所述的方法,其特征在于,所述将所述目标文件作为查询结果发送至所述查询端,包括:
在所述目标文件为文本格式文件的情况下,将所述目标文件发送至所述查询端;
在所述目标文件为非文本格式文件的情况下,将所述目标文件与所述目标描述文本共同发送至所述查询端;
在所述目标文件包括文本片段和非文本片段的情况下,将所述目标文件与所述目标描述文本共同发送至所述查询端。
12.一种文件的查询装置,其特征在于,包括:
查询模块,用于响应于查询端发出的查询请求,通过所述查询请求获得查询文本;所述查询文本是一段具有含义的文字;
匹配模块,用于将所述查询文本与查询数据库中预设的描述文本匹配,获取与查询文本匹配的目标描述文本;所述查询数据库中还建立有描述文本和文件的对应关系;所述描述文本用以通过文字解释文件的具体内容;
输出模块,用于根据所述目标描述文本和所述对应关系,获取与所述目标描述文本对应的目标文件,并将所述目标文件作为查询结果发送至所述查询端。
13.一种电子设备,其特征在于,包括:处理器、用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如权利要求1至11中任一项所述的方法。
14.一种计算机可读存储介质,其特征在于,当所述计算机可读存储介质中的指令由电子设备的处理器执行时,使得所述电子设备能够执行如权利要求1至11中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311498495.0A CN117539829A (zh) | 2023-11-10 | 2023-11-10 | 文件的查询方法、装置、电子设备及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311498495.0A CN117539829A (zh) | 2023-11-10 | 2023-11-10 | 文件的查询方法、装置、电子设备及计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117539829A true CN117539829A (zh) | 2024-02-09 |
Family
ID=89789200
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311498495.0A Pending CN117539829A (zh) | 2023-11-10 | 2023-11-10 | 文件的查询方法、装置、电子设备及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117539829A (zh) |
-
2023
- 2023-11-10 CN CN202311498495.0A patent/CN117539829A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11355100B2 (en) | Method and electronic device for processing audio, and non-transitory storage medium | |
CN102782751B (zh) | 社会网络中的数字媒体语音标签 | |
CN110781305B (zh) | 基于分类模型的文本分类方法及装置,以及模型训练方法 | |
CN108847214B (zh) | 语音处理方法、客户端、装置、终端、服务器和存储介质 | |
CN111259148B (zh) | 信息处理方法、装置及存储介质 | |
CN110473546B (zh) | 一种媒体文件推荐方法及装置 | |
US20060173859A1 (en) | Apparatus and method for extracting context and providing information based on context in multimedia communication system | |
CN111586469B (zh) | 弹幕显示方法、装置及电子设备 | |
WO2006025797A1 (en) | A search system | |
CN109801648B (zh) | 消息弹窗语音编辑方法、装置、计算机设备及存储介质 | |
US9557903B2 (en) | Method for providing user interface on terminal | |
CN104252464A (zh) | 信息处理方法和装置 | |
CN110287364B (zh) | 语音搜索方法、系统、设备及计算机可读存储介质 | |
CN107145509B (zh) | 一种信息搜索方法及其设备 | |
CN109710799B (zh) | 语音交互方法、介质、装置和计算设备 | |
KR20090068380A (ko) | 개선된 이동 통신 단말 | |
CN107643923B (zh) | 复制信息的处理方法及移动终端 | |
KR20140060217A (ko) | 오디오 신호에 의해 메시지를 포스팅하는 시스템 및 방법 | |
CN113407775B (zh) | 视频搜索方法、装置及电子设备 | |
CN112133295B (zh) | 语音识别方法、装置及存储介质 | |
CN112149403A (zh) | 一种确定涉密文本的方法和装置 | |
WO2019228140A1 (zh) | 指令执行方法、装置、存储介质及电子设备 | |
CN116343771A (zh) | 一种基于知识图谱的音乐点播语音指令识别方法、装置 | |
CN117539829A (zh) | 文件的查询方法、装置、电子设备及计算机可读存储介质 | |
CN113923517B (zh) | 一种背景音乐生成方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |