CN116089368B - 文件搜索方法和相关装置 - Google Patents
文件搜索方法和相关装置 Download PDFInfo
- Publication number
- CN116089368B CN116089368B CN202210920196.0A CN202210920196A CN116089368B CN 116089368 B CN116089368 B CN 116089368B CN 202210920196 A CN202210920196 A CN 202210920196A CN 116089368 B CN116089368 B CN 116089368B
- Authority
- CN
- China
- Prior art keywords
- index
- file
- search
- word
- files
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 67
- 230000000875 corresponding effect Effects 0.000 claims description 108
- 230000002596 correlated effect Effects 0.000 claims description 22
- 230000008859 change Effects 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 10
- 230000006870 function Effects 0.000 description 41
- 238000010586 diagram Methods 0.000 description 23
- 238000012545 processing Methods 0.000 description 23
- 239000010410 layer Substances 0.000 description 21
- 238000004891 communication Methods 0.000 description 17
- 238000007726 management method Methods 0.000 description 10
- 230000008569 process Effects 0.000 description 7
- 230000005236 sound signal Effects 0.000 description 7
- 238000010295 mobile communication Methods 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 5
- 238000009877 rendering Methods 0.000 description 5
- 238000013461 design Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000007781 pre-processing Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 238000012217 deletion Methods 0.000 description 3
- 230000037430 deletion Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 239000000835 fiber Substances 0.000 description 3
- 230000003190 augmentative effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 230000001276 controlling effect Effects 0.000 description 2
- 238000012015 optical character recognition Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 210000000988 bone and bone Anatomy 0.000 description 1
- 239000012792 core layer Substances 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000001356 surgical procedure Methods 0.000 description 1
- 238000010408 sweeping Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 230000002618 waking effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/14—Details of searching files based on file metadata
- G06F16/144—Query formulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/13—File access structures, e.g. distributed indices
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/14—Details of searching files based on file metadata
- G06F16/156—Query results presentation
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Abstract
本申请实施例提供一种文件搜索方法和相关装置,涉及终端技术领域,方法包括:终端设备获取用户输入的搜索词;当利用搜索词无法搜索到搜索结果时,终端设备在存储在本地的M个索引词中确定与搜索词的相似度满足第一预设条件的N个索引词;N小于或等于M,N为大于1的整数;终端设备在N个索引词中确定词频满足第二预设条件的目标索引词;其中,N个索引词中第一索引词的词频与第一索引词对应的Q个索引文件的下述一项或多项内容有关:Q个索引文件各自的文件类型、各文件类型在搜索历史中被搜索的次数;终端设备输出目标索引词对应的索引文件。这样,使得终端设备可以在无法搜索到结果时输出更加符合用户搜索意图的索引文件,提升用户体验。
Description
技术领域
本申请涉及终端技术领域,尤其涉及一种文件搜索方法和相关装置。
背景技术
终端设备中可以存储大量的文件,例如,图像、视频、音频等,用户可以通过搜索的方式在终端设备中查找需要的文件。例如,用户可以在终端设备对应的搜索框中输入搜索词,以使终端设备基于用户输入的搜索词搜索对应的目标文件,并输出目标文件。
在搜索文件时,可能存在用户输入的搜索词不规范、语义错误或者错别字等问题,导致终端设备基于用户输入的搜索词无法搜索到相匹配的文件。在现有技术中,通常可以针对用户输入的搜索词进行模糊查找,例如,针对搜索词中的某个字查找文件,以使终端设备能够输出与搜索词相对应的目标文件。
然而,模糊查找的方式搜索到的文件可能并不是用户需要的文件,甚至与用户的搜索意图相悖,导致用户的体验差。
发明内容
本申请实施例提供一种文件搜索方法和相关装置,能够输出符合用户搜索意图的索引文件,提升了用户体验。
第一方面,本申请实施例提供一种文件搜索方法,应用于终端设备,方法包括:
获取用户输入的搜索词;利用所述搜索词在M个索引词中进行搜索;所述M个索引词为存储在终端设备本地的索引词;当利用所述搜索词在所述M个索引词中无法搜索到搜索结果时,在所述M个索引词中确定与所述搜索词的相似度满足第一预设条件的N个索引词;所述N小于或等于M,所述N为大于1的整数;在所述N个索引词中确定满足第二预设条件的目标索引词;其中,任一个所述索引词对应有至少一个索引文件,所述第二预设条件与所述N个索引词各自的词频有关,对于所述N个索引词中第一索引词的词频,所述第一索引词的词频与所述第一索引词对应的Q个索引文件的下述一项或多项内容有关:所述Q个索引文件各自的文件类型、各所述文件类型在搜索历史中被搜索的次数;输出所述目标索引词对应的索引文件。这样,在用户输入的搜索词无法搜索到搜索结果时,终端设备能够利用搜索词确定词频满足第二预设条件的目标索引词,且词频与文件类型和/或文件类型被搜索的次数有关,实现了利用用户输入的搜索词预测用户的索索意图,从而输出符合用户的搜索意图的索引文件,提升了用户体验。
一种可能的实现方式中,所述Q个索引文件对应于L个文件类型,所述词频具体与L个第一比例和/或L个第二比例有关,其中,所述L个文件类型分别对应有第一比例和/或第二比例;针对所述L个文件类型中的第一文件类型:所述第一文件类型的第一比例与所述终端设备中存储的所述第一文件类型的索引文件的文件数量正相关,以及与所述终端设备中存储的索引文件总数负相关;所述第一文件类型的第二比例与所述第一文件类型的索引文件在预设时长内被搜索的次数正相关,以及与所述终端设备中除所述第一文件类型外的其它类型的索引文件在所述预设时长内被搜索的次数负相关。这样,使得终端设备可以根据其存储的索引文件的数量和/或索引文件被搜索的次数确定索引词的词频,使得终端设备输出的索引文件更加符合用户的搜索意图。
一种可能的实现方式中,所述第一文件类型的第一比例为第一值与所述终端设备中存储的索引文件总数的比例,所述第一值为所述终端设备中所存储的所述第一文件类型的索引文件的文件数量;所述第一文件类型的第二比例为第二值与第三值的比例,所述第二值为所述第一文件类型的索引文件在预设时长内被搜索的次数,所述第三值与所述终端设备中除所述第一文件类型外的其它类型的索引文件在所述预设时长内被搜索的次数有关。这样,使得终端设备确定的与用户输入的搜索词相关的目标索引词更加准确。
一种可能的实现方式中,所述第三值为动态参数与所述终端设备中除所述第一文件类型外的其它类型的索引文件在所述预设时长内被搜索的次数之和,所述动态参数随着所述第一文件类型的第一比例的变化而变化,以使所述第一文件类型的第一比例和所述第一文件类型的第二比例之间的差值小于预设阈值。这样,使用动态参数控制第一比例和第二比例之间的差值,使得第一比例和第二比例在索引词的词频中的权重相当,进一步提升终端设备输出的索引文件与用户的搜索意图的契合度。
一种可能的实现方式中,所述第一文件类型的第二比例满足下述公式:
所述x为所述第一文件类型的索引文件在预设时长内被搜索的次数,y为所述终端设备中除所述第一文件类型外的其它类型的索引文件在所述预设时长内被搜索的次数,所述λ为动态参数。这样,使用sigmoid函数形式表示文件类型的第二比例,使得文件类型的第二比例对应的函数的取值区间为[0,1),与第一比例对应函数的取值区间相同,提升了索引词词频的准确度。
一种可能的实现方式中,所述第一索引词的词频满足下述公式:
所述Xi为L个文件类型中第i个文件类型在所述Q个索引文件中对应的索引文件数量,所述pi为L个文件类型中第i个文件类型的第一比例,所述hi为L个文件类型中第i个文件类型的第二比例。这样,使得终端设备可以依据用户对于不同文件类型的搜索偏好确定索引词的词频,能够有效的提升根据用户输入的搜索词确定的目标索引词的精准度。
一种可能的实现方式中,所述终端设备中预先维护有所述Q个索引文件的下述一项或多项:所述L个文件类型各自对应的第一比例、所述L个文件类型各自对应的第二比例、所述L个文件类型各自在所述Q个索引文件中对应的索引文件数量。这样,使得终端设备能够快速确定索引词的词频,提升了终端设备输出目标索引词对应的索引文件的速度。
一种可能的实现方式中,所述获取用户输入的搜索词之前,还包括:显示负一屏界面或备忘录搜索界面;所述负一屏界面或所述备忘录搜索界面包括搜索框;接收用户在所述搜索框中输入的所述搜索词。这样,使得终端设备能够在负一屏界面和备忘录界面快速准确的得到索引文件。
一种可能的实现方式中,终端设备利用第一搜索词进行文件搜索时,索引文件的文件类型包括下述一项或多项:图像、视频、音频、文档、备忘录、短信;所述第一搜索词为用户在所述负一屏显示界面的搜索框中输入的搜索词;终端设备利用第二搜索词进行文件搜索时,索引文件的文件类型包括下述一项或多项:文本、图像、语音;所述第二搜索词为用户在所述备忘录搜索界面的搜索框中输入的搜索词。这样,终端设备能够根据用户输入的搜索词准确的输出不同显示界面对应的索引文件。
一种可能的实现方式中,所述在所述N个索引词中确定满足第二预设条件的目标索引词,包括:在所述N个索引词中确定W个目标索引词,所述W小于等于N,所述W为大于等于1的整数,所述W个目标索引词为词频从大到小排序中的前W个索引词。这样,能够控制终端设备输出的索引文件的数量,且使得终端设备输出的索引文件更加符合用户的搜索意图。
一种可能的实现方式中,所述在所述M个索引词中确定与所述搜索词的相似度满足第一预设条件的N个索引词,包括:在所述M个索引词中确定所述相似度大于或等于相似度阈值的N个索引词。这样,使得终端设备确定的N个索引词是与用户输入的搜索词相关的。
第二方面,本申请实施例提供一种文件搜索装置,本申请实施例提供一种文件搜索装置,该文件搜索装置可以是终端设备,也可以是终端设备内的芯片或者芯片系统。该文件搜索装置可以包括显示单元和处理单元。当该文件搜索装置是终端设备时,该处显示单元可以是显示屏。该显示单元用于执行显示的步骤,以使该终端设备实现第一方面或第一方面的任意一种可能的实现方式中描述的显示相关的方法,处理单元用于实现第一方面或第一方面的任意一种可能的实现方式中与处理相关的任意方法。当该文件搜索装置是终端设备时,该处理单元可以是处理器。该文件搜索装置还可以包括存储单元,该存储单元可以是存储器。该存储单元用于存储指令,该处理单元执行该存储单元所存储的指令,以使该终端设备实现第一方面或第一方面的任意一种可能的实现方式中描述的一种方法。当该视频处理装置是终端设备内的芯片或者芯片系统时,该处理单元可以是处理器。该处理单元执行存储单元所存储的指令,以使该终端设备实现第一方面或第一方面的任意一种可能的实现方式中描述的一种方法。该存储单元可以是该芯片内的存储单元(例如,寄存器、缓存等),也可以是该终端设备内的位于该芯片外部的存储单元(例如,只读存储器、随机存取存储器等)。
示例性的,处理单元,用于获取用户输入的搜索词;还用于利用所述搜索词在M个索引词中进行搜索;所述M个索引词为存储在终端设备本地的索引词;还用于当利用所述搜索词在所述M个索引词中无法搜索到搜索结果时,在所述M个索引词中确定与所述搜索词的相似度满足第一预设条件的N个索引词;所述N小于或等于M,所述N为大于1的整数;还用于在所述N个索引词中确定满足第二预设条件的目标索引词;其中,任一个所述索引词对应有至少一个索引文件,所述第二预设条件与所述N个索引词各自的词频有关,对于所述N个索引词中第一索引词的词频,所述第一索引词的词频与所述第一索引词对应的Q个索引文件的下述一项或多项内容有关:所述Q个索引文件各自的文件类型、各所述文件类型在搜索历史中被搜索的次数;还用于输出所述目标索引词对应的索引文件。
一种可能的实现方式中,所述Q个索引文件对应于L个文件类型,所述词频具体与L个第一比例和/或L个第二比例有关,其中,所述L个文件类型分别对应有第一比例和/或第二比例;针对所述L个文件类型中的第一文件类型:所述第一文件类型的第一比例与所述终端设备中存储的所述第一文件类型的索引文件的文件数量正相关,以及与所述终端设备中存储的索引文件总数负相关;所述第一文件类型的第二比例与所述第一文件类型的索引文件在预设时长内被搜索的次数正相关,以及与所述终端设备中除所述第一文件类型外的其它类型的索引文件在所述预设时长内被搜索的次数负相关。
一种可能的实现方式中,所述第一文件类型的第一比例为第一值与所述终端设备中存储的索引文件总数的比例,所述第一值为所述终端设备中所存储的所述第一文件类型的索引文件的文件数量;所述第一文件类型的第二比例为第二值与第三值的比例,所述第二值为所述第一文件类型的索引文件在预设时长内被搜索的次数,所述第三值与所述终端设备中除所述第一文件类型外的其它类型的索引文件在所述预设时长内被搜索的次数有关。
一种可能的实现方式中,所述第三值为动态参数与所述终端设备中除所述第一文件类型外的其它类型的索引文件在所述预设时长内被搜索的次数之和,所述动态参数随着所述第一文件类型的第一比例的变化而变化,以使所述第一文件类型的第一比例和所述第一文件类型的第二比例之间的差值小于预设阈值。
一种可能的实现方式中,所述第一文件类型的第二比例满足下述公式:
所述x为所述第一文件类型的索引文件在预设时长内被搜索的次数,y为所述终端设备中除所述第一文件类型外的其它类型的索引文件在所述预设时长内被搜索的次数,所述λ为动态参数。
一种可能的实现方式中,所述第一索引词的词频满足下述公式:
所述Xi为L个文件类型中第i个文件类型在所述Q个索引文件中对应的索引文件数量,所述pi为L个文件类型中第i个文件类型的第一比例,所述hi为L个文件类型中第i个文件类型的第二比例。
一种可能的实现方式中,所述终端设备中预先维护有所述Q个索引文件的下述一项或多项:所述L个文件类型各自对应的第一比例、所述L个文件类型各自对应的第二比例、所述L个文件类型各自在所述Q个索引文件中对应的索引文件数量。
一种可能的实现方式中,所述显示单元,用于显示负一屏界面或备忘录搜索界面;所述负一屏界面或所述备忘录搜索界面包括搜索框;所述处理单元,还用于接收用户在所述搜索框中输入的所述搜索词。
一种可能的实现方式中,终端设备利用第一搜索词进行文件搜索时,索引文件的文件类型包括下述一项或多项:图像、视频、音频、文档、备忘录、短信;所述第一搜索词为用户在所述负一屏显示界面的搜索框中输入的搜索词;终端设备利用第二搜索词进行文件搜索时,索引文件的文件类型包括下述一项或多项:文本、图像、语音;所述第二搜索词为用户在所述备忘录搜索界面的搜索框中输入的搜索词。这样,终端设备能够根据用户输入的搜索词准确的输出不同显示界面对应的索引文件。
一种可能的实现方式中,所述处理单元,具体用于在所述N个索引词中确定W个目标索引词,所述W小于等于N,所述W为大于等于1的整数,所述W个目标索引词为词频从大到小排序中的前W个索引词。
一种可能的实现方式中,所述处理单元,具体用于在所述M个索引词中确定所述相似度大于或等于相似度阈值的N个索引词。
第三方面,本申请实施例提供一种终端设备,包括处理器和存储器,存储器用于存储代码指令;处理器用于运行代码指令,使得电子设备以执行如第一方面或第一方面的任一种实现方式中描述的文件搜索方法。
第四方面,本申请实施例提供一种计算机可读存储介质,计算机可读存储介质存储有指令,当指令被执行时,使得计算机执行如第一方面或第一方面的任一种实现方式中描述的文件搜索方法。
第五方面,一种计算机程序产品,包括计算机程序,当计算机程序被运行时,使得计算机执行如第一方面或第一方面的任一种实现方式中描述的文件搜索方法。
应当理解的是,本申请的第二方面至第五方面与本申请的第一方面的技术方案相对应,各方面及对应的可行实施方式所取得的有益效果相似,不再赘述。
附图说明
图1为本申请实施例提供的一种场景示意图一;
图2为本申请实施例提供的场景示意图二;
图3为本申请实施例提供的一种终端设备的结构示意图;
图4为本申请实施例提供的一种终端设备的软件结构框图;
图5为本申请实施例提供的一种文件搜索方法的流程示意图;
图6为本申请实施例提供的一种输出索引文件的界面示意图一;
图7为本申请实施例提供的一种输出索引文件的界面示意图二;
图8为本申请实施例提供的一种第一比例与文件数量的函数关系示意图;
图9为本申请实施例提供的一种第二比例与被搜索次数的函数关系示意图;
图10为本申请实施例提供的另一种文件搜索方法的流程示意图;
图11为本申请实施例提供的一种获取搜索词的界面示意图;
图12为本申请实施例提供的一种终端设备维护索引文件的基础信息的方法流程示意图;
图13为本申请实施例提供的一种终端设备维护搜索历史记录的方法流程示意图;
图14为本申请实施例提供的一种控制设备的硬件结构示意图;
图15为本申请实施例提供的一种芯片的结构示意图。
具体实施方式
下面对本申请实施例中所描述的词汇进行说明。可以理解,该说明是为更加清楚的解释本申请实施例,并不必然构成对本申请实施例的限定。
索引文件:存储在终端设备本地的文件,包括:文档文件、图像文件、视频文件、音频文件、备忘录文件等。
索引词:对应于索引文件,且一个索引文件可以包括多个索引词,可用于说明索引文件的内容、形式等信息。
词频:用于表征用户的搜索意图,与索引词对应的索引文件的文件类型和/或文件类型在搜索历史中被搜索的次数有关。
为了便于清楚描述本申请实施例的技术方案,在本申请的实施例中,采用了“第一”、“第二”等字样对功能和作用基本相同的相同项或相似项进行区分。例如,第一目标功能的界面和第二目标功能的界面是为了区分不同的响应界面,并不对其先后顺序进行限定。本领域技术人员可以理解“第一”、“第二”等字样并不对数量和执行次序进行限定,并且“第一”、“第二”等字样也并不限定一定不同。
需要说明的是,本申请中,“示例性的”或者“例如”等词用于表示作例子、例证或说明。本申请中被描述为“示例性的”或者“例如”的任何实施例或设计方案不应被解释为比其他实施例或设计方案更优选或更具优势。确切而言,使用“示例性的”或者“例如”等词旨在以具体方式呈现相关概念。
本申请中,“至少一个”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B的情况,其中A,B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达,是指的这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b,或c中的至少一项(个),可以表示:a,b,c,a和b,a和c,b和c,或a、b和c,其中a,b,c可以是单个,也可以是多个。
终端设备中往往存储有各种各样的文件,而且随着终端设备的存储能力的提升,其可以存储的文件数量也在不断增加。用户可以在终端设备中搜索存储的文件,从而快速的查找到目标文件。
示例性的,图1为本申请实施例提供的一种场景示意图一。终端设备显示如图1所示的负一屏界面,该负一屏界面中可以包括:天气信息、用于搜索本地文件的搜索框、快捷工具控件、用户显示动态信息的显示框、用于显示资讯信息的显示框等。其中,快捷工具控件包括健康码控件、乘车码控件、扫一扫控件、付款码控件以及用于显示更多快捷工具的控件。
可以理解的是,用户可以在如图1所示的界面上的搜索框中输入搜索词,以使终端设备利用搜索词在终端设备存储的本地文件中搜索到目标文件。例如,用户在搜索框内输入搜索词“海边”,在用户点击开始搜索的标识时,终端设备会显示搜索到的与“海边”相关的文件,显示的文件可能为图像、视频、音频等中的一项或多项。
然而,用户在使用上述图1所示的界面搜索文件时,在输入搜索词的过程中,可能会由于误触或者打错字等原因,造成输入的搜索词出现特殊字符、错别字等情况,使得终端设备无法查找到与用户输入的搜索词相匹配的文件,即针对用户输入的搜索词无法返回搜索结果,影响用户的体验。
有鉴于此,本申请实施例提供了一种文件搜索方法,终端设备在利用用户输入的搜索词无法搜索到搜索结果时,终端设备在存储的M个索引词中确定与用户输入的搜索词的相似度满足第一预设条件的N个索引词,输出N个索引词中词频满足第二预设条件的目标索引词对应的索引文件,使得终端设备能够返回搜索结果,且返回的搜索结果与用户输入的搜索词具有一定的相关性。考虑到用户对于不同文件类型的搜索偏好存在差异,索引词的词频与其对应的索引文件的各文件类型以及各文件类型在搜索历史中被搜索的次数相关,使得针对索引词的词频输出的索引文件更加符合用户的搜索意图,有效的提升了用户体验。
示例性的,本申请实施例提供的文件搜索方法还可以应用于如图2所示的场景中。图2为本申请实施例提供的场景示意图二。当终端设备接收到用户打开备忘录应用的操作时,可以显示如图2中的a所示的界面,该界面中包括用于切换备忘录文件显示方式的控件、搜索备忘录文件对应的搜索框、多个备忘录文件、用于创建新的备忘录文件的控件、用于显示笔记的控件以及用于显示待办事项的控件等。其中,该多个备忘录文件包括:备忘录内容1、备忘录内容2、备忘录内容3、备忘录内容4、备忘录内容5、备忘录内容6等,各备忘录文件的周围显示该备忘录文件对应的创建时间等。
如图2中的a所示的界面中,当终端设备获取到用户在搜索备忘录文件对应的搜索框中输入的搜索词“电路图”时,终端设备针对搜索词在终端设备存储的所有备忘录文件的索引词中进行搜索,在搜索到与“电路图”相匹配的索引词时,输出该索引词对应的目标备忘录文件,即显示如图2中的b所示的界面。该界面上可以包括:用于切换备忘录文件显示方式的控件、搜索备忘录文件对应的搜索框、2个备忘录文件、用于显示笔记的控件以及用于显示待办事项的控件等。其中,界面中显示的2个备忘录文件分别为备忘录内容5和备忘录内容3,且备忘录内容5的创建时间早于备忘录内容3。可以理解的是,备忘录内容5和备忘录内容3分别的索引词与搜索词“电路图”相关,且备忘录内容5的相关性大于备忘录内容3的相关性,例如,备忘录内容5可以为电路图(试用)的备忘录文件,备忘录内容3可以为电路原理图的备忘录文件。
可以理解的是,备忘录文件对应的索引词可以与备忘录文件的内容相关,一个备忘录文件可以对应多个索引词,本申请实施例对于备忘录文件对应的索引词的内容以及数量不做具体限定。用户可以在图2中的b所示的界面上自主选择需要的电路进行查看、修改等操作。
可以理解的是,在上述图1和图2对应的场景实施例中,均以终端设备为手机为例进行示例说明,该示例并不构成本申请实施例的限定。
可以理解的是,上述终端设备也可以称为终端,(terminal)、用户设备(userequipment,UE)、移动台(mobile station,MS)、移动终端(mobile terminal,MT)等。终端设备可以为拥有MIC的手机(mobile phone)、智能电视、穿戴式设备、平板电脑(Pad)、带无线收发功能的电脑、虚拟现实(virtual reality,VR)终端设备、增强现实(augmentedreality,AR)终端设备、工业控制(industrial control)中的无线终端、无人驾驶(self-driving)中的无线终端、远程手术(remote medical surgery)中的无线终端、智能电网(smart grid)中的无线终端、运输安全(transportation safety)中的无线终端、智慧城市(smart city)中的无线终端、智慧家庭(smart home)中的无线终端等等。本申请的实施例对终端设备所采用的具体技术和具体设备形态不做限定。
因此,为了能够更好地理解本申请实施例,下面对本申请实施例的终端设备的结构进行介绍。示例性的,图3为本申请实施例提供的一种终端设备的结构示意图。
终端设备可以包括处理器110,外部存储器接口120,内部存储器121,通用串行总线(universal serial bus,USB)接口130,充电管理模块140,电源管理模块141,天线1,天线2,移动通信模块150,无线通信模块160,音频模块170,扬声器170A,受话器170B,麦克风170C,耳机接口170D,传感器模块180,按键190,指示器192,摄像头193,以及显示屏194等。
可以理解的是,本申请实施例示意的结构并不构成对终端设备的具体限定。在本申请另一些实施例中,终端设备可以包括比图示更多或更少的部件,或者组合某些部件,或者拆分某些部件,或者不同的部件布置。图示的部件可以以硬件,软件或软件和硬件的组合实现。
处理器110可以包括一个或多个处理单元。其中,不同的处理单元可以是独立的器件,也可以集成在一个或多个处理器中。处理器110中还可以设置存储器,用于存储指令和数据。
USB接口130是符合USB标准规范的接口,具体可以是Mini USB接口,Micro USB接口,USB Type C接口等。USB接口130可以用于连接充电器为终端设备充电,也可以用于终端设备与外围设备之间传输数据。也可以用于连接耳机,通过耳机播放音频。该接口还可以用于连接其他电子设备,例如AR设备等。
充电管理模块140用于从充电器接收充电输入。其中,充电器可以是无线充电器,也可以是有线充电器。电源管理模块141用于连接充电管理模块140与处理器110。
终端设备的无线通信功能可以通过天线1,天线2,移动通信模块150,无线通信模块160,调制解调处理器以及基带处理器等实现。
天线1和天线2用于发射和接收电磁波信号。终端设备中的天线可用于覆盖单个或多个通信频带。不同的天线还可以复用,以提高天线的利用率。
移动通信模块150可以提供应用在终端设备上的包括2G/3G/4G/5G等无线通信的解决方案。移动通信模块150可以包括至少一个滤波器,开关,功率放大器,低噪声放大器(low noise amplifier,LNA)等。移动通信模块150可以由天线1接收电磁波,并对接收的电磁波进行滤波,放大等处理,传送至调制解调处理器进行解调。
无线通信模块160可以提供应用在终端设备上的包括无线局域网(wirelesslocalarea networks,WLAN)(如无线保真(wireless fidelity,Wi-Fi)网络),蓝牙(bluetooth,BT),全球导航卫星系统(global navigation satellite system,GNSS),调频(frequencymodulation,FM)等无线通信的解决方案。
终端设备通过GPU,显示屏194,以及应用处理器等实现显示功能。GPU为图像处理的微处理器,连接显示屏194和应用处理器。GPU用于执行数学和几何计算,用于图形渲染。
显示屏194用于显示图像,视频等。显示屏194包括显示面板。在一些实施例中,终端设备可以包括1个或N个显示屏194,N为大于1的正整数。
终端设备可以通过ISP,摄像头193,视频编解码器,GPU,显示屏194以及应用处理器等实现拍摄功能。
摄像头193用于捕获静态图像或视频。在一些实施例中,终端设备可以包括1个或N个摄像头193,N为大于1的正整数。
外部存储器接口120可以用于连接外部存储卡,例如Micro SD卡,实现扩展终端设备的存储能力。外部存储卡通过外部存储器接口120与处理器110通信,实现数据存储功能。例如将音乐,视频等文件保存在外部存储卡中。
内部存储器121可以用于存储计算机可执行程序代码,可执行程序代码包括指令。内部存储器121可以包括存储程序区和存储数据区。
终端设备可以通过音频模块170,扬声器170A,受话器170B,麦克风170C,耳机接口170D,以及应用处理器等实现音频功能。例如音乐播放,录音等。
音频模块170用于将数字音频信息转换成模拟音频信号输出,也用于将模拟音频输入转换为数字音频信号。扬声器170A,也称“喇叭”,用于将音频电信号转换为声音信号。终端设备可以通过扬声器170A收听音乐,或收听免提通话。受话器170B,也称“听筒”,用于将音频电信号转换成声音信号。当终端设备接听电话或语音信息时,可以通过将受话器170B靠近人耳接听语音。耳机接口170D用于连接有线耳机。
麦克风170C,也称“话筒”,“传声器”,用于将声音信号转换为电信号。本申请实施例中,终端设备可以基于麦克风170C接收用于唤醒终端设备的声音信号,并将声音信号转换为可以进行后续处理的电信号,该终端设备可以拥有至少一个麦克风170C。
传感器模块180可以包括下述一种或多种传感器,例如:压力传感器,陀螺仪传感器,气压传感器,磁传感器,加速度传感器,距离传感器,接近光传感器,指纹传感器,温度传感器,触摸传感器,环境光传感器,或骨传导传感器等(图3中未示出)。
按键190包括开机键,音量键等。按键190可以是机械按键。也可以是触摸式按键。终端设备可以接收按键输入,产生与终端设备的用户设置以及功能控制有关的键信号输入。指示器192可以是指示灯,可以用于指示充电状态,电量变化,也可以用于指示消息,未接来电,通知等。
终端设备100的软件系统可以采用分层架构,事件驱动架构,微核架构,微服务架构,或云架构,等。本申请实施例以分层架构的Android系统为例,示例性说明终端设备100的软件结构。
图4为本申请实施例提供的一种终端设备的软件结构框图。
分层架构将软件分成若干个层,每一层都有清晰的角色和分工。层与层之间通过软件接口通信。在一些实施例中,将Android系统分为五层,从上至下分别为应用层,应用程序框架层,安卓运行时(Android runtime)和系统库,硬件抽象层,以及内核层。
应用层可以包括一系列应用程序包。如图4所示,应用程序包可以包括电话、邮箱、日历、相机等应用程序。
应用程序框架层为应用层的应用程序提供应用编程接口(applicationprogramming interface,API)和编程框架。应用程序框架层包括一些预先定义的函数。
如图4所示,应用程序框架层可以包括窗口管理器、活动管理器、位置管理器、包管理器、通知管理器、资源管理器、电话管理器、视图系统和帧率决策管理器等。
窗口管理器(window manager service,WMS)用于管理窗口程序。窗口管理器可以获取显示屏大小,判断是否有状态栏,锁定屏幕,截取屏幕等。
活动管理器用于管理各个应用程序的生命周期以及导航回退功能。负责Android的主线程创建,各个应用程序的生命周期的维护。
位置管理器用于为应用程序提供位置服务,包括查询上一个已知位置、注册和注销来自某个周期性的位置更新等。
包管理器用于系统内的程序管理,例如:应用程序安装、卸载和升级等。
通知管理器使应用程序可以在状态栏中显示通知信息,可以用于传达告知类型的消息,可以短暂停留后自动消失,无需用户交互。比如通知管理器被用于告知下载完成,消息提醒等。通知管理器还可以是以图表或者滚动条文本形式出现在系统顶部状态栏的通知,例如后台运行的应用程序的通知,还可以是以对话窗口形式出现在屏幕上的通知。例如在状态栏提示文本信息,发出提示音,终端设备振动,指示灯闪烁等。
资源管理器为应用程序提供各种资源,比如本地化字符串,图标,图片,布局文件,视频文件等等。
电话管理器用于管理移动设备功能,包括:手机通话状态、获取电话信息(设备、sim卡、网络信息),监听电话状态以及调用电话拨号器拨打电话
视图系统包括可视控件,例如显示文字的控件,显示图片的控件等。视图系统可用于构建应用程序。显示界面可以由一个或多个视图组成的。例如,包括短信通知图标的显示界面,可以包括显示文字的视图以及显示图片的视图。
帧率决策管理器用于确定终端设备的屏幕刷新帧率,以及选取屏幕刷新帧率的切换方式。
Android runtime包括核心库和虚拟机。Android runtime负责安卓系统的调度和管理。
核心库包含两部分:一部分是java语言需要调用的功能函数,另一部分是安卓的核心库。
应用层和应用程序框架层运行在虚拟机中。虚拟机将应用层和应用程序框架层的java文件执行为二进制文件。虚拟机用于执行对象生命周期的管理,堆栈管理,线程管理,安全和异常的管理,以及垃圾回收等功能。虚拟机中还运行有显示合成进程(例如,surfaceflinger)。显示合成进程用于控制图像的合成。
系统库可以包括多个功能模块。例如:图像绘制模块、图像渲染模块、图像合成模块、函数库和媒体库等。
图像绘制模块用于二维或三维图像的绘制。图像渲染模块用于二维或三维图像的渲染。图像合成模块用于二维或三维图像的合成。
可能的实现方式中,应用通过图像绘制模块对图像进行绘制,然后应用通过图像渲染模块对绘制后的图像进行渲染,然后应用将渲染后的图像发送至显示合成进程的缓存队列中。每当Vsync到来时,显示合成进程(例如,surface flinger)从缓存队列中按顺序获取待合成的一帧图像,然后通过图像合成模块进行图像合成。
函数库提供C语言中所使用的宏、类型定义、字符串操作函数、数学计算函数以及输入输出函数等
媒体库支持多种常用的音频,视频格式回放和录制,以及静态图像文件等。媒体库可以支持多种音视频编码格式,例如:MPEG4,H.264,MP3,AAC,AMR,JPG,PNG等。
硬件抽象层,可以包含多个库模块,库模块如可以为硬件配置模块(hwcomposer,HWC)、摄像头库模块等。Android系统可以为设备硬件加载相应的库模块,进而实现应用程序框架层访问设备硬件的目的。设备硬件可以包括如电子设备中的LCD屏幕、摄像头等。
内核层是硬件和软件之间的层。内核层用于驱动硬件,使得硬件工作。内核层至少包含LCD/LED驱动、显示驱动、音频驱动、摄像头驱动和传感器驱动等。
硬件可以是音频设备、蓝牙设备、相机设备、传感器设备等。
示例性的,图5为本申请实施例提供的一种文件搜索方法的流程示意图。如图5所示,该文件搜索方法包括如下步骤:
S501、终端设备获取用户输入的搜索词。
本申请实施例中,用户输入的搜索词可以用于搜索终端设备本地文件,且搜索词可以为与用户需要搜索的文件相关的词,例如,用户想搜索小狗的照片,输入的搜索词可以为“小狗”。用户向搜索某天记录的备忘录笔记,输入的搜索词可以为创建备忘录文件的日期。本申请实施例对于用户输入的搜索词不做具体限定。
示例性的,终端设备获取的搜索词为用户在负一屏界面的搜索框输入的,或者,用户在备忘录搜索界面的搜索框输入的。终端设备获取负一屏界面的搜索框中的搜索词的场景可参见上述图1所示,终端设备获取备忘录搜索界面的搜索框的搜索词的场景可参见上述图2所示。
S502、终端设备利用搜索词在M个索引词中进行搜索。
在本申请实施例中,M个索引词为存储在终端设备本地的索引词,该索引词可以与终端设备存储的本地索引文件相对应,且一个索引文件可以对应有多个索引词。索引词包括但不限于索引文件的名称、索引文件的内容、索引文件的关键词、索引文件的抽象化表述。其中,索引文件的抽象表述可以基于索引文件内容抽象出的关键词,如索引文件为马路的照片,则其对应的索引词可以包括“马路”、“车辆”等。本申请实施例仅以上述索引词为例进行说明,该示例并不构成对本申请实施例的限定。
示例性的,终端设备利用搜索词在M个索引词中进行搜索时,可以将搜索词与M个索引词进行对比,以搜索到相应的索引文件。
可以理解的是,若用户输入的搜索词出现错别字或者语义错误等问题,则终端设备无法根据搜索词搜索到搜索结果,此时,终端设备可以执行下述步骤S503:
S503、当利用搜索词在M个索引词中无法搜索到搜索结果时,终端设备在M个索引词中确定与搜索词的相似度满足第一预设条件的N个索引词;N小于或等于M,N为大于1的整数。
示例性的,索引词与搜索词的相似度可以通过索引词与搜索词的拼音确定,或者可以通过索引词与搜索词的字形确定,或者两个词之间的编辑距离确定。例如,搜索词为“没丽”,索引词为“美丽”,若按照字形确定两者之间的相似度,其相似度可以为50%左右;若按照拼音确定两者之间的相似度,则相似度可以为90%以上。本申请实施例对于确定索引词与搜索词之间的相似度的方法不做具体限定。
示例性的,第一预设条件可以与以下一项或多项有关:存储在终端设备本地的索引词的数量、存储在终端设备本地的索引文件的数量、终端设备的存储空间。本申请实施例仅以上述为例进行说明,该示例并不构成对本申请实施例的限定。
S504、终端设备在N个索引词中确定满足第二预设条件的目标索引词。
在本申请实施例中,任一个索引词对应有至少一个索引文件,第二预设条件与N个索引词各自的词频有关,对于N个索引词中第一索引词的词频,第一索引词的词频与第一索引词对应的Q个索引文件的下述一项或多项内容有关:Q个索引文件各自的文件类型、各文件类型在搜索历史中被搜索的次数。
可以理解的是,文件类型可以理解为文件的格式。例如,文件类型可以包括图像、音频、文本等类型。不同用户对于不同文件类型的搜索偏好不同,且第一索引词的词频与第一索引词对应的Q个索引文件各自的文件类型,和/或,各文件类型在搜索历史中被搜索的次数相关。因此,索引词的词频能够表征用户的搜索意图。
终端设备确定的目标索引词的数量为大于等于1且小于等于N的整数。本申请实施例对于终端设备的目标索引词的数量不做具体限定。
S505、终端设备输出目标索引词对应的索引文件。
可以理解的是,基于上述步骤S504所述,任一个索引词对应有至少一个索引文件,则终端设备输出至少一个索引文件。以图1所示的场景为例,终端设备输出的索引文件的数量不同可以有不同的输出方式,以目标索引词的数量等于1为例,终端设备输出索引文件的方式具体可参见图6和图7所示。图6为本申请实施例提供的一种输出索引文件的界面示意图一。图7为本申请实施例提供的一种输出索引文件的界面示意图二。
可能的实现方式中,目标索引词对应有1个索引文件时,终端设备输出索引文件的界面可参见图6所示。终端设备利用如图6中的a所示的界面中的搜索框中的搜索词“研9高高”确定的目标索引词为“研究报告”,且该目标索引词对应的索引文件的数量为1个。终端设备在输出该目标索引词对应的索引文件时,可以显示如图6中的b所示的界面或者图6中的c所示的界面。其中,图6中的b所示的界面中包括天气信息、搜索本地存储文件对应的搜索框以及目标索引词对应的索引文件的控件。该索引文件包括文件类型以及文件名称,即该索引文件是文件名称为研究报告的word文件。图6中的c所示的界面中包括目标索引词对应的索引文件的内容。可以理解的是,在目标索引词对应的索引文件为1个时,可以显示该索引文件对应的控件,也可以直接显示索引文件的内容。
可能的实现方式中,终端设备输出的目标索引词对应的索引文件的数量为大于等于2的整数时,终端设备输出索引文件的界面可参见图7所示。终端设备在利用如图7中的a所示的界面中的搜索框中的搜索词“钥ahi”确定目标索引词为“钥匙”,且该目标索引词对应的索引文件包括3个图像文件和2个文档文件。终端设备在输出该目标索引词对应的索引文件时,终端设备可以显示如图7中的b所示的界面或者图7中的c所示的界面。其中,图7中的b所示的界面和图7中的C所示的界面均包括天气信息、搜索本地存储文件对应的搜索框以及目标索引词对应的索引文件的控件。
在图7中的b所示的界面中,索引文件按照其文件类型排序显示,文档文件显示在图像文件的下方。可以理解的是,图像文件中包含的索引文件的总数量大于文档文件包含的索引文件的总数量,或者,图像文件在搜索历史中被搜索的次数大于文档文件在搜索历史中被搜索的次数。其中,3个图像文件从左到右的排布可以是按照图像文件的大小、创建日期等进行排序的,例如,将按照文件从大到小的顺序,或者,按照文件的创建时间从早到晚的顺序。在图7中的c所示的界面中,索引文件可以是不分文件类型按照创建时间排序的。
在本申请实施例中,目标索引词的数量可以为大于1的整数。在终端设备输出多个目标索引词分别对应的索引文件时,终端设备可以根据多个目标索引词对应的词频由大到小的顺序显示其对应的索引文件。例如,终端设备确定出目标索引词1和目标索引词2,且目标索引词1的词频大于目标索引词2的词频。终端设备在输出2个目标索引词分别对应的索引文件时,可以按照目标索引词1对应的文件在先而目标索引词2对应的文件在后的顺序进行显示,其中,每个目标索引词对应的索引文件的显示方式可以参见上述图7中的b所示的界面或者图7中的c所示的界面。
可能的实现方式中,在终端设备输出多个目标索引词分别对应的索引文件时,终端设备可以按照文件对输出的索引文件进行分类,在界面上显示多个文件类型,各个文件类型中包含的索引词可能对应相同的索引词,也可能对应不同的索引词,可参见上述图6中的b所示的界面。其中,在每个文件类型中,索引文件按照其索引词的词频从大到小的顺序排列。例如,终端设备确定出3个目标索引词,按照词频由大到小的顺序分别为目标索引词A、目标索引词B和目标索引词C,且目标索引词A对应的索引文件包括文档1和文档2,目标索引词B对应的索引文件包括文档3、图像1和图像2,目标索引词C对应的索引文件包括音频1和文档4。终端设备在输出目标索引词对应的索引文件时,终端设备的界面中可以按照文档、图像、音频的顺序排列,其中,文档按照文档1、文档2、文档3、文档4的顺序排列,图像按照图像1、图像2的顺序排列。
基于此,终端设备基于存储在本地的M个索引词与搜索词的相似度以及索引词的词频确定目标索引词,且索引词的词频与其对应的索引文件的文件类型和/或各文件类型在搜索历史中被搜索的次数相关。终端设备可以将目标索引词作为新的索引词进行搜索,并输出目标索引词对应的索引文件,使得终端设备能够针对用户输入的搜索词对用户的搜索意图进行预测,实现了输出更加符合用户搜索意图的索引文件,提升了用户体验。
本申请实施例中,不同搜索场景对应的文件类型不同。终端设备利用第一搜索词进行文件搜索时,索引文件的文件类型包括图像、视频、音频、文档、备忘录、短信等。该第一搜索词为用户在负一屏显示界面的搜索框中输入的搜索词,即用户在图1所示的负一屏界面进行本地文件的搜索。终端设备利用第二搜索词进行文件搜索时,索引文件的文件类型包括下述一项或多项:文本、图像、语音等,该第二搜索词为用户在备忘录搜索界面的搜索框中输入的搜索词,即用户在图2中的a所示的备忘录搜索界面进行备忘录文件搜索。可以理解的是,可以通过OCR(Optical Character Recognition,光学字符识别)的方式识别图像文件中的文字内容,以根据识别到的文字内容创建图像对应的索引词。
可选的,在图5对应的实施例的基础上,本申请实施例在确定N个索引词时,终端设备可以在M个索引词中确定的相似度大于或等于相似度阈值的N个索引词。其中,相似度阈值可以根据实际情况进行设定。
示例性的,终端设备中可以存储有相似度阈值与终端设备参数的对应关系,以实现相似度阈值可以随着终端设备参数的变化进行变化,该对应关系可以为多个特定的相似度阈值与终端设备参数的对应关系,或者,相似度阈值与终端设备参数的函数关系。其中,终端设备参数可以包括存储在终端设备本地的索引词的数量、存储在终端设备本地的索引文件的数量、终端设备的存储空间中的一项或多项。
可以理解的是,终端设备预先存储有相似度阈值与终端设备参数的函数关系,可以实现相似度阈值的动态变化。例如,相似度阈值与存储在终端设备本地的索引词的数量或者存储在终端设备本地的索引文件的数量负相关。存储在终端设备本地的索引词的数量或者存储在终端设备本地的索引文件的数量增加时,可以控制相似度阈值减小,反之,可以控制相似度阈值增大。
可选的,在图5对应的实施例的基础上,本申请实施例在确定目标索引词时,终端设备可以在N个索引词中确定W个目标索引词,W小于等于N,W为大于等于1的整数,W个目标索引词为词频从大到小排序中的前W个索引词。
可能的实现方式中,W等于1时,目标索引词为词频从大到小排序中的第1个索引词,即词频最大的索引词。终端设备确定词频最大的索引词为目标索引词,有效的控制了输出的索引文件的数量,有利于用户快速查找到需要的索引文件,且减轻了终端设备的显示压力。
可能的实现方式中,W为大于等于2的整数。终端设备输出的索引文件为W个目标索引词分别对应的索引文件,能够尽可能多的为用户显示符合其搜索意图的索引文件,使得用户在输入的搜索词出现错误时依然能够查找到需要的索引文件。
在本申请实施例中,终端设备能够输出词频较大的W个索引词的索引文件,使得输出的索引文件更加符合用户的搜索意图,即使在用户输入的搜索词存在错别字的情况也能够准确的输出用户需要的索引文件。
为了便于理解本申请实施例中索引词的词频与文件类型的关系,下面结合具体的示例对索引词的词频与各文件类型之间的关系进行详细的描述。
示例性的,Q个索引文件对应于L个文件类型,词频具体与L个第一比例和/或L个第二比例有关,其中,L个文件类型分别对应有第一比例和/或第二比例。针对L个文件类型中的第一文件类型:
第一文件类型的第一比例与终端设备中存储的第一文件类型的索引文件的文件数量正相关,以及与终端设备中存储的索引文件总数负相关;第一文件类型的第二比例与第一文件类型的索引文件在预设时长内被搜索的次数正相关,以及与终端设备中除第一文件类型外的其它类型的索引文件在预设时长内被搜索的次数负相关。
例如,终端设备存储索引文件的文件类型包括备忘录、图像以及音频,终端设备中存储有a个备忘录文件、b个图像文件以及c个音频文件,且搜索历史中备忘录文件在预设时长内被搜索的次数为d,图像文件在预设时长内被搜索的次数为e,音频文件在预设时长内被搜索的次数为f。假设Q个索引文件对应于上述3个文件类型,则针对第一文件类型备忘录来说,其第一比例与索引文件的文件数量a正相关,以及与索引文件总数a+b+c负相关;备忘录对应的第二比例与其在预设时长内被搜索的次数d正相关,以及与除备忘录外的其它类型索引文件在预设时长内被搜索的次数e+f负相关。
进一步的,第一文件类型的第一比例为第一值与终端设备中存储的索引文件总数的比例,第一值为终端设备中所存储第一文件类型的索引文件的文件数量。第一文件类型的第二比例为第二值与第三值的比例,第二值为第一文件类型的索引文件在预设时长内被搜索的次数,第三值与终端设备中除第一文件类型外的其它类型的索引文件在预设时长内被搜索的次数有关。各文件类型的索引文件的文件数量占索引文件总数的比值能够在一定程度上表征索引文件数量与词频之间的关系,充分考虑到了第一比例值较大的文件类型可能为用户搜索意图较强的文件类型。此外,各文件类型的索引文件在预设时长内被搜索的次数能够体现用户不用文件类型的搜索偏好。因此,终端设备利用各文件类型的第一比例和第二比例确定词频,使得根据词频输出的索引文件更加符合用户的搜索意图,提升用户体验。
可以理解的是,预设时长可以为一周、一个月、一年或者用户使用终端设备至当前时刻的时长,具体的可根据实际情况进行设定,本申请实施例对于预设时长不做具体限定。
示例性的,第二比例中的第三值可以为动态参数与终端设备中除第一文件类型外的其它类型的索引文件在预设时长内被搜索的次数之和,动态参数随着第一文件类型的第一比例的变化而变化,以使第一文件类型的第一比例和第一文件类型的第二比例之间的差值小于预设阈值。可以理解的是,不同文件类型对应的动态参数可以相同也可以不相同,具体可根据实际情况进行设定,本申请实施例对于动态参数不做具体限定。预设阈值可根据实际情况进行设定。
例如,终端设备存储的索引文件的文件类型包括备忘录、图像以及音频,且终端设备中存储有a个备忘录文件、b个图像文件以及c个音频文件,搜索历史中备忘录文件在预设时长内被搜索的次数为d,图像文件在预设时长内被搜索的次数为e,音频文件在预设时长内被搜索的次数为f,各文件类型对应的动态参数均为λ。备忘录的第一比例可以表示为p1=a/(a+b+c),图像的第一比例可以表示为p2=b/(a+b+c),音频的第一比例可以表示为p3=c/(a+b+c)。备忘录的第二比例可以表示为h1=d/(e+f+λ),图像的第二比例可以表示为h2=e/(d+f+λ),音频的第二比例可以表示为h3=f/(d+e+λ)。
可能的实现方式中,为了将第一文件类型的第二比例值映射在[0,1]区间内,可以引入sigmoid函数,使得第一文件类型的第二比例满足下述公式(1):
其中,x为第一文件类型的索引文件在预设时长内被搜索的次数,y为终端设备中除第一文件类型外的其它类型的索引文件在预设时长内被搜索的次数,λ为动态参数。通过引入sigmoid函数可以使得在第二比例对应的函数为单调递增的,且函数对应的值域为[0,1)。
可以理解的是,上述示例中,引入sigmoid函数之后的各文件类型的第二比例分别为:
本申请实施例可以通过具体的示例对动态参数进行详细的说明。例如,终端设备中存储的图像文件和音频文件的数量之和为5,图像文件和音频文件在搜索历史中被搜索的次数之和为5,且图像文件和音频文件的数量之和以及被搜索的次数之和固定不变。备忘录文件的数量和被搜索的次数为动态变化的。在上述条件下,备忘录的第一比例与备忘录文件的数量之间的关系可参见图8所示,图8为本申请实施例提供的一种第一比例与文件数量的函数关系示意图。设定备忘录对应的动态参数λ=5,备忘录的第二比例与备忘录在搜索历史中被搜索的次数之间的关系可参见图9所示,图9为本申请实施例提供的一种第二比例与被搜索次数的函数关系示意图。
如图8所示,备忘录的第一比例与备忘录文件的数量正相关,且备忘录的第一比例与备忘录文件的数量之间的函数关系并非正比例函数关系。如图9所示,备忘录的第二比例与备忘录在搜索历史中被搜索的次数正相关,且备忘录的第二比例与备忘录在搜索历史中被搜索的次数之间的函数关系并非正比例函数关系。通过设定动态参数λ=5,以保证图8所示的函数曲线的斜率与图9所示的函数曲线的斜率几乎相当,即两斜率之间的差值小于特定值,以使备忘录的第一比例和备忘录的第二比例之间的差值小于预设阈值。
可以理解的是,动态参数的设定主要的目的是使得文件类型的第一比例对应的函数与该文件类型的第二比例对应的函数之间的变化趋势几乎一致,以保证索引文件数量和索引文件被搜索的次数在索引词的词频中保持相近的占比。
可能的实现方式中,第一索引词的词频与其对应的Q个索引文件各自的文件类型有关,即第一索引词的词频与上述L个文件类型的第一比例有关。
可能的实现方式中,第一索引词的词频与其对应的Q个索引文件各文件类型在搜索历史中被搜索的次数有关,即第一索引词的词频与上述L个文件类型的第二比例有关。终端设备可以利用上述公式(2)确定各文件类型的第二比例,并通过L个第二比例确定第一索引词的词频。例如,可以确定L个第二比例的加和或者乘积为第一索引词的词频。
可能的实现方式中,第一索引词的词频其对应的Q个索引文件各自的文件类型,以及各文件类型在搜索历史中被搜索的次数有关。终端设备可以可以根据下述公式(2)确定第一索引词的词频:
其中,Xi为L个文件类型中第i个文件类型在Q个索引文件中对应的索引文件数量,pi为L个文件类型中第i个文件类型的第一比例,hi为L个文件类型中第i个文件类型的第二比例。
例如,终端设备中存储有1个备忘录文件,2个图像文件,2个音频文件,且备忘录在搜索历史中被搜索的次数为2,图像在搜索历史中被搜索的次数为1,音频在搜索历史中被搜索的次数为0。其中,动态参数λ=1。根据上述公式(2)对于备忘录文件对应的任一索引词的词频为
在本申请实施例中,通过索引词对应的各文件类型中索引文件的数量占比,以及历史搜索中被搜索的次数的占比确定索引词的词频,实现了针对用户对不同文件类型的搜索偏好对用户的搜索意图进行预测,使得在用户输入无搜索结果的搜索词时,终端设备能够输出利用该搜索词预测的用户可能需要的索引文件,有效的提升了用户搜索文件的体验。
示例性的,图10为本申请实施例提供的另一种文件搜索方法的流程示意图。在图10对应的实施例中,以终端设备可以实时计算索引词的词频为例进行示例说明,该示例并不构成对本申请实施例的限定。
如图10所示,该文件搜索方法可以包括如下步骤:
S1001、终端设备获取用户输入的搜索词。
在本申请实施例中,在终端设备显示负一屏界面时,可以接收用户在负一屏界面中的搜索框中输入的搜索词,具体可参见上述图1所示。或者,在终端设备显示备忘录搜索界面时,可以接收用户在备忘录搜索界面中的搜索框中输入的搜索词,具体可参见上述图2所示。
示例性的,在终端设备为电脑时,终端设备获取用户输入的搜索词可参见图11所示,图11为本申请实施例提供的一种获取搜索词的界面示意图。电脑显示如图11所示的界面,该界面中可以包括:搜索框、当前显示的文件名称、当前文件内包括的文件。如图11所示,电脑当前显示的界面为文件AAA的界面,且文件AAA中包括文件111和文件222,电脑可以获取用户在如图11所示的界面中的搜索框中输入的搜索词。
S1002、终端设备对搜索词进行预处理。
在本申请实施例中,对搜索词进行预处理的目的是去除搜索词中的特殊字符或者乱码等无效字符。终端设备可以通过筛选处理得到搜索词中的有效词,本申请实施例对于搜索词的预处理不做具体限定。
S1003、终端设备判断利用预处理后的搜索词是否能够得到搜索结果。
示例性的,终端设备可以利用预处理后的搜索词与存储在终端设备本地的M个索引词进行搜索,根据是否搜索到预处理后的搜索词判断是否能够得到搜索结果。
可能的实现方式中,若M个索引词中存在与预处理后的搜索词,终端设备可以利用预处理后的搜索词得到搜索结果,则可以执行下述步骤S1007。
可能的实现方式中,若M个索引词中不存在与预处理后的搜索词,终端设备利用预处理后的搜索词无法得到搜索结果,则可以执行下述步骤S1004。
S1004、终端设备在本地存储的M个索引词中确定与处理后的搜索词的相似度大于或等于相似度阈值的N个索引词。
在本申请实施例中,终端设备可以计算M个索引词分别与处理后的搜索词的相似度,并取相似度大于或等于相似度阈值的N个索引词。具体可参见上述实施例所述,本申请实施例对此不再赘述。
S1005、终端设备确定N个索引词各自的词频,并确定词频最大的索引词为目标索引词。
在本申请实施例中,终端设备在利用索引词的词频确定目标索引词时,索引词的词频可以为实时计算的,也可以为预先计算好存储在终端设备中的。
可能的实现方式中,终端设备在实时计算N个索引词各自的词频时,可以获取终端设备中预先维护的Q和索引文件的下述一项或多项:L个文件类型各自对应的第一比例、L个文件类型各自对应的第二比例、L个文件类型各自在Q个索引文件中对应的索引文件数量,根据上述词频与文件类型的关系计算N个索引词的词频。
例如,终端设备获取预先维护的L个文件类型各自对应的第一比例、L个文件类型各自对应的第二比例、L个文件类型各自在Q个索引文件中对应的索引文件数量,利用上述公式(2)计算N个索引词各自的词频。
可能的实现方式中,终端设备可以直接获取存储在终端设备本地的N个索引词的词频,N个索引词的词频可以是终端设备预先维护的。
可以理解的是,终端设备中可以预先维护有确定索引词的词频的信息,例如,各索引词对应的各文件类型、各文件类型中索引文件的数量、各文件类型在搜索历史中被搜索的次数、各文件类型的第一比例、各文件类型的第二比例等。
示例性的,终端设备可以确定词频最大的索引词为目标索引词,使得确定的目标索引词更加接近用户想输入的搜索词,实现对用户的搜索词的预测,以输出符合用户搜索意图的索引文件。
S1006、终端设备利用目标索引词进行文件搜索。
示例性的,终端设备可以将目标索引词作为新的搜索词,搜索目标索引词对应的索引文件,或者,终端设备直接根据索引词与索引文件的对应关系获取目标索引词对应的索引文件。
S1007、终端设备输出搜索结果。
可能的实现方式中,终端设备利用预处理后的搜索词搜索到对应的索引文件,则终端设备输出该索引文件。
可能的实现方式中,终端设备利用预处理后的搜索词未搜索到对应的索引文件,则终端设备输出目标索引词对应的索引文件。
终端设备输出搜索结果的方法与上述实施例中的步骤S505对应的方法相同,本申请实施例在此不再赘述。
综上,终端设备能够在利用用户输入的搜索词无法搜索到搜索结果时,通过确定终端设备中存储的本地索引词的词频确定目标索引词,并输出目标索引词对应的索引文件,解决了用户输入的搜索词不规范而无法输出搜索结果的问题,有效的提升了用户体验。
根据上述实施例所述,终端设备中预先维护有索引文件的信息。可以理解的是,终端设备可以对索引文件的基础信息进行维护(如图12对应的实施例),以及终端设备可以对索引文件在搜索历史中被搜索的次数进行维护(如图13对应的实施例)。可以理解的是,索引文件的基础信息可以包括各文件类型的第一比例、索引文件与索引词之间的对应关系等。
示例性的,图12为本申请实施例提供的一种终端设备维护索引文件的基础信息的方法流程示意图。
如图12所示,终端设备维护索引文件的基础信息的方法可以包括下述步骤:
S1201、终端设备获取本地存储的发生变化的目标索引文件。
示例性的,目标索引文件的变化包括新增、删除、内容变更中的至少一种。
可以理解的是,终端设备获取的发生变化的目标索引文件可以是接收用户对目标索引文件的操作得到的。例如,用户在终端设备的显示界面上新增一个目标索引文件,则终端设备可以获取该新增的目标索引文件。
S1202、终端设备依据目标索引文件的变化维护目标文件类型对应的第一比例。
可能的实现方式中,目标索引文件为新增索引文件。终端设备获取目标索引文件对应的目标文件类型,更新目标文件类型中索引文件的数量以及终端设备中文件总数量,例如,将索引文件的数量以及终端设备中文件总数量均减1,从而更新目标文件类型对应的第一比例。
可能的实现方式中,目标索引文件为删除索引文件。终端设备获取目标索引文件对应的目标文件类型,更新目标文件类型中索引文件的数量以及终端设备中文件总数量,例如,将索引文件的数量以及终端设备中文件总数量均加1,从而更新目标文件类型对应的第一比例。
可能的实现方式中,目标索引文件为内容变更后的索引文件,即终端设备中的索引文件的数量并未发生改变,则终端设备不需要更新目标文件类型的第二比例。
S1203、终端设备依据目标索引文件的变化维护索引字典。
在本申请实施例中,索引字典中可以包括索引词与索引文件的对应关系、索引词在各文件类型中对应的索引文件的数量。例如,索引字典中存储有{“a”:[2,3,0],“apple”:[1,2,3]},其中,a和apple均为索引词,“a”:[2,3,0]表示索引词a的第一文件类型的索引文件的数量为2,第二文件类型的索引文件的数量为3,第三文件类型的索引文件的数量为0。“apple”:[1,2,3]表示索引词apple的第一文件类型的索引文件的数量为1,第二文件类型的索引文件的数量为2,第三文件类型的索引文件的数量为3。根据上述实施例所述的方法,索引词a的词频为2×(1+p1)×(1+h1)+3×(1+p2)×(1+h2)。
可能的实现方式中,目标索引文件为新增索引文件。终端设备获取目标索引文件的索引词,根据该索引词对索引字典进行更新。例如,目标索引文件的索引词为已经存储在终端设备中的索引词,终端设备可以增加该索引词对应的索引文件的数量,若新增1个索引文件,则索引词对应的索引文件的数量加1。
可能的实现方式中,目标索引文件为删除索引文件。终端设备获取目标索引文件的索引词,将该索引词在索引字典中清除,即清除该索引词与目标索引文件的对应关系,并对该索引词对应的索引文件的数量进行更新。例如,删除的索引文件对应的索引词为dog,且该索引词仅对应一个索引文件,则终端设备将该索引词在索引字典中删除。
可能的实现方式中,目标索引文件为内容变更后的索引文件,终端设备根据内容变更前后目标索引文件的索引词的变化,确定新增的索引词以及删除的索引词,以对索引字典进行更新。
示例性的,图13为本申请实施例提供的一种终端设备维护搜索历史记录的方法流程示意图。
如图13所示,终端设备维护搜索历史记录的方法可以包括下述步骤:
S1301、终端设备获取用户点击的搜索结果。
可以理解的是,用户可以在终端设备上点击搜索结果进行查看,例如,在用户点击终端设备显示界面中多个搜索结果中的任一搜索结果时,终端设备显示包括该搜索结果内容的界面。
S1302、终端设备根据用户点击的搜索结果维护搜索历史记录。
示例性的,终端设备确定用户点击的搜索结果中的索引文件对应的文件类型,并将该索引文件和文件类型对应的被搜索次数加1,以实现维护搜索历史记录。
在本申请实施例中,终端设备可以利用反编译代码对索引词的词频确定方式进行验证或者调整。示例性的,终端设备可以;利用反编译代码得到每个索引词的第一词频,并在终端设备中存储的索引文件发生增、删、查、改等操作时,再次利用反编译代码获取每个索引词的第二词频,根据第一词频和第二词频之间的差异确定是否需要调整词频计算中使用的参数。
在本申请实施例中,终端设备可以对搜索词与索引文件的数量或者被搜索的次数之间的关系进行验证。示例性的,终端设备的多媒体文件中存入指定标签的a类型文件多个,存入另一指定标签的b类型的多媒体文件多个,使得用户输入搜索词与两个标签的编辑距离均为1。在a类型继续存入其他标签文件,使用搜索词进行查询操作,确定搜索结果与索引文件数量和/或查询历史相关。
上面结合图1-图2以及图5-图13,对本申请实施例提供的方法进行了说明,为了实现上述功能,其包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到,结合本文中所公开的实施例描述的各示例的方法步骤,本申请能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
本申请实施例可以根据上述方法示例对文件搜索方法的装置进行功能模块的划分,例如可以对应各个功能划分各个功能模块,也可以将两个或两个以上的功能集成在一个处理模块中。集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。需要说明的是,本申请实施例中对模块的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时
图14为本申请实施例提供的一种控制设备的硬件结构示意图,如图14所示,该控制设备包括处理器1401,通信线路1404以及至少一个通信接口(图14中示例性的以通信接口1403为例进行说明)。
处理器1401可以是一个通用中央处理器(central processing unit,CPU),微处理器,特定应用集成电路(application-specific integrated circuit,ASIC),或一个或多个用于控制本申请方案程序执行的集成电路。
通信线路1404可包括在上述组件之间传送信息的电路。
通信接口1403,使用任何收发器一类的装置,用于与其他设备或通信网络通信,如以太网,无线局域网(wireless local area networks,WLAN)等。
可能的,该控制设备还可以包括存储器1402。
存储器1402可以是只读存储器(read-only memory,ROM)或可存储静态信息和指令的其他类型的静态存储设备,随机存取存储器(random access memory,RAM)或者可存储信息和指令的其他类型的动态存储设备,也可以是电可擦可编程只读存储器(electrically erasable programmable read-only memory,EEPROM)、只读光盘(compactdisc read-only memory,CD-ROM)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。存储器可以是独立存在,通过通信线路1404与处理器相连接。存储器也可以和处理器集成在一起。
其中,存储器1402用于存储执行本申请方案的计算机执行指令,并由处理器1401来控制执行。处理器1401用于执行存储器1402中存储的计算机执行指令,从而实现本申请实施例所提供的视频处理方法。
可能的,本申请实施例中的计算机执行指令也可以称之为应用程序代码,本申请实施例对此不作具体限定。
在具体实现中,作为一种实施例,处理器1401可以包括一个或多个CPU,例如图14中的CPU0和CPU1。
在具体实现中,作为一种实施例,控制设备可以包括多个处理器,例如图14中的处理器1401和处理器1405。这些处理器中的每一个可以是一个单核(single-CPU)处理器,也可以是一个多核(multi-CPU)处理器。这里的处理器可以指一个或多个设备、电路、和/或用于处理数据(例如计算机程序指令)的处理核。
示例性的,图15为本申请实施例提供的一种芯片的结构示意图。芯片150包括一个或两个以上(包括两个)处理器1520和通信接口1530。
在一些实施方式中,存储器1540存储了如下的元素:可执行模块或者数据结构,或者他们的子集,或者他们的扩展集。
本申请实施例中,存储器1540可以包括只读存储器和随机存取存储器,并向处理器1520提供指令和数据。存储器1540的一部分还可以包括非易失性随机存取存储器(non-volatile random access memory,NVRAM)。
本申请实施例中,存储器1540、通信接口1530以及存储器1540通过总线系统1510耦合在一起。其中,总线系统1510除包括数据总线之外,还可以包括电源总线、控制总线和状态信号总线等。为了便于描述,在图15中将各种总线都标为总线系统1510。
上述本申请实施例描述的方法可以应用于处理器1520中,或者由处理器1520实现。处理器1520可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器1520中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器1520可以是通用处理器(例如,微处理器或常规处理器)、数字信号处理器(digitalsignal processing,DSP)、专用集成电路(application specific integrated circuit,ASIC)、现成可编程门阵列(field-programmable gate array,FPGA)或者其他可编程逻辑器件、分立门、晶体管逻辑器件或分立硬件组件,处理器1520可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。
结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。其中,软件模块可以位于随机存储器、只读存储器、可编程只读存储器或带电可擦写可编程存储器(electricallyerasable programmable read only memory,EEPROM)等本领域成熟的存储介质中。该存储介质位于存储器1540,处理器1520读取存储器1540中的信息,结合其硬件完成上述方法的步骤。
在上述实施例中,存储器存储的供处理器执行的指令可以以计算机程序产品的形式实现。其中,计算机程序产品可以是事先写入在存储器中,也可以是以软件形式下载并安装在存储器中。
计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行计算机程序指令时,全部或部分地产生按照本申请实施例的流程或功能。计算机可以是通用计算机、专用计算机、计算机网络或者其他可编程装置。计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一计算机可读存储介质传输,例如,计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(digital subscriber line,DSL)或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。计算机可读存储介质可以是计算机能够存储的任何可用介质或者是包括一个或多个可用介质集成的服务器、数据中心等数据存储设备。例如,可用介质可以包括磁性介质(例如,软盘、硬盘或磁带)、光介质(例如,数字通用光盘(digital versatile disc,DVD))、或者半导体介质(例如,固态硬盘(solid state disk,SSD))等。
本申请实施例还提供了一种计算机可读存储介质。上述实施例中描述的方法可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。计算机可读介质可以包括计算机存储介质和通信介质,还可以包括任何可以将计算机程序从一个地方传送到另一个地方的介质。存储介质可以是可由计算机访问的任何目标介质。
作为一种可能的设计,计算机可读介质可以包括紧凑型光盘只读储存器(compactdisc read-only memory,CD-ROM)、RAM、ROM、EEPROM或其它光盘存储器;计算机可读介质可以包括磁盘存储器或其它磁盘存储设备。而且,任何连接线也可以被适当地称为计算机可读介质。例如,如果使用同轴电缆,光纤电缆,双绞线,DSL或无线技术(如红外,无线电和微波)从网站,服务器或其它远程源传输软件,则同轴电缆,光纤电缆,双绞线,DSL或诸如红外,无线电和微波之类的无线技术包括在介质的定义中。如本文所使用的磁盘和光盘包括光盘(CD),激光盘,光盘,数字通用光盘(digital versatile disc,DVD),软盘和蓝光盘,其中磁盘通常以磁性方式再现数据,而光盘利用激光光学地再现数据。
上述的组合也应包括在计算机可读介质的范围内。以上,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种文件搜索方法,其特征在于,应用于终端设备,所述方法包括:
获取用户输入的搜索词;
利用所述搜索词在M个索引词中进行搜索;所述M个索引词为存储在终端设备本地的索引词;
当利用所述搜索词在所述M个索引词中无法搜索到搜索结果时,在所述M个索引词中确定与所述搜索词的相似度满足第一预设条件的N个索引词;所述N小于或等于M,所述N为大于1的整数;
在所述N个索引词中确定满足第二预设条件的目标索引词;其中,任一个所述索引词对应有至少一个索引文件,所述第二预设条件与所述N个索引词各自的词频有关,对于所述N个索引词中第一索引词的词频,所述第一索引词的词频与所述第一索引词对应的Q个索引文件的下述一项或多项内容有关:所述Q个索引文件各自的文件类型、各所述文件类型在搜索历史中被搜索的次数,所述第一索引词的词频用于表征用户的搜索意图;
输出所述目标索引词对应的索引文件;
所述Q个索引文件对应于L个文件类型,所述词频具体与L个第一比例和/或L个第二比例有关,其中,所述L个文件类型分别对应有第一比例和/或第二比例;针对所述L个文件类型中的第一文件类型:
所述第一文件类型的第一比例与所述终端设备中存储的所述第一文件类型的索引文件的文件数量正相关,以及与所述终端设备中存储的索引文件总数负相关;
所述第一文件类型的第二比例与所述第一文件类型的索引文件在预设时长内被搜索的次数正相关,以及与所述终端设备中除所述第一文件类型外的其它类型的索引文件在所述预设时长内被搜索的次数负相关;
所述第一文件类型的第一比例为第一值与所述终端设备中存储的索引文件总数的比例,所述第一值为所述终端设备中所存储的所述第一文件类型的索引文件的文件数量;
所述第一文件类型的第二比例为第二值与第三值的比例,所述第二值为所述第一文件类型的索引文件在预设时长内被搜索的次数,所述第三值与所述终端设备中除所述第一文件类型外的其它类型的索引文件在所述预设时长内被搜索的次数有关;
所述第三值为动态参数与所述终端设备中除所述第一文件类型外的其它类型的索引文件在所述预设时长内被搜索的次数之和,所述动态参数随着所述第一文件类型的第一比例的变化而变化,以使所述第一文件类型的第一比例和所述第一文件类型的第二比例之间的差值小于预设阈值。
2.根据权利要求1所述的方法,其特征在于,所述第一文件类型的第二比例满足下述公式:
所述
所述x为所述第一文件类型的索引文件在预设时长内被搜索的次数,y为所述终端设备中除所述第一文件类型外的其它类型的索引文件在所述预设时长内被搜索的次数,所述λ为动态参数。
3.根据权利要求1所述的方法,其特征在于,所述第一索引词的词频满足下述公式:
所述
所述Xi为L个文件类型中第i个文件类型在所述Q个索引文件中对应的索引文件数量,所述pi为L个文件类型中第i个文件类型的第一比例,所述hi为L个文件类型中第i个文件类型的第二比例。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述终端设备中预先维护有所述Q个索引文件的下述一项或多项:所述L个文件类型各自对应的第一比例、所述L个文件类型各自对应的第二比例、所述L个文件类型各自在所述Q个索引文件中对应的索引文件数量。
5.根据权利要求1-3任一项所述的方法,其特征在于,所述获取用户输入的搜索词之前,还包括:
显示负一屏界面或备忘录搜索界面;所述负一屏界面或所述备忘录搜索界面包括搜索框;
接收用户在所述搜索框中输入的所述搜索词。
6.根据权利要求5所述的方法,其特征在于,终端设备利用第一搜索词进行文件搜索时,索引文件的文件类型包括下述一项或多项:图像、视频、音频、文档、备忘录、短信;所述第一搜索词为用户在所述负一屏界面的搜索框中输入的搜索词;
终端设备利用第二搜索词进行文件搜索时,索引文件的文件类型包括下述一项或多项:文本、图像、语音;所述第二搜索词为用户在所述备忘录搜索界面的搜索框中输入的搜索词。
7.根据权利要求1-3、6任一项所述的方法,其特征在于,所述在所述N个索引词中确定满足第二预设条件的目标索引词,包括:
在所述N个索引词中确定W个目标索引词,所述W小于等于N,所述W为大于等于1的整数,所述W个目标索引词为词频从大到小排序中的前W个索引词。
8.根据权利要求1-3、6任一项所述的方法,其特征在于,所述在所述M个索引词中确定与所述搜索词的相似度满足第一预设条件的N个索引词,包括:
在所述M个索引词中确定所述相似度大于或等于相似度阈值的N个索引词。
9.一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时,使得所述终端设备执行如权利要求1至8任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有指令,当所述指令被执行时,使得计算机执行如权利要求1至8任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210920196.0A CN116089368B (zh) | 2022-08-01 | 2022-08-01 | 文件搜索方法和相关装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210920196.0A CN116089368B (zh) | 2022-08-01 | 2022-08-01 | 文件搜索方法和相关装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116089368A CN116089368A (zh) | 2023-05-09 |
CN116089368B true CN116089368B (zh) | 2023-12-19 |
Family
ID=86201299
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210920196.0A Active CN116089368B (zh) | 2022-08-01 | 2022-08-01 | 文件搜索方法和相关装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116089368B (zh) |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004192546A (ja) * | 2002-12-13 | 2004-07-08 | Nippon Telegr & Teleph Corp <Ntt> | 情報検索方法、装置、プログラム、および記録媒体 |
JPWO2005038672A1 (ja) * | 2003-10-21 | 2007-01-25 | 株式会社アイ・ピー・ビー | 調査対象文書の索引語抽出装置、性格表現図、及び文書特徴分析装置 |
CN107229679A (zh) * | 2017-05-08 | 2017-10-03 | 国网山东省电力公司烟台供电公司 | 一种可即时查找客户所属线路的系统及方法 |
CN107633051A (zh) * | 2017-09-15 | 2018-01-26 | 努比亚技术有限公司 | 桌面搜索方法、移动终端及计算机可读存储介质 |
CN108345690A (zh) * | 2018-03-09 | 2018-07-31 | 广州杰赛科技股份有限公司 | 智能问答方法与系统 |
CN111008265A (zh) * | 2019-12-03 | 2020-04-14 | 腾讯云计算(北京)有限责任公司 | 企业信息搜索方法及装置 |
CN111782595A (zh) * | 2020-05-29 | 2020-10-16 | 中国平安财产保险股份有限公司 | 海量文件管理方法、装置、计算机设备和可读存储介质 |
CN112925872A (zh) * | 2019-12-05 | 2021-06-08 | 北京沃东天骏信息技术有限公司 | 一种数据搜索方法和装置 |
WO2021180109A1 (zh) * | 2020-03-10 | 2021-09-16 | 华为技术有限公司 | 电子设备以及电子设备的搜索方法、介质 |
CN113868373A (zh) * | 2021-09-14 | 2021-12-31 | 中国联合网络通信集团有限公司 | 一种词云生成方法、装置、电子设备及存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4899284B2 (ja) * | 2003-07-18 | 2012-03-21 | コニカミノルタホールディングス株式会社 | 有機エレクトロルミネッセンス素子、照明装置及び表示装置 |
-
2022
- 2022-08-01 CN CN202210920196.0A patent/CN116089368B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004192546A (ja) * | 2002-12-13 | 2004-07-08 | Nippon Telegr & Teleph Corp <Ntt> | 情報検索方法、装置、プログラム、および記録媒体 |
JPWO2005038672A1 (ja) * | 2003-10-21 | 2007-01-25 | 株式会社アイ・ピー・ビー | 調査対象文書の索引語抽出装置、性格表現図、及び文書特徴分析装置 |
CN107229679A (zh) * | 2017-05-08 | 2017-10-03 | 国网山东省电力公司烟台供电公司 | 一种可即时查找客户所属线路的系统及方法 |
CN107633051A (zh) * | 2017-09-15 | 2018-01-26 | 努比亚技术有限公司 | 桌面搜索方法、移动终端及计算机可读存储介质 |
CN108345690A (zh) * | 2018-03-09 | 2018-07-31 | 广州杰赛科技股份有限公司 | 智能问答方法与系统 |
CN111008265A (zh) * | 2019-12-03 | 2020-04-14 | 腾讯云计算(北京)有限责任公司 | 企业信息搜索方法及装置 |
CN112925872A (zh) * | 2019-12-05 | 2021-06-08 | 北京沃东天骏信息技术有限公司 | 一种数据搜索方法和装置 |
WO2021180109A1 (zh) * | 2020-03-10 | 2021-09-16 | 华为技术有限公司 | 电子设备以及电子设备的搜索方法、介质 |
CN111782595A (zh) * | 2020-05-29 | 2020-10-16 | 中国平安财产保险股份有限公司 | 海量文件管理方法、装置、计算机设备和可读存储介质 |
CN113868373A (zh) * | 2021-09-14 | 2021-12-31 | 中国联合网络通信集团有限公司 | 一种词云生成方法、装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN116089368A (zh) | 2023-05-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2022508176A (ja) | 音声制御方法及び電子装置 | |
CN112130714B (zh) | 可进行学习的关键词搜索方法和电子设备 | |
WO2022100221A1 (zh) | 检索处理方法、装置及存储介质 | |
CN113495744A (zh) | 一种版本升级方法及相关装置 | |
WO2021104117A1 (zh) | 一种构建应用程序资源包的方法、构建装置及终端设备 | |
CN112740148A (zh) | 一种向输入框中输入信息的方法及电子设备 | |
CN113709026A (zh) | 即时通信消息的处理方法、设备、存储介质和程序产品 | |
CN116128571B (zh) | 广告曝光量分析方法及相关装置 | |
CN115098449B (zh) | 一种文件清理方法及电子设备 | |
CN116089368B (zh) | 文件搜索方法和相关装置 | |
CN114979785B (zh) | 视频处理方法、电子设备及存储介质 | |
CN114489471B (zh) | 一种输入输出处理方法和电子设备 | |
CN116089320B (zh) | 垃圾回收方法和相关装置 | |
CN113497835A (zh) | 多屏交互方法、电子设备及计算机可读存储介质 | |
CN116095230B (zh) | 应用程序推荐方法和终端设备、可读存储介质 | |
WO2024046010A1 (zh) | 一种界面显示方法、设备及系统 | |
CN114513575B (zh) | 一种收藏处理的方法及相关装置 | |
CN117097793B (zh) | 一种消息推送方法、终端及服务器 | |
CN117009023B (zh) | 显示通知信息的方法及相关装置 | |
CN113409041B (zh) | 一种电子卡的选取方法、装置、终端以及存储介质 | |
WO2023061298A1 (zh) | 一种图片备份系统、方法与设备 | |
WO2023236908A1 (zh) | 图像描述方法、电子设备及计算机可读存储介质 | |
WO2023169212A1 (zh) | 一种识别应用程序中sdk的方法、终端及服务器 | |
WO2023246666A1 (zh) | 一种搜索方法及电子设备 | |
WO2023207890A1 (zh) | 一种界面显示方法及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |