CN113779364A - 一种基于标签提取的搜索方法及其相关设备 - Google Patents
一种基于标签提取的搜索方法及其相关设备 Download PDFInfo
- Publication number
- CN113779364A CN113779364A CN202111087012.9A CN202111087012A CN113779364A CN 113779364 A CN113779364 A CN 113779364A CN 202111087012 A CN202111087012 A CN 202111087012A CN 113779364 A CN113779364 A CN 113779364A
- Authority
- CN
- China
- Prior art keywords
- search
- determining
- label
- target
- content
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 75
- 238000000605 extraction Methods 0.000 title claims abstract description 30
- 230000011218 segmentation Effects 0.000 claims description 36
- 238000012545 processing Methods 0.000 claims description 23
- 238000004590 computer program Methods 0.000 claims description 4
- 230000002085 persistent effect Effects 0.000 claims description 3
- 230000001052 transient effect Effects 0.000 claims description 2
- 230000008569 process Effects 0.000 abstract description 25
- 238000010586 diagram Methods 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 230000018109 developmental process Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000000638 solvent extraction Methods 0.000 description 2
- 238000005034 decoration Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/3332—Query translation
- G06F16/3334—Selection or weighting of terms from queries, including natural language queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/3332—Query translation
- G06F16/3338—Query expansion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请实施例公开了一种基于标签提取的搜索方法及其相关设备。本申请实施例方法包括:接收用户输入的搜索内容;确定搜索内容对应的目标标签;确定目标标签对应的搜索策略;依据搜索策略搜索所述搜索内容并向用户返回搜索结果。本申请实施例具有以下优点,通过上述方式使得搜索过程对于用户所输入的搜索内容基于所对应的标签不同选择不同的搜索逻辑进行搜索,进而使得搜索结果可依据不同的搜索策略产生,提高了搜索过程的灵活性,以使得所获得的搜索结果尽可能的满足用户的使用需求。
Description
技术领域
本申请属于搜索领域,尤其涉及一种基于标签提取的搜索方法及其相关设备。
背景技术
目前,互联网的发展所带来的信息量爆炸式增长,使得用户在筛选信息的时候越来越依靠于搜索引擎,随着搜索技术的不断发展,各种应用程序也内置了搜索引擎,以便搜索应用程序内的相应资源。用户在使用搜索引擎的过程中,可以在搜索引擎提供的搜索框中输入搜索内容,由搜索引擎查询得到与该搜索内容匹配的资源,以作为搜索结果,并利用一定的排序策略,并通过搜索结果将经过排序的搜索结果返回给用户。
现有技术中,对于用户所输入的所有内容均采用同一搜索逻辑,即按标题和内容去计算资源与搜索内容的相关性得分,然后将得分高的资源返回至用户。
然而这一搜索过程不能应对所有的搜索情况,某些时候搜索得到的结果无法满足用户的使用需求。
发明内容
本申请实施例第一方面提供了一种基于标签提取的搜索方法,包括:
接收用户输入的搜索内容;
确定所述搜索内容对应的目标标签;
确定所述目标标签对应的搜索策略;
依据所述搜索策略搜索所述搜索内容并向所述用户返回搜索结果。
基于本申请实施例第一方面提供的搜索方法,可选的,所述确定所述搜索内容对应的目标标签,包括:
使用分词工具对所述搜索内容进行分词处理,获得一个或多个搜索分词;
确定所述一个或多个搜索分词分别对应的目标标签。
基于本申请实施例第一方面提供的搜索方法,可选的,所述目标标签包括:预算类标签、面积类标签、场景类标签和作者类标签中的任意一种或多种。
基于本申请实施例第一方面提供的搜索方法,可选的,所述确定所述一个或多个搜索分词分别对应的目标标签,之前,所述方法还包括:
对所述搜索分词进行近义词处理。
基于本申请实施例第一方面提供的搜索方法,可选的,所述确定所述一个或多个搜索分词分别对应的目标标签,包括:
判断所述搜索分词中是否存在数字字符,
若所述搜索分词中存在数字字符,则判断所述搜索分词是否存在预算单位字符或面积单位字符;
若所述搜索分词中存在所述预算单位字符,则确定所述搜索分词所对应的标签为预算类标签;
若所述搜索分词中存在所述面积单位字符,则确定所述搜索分词所对应的标签为面积类标签。
基于本申请实施例第一方面提供的搜索方法,可选的,所述确定所述搜索内容对应的目标标签之前,所述方法还包括:确定处于激活状态的标签类别;
所述确定所述搜索内容对应的目标标签,包括:
在所述处于激活状态的标签类别中确定所述搜索内容对应的目标标签。
本申请实施例第二方面提供了一种基于标签提取的搜索设备,包括:
接收单元,用于接收用户输入的搜索内容;
第一确定单元,用于确定所述搜索内容对应的目标标签;
第二确定单元,用于确定所述目标标签对应的搜索策略;
搜索单元,用于依据所述搜索策略搜索所述搜索内容并向所述用户返回搜索结果。
基于本申请实施例第二方面提供的搜索设备,可选的,所述第一确定单元具体用于:
使用分词工具对所述搜索内容进行分词处理,获得一个或多个搜索分词;
确定所述一个或多个搜索分词分别对应的目标标签。
基于本申请实施例第二方面提供的搜索设备,可选的,所述目标标签包括:预算类标签、面积类标签、场景类标签和作者类标签中的任意一种或多种。
基于本申请实施例第二方面提供的搜索设备,可选的,所述第一确定单元还用于:对所述搜索分词进行近义词处理。
基于本申请实施例第二方面提供的搜索设备,可选的,所述第一确定单元具体用于:
判断所述搜索分词中是否存在数字字符,
若所述搜索分词中存在数字字符,则判断所述搜索分词是否存在预算单位字符或面积单位字符;
若所述搜索分词中存在所述预算单位字符,则确定所述搜索分词所对应的标签为预算类标签;
若所述搜索分词中存在所述面积单位字符,则确定所述搜索分词所对应的标签为面积类标签。
基于本申请实施例第二方面提供的搜索设备,可选的,所述第一确定单元具体用于:
确定处于激活状态的标签类别;
在所述处于激活状态的标签类别中确定所述搜索内容对应的目标标签。
本申请实施例第三方面提供了一种基于标签提取的搜索设备,包括:
中央处理器,存储器,输入输出接口,有线或无线网络接口以及电源;
所述存储器为短暂存储存储器或持久存储存储器;
所述中央处理器配置为与所述存储器通信,在所述设备上执行所述存储器中的指令操作以执行本申请实施例第一方面中任意一项所述的方法。
本申请实施例第四方面提供了一种计算机可读存储介质,包括指令,当所述指令在计算机上运行时,使得计算机执行如本申请实施例第一方面中任意一项所述的方法。
本申请实施例第五方面提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行如本申请实施例第一方面中任意一项所述的方法。
从以上技术方案可以看出,本申请实施例具有以下优点:本方案提供了一种基于标签提取的搜索方法,包括:接收用户输入的搜索内容,确定搜索内容对应的目标标签,确定目标标签对应的搜索策略,依据搜索策略搜索所述搜索内容并向所述用户返回搜索结果。通过上述方式使得搜索过程对于用户所输入的搜索内容基于所对应的标签不同选择不同的搜索逻辑进行搜索,进而使得搜索结果可依据不同的搜索策略产生,提高了搜索过程的灵活性,以使得所获得的搜索结果尽可能的满足用户的使用需求。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请所提供的基于标签提取的搜索方法实施例的一个流程示意图;
图2为本申请所提供的基于标签提取的搜索方法实施例的另一个流程示意图;
图3为本申请所提供的基于标签提取的搜索设备实施例的一个结构示意图。
图4为本申请所提供的基于标签提取的搜索设备实施例的另一个结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
随着搜索技术的不断发展,各种应用程序也内置了搜索引擎,以便搜索应用程序内的相应资源。用户在使用搜索引擎的过程中,可以在搜索引擎提供的搜索框中输入搜索内容,由搜索引擎查询得到与该搜索内容匹配的资源,以作为搜索结果,并利用一定的排序策略,并通过搜索结果将经过排序的搜索结果返回给用户。现有技术中,对于用户所输入的所有内容均采用同一搜索逻辑,即按标题和内容去计算资源与搜索内容的相关性得分,然后将得分高的资源返回至用户。然而这一搜索过程不能应对所有的搜索情况,某些时候搜索得到的结果无法满组用户的使用需求。
举例而言,如用户所输入的搜索内容为:“妙招姐”此时基于现有的搜索逻辑,基于资源的标题和内容计算与“妙招姐”的相关性得分并返回得到的结果往往与用户所期望获得的搜索结果差距较大,造成这一现象的原因在于实际上“秒招姐”是一位作者,此时如果按作者昵称去计算相关性,结果会更加准确。在实际实施过程中用户所输入的搜索内容可能存在各种各样的形式,可能是如“10万”这样的预算相关、或者“98平”这样的面积相关,现有的搜索方式无法很好的应对这一情况。
为解决上述问题本申请提供了一种基于标签提取的搜索方法,请参照图1,本申请所提供的基于标签提取的搜索方法包括:步骤101至步骤104。
101、接收用户输入的搜索内容。
具体的,接收用户输入的搜索内容,其中搜索内容即为用户所希望搜索得到的资源所具有的关键信息,用户可通过相应的输入栏输入相应的文本做为搜索内容,为保证搜索效率,可对搜索内容进行一定限制,如对搜索输入栏中可以输入的字数进行限制,具体可依据实际情况而定,此处不做限定。同时用户也可对希望搜索获得的资源进行限制,如用户可限制搜索得到的资源的类型进行限制,如正常情况搜索得到的资源类型包括视频、文章以及图片等类型,而用户可主动将希望搜索得到的资源类型限制为某一单独类型,具体可依据实际情况而定,此处不做限定。
102、确定搜索内容对应的目标标签。
具体的,确定搜索内容对应的目标标签,在实际实施过程中,可以预先设置多个标签类别,如色系标签类别,其中包括红色、灰色和白色等多种标签,空间标签类别下则可包括客厅、卧室、走廊等多种标签,作者标签类别下可包括不同作者的ID(Identitydocument,身份表示号)信息等,具体可依据实际情况而定,此处不做限定。在确定搜索内容对应的目标标签过程中可使用各个标签所对应的文本与用户所输入的搜索内容进行对比,若存在一致的内容,则确定搜索内容对应有相应的目标标签,同时,为保证所获得的目标标签的准确定,在确定目标标签过程进行前,还可对搜索内容进行分词处理,对分词处理所获得的结果分别确定对应的目标标签,具体可依据实际情况而定,此处不做限定。可以理解的是,基于搜索内容确定得出的目标标签可为一个或多个,具体可依据实际情况而定,此处不做限定。
103、确定目标标签对应的搜索策略。
具体的,确定目标标签所对应的搜索策略,对于不同的目标标签可以分别具有不用的搜索策略,如对于目标标签为作者标签类别的情况,则其所对应的搜索策略应重点以资源的作者与搜索内容相匹配为目标进行搜索,其他信息的相关性占次要地位。具体的,对于不同目标标签所设置的搜索策略可依据实际情况而情况而定,此处不做限定。可以理解的是,在确定得出的目标标签为多个的情况下可相应设置用于此种情况下的搜索策略,具体可依据实际情况而定,此处不做限定。
104、依据搜索策略搜索所述搜索内容并向所述用户返回搜索结果。
具体的,依据搜索策略搜索所述搜索内容向所述用户返回搜索结果。依据目标标签所对应的搜索策略执行对用户所输入的搜索内容进行搜索,可以理解的是,在搜索过程中也可对搜索内容进行分词处理并依据分词结果进行搜索。同时对于存在多个目标标签的情况,可依据搜索策略的设置按不同目标标签的搜索权重设置返回的搜索结果的排序,对于未设置权重的情况可默认为1比1权重,即基于各个标签分别对应的搜索策略执行所获得的搜索结果按顺序交叉排序,具体可依据实际情况而定,此处不做限定。
从以上技术方案可以看出,本申请实施例具有以下优点:本方案提供了一种基于标签提取的搜索方法,包括:接收用户输入的搜索内容,确定搜索内容对应的目标标签,确定目标标签对应的搜索策略,依据搜索策略搜索所述搜索内容并向所述用户返回搜索结果。通过上述方式使得搜索过程对于用户所输入的搜索内容基于所对应的标签不同选择不同的搜索逻辑进行搜索,进而使得搜索结果可依据不同的搜索策略产生,提高了搜索过程的灵活性,以使得所获得的搜索结果尽可能的满足用户的使用需求。
基于上述图1对应的实施例,可选的,本申请还提供以供可选择实时的更为详细的实施例,具体的,请参阅图2,本申请基于标签提取的搜索方法的一个实施例包括:步骤201-步骤210。
201、接收用户输入的搜索内容。
具体的,接收用户输入的搜索内容,本步骤与上述图1对应实施例中步骤101类似,具体可参照前述内容,此处不做赘述。
202、确定处于激活状态的标签类别。
具体的,确定处于激活状态的标签类别,标签类别的具体分类可包括预算类标签、面积类标签、场景类标签和作者类标签中的任意一种或多种。如可以设置处于激活状态的标签类别为预算类标签,以便进一步符合用户的搜索需求,降低所需的搜索资源,进而进一步提高本方案的可实施性。本实施例中以处于激活状态的标签类别为预算类标签和面积类标签进行介绍,可以理解的是,在实际实施过程中所激活的标签类别可依据实际情况而定,此处不做限定。
203、使用分词工具对搜索内容进行分词处理,获得一个或多个搜索分词。
具体的,使用分词工具对搜索内容进行分词处理,获得一个或多个搜索分词,其中分词工具可为lucene(全文搜索引擎)分词工具,可以理解的是,在实际实施过程中所采用的分词工具可依据实际情况进行调整,此处不做限定。分词工具的目的在于将用户所输入的搜索内容分解为一个个的词语,如当用户所输入的搜索内容为“客厅”此时无需采用分词处理进行搜索也可得到准确结果,然而当用户输入的搜索内容为“现代简约客厅设计”,不使用分词工具进行处理的话那么就会将该内容认定为一个整体进行标签匹配,该整体进行标签匹配所获得的结果往往是不准确的,甚至无法获得标签,对于后续过程造成影响,然而使用lucene分词工具则会将其分解为“现代简约”、“客厅”、“设计”这样一个个词语,此时用分解后所得到的分词结果再去确定其对应标签就更加准确,提高了本方案的可实施性。
可以理解的是,分词工具可能存在一定的局限性,如某些特定领域的词汇使用一般分词库无法得出,此时可对分词工具设置自定义词库,比如某些装修企业的企业名称基础的lucene分词工具没法分解出这个词,但接入自定义分词库后,只需要往自定义分词库里添加“圳星”,lucene分词工具就能分解出“圳星”了。具体自定义词库所设置的词汇可依据实际情况而定,此处不做限定。
204、对所述搜索分词进行近义词处理。
具体的,对所述搜索分词进行近义词处理。用户所输入的搜索内容由于表达习惯的原因,可能与标签库中所存储的标签之间存在差距,如词语“过道”、“走廊”、“走道”,由于我们标准标签名为“走廊”,那么用户搜索“过道”无法匹配到对应标签,此时需要进行一步近义词转化。近义词转化即将一些近义词转化为对应的标准标签名,近义词处理过程所使用的近义词数据库可为预先设置,具体此处不做限定。
205、判断所述搜索分词中是否存在数字字符。
具体的,判断所述搜索分词中是否存在数字字符,若存在数字字符则说明用户所提供的搜索内容与数字相关联,需要进一步判断,即执行步骤206、判断所述搜索分词是否存在预算单位字符或面积单位字符。若不存在数字字符,则可选用现有常用的搜索方式,具体可依据实际情况而定,此处不做限定。如搜索分词可能是“89平”、“9万”这样的词,存在89,9这样的数字,即认为搜索分词存在数字字符,可以理解的是一些以汉字形式表述的数字经近义词处理后也可认定为数字字符,具体可依据实际情况而定,此处不做限定。
206、判断所述搜索分词是否存在预算单位字符或面积单位字符。
具体的,判断所述搜索分词是否存在预算单位字符或面积单位字符。若搜索分词中存在“平”“平方”“方”“m2”一类的字符且与数字字符相连出现,则认为存在面积单位字符,执行步骤207,确定搜索分词所对应的标签为面积类标签。若存在“万”“w”等一类的字符且与数字字符相连出现,则认为存在预算单位字符,执行步骤208、确定搜索分词所对应的标签为预算类标签。
207、确定搜索分词所对应的标签为面积类标签。
具体的,若搜索分词既存在数字字符又存在面积单位字符,则可认定搜索分词对应的标签为面积类标签。如:“90平”、“40m2”等情况。
208、确定搜索分词所对应的标签为预算类标签
具体的,若搜索分词既存在数字字符又存在预算单位字符,则可认定搜索分词对应的标签为面积类标签。如:“9万”、“40w”等情况。
209、确定目标标签对应的搜索策略。
基于所确定的目标标签获取其对应的搜索策略。具体的,搜索策略可依据实际情况而定,此处不做限定,值得注意的是,用户输入的搜索内容可能是如“89平”、“9万”这样的词,而面积预算类标签都是一个范围的,如“61-80平”,那么这类包含“平”、“方”、“㎡”等的词,可将对应关键字前的文字(可能是中文数字也可能是阿拉伯数字)转换为数字,然后去匹配对应区间的面积标签,同理。对于包含“万”、“w”的词,也是同样操作然后去匹配对应区间的预算标签。具体方式可依据实际情况而定,此处不做限定。
210、依据搜索策略搜索所述搜索内容向所述用户返回搜索结果
具体的,依据搜索策略搜索所述搜索内容。依据目标标签所对应的搜索策略执行对用户所输入的搜索内容进行搜索,搜索完成后即向所述用户返回搜索结果,具体可依据实际情况而定,此处不做限定。
从以上技术方案可以看出,本申请实施例具有以下优点:本方案提供了一种基于标签提取的搜索方法,包括:接收用户输入的搜索内容,确定搜索内容对应的目标标签,确定目标标签对应的搜索策略,依据搜索策略搜索所述搜索内容并向所述用户返回搜索结果。通过上述方式使得搜索过程对于用户所输入的搜索内容基于所对应的标签不同选择不同的搜索逻辑进行搜索,进而使得搜索结果可依据不同的搜索策略产生,提高了搜索过程的灵活性,以使得所获得的搜索结果尽可能的满足用户的使用需求。
上述实施例对本申请所提供的基于标签提取的搜索方法进行了描述,下面对本申请提供的基于标签提取的搜索设备,请参阅图3,本申请所提供的基于标签提取的搜索设备的一个实施例包括:
接收单元301,用于接收用户输入的搜索内容;
第一确定单元302,用于确定所述搜索内容对应的目标标签;
第二确定单元303,用于确定所述目标标签对应的搜索策略;
搜索单元304,用于依据所述搜索策略搜索所述搜索内容并向所述用户返回搜索结果。
可选的,所述第一确定单元302具体用于:
使用分词工具对所述搜索内容进行分词处理,获得一个或多个搜索分词;
确定所述一个或多个搜索分词分别对应的目标标签。
可选的,所述目标标签包括:预算类标签、面积类标签、场景类标签和作者类标签中的任意一种或多种。
可选的,所述第一确定单元302还用于:对所述搜索分词进行近义词处理。
可选的,所述第一确定单元302具体用于:
判断所述搜索分词中是否存在数字字符,
若所述搜索分词中存在数字字符,则判断所述搜索分词是否存在预算单位字符或面积单位字符;
若所述搜索分词中存在所述预算单位字符,则确定所述搜索分词所对应的标签为预算类标签;
若所述搜索分词中存在所述面积单位字符,则确定所述搜索分词所对应的标签为面积类标签。
所述第一确定单元302具体用于:
确定处于激活状态的标签类别;
在所述处于激活状态的标签类别中确定所述搜索内容对应的目标标签。
本实施例中,基于标签提取的搜索设备中各单元所执行的流程与前述图1及图2所对应的实施例中描述的方法流程类似,此处不再赘述。
图3是本申请实施例提供的一种基于标签提取的搜索设备的结构示意图,该搜索设备400可以包括一个或一个以上中央处理器(central processing units,CPU)401和存储器405,该存储器405中存储有一个或一个以上的应用程序或数据。
本实施例中,中央处理器401中的具体功能模块划分可以与前述图3中所描述的各单元的功能模块划分方式类似,此处不再赘述。
其中,存储器405可以是易失性存储或持久存储。存储在存储器405的程序可以包括一个或一个以上模块,每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器401可以设置为与存储器405通信,在服务器400上执行存储器405中的一系列指令操作。
基于标签提取的搜索设备400还可以包括一个或一个以上电源402,一个或一个以上有线或无线网络接口403,一个或一个以上输入输出接口404,和/或,一个或一个以上操作系统,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等。
该中央处理器401可以执行前述图1所示实施例中基于标签提取的搜索方法所执行的操作,具体此处不再赘述。
本申请实施例还提供了一种计算机存储介质,该计算机存储介质用于储存为上述基于标签提取的搜索方法所用的计算机软件指令,其包括用于执行为基于标签提取的搜索方法所设计的程序。
该基于标签提取的搜索方法可以如前述图1中所描述的基于标签提取的搜索方法。
本申请实施例还提供了一种计算机程序产品,该计算机程序产品包括计算机软件指令,该计算机软件指令可通过处理器进行加载来实现上述图1图2中任意一项的基于标签提取的搜索方法的流程。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,电路的等效变换,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换或改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种基于标签提取的搜索方法,其特征在于,包括:
接收用户输入的搜索内容;
确定所述搜索内容对应的目标标签;
确定所述目标标签对应的搜索策略;
依据所述搜索策略搜索所述搜索内容并向所述用户返回搜索结果。
2.根据权利要求1所述的搜索方法,其特征在于,所述确定所述搜索内容对应的目标标签,包括:
使用分词工具对所述搜索内容进行分词处理,获得一个或多个搜索分词;
确定所述一个或多个搜索分词分别对应的目标标签。
3.根据权利要求1所述的搜索方法,其特征在于,
所述目标标签包括:预算类标签、面积类标签、场景类标签和作者类标签中的任意一种或多种。
4.根据权利要求2所述的搜索方法,其特征在于,所述确定所述一个或多个搜索分词分别对应的目标标签之前,所述方法还包括:
对所述搜索分词进行近义词处理。
5.根据权利要求2所述的搜索方法,其特征在于,所述确定所述一个或多个搜索分词分别对应的目标标签,包括:
判断所述搜索分词中是否存在数字字符,
若所述搜索分词中存在数字字符,则判断所述搜索分词是否存在预算单位字符或面积单位字符;
若所述搜索分词中存在所述预算单位字符,则确定所述搜索分词所对应的标签为预算类标签;
若所述搜索分词中存在所述面积单位字符,则确定所述搜索分词所对应的标签为面积类标签。
6.根据权利要求1所述的搜索方法,其特征在于,所述确定所述搜索内容对应的目标标签之前,所述方法还包括:确定处于激活状态的标签类别;
所述确定所述搜索内容对应的目标标签,包括:
在所述处于激活状态的标签类别中确定所述搜索内容对应的目标标签。
7.一种基于标签提取的搜索设备,其特征在于,包括:
接收单元,用于接收用户输入的搜索内容;
第一确定单元,用于确定所述搜索内容对应的目标标签;
第二确定单元,用于确定所述目标标签对应的搜索策略;
搜索单元,用于依据所述搜索策略搜索所述搜索内容并向所述用户返回搜索结果。
8.一种基于标签提取的搜索设备,其特征在于,包括:
中央处理器,存储器,输入输出接口,有线或无线网络接口以及电源;
所述存储器为短暂存储存储器或持久存储存储器;
所述中央处理器配置为与所述存储器通信,在所述搜索设备上执行所述存储器中的指令操作以执行如权利要求1至6中任意一项所述的方法。
9.一种计算机可读存储介质,其特征在于,包括指令,当所述指令在计算机上运行时,使得计算机执行如权利要求1至6中任意一项所述的方法。
10.一种包含指令的计算机程序产品,其特征在于,当其在计算机上运行时,使得计算机执行如权利要求1至6中任意一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111087012.9A CN113779364A (zh) | 2021-09-16 | 2021-09-16 | 一种基于标签提取的搜索方法及其相关设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111087012.9A CN113779364A (zh) | 2021-09-16 | 2021-09-16 | 一种基于标签提取的搜索方法及其相关设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113779364A true CN113779364A (zh) | 2021-12-10 |
Family
ID=78851398
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111087012.9A Pending CN113779364A (zh) | 2021-09-16 | 2021-09-16 | 一种基于标签提取的搜索方法及其相关设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113779364A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024075927A1 (en) * | 2022-10-08 | 2024-04-11 | Samsung Electronics Co., Ltd. | Meta-searching method and apparatus |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103198067A (zh) * | 2012-01-06 | 2013-07-10 | 卓望数码技术(深圳)有限公司 | 一种业务搜索方法及系统 |
CN106096050A (zh) * | 2016-06-29 | 2016-11-09 | 乐视控股(北京)有限公司 | 一种视频内容搜索的方法和装置 |
CN107590291A (zh) * | 2017-10-30 | 2018-01-16 | 广东欧珀移动通信有限公司 | 一种图片的搜索方法、终端设备及存储介质 |
-
2021
- 2021-09-16 CN CN202111087012.9A patent/CN113779364A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103198067A (zh) * | 2012-01-06 | 2013-07-10 | 卓望数码技术(深圳)有限公司 | 一种业务搜索方法及系统 |
CN106096050A (zh) * | 2016-06-29 | 2016-11-09 | 乐视控股(北京)有限公司 | 一种视频内容搜索的方法和装置 |
CN107590291A (zh) * | 2017-10-30 | 2018-01-16 | 广东欧珀移动通信有限公司 | 一种图片的搜索方法、终端设备及存储介质 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024075927A1 (en) * | 2022-10-08 | 2024-04-11 | Samsung Electronics Co., Ltd. | Meta-searching method and apparatus |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI536181B (zh) | 在多語文本中的語言識別 | |
CN103136228A (zh) | 一种图片搜索方法以及图片搜索装置 | |
US8572087B1 (en) | Content identification | |
CA3174601A1 (en) | Text intent identifying method, device, computer equipment and storage medium | |
US20140379719A1 (en) | System and method for tagging and searching documents | |
CA3138556A1 (en) | Apparatuses, storage medium and method of querying data based on vertical search | |
US20130339369A1 (en) | Search Method and Apparatus | |
US9418058B2 (en) | Processing method for social media issue and server device supporting the same | |
CN112989208B (zh) | 一种信息推荐方法、装置、电子设备及存储介质 | |
CN111475725A (zh) | 用于搜索内容的方法、装置、设备和计算机可读存储介质 | |
CN112925883B (zh) | 搜索请求处理方法、装置、电子设备及可读存储介质 | |
CN111563382A (zh) | 文本信息的获取方法、装置、存储介质及计算机设备 | |
CN112699232A (zh) | 文本标签提取方法、装置、设备和存储介质 | |
US20120059786A1 (en) | Method and an apparatus for matching data network resources | |
CN113779364A (zh) | 一种基于标签提取的搜索方法及其相关设备 | |
CN113591476A (zh) | 一种基于机器学习的数据标签推荐方法 | |
CN112579781A (zh) | 文本归类方法、装置、电子设备及介质 | |
CN113806491B (zh) | 一种信息处理的方法、装置、设备和介质 | |
CN115525761A (zh) | 一种文章关键词筛选类别的方法、装置、设备及存储介质 | |
CN112926297B (zh) | 处理信息的方法、装置、设备和存储介质 | |
CN114255067A (zh) | 数据定价方法和装置、电子设备、存储介质 | |
CN110647666B (zh) | 模板与公式的智能匹配方法、装置及计算机可读存储介质 | |
CN113869043A (zh) | 内容标注方法、装置、设备及存储介质 | |
CN110851560B (zh) | 信息检索方法、装置及设备 | |
CN111931480A (zh) | 文本主要内容的确定方法、装置、存储介质及计算机设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |