CN113486071A - 基于电子书的搜索方法、服务端、客户端及系统 - Google Patents
基于电子书的搜索方法、服务端、客户端及系统 Download PDFInfo
- Publication number
- CN113486071A CN113486071A CN202110852096.4A CN202110852096A CN113486071A CN 113486071 A CN113486071 A CN 113486071A CN 202110852096 A CN202110852096 A CN 202110852096A CN 113486071 A CN113486071 A CN 113486071A
- Authority
- CN
- China
- Prior art keywords
- book
- word
- words
- target
- search
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2457—Query processing with adaptation to user needs
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于电子书的搜索方法、服务端、客户端及系统。其中,方法包括:接收客户端发送的目标搜索词;确定与目标搜索词对应的至少一个共现搜索词;针对于任一共现搜索词,获取该共现搜索词关联的书籍词;将书籍词发送至客户端,以供在客户端展示书籍词。采用本方案,能够获得与目标搜索词语义关联强的搜索词,基于该共现搜索词获得的搜索结果不仅能够符合用户的搜索需求,还能够为用户提供多样化的搜索结果,提升搜索结果命中率;而且本方案将共现搜索词关联的书籍词发送至客户端,通过在客户端中展示书籍词能够缩短用户的书籍查找路径,提升书籍查找效率。
Description
技术领域
本发明涉及电子书技术领域,具体涉及一种基于电子书的搜索方法、服务端、客户端及系统。
背景技术
随着电子设备的不断发展,电子书以其节能环保、容量大以及阅读便捷等特点越来越受到读者青睐。为了能够使用户从海量电子书中查找出感兴趣的书籍,许多电子书应用为用户提供有搜索功能。
目前,电子书应用提供的搜索功能是在用户输入搜索词之后,采用模糊匹配算法来获得与搜索词匹配的搜索结果。其中,模糊匹配算法获得的搜索结果仅仅包含与搜索词字面相近的结果词。从而采用现有技术中的搜索方式,为用户提供的搜索结果单一,并且搜索结果无法满足用户实际的搜索需求,从而降低用户查找到感兴趣书籍的效率。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的基于电子书的搜索方法、服务端、客户端及系统。
根据本发明的第一个方面,提供了一种基于电子书的搜索方法,包括:
接收客户端发送的目标搜索词;
确定与所述目标搜索词对应的至少一个共现搜索词;
针对于任一共现搜索词,获取该共现搜索词关联的书籍词;
将所述书籍词发送至所述客户端,以供在所述客户端展示所述书籍词。
根据本发明的第二个方面,提供了一种基于电子书的搜索方法,包括:
获取用户输入的目标搜索词;
将所述目标搜索词发送至服务端,以供所述服务端确定与所述目标搜索词对应的至少一个共现搜索词,以及针对于任一共现搜索词,获取该共现搜索词关联的书籍词;
接收服务端发送的书籍词,并展示接收到的书籍词。
根据本发明的第三个方面,提供了一种服务端,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如下操作:
接收客户端发送的目标搜索词;
确定与所述目标搜索词对应的至少一个共现搜索词;
针对于任一共现搜索词,获取该共现搜索词关联的书籍词;
将所述书籍词发送至所述客户端,以供在所述客户端展示所述书籍词。
根据本发明的第四个方面,提供了一种客户端,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如下操作:
获取用户输入的目标搜索词;
将所述目标搜索词发送至服务端,以供所述服务端确定与所述目标搜索词对应的至少一个共现搜索词,以及针对于任一共现搜索词,获取该共现搜索词关联的书籍词;
接收服务端发送的书籍词,并展示接收到的书籍词。
根据本发明的第五个方面,提供了一种基于电子书的搜索系统,包括上述服务端,以及上述客户端。
根据本发明的第六个方面,提供了一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行上述服务端执行基于电子书的搜索方法对应的操作。
根据本发明的第七个方面,提供了一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行上述客户端执行基于电子书的搜索方法对应的操作。
本发明公开了一种基于电子书的搜索方法、服务端、客户端及系统。其中,方法包括:接收客户端发送的目标搜索词;确定与目标搜索词对应的至少一个共现搜索词;针对于任一共现搜索词,获取该共现搜索词关联的书籍词;将书籍词发送至客户端,以供在客户端展示书籍词。采用本方案,能够获得与目标搜索词语义关联强的搜索词,基于该共现搜索词获得的搜索结果不仅能够符合用户的搜索需求,还能够为用户提供多样化的搜索结果,提升搜索结果命中率;而且本方案将共现搜索词关联的书籍词发送至客户端,通过在客户端中展示书籍词能够缩短用户的书籍查找路径,提升书籍查找效率。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了根据本发明实施例一提供的一种基于电子书的搜索方法的流程图;
图2示出了根据本发明实施例二提供的一种基于电子书的搜索方法的流程图;
图3示出了根据本发明实施例三提供的一种基于电子书的搜索方法的流程图;
图4示出了应用于本发明实施例三中的一种书籍词剔除方法的流程图;
图5示出了根据本发明实施例四提供的一种基于电子书的搜索方法的流程图;
图6示出了根据本发明实施例五提供的一种服务器的结构示意图;
图7示出了根据本发明实施例六提供的一种客户端的结构示意图;
图8示出了根据本发明实施例七提供的一种基于电子书的搜索系统的结构示意图。
具体实施方式
下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。
实施例一
图1示出了根据本发明实施例一提供的一种基于电子书的搜索方法的流程图。其中,本实施例提供的基于电子书的搜索方法可以应用于电子书应用的服务端。
如图1所示,该方法包括如下步骤:
步骤S110,接收客户端发送的目标搜索词。
电子书应用的客户端监测用户的搜索词输入操作,客户端在监测到用户执行了搜索词输入操作之后,获取用户输入的搜索词,并将该搜索词发送至服务端。其中,客户端向服务端发送的搜索词为目标搜索词。
步骤S120,确定与目标搜索词对应的至少一个共现搜索词。
与模糊匹配不同的是,本实施例并不是获取与目标搜索词字面相近的相似词,而是基于大量的用户历史搜索数据,获取用户历史搜索词间的共同出现关系(即共现关系)。继而根据该共现关系确定与步骤S110中目标搜索词对应的至少一个共现搜索词。在此应当理解的是,本实施例中用户历史搜索数据在用户授权的情况下获得。
在一种可选的实施方式中,为了提升共现搜索词的确定精度,本实施例基于机器学习算法预先构建共现搜索词识别模型。其中,本实施例对共现搜索词识别模型的具体结构及类型等不作限定。进一步获取预设历史时间窗口内的用户历史搜索数据,基于该用户历史搜索数据生成样本数据,通过该样本数据对预先构建共现搜索词识别模型的训练来获得训练好的共现搜索词识别模型。
在本步骤执行过程中,将步骤S110接收到的目标搜索词输入至预先训练好的共现搜索词识别模型中,并获取该共现搜索词识别模型输出的与该目标搜索词对应的至少一个共现搜索词。
步骤S130,针对于任一共现搜索词,获取与该共现搜索词关联的书籍词。
根据共现搜索词并无法直接且快速地查找到书籍,从而若直接将共现搜索词在客户端中展示,会加长用户查找书籍的路径,降低用户的书籍查找效率。基于此,本实施例在确定与目标搜索词对应的至少一个共现搜索词之后,针对于任一共现搜索词,获取与该共现搜索词关联的书籍词。
在一种可选的实施方式中,为了进一步提升用户的书籍查找效率,预先构建任一搜索词对应的书籍词集合,搜索词对应的书籍词集合中包含有该搜索词关联的至少一个书籍词。其中,可根据用户历史搜索数据,获取该共现搜索词关联的书籍词。
具体地,从用户历史搜索数据中确定出至少一个搜索词,针对于每个搜索词确定该搜索词对应的各个搜索单位。其中,一个搜索单位为一个用户一个搜索词的搜索过程。进一步获取该搜索词在各个搜索单位中的意向书籍词,并将该意向书籍词作为该搜索词关联的书籍词。其中,该搜索词在各个搜索单位中的意向书籍词具体为用户在该搜索词对应的搜索单位中执行了点击、收藏、查看详情等操作的书籍词。
步骤S140,将书籍词发送至客户端,以供在客户端展示该书籍词。
将步骤S130获得的书籍词中的部分或全部发送至客户端,通过在客户端中展示该书籍词能够便于用户缩短书籍查找路径,提升书籍查询效率。
由此可见,本实施例提供的基于电子书的搜索方法,接收客户端发送的目标搜索词,并确定与目标搜索词对应的至少一个共现搜索词。由于存在共现关系的搜索词语义相关性较强,从而本实施例能够获得与目标搜索词语义关联强的搜索词,基于该共现搜索词获得的搜索结果不仅能够符合用户的搜索需求,还能够为用户提供多样化的搜索结果,提升搜索结果命中率。而且本实施例将共现搜索词关联的书籍词发送至客户端,通过在客户端中展示书籍词能够缩短用户的书籍查找路径,提升书籍查找效率。
实施例二
图2示出了根据本发明实施例二提供的一种基于电子书的搜索方法的流程图。其中,本实施例提供的基于电子书的搜索方法是对实施例一中搜索方法的进一步优化。
如图2所示,该方法包括如下步骤:
步骤S210,接收客户端发送的目标搜索词,确定与目标搜索词对应的至少一个共现搜索词,针对于任一共现搜索词,获取该共现搜索词关联的书籍词。
本步骤的具体实施过程可参照实施例一中相应部分的描述,本实施例在此不作赘述。
步骤S220,针对于任一书籍词,计算该书籍词与目标搜索词的语义相似度。
书籍词与目标搜索词的语义相似度根据书籍词与关联的共现搜索词的关联度以及该关联的共现搜索词与目标搜索词的共现率确定。
具体地,书籍词与关联的共现搜索词的关联度表征了在该共现搜索词下该书籍词为用户意向词的概率。在计算该书籍词与该书籍词关联的共现搜索词的关联度过程中,针对于任一书籍词,计算该书籍词关联的共现搜索词所对应的搜索单位的总个数,并计算该书籍词在该共现搜索词的所有搜索单位中作为意向书籍词的次数,将该书籍词在该共现搜索词的所有搜索单位中作为意向书籍词的次数与该共现搜索词所对应的搜索单位总个数的比值,作为该书籍词与关联的共现搜索词的关联度。
共现搜索词与目标搜索词的共现率表征了共现搜索词与目标搜索词的语义相关性。共现搜索词与目标搜索词的语义相关性越强,则共现搜索词与目标搜索词的共现率越高。在计算该书籍词关联的共现搜索词与目标搜索词的共现率的过程中,具体根据历史用户搜索数据中,该共现搜索词与目标搜索词共同出现的频率确定。
在获得书籍词与关联的共现搜索词的关联度以及该关联的共现搜索词与目标搜索词的共现率后,可以将该关联度以及共现率的乘积作为该书籍词与目标搜索词的语义相似度.
步骤S230,根据计算获得的书籍词与目标搜索词的语义相似度,从获取的书籍词中提取目标书籍词。
其中,向客户端发送的书籍词为目标书籍词。在具体实施过程中,可以将与目标搜索词的语义相似度较高的前n个书籍词作为目标书籍词,从而目标书籍词与目标搜索词的语义相似度较高,便于提升后续搜索结果的命中率。
步骤S240,将目标书籍词发送至客户端,以供在客户端展示目标书籍词。
在一种可选的实施方式中,在将目标书籍词发送至客户端之前,可以确定目标书籍词的排列顺序。其中,根据目标书籍词与目标搜索词的语义相似度,确定目标书籍词的排列顺序。例如,目标书籍词与目标搜索词的语义相似度越高,目标书籍词的位序越高。
由此可见,本实施例提供的基于电子书的搜索方法,根据书籍词与关联的共现搜索词的关联度以及该关联的共现搜索词与目标搜索词的共现率确定书籍词与目标搜索词的语义相似度,从而提升书籍词与目标搜索词的语义相似度的确定精度。并且,根据书籍词与目标搜索词的语义相似度,从获取的书籍词中筛选出目标书籍词,并将目标书籍词发送至客户端,以供在客户端展示目标书籍词。采用该种方式,一方面减少了数据传输量,节约带宽资源;另一方面为用户提供与目标搜索词语义相似度高的书籍词,提升了搜索结果的命中率,提升用户体验。
实施例三
图3示出了根据本发明实施例三提供的一种基于电子书的搜索方法的流程图。其中,本实施例提供的基于电子书的搜索方法是对实施例一中搜索方法的进一步优化。
如图3所示,该方法包括如下步骤:
步骤S310,接收客户端发送的目标搜索词,确定与目标搜索词对应的至少一个共现搜索词,针对于任一共现搜索词,获取该共现搜索词关联的书籍词。
本步骤的具体实施过程可参照实施例一中相应部分的描述,本实施例在此不作赘述。
步骤S320,计算书籍词与目标搜索词的字面相似度,从获取的书籍词中提取与目标搜索词的字面相似度小于或等于预设相似度阈值的目标书籍词。
为了提升为用户展示的书籍词的多样性,提高搜索结果命中率,提升用户体验。本实施例在初步获取书籍词之后,进一步对书籍词进行多样性校验,以剔除不符合多样性要求的书籍词。
具体地,计算书籍词与目标搜索词的字面相似度,从获取的书籍词中提取与目标搜索词的字面相似度小于或等于预设相似度阈值的目标书籍词。其中,本实施例对字面相似度的具体计算方式不作限定,例如可以计算书籍词与目标搜索词的编辑距离,又或者计算书籍词与目标搜索词的余弦相似度等等。
在一种可选的实施方式中,可通过图4所示的方法来剔除书籍词。如图4所示,该方法包括如下步骤S321-S325。
S321,从候选书籍词集合中选取一书籍词。
其中,候选书籍词集合在初始状态下可以包含所有初步获取到的书籍词。例如,可以先根据书籍词与目标搜索词的语义相似度获取语义相似度高的前n个书籍词,并将该n个书籍词存储至候选书籍词集合中。
在一种可选的书籍词选取方式中,可以从当前候选书籍词集合中随机选取一书籍词,从而提升书籍词的选取精度。
在又一种可选的书籍词选取方式中,每次从候选书籍词集合中选取与目标搜索词的语义相似度最大的书籍词,从而可以先对语义相似度最大的书籍词进行多样性校验。并且后续书籍词加入目标书籍词集合的顺序和书籍词与目标搜索词的语义相似度的大小顺序相一致,即与目标搜索词的语义相似度高的先加入目标书籍词集合。从而后续在获得目标书籍词集合之后,无需再根据目标书籍词与目标搜索词的语义相似度的大小对目标书籍词进行排序,而直接根据记录的目标搜索词加入目标搜索词集合的顺序即可获得目标搜索词的顺序。
S322,计算选取的该书籍词与目标搜索词的字面相似度,以及计算选取的该书籍词与目标书籍词集合中的每个目标书籍词的字面相似度。
目标书籍词集合中包含的目标书籍词是已经过筛选,并且后续待发送给客户端的书籍词。本实施方式中,不但计算选取的该书籍词与目标搜索词的字面相似度,还计算选取的该书籍词与目标书籍词集合中的每个目标书籍词的字面相似度。其中,本实施方式对字面相似度的具体计算方式不作限定,例如可通过字符串编辑距离、或余弦相似度等计算方式获得。
S323,判断选取的该书籍词与目标搜索词的字面相似度,以及选取的该书籍词与目标书籍词集合中的每个书籍词的字面相似度是否均小于或等于预设相似度阈值;若是,则执行S324;否则,则执行S325。
S324,将选取的该书籍词加入目标书籍词集合中,并将选取的该书籍词从候选书籍词集合中剔除。
若选取的该书籍词与目标搜索词的字面相似度小于或等于预设相似度阈值,并且,选取的该书籍词与目标书籍词集合中的每个书籍词的字面相似度均小于或等于预设相似度阈值,则表明选取的该书籍词在字面上既不与目标搜索词相近,也不与已经筛选出的待发送给客户端的目标书籍词相近。
进一步将选取的该书籍词加入目标书籍词集合中,从而最终能够使得目标书籍词集合中的目标书籍词既不与目标搜索词字面相似,而且目标书籍词之间也不存在字面相似,继而保障了搜索结果的多样性。
并且进一步执行S321以从候选书籍词集合中选取下一书籍词;或者,判断当前目标书籍词集合中包含的目标书籍词的数量是否大于或等于预设数量阈值。若满足,则表明获取到的目标书籍词的数量已满足要求,则结束书籍词的多样性校验;若不满足,则表明获取到的目标书籍词的数量不满足要求,则进一步执行S321。
S325,将选取的该书籍词从候选书籍词集合中剔除。
若选取的该书籍词不满足与目标搜索词的字面相似度小于或等于预设相似度阈值,或者选取的该书籍词不满足与目标书籍词集合中的每个书籍词的字面相似度均小于或等于预设相似度阈值,则将该书籍词加入目标书籍词集合中会降低搜索结果的多样性,从而本实施例方式在该种情况下将选取的该书籍词从候选书籍词集合中剔除。并且进一步执行S321以从候选书籍词集合中选取下一书籍词。
进一步可选的,在执行S321之前,可判断当前候选书籍词集合中是否包含有书籍词。若当前候选书籍词集合中包含有书籍词,则执行S321;若当前候选书籍词集合中未包含有书籍词,则判断当前目标书籍词集合中的书籍词的数量是否大于或等于预设数量阈值。
若当前候选书籍词集合中未包含有书籍词,且当前目标书籍词集合中的书籍词的数量大于或等于预设数量阈值,则结束书籍词的多样性校验。
若当前候选书籍词集合中未包含有书籍词,且目标书籍词集合中的书籍词的数量小于预设数量阈值,则获取填充书籍词。
在一种可选的填充书籍词获取方式中,针对于任一剔除的书籍词,确定该剔除的书籍词关联的共现搜索词,并从该共现搜索词关联的书籍词中获取填充书籍词;其中,填充书籍词与剔除的书籍词不同。在该种填充书籍词获取方式,填充书籍词与剔除的书籍词具有相同的共现搜索词,从而填充书籍词与剔除的书籍词具有语义关联性,继而填充书籍词与目标搜索词相关性较高,从而提升搜索结果与目标搜索词的匹配度。
在又一种可选的填充书籍词获取方式中,根据用户历史搜索数据,提取热搜词,从热搜词中获取填充书籍词。在该种方式中,利用热搜词进行填补,从而简化填补逻辑,提升本方法的整体执行效率。
在一种可选的方式中,在获得填充书籍词之后,可以将填充书籍词加入候选书籍词集合中,并执行S321,以便对填充书籍词进行进一步的多样性校验,保障搜索结果的多样性。
在另一种可选的实施方式,在获得填充书籍词之后,可直接将填充书籍词加入目标书籍词集合中,并且填充书籍词加入目标书籍词集合后,目标书籍词集合中的书籍词的数量等于预设数量阈值。
步骤S330,将目标书籍词发送至客户端,以供在客户端展示目标书籍词。
由此可见,采用本实施例提供的基于电子书的搜索方法,计算书籍词与目标搜索词的字面相似度,从获取的书籍词中提取与目标搜索词的字面相似度小于或等于预设相似度阈值的目标书籍词,从而保障搜索结果的多样性,提升搜索结果的命中率,提升用户体验。
实施例四
图5示出了根据本发明实施例四提供的一种基于电子书的搜索方法的流程图。其中,本实施例提供的基于电子书的搜索方法应用于电子书应用的客户端。
如图5所示,该方法包括如下步骤:
步骤S510,获取用户输入的目标搜索词。
客户端为用户提供有搜索词输入入口,用户可通过该输入入口输入相应的目标搜索词。
步骤S520,将目标搜索词发送至服务端,以供服务端确定与目标搜索词对应的至少一个共现搜索词,以及针对于任一共现搜索词,获取该共现搜索词关联的书籍词。
步骤S530,接收服务端发送的书籍词,并展示接收到的书籍词。
其中,本实施例对书籍词的具体展示方式不作限定。
在一种可选的实施方式中,步骤S520接收服务端发送的书籍词以及书籍词的排列顺序,则步骤S530按照书籍词的排列顺序展示接收到的书籍词。
本实施例中的步骤的具体实施方式可参照其他方法实施例中相应部分的描述,在此不作赘述。
由此可见,本实施例提供的基于电子书的搜索方法,获取用户输入的目标搜索词,将目标搜索词发送至服务端,以供服务端确定与所述目标搜索词对应的至少一个共现搜索词,以及针对于任一共现搜索词,获取该共现搜索词关联的书籍词,并接收服务端发送的书籍词,并展示接收到的书籍词。采用本方案,能够获得与目标搜索词语义关联强的搜索词,基于该共现搜索词获得的搜索结果不仅能够符合用户的搜索需求,还能够为用户提供多样化的搜索结果,提升搜索结果命中率;而且本实施例展示书籍词能够缩短用户的书籍查找路径,提升书籍查找效率。
实施例五
图6示出了本发明实施例五提供的一种服务端的结构示意图。本发明具体实施例并不对服务端的具体实现做限定。
如图6所示,该服务端可以包括:处理器(processor)602、通信接口(Communications Interface)604、存储器(memory)606、以及通信总线608。
其中:处理器602、通信接口604、以及存储器606通过通信总线608完成相互间的通信。通信接口604,用于与其它设备比如客户端或其它服务器等的网元通信。处理器602,用于执行程序610,具体可以执行上述服务端方法实施例中的相关步骤。
具体地,程序610可以包括程序代码,该程序代码包括计算机操作指令。
处理器602可能是中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。计算设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个CPU;也可以是不同类型的处理器,如一个或多个CPU以及一个或多个ASIC。
存储器606,用于存放程序610。存储器606可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
程序610具体可以用于使得处理器602执行以下操作:
接收客户端发送的目标搜索词;
确定与所述目标搜索词对应的至少一个共现搜索词;
针对于任一共现搜索词,获取该共现搜索词关联的书籍词;
将所述书籍词发送至所述客户端,以供在所述客户端展示所述书籍词。
在一种可选的实施方式中,程序610具体可以用于使得处理器602执行以下操作:
在所述获取该共现搜索词关联的书籍词之后,针对于任一书籍词,计算该书籍词与所述目标搜索词的语义相似度;
根据计算获得的书籍词与所述目标搜索词的语义相似度,从获取的书籍词中提取目标书籍词;
将所述目标书籍词发送至所述客户端,以供在所述客户端展示所述目标书籍词。
在一种可选的实施方式中,程序610具体可以用于使得处理器602执行以下操作:
计算该书籍词与该书籍词关联的共现搜索词的关联度,以及计算该书籍词关联的共现搜索词与所述目标搜索词的共现率;
根据所述关联度以及所述共现率,计算该书籍词与所述目标搜索词的语义相似度。
在一种可选的实施方式中,程序610具体可以用于使得处理器602执行以下操作:
将所述关联度与所述共现率的乘积,作为该书籍词与所述目标搜索词的语义相似度。
在一种可选的实施方式中,程序610具体可以用于使得处理器602执行以下操作:
在所述将所述书籍词发送至所述客户端之前,确定书籍词的排列顺序;
将所述书籍词以及书籍词的排列顺序发送至所述客户端。
在一种可选的实施方式中,程序610具体可以用于使得处理器602执行以下操作:
根据书籍词与所述目标搜索词的语义相似度,确定书籍词的排列顺序。
在一种可选的实施方式中,程序610具体可以用于使得处理器602执行以下操作:
将所述目标搜索词输入至预先训练好的共现搜索词识别模型中;
获取所述共现搜索词识别模型输出的与所述目标搜索词对应的至少一个共现搜索词。
在一种可选的实施方式中,程序610具体可以用于使得处理器602执行以下操作:
根据用户历史搜索数据,获取该共现搜索词关联的书籍词。
在一种可选的实施方式中,程序610具体可以用于使得处理器602执行以下操作:
在所述获取该共现搜索词关联的书籍词之后,计算书籍词与所述目标搜索词的字面相似度;
从获取的书籍词中提取与所述目标搜索词的字面相似度小于或等于预设相似度阈值的目标书籍词。
在一种可选的实施方式中,程序610具体可以用于使得处理器602执行以下操作:
从候选书籍词集合中选取一书籍词;
计算选取的该书籍词与所述目标搜索词的字面相似度,以及计算选取的该书籍词与目标书籍词集合中的每个目标书籍词的字面相似度;
判断选取的该书籍词与所述目标搜索词的字面相似度,以及选取的该书籍词与目标书籍词集合中的每个目标书籍词的字面相似度是否均小于或等于预设相似度阈值;
若是,将选取的该书籍词加入所述目标书籍词集合中,并将选取的该书籍词从所述候选书籍词集合中剔除,以及执行所述从候选书籍词集合中选取一书籍词的步骤;
若否,将选取的该书籍词从所述候选书籍词集合中剔除,以及执行所述从候选书籍词集合中选取一书籍词的步骤。
在一种可选的实施方式中,程序610具体可以用于使得处理器602执行以下操作:
从候选书籍词集合中选取与所述目标搜索词的语义相似度最大的书籍词。
在一种可选的实施方式中,程序610具体可以用于使得处理器602执行以下操作:
计算书籍词与所述目标搜索词的编辑距离。
在一种可选的实施方式中,程序610具体可以用于使得处理器602执行以下操作:
在所述从候选书籍词集合中选取一书籍词之前,判断当前所述候选书籍词集合中是否包含有书籍词;
若当前所述候选书籍词集合中包含有书籍词,则执行所述从候选书籍词集合中选取一书籍词的步骤;
若当前所述候选书籍词集合中未包含有书籍词,则判断当前所述目标书籍词集合中的书籍词的数量是否大于或等于预设数量阈值;
若当前所述目标书籍词集合中的书籍词的数量小于预设数量阈值,则获取填充书籍词,并将所述填充书籍词加入所述候选书籍词集合中,并执行所述从候选书籍词集合中选取一书籍词的步骤。
在一种可选的实施方式中,程序610具体可以用于使得处理器602执行以下操作:
针对于任一剔除的书籍词,确定该剔除的书籍词关联的共现搜索词,并从该共现搜索词关联的书籍词中获取填充书籍词;其中,所述填充书籍词与剔除的书籍词不同。
在一种可选的实施方式中,程序610具体可以用于使得处理器602执行以下操作:
根据用户历史搜索数据,提取热搜词;
从所述热搜词中获取填充书籍词。
其中,本实施例的具体实施过程可参照上述服务端执行的基于电子书的搜索方法实施例中的步骤。在此不作赘述。
实施例六
图7示出了本发明实施例六提供的一种客户端的结构示意图。本发明具体实施例并不对客户端的具体实现做限定。
如图7所示,该客户端可以包括:处理器(processor)702、通信接口(Communications Interface)704、存储器(memory)706、以及通信总线708。其中:处理器702、通信接口704、以及存储器706通过通信总线708完成相互间的通信。通信接口704,用于与其它设备比如客户端或其它服务器等的网元通信。处理器702,用于执行程序710,具体可以执行上述客户端方法实施例中的相关步骤。
具体地,程序710可以包括程序代码,该程序代码包括计算机操作指令。处理器702可能是中央处理器CPU,或者是特定集成电路ASIC(Application Specific IntegratedCircuit),或者是被配置成实施本发明实施例的一个或多个集成电路。计算设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个CPU;也可以是不同类型的处理器,如一个或多个CPU以及一个或多个ASIC。存储器706,用于存放程序710。存储器706可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
程序710具体可以用于使得处理器702执行以下操作:
获取用户输入的目标搜索词;
将所述目标搜索词发送至服务端,以供所述服务端确定与所述目标搜索词对应的至少一个共现搜索词,以及针对于任一共现搜索词,获取该共现搜索词关联的书籍词;
接收服务端发送的书籍词,并展示接收到的书籍词。
在一种可选的实施方式中,程序710具体可以用于使得处理器702执行以下操作:
接收服务端发送的书籍词以及书籍词的排列顺序,按照所述书籍词的排列顺序展示接收到的书籍词。
其中,本实施例的具体实施过程可参照上述客户端执行的基于电子书的搜索方法实施例中的步骤。在此不作赘述。
在此应当理解的是,随着智能终端处理能力的不断增强,本发明实施例中由服务器执行的全部或部分步骤可以由客户端来执行,本发明对此不作限定。
实施例七
图8示出了根据本发明实施例七提供的一种基于电子书的搜索系统的结构示意图。如图8所示,系统800包括服务端810及客户端820。
其中,服务端810及客户端820的具体结构可分别参照实施例五及实施例六中的描述,本实施例在此不作赘述。
实施例八
本发明实施例八提供了一种非易失性计算机存储介质,所述计算机存储介质存储有至少一可执行指令,该计算机可执行指令可执行上述任意服务端执行的基于电子书的搜索方法。
可执行指令具体可以用于使得处理器执行以下操作:
接收客户端发送的目标搜索词;确定与所述目标搜索词对应的至少一个共现搜索词;针对于任一共现搜索词,获取该共现搜索词关联的书籍词;将所述书籍词发送至所述客户端,以供在所述客户端展示所述书籍词。
在一种可选的实施方式中,可执行指令具体可以用于使得处理器执行以下操作:在所述获取该共现搜索词关联的书籍词之后,针对于任一书籍词,计算该书籍词与所述目标搜索词的语义相似度;根据计算获得的书籍词与所述目标搜索词的语义相似度,从获取的书籍词中提取目标书籍词;将所述目标书籍词发送至所述客户端,以供在所述客户端展示所述目标书籍词。
在一种可选的实施方式中,可执行指令具体可以用于使得处理器执行以下操作:计算该书籍词与该书籍词关联的共现搜索词的关联度,以及计算该书籍词关联的共现搜索词与所述目标搜索词的共现率;根据所述关联度以及所述共现率,计算该书籍词与所述目标搜索词的语义相似度。
在一种可选的实施方式中,可执行指令具体可以用于使得处理器执行以下操作:将所述关联度与所述共现率的乘积,作为该书籍词与所述目标搜索词的语义相似度。
在一种可选的实施方式中,可执行指令具体可以用于使得处理器执行以下操作:在所述将所述书籍词发送至所述客户端之前,确定书籍词的排列顺序;将所述书籍词以及书籍词的排列顺序发送至所述客户端。
在一种可选的实施方式中,可执行指令具体可以用于使得处理器执行以下操作:根据书籍词与所述目标搜索词的语义相似度,确定书籍词的排列顺序。
在一种可选的实施方式中,可执行指令具体可以用于使得处理器执行以下操作:将所述目标搜索词输入至预先训练好的共现搜索词识别模型中;获取所述共现搜索词识别模型输出的与所述目标搜索词对应的至少一个共现搜索词。
在一种可选的实施方式中,可执行指令具体可以用于使得处理器执行以下操作:根据用户历史搜索数据,获取该共现搜索词关联的书籍词。
在一种可选的实施方式中,可执行指令具体可以用于使得处理器执行以下操作:在所述获取该共现搜索词关联的书籍词之后,计算书籍词与所述目标搜索词的字面相似度;从获取的书籍词中提取与所述目标搜索词的字面相似度小于或等于预设相似度阈值的目标书籍词。
在一种可选的实施方式中,可执行指令具体可以用于使得处理器执行以下操作:从候选书籍词集合中选取一书籍词;计算选取的该书籍词与所述目标搜索词的字面相似度,以及计算选取的该书籍词与目标书籍词集合中的每个目标书籍词的字面相似度;判断选取的该书籍词与所述目标搜索词的字面相似度,以及选取的该书籍词与目标书籍词集合中的每个目标书籍词的字面相似度是否均小于或等于预设相似度阈值;若是,将选取的该书籍词加入所述目标书籍词集合中,并将选取的该书籍词从所述候选书籍词集合中剔除,以及执行所述从候选书籍词集合中选取一书籍词的步骤;若否,将选取的该书籍词从所述候选书籍词集合中剔除,以及执行所述从候选书籍词集合中选取一书籍词的步骤。
在一种可选的实施方式中,可执行指令具体可以用于使得处理器执行以下操作:从候选书籍词集合中选取与所述目标搜索词的语义相似度最大的书籍词。
在一种可选的实施方式中,可执行指令具体可以用于使得处理器执行以下操作:计算书籍词与所述目标搜索词的编辑距离。
在一种可选的实施方式中,可执行指令具体可以用于使得处理器执行以下操作:在所述从候选书籍词集合中选取一书籍词之前,判断当前所述候选书籍词集合中是否包含有书籍词;若当前所述候选书籍词集合中包含有书籍词,则执行所述从候选书籍词集合中选取一书籍词的步骤;若当前所述候选书籍词集合中未包含有书籍词,则判断当前所述目标书籍词集合中的书籍词的数量是否大于或等于预设数量阈值;若当前所述目标书籍词集合中的书籍词的数量小于预设数量阈值,则获取填充书籍词,并将所述填充书籍词加入所述候选书籍词集合中,并执行所述从候选书籍词集合中选取一书籍词的步骤。
在一种可选的实施方式中,可执行指令具体可以用于使得处理器执行以下操作:针对于任一剔除的书籍词,确定该剔除的书籍词关联的共现搜索词,并从该共现搜索词关联的书籍词中获取填充书籍词;其中,所述填充书籍词与剔除的书籍词不同。
在一种可选的实施方式中,可执行指令具体可以用于使得处理器执行以下操作:根据用户历史搜索数据,提取热搜词;从所述热搜词中获取填充书籍词。
其中,本实施例的具体实施过程可参照上述服务端执行的基于电子书的搜索方法实施例中的步骤。在此不作赘述。
实施例九
本发明实施例九提供了一种非易失性计算机存储介质,所述计算机存储介质存储有至少一可执行指令,该计算机可执行指令可执行上述任意客户端执行的基于电子书的搜索方法。
可执行指令具体可以用于使得处理器执行以下操作:
获取用户输入的目标搜索词;将所述目标搜索词发送至服务端,以供所述服务端确定与所述目标搜索词对应的至少一个共现搜索词,以及针对于任一共现搜索词,获取该共现搜索词关联的书籍词;接收服务端发送的书籍词,并展示接收到的书籍词。
在一种可选的实施方式中,可执行指令具体可以用于使得处理器执行以下操作:
接收服务端发送的书籍词以及书籍词的排列顺序,按照所述书籍词的排列顺序展示接收到的书籍词。
在此提供的算法或显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明实施例也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本发明并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明实施例的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。上述实施例中的步骤,除有特殊说明外,不应理解为对执行顺序的限定。
本发明公开了:A1.一种基于电子书的搜索方法,包括:
接收客户端发送的目标搜索词;
确定与所述目标搜索词对应的至少一个共现搜索词;
针对于任一共现搜索词,获取该共现搜索词关联的书籍词;
将所述书籍词发送至所述客户端,以供在所述客户端展示所述书籍词。
A2.根据A1所述的方法,其中,在所述获取该共现搜索词关联的书籍词之后,所述方法还包括:
针对于任一书籍词,计算该书籍词与所述目标搜索词的语义相似度;
根据计算获得的书籍词与所述目标搜索词的语义相似度,从获取的书籍词中提取目标书籍词;
则所述将所述书籍词发送至所述客户端,以供在所述客户端展示所述书籍词进一步包括:
将所述目标书籍词发送至所述客户端,以供在所述客户端展示所述目标书籍词。
A3.根据A2所述的方法,其中,所述计算该书籍词与所述目标搜索词的语义相似度进一步包括:
计算该书籍词与该书籍词关联的共现搜索词的关联度,以及计算该书籍词关联的共现搜索词与所述目标搜索词的共现率;
根据所述关联度以及所述共现率,计算该书籍词与所述目标搜索词的语义相似度。
A4.根据A3所述的方法,其中,所述根据所述关联度以及所述共现率,计算该书籍词与所述目标搜索词的语义相似度进一步包括:
将所述关联度与所述共现率的乘积,作为该书籍词与所述目标搜索词的语义相似度。
A5.根据A2-A4中任一项所述的方法,其中,在所述将所述目标书籍词发送至所述客户端之前,所述方法还包括:确定目标书籍词的排列顺序;
则所述将所述目标书籍词发送至所述客户端,以供在所述客户端展示所述目标书籍词进一步包括:将所述目标书籍词以及目标书籍词的排列顺序发送至所述客户端。
A6.根据A5所述的方法,其中,所述确定目标书籍词的排列顺序进一步包括:
根据目标书籍词与所述目标搜索词的语义相似度,确定目标书籍词的排列顺序。
A7.根据A1-A6中任一项所述的方法,其中,所述确定与所述目标搜索词对应的至少一个共现搜索词进一步包括:
将所述目标搜索词输入至预先训练好的共现搜索词识别模型中;
获取所述共现搜索词识别模型输出的与所述目标搜索词对应的至少一个共现搜索词。
A8.根据A1-A7中任一项所述的方法,其中,所述获取该共现搜索词关联的书籍词进一步包括:
根据用户历史搜索数据,获取该共现搜索词关联的书籍词。
A9.根据A1-A8中任一项所述的方法,其中,在所述获取该共现搜索词关联的书籍词之后,所述方法还包括:
计算书籍词与所述目标搜索词的字面相似度;
从获取的书籍词中提取与所述目标搜索词的字面相似度小于或等于预设相似度阈值的目标书籍词。
A10.根据A9所述的方法,其中,所述计算书籍词与所述目标搜索词的字面相似度;从获取的书籍词中提取与所述目标搜索词的字面相似度小于或等于预设相似度阈值的目标书籍词进一步包括:
从候选书籍词集合中选取一书籍词;
计算选取的该书籍词与所述目标搜索词的字面相似度,以及计算选取的该书籍词与目标书籍词集合中的每个目标书籍词的字面相似度;
判断选取的该书籍词与所述目标搜索词的字面相似度,以及选取的该书籍词与目标书籍词集合中的每个目标书籍词的字面相似度是否均小于或等于预设相似度阈值;
若是,将选取的该书籍词加入所述目标书籍词集合中,并将选取的该书籍词从所述候选书籍词集合中剔除,以及执行所述从候选书籍词集合中选取一书籍词的步骤;
若否,将选取的该书籍词从所述候选书籍词集合中剔除,以及执行所述从候选书籍词集合中选取一书籍词的步骤。
A11.根据A10所述的方法,其中,所述从候选书籍词集合中选取一书籍词进一步包括:
从候选书籍词集合中选取与所述目标搜索词的语义相似度最大的书籍词。
A12.根据A9-A11中任一项所述的方法,其中,所述计算书籍词与所述目标搜索词的字面相似度进一步包括:
计算书籍词与所述目标搜索词的编辑距离。
A13.根据A10或A11所述的方法,其中,在所述从候选书籍词集合中选取一书籍词之前,所述方法还包括:
判断当前所述候选书籍词集合中是否包含有书籍词;
若当前所述候选书籍词集合中包含有书籍词,则执行所述从候选书籍词集合中选取一书籍词的步骤;
若当前所述候选书籍词集合中未包含有书籍词,则判断当前所述目标书籍词集合中的书籍词的数量是否大于或等于预设数量阈值;
若当前所述目标书籍词集合中的书籍词的数量小于预设数量阈值,则获取填充书籍词,并将所述填充书籍词加入所述候选书籍词集合中,并执行所述从候选书籍词集合中选取一书籍词的步骤。
A14.根据A13所述的方法,其中,所述获取填充书籍词进一步包括:
针对于任一剔除的书籍词,确定该剔除的书籍词关联的共现搜索词,并从该共现搜索词关联的书籍词中获取填充书籍词;其中,所述填充书籍词与剔除的书籍词不同。
A15.根据A13所述的方法,其中,所述获取填充书籍词进一步包括:
根据用户历史搜索数据,提取热搜词;
从所述热搜词中获取填充书籍词。
本发明还公开了:B16.一种基于电子书的搜索方法,包括:
获取用户输入的目标搜索词;
将所述目标搜索词发送至服务端,以供所述服务端确定与所述目标搜索词对应的至少一个共现搜索词,以及针对于任一共现搜索词,获取该共现搜索词关联的书籍词;
接收服务端发送的书籍词,并展示接收到的书籍词。
B17.根据B16所述的方法,其中,所述接收服务端发送的书籍词,并展示接收到的书籍词进一步包括:
接收服务端发送的书籍词以及书籍词的排列顺序,按照所述书籍词的排列顺序展示接收到的书籍词。
本发明还公开了:C18.一种服务端,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如下操作:
接收客户端发送的目标搜索词;
确定与所述目标搜索词对应的至少一个共现搜索词;
针对于任一共现搜索词,获取该共现搜索词关联的书籍词;
将所述书籍词发送至所述客户端,以供在所述客户端展示所述书籍词。
C19.根据C18所述的服务端,其中,所述可执行指令使所述处理器执行如下操作:
在所述获取该共现搜索词关联的书籍词之后,针对于任一书籍词,计算该书籍词与所述目标搜索词的语义相似度;
根据计算获得的书籍词与所述目标搜索词的语义相似度,从获取的书籍词中提取目标书籍词;
将所述目标书籍词发送至所述客户端,以供在所述客户端展示所述目标书籍词。
C20.根据C19所述的服务端,其中,所述可执行指令使所述处理器执行如下操作:
计算该书籍词与该书籍词关联的共现搜索词的关联度,以及计算该书籍词关联的共现搜索词与所述目标搜索词的共现率;
根据所述关联度以及所述共现率,计算该书籍词与所述目标搜索词的语义相似度。
C21.根据C20所述的服务端,其中,所述可执行指令使所述处理器执行如下操作:
将所述关联度与所述共现率的乘积,作为该书籍词与所述目标搜索词的语义相似度。
C22.根据C19-C21中任一项所述的服务端,其中,所述可执行指令使所述处理器执行如下操作:
在所述将所述书籍词发送至所述客户端之前,确定书籍词的排列顺序;
将所述书籍词以及书籍词的排列顺序发送至所述客户端。
C23.根据C22所述的服务端,其中,所述可执行指令使所述处理器执行如下操作:
根据书籍词与所述目标搜索词的语义相似度,确定书籍词的排列顺序。
C24.根据C18-C23中任一项所述的服务端,其中,所述可执行指令使所述处理器执行如下操作:
将所述目标搜索词输入至预先训练好的共现搜索词识别模型中;
获取所述共现搜索词识别模型输出的与所述目标搜索词对应的至少一个共现搜索词。
C25.根据C18-C24中任一项所述的服务端,其中,所述可执行指令使所述处理器执行如下操作:
根据用户历史搜索数据,获取该共现搜索词关联的书籍词。
C26.根据C18-C25中任一项所述的服务端,其中,所述可执行指令使所述处理器执行如下操作:
在所述获取该共现搜索词关联的书籍词之后,计算书籍词与所述目标搜索词的字面相似度;
从获取的书籍词中提取与所述目标搜索词的字面相似度小于或等于预设相似度阈值的目标书籍词。
C27.根据C26所述的服务端,其中,所述可执行指令使所述处理器执行如下操作:
从候选书籍词集合中选取一书籍词;
计算选取的该书籍词与所述目标搜索词的字面相似度,以及计算选取的该书籍词与目标书籍词集合中的每个目标书籍词的字面相似度;
判断选取的该书籍词与所述目标搜索词的字面相似度,以及选取的该书籍词与目标书籍词集合中的每个目标书籍词的字面相似度是否均小于或等于预设相似度阈值;
若是,将选取的该书籍词加入所述目标书籍词集合中,并将选取的该书籍词从所述候选书籍词集合中剔除,以及执行所述从候选书籍词集合中选取一书籍词的步骤;
若否,将选取的该书籍词从所述候选书籍词集合中剔除,以及执行所述从候选书籍词集合中选取一书籍词的步骤。
C28.根据C27所述的服务端,其中,所述可执行指令使所述处理器执行如下操作:
从候选书籍词集合中选取与所述目标搜索词的语义相似度最大的书籍词。
C29.根据C26-C28中任一项所述的服务端,其中,所述可执行指令使所述处理器执行如下操作:
计算书籍词与所述目标搜索词的编辑距离。
C30.根据C27或C28所述的服务端,其中,所述可执行指令使所述处理器执行如下操作:
在所述从候选书籍词集合中选取一书籍词之前,判断当前所述候选书籍词集合中是否包含有书籍词;
若当前所述候选书籍词集合中包含有书籍词,则执行所述从候选书籍词集合中选取一书籍词的步骤;
若当前所述候选书籍词集合中未包含有书籍词,则判断当前所述目标书籍词集合中的书籍词的数量是否大于或等于预设数量阈值;
若当前所述目标书籍词集合中的书籍词的数量小于预设数量阈值,则获取填充书籍词,并将所述填充书籍词加入所述候选书籍词集合中,并执行所述从候选书籍词集合中选取一书籍词的步骤。
C31.根据C30所述的服务端,其中,所述可执行指令使所述处理器执行如下操作:
针对于任一剔除的书籍词,确定该剔除的书籍词关联的共现搜索词,并从该共现搜索词关联的书籍词中获取填充书籍词;其中,所述填充书籍词与剔除的书籍词不同。
C32.根据C30所述的服务端,其中,所述可执行指令使所述处理器执行如下操作:
根据用户历史搜索数据,提取热搜词;
从所述热搜词中获取填充书籍词。
本发明还公开了:D33.一种客户端,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如下操作:
获取用户输入的目标搜索词;
将所述目标搜索词发送至服务端,以供所述服务端确定与所述目标搜索词对应的至少一个共现搜索词,以及针对于任一共现搜索词,获取该共现搜索词关联的书籍词;
接收服务端发送的书籍词,并展示接收到的书籍词。
D34.根据D33所述的客户端,其中,所述可执行指令使所述处理器执行如下操作:
接收服务端发送的书籍词以及书籍词的排列顺序,按照所述书籍词的排列顺序展示接收到的书籍词。
本发明还公开了:E35.一种基于电子书的搜索系统,包括如C18-C32任一项所述的服务端,以及如D33或D34所述的客户端。
本发明还公开了:F36.一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如A1-A15中任一项所述的基于电子书的搜索方法对应的操作。
本发明还公开了:G37.一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如B16或B17所述的基于电子书的搜索方法对应的操作。
Claims (10)
1.一种基于电子书的搜索方法,包括:
接收客户端发送的目标搜索词;
确定与所述目标搜索词对应的至少一个共现搜索词;
针对于任一共现搜索词,获取该共现搜索词关联的书籍词;
将所述书籍词发送至所述客户端,以供在所述客户端展示所述书籍词。
2.根据权利要求1所述的方法,其中,在所述获取该共现搜索词关联的书籍词之后,所述方法还包括:
针对于任一书籍词,计算该书籍词与所述目标搜索词的语义相似度;
根据计算获得的书籍词与所述目标搜索词的语义相似度,从获取的书籍词中提取目标书籍词;
则所述将所述书籍词发送至所述客户端,以供在所述客户端展示所述书籍词进一步包括:
将所述目标书籍词发送至所述客户端,以供在所述客户端展示所述目标书籍词。
3.根据权利要求2所述的方法,其中,所述计算该书籍词与所述目标搜索词的语义相似度进一步包括:
计算该书籍词与该书籍词关联的共现搜索词的关联度,以及计算该书籍词关联的共现搜索词与所述目标搜索词的共现率;
根据所述关联度以及所述共现率,计算该书籍词与所述目标搜索词的语义相似度。
4.根据权利要求3所述的方法,其中,所述根据所述关联度以及所述共现率,计算该书籍词与所述目标搜索词的语义相似度进一步包括:
将所述关联度与所述共现率的乘积,作为该书籍词与所述目标搜索词的语义相似度。
5.根据权利要求2-4中任一项所述的方法,其中,在所述将所述目标书籍词发送至所述客户端之前,所述方法还包括:确定目标书籍词的排列顺序;
则所述将所述目标书籍词发送至所述客户端,以供在所述客户端展示所述目标书籍词进一步包括:将所述目标书籍词以及目标书籍词的排列顺序发送至所述客户端。
6.一种基于电子书的搜索方法,包括:
获取用户输入的目标搜索词;
将所述目标搜索词发送至服务端,以供所述服务端确定与所述目标搜索词对应的至少一个共现搜索词,以及针对于任一共现搜索词,获取该共现搜索词关联的书籍词;
接收服务端发送的书籍词,并展示接收到的书籍词。
7.一种服务端,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如下操作:
接收客户端发送的目标搜索词;
确定与所述目标搜索词对应的至少一个共现搜索词;
针对于任一共现搜索词,获取该共现搜索词关联的书籍词;
将所述书籍词发送至所述客户端,以供在所述客户端展示所述书籍词。
8.一种客户端,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如下操作:
获取用户输入的目标搜索词;
将所述目标搜索词发送至服务端,以供所述服务端确定与所述目标搜索词对应的至少一个共现搜索词,以及针对于任一共现搜索词,获取该共现搜索词关联的书籍词;
接收服务端发送的书籍词,并展示接收到的书籍词。
9.一种基于电子书的搜索系统,包括如权利要求7所述的服务端,以及如权利要求8所述的客户端。
10.一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如权利要求1-6中任一项所述的基于电子书的搜索方法对应的操作。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110852096.4A CN113486071B (zh) | 2021-07-27 | 2021-07-27 | 基于电子书的搜索方法、服务端、客户端及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110852096.4A CN113486071B (zh) | 2021-07-27 | 2021-07-27 | 基于电子书的搜索方法、服务端、客户端及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113486071A true CN113486071A (zh) | 2021-10-08 |
CN113486071B CN113486071B (zh) | 2022-04-26 |
Family
ID=77944108
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110852096.4A Active CN113486071B (zh) | 2021-07-27 | 2021-07-27 | 基于电子书的搜索方法、服务端、客户端及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113486071B (zh) |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1679623A2 (en) * | 2005-01-10 | 2006-07-12 | Xerox Corporation | Method and apparatus for detecting a table of contents and reference determination |
WO2008139568A1 (ja) * | 2007-05-08 | 2008-11-20 | Fujitsu Limited | キーワード出力プログラム、キーワード出力装置およびキーワード出力方法 |
JP2013020439A (ja) * | 2011-07-11 | 2013-01-31 | Nec Corp | 同義語抽出システム、方法およびプログラム |
CN103258025A (zh) * | 2013-05-08 | 2013-08-21 | 百度在线网络技术(北京)有限公司 | 生成共现关键词的方法、提供关联搜索词的方法以及系统 |
CN103678668A (zh) * | 2013-12-24 | 2014-03-26 | 乐视网信息技术(北京)股份有限公司 | 相关搜索结果的提示方法、服务器及系统 |
CN106294618A (zh) * | 2016-08-01 | 2017-01-04 | 北京百度网讯科技有限公司 | 搜索方法及装置 |
CN106571139A (zh) * | 2016-11-09 | 2017-04-19 | 百度在线网络技术(北京)有限公司 | 基于人工智能的语音搜索结果处理方法及装置 |
CN107885875A (zh) * | 2017-11-28 | 2018-04-06 | 北京百度网讯科技有限公司 | 检索词的同义变换方法、装置及服务器 |
CN108415900A (zh) * | 2018-02-05 | 2018-08-17 | 中国科学院信息工程研究所 | 一种基于多级共现关系词图的可视化文本信息发现方法及系统 |
CN110020163A (zh) * | 2017-12-15 | 2019-07-16 | 百度在线网络技术(北京)有限公司 | 基于人机交互的搜索方法、装置、计算机设备和存储介质 |
CN110032675A (zh) * | 2019-03-13 | 2019-07-19 | 平安城市建设科技(深圳)有限公司 | 基于共现词的检索方法、装置、设备及可读存储介质 |
CN111061842A (zh) * | 2019-12-26 | 2020-04-24 | 上海众源网络有限公司 | 一种相似文本确定方法及装置 |
CN111680207A (zh) * | 2020-03-11 | 2020-09-18 | 华中科技大学鄂州工业技术研究院 | 一种用于确定用户搜索意图的方法及装置 |
CN112835923A (zh) * | 2021-02-02 | 2021-05-25 | 中国工商银行股份有限公司 | 一种相关检索方法、装置和设备 |
-
2021
- 2021-07-27 CN CN202110852096.4A patent/CN113486071B/zh active Active
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1679623A2 (en) * | 2005-01-10 | 2006-07-12 | Xerox Corporation | Method and apparatus for detecting a table of contents and reference determination |
WO2008139568A1 (ja) * | 2007-05-08 | 2008-11-20 | Fujitsu Limited | キーワード出力プログラム、キーワード出力装置およびキーワード出力方法 |
JP2013020439A (ja) * | 2011-07-11 | 2013-01-31 | Nec Corp | 同義語抽出システム、方法およびプログラム |
CN103258025A (zh) * | 2013-05-08 | 2013-08-21 | 百度在线网络技术(北京)有限公司 | 生成共现关键词的方法、提供关联搜索词的方法以及系统 |
CN103678668A (zh) * | 2013-12-24 | 2014-03-26 | 乐视网信息技术(北京)股份有限公司 | 相关搜索结果的提示方法、服务器及系统 |
CN106294618A (zh) * | 2016-08-01 | 2017-01-04 | 北京百度网讯科技有限公司 | 搜索方法及装置 |
CN106571139A (zh) * | 2016-11-09 | 2017-04-19 | 百度在线网络技术(北京)有限公司 | 基于人工智能的语音搜索结果处理方法及装置 |
CN107885875A (zh) * | 2017-11-28 | 2018-04-06 | 北京百度网讯科技有限公司 | 检索词的同义变换方法、装置及服务器 |
CN110020163A (zh) * | 2017-12-15 | 2019-07-16 | 百度在线网络技术(北京)有限公司 | 基于人机交互的搜索方法、装置、计算机设备和存储介质 |
CN108415900A (zh) * | 2018-02-05 | 2018-08-17 | 中国科学院信息工程研究所 | 一种基于多级共现关系词图的可视化文本信息发现方法及系统 |
CN110032675A (zh) * | 2019-03-13 | 2019-07-19 | 平安城市建设科技(深圳)有限公司 | 基于共现词的检索方法、装置、设备及可读存储介质 |
CN111061842A (zh) * | 2019-12-26 | 2020-04-24 | 上海众源网络有限公司 | 一种相似文本确定方法及装置 |
CN111680207A (zh) * | 2020-03-11 | 2020-09-18 | 华中科技大学鄂州工业技术研究院 | 一种用于确定用户搜索意图的方法及装置 |
CN112835923A (zh) * | 2021-02-02 | 2021-05-25 | 中国工商银行股份有限公司 | 一种相关检索方法、装置和设备 |
Also Published As
Publication number | Publication date |
---|---|
CN113486071B (zh) | 2022-04-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109189991B (zh) | 重复视频识别方法、装置、终端及计算机可读存储介质 | |
WO2022068196A1 (zh) | 跨模态的数据处理方法、装置、存储介质以及电子装置 | |
US9576054B2 (en) | Search method, apparatus and system based on rewritten search term | |
CN110704603B (zh) | 一种通过资讯发掘当前热点事件的方法和装置 | |
EP2783310A1 (en) | Image searching | |
CN105740268A (zh) | 一种信息推送方法和装置 | |
CN110263122B (zh) | 一种关键词获取方法、装置及计算机可读存储介质 | |
CN110990533B (zh) | 确定查询文本所对应标准文本的方法及装置 | |
WO2017088496A1 (zh) | 一种搜索推荐方法、装置、设备及计算机存储介质 | |
CN104142945B (zh) | 一种基于查询词的检索方法及装置 | |
CN110968765A (zh) | 书籍搜索方法、计算设备及计算机存储介质 | |
WO2023029350A1 (zh) | 基于点击行为预测的信息推送方法及装置 | |
CN111881269A (zh) | 推荐对象确定方法、装置、电子设备及存储介质 | |
CN110990701B (zh) | 书籍搜索方法、计算设备及计算机存储介质 | |
CN111125543B (zh) | 书籍推荐排序模型的训练方法、计算设备及存储介质 | |
CN112182126A (zh) | 用于确定匹配度的模型训练方法、装置、电子设备及可读存储介质 | |
CN111625619B (zh) | 查询省略方法、装置、计算机可读介质及电子设备 | |
CN113486071B (zh) | 基于电子书的搜索方法、服务端、客户端及系统 | |
CN113656549B (zh) | 电子书的内容搜索方法、电子设备及计算机存储介质 | |
WO2016101737A1 (zh) | 搜索查询方法和装置 | |
CN113626483B (zh) | 一种填写表单的前端缓存方法、系统、设备及存储介质 | |
CN115757994A (zh) | 商户名确定方法、装置、设备、介质及产品 | |
CN113204665B (zh) | 图像检索方法、装置、电子设备及计算机可读存储介质 | |
CN112364258B (zh) | 基于图谱的推荐方法、系统、存储介质及电子设备 | |
CN111597368B (zh) | 一种数据处理方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |