CN113282834A - 基于移动互联网数据深度挖掘的网页搜索智能排序方法、系统和计算机存储介质 - Google Patents
基于移动互联网数据深度挖掘的网页搜索智能排序方法、系统和计算机存储介质 Download PDFInfo
- Publication number
- CN113282834A CN113282834A CN202110664490.5A CN202110664490A CN113282834A CN 113282834 A CN113282834 A CN 113282834A CN 202110664490 A CN202110664490 A CN 202110664490A CN 113282834 A CN113282834 A CN 113282834A
- Authority
- CN
- China
- Prior art keywords
- user
- search
- picture
- imported
- text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9538—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/60—Analysis of geometric attributes
- G06T7/62—Analysis of geometric attributes of area, perimeter, diameter or volume
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10004—Still image; Photographic image
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Multimedia (AREA)
- Geometry (AREA)
- Probability & Statistics with Applications (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开基于移动互联网数据深度挖掘的网页搜索智能排序方法、系统和计算机存储介质,通过将用户需要搜索的图片导入至网页搜索引擎,同时通过用户选择搜索方式,若用户选择图片搜索方式,则分析计算用户导入搜索图片的综合匹配度符合系数,对比得到网页搜索引擎中各图片的综合匹配度符合系数差值,并按照综合匹配度符合系数差值从小到大顺序依次进行排序;若用户选择文本搜索方式,则分析计算网页搜索引擎中各文本的综合匹配度符合系数,并按照综合匹配度符合系数从大到小的顺序依次进行排序,从而实现多种搜索方式选择的功能,满足用户的实际搜索需求,提高网页搜索引擎的智能排序水平。
Description
技术领域
本发明涉及网页搜索排序技术领域,涉及到基于移动互联网数据深度挖掘的网页搜索智能排序方法、系统和计算机存储介质。
背景技术
随着互联网技术的发展和普及,网页搜索几乎已经成为现代人闲余生活中获取有效信息的必备途经。随着网页搜索引擎在人们生活中使用频率的提高,对网页搜索内容排序管理研究也更加重要。
目前,现有的网页图片搜索排序管理基本根据图片上传时间进行排序,这样方式虽然简洁、方便,但是无法实现网页搜索引擎中图片排序管理的智能化水平,导致用户需求的图片被深埋在众多图片中难以快速查找,从而增加用户查找类似图片的时间,降低用户搜索需求图片的效率,同时现有的网页图片搜索无法实现多种搜索方式的选择,从而不能满足用户的实际搜索需求,减少用户对网页图片搜索的体验感和满意感,进而影响网页搜索引擎的智能排序水平,为了解决以上问题,现设计基于移动互联网数据深度挖掘的网页搜索智能排序方法、系统和计算机存储介质。
发明内容
本发明的目的在于提供基于移动互联网数据深度挖掘的网页搜索智能排序方法、系统和计算机存储介质,本发明通过将用户需要搜索的图片导入至网页搜索引擎,若用户选择图片搜索方式,则提取用户导入搜索图片中各特征点区域,分析用户搜索图片中各特征点区域的面积占比,同时获取用户导入搜索图片的文字信息中各主题内各有效词,计算用户导入搜索图片的文字信息中各主题的权重系数,筛选用户导入搜索图片的文字信息中权重系数最大的主题,计算用户导入搜索图片的综合匹配度符合系数,对比得到网页搜索引擎中各图片的综合匹配度符合系数差值,并按照差值从小到大顺序依次进行排序;若用户选择文本搜索方式,则获得用户导入搜索图片中各类别图像面积,计算用户导入搜索图片中各类别图像的权重比例,同时获取用户导入搜索图片中各类别图像对应的关键词,统计网页搜索引擎中各文本内容内各关键词的词频,计算网页搜索引擎中各文本的综合匹配度符合系数,并按照综合匹配度符合系数从大到小的顺序依次进行排序,解决了背景技术中存在的问题。
本发明的目的可以通过以下技术方案实现:
第一方面,本发明提供基于移动互联网数据深度挖掘的网页搜索智能排序方法,包括如下步骤:
S1、用户搜索图片导入:通过图片导入模块将用户需要搜索的图片进行导入,按照设定的图片格式和规格导入至网页搜索引擎,并通过用户选择网页搜索引擎的搜索方式,若用户选择图片搜索方式,则进行步骤S2,若用户选择文本搜索方式,则进行步骤S7;
S2、图片特征点提取:通过特征点提取模块对用户导入搜索图片中各特征点进行提取,得到用户导入搜索图片中各特征点区域,并获取用户导入搜索图片中各特征点区域的面积;
S3、区域面积占比分析:通过面积占比分析模块提取网页搜索引擎中图片导入的设定规格面积,计算用户搜索图片中各特征点区域的面积占比,统计用户搜索图片中各特征点区域的面积占比;
S4、图片文字信息获取:通过文字信息提取模块对用户导入搜索图片的文字信息进行提取,得到用户导入搜索图片的文字信息,并按照文本位置先后顺序依次提取用户导入搜索图片的文字信息中各有效词;
S5、搜索图片主题统计:通过图片主题获取模块对用户导入搜索图片的文字信息中各有效词对应的主题进行获取,分别获取用户导入搜索图片的文字信息中各有效词对应的主题,统计用户导入搜索图片的文字信息中各主题内各有效词,并获取用户导入搜索图片的文字信息中各主题内各有效词所处文本位置编号,计算用户导入搜索图片的文字信息中各主题的权重系数;
S6、图片匹配度符合系数分析:通过分析服务器将用户导入搜索图片的文字信息中各主题的权重系数进行对比,筛选用户导入搜索图片的文字信息中权重系数最大的主题,并将该主题记为用户导入搜索图片的文字信息对应主题,同时提取用户导入搜索图片的文字信息对应主题的权重系数ξmax,计算用户导入搜索图片的综合匹配度符合系数,将用户导入搜索图片的综合匹配度符合系数与网页搜索引擎中各图片的综合匹配度符合系数进行对比,统计网页搜索引擎中各图片的综合匹配度符合系数差值,按照综合匹配度符合系数差值从小到大的顺序依次对网页搜索引擎中各图片进行排序;
S7、类别图像面积获取:通过图片处理模块将用户导入搜索图片进行分割处理,获得用户导入搜索图片中各类别图像面积,构成用户导入搜索图片中各类别图像面积集合S′(s′1,s′2,...,s′r,...,s′l),s′r表示为用户导入搜索图片中第r个类别图像面积,计算用户导入搜索图片中各类别图像的权重比例;
S8、类别图像关键词获取:通过关键词获取模块对用户导入搜索图片中各类别图像对应的关键词进行获取,统计用户导入搜索图片中各类别图像对应的关键词;
S9、文本关键词词频统计:通过关键词词频统计模块对网页搜索引擎中各文本内容内各关键词的词频进行统计,分别构成网页搜索引擎中各文本内容内各关键词的词频集合fpB(fpb1,fpb2,...,fpbr,...,fpbl),fpbr表示为网页搜索引擎中第p个文本内容内第r个关键词的词频,p=1,2,...,q;
S10、文本匹配度符合系数分析:通过分析服务器提取存储数据库中存储的文本关键词词频对应的权重修正系数,计算网页搜索引擎中各文本的综合匹配度符合系数,并按照综合匹配度符合系数从大到小的顺序依次对网页搜索引擎中各文本进行排序。
进一步地,所述步骤S2中包括统计用户导入搜索图片中各特征点区域的面积,构成用户导入搜索图片中各特征点区域的面积集合S(s1,s2,...,si,...,sn),si表示为用户导入搜索图片中第i个特征点区域的面积。
进一步地,所述用户搜索图片中各特征点区域的面积占比计算公式为ki表示为用户搜索图片中第i个特征点区域的面积占比,si表示为用户导入搜索图片中第i个特征点区域的面积,S设定表示为网页搜索引擎中图片导入的设定规格面积。
进一步地,所述步骤S5中包括构成用户导入搜索图片的文字信息中各主题内各有效词所处文本位置编号集合WjA(wja1,wja2,...,wjaf,....,wjav),wjaf表示为用户导入搜索图片的文字信息中第j个主题内第f个有效词所处文本位置编号,j=1,2,...,m。
进一步地,所述用户导入搜索图片的文字信息中各主题的权重系数计算公式为ξj表示为用户导入搜索图片的文字信息中第j个主题的权重系数,λf表示为用户导入搜索图片的文字信息中第f个有效词所处位置的影响补偿系数,wjaf表示为用户导入搜索图片的文字信息中第j个主题内第f个有效词所处文本位置编号,j=1,2,...,m,W总表示为用户导入搜索图片的文字信息中有效词所处文本位置的总编号数量。
进一步地,所述用户导入搜索图片的综合匹配度符合系数计算公式为ψ表示为用户导入搜索图片的综合匹配度符合系数,ξmax表示为用户导入搜索图片的文字信息对应主题的权重系数,α表示为图片特征点区域面积占比对应的权重修正系数,n表示为用户导入搜索图片中特征点的总数量,ki表示为用户搜索图片中第i个特征点区域的面积占比。
进一步地,所述网页搜索引擎中各文本的综合匹配度符合系数计算公式为ψ′p表示为网页搜索引擎中第p个文本的综合匹配度符合系数,β表示为文本关键词词频对应的权重修正系数,l表示为用户导入搜索图片中提取的关键词数量,κ′r表示为用户导入搜索图片中第r个类别图像的权重比例,fpbr表示为网页搜索引擎中第p个文本内容内第r个关键词的词频,p=1,2,...,q。
第二方面,本发明还提供基于移动互联网数据深度挖掘的网页搜索智能排序系统,包括图片导入模块、特征点提取模块、面积占比分析模块、文字信息提取模块、图片主题获取模块、图片处理模块、关键词获取模块、关键词词频统计模块、分析服务器和存储数据库;
所述图片导入模块分别与特征点提取模块和图片处理模块连接,面积占比分析模块分别与特征点提取模块和分析服务器连接,图片主题获取模块分别与文字信息提取模块和分析服务器连接,关键词获取模块分别与图片处理模块和关键词词频统计模块连接,分析服务器分别与关键词词频统计模块和存储数据库连接。
第三方面,本发明还提供一种计算机存储介质,所述计算机存储介质烧录有计算机程序,所述计算机程序在服务器的内存中运行时实现上述本发明所述的方法。
有益效果:
(1)本发明提供的基于移动互联网数据深度挖掘的网页搜索智能排序方法、系统和计算机存储介质,通过将用户需要搜索的图片导入至网页搜索引擎,若用户选择图片搜索方式,则提取用户导入搜索图片中各特征点区域,分析用户搜索图片中各特征点区域的面积占比,为后期计算用户导入搜索图片的综合匹配度符合系数提供可靠的参考数据,同时获取用户导入搜索图片的文字信息中各主题内各有效词,计算用户导入搜索图片的文字信息中各主题的权重系数,筛选用户导入搜索图片的文字信息中权重系数最大的主题,计算用户导入搜索图片的综合匹配度符合系数,对比得到网页搜索引擎中各图片的综合匹配度符合系数差值,并按照差值从小到大顺序依次进行排序,从而实现网页搜索引擎中图片排序管理的智能化水平,确保用户需求的图片能够快速查找,减少用户查找类似图片的时间,提供用户搜索需求图片的效率。
(2)本发明中若用户选择文本搜索方式,则获得用户导入搜索图片中各类别图像面积,计算用户导入搜索图片中各类别图像的权重比例,为后期计算网页搜索引擎中各文本的综合匹配度符合系数提供可靠的参考依据,同时获取用户导入搜索图片中各类别图像对应的关键词,统计网页搜索引擎中各文本内容内各关键词的词频,计算网页搜索引擎中各文本的综合匹配度符合系数,并按照综合匹配度符合系数从大到小的顺序依次进行排序,从而实现多种搜索方式选择的功能,满足用户的实际搜索需求,增加用户对网页图片搜索的体验感和满意感,进而提高网页搜索引擎的智能排序水平。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明的方法步骤示意图;
图2为本发明的模块连接结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
请参阅图1所示,本发明的第一方面提供基于移动互联网数据深度挖掘的网页搜索智能排序方法,包括如下步骤:
S1、用户搜索图片导入:通过图片导入模块将用户需要搜索的图片进行导入,按照设定的图片格式和规格导入至网页搜索引擎,并通过用户选择网页搜索引擎的搜索方式,若用户选择图片搜索方式,则进行步骤S2,若用户选择文本搜索方式,则进行步骤S7。
S2、图片特征点提取:通过特征点提取模块对用户导入搜索图片中各特征点进行提取,得到用户导入搜索图片中各特征点区域,并获取用户导入搜索图片中各特征点区域的面积。
在本实施例中,所述步骤S2中包括统计用户导入搜索图片中各特征点区域的面积,构成用户导入搜索图片中各特征点区域的面积集合S(s1,s2,...,si,...,sn),si表示为用户导入搜索图片中第i个特征点区域的面积。
S3、区域面积占比分析:通过面积占比分析模块提取网页搜索引擎中图片导入的设定规格面积,计算用户搜索图片中各特征点区域的面积占比,统计用户搜索图片中各特征点区域的面积占比。
在本实施例中,所述用户搜索图片中各特征点区域的面积占比计算公式为ki表示为用户搜索图片中第i个特征点区域的面积占比,si表示为用户导入搜索图片中第i个特征点区域的面积,S设定表示为网页搜索引擎中图片导入的设定规格面积。
具体地,本发明通过提取用户导入搜索图片中各特征点区域,分析用户搜索图片中各特征点区域的面积占比,为后期计算用户导入搜索图片的综合匹配度符合系数提供可靠的参考数据。
S4、图片文字信息获取:通过文字信息提取模块对用户导入搜索图片的文字信息进行提取,得到用户导入搜索图片的文字信息,并按照文本位置先后顺序依次提取用户导入搜索图片的文字信息中各有效词。
S5、搜索图片主题统计:通过图片主题获取模块对用户导入搜索图片的文字信息中各有效词对应的主题进行获取,分别获取用户导入搜索图片的文字信息中各有效词对应的主题,统计用户导入搜索图片的文字信息中各主题内各有效词,并获取用户导入搜索图片的文字信息中各主题内各有效词所处文本位置编号,计算用户导入搜索图片的文字信息中各主题的权重系数。
在本实施例中,所述步骤S5中包括构成用户导入搜索图片的文字信息中各主题内各有效词所处文本位置编号集合WjA(wja1,wja2,...,wjaf,....,wjav),wjaf表示为用户导入搜索图片的文字信息中第j个主题内第f个有效词所处文本位置编号,j=1,2,...,m。
在本实施例中,所述用户导入搜索图片的文字信息中各主题的权重系数计算公式为ξj表示为用户导入搜索图片的文字信息中第j个主题的权重系数,λf表示为用户导入搜索图片的文字信息中第f个有效词所处位置的影响补偿系数,wjaf表示为用户导入搜索图片的文字信息中第j个主题内第f个有效词所处文本位置编号,j=1,2,...,m,W总表示为用户导入搜索图片的文字信息中有效词所处文本位置的总编号数量。
S6、图片匹配度符合系数分析:通过分析服务器将用户导入搜索图片的文字信息中各主题的权重系数进行对比,筛选用户导入搜索图片的文字信息中权重系数最大的主题,并将该主题记为用户导入搜索图片的文字信息对应主题,同时提取用户导入搜索图片的文字信息对应主题的权重系数ξmax,计算用户导入搜索图片的综合匹配度符合系数,将用户导入搜索图片的综合匹配度符合系数与网页搜索引擎中各图片的综合匹配度符合系数进行对比,统计网页搜索引擎中各图片的综合匹配度符合系数差值,按照综合匹配度符合系数差值从小到大的顺序依次对网页搜索引擎中各图片进行排序。
在本实施例中,所述用户导入搜索图片的综合匹配度符合系数计算公式为ψ表示为用户导入搜索图片的综合匹配度符合系数,ξmax表示为用户导入搜索图片的文字信息对应主题的权重系数,α表示为图片特征点区域面积占比对应的权重修正系数,n表示为用户导入搜索图片中特征点的总数量,ki表示为用户搜索图片中第i个特征点区域的面积占比。
具体地,本发明通过将用户需要搜索的图片导入至网页搜索引擎,若用户选择图片搜索方式,则提取用户导入搜索图片中各特征点区域,分析用户搜索图片中各特征点区域的面积占比,同时获取用户导入搜索图片的文字信息中各主题内各有效词,计算用户导入搜索图片的文字信息中各主题的权重系数,筛选用户导入搜索图片的文字信息中权重系数最大的主题,计算用户导入搜索图片的综合匹配度符合系数,对比得到网页搜索引擎中各图片的综合匹配度符合系数差值,并按照差值从小到大顺序依次进行排序,从而实现网页搜索引擎中图片排序管理的智能化水平,确保用户需求的图片能够快速查找,减少用户查找类似图片的时间,提供用户搜索需求图片的效率。
S7、类别图像面积获取:通过图片处理模块将用户导入搜索图片进行分割处理,获得用户导入搜索图片中各类别图像面积,构成用户导入搜索图片中各类别图像面积集合S′(s′1,s′2,...,s′r,...,s′l),s′r表示为用户导入搜索图片中第r个类别图像面积,计算用户导入搜索图片中各类别图像的权重比例。
具体地,本发明通过获得用户导入搜索图片中各类别图像面积,计算用户导入搜索图片中各类别图像的权重比例,为后期计算网页搜索引擎中各文本的综合匹配度符合系数提供可靠的参考依据。
S8、类别图像关键词获取:通过关键词获取模块对用户导入搜索图片中各类别图像对应的关键词进行获取,统计用户导入搜索图片中各类别图像对应的关键词。
S9、文本关键词词频统计:通过关键词词频统计模块对网页搜索引擎中各文本内容内各关键词的词频进行统计,分别构成网页搜索引擎中各文本内容内各关键词的词频集合fpB(fpb1,fpb2,...,fpbr,...,fpbl),fpbr表示为网页搜索引擎中第p个文本内容内第r个关键词的词频,p=1,2,...,q。
S10、文本匹配度符合系数分析:通过分析服务器提取存储数据库中存储的文本关键词词频对应的权重修正系数,计算网页搜索引擎中各文本的综合匹配度符合系数,并按照综合匹配度符合系数从大到小的顺序依次对网页搜索引擎中各文本进行排序。
在本实施例中,所述网页搜索引擎中各文本的综合匹配度符合系数计算公式为ψ′p表示为网页搜索引擎中第p个文本的综合匹配度符合系数,β表示为文本关键词词频对应的权重修正系数,l表示为用户导入搜索图片中提取的关键词数量,κ′r表示为用户导入搜索图片中第r个类别图像的权重比例,fpbr表示为网页搜索引擎中第p个文本内容内第r个关键词的词频,p=1,2,...,q。
具体地,本发明中若用户选择文本搜索方式,则获得用户导入搜索图片中各类别图像面积,计算用户导入搜索图片中各类别图像的权重比例,同时获取用户导入搜索图片中各类别图像对应的关键词,统计网页搜索引擎中各文本内容内各关键词的词频,计算网页搜索引擎中各文本的综合匹配度符合系数,并按照综合匹配度符合系数从大到小的顺序依次进行排序,从而实现多种搜索方式选择的功能,满足用户的实际搜索需求,增加用户对网页图片搜索的体验感和满意感,进而提高网页搜索引擎的智能排序水平。
请参阅图2所示,本发明的第二方面还提供基于移动互联网数据深度挖掘的网页搜索智能排序系统,包括图片导入模块、特征点提取模块、面积占比分析模块、文字信息提取模块、图片主题获取模块、图片处理模块、关键词获取模块、关键词词频统计模块、分析服务器和存储数据库;
所述图片导入模块分别与特征点提取模块和图片处理模块连接,面积占比分析模块分别与特征点提取模块和分析服务器连接,图片主题获取模块分别与文字信息提取模块和分析服务器连接,关键词获取模块分别与图片处理模块和关键词词频统计模块连接,分析服务器分别与关键词词频统计模块和存储数据库连接。
第三方面,本发明还提供一种计算机存储介质,所述计算机存储介质烧录有计算机程序,所述计算机程序在服务器的内存中运行时实现上述本发明所述的方法。
以上内容仅仅是对本发明的构思所作的举例和说明,所属本技术领域的技术人员对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,只要不偏离发明的构思或者超越本权利要求书所定义的范围,均应属于本发明的保护范围。
Claims (10)
1.基于移动互联网数据深度挖掘的网页搜索智能排序方法,其特征在于:包括如下步骤:
S1、用户搜索图片导入:通过图片导入模块将用户需要搜索的图片进行导入,按照设定的图片格式和规格导入至网页搜索引擎,并通过用户选择网页搜索引擎的搜索方式,若用户选择图片搜索方式,则进行步骤S2,若用户选择文本搜索方式,则进行步骤S7;
S2、图片特征点提取:通过特征点提取模块对用户导入搜索图片中各特征点进行提取,得到用户导入搜索图片中各特征点区域,并获取用户导入搜索图片中各特征点区域的面积;
S3、区域面积占比分析:通过面积占比分析模块提取网页搜索引擎中图片导入的设定规格面积,计算用户搜索图片中各特征点区域的面积占比,统计用户搜索图片中各特征点区域的面积占比;
S4、图片文字信息获取:通过文字信息提取模块对用户导入搜索图片的文字信息进行提取,得到用户导入搜索图片的文字信息,并按照文本位置先后顺序依次提取用户导入搜索图片的文字信息中各有效词;
S5、搜索图片主题统计:通过图片主题获取模块对用户导入搜索图片的文字信息中各有效词对应的主题进行获取,分别获取用户导入搜索图片的文字信息中各有效词对应的主题,统计用户导入搜索图片的文字信息中各主题内各有效词,并获取用户导入搜索图片的文字信息中各主题内各有效词所处文本位置编号,计算用户导入搜索图片的文字信息中各主题的权重系数;
S6、图片匹配度符合系数分析:通过分析服务器将用户导入搜索图片的文字信息中各主题的权重系数进行对比,筛选用户导入搜索图片的文字信息中权重系数最大的主题,并将该主题记为用户导入搜索图片的文字信息对应主题,同时提取用户导入搜索图片的文字信息对应主题的权重系数ξmax,计算用户导入搜索图片的综合匹配度符合系数,将用户导入搜索图片的综合匹配度符合系数与网页搜索引擎中各图片的综合匹配度符合系数进行对比,统计网页搜索引擎中各图片的综合匹配度符合系数差值,按照综合匹配度符合系数差值从小到大的顺序依次对网页搜索引擎中各图片进行排序;
S7、类别图像面积获取:通过图片处理模块将用户导入搜索图片进行分割处理,获得用户导入搜索图片中各类别图像面积,构成用户导入搜索图片中各类别图像面积集合S′(s′1,s′2,...,s′r,...,s′l),s′r表示为用户导入搜索图片中第r个类别图像面积,计算用户导入搜索图片中各类别图像的权重比例;
S8、类别图像关键词获取:通过关键词获取模块对用户导入搜索图片中各类别图像对应的关键词进行获取,统计用户导入搜索图片中各类别图像对应的关键词;
S9、文本关键词词频统计:通过关键词词频统计模块对网页搜索引擎中各文本内容内各关键词的词频进行统计,分别构成网页搜索引擎中各文本内容内各关键词的词频集合fpB(fpb1,fpb2,...,fpbr,...,fpbl),fpbr表示为网页搜索引擎中第p个文本内容内第r个关键词的词频,p=1,2,...,q;
S10、文本匹配度符合系数分析:通过分析服务器提取存储数据库中存储的文本关键词词频对应的权重修正系数,计算网页搜索引擎中各文本的综合匹配度符合系数,并按照综合匹配度符合系数从大到小的顺序依次对网页搜索引擎中各文本进行排序。
2.根据权利要求1所述的基于移动互联网数据深度挖掘的网页搜索智能排序方法,其特征在于:所述步骤S2中包括统计用户导入搜索图片中各特征点区域的面积,构成用户导入搜索图片中各特征点区域的面积集合S(s1,s2,...,si,...,sn),si表示为用户导入搜索图片中第i个特征点区域的面积。
4.根据权利要求1所述的基于移动互联网数据深度挖掘的网页搜索智能排序方法,其特征在于:所述步骤S5中包括构成用户导入搜索图片的文字信息中各主题内各有效词所处文本位置编号集合WjA(wja1,wja2,...,wjaf,....,wjav),wjaf表示为用户导入搜索图片的文字信息中第j个主题内第f个有效词所处文本位置编号,j=1,2,...,m。
9.基于移动互联网数据深度挖掘的网页搜索智能排序系统,其特征在于:包括图片导入模块、特征点提取模块、面积占比分析模块、文字信息提取模块、图片主题获取模块、图片处理模块、关键词获取模块、关键词词频统计模块、分析服务器和存储数据库;
所述图片导入模块分别与特征点提取模块和图片处理模块连接,面积占比分析模块分别与特征点提取模块和分析服务器连接,图片主题获取模块分别与文字信息提取模块和分析服务器连接,关键词获取模块分别与图片处理模块和关键词词频统计模块连接,分析服务器分别与关键词词频统计模块和存储数据库连接。
10.一种计算机存储介质,其特征在于:所述计算机存储介质烧录有计算机程序,所述计算机程序在服务器的内存中运行时实现上述权利要求1-8任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110664490.5A CN113282834A (zh) | 2021-06-16 | 2021-06-16 | 基于移动互联网数据深度挖掘的网页搜索智能排序方法、系统和计算机存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110664490.5A CN113282834A (zh) | 2021-06-16 | 2021-06-16 | 基于移动互联网数据深度挖掘的网页搜索智能排序方法、系统和计算机存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113282834A true CN113282834A (zh) | 2021-08-20 |
Family
ID=77284698
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110664490.5A Withdrawn CN113282834A (zh) | 2021-06-16 | 2021-06-16 | 基于移动互联网数据深度挖掘的网页搜索智能排序方法、系统和计算机存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113282834A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114077682A (zh) * | 2022-01-19 | 2022-02-22 | 广州拟实网络科技有限公司 | 一种图像检索智能识别匹配处理方法、系统和存储介质 |
CN115033799A (zh) * | 2022-07-04 | 2022-09-09 | 武汉历历晴川网络科技有限公司 | 一种商品搜索方法、系统及存储介质 |
CN115098804A (zh) * | 2022-06-24 | 2022-09-23 | 武汉楷瀚文化传媒有限公司 | 一种基于大数据分析的网页搜索历史记录智能管理系统 |
CN115309988A (zh) * | 2022-08-10 | 2022-11-08 | 武汉圣男品牌管理有限公司 | 一种网页搜索内容匹配方法、系统及存储介质 |
-
2021
- 2021-06-16 CN CN202110664490.5A patent/CN113282834A/zh not_active Withdrawn
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114077682A (zh) * | 2022-01-19 | 2022-02-22 | 广州拟实网络科技有限公司 | 一种图像检索智能识别匹配处理方法、系统和存储介质 |
CN115098804A (zh) * | 2022-06-24 | 2022-09-23 | 武汉楷瀚文化传媒有限公司 | 一种基于大数据分析的网页搜索历史记录智能管理系统 |
CN115098804B (zh) * | 2022-06-24 | 2023-11-03 | 上海上班族数字科技有限公司 | 一种基于大数据分析的网页搜索历史记录智能管理系统 |
CN115033799A (zh) * | 2022-07-04 | 2022-09-09 | 武汉历历晴川网络科技有限公司 | 一种商品搜索方法、系统及存储介质 |
CN115033799B (zh) * | 2022-07-04 | 2023-01-17 | 郑州易赛诺信息技术有限公司 | 一种商品搜索方法、系统及存储介质 |
CN115309988A (zh) * | 2022-08-10 | 2022-11-08 | 武汉圣男品牌管理有限公司 | 一种网页搜索内容匹配方法、系统及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113282834A (zh) | 基于移动互联网数据深度挖掘的网页搜索智能排序方法、系统和计算机存储介质 | |
US8549016B2 (en) | System and method for providing robust topic identification in social indexes | |
CN108763321B (zh) | 一种基于大规模相关实体网络的相关实体推荐方法 | |
CN110532379B (zh) | 一种基于lstm的用户评论情感分析的电子资讯推荐方法 | |
CN105843850B (zh) | 搜索优化方法和装置 | |
CN105045875B (zh) | 个性化信息检索方法及装置 | |
CN111046225B (zh) | 音频资源处理方法、装置、设备及存储介质 | |
CN101739428B (zh) | 一种对多媒体创建索引的方法 | |
CN106951498A (zh) | 文本聚类方法 | |
CN101587478A (zh) | 图像训练、自动标注、检索方法及装置 | |
CN107679070B (zh) | 一种智能阅读推荐方法与装置、电子设备 | |
CN111008321A (zh) | 基于逻辑回归推荐方法、装置、计算设备、可读存储介质 | |
CN112559684A (zh) | 一种关键词提取及信息检索方法 | |
CN109308324A (zh) | 一种基于手绘风格推荐的图像检索方法及系统 | |
CN102855317A (zh) | 一种基于演示视频的多模式索引方法及系统 | |
KR101224312B1 (ko) | 소셜 네트워킹 서비스 사용자를 위한 친구 추천 방법, 이를 위한 기록 매체 및 이를 이용하는 소셜 네트워킹 서비스 및 서버 | |
CN103927339B (zh) | 知识重组系统和知识重组方法 | |
CN109446399A (zh) | 一种影视实体搜索方法 | |
CN115618014A (zh) | 一种应用大数据技术的标准文献分析管理系统及方法 | |
CN116010552A (zh) | 一种基于关键词词库的工程造价数据解析系统及其方法 | |
CN111078859A (zh) | 一种基于引用次数的作者推荐方法 | |
CN113821679A (zh) | 一种视频帧定位方法、电子设备及计算机可读存储介质 | |
CN108595413A (zh) | 一种基于语义依存树的答案抽取方法 | |
KR20110038247A (ko) | 키워드 추출 장치 및 방법 | |
CN114969545B (zh) | 一种心理健康课程个性化智能推荐系统及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20210820 |
|
WW01 | Invention patent application withdrawn after publication |