CN113282834A - 基于移动互联网数据深度挖掘的网页搜索智能排序方法、系统和计算机存储介质 - Google Patents

基于移动互联网数据深度挖掘的网页搜索智能排序方法、系统和计算机存储介质 Download PDF

Info

Publication number
CN113282834A
CN113282834A CN202110664490.5A CN202110664490A CN113282834A CN 113282834 A CN113282834 A CN 113282834A CN 202110664490 A CN202110664490 A CN 202110664490A CN 113282834 A CN113282834 A CN 113282834A
Authority
CN
China
Prior art keywords
user
search
picture
imported
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202110664490.5A
Other languages
English (en)
Inventor
刘伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan Ruitong Huixing E Commerce Co ltd
Original Assignee
Wuhan Ruitong Huixing E Commerce Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan Ruitong Huixing E Commerce Co ltd filed Critical Wuhan Ruitong Huixing E Commerce Co ltd
Priority to CN202110664490.5A priority Critical patent/CN113282834A/zh
Publication of CN113282834A publication Critical patent/CN113282834A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/60Analysis of geometric attributes
    • G06T7/62Analysis of geometric attributes of area, perimeter, diameter or volume
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • Geometry (AREA)
  • Probability & Statistics with Applications (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开基于移动互联网数据深度挖掘的网页搜索智能排序方法、系统和计算机存储介质,通过将用户需要搜索的图片导入至网页搜索引擎,同时通过用户选择搜索方式,若用户选择图片搜索方式,则分析计算用户导入搜索图片的综合匹配度符合系数,对比得到网页搜索引擎中各图片的综合匹配度符合系数差值,并按照综合匹配度符合系数差值从小到大顺序依次进行排序;若用户选择文本搜索方式,则分析计算网页搜索引擎中各文本的综合匹配度符合系数,并按照综合匹配度符合系数从大到小的顺序依次进行排序,从而实现多种搜索方式选择的功能,满足用户的实际搜索需求,提高网页搜索引擎的智能排序水平。

Description

基于移动互联网数据深度挖掘的网页搜索智能排序方法、系 统和计算机存储介质
技术领域
本发明涉及网页搜索排序技术领域,涉及到基于移动互联网数据深度挖掘的网页搜索智能排序方法、系统和计算机存储介质。
背景技术
随着互联网技术的发展和普及,网页搜索几乎已经成为现代人闲余生活中获取有效信息的必备途经。随着网页搜索引擎在人们生活中使用频率的提高,对网页搜索内容排序管理研究也更加重要。
目前,现有的网页图片搜索排序管理基本根据图片上传时间进行排序,这样方式虽然简洁、方便,但是无法实现网页搜索引擎中图片排序管理的智能化水平,导致用户需求的图片被深埋在众多图片中难以快速查找,从而增加用户查找类似图片的时间,降低用户搜索需求图片的效率,同时现有的网页图片搜索无法实现多种搜索方式的选择,从而不能满足用户的实际搜索需求,减少用户对网页图片搜索的体验感和满意感,进而影响网页搜索引擎的智能排序水平,为了解决以上问题,现设计基于移动互联网数据深度挖掘的网页搜索智能排序方法、系统和计算机存储介质。
发明内容
本发明的目的在于提供基于移动互联网数据深度挖掘的网页搜索智能排序方法、系统和计算机存储介质,本发明通过将用户需要搜索的图片导入至网页搜索引擎,若用户选择图片搜索方式,则提取用户导入搜索图片中各特征点区域,分析用户搜索图片中各特征点区域的面积占比,同时获取用户导入搜索图片的文字信息中各主题内各有效词,计算用户导入搜索图片的文字信息中各主题的权重系数,筛选用户导入搜索图片的文字信息中权重系数最大的主题,计算用户导入搜索图片的综合匹配度符合系数,对比得到网页搜索引擎中各图片的综合匹配度符合系数差值,并按照差值从小到大顺序依次进行排序;若用户选择文本搜索方式,则获得用户导入搜索图片中各类别图像面积,计算用户导入搜索图片中各类别图像的权重比例,同时获取用户导入搜索图片中各类别图像对应的关键词,统计网页搜索引擎中各文本内容内各关键词的词频,计算网页搜索引擎中各文本的综合匹配度符合系数,并按照综合匹配度符合系数从大到小的顺序依次进行排序,解决了背景技术中存在的问题。
本发明的目的可以通过以下技术方案实现:
第一方面,本发明提供基于移动互联网数据深度挖掘的网页搜索智能排序方法,包括如下步骤:
S1、用户搜索图片导入:通过图片导入模块将用户需要搜索的图片进行导入,按照设定的图片格式和规格导入至网页搜索引擎,并通过用户选择网页搜索引擎的搜索方式,若用户选择图片搜索方式,则进行步骤S2,若用户选择文本搜索方式,则进行步骤S7;
S2、图片特征点提取:通过特征点提取模块对用户导入搜索图片中各特征点进行提取,得到用户导入搜索图片中各特征点区域,并获取用户导入搜索图片中各特征点区域的面积;
S3、区域面积占比分析:通过面积占比分析模块提取网页搜索引擎中图片导入的设定规格面积,计算用户搜索图片中各特征点区域的面积占比,统计用户搜索图片中各特征点区域的面积占比;
S4、图片文字信息获取:通过文字信息提取模块对用户导入搜索图片的文字信息进行提取,得到用户导入搜索图片的文字信息,并按照文本位置先后顺序依次提取用户导入搜索图片的文字信息中各有效词;
S5、搜索图片主题统计:通过图片主题获取模块对用户导入搜索图片的文字信息中各有效词对应的主题进行获取,分别获取用户导入搜索图片的文字信息中各有效词对应的主题,统计用户导入搜索图片的文字信息中各主题内各有效词,并获取用户导入搜索图片的文字信息中各主题内各有效词所处文本位置编号,计算用户导入搜索图片的文字信息中各主题的权重系数;
S6、图片匹配度符合系数分析:通过分析服务器将用户导入搜索图片的文字信息中各主题的权重系数进行对比,筛选用户导入搜索图片的文字信息中权重系数最大的主题,并将该主题记为用户导入搜索图片的文字信息对应主题,同时提取用户导入搜索图片的文字信息对应主题的权重系数ξmax,计算用户导入搜索图片的综合匹配度符合系数,将用户导入搜索图片的综合匹配度符合系数与网页搜索引擎中各图片的综合匹配度符合系数进行对比,统计网页搜索引擎中各图片的综合匹配度符合系数差值,按照综合匹配度符合系数差值从小到大的顺序依次对网页搜索引擎中各图片进行排序;
S7、类别图像面积获取:通过图片处理模块将用户导入搜索图片进行分割处理,获得用户导入搜索图片中各类别图像面积,构成用户导入搜索图片中各类别图像面积集合S′(s′1,s′2,...,s′r,...,s′l),s′r表示为用户导入搜索图片中第r个类别图像面积,计算用户导入搜索图片中各类别图像的权重比例;
S8、类别图像关键词获取:通过关键词获取模块对用户导入搜索图片中各类别图像对应的关键词进行获取,统计用户导入搜索图片中各类别图像对应的关键词;
S9、文本关键词词频统计:通过关键词词频统计模块对网页搜索引擎中各文本内容内各关键词的词频进行统计,分别构成网页搜索引擎中各文本内容内各关键词的词频集合fpB(fpb1,fpb2,...,fpbr,...,fpbl),fpbr表示为网页搜索引擎中第p个文本内容内第r个关键词的词频,p=1,2,...,q;
S10、文本匹配度符合系数分析:通过分析服务器提取存储数据库中存储的文本关键词词频对应的权重修正系数,计算网页搜索引擎中各文本的综合匹配度符合系数,并按照综合匹配度符合系数从大到小的顺序依次对网页搜索引擎中各文本进行排序。
进一步地,所述步骤S2中包括统计用户导入搜索图片中各特征点区域的面积,构成用户导入搜索图片中各特征点区域的面积集合S(s1,s2,...,si,...,sn),si表示为用户导入搜索图片中第i个特征点区域的面积。
进一步地,所述用户搜索图片中各特征点区域的面积占比计算公式为
Figure BDA0003116758080000042
ki表示为用户搜索图片中第i个特征点区域的面积占比,si表示为用户导入搜索图片中第i个特征点区域的面积,S设定表示为网页搜索引擎中图片导入的设定规格面积。
进一步地,所述步骤S5中包括构成用户导入搜索图片的文字信息中各主题内各有效词所处文本位置编号集合WjA(wja1,wja2,...,wjaf,....,wjav),wjaf表示为用户导入搜索图片的文字信息中第j个主题内第f个有效词所处文本位置编号,j=1,2,...,m。
进一步地,所述用户导入搜索图片的文字信息中各主题的权重系数计算公式为
Figure BDA0003116758080000041
ξj表示为用户导入搜索图片的文字信息中第j个主题的权重系数,λf表示为用户导入搜索图片的文字信息中第f个有效词所处位置的影响补偿系数,wjaf表示为用户导入搜索图片的文字信息中第j个主题内第f个有效词所处文本位置编号,j=1,2,...,m,W表示为用户导入搜索图片的文字信息中有效词所处文本位置的总编号数量。
进一步地,所述用户导入搜索图片的综合匹配度符合系数计算公式为
Figure BDA0003116758080000051
ψ表示为用户导入搜索图片的综合匹配度符合系数,ξmax表示为用户导入搜索图片的文字信息对应主题的权重系数,α表示为图片特征点区域面积占比对应的权重修正系数,n表示为用户导入搜索图片中特征点的总数量,ki表示为用户搜索图片中第i个特征点区域的面积占比。
进一步地,所述用户导入搜索图片中各类别图像的权重比例计算公式为
Figure BDA0003116758080000052
κ′r表示为用户导入搜索图片中第r个类别图像的权重比例,s′r表示为用户导入搜索图片中第r个类别图像面积。
进一步地,所述网页搜索引擎中各文本的综合匹配度符合系数计算公式为
Figure BDA0003116758080000053
ψ′p表示为网页搜索引擎中第p个文本的综合匹配度符合系数,β表示为文本关键词词频对应的权重修正系数,l表示为用户导入搜索图片中提取的关键词数量,κ′r表示为用户导入搜索图片中第r个类别图像的权重比例,fpbr表示为网页搜索引擎中第p个文本内容内第r个关键词的词频,p=1,2,...,q。
第二方面,本发明还提供基于移动互联网数据深度挖掘的网页搜索智能排序系统,包括图片导入模块、特征点提取模块、面积占比分析模块、文字信息提取模块、图片主题获取模块、图片处理模块、关键词获取模块、关键词词频统计模块、分析服务器和存储数据库;
所述图片导入模块分别与特征点提取模块和图片处理模块连接,面积占比分析模块分别与特征点提取模块和分析服务器连接,图片主题获取模块分别与文字信息提取模块和分析服务器连接,关键词获取模块分别与图片处理模块和关键词词频统计模块连接,分析服务器分别与关键词词频统计模块和存储数据库连接。
第三方面,本发明还提供一种计算机存储介质,所述计算机存储介质烧录有计算机程序,所述计算机程序在服务器的内存中运行时实现上述本发明所述的方法。
有益效果:
(1)本发明提供的基于移动互联网数据深度挖掘的网页搜索智能排序方法、系统和计算机存储介质,通过将用户需要搜索的图片导入至网页搜索引擎,若用户选择图片搜索方式,则提取用户导入搜索图片中各特征点区域,分析用户搜索图片中各特征点区域的面积占比,为后期计算用户导入搜索图片的综合匹配度符合系数提供可靠的参考数据,同时获取用户导入搜索图片的文字信息中各主题内各有效词,计算用户导入搜索图片的文字信息中各主题的权重系数,筛选用户导入搜索图片的文字信息中权重系数最大的主题,计算用户导入搜索图片的综合匹配度符合系数,对比得到网页搜索引擎中各图片的综合匹配度符合系数差值,并按照差值从小到大顺序依次进行排序,从而实现网页搜索引擎中图片排序管理的智能化水平,确保用户需求的图片能够快速查找,减少用户查找类似图片的时间,提供用户搜索需求图片的效率。
(2)本发明中若用户选择文本搜索方式,则获得用户导入搜索图片中各类别图像面积,计算用户导入搜索图片中各类别图像的权重比例,为后期计算网页搜索引擎中各文本的综合匹配度符合系数提供可靠的参考依据,同时获取用户导入搜索图片中各类别图像对应的关键词,统计网页搜索引擎中各文本内容内各关键词的词频,计算网页搜索引擎中各文本的综合匹配度符合系数,并按照综合匹配度符合系数从大到小的顺序依次进行排序,从而实现多种搜索方式选择的功能,满足用户的实际搜索需求,增加用户对网页图片搜索的体验感和满意感,进而提高网页搜索引擎的智能排序水平。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明的方法步骤示意图;
图2为本发明的模块连接结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
请参阅图1所示,本发明的第一方面提供基于移动互联网数据深度挖掘的网页搜索智能排序方法,包括如下步骤:
S1、用户搜索图片导入:通过图片导入模块将用户需要搜索的图片进行导入,按照设定的图片格式和规格导入至网页搜索引擎,并通过用户选择网页搜索引擎的搜索方式,若用户选择图片搜索方式,则进行步骤S2,若用户选择文本搜索方式,则进行步骤S7。
S2、图片特征点提取:通过特征点提取模块对用户导入搜索图片中各特征点进行提取,得到用户导入搜索图片中各特征点区域,并获取用户导入搜索图片中各特征点区域的面积。
在本实施例中,所述步骤S2中包括统计用户导入搜索图片中各特征点区域的面积,构成用户导入搜索图片中各特征点区域的面积集合S(s1,s2,...,si,...,sn),si表示为用户导入搜索图片中第i个特征点区域的面积。
S3、区域面积占比分析:通过面积占比分析模块提取网页搜索引擎中图片导入的设定规格面积,计算用户搜索图片中各特征点区域的面积占比,统计用户搜索图片中各特征点区域的面积占比。
在本实施例中,所述用户搜索图片中各特征点区域的面积占比计算公式为
Figure BDA0003116758080000081
ki表示为用户搜索图片中第i个特征点区域的面积占比,si表示为用户导入搜索图片中第i个特征点区域的面积,S设定表示为网页搜索引擎中图片导入的设定规格面积。
具体地,本发明通过提取用户导入搜索图片中各特征点区域,分析用户搜索图片中各特征点区域的面积占比,为后期计算用户导入搜索图片的综合匹配度符合系数提供可靠的参考数据。
S4、图片文字信息获取:通过文字信息提取模块对用户导入搜索图片的文字信息进行提取,得到用户导入搜索图片的文字信息,并按照文本位置先后顺序依次提取用户导入搜索图片的文字信息中各有效词。
S5、搜索图片主题统计:通过图片主题获取模块对用户导入搜索图片的文字信息中各有效词对应的主题进行获取,分别获取用户导入搜索图片的文字信息中各有效词对应的主题,统计用户导入搜索图片的文字信息中各主题内各有效词,并获取用户导入搜索图片的文字信息中各主题内各有效词所处文本位置编号,计算用户导入搜索图片的文字信息中各主题的权重系数。
在本实施例中,所述步骤S5中包括构成用户导入搜索图片的文字信息中各主题内各有效词所处文本位置编号集合WjA(wja1,wja2,...,wjaf,....,wjav),wjaf表示为用户导入搜索图片的文字信息中第j个主题内第f个有效词所处文本位置编号,j=1,2,...,m。
在本实施例中,所述用户导入搜索图片的文字信息中各主题的权重系数计算公式为
Figure BDA0003116758080000091
ξj表示为用户导入搜索图片的文字信息中第j个主题的权重系数,λf表示为用户导入搜索图片的文字信息中第f个有效词所处位置的影响补偿系数,wjaf表示为用户导入搜索图片的文字信息中第j个主题内第f个有效词所处文本位置编号,j=1,2,...,m,W表示为用户导入搜索图片的文字信息中有效词所处文本位置的总编号数量。
S6、图片匹配度符合系数分析:通过分析服务器将用户导入搜索图片的文字信息中各主题的权重系数进行对比,筛选用户导入搜索图片的文字信息中权重系数最大的主题,并将该主题记为用户导入搜索图片的文字信息对应主题,同时提取用户导入搜索图片的文字信息对应主题的权重系数ξmax,计算用户导入搜索图片的综合匹配度符合系数,将用户导入搜索图片的综合匹配度符合系数与网页搜索引擎中各图片的综合匹配度符合系数进行对比,统计网页搜索引擎中各图片的综合匹配度符合系数差值,按照综合匹配度符合系数差值从小到大的顺序依次对网页搜索引擎中各图片进行排序。
在本实施例中,所述用户导入搜索图片的综合匹配度符合系数计算公式为
Figure BDA0003116758080000101
ψ表示为用户导入搜索图片的综合匹配度符合系数,ξmax表示为用户导入搜索图片的文字信息对应主题的权重系数,α表示为图片特征点区域面积占比对应的权重修正系数,n表示为用户导入搜索图片中特征点的总数量,ki表示为用户搜索图片中第i个特征点区域的面积占比。
具体地,本发明通过将用户需要搜索的图片导入至网页搜索引擎,若用户选择图片搜索方式,则提取用户导入搜索图片中各特征点区域,分析用户搜索图片中各特征点区域的面积占比,同时获取用户导入搜索图片的文字信息中各主题内各有效词,计算用户导入搜索图片的文字信息中各主题的权重系数,筛选用户导入搜索图片的文字信息中权重系数最大的主题,计算用户导入搜索图片的综合匹配度符合系数,对比得到网页搜索引擎中各图片的综合匹配度符合系数差值,并按照差值从小到大顺序依次进行排序,从而实现网页搜索引擎中图片排序管理的智能化水平,确保用户需求的图片能够快速查找,减少用户查找类似图片的时间,提供用户搜索需求图片的效率。
S7、类别图像面积获取:通过图片处理模块将用户导入搜索图片进行分割处理,获得用户导入搜索图片中各类别图像面积,构成用户导入搜索图片中各类别图像面积集合S′(s′1,s′2,...,s′r,...,s′l),s′r表示为用户导入搜索图片中第r个类别图像面积,计算用户导入搜索图片中各类别图像的权重比例。
在本实施例中,所述用户导入搜索图片中各类别图像的权重比例计算公式为
Figure BDA0003116758080000102
κ′r表示为用户导入搜索图片中第r个类别图像的权重比例,s′r表示为用户导入搜索图片中第r个类别图像面积。
具体地,本发明通过获得用户导入搜索图片中各类别图像面积,计算用户导入搜索图片中各类别图像的权重比例,为后期计算网页搜索引擎中各文本的综合匹配度符合系数提供可靠的参考依据。
S8、类别图像关键词获取:通过关键词获取模块对用户导入搜索图片中各类别图像对应的关键词进行获取,统计用户导入搜索图片中各类别图像对应的关键词。
S9、文本关键词词频统计:通过关键词词频统计模块对网页搜索引擎中各文本内容内各关键词的词频进行统计,分别构成网页搜索引擎中各文本内容内各关键词的词频集合fpB(fpb1,fpb2,...,fpbr,...,fpbl),fpbr表示为网页搜索引擎中第p个文本内容内第r个关键词的词频,p=1,2,...,q。
S10、文本匹配度符合系数分析:通过分析服务器提取存储数据库中存储的文本关键词词频对应的权重修正系数,计算网页搜索引擎中各文本的综合匹配度符合系数,并按照综合匹配度符合系数从大到小的顺序依次对网页搜索引擎中各文本进行排序。
在本实施例中,所述网页搜索引擎中各文本的综合匹配度符合系数计算公式为
Figure BDA0003116758080000111
ψ′p表示为网页搜索引擎中第p个文本的综合匹配度符合系数,β表示为文本关键词词频对应的权重修正系数,l表示为用户导入搜索图片中提取的关键词数量,κ′r表示为用户导入搜索图片中第r个类别图像的权重比例,fpbr表示为网页搜索引擎中第p个文本内容内第r个关键词的词频,p=1,2,...,q。
具体地,本发明中若用户选择文本搜索方式,则获得用户导入搜索图片中各类别图像面积,计算用户导入搜索图片中各类别图像的权重比例,同时获取用户导入搜索图片中各类别图像对应的关键词,统计网页搜索引擎中各文本内容内各关键词的词频,计算网页搜索引擎中各文本的综合匹配度符合系数,并按照综合匹配度符合系数从大到小的顺序依次进行排序,从而实现多种搜索方式选择的功能,满足用户的实际搜索需求,增加用户对网页图片搜索的体验感和满意感,进而提高网页搜索引擎的智能排序水平。
请参阅图2所示,本发明的第二方面还提供基于移动互联网数据深度挖掘的网页搜索智能排序系统,包括图片导入模块、特征点提取模块、面积占比分析模块、文字信息提取模块、图片主题获取模块、图片处理模块、关键词获取模块、关键词词频统计模块、分析服务器和存储数据库;
所述图片导入模块分别与特征点提取模块和图片处理模块连接,面积占比分析模块分别与特征点提取模块和分析服务器连接,图片主题获取模块分别与文字信息提取模块和分析服务器连接,关键词获取模块分别与图片处理模块和关键词词频统计模块连接,分析服务器分别与关键词词频统计模块和存储数据库连接。
第三方面,本发明还提供一种计算机存储介质,所述计算机存储介质烧录有计算机程序,所述计算机程序在服务器的内存中运行时实现上述本发明所述的方法。
以上内容仅仅是对本发明的构思所作的举例和说明,所属本技术领域的技术人员对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,只要不偏离发明的构思或者超越本权利要求书所定义的范围,均应属于本发明的保护范围。

Claims (10)

1.基于移动互联网数据深度挖掘的网页搜索智能排序方法,其特征在于:包括如下步骤:
S1、用户搜索图片导入:通过图片导入模块将用户需要搜索的图片进行导入,按照设定的图片格式和规格导入至网页搜索引擎,并通过用户选择网页搜索引擎的搜索方式,若用户选择图片搜索方式,则进行步骤S2,若用户选择文本搜索方式,则进行步骤S7;
S2、图片特征点提取:通过特征点提取模块对用户导入搜索图片中各特征点进行提取,得到用户导入搜索图片中各特征点区域,并获取用户导入搜索图片中各特征点区域的面积;
S3、区域面积占比分析:通过面积占比分析模块提取网页搜索引擎中图片导入的设定规格面积,计算用户搜索图片中各特征点区域的面积占比,统计用户搜索图片中各特征点区域的面积占比;
S4、图片文字信息获取:通过文字信息提取模块对用户导入搜索图片的文字信息进行提取,得到用户导入搜索图片的文字信息,并按照文本位置先后顺序依次提取用户导入搜索图片的文字信息中各有效词;
S5、搜索图片主题统计:通过图片主题获取模块对用户导入搜索图片的文字信息中各有效词对应的主题进行获取,分别获取用户导入搜索图片的文字信息中各有效词对应的主题,统计用户导入搜索图片的文字信息中各主题内各有效词,并获取用户导入搜索图片的文字信息中各主题内各有效词所处文本位置编号,计算用户导入搜索图片的文字信息中各主题的权重系数;
S6、图片匹配度符合系数分析:通过分析服务器将用户导入搜索图片的文字信息中各主题的权重系数进行对比,筛选用户导入搜索图片的文字信息中权重系数最大的主题,并将该主题记为用户导入搜索图片的文字信息对应主题,同时提取用户导入搜索图片的文字信息对应主题的权重系数ξmax,计算用户导入搜索图片的综合匹配度符合系数,将用户导入搜索图片的综合匹配度符合系数与网页搜索引擎中各图片的综合匹配度符合系数进行对比,统计网页搜索引擎中各图片的综合匹配度符合系数差值,按照综合匹配度符合系数差值从小到大的顺序依次对网页搜索引擎中各图片进行排序;
S7、类别图像面积获取:通过图片处理模块将用户导入搜索图片进行分割处理,获得用户导入搜索图片中各类别图像面积,构成用户导入搜索图片中各类别图像面积集合S′(s′1,s′2,...,s′r,...,s′l),s′r表示为用户导入搜索图片中第r个类别图像面积,计算用户导入搜索图片中各类别图像的权重比例;
S8、类别图像关键词获取:通过关键词获取模块对用户导入搜索图片中各类别图像对应的关键词进行获取,统计用户导入搜索图片中各类别图像对应的关键词;
S9、文本关键词词频统计:通过关键词词频统计模块对网页搜索引擎中各文本内容内各关键词的词频进行统计,分别构成网页搜索引擎中各文本内容内各关键词的词频集合fpB(fpb1,fpb2,...,fpbr,...,fpbl),fpbr表示为网页搜索引擎中第p个文本内容内第r个关键词的词频,p=1,2,...,q;
S10、文本匹配度符合系数分析:通过分析服务器提取存储数据库中存储的文本关键词词频对应的权重修正系数,计算网页搜索引擎中各文本的综合匹配度符合系数,并按照综合匹配度符合系数从大到小的顺序依次对网页搜索引擎中各文本进行排序。
2.根据权利要求1所述的基于移动互联网数据深度挖掘的网页搜索智能排序方法,其特征在于:所述步骤S2中包括统计用户导入搜索图片中各特征点区域的面积,构成用户导入搜索图片中各特征点区域的面积集合S(s1,s2,...,si,...,sn),si表示为用户导入搜索图片中第i个特征点区域的面积。
3.根据权利要求1所述的基于移动互联网数据深度挖掘的网页搜索智能排序方法,其特征在于:所述用户搜索图片中各特征点区域的面积占比计算公式为
Figure FDA0003116758070000031
ki表示为用户搜索图片中第i个特征点区域的面积占比,si表示为用户导入搜索图片中第i个特征点区域的面积,S设定表示为网页搜索引擎中图片导入的设定规格面积。
4.根据权利要求1所述的基于移动互联网数据深度挖掘的网页搜索智能排序方法,其特征在于:所述步骤S5中包括构成用户导入搜索图片的文字信息中各主题内各有效词所处文本位置编号集合WjA(wja1,wja2,...,wjaf,....,wjav),wjaf表示为用户导入搜索图片的文字信息中第j个主题内第f个有效词所处文本位置编号,j=1,2,...,m。
5.根据权利要求1所述的基于移动互联网数据深度挖掘的网页搜索智能排序方法,其特征在于:所述用户导入搜索图片的文字信息中各主题的权重系数计算公式为
Figure FDA0003116758070000032
ξj表示为用户导入搜索图片的文字信息中第j个主题的权重系数,λf表示为用户导入搜索图片的文字信息中第f个有效词所处位置的影响补偿系数,wjaf表示为用户导入搜索图片的文字信息中第j个主题内第f个有效词所处文本位置编号,j=1,2,...,m,W表示为用户导入搜索图片的文字信息中有效词所处文本位置的总编号数量。
6.根据权利要求1所述的基于移动互联网数据深度挖掘的网页搜索智能排序方法,其特征在于:所述用户导入搜索图片的综合匹配度符合系数计算公式为
Figure FDA0003116758070000033
ψ表示为用户导入搜索图片的综合匹配度符合系数,ξmax表示为用户导入搜索图片的文字信息对应主题的权重系数,α表示为图片特征点区域面积占比对应的权重修正系数,n表示为用户导入搜索图片中特征点的总数量,ki表示为用户搜索图片中第i个特征点区域的面积占比。
7.根据权利要求1所述的基于移动互联网数据深度挖掘的网页搜索智能排序方法,其特征在于:所述用户导入搜索图片中各类别图像的权重比例计算公式为
Figure FDA0003116758070000041
κ′r表示为用户导入搜索图片中第r个类别图像的权重比例,s′r表示为用户导入搜索图片中第r个类别图像面积。
8.根据权利要求1所述的基于移动互联网数据深度挖掘的网页搜索智能排序方法,其特征在于:所述网页搜索引擎中各文本的综合匹配度符合系数计算公式为
Figure FDA0003116758070000042
ψ′p表示为网页搜索引擎中第p个文本的综合匹配度符合系数,β表示为文本关键词词频对应的权重修正系数,l表示为用户导入搜索图片中提取的关键词数量,κ′r表示为用户导入搜索图片中第r个类别图像的权重比例,fpbr表示为网页搜索引擎中第p个文本内容内第r个关键词的词频,p=1,2,...,q。
9.基于移动互联网数据深度挖掘的网页搜索智能排序系统,其特征在于:包括图片导入模块、特征点提取模块、面积占比分析模块、文字信息提取模块、图片主题获取模块、图片处理模块、关键词获取模块、关键词词频统计模块、分析服务器和存储数据库;
所述图片导入模块分别与特征点提取模块和图片处理模块连接,面积占比分析模块分别与特征点提取模块和分析服务器连接,图片主题获取模块分别与文字信息提取模块和分析服务器连接,关键词获取模块分别与图片处理模块和关键词词频统计模块连接,分析服务器分别与关键词词频统计模块和存储数据库连接。
10.一种计算机存储介质,其特征在于:所述计算机存储介质烧录有计算机程序,所述计算机程序在服务器的内存中运行时实现上述权利要求1-8任一项所述的方法。
CN202110664490.5A 2021-06-16 2021-06-16 基于移动互联网数据深度挖掘的网页搜索智能排序方法、系统和计算机存储介质 Withdrawn CN113282834A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110664490.5A CN113282834A (zh) 2021-06-16 2021-06-16 基于移动互联网数据深度挖掘的网页搜索智能排序方法、系统和计算机存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110664490.5A CN113282834A (zh) 2021-06-16 2021-06-16 基于移动互联网数据深度挖掘的网页搜索智能排序方法、系统和计算机存储介质

Publications (1)

Publication Number Publication Date
CN113282834A true CN113282834A (zh) 2021-08-20

Family

ID=77284698

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110664490.5A Withdrawn CN113282834A (zh) 2021-06-16 2021-06-16 基于移动互联网数据深度挖掘的网页搜索智能排序方法、系统和计算机存储介质

Country Status (1)

Country Link
CN (1) CN113282834A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114077682A (zh) * 2022-01-19 2022-02-22 广州拟实网络科技有限公司 一种图像检索智能识别匹配处理方法、系统和存储介质
CN115033799A (zh) * 2022-07-04 2022-09-09 武汉历历晴川网络科技有限公司 一种商品搜索方法、系统及存储介质
CN115098804A (zh) * 2022-06-24 2022-09-23 武汉楷瀚文化传媒有限公司 一种基于大数据分析的网页搜索历史记录智能管理系统
CN115309988A (zh) * 2022-08-10 2022-11-08 武汉圣男品牌管理有限公司 一种网页搜索内容匹配方法、系统及存储介质

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114077682A (zh) * 2022-01-19 2022-02-22 广州拟实网络科技有限公司 一种图像检索智能识别匹配处理方法、系统和存储介质
CN115098804A (zh) * 2022-06-24 2022-09-23 武汉楷瀚文化传媒有限公司 一种基于大数据分析的网页搜索历史记录智能管理系统
CN115098804B (zh) * 2022-06-24 2023-11-03 上海上班族数字科技有限公司 一种基于大数据分析的网页搜索历史记录智能管理系统
CN115033799A (zh) * 2022-07-04 2022-09-09 武汉历历晴川网络科技有限公司 一种商品搜索方法、系统及存储介质
CN115033799B (zh) * 2022-07-04 2023-01-17 郑州易赛诺信息技术有限公司 一种商品搜索方法、系统及存储介质
CN115309988A (zh) * 2022-08-10 2022-11-08 武汉圣男品牌管理有限公司 一种网页搜索内容匹配方法、系统及存储介质

Similar Documents

Publication Publication Date Title
CN113282834A (zh) 基于移动互联网数据深度挖掘的网页搜索智能排序方法、系统和计算机存储介质
CN105824959B (zh) 舆情监控方法及系统
US8549016B2 (en) System and method for providing robust topic identification in social indexes
US7406459B2 (en) Concept network
CN108763321B (zh) 一种基于大规模相关实体网络的相关实体推荐方法
CN105843850B (zh) 搜索优化方法和装置
CN110532379B (zh) 一种基于lstm的用户评论情感分析的电子资讯推荐方法
CN105045875B (zh) 个性化信息检索方法及装置
CN110134792B (zh) 文本识别方法、装置、电子设备以及存储介质
CN111046225B (zh) 音频资源处理方法、装置、设备及存储介质
CN107679070B (zh) 一种智能阅读推荐方法与装置、电子设备
CN111008321A (zh) 基于逻辑回归推荐方法、装置、计算设备、可读存储介质
CN112559684A (zh) 一种关键词提取及信息检索方法
CN108038099B (zh) 基于词聚类的低频关键词识别方法
CN109308324A (zh) 一种基于手绘风格推荐的图像检索方法及系统
CN102855317A (zh) 一种基于演示视频的多模式索引方法及系统
KR101224312B1 (ko) 소셜 네트워킹 서비스 사용자를 위한 친구 추천 방법, 이를 위한 기록 매체 및 이를 이용하는 소셜 네트워킹 서비스 및 서버
CN109446399A (zh) 一种影视实体搜索方法
CN115618014A (zh) 一种应用大数据技术的标准文献分析管理系统及方法
CN116010552A (zh) 一种基于关键词词库的工程造价数据解析系统及其方法
CN111078859A (zh) 一种基于引用次数的作者推荐方法
CN113821679A (zh) 一种视频帧定位方法、电子设备及计算机可读存储介质
CN108595413A (zh) 一种基于语义依存树的答案抽取方法
CN111966899A (zh) 搜索排序方法、系统及计算机可读存储介质
KR20110038247A (ko) 키워드 추출 장치 및 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20210820

WW01 Invention patent application withdrawn after publication