CN115309988A - 一种网页搜索内容匹配方法、系统及存储介质 - Google Patents
一种网页搜索内容匹配方法、系统及存储介质 Download PDFInfo
- Publication number
- CN115309988A CN115309988A CN202210955863.9A CN202210955863A CN115309988A CN 115309988 A CN115309988 A CN 115309988A CN 202210955863 A CN202210955863 A CN 202210955863A CN 115309988 A CN115309988 A CN 115309988A
- Authority
- CN
- China
- Prior art keywords
- picture
- matching
- pictures
- search
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9538—Presentation of query results
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Image Analysis (AREA)
Abstract
本发明提供的一种网页搜索内容匹配方法、系统及存储介质。该网页搜索内容匹配方法包括:用户输入信息获取,搜索信息匹配分析,图片初步匹配分析,特征区域划分与特征信息提取,图片深度匹配分析,检索图片界面展示,文字匹配分析和检索文字界面展示;本发明有效的解决了当前网页搜索内容匹配处理方式还存在一定的局限性的问题,对图片的内容进行深度挖掘,进而对图片进行深度分析,保障了图片匹配结果的参考性和合理性,提高了图片的匹配效率,降低了用户检索时长,提升了用户的检索体验感,减少了后台系统的匹配任务量,加速了图片搜索进程,避免用户等待时长过长,在一定程度上有效的提升了用户对目标检索平台的满意度。
Description
技术领域
本发明属于网页搜索技术领域,涉及到一种网页搜索内容匹配方法、系统及存储介质。
背景技术
随着搜索引擎技术的发展,搜索结果的准确率已成为普遍关注的问题,目前,绝大多数搜索引擎都能呈现大量的搜索结果,但往往只有相关性好、结果准确的记录才被关注,因此,对网页搜索内容匹配管理研究也更加重要。
目前对于图片搜索方式主要是通过识别图片中的纹理特征和特征数目,从而与网页检索平台中的图片进行匹配关联,具有一定的局限性,很显然,当前对于网页搜索内容匹配还存在以下不足:
1、当前网页搜索内容匹配对用户输入的信息处理还存在一定的局限性,还停留在图像的基础表征属性信息,没有对图片的内容进行深度挖掘,由此对图片进行深度分析,分析维度比较浅显,无法保障图片匹配结果的参考性和合理性;
2、当前对图片搜索的匹配方式是对图片进行整体化的匹配分析,无法凸显出图片中的细节特征,而图片的细节特征之间决定了图片匹配结果的精准性,同时还影响了图片的匹配效率,进而延长了用户检索时长,并且还降低了用户的检索体验感;
3、当前图片搜索匹配方式笼统化的匹配方式,没有对图片进行初步筛选,导致匹配图片过多造成匹配效率不高,同时还增加了后台系统的匹配任务量,从而延缓了图片搜索匹配进程,造成用户等待时长过长,存在用户粘性降低的风险,进而对网页的运营造成了一定的影响。
发明内容
针对现有技术中的上述缺陷,本发明提供一种网页搜索内容匹配方法、系统及存储介质,具体技术方案如下:
本发明第一方面提供了一种网页搜索内容匹配方法,该方法包括以下步骤:
步骤一、用户输入信息获取:获取用户当前输入的搜索指令信息,由此获取用户对应的输入的搜索方式和搜索内容;
步骤二、搜索信息匹配分析:根据用户对应的输入的搜索方式,若用户对应的输入的搜索方式为图片搜索,提取用户输入的图片,并执行步骤三,若用户对应的输入的搜索方式为文字搜索,提取用户输入的文本,并执行步骤七;
步骤三、图片初步匹配分析:从目标图片中识别出物体种类数目、各种类物体对应的轮廓形状和轮廓面积,从搜索网页后台提取各参考图片对应的基本信息,进而分析得到各参考图片对应的初步匹配系数,由此确认各待选图片;
步骤四、特征区域划分与特征信息提取:从各待选图片中识别出存在的颜色种类和各种类颜色对应的色度值,进而依据各种类颜色在各待选图片中的位置,将各待选图片划分为各特征区域,并提取各特征区域对应的特征信息;
步骤五、图片深度匹配分析:将目标图片与各待选图片特征区域进行深度匹配,分析得到各待选图片对应的深度匹配系数;
步骤六、检索图片界面展示:将各待选图片对应的深度匹配系数按照从大到小的顺序进行排序,并作为各待选图片对应的展示顺序,由此将各待选图片对应的展示顺序发送至用户输入搜索界面,并按照各待选图片对应的展示顺序进行展示;
步骤七、文字匹配分析:将目标文字信息划分为各关键词,从而构成目标文字关键词集合,将目标文字关键词集合与各展示网页对应的关联关键词集合进行匹配对比,分析得到各展示网页对应的文本匹配系数;
步骤八、检索文字界面展示:将各展示网页对应的文本匹配系数按照从大到小的顺序进行排序,并作为各展示网页对应的展示顺序,由此将各展示网页对应的展示顺序发送至用户输入搜索界面,并按照各展示网页对应的展示顺序进行展示。
需要进一步说明的是,所述步骤三中的各参考图片对应的基本信息具体包括种类物体数目、各物体种类对应的数目、各物体种类对应的轮廓形态和轮廓面积。
需要进一步说明的是,所述步骤三中分析得到各参考图片对应的初步匹配系数,具体分析过程如下:
A1、从各参考图片对应的基本信息提取出种类物体数目,利用计算公式计算得出各参考图片对应的种类物体数目匹配系数αi,其中,i表示为各参考图片对应的编号,i=1,2,......m,M'表示为目标图片对应的种类物体数目,Mi表示为第i个参考图片对应的种类物体数目;
A2、将各参考图片中对应的各物体种类分别与目标图片对应的各物体种类进行匹配对比,若某参考图片中对应的各物体种类与目标图片对应的各物体种类均匹配一致,则将该参考图片对应的物体种类匹配系数记为G,若某参考图片中对应的某物体种类与目标图片对应的某物体种类不一致,则将该参考图片对应的物体种类匹配系数记为G',由此得到各参考图片对应的物体种类匹配系数ζi,其中ζi取值为G或G',且G>G';
A3、基于各参考图片对应的种类物体数目匹配系数和物体种类匹配系数,利用计算公式计算得出各参考图片对应的物体种类基本匹配系数ψi,统计各参考图片对应的物品种类基本匹配系数,将各参考图片对应的物体基本匹配系数与设定的标准参考图片物体基本匹配系数进行对比,若某参考图片对应的物体基本匹配系数大于或者等于标准参考图片物体基本匹配系数,则执行A4步骤,若某参考图片对应的物体基本匹配系数小于标准参考图片物体基本匹配系数,则将该参考图片对应的物体种类基本匹配系数作为初步匹配系数;
A4、从该参考图片对应的基本信息提取出各物体种类对应的轮廓形态,将该参考图片中各物体种类对应的轮廓与目标图片对应的各物体种类对应的轮廓形态进行重合对比,由此得到该参考图片与目标图片的各物体种类对应的重合面积,将其记为Xj,利用计算公式计算得出该参考图片中各物体种类对应的形态匹配系数βj,其中,j表示为各种类物体对应的编号,依次标记为j=1,2,......n,Sj表示为该参考图片第j个种类物体对应的轮廓面积,Sj′表示为目标图片中第j个种类物体对应的轮廓面积,a1和a2分别表示为设定的轮廓形态和轮廓面积对应的权重因子,且a1+a2=1,e表示为自然常数;
A5、基于各参考图片对应的物品种类基本匹配系数和该参考图片中各物体种类对应的形态匹配系数,利用计算公式计算得出各参考图片对应的初步匹配系数χi,其中,b1、b2和b3分别表示为设定的物体种类数目、物体种类和物体种类形态对应的权重因子,且b1+b2+b3=1。
需要进一步说明的是,所述步骤三中确认各待选图片,具体确认过程为:
将各参考图片对应的初步匹配系数与设定的图片标准匹配系数进行比对,若某参考图片对应的初步匹配系数大于或等于设定的标准图片匹配系数,则将该参考图片记为待选图片,反之则将该参考图片记为无效图片,以此得到各待选图片。
需要进一步说明的是,所述步骤四中各特征区域对应的特征信息具体包括色度值、轮廓面积、中心点位置以及轮廓形状。
需要进一步说明的是,所述步骤五中分析得到各待选图片对应的深度匹配系数,具体分析过程如下:
B1、将目标图片按照各待选图片特征区域的划分方式划分为各特征区域,提取目标图片中各特征区域对应的色度值、轮廓面积、中心点位置以及轮廓形状,将目标图片对应各特征区域按照设定的顺序进行编号为1,2,...r,...u,将各待选图片对应的各特征区域依次编号为1',2',...r',...u',其中目标图片对应各特征区域编号与各待选图片对应的各特征区域编号为对应关系;
B2、从各待选图片中各特征区域对应的特征信息中提取色度值,利用计算公式计算得出各待选图片的颜色符合系数δq,其中,r表示为目标图片对应的各特征区域编号,依次标记为r=1,2,......u,r'表示为各待选图片对应的各特征区域编号,依次标记为r'=1',2',......u',q表示为各待选图片对应的编号,依次标记为q=1,2,......d,Nr表示为目标图片中第r个特征区域对应的色度值,Nr′ q表示为第p张待选图片中第r个特征区域对应的色度值;
B3、以目标图片对应的中心点为坐标原点构建图像参考坐标系,将目标图片中各特征区域对应的中心点位置以及各待选图片对应各特征区域的中心点位置导入图像参考坐标系中,得到目标图片中各特征区域对应的中心点坐标和各待选图片对应各特征区域的中心点坐标,利用计算公式计算得出各待选图片的位置符合系数εq,其中,(x1 r,y1 r)表示为目标图片第r个特征区域对应的中心点坐标,(x2 qr′,y2 qr′)表示为第q张待选图片中第r'个特征区域对应的中心点坐标;
B4、从各待选图片中各特征区域对应的特征信息中提取区域面积和区域轮廓形状,并与目标图片中各特征区域对应的对应的轮廓形态进行重合对比,由此得到各待选图片与目标图片的各特征区域对应的重合面积,将其记为Rr′ q,利用计算公式计算得出各待选图片的轮廓符合系数φq,其中,Tr表示为目标图片中第r个特征区域对应的区域面积,Tr′ q分别表示为第q张待选图片中第r'个特征区域对应的区域面积,c1和c2分别表示为设定的区域面积和区域轮廓形状对应的权重因子,且c1+c2=1;
B5、基于各待选图片的颜色符合系数、位置符合系数和轮廓符合系数,综合计算得出各待选图片对应的深度匹配系数。
需要进一步说明的是,所述各待选图片对应的深度匹配系数具体计算公式如下:
需要进一步说明的是,所述步骤七中分析得到各展示网页对应的文本匹配系数,具体分析过程如下:
C1、将各展示网页对应的关联关键词集合记为Ew,将目标文字对应的关键词集合记为F,其中,w表示为各展示网页对应的编号,w=1,2,......x;
本发明第二方面提供了一种网页搜索内容匹配系统,所述该系统包括:用户输入信息获取模块、搜索信息匹配分析模块、图片初步匹配分析模块、区域划分与信息提取模块、图片深度匹配分析模块、检索图片界面展示模块、文字匹配分析模块和检索文字界面展示模块;其中,
所述用户输入信息获取模块,用于获取用户当前输入的搜素指令信息,由此获取用户对应的输入的搜索方式和搜索内容;
所述搜索信息匹配分析模块,用于确认用户对应的搜索方式,其中,搜索方式包括图片搜索方式和文字搜索方式;
所述图片初步匹配分析模块,用于从目标图片中识别出物体种类数目、各种类物体对应的轮廓形状和轮廓面积,从搜索网页后台提取各参考图片对应的基本信息,分析得到各参考图片对应的初步匹配系数,由此确认各待选图片;
所述区域划分与信息提取模块,用于从各待选图片中识别出存在的颜色种类和各种类颜色对应的色度值,进而依据各种类颜色在各待选图片中的位置,将各待选图片划分为各特征区域,并提取各特征区域对应的特征信息;
所述图片深度匹配分析模块,用于根据目标图片与各待选图片特征区域进行深度匹配,分析得到各待选图片对应的深度匹配系数;
所述检索图片界面展示模块,用于将各待选图片对应的深度匹配系数按照从大到小的顺序进行排序,并作为各待选图片对应的展示顺序,由此将各待选图片对应的展示顺序发送至用户输入搜索界面,并按照各待选图片对应的展示顺序进行展示;
所述文字匹配分析模块,用于将目标文字信息划分为各关键词,从而构成目标文字关键词集合,将目标文字关键词集合与各展示网页对应的关联关键词集合进行匹配对比,分析得到各展示网页对应的文本匹配系数;
所述检索文字界面展示模块,用于将各展示网页对应的文本匹配系数按照从大到小的顺序进行排序,并作为各展示网页对应的展示顺序,由此将各展示网页对应的展示顺序发送至用户输入搜索界面,并按照各展示网页对应的展示顺序进行展示。
本发明第三方面提供了一种网页搜索内容匹配存储介质,所述网页搜索内容匹配存储介质烧录有计算机程序,所述计算机程序在服务器的内存中运行时实现本发明所述的网页搜索内容匹配方法。
结合上述技术方案,本发明的有益效果如下:
本发明提供的一种网页搜索内容匹配方法,通过对各参考图片的基本信息与目标图片信息进行比对分析,进而得到各参考图片对应的初步匹配系数,由此确认各待选图片,进一步对各待选图片划分各特征区域,分析得到各待选图片对应的深度匹配系数,并将各待选图片对应的深度匹配系数按照从大到小的顺序进行优先排序展示,一方面,有效的解决了当前网页搜索内容匹配处理方式还存在一定的局限性的问题,对图片的内容进行深度挖掘,进而对图片进行深度分析,保障了图片匹配结果的参考性和合理性,一方面,凸显出了图片中的细节特征,降低了用户检索时长,提升了用户的检索体验感;另一方面,通过对图片进行初步筛选,提高了图片的匹配效率,减少了后台系统的匹配任务量,加速了图片搜索进程,避免用户等待时长过长,同时在一定程度上有效的提升了用户对目标检索平台的满意度。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明方法实施步骤流程图;
图2为本发明系统各模块连接示意图。
具体实施方式
下面将结合本发明实施以上内容仅仅是对本发明的构思所作的举例和说明,所属本技术领域的技术人员对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,只要不偏离发明的构思或者超越本权利要求书所定义的范围,均应属于本发明的保护范围。
请参阅图1所示,一种网页搜索内容匹配方法,该方法包括以下步骤:
步骤一、用户输入信息获取:获取用户当前输入的搜索指令信息,由此获取用户对应的输入的搜索方式和搜索内容。
步骤二、搜索信息匹配分析:根据用户对应的输入的搜索方式,若用户对应的输入的搜索方式为图片搜索,提取用户输入的图片,并执行步骤三,若用户对应的输入的搜索方式为文字搜索,提取用户输入的文本,并执行步骤七。
步骤三、图片初步匹配分析:从目标图片中识别出物体种类数目、各种类物体对应的轮廓形状和轮廓面积,从搜索网页后台提取各参考图片对应的基本信息,进而分析得到各参考图片对应的初步匹配系数,由此确认各待选图片。
具体地,所述步骤三中的各参考图片对应的基本信息具体包括种类物体数目、各物体种类对应的数目、各物体种类对应的轮廓形态和轮廓面积。
具体地,所述步骤三中分析得到各参考图片对应的初步匹配系数,具体分析过程如下:
A1、从各参考图片对应的基本信息提取出种类物体数目,利用计算公式计算得出各参考图片对应的种类物体数目匹配系数αi,其中,i表示为各参考图片对应的编号,i=1,2,......m,M'表示为目标图片对应的种类物体数目,Mi表示为第i个参考图片对应的种类物体数目;
A2、将各参考图片中对应的各物体种类分别与目标图片对应的各物体种类进行匹配对比,若某参考图片中对应的各物体种类与目标图片对应的各物体种类均匹配一致,则将该参考图片对应的物体种类匹配系数记为G,若某参考图片中对应的某物体种类与目标图片对应的某物体种类不一致,则将该参考图片对应的物体种类匹配系数记为G',由此得到各参考图片对应的物体种类匹配系数ζi,其中ζi取值为G或G',且G>G';
A3、基于各参考图片对应的种类物体数目匹配系数和物体种类匹配系数,利用计算公式计算得出各参考图片对应的物体种类基本匹配系数ψi,统计各参考图片对应的物品种类基本匹配系数,将各参考图片对应的物体基本匹配系数与设定的标准参考图片物体基本匹配系数进行对比,若某参考图片对应的物体基本匹配系数大于或者等于标准参考图片物体基本匹配系数,则执行A4步骤,若某参考图片对应的物体基本匹配系数小于标准参考图片物体基本匹配系数,则将该参考图片对应的物体种类基本匹配系数作为初步匹配系数;
A4、从该参考图片对应的基本信息提取出各物体种类对应的轮廓形态,将该参考图片中各物体种类对应的轮廓与目标图片对应的各物体种类对应的轮廓形态进行重合对比,由此得到该参考图片与目标图片的各物体种类对应的重合面积,将其记为Xj,利用计算公式计算得出该参考图片中各物体种类对应的形态匹配系数βj,其中,j表示为各种类物体对应的编号,依次标记为j=1,2,......n,Sj表示为该参考图片第j个种类物体对应的轮廓面积,S′j表示为目标图片中第j个种类物体对应的轮廓面积,a1和a2分别表示为设定的轮廓形态和轮廓面积对应的权重因子,且a1+a2=1,e表示为自然常数;
A5、基于各参考图片对应的物品种类基本匹配系数和该参考图片中各物体种类对应的形态匹配系数,利用计算公式计算得出各参考图片对应的初步匹配系数χi,其中,b1、b2和b3分别表示为设定的物体种类数目、物体种类和物体种类形态对应的权重因子,且b1+b2+b3=1。
在一个具体实施例中,各参考图片与目标图片的图像尺寸是一致的,若不一致,先将各参考图片放大或缩小至目标图片的图像尺寸一致时,再进行匹配。
具体地,所述步骤三中确认各待选图片,具体确认过程为:
将各参考图片对应的初步匹配系数与设定的图片标准匹配系数进行比对,若某参考图片对应的初步匹配系数大于或等于设定的标准图片匹配系数,则将该参考图片记为待选图片,反之则将该参考图片记为无效图片,以此得到各待选图片。
步骤四、特征区域划分与特征信息提取:从各待选图片中识别出存在的颜色种类和各种类颜色对应的色度值,进而依据各种类颜色在各待选图片中的位置,将各待选图片划分为各特征区域,并提取各特征区域对应的特征信息。
具体地,所述步骤四中各特征区域对应的特征信息具体包括色度值、轮廓面积、中心点位置以及轮廓形状。
步骤五、图片深度匹配分析:将目标图片与各待选图片特征区域进行深度匹配,分析得到各待选图片对应的深度匹配系数。
具体地,所述步骤五中分析得到各待选图片对应的深度匹配系数,具体分析过程如下:
B1、将目标图片按照各待选图片特征区域的划分方式划分为各特征区域,提取目标图片中各特征区域对应的色度值、轮廓面积、中心点位置以及轮廓形状,将目标图片对应各特征区域按照设定的顺序进行编号为1,2,...r,...u,将各待选图片对应的各特征区域依次编号为1',2',...r',...u',其中目标图片对应各特征区域编号与各待选图片对应的各特征区域编号为对应关系;
B2、从各待选图片中各特征区域对应的特征信息中提取色度值,利用计算公式计算得出各待选图片的颜色符合系数δq,其中,r表示为目标图片对应的各特征区域编号,依次标记为r=1,2,......u,r'表示为各待选图片对应的各特征区域编号,依次标记为r'=1',2',......u',q表示为各待选图片对应的编号,依次标记为q=1,2,......d,Nr表示为目标图片中第r个特征区域对应的色度值,Nr′ q表示为第p张待选图片中第r个特征区域对应的色度值;
B3、以目标图片对应的中心点为坐标原点构建图像参考坐标系,将目标图片中各特征区域对应的中心点位置以及各待选图片对应各特征区域的中心点位置导入图像参考坐标系中,得到目标图片中各特征区域对应的中心点坐标和各待选图片对应各特征区域的中心点坐标,利用计算公式计算得出各待选图片的位置符合系数εq,其中,(x1 r,y1 r)表示为目标图片第r个特征区域对应的中心点坐标,(x2 qr′,y2 qr′)表示为第q张待选图片中第r'个特征区域对应的中心点坐标;
B4、从各待选图片中各特征区域对应的特征信息中提取区域面积和区域轮廓形状,并与目标图片中各特征区域对应的对应的轮廓形态进行重合对比,由此得到各待选图片与目标图片的各特征区域对应的重合面积,将其记为Rr′ q,利用计算公式计算得出各待选图片的轮廓符合系数φq,其中,Tr表示为目标图片中第r个特征区域对应的区域面积,Tr′ q分别表示为第q张待选图片中第r'个特征区域对应的区域面积,c1和c2分别表示为设定的区域面积和区域轮廓形状对应的权重因子,且c1+c2=1;
B5、基于各待选图片的颜色符合系数、位置符合系数和轮廓符合系数,综合计算得出各待选图片对应的深度匹配系数。
具体地,所述各待选图片对应的深度匹配系数具体计算公式如下:
步骤六、检索图片界面展示:将各待选图片对应的深度匹配系数按照从大到小的顺序进行排序,并作为各待选图片对应的展示顺序,由此将各待选图片对应的展示顺序发送至用户输入搜索界面,并按照各待选图片对应的展示顺序进行展示。
步骤七、文字匹配分析:将目标文字信息划分为各关键词,从而构成目标文字关键词集合,将目标文字关键词集合与各展示网页对应的关联关键词集合进行匹配对比,分析得到各展示网页对应的文本匹配系数。
具体地,所述步骤七中分析得到各展示网页对应的文本匹配系数,具体分析过程如下:
C1、将各展示网页对应的关联关键词集合记为Ew将目标文字对应的关键词集合记为F,其中,w表示为各展示网页对应的编号,w=1,2,......x;
步骤八、检索文字界面展示:将各展示网页对应的文本匹配系数按照从大到小的顺序进行排序,并作为各展示网页对应的展示顺序,由此将各展示网页对应的展示顺序发送至用户输入搜索界面,并按照各展示网页对应的展示顺序进行展示。
本发明提供的一种网页搜索内容匹配方法,通过对各参考图片的基本信息与目标图片信息进行比对分析,进而得到各参考图片对应的初步匹配系数,由此确认各待选图片,进一步对各待选图片划分各特征区域,分析得到各待选图片对应的深度匹配系数,并将各待选图片对应的深度匹配系数按照从大到小的顺序进行优先排序展示,一方面,有效的解决了当前网页搜索内容匹配处理方式还存在一定的局限性的问题,对图片的内容进行深度挖掘,进而对图片进行深度分析,保障了图片匹配结果的参考性和合理性,一方面,凸显出了图片中的细节特征,降低了用户检索时长,提升了用户的检索体验感;另一方面,通过对图片进行初步筛选,提高了图片的匹配效率,减少了后台系统的匹配任务量,加速了图片搜索进程,避免用户等待时长过长,同时在一定程度上有效的提升了用户对目标检索平台的满意度。
请参阅图2所示,一种网页搜索内容匹配系统,所述该系统包括:用户输入信息获取模块、搜索信息匹配分析模块、图片初步匹配分析模块、区域划分与信息提取模块、图片深度匹配分析模块、检索图片界面展示模块、文字匹配分析模块和检索文字界面展示模块;
所述搜索信息匹配分析模块与用户输入信息获取模块、图片初步匹配分析模块和文字匹配分析模块连接,图片初步匹配分析模块和特征区域划分与特征信息提取模块连接,特征区域划分与特征信息提取模块和图片深度匹配分析模块,图片深度匹配分析模块和检索图片界面展示模块连接,文字匹配分析模块与检索文字界面展示模块连接;
所述用户输入信息获取模块,用于获取用户当前输入的搜素指令信息,由此获取用户对应的输入的搜索方式和搜索内容;
所述搜索信息匹配分析模块,用于确认用户对应的搜索方式,其中,搜索方式包括图片搜索方式和文字搜索方式;
所述图片初步匹配分析模块,用于从目标图片中识别出物体种类数目、各种类物体对应的轮廓形状和轮廓面积,从搜索网页后台提取各参考图片对应的基本信息,分析得到各参考图片对应的初步匹配系数,由此确认各待选图片;
所述区域划分与信息提取模块,用于从各待选图片中识别出存在的颜色种类和各种类颜色对应的色度值,进而依据各种类颜色在各待选图片中的位置,将各待选图片划分为各特征区域,并提取各特征区域对应的特征信息;
所述图片深度匹配分析模块,用于根据目标图片与各待选图片特征区域进行深度匹配,分析得到各待选图片对应的深度匹配系数;
所述检索图片界面展示模块,用于将各待选图片对应的深度匹配系数按照从大到小的顺序进行排序,并作为各待选图片对应的展示顺序,由此将各待选图片对应的展示顺序发送至用户输入搜索界面,并按照各待选图片对应的展示顺序进行展示;
所述文字匹配分析模块,用于将目标文字信息划分为各关键词,从而构成目标文字关键词集合,将目标文字关键词集合与各展示网页对应的关联关键词集合进行匹配对比,分析得到各展示网页对应的文本匹配系数;
所述检索文字界面展示模块,用于将各展示网页对应的文本匹配系数按照从大到小的顺序进行排序,并作为各展示网页对应的展示顺序,由此将各展示网页对应的展示顺序发送至用户输入搜索界面,并按照各展示网页对应的展示顺序进行展示。
本发明还提供了一种网页搜索内容匹配存储介质,所述网页搜索内容匹配存储介质烧录有计算机程序,所述计算机程序在服务器的内存中运行时实现本发明所述的网页搜索内容匹配方法。
以上内容仅仅是对本发明的构思所作的举例和说明,所属本技术领域的技术人员对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,只要不偏离发明的构思或者超越本权利要求书所定义的范围,均应属于本发明的保护范围。
Claims (10)
1.一种网页搜索内容匹配方法,其特征在于:该方法包括以下步骤:
步骤一、用户输入信息获取:获取用户当前输入的搜索指令信息,由此获取用户对应的输入的搜索方式和搜索内容;
步骤二、搜索信息匹配分析:根据用户对应的输入的搜索方式,若用户对应的输入的搜索方式为图片搜索,提取用户输入的图片,并执行步骤三,若用户对应的输入的搜索方式为文字搜索,提取用户输入的文本,并执行步骤七;
步骤三、图片初步匹配分析:从目标图片中识别出物体种类数目、各种类物体对应的轮廓形状和轮廓面积,从搜索网页后台提取各参考图片对应的基本信息,进而分析得到各参考图片对应的初步匹配系数,由此确认各待选图片;
步骤四、特征区域划分与特征信息提取:从各待选图片中识别出存在的颜色种类和各种类颜色对应的色度值,进而依据各种类颜色在各待选图片中的位置,将各待选图片划分为各特征区域,并提取各特征区域对应的特征信息;
步骤五、图片深度匹配分析:将目标图片与各待选图片特征区域进行深度匹配,分析得到各待选图片对应的深度匹配系数;
步骤六、检索图片界面展示:将各待选图片对应的深度匹配系数按照从大到小的顺序进行排序,并作为各待选图片对应的展示顺序,由此将各待选图片对应的展示顺序发送至用户输入搜索界面,并按照各待选图片对应的展示顺序进行展示;
步骤七、文字匹配分析:将目标文字信息划分为各关键词,从而构成目标文字关键词集合,将目标文字关键词集合与各展示网页对应的关联关键词集合进行匹配对比,分析得到各展示网页对应的文本匹配系数;
步骤八、检索文字界面展示:将各展示网页对应的文本匹配系数按照从大到小的顺序进行排序,并作为各展示网页对应的展示顺序,由此将各展示网页对应的展示顺序发送至用户输入搜索界面,并按照各展示网页对应的展示顺序进行展示。
2.根据权利要求1所述的一种网页搜索内容匹配方法,其特征在于:所述步骤三中的各参考图片对应的基本信息具体包括种类物体数目、各物体种类对应的数目、各物体种类对应的轮廓形态和轮廓面积。
3.根据权利要求1所述的一种网页搜索内容匹配方法,其特征在于:所述步骤三中分析得到各参考图片对应的初步匹配系数,具体分析过程如下:
A1、从各参考图片对应的基本信息提取出种类物体数目,利用计算公式计算得出各参考图片对应的种类物体数目匹配系数αi,其中,i表示为各参考图片对应的编号,i=1,2,......m,M'表示为目标图片对应的种类物体数目,Mi表示为第i个参考图片对应的种类物体数目;
A2、将各参考图片中对应的各物体种类分别与目标图片对应的各物体种类进行匹配对比,若某参考图片中对应的各物体种类与目标图片对应的各物体种类均匹配一致,则将该参考图片对应的物体种类匹配系数记为G,若某参考图片中对应的某物体种类与目标图片对应的某物体种类不一致,则将该参考图片对应的物体种类匹配系数记为G',由此得到各参考图片对应的物体种类匹配系数ζi,其中ζi取值为G或G',且G>G';
A3、基于各参考图片对应的种类物体数目匹配系数和物体种类匹配系数,利用计算公式计算得出各参考图片对应的物体种类基本匹配系数ψi,统计各参考图片对应的物品种类基本匹配系数,将各参考图片对应的物体基本匹配系数与设定的标准参考图片物体基本匹配系数进行对比,若某参考图片对应的物体基本匹配系数大于或者等于标准参考图片物体基本匹配系数,则执行A4步骤,若某参考图片对应的物体基本匹配系数小于标准参考图片物体基本匹配系数,则将该参考图片对应的物体种类基本匹配系数作为初步匹配系数;
A4、从该参考图片对应的基本信息提取出各物体种类对应的轮廓形态,将该参考图片中各物体种类对应的轮廓与目标图片对应的各物体种类对应的轮廓形态进行重合对比,由此得到该参考图片与目标图片的各物体种类对应的重合面积,将其记为Xj,利用计算公式计算得出该参考图片中各物体种类对应的形态匹配系数βj,其中,j表示为各种类物体对应的编号,依次标记为j=1,2,......n,Sj表示为该参考图片第j个种类物体对应的轮廓面积,S′j表示为目标图片中第j个种类物体对应的轮廓面积,a1和a2分别表示为设定的轮廓形态和轮廓面积对应的权重因子,且a1+a2=1,e表示为自然常数;
4.根据权利要求1所述的一种网页搜索内容匹配方法,其特征在于:所述步骤三中确认各待选图片,具体确认过程为:
将各参考图片对应的初步匹配系数与设定的图片标准匹配系数进行比对,若某参考图片对应的初步匹配系数大于或等于设定的标准图片匹配系数,则将该参考图片记为待选图片,反之则将该参考图片记为无效图片,以此得到各待选图片。
5.根据权利要求1所述的一种网页搜索内容匹配方法,其特征在于:所述步骤四中各特征区域对应的特征信息具体包括色度值、轮廓面积、中心点位置以及轮廓形状。
6.根据权利要求1所述的一种网页搜索内容匹配方法,其特征在于:所述步骤五中分析得到各待选图片对应的深度匹配系数,具体分析过程如下:
B1、将目标图片按照各待选图片特征区域的划分方式划分为各特征区域,提取目标图片中各特征区域对应的色度值、轮廓面积、中心点位置以及轮廓形状,将目标图片对应各特征区域按照设定的顺序进行编号为1,2,...r,...u,将各待选图片对应的各特征区域依次编号为1',2',...r',...u',其中目标图片对应各特征区域编号与各待选图片对应的各特征区域编号为对应关系;
B2、从各待选图片中各特征区域对应的特征信息中提取色度值,利用计算公式计算得出各待选图片的颜色符合系数δq,其中,r表示为目标图片对应的各特征区域编号,依次标记为r=1,2,......u,r'表示为各待选图片对应的各特征区域编号,依次标记为r'=1',2',......u',q表示为各待选图片对应的编号,依次标记为q=1,2,......d,Nr表示为目标图片中第r个特征区域对应的色度值,Nr′ q表示为第p张待选图片中第r个特征区域对应的色度值;
B3、以目标图片对应的中心点为坐标原点构建图像参考坐标系,将目标图片中各特征区域对应的中心点位置以及各待选图片对应各特征区域的中心点位置导入图像参考坐标系中,得到目标图片中各特征区域对应的中心点坐标和各待选图片对应各特征区域的中心点坐标,利用计算公式计算得出各待选图片的位置符合系数εq,其中,(x1 r,y1 r)表示为目标图片第r个特征区域对应的中心点坐标,(x2 qr′,y2 qr′)表示为第q张待选图片中第r'个特征区域对应的中心点坐标;
B4、从各待选图片中各特征区域对应的特征信息中提取区域面积和区域轮廓形状,并与目标图片中各特征区域对应的对应的轮廓形态进行重合对比,由此得到各待选图片与目标图片的各特征区域对应的重合面积,将其记为Rr′ q,利用计算公式计算得出各待选图片的轮廓符合系数φq,其中,Tr表示为目标图片中第r个特征区域对应的区域面积,Tr′ q分别表示为第q张待选图片中第r'个特征区域对应的区域面积,c1和c2分别表示为设定的区域面积和区域轮廓形状对应的权重因子,且c1+c2=1;
B5、基于各待选图片的颜色符合系数、位置符合系数和轮廓符合系数,综合计算得出各待选图片对应的深度匹配系数。
9.一种网页搜索内容匹配系统,其特征在于:所述该系统包括:用户输入信息获取模块、搜索信息匹配分析模块、图片初步匹配分析模块、区域划分与信息提取模块、图片深度匹配分析模块、检索图片界面展示模块、文字匹配分析模块和检索文字界面展示模块;其中,
所述用户输入信息获取模块,用于获取用户当前输入的搜素指令信息,由此获取用户对应的输入的搜索方式和搜索内容;
所述搜索信息匹配分析模块,用于确认用户对应的搜索方式,其中,搜索方式包括图片搜索方式和文字搜索方式;
所述图片初步匹配分析模块,用于从目标图片中识别出物体种类数目、各种类物体对应的轮廓形状和轮廓面积,从搜索网页后台提取各参考图片对应的基本信息,分析得到各参考图片对应的初步匹配系数,由此确认各待选图片;
所述区域划分与信息提取模块,用于从各待选图片中识别出存在的颜色种类和各种类颜色对应的色度值,进而依据各种类颜色在各待选图片中的位置,将各待选图片划分为各特征区域,并提取各特征区域对应的特征信息;
所述图片深度匹配分析模块,用于根据目标图片与各待选图片特征区域进行深度匹配,分析得到各待选图片对应的深度匹配系数;
所述检索图片界面展示模块,用于将各待选图片对应的深度匹配系数按照从大到小的顺序进行排序,并作为各待选图片对应的展示顺序,由此将各待选图片对应的展示顺序发送至用户输入搜索界面,并按照各待选图片对应的展示顺序进行展示;
所述文字匹配分析模块,用于将目标文字信息划分为各关键词,从而构成目标文字关键词集合,将目标文字关键词集合与各展示网页对应的关联关键词集合进行匹配对比,分析得到各展示网页对应的文本匹配系数;
所述检索文字界面展示模块,用于将各展示网页对应的文本匹配系数按照从大到小的顺序进行排序,并作为各展示网页对应的展示顺序,由此将各展示网页对应的展示顺序发送至用户输入搜索界面,并按照各展示网页对应的展示顺序进行展示。
10.一种网页搜索内容匹配存储介质,其特征在于:所述网页搜索内容匹配存储介质烧录有计算机程序,所述计算机程序在服务器的内存中运行时实现上述权利要求1-8任一项所述的网页搜索内容匹配方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210955863.9A CN115309988B (zh) | 2022-08-10 | 2022-08-10 | 一种网页搜索内容匹配方法、系统及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210955863.9A CN115309988B (zh) | 2022-08-10 | 2022-08-10 | 一种网页搜索内容匹配方法、系统及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115309988A true CN115309988A (zh) | 2022-11-08 |
CN115309988B CN115309988B (zh) | 2023-07-07 |
Family
ID=83860816
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210955863.9A Active CN115309988B (zh) | 2022-08-10 | 2022-08-10 | 一种网页搜索内容匹配方法、系统及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115309988B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116595142A (zh) * | 2023-05-19 | 2023-08-15 | 大安健康科技(北京)有限公司 | 基于医疗语义分析的检索匹配方法及系统 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020164074A1 (en) * | 1996-11-20 | 2002-11-07 | Masakazu Matsugu | Method of extracting image from input image using reference image |
CN102915372A (zh) * | 2012-11-06 | 2013-02-06 | 成都理想境界科技有限公司 | 图像检索方法、装置及系统 |
CN105069466A (zh) * | 2015-07-24 | 2015-11-18 | 成都市高博汇科信息科技有限公司 | 基于数字图像处理的行人服饰颜色识别方法 |
CN105931178A (zh) * | 2016-04-15 | 2016-09-07 | 乐视控股(北京)有限公司 | 一种图像处理方法及装置 |
CN108305278A (zh) * | 2018-01-30 | 2018-07-20 | 西南交通大学 | 一种orb-slam算法中图像匹配相关性改进方法 |
CN108804993A (zh) * | 2018-03-13 | 2018-11-13 | 周慧 | 基于修正式图像处理的搜索方法 |
CN110705283A (zh) * | 2019-09-06 | 2020-01-17 | 上海交通大学 | 基于文本法律法规与司法解释匹配的深度学习方法和系统 |
CN111160361A (zh) * | 2019-11-18 | 2020-05-15 | 中国科学院自动化研究所 | 一种图像分类方法、装置以及计算机可读介质 |
CN113282834A (zh) * | 2021-06-16 | 2021-08-20 | 武汉瑞通慧行电子商务有限公司 | 基于移动互联网数据深度挖掘的网页搜索智能排序方法、系统和计算机存储介质 |
-
2022
- 2022-08-10 CN CN202210955863.9A patent/CN115309988B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020164074A1 (en) * | 1996-11-20 | 2002-11-07 | Masakazu Matsugu | Method of extracting image from input image using reference image |
CN102915372A (zh) * | 2012-11-06 | 2013-02-06 | 成都理想境界科技有限公司 | 图像检索方法、装置及系统 |
CN105069466A (zh) * | 2015-07-24 | 2015-11-18 | 成都市高博汇科信息科技有限公司 | 基于数字图像处理的行人服饰颜色识别方法 |
CN105931178A (zh) * | 2016-04-15 | 2016-09-07 | 乐视控股(北京)有限公司 | 一种图像处理方法及装置 |
CN108305278A (zh) * | 2018-01-30 | 2018-07-20 | 西南交通大学 | 一种orb-slam算法中图像匹配相关性改进方法 |
CN108804993A (zh) * | 2018-03-13 | 2018-11-13 | 周慧 | 基于修正式图像处理的搜索方法 |
CN110705283A (zh) * | 2019-09-06 | 2020-01-17 | 上海交通大学 | 基于文本法律法规与司法解释匹配的深度学习方法和系统 |
CN111160361A (zh) * | 2019-11-18 | 2020-05-15 | 中国科学院自动化研究所 | 一种图像分类方法、装置以及计算机可读介质 |
CN113282834A (zh) * | 2021-06-16 | 2021-08-20 | 武汉瑞通慧行电子商务有限公司 | 基于移动互联网数据深度挖掘的网页搜索智能排序方法、系统和计算机存储介质 |
Non-Patent Citations (2)
Title |
---|
ARNAV ACHARYYA 等: "DEPTH ESTIMATION FROM FOCUS AND DISPARITY", 《2016 IEEE INTERNATIONAL CONFERENCE ON IMAGE PROCESSING (ICIP)》 * |
郑涛 等: "基于特征匹配预估的Mean Shift运动检测与跟踪", 《传感器与微系统》 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116595142A (zh) * | 2023-05-19 | 2023-08-15 | 大安健康科技(北京)有限公司 | 基于医疗语义分析的检索匹配方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN115309988B (zh) | 2023-07-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9007647B2 (en) | Methods and apparatus to identify images in print advertisements | |
US9400808B2 (en) | Color description analysis device, color description analysis method, and color description analysis program | |
CN102750347B (zh) | 一种用于图像或视频搜索重排序的方法 | |
CN102110123B (zh) | 倒排索引建立方法 | |
CN108363691B (zh) | 一种用于电力95598工单的领域术语识别系统及方法 | |
CN111814425A (zh) | 一种基于图书文字信息的图书自动排版实现方法 | |
CN107220325A (zh) | 一种基于卷积神经网络的app相似图标检索方法和系统 | |
CN112541922A (zh) | 基于数字图像的试卷布局分割方法、电子设备及存储介质 | |
CN104881668B (zh) | 一种基于代表性局部模式的图像指纹提取方法及系统 | |
CN105183950B (zh) | 一种基于移动终端查阅工程图纸的方法及系统 | |
CN114818710A (zh) | 表格信息提取方法、装置、设备及介质 | |
Li et al. | A multi-level interactive lifelog search engine with user feedback | |
CN104965928B (zh) | 一种基于形状匹配的汉字图像检索方法 | |
CN108304588B (zh) | 一种基于k近邻和模糊模式识别的图像检索方法及系统 | |
CN112148735B (zh) | 一种用于结构化表格数据知识图谱的构建方法 | |
CN111783416B (zh) | 一种利用先验知识构建文档图像数据集的方法 | |
CN115309988B (zh) | 一种网页搜索内容匹配方法、系统及存储介质 | |
CN114579796B (zh) | 机器阅读理解方法及装置 | |
CN116543391A (zh) | 一种结合图像校正的文本数据采集系统及方法 | |
CN114743251B (zh) | 一种基于共享集成卷积神经网络的戏曲人物面部表情识别方法 | |
CN112256909A (zh) | 一种图形商标检索方法、系统、设备及可读存储介质 | |
CN115713775A (zh) | 一种从文档中提取表格的方法、系统和计算机设备 | |
CN114332866A (zh) | 一种基于图像处理的文献曲线分离与坐标信息提取方法 | |
CN112560849B (zh) | 基于神经网络算法的文理分割方法及系统 | |
CN111563181B (zh) | 数字图像文件查询方法、装置及可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20230614 Address after: 201800 16-1, No. 188, Nan'an Road, Jiading District, Shanghai Applicant after: SHANGHAI DATABANK DATA TECHNOLOGY CO.,LTD. Address before: 430021 No. 17, tangjiadun Road, Jianghan District, Wuhan City, Hubei Province Applicant before: Wuhan Shengnan Brand Management Co.,Ltd. |
|
GR01 | Patent grant | ||
GR01 | Patent grant |