CN105095498A - 信息处理方法和信息处理装置 - Google Patents

信息处理方法和信息处理装置 Download PDF

Info

Publication number
CN105095498A
CN105095498A CN201510524129.7A CN201510524129A CN105095498A CN 105095498 A CN105095498 A CN 105095498A CN 201510524129 A CN201510524129 A CN 201510524129A CN 105095498 A CN105095498 A CN 105095498A
Authority
CN
China
Prior art keywords
image
web page
target image
original web
displaying contents
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510524129.7A
Other languages
English (en)
Inventor
姜宇宁
印奇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Megvii Technology Co Ltd
Beijing Aperture Science and Technology Ltd
Original Assignee
Beijing Megvii Technology Co Ltd
Beijing Aperture Science and Technology Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Megvii Technology Co Ltd, Beijing Aperture Science and Technology Ltd filed Critical Beijing Megvii Technology Co Ltd
Priority to CN201510524129.7A priority Critical patent/CN105095498A/zh
Publication of CN105095498A publication Critical patent/CN105095498A/zh
Priority to US14/983,161 priority patent/US20170060825A1/en
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0277Online advertisement
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • G06F16/972Access to data in other repository systems, e.g. legacy data or dynamic Web page generation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/60Editing figures and text; Combining figures or text

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Databases & Information Systems (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明提供了一种信息处理方法和信息处理设备,所述信息处理方法包括:获取原始网页;解析所述原始网页,以确定目标图像;对所述目标图像和与所述目标图像相关联的上下文中的至少一个进行分析,以得到所述原始网页的内容特征;基于所述内容特征,确定与所述内容特征匹配的显示内容;将所述显示内容插入所述原始网页中与所述目标图像对应的目标区域,以得到目标网页;以及输出所述目标网页。

Description

信息处理方法和信息处理装置
技术领域
本发明涉及信息处理的领域,更具体地,本发明涉及一种信息处理方法和信息处理装置。
背景技术
随着互联网技术的发展,出现了在用户浏览的网页中插入额外的信息的技术。在这样的技术中,期望所插入的信息是用户所感兴趣的,而且,所插入的信息的显示既显著又不影响用户的正常浏览体验。
以互联网广告为例,在现有的互联网展示广告的投放方法中,通过对诸如用户浏览记录的用户过往行为进行分析而确定用户的兴趣点,并且将与用户兴趣点匹配的广告插入到用户当前浏览的网页中。然而,在这样的投放方法中,首先,由于基于用户过往的行为而分析用户当前的兴趣点,而用户的兴趣点是随时可能改变的,因此,这样的兴趣点挖掘有可能出现偏差,导致投放精度下降。其次,广告要么插入在网页正文部分的显著区域,要么插入在页面中的非显著区域。在前者的情况下,严重影响用户的浏览感受,降低用户体验;在后者的情况下,常常会被用户忽视,导致投放效果不佳。而且,无论哪种情况,广告的显示与所浏览的页面的显示都没有进行匹配,显得突兀、不美观,从而也降低了用户体验。
发明内容
有鉴于上述情况,本发明提供了一种信息处理方法和信息处理装置,其能够在网页中以显著而不影响用户阅读体验的方式插入与当前网页的内容相匹配的信息。
根据本发明一实施例,提供了一种信息处理方法,包括:获取原始网页;解析所述原始网页,以确定目标图像;对所述目标图像和与所述目标图像相关联的上下文中的至少一个进行分析,以得到所述原始网页的内容特征;基于所述内容特征,确定与所述内容特征匹配的显示内容;将所述显示内容插入所述原始网页中与所述目标图像对应的目标区域,以得到目标网页;以及输出所述目标网页。
根据本发明另一实施例,提供了一种信息处理装置,包括:获取单元,获取原始网页;解析单元,解析所述原始网页,以确定目标图像;分析单元,对所述目标图像和与所述目标图像相关联的上下文中的至少一个进行分析,以得到所述原始网页的内容特征;确定单元,基于所述内容特征,确定与所述内容特征匹配的显示内容;插入单元,将所述显示内容插入所述原始网页中与所述目标图像对应的目标区域,以得到目标网页;以及输出单元,输出所述目标网页。
根据本发明另一实施例,提供了一种信息处理装置,包括:处理器;存储器;和存储在所述存储器中的计算机程序指令,在所述计算机程序指令被所述处理器运行时执行以下步骤:获取原始网页;解析所述原始网页,以确定目标图像;对所述目标图像和与所述目标图像相关联的上下文中的至少一个进行分析,以得到所述原始网页的内容特征;基于所述内容特征,确定与所述内容特征匹配的显示内容;将所述显示内容插入所述原始网页中与所述目标图像对应的目标区域,以得到目标网页;以及输出所述目标网页。
根据本发明另一实施例,提供了一种计算机程序产品,包括计算机可读存储介质,在所述计算机可读存储介质上存储了计算机程序指令,所述计算机程序指令在被计算机运行时执行以下步骤:获取原始网页;解析所述原始网页,以确定目标图像;对所述目标图像和与所述目标图像相关联的上下文中的至少一个进行分析,以得到所述原始网页的内容特征;基于所述内容特征,确定与所述内容特征匹配的显示内容;将所述显示内容插入所述原始网页中与所述目标图像对应的目标区域,以得到目标网页;以及输出所述目标网页。
在本发明实施例的信息处理方法和信息处理装置中,对网页中的图像和上下文中的至少一个分析以得到网页的内容特征,并在网页的目标区域中插入与所述内容特征匹配的显示内容,从而能够在网页中以显著而不影响用户阅读体验的方式插入与当前网页的内容特征相匹配的信息。
附图说明
图1是图示根据本发明实施例的信息处理方法的流程图;
图2A-2D是图示应用本发明实施例的信息处理方法的场景的示意图;
图3是图示根据本发明实施例的信息处理装置的主要配置的框图;以及
图4是图示根据本发明另一实施例的信息处理装置的主要配置的框图。
具体实施方式
以下将参考附图详细描述本发明实施例。
首先,参照图1描述根据本发明实施例的信息处理方法。
如图1所示,首先,在步骤S110,获取原始网页。
具体地,当用户访问网页时,根据用户的访问请求获取所述网页(为区别起见,以下适当时称为原始网页)的地址。
接下来,在步骤S120,解析所述原始网页,以确定目标图像。
具体地,可以解析所述原始网页的代码,从而获取所述原始网页中每个图像的图像信息。所述图像信息表示图像的属性,例如包括但不限于图像尺寸、图像位置、图像显著程度等中的至少一个及其任意组合。
然后,可以基于所述图像信息,从所述原始网页中的所有图像中确定所述目标图像。
具体地,例如,可确定关于目标图像的选择标准。在第一示例中,所述选择标准可以为图像尺寸大于预定尺寸阈值。在第二示例中,所述选择标准可以为图像位置位于预定范围内。在第三示例中,所述选择标准可以为图像显著程度大于预定显著程度阈值。以上所述的预定尺寸阈值、预定范围和预定显著程度阈值可以由本领域技术人员根据需要适当地设置,在此不作具体限定。此外,以上所述的仅为示例。本领域技术人员可以根据图像信息而设计其他各种相应的选择标准。
由此,可以确定每个图像的图像信息是否符合所述选择标准,并将符合选择标准的一个或多个图像确定为目标图像。
接下来,在步骤S130,对所述目标图像和与所述目标图像相关联的上下文中的至少一个进行分析,以得到所述原始网页的内容特征。
所述内容特征包括图像内容特征和上下文内容特征中的至少一个。具体地,一方面,可以对所述目标图像进行图像识别处理,以得到所述图像内容特征。更具体地,可以通过例如人脸识别、文字识别、物体识别、场景识别等的各种识别方式,对所述目标图像进行图像识别,以得到相应的图像内容特征。例如,可通过人脸识别而检测出目标图像中是否包含人脸。可通过文字识别而检测出目标图像中是否包含文字(及文字内容),例如书本、街店招牌等。可通过物体识别而检测出目标图像中是否包含特定物体,如汽车、自行车、房屋等。可通过场景识别而检测出目标图像是否对应于特定场景,如室内、森林、海滩等。在通过如上所述的识别而获得相应的识别结果之后,可以对所述目标图像加相应的标签,如“人脸”,等等。图像识别的具体处理为本领域技术人员所知,在此不再详述。
另一方面,可以对与所述目标图像相关联的上下文进行自然语言处理,以得到所述上下文内容特征。
更具体地,所述上下文与所述目标图像相关联。在一示例中,所述上下文与所述目标图像之间的距离小于预定义的距离。例如,所述上下文为紧挨所述目标图像之上和之下的词、语句或段落等等。在另一示例中,所述上下文为包含预定关键词的语句或段落等等。所述预定关键词例如为“下图”、“上图”等等。当然,本领域技术人员可以设计其他各种上下文与目标图像之间的关联方式,在此不再详述。
由此,可以通过例如自然语言处理等的各种方法来分析出上下文内容特征。更具体地,所采用的自然语言处理方法例如为基于词向量的方法、基于深度学习的方法等等,其具体处理为本领域技术人员所知,在此不再详述。
在得到包括上下文内容特征和图像内容特征中的至少一个的内容特征之后,所述信息处理方法进行到步骤S140,基于所述内容特征,确定与所述内容特征匹配的显示内容。
具体地,首先,可以基于所述内容特征,确定意图浏览所述原始网页的用户的兴趣点。更具体地,可以基于所述内容特征,利用机器学习等的方法来挖掘用户的兴趣点,其具体处理为本领域技术人员所知,在此不再详述。
接下来,可以从内容库中确定与所述兴趣点匹配的显示内容。也就是说,所述内容库中可以预先存储各方面的显示内容,从而可以从中确定与所述兴趣点匹配的特定方面的显示内容。
以展示广告的投放为例,所述内容库例如为应用所述信息处理方法的装置(如,服务器)自身的广告库或第三方广告交易平台等,其中存储了诸如食品、运动、旅游等各方面的广告物料。在通过如上所述的步骤S110-S130的处理基于用户当前期望浏览的网页而确定了用户当前的兴趣点之后,从广告库或第三方广告交易平台中确定相应的广告物料,以便有针对性的投放。
然后,在步骤S140,将所述显示内容插入所述原始网页中与所述目标图像对应的目标区域,以得到目标网页。
具体地,所述目标区域可以为所述目标图像所在的区域中最适合插入所述显示内容(例如,广告)的区域。在第一示例中,可以简单地将所述目标图像所在的区域中的特定位置(如中间区域、或某个角落)设置为所述目标区域。在第二示例中,可以更智能地设置所述目标区域,使其与目标图像的内容相关联。例如,可以将目标区域设置为与所述目标图像中的大片色调相对单一的图像元素对应的区域。具体地,可通过对所述目标图像进行图像分割处理或显著区域检测处理,以确定所述目标图像中最适合插入所述显示内容的区域,作为所述目标区域。
此外,在此步骤中,还可以根据所述目标区域的性质调整所述显示内容的显示属性,并将调整后的显示内容插入所述目标区域。具体地,所述目标区域的性质例如包括但不限于目标区域的大小、形状、颜色、物体属性等中的至少一个或其任意组合。所述显示内容的显示属性例如包括但不限于显示内容的颜色、对比度、大小、外形等中的至少一个或其任意组合。由此,能够使得显示内容与目标图像之间更加协调。
最后,在步骤S150,输出所述目标网页。在一示例中,本发明实施例的信息处理方法可以应用于例如服务器。所述服务器与诸如手机、计算机等的用户终端进行通信。由此,所述服务器将所述目标网页发送回所述用户终端,以在所述用户终端上进行显示。替代地,在所述用户终端的处理能力较强的情况下,所述信息处理方法也可应用于所述用户终端。由此,在此步骤,所述用户终端直接显示所述目标网页。
下面,将结合图2,假设显示内容为广告,描述本发明实施例的信息处理方法的示例性应用场景。
图2A示出了根据用户的访问请求原本应显示的原始网页,其中包含两个图像:第一图像210和第二图像220。通过解析所述原始网页的代码可知,所述第一图像210位于网页中间且图像尺寸大于阈值,而第二图像220位于网页角落且图像尺寸小于阈值,由此,将第一图像210确定为目标图像。
图2B放大示出了所述目标图像。通过对目标图像进行图像识别,识别出目标图像为海滩风景,用户兴趣点为旅游,由此确定与海滩匹配的显示内容,例如,某海岛旅游的旅游公司广告,从而获得含有广告语的物料图像。然后,分析出所述目标图像的下方有大片色调相对单一的图像元素(图像中示例性地为沙滩),因此将其所在区域确定为目标区域。接下来,可以根据所述目标区域的性质调整所述显示内容的显示属性。例如,可根据目标区域的大小调整物料图像的大小。可根据目标区域的颜色(浅黄色)调整物料图像的颜色,使其颜色形状与目标区域相协调,并将调整后的广告物料图像以例如对话框的形式插入到所述目标区域,如图2C所示。最后,输出目标网页,并在用户终端显示如图2D所示的目标网页。
以上,参照图1和图2描述了本发明实施例的信息处理方法。
需要指出的是,虽然上面以广告为例描述了本发明实施例的信息处理方法,然而,本发明不限于此,而是可以应用于各种显示内容的显示。
在本发明实施例的信息处理方法中,对网页中的图像和上下文中的至少一个分析以得到网页的内容特征,并在网页的目标区域中插入与所述内容特征匹配的显示内容,从而能够在网页中以显著而不影响用户阅读体验的方式插入与当前网页的内容特征相匹配的信息。
在本发明实施例的信息处理方法应用于展示广告的投放时,可以投放与当前网页的图像/文字相关联的广告。具体地,可以基于当前网页精准地挖掘用户当前可能感兴趣的点并实时地推荐相应广告。
此外,在本发明实施例的信息处理方法中,广告可以采用基于图像的广告展现形式,即,可以插入在当前网页的特定图像所在的区域中,因此,既醒目又不会打断用户对于网页的阅读体验。而且,这样的展现形式无需额外的广告位,这在屏幕大小受限时(如应用于手机显示的情况下)尤为有利。
此外,在本发明实施例的信息处理方法中,可以根据目标图像的性质确定广告物料的显示区域及其显示属性,因此,使得广告的展示更加美观协调。
此外,在本发明实施例的信息处理方法中,通过诸如机器学习算法等的算法自动得到网页的内容特征并挖掘用户的兴趣点,并且通过诸如图像分割处理或显著区域检测处理等的处理自动确定目标区域,在上述过程中都无需人工标注,因此,提高了处理效率,缩短了处理时间。
下面,将参照图3描述本发明实施例的信息处理装置。
图3是图示根据本发明实施例的信息处理装置的主要配置的框图。如图3所示,本发明实施例的信息处理装置300包括:获取单元310、解析单元320、分析单元330、确定单元340、插入单元350和输出单元360。
具体地,获取单元310获取原始网页。解析单元320解析所述原始网页,以确定目标图像。分析单元330对所述目标图像和与所述目标图像相关联的上下文中的至少一个进行分析,以得到所述原始网页的内容特征。确定单元340基于所述内容特征,确定与所述内容特征匹配的显示内容。插入单元350所述显示内容插入所述原始网页中与所述目标图像对应的目标区域,以得到目标网页。输出单元360输出所述目标网页。
在一实施例中,所述解析单元320包括:图像信息获取单元,解析所述原始网页的代码,以获取所述原始网页中每个图像的图像信息,所述图像信息包括图像尺寸、图像位置、图像显著程度中的至少一个;以及目标图像确定单元,基于所述图像信息,从所述原始网页中的所有图像中确定所述目标图像。
在另一实施例中,所述原始网页的内容特征包括图像内容特征和上下文内容特征中的至少一个;并且,所述分析单元330包括以下中的至少一个:图像识别单元,对所述目标图像进行图像识别处理,以得到所述图像内容特征;自然语言处理单元,对与所述目标图像相关联的上下文进行自然语言处理,以得到所述上下文内容特征。
在另一实施例中,所述确定单元340包括:兴趣点确定单元,基于所述内容特征,确定意图浏览所述原始网页的用户的兴趣点;以及匹配内容确定单元,从内容库中确定与所述兴趣点匹配的显示内容。
在另一实施例中,所述插入单元350包括:属性调整单元,根据所述目标区域的性质调整所述显示内容的显示属性;以及内容插入单元,将调整后的显示内容插入所述目标区域。
在另一实施例中,所述插入单元350包括:目标区域确定单元,对所述目标图像进行图像分割处理或显著区域检测处理,以确定所述目标图像中最适合插入所述显示内容的区域,作为所述目标区域;以及内容插入单元,将所述显示内容插入所述目标区域。
所述信息处理装置300的各个单元的功能和配置已经在参照图1所述的信息处理方法中详细描述,在此不再重复。
图4是图示根据本发明另一实施例的信息处理装置的主要配置的框图。
如图4所示,本发明实施例的信息处理装置400主要包括:一个或多个处理器410和存储器420,这些组件通过总线系统430和/或其它形式的连接机构(未示出)互连。应当注意,图4所示的信息处理装置400的组件和结构只是示例性的,而非限制性的,根据需要,信息处理装置400也可以具有其他组件和结构。
处理器410可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其它形式的处理单元,并且可以控制信息处理装置400中的其它组件以执行期望的功能。
存储器420可以包括一个或多个计算机程序产品,所述计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器420可以运行所述程序指令,以实现本发明实施例的信息处理方法的功能以及/或者其它期望的功能。
以上,参照图3和图4描述了本发明实施例的信息处理装置。
在本发明实施例的信息处理装置中,对网页中的图像和上下文中的至少一个分析以得到网页的内容特征,并在网页的目标区域中插入与所述内容特征匹配的显示内容,从而能够在网页中以显著而不影响用户阅读体验的方式插入与当前网页的内容特征相匹配的信息。
在本发明实施例的信息处理装置应用于展示广告的投放时,可以投放与当前网页的图片/文字相关联的广告。具体地,可以基于当前网页精准地挖掘用户当前可能感兴趣的点并实时地推荐相应广告。
此外,在本发明实施例的信息处理装置中,广告可以采用基于图像的广告展现形式,即,可以插入在当前网页的特定图像所在的区域中,因此,既醒目又不会打断用户对于网页的阅读体验。而且,这样的展现形式无需额外的广告位,这在屏幕大小受限时(如应用于手机的情况下)尤为有利。
此外,在本发明实施例的信息处理装置中,可以根据目标图像的性质确定广告物料的显示区域及其显示属性,因此,使得广告的展示更加美观协调。
此外,在本发明实施例的信息处理装置中,通过诸如机器学习算法等的算法自动得到网页的内容特征并挖掘用户的兴趣点,并且通过诸如图像分割处理或显著区域检测处理等的处理自动确定目标区域,在上述过程中都无需人工标注,因此,提高了处理效率,缩短了处理时间。
此外,根据本发明另一实施例,提供了一种用于信息处理的计算机程序产品,该计算机程序产品包括计算机可读存储介质,在所述计算机可读存储介质上存储了计算机程序指令,所述计算机程序指令可由处理器执行以使得所述处理器执行以下处理:获取原始网页;解析所述原始网页,以确定目标图像;对所述目标图像和与所述目标图像相关联的上下文中的至少一个进行分析,以得到所述原始网页的内容特征;基于所述内容特征,确定与所述内容特征匹配的显示内容;将所述显示内容插入所述原始网页中与所述目标图像对应的目标区域,以得到目标网页;以及输出所述目标网页。
需要说明的是,在本说明书中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
此外,需要说明的是,在本说明书中,类似“第一…单元”、“第二...单元”的表述仅为了在描述时方便区分,而并不意味着其必须实现为物理分离的两个或多个单元。事实上,根据需要,所述单元可以整体实现为一个单元,也可以实现为多个单元。
最后,还需要说明的是,上述一系列处理不仅包括以这里所述的顺序按时间序列执行的处理,而且包括并行或分别地、而不是按时间顺序执行的处理。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本发明可借助软件加必需的硬件平台的方式来实现,当然也可以全部通过硬件来实施。基于这样的理解,本发明的技术方案对背景技术做出贡献的全部或者部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。
在本发明实施例中,单元/模块可以用软件实现,以便由各种类型的处理器执行。举例来说,一个标识的可执行代码模块可以包括计算机指令的一个或多个物理或者逻辑块,举例来说,其可以被构建为对象、过程或函数。尽管如此,所标识模块的可执行代码无需物理地位于一起,而是可以包括存储在不同位里上的不同的指令,当这些指令逻辑上结合在一起时,其构成单元/模块并且实现该单元/模块的规定目的。
在单元/模块可以利用软件实现时,考虑到现有硬件工艺的水平,所以可以以软件实现的单元/模块,在不考虑成本的情况下,本领域技术人员都可以搭建对应的硬件电路来实现对应的功能,所述硬件电路包括常规的超大规模集成(VLSI)电路或者门阵列以及诸如逻辑芯片、晶体管之类的现有半导体或者是其它分立的元件。模块还可以用可编程硬件设备,诸如现场可编程门阵列、可编程阵列逻辑、可编程逻辑设备等实现。
以上对本发明进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (12)

1.一种信息处理方法,包括:
获取原始网页;
解析所述原始网页,以确定目标图像;
对所述目标图像和与所述目标图像相关联的上下文中的至少一个进行分析,以得到所述原始网页的内容特征;
基于所述内容特征,确定与所述内容特征匹配的显示内容;
将所述显示内容插入所述原始网页中与所述目标图像对应的目标区域,以得到目标网页;以及
输出所述目标网页。
2.如权利要求1所述的信息处理方法,其中,解析所述原始网页的步骤包括:
解析所述原始网页的代码,以获取所述原始网页中每个图像的图像信息,所述图像信息包括图像尺寸、图像位置、图像显著程度中的至少一个;以及
基于所述图像信息,从所述原始网页中的所有图像中确定所述目标图像。
3.如权利要求1所述的信息处理方法,其中,所述原始网页的内容特征包括图像内容特征和上下文内容特征中的至少一个;并且,对所述目标图像和与所述目标图像相关联的上下文中的至少一个进行分析的步骤包括以下至少之一:
对所述目标图像进行图像识别处理,以得到所述图像内容特征;
对与所述目标图像相关联的上下文进行自然语言处理,以得到所述上下文内容特征。
4.如权利要求1所述的信息处理方法,其中,确定与所述内容特征匹配的显示内容的步骤包括:
基于所述内容特征,确定意图浏览所述原始网页的用户的兴趣点;以及
从内容库中确定与所述兴趣点匹配的显示内容。
5.如权利要求1所述的信息处理方法,其中,将所述显示内容插入所述原始网页中与所述目标图像对应的目标区域的步骤包括:
根据所述目标区域的性质调整所述显示内容的显示属性;以及
将调整后的显示内容插入所述目标区域。
6.如权利要求1所述的信息处理方法,其中,将所述显示内容插入所述原始网页中与所述目标图像对应的目标区域的步骤包括:
对所述目标图像进行图像分割处理或显著区域检测处理,以确定所述目标图像中最适合插入所述显示内容的区域,作为所述目标区域;以及
将所述显示内容插入所述目标区域。
7.一种信息处理装置,包括:
获取单元,获取原始网页;
解析单元,解析所述原始网页,以确定目标图像;
分析单元,对所述目标图像和与所述目标图像相关联的上下文中的至少一个进行分析,以得到所述原始网页的内容特征;
确定单元,基于所述内容特征,确定与所述内容特征匹配的显示内容;
插入单元,将所述显示内容插入所述原始网页中与所述目标图像对应的目标区域,以得到目标网页;以及
输出单元,输出所述目标网页。
8.如权利要求7所述的信息处理装置,其中,所述解析单元包括:
图像信息获取单元,解析所述原始网页的代码,以获取所述原始网页中每个图像的图像信息,所述图像信息包括图像尺寸、图像位置、图像显著程度中的至少一个;以及
目标图像确定单元,基于所述图像信息,从所述原始网页中的所有图像中确定所述目标图像。
9.如权利要求7所述的信息处理装置,其中,所述原始网页的内容特征包括图像内容特征和上下文内容特征中的至少一个;并且,所述分析单元包括以下中的至少一个:
图像识别单元,对所述目标图像进行图像识别处理,以得到所述图像内容特征;
自然语言处理单元,对与所述目标图像相关联的上下文进行自然语言处理,以得到所述上下文内容特征。
10.如权利要求7所述的信息处理装置,其中,所述确定单元包括:
兴趣点确定单元,基于所述内容特征,确定意图浏览所述原始网页的用户的兴趣点;以及
匹配内容确定单元,从内容库中确定与所述兴趣点匹配的显示内容。
11.如权利要求7所述的信息处理装置,其中,所述插入单元包括:
属性调整单元,根据所述目标区域的性质调整所述显示内容的显示属性;以及
内容插入单元,将调整后的显示内容插入所述目标区域。
12.如权利要求7所述的信息处理装置,其中,所述插入单元包括:
目标区域确定单元,对所述目标图像进行图像分割处理或显著区域检测处理,以确定所述目标图像中最适合插入所述显示内容的区域,作为所述目标区域;以及
内容插入单元,将所述显示内容插入所述目标区域。
CN201510524129.7A 2015-08-24 2015-08-24 信息处理方法和信息处理装置 Pending CN105095498A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201510524129.7A CN105095498A (zh) 2015-08-24 2015-08-24 信息处理方法和信息处理装置
US14/983,161 US20170060825A1 (en) 2015-08-24 2015-12-29 Information processing method and information processing apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510524129.7A CN105095498A (zh) 2015-08-24 2015-08-24 信息处理方法和信息处理装置

Publications (1)

Publication Number Publication Date
CN105095498A true CN105095498A (zh) 2015-11-25

Family

ID=54575933

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510524129.7A Pending CN105095498A (zh) 2015-08-24 2015-08-24 信息处理方法和信息处理装置

Country Status (2)

Country Link
US (1) US20170060825A1 (zh)
CN (1) CN105095498A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105512220A (zh) * 2015-11-30 2016-04-20 小米科技有限责任公司 图像页面输出方法及装置
CN106204165A (zh) * 2016-08-11 2016-12-07 广州出益信息科技有限公司 一种广告投放方法及装置
CN107169135A (zh) * 2017-06-12 2017-09-15 广州市动景计算机科技有限公司 图像处理方法、装置和电子设备
CN107679128A (zh) * 2017-09-21 2018-02-09 北京金山安全软件有限公司 一种信息展示方法、装置、电子设备及存储介质
WO2018130069A1 (zh) * 2017-01-13 2018-07-19 优视科技有限公司 图集内容承载页生成方法、装置、计算设备以及存储介质
CN110147817A (zh) * 2019-04-11 2019-08-20 北京搜狗科技发展有限公司 训练数据集生成方法及装置

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111815340B (zh) * 2019-04-12 2023-09-01 百度在线网络技术(北京)有限公司 推广信息确定方法、装置、设备及可读存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090125544A1 (en) * 2007-11-09 2009-05-14 Vibrant Media, Inc. Intelligent Augmentation Of Media Content
CN102662950A (zh) * 2012-02-29 2012-09-12 北京明日时尚信息技术有限公司 基于互联网图片的主动式广告的生成方法
CN104268168A (zh) * 2014-09-10 2015-01-07 百度在线网络技术(北京)有限公司 一种向用户推送信息的方法与装置
US20150186341A1 (en) * 2013-12-26 2015-07-02 Joao Redol Automated unobtrusive scene sensitive information dynamic insertion into web-page image

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7542610B2 (en) * 2005-05-09 2009-06-02 Like.Com System and method for use of images with recognition analysis
US8136028B1 (en) * 2007-02-02 2012-03-13 Loeb Enterprises Llc System and method for providing viewers of a digital image information about identifiable objects and scenes within the image
US20090316961A1 (en) * 2008-06-21 2009-12-24 Microsoft Corporation Method for tagging image content
US20090327076A1 (en) * 2008-06-27 2009-12-31 Microsoft Corporation Ad targeting based on user behavior
US8352321B2 (en) * 2008-12-12 2013-01-08 Microsoft Corporation In-text embedded advertising
US20110112995A1 (en) * 2009-10-28 2011-05-12 Industrial Technology Research Institute Systems and methods for organizing collective social intelligence information using an organic object data model
US20110125576A1 (en) * 2009-11-21 2011-05-26 Veruta, Inc. Serving dynamic advertisments based on user interest of a product
US9661088B2 (en) * 2013-07-01 2017-05-23 24/7 Customer, Inc. Method and apparatus for determining user browsing behavior
US9471601B2 (en) * 2014-03-25 2016-10-18 International Business Machines Corporation Images for a question answering system
US20160140626A1 (en) * 2014-10-12 2016-05-19 Atul Agarwal Web page advertisement configuration and optimization with visual editor and automatic website and webpage analysis

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090125544A1 (en) * 2007-11-09 2009-05-14 Vibrant Media, Inc. Intelligent Augmentation Of Media Content
CN102662950A (zh) * 2012-02-29 2012-09-12 北京明日时尚信息技术有限公司 基于互联网图片的主动式广告的生成方法
US20150186341A1 (en) * 2013-12-26 2015-07-02 Joao Redol Automated unobtrusive scene sensitive information dynamic insertion into web-page image
CN104268168A (zh) * 2014-09-10 2015-01-07 百度在线网络技术(北京)有限公司 一种向用户推送信息的方法与装置

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105512220A (zh) * 2015-11-30 2016-04-20 小米科技有限责任公司 图像页面输出方法及装置
CN105512220B (zh) * 2015-11-30 2018-12-11 小米科技有限责任公司 图像页面输出方法及装置
CN106204165A (zh) * 2016-08-11 2016-12-07 广州出益信息科技有限公司 一种广告投放方法及装置
WO2018130069A1 (zh) * 2017-01-13 2018-07-19 优视科技有限公司 图集内容承载页生成方法、装置、计算设备以及存储介质
CN107169135A (zh) * 2017-06-12 2017-09-15 广州市动景计算机科技有限公司 图像处理方法、装置和电子设备
CN107679128A (zh) * 2017-09-21 2018-02-09 北京金山安全软件有限公司 一种信息展示方法、装置、电子设备及存储介质
CN107679128B (zh) * 2017-09-21 2020-05-05 北京金山安全软件有限公司 一种信息展示方法、装置、电子设备及存储介质
CN110147817A (zh) * 2019-04-11 2019-08-20 北京搜狗科技发展有限公司 训练数据集生成方法及装置

Also Published As

Publication number Publication date
US20170060825A1 (en) 2017-03-02

Similar Documents

Publication Publication Date Title
CN105117463A (zh) 信息处理方法和信息处理装置
CN105095498A (zh) 信息处理方法和信息处理装置
CN109618222B (zh) 一种拼接视频生成方法、装置、终端设备及存储介质
US10672052B2 (en) Method, apparatus, system, and computer program for offering and displaying product information
CN102567543B (zh) 一种服装图片的搜索方法和装置
US8675957B2 (en) Image quality assessment to merchandise an item
US20190340649A1 (en) Generating and providing augmented reality representations of recommended products based on style compatibility in relation to real-world surroundings
CN102855480A (zh) 一种图像文字识别方法和装置
CN112215171B (zh) 目标检测方法、装置、设备及计算机可读存储介质
CN107766349B (zh) 一种生成文本的方法、装置、设备及客户端
US20130339139A1 (en) System and method for nonstandard creative content auctioning
CN102831117B (zh) 选择字体、字体的确定、推荐、生成方法及其设备
CN109690471A (zh) 使用取向元数据的媒体渲染
US20210072880A1 (en) Method and electronic device for generating at least one data item from screenshot
CN104794220A (zh) 信息搜索方法和信息搜索装置
WO2021098310A1 (zh) 视频生成方法、装置、终端以及存储介质
CN107391535A (zh) 在文档应用中搜索文档的方法及装置
CN105373593A (zh) 一种展示网页中目标元素的方法及装置
US20160171548A1 (en) Method for identifying advertisements for placement in multimedia content elements
CN115203539A (zh) 一种媒体内容推荐方法、装置、设备及存储介质
KR102119730B1 (ko) 전자 문서에 적용 가능한 템플릿을 이미지로부터 추출하는 전자 장치 및 그의 동작 방법
CN110363206B (zh) 数据对象的聚类、数据处理及数据识别方法
CN115222464A (zh) 数据处理方法、装置、电子设备和存储介质
CN104933140B (zh) 一种基于图像的媒体互动方法
CN108460131B (zh) 一种分类标签处理方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 100080 room A, block, No. 2 South Road, Haidian District Academy of Sciences, Beijing, China

Applicant after: MEGVII INC.

Applicant after: Beijing maigewei Technology Co., Ltd.

Address before: 100080 room A, block, No. 2 South Road, Haidian District Academy of Sciences, Beijing, China

Applicant before: MEGVII INC.

Applicant before: Beijing aperture Science and Technology Ltd.

CB02 Change of applicant information
RJ01 Rejection of invention patent application after publication

Application publication date: 20151125

RJ01 Rejection of invention patent application after publication