CN106021304A - 一种网页地址校正方法及系统 - Google Patents

一种网页地址校正方法及系统 Download PDF

Info

Publication number
CN106021304A
CN106021304A CN201610291185.5A CN201610291185A CN106021304A CN 106021304 A CN106021304 A CN 106021304A CN 201610291185 A CN201610291185 A CN 201610291185A CN 106021304 A CN106021304 A CN 106021304A
Authority
CN
China
Prior art keywords
address
network
character stream
network linking
text character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610291185.5A
Other languages
English (en)
Inventor
常建军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LeTV Holding Beijing Co Ltd
LeTV Mobile Intelligent Information Technology Beijing Co Ltd
Original Assignee
LeTV Holding Beijing Co Ltd
LeTV Mobile Intelligent Information Technology Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LeTV Holding Beijing Co Ltd, LeTV Mobile Intelligent Information Technology Beijing Co Ltd filed Critical LeTV Holding Beijing Co Ltd
Priority to CN201610291185.5A priority Critical patent/CN106021304A/zh
Publication of CN106021304A publication Critical patent/CN106021304A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9566URL specific, e.g. using aliases, detecting broken or misspelled links

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明涉及互联网信息技术领域,尤其涉及一种网页地址校正方法及系统。所述网页地址校正方法包括:步骤100:接收电子邮件,并获取邮件文本字符流;步骤101:判断邮件文本字符流中的网络链接地址是否是错误网络链接地址,如果邮件文本字符流的网络链接地址是错误网络链接地址,执行步骤102;步骤102:识别错误网络链接地址的出错位置,并对该错误网络链接地址的出错位置进行校正,生成正确的网络链接地址。本发明在接收到电子邮件后,检测电子邮件中存在的网络链接地址是否有效,如果网络链接地址错误,则根据WEB地址协议标准找出错误网络链接地址的出错位置,并对出错位置进行校正。本发明操作简单,无需用户手动操作,有利于提升用户的使用体验。

Description

一种网页地址校正方法及系统
技术领域
本发明涉及互联网信息技术领域,尤其涉及一种网页地址校正方法及系统。
背景技术
用户在发送电子邮件时,可在邮件文本中插入网络链接地址,邮件接收用户接收到邮件后,通过点击邮件文本中的网络链接地址,即可打开该网络链接地址并获取网络信息。
现有技术中,用户经常会遇到邮件文本中的网络链接地址由于错误而无法正常打开的情况,而电子邮件并不能自动判断邮件文本中的网络链接地址是否错误。如果需要判断该网络链接地址是否为错误地址,用户需要将该网络链接地址手动拷贝到浏览器,如果浏览器也无法正常打开,则说明该网络链接地址是错误的,操作比较繁琐;且检测出错误网络链接地址后,无法对该错误网络链接地址进行校正,导致用户无法正常获取对应的网络信息,影响用户的使用体验。
发明内容
本发明提供了一种网页地址校正方法及系统,旨在解决现有的电子邮件无法自动判断邮件文本中的网络链接地址是否错误,且无法对错误网络链接地址进行校正的技术问题。
为了解决以上提出的问题,本发明采用的技术方案为:一种网页地址校正方法,包括以下步骤:
步骤100:接收电子邮件,并获取邮件文本字符流;
步骤101:判断邮件文本字符流中的网络链接地址是否是错误网络链接地址,如果邮件文本字符流的网络链接地址是错误网络链接地址,执行步骤102
步骤102:识别错误网络链接地址的出错位置,并对该错误网络链接地址的出错位置进行校正,生成正确的网络链接地址。
本发明实施例采取的技术方案还包括:所述步骤100还包括:将获取的邮件文本字符流保存在本地文本字符串中,并显示邮件文本字符流。
本发明实施例采取的技术方案还包括:所述步骤101还包括:判断邮件文本字符流中是否存在网络链接地址,如果邮件文本字符流中不存在网络链接地址,略过该邮件文本字符流不做校正处理;如果邮件文本字符流中存在网络链接地址,则判断邮件文本字符流中的网络链接地址是否是错误网络链接地址。
本发明实施例采取的技术方案还包括:所述判断邮件文本字符流中是否存在网络链接地址的判断方式为:在邮件文本中有指定链接地址的锚点,通过解析链接地址的锚点判断邮件文本字符流中是否存在网络链接地址。
本发明实施例采取的技术方案还包括:所述判断邮件文本字符流中的网络链接地址是否是错误网络链接地址的判断方式为:建立正则表达式字符串,通过正则表达式字符串过滤邮件文本,对网络链接地址进行匹配,从而确定该网络链接地址是否是错误网络链接地址。
本发明实施例采取的技术方案还包括:在所述步骤102中,所述生成正确的网络链接地址具体包括:根据WEB地址协议标准从邮件文本字符流中对正确的网络链接地址进行识别,找出错误网络链接地址的出错位置,在本地文本字符串中获取正确字符,将获取的正确字符与错误网络链接地址中出错位置的字符进行替换,生成正确的网络链接地址;并删除邮件文本字符流中错误的网络链接地址,将正确的网络链接地址保存在邮件文本字符流中。
本发明实施例采取的另一技术方案为:一种网页地址校正系统,包括邮件接收模块、地址判断模块和地址校正模块,所述邮件接收模块用于接收电子邮件,并获取邮件文本字符流;所述地址判断模块用于判断邮件文本字符流中的网络链接地址是否是错误网络链接地址,如果邮件文本字符流的网络链接地址是错误网络链接地址,通过地址校正模块对错误网络链接地址进行校正;所述地址校正模块用于识别错误网络链接地址的出错位置,并对该错误网络链接地址的出错位置进行校正,生成正确的网络链接地址。
本发明实施例采取的技术方案还包括:还包括存储模块和显示模块,所述存储模块用于将获取的邮件文本字符流保存在本地文本字符串中;所述显示模块用于显示邮件文本字符流。
本发明实施例采取的技术方案还包括:还包括第一判断模块,第一判断模块用于判断邮件文本字符流中是否存在网络链接地址,如果邮件文本字符流中不存在网络链接地址,略过该邮件文本字符流不做校正处理;如果邮件文本字符流中存在网络链接地址,通过地址判断模块判断网络链接地址是否是错误网络链接地址。
本发明实施例采取的技术方案还包括:所述地址校正模块生成正确的网络链接地址具体包括:根据WEB地址协议标准从邮件文本字符流中对正确的网络链接地址进行识别,找出错误网络链接地址的出错位置,在本地文本字符串中获取正确字符,将获取的正确字符与错误网络链接地址中出错位置的字符进行替换,生成正确的网络链接地址;并删除邮件文本字符流中错误的网络链接地址,将正确的网络链接地址保存在邮件文本字符流中。
与现有技术相比,本发明实施例的有益效果在于:本发明实施例的网页地址校正方法及系统在接收到电子邮件后,通过邮件文本字符流判断该电子邮件中是否存在网络链接地址,如果存在网络链接地址,则进一步检测存在的网络链接地址是否有效,如果网络链接地址错误,则根据WEB地址协议标准找出错误网络链接地址的出错位置,并在本地文本字符串中获取正确字符,将获取的正确字符与错误网络链接地址中出错位置的字符进行替换,从而生成正确的网络链接地址。本发明操作简单,无需用户手动操作,有利于提升用户的使用体验。
附图说明
图1为本发明第一实施例的网页地址校正方法的流程图;
图2为本发明第二实施例的网页地址校正方法的流程图;
图3为本发明第一实施例的网页地址校正系统的结构示意图;
图4为本发明第二实施例的网页地址校正系统的结构示意图。
具体实施方式
为了便于理解本发明,下面将参照相关附图对本发明进行更全面的描述。附图中给出了本发明的较佳实施例。但是,本发明可以以许多不同的形式来实现,并不限于本文所描述的实施例。相反地,提供这些实施例的目的是使对本发明的公开内容的理解更加透彻全面。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。
请参阅图1,是本发明第一实施例的网页地址校正方法的流程图。本发明第一实施例的网页地址校正方法包括以下步骤:
步骤100:接收电子邮件,并获取邮件文本字符流;
步骤101:判断邮件文本字符流中的网络链接地址是否是错误网络链接地址,如果邮件文本字符流的网络链接地址是错误网络链接地址,执行步骤102;
步骤102:识别错误网络链接地址的出错位置,并对该错误网络链接地址的出错位置进行校正,生成正确的网络链接地址。
请参阅图2,是本发明第二实施例的网页地址校正方法的流程图。本发明第二实施例的网页地址校正方法包括以下步骤:
步骤200:接收电子邮件,并获取邮件文本的字符流;
在步骤200中,接收电子邮件的方式为通过服务器接收电子邮件,在本发明实施例中,获取的邮件文本格式为HTML文件(HyperText Mark-upLanguage,是一种制作万维网页面的标准语言)格式,HTML文本是目前网络上应用最为广泛的语言,也是构成网页文档的主要语言。HTML文本是由HTML命令组成的描述性文本,HTML命令可以说明文字、图形、动画、声音、表格、链接等。HTML文本的结构包括头部(Head)、主体(Body)两大部分,其中头部描述浏览器所需的信息,而主体则包含所要说明的具体内容。在本发明其他实施例中,邮件文本格式也可为其他格式,例如普通文本格式等。
在步骤200中,获取邮件文本的字符流的获取方式为:通过Stream方式以字符流格式从服务器中下载邮件文本,完成下载后,本地显示的邮件文本是文件流数据。其中,Stream泛指流媒体技术,流媒体技术是一种新的媒体传送方式,是指采用流式传输的方式进行网络播放的媒体格式。
步骤201:将获取的邮件文本字符流保存在本地文本字符串中,并显示邮件文本字符流;
步骤202:判断邮件文本字符流中是否存在网络链接地址,如果邮件文本字符流中不存在网络链接地址,执行步骤203;如果邮件文本字符流中存在网络链接地址,执行步骤204;
在步骤202中,判断邮件文本字符流中是否存在网络链接地址的判断方式为:在HTML文本中有指定链接地址的锚点“<a href/>”,通过解析链接地址的锚点判断邮件文本字符流中是否存在网络链接地址。
步骤203:略过该邮件文本字符流不做校正处理;
步骤204:判断邮件文本字符流中的网络链接地址是否是错误网络链接地址,如果邮件文本字符流中的网络链接地址是有效网络链接地址,执行步骤203;如果邮件文本字符流中的网络链接地址是错误网络链接地址,执行步骤205;
在步骤204中,判断邮件文本字符流中的网络链接地址是否是错误网络链接地址的判断方式为:建立正则表达式字符串<a.*?href=\s*"([^"]*)".*?>(.*?)</a>,通过此正则表达式字符串过滤HTML文本内容,对网络链接地址进行匹配,从而确定该网络链接地址是否是错误网络链接地址。其中,正则表达式(Regular Expression,在代码中常简写为regex、regexp或RE),又称正规表示法或常规表示法,计算机科学的一个概念。正则表达式使用单个字符串来描述、匹配一系列符合某个句法规则的字符串。在很多文本编辑器里,正则表达式通常被用来检索、替换那些符合某个模式的文本。在本发明实施例中,建立正则表达式字符串如下:
步骤205:识别该网络链接地址的出错位置,从本地文本字符串中获取正确字符,通过正确字符对该网络链接地址的出错位置进行校正,生成正确的网络链接地址;
在步骤205中,正确网络链接地址的生成方式包括:通常网络链接地址错误的原因在于:由于编程或其他原因导致网络链接地址中的部分字符错误,使得网络链接地址无法正常加载,本发明实施例根据WEB地址协议标准从邮件文本字符流中对正确的网络链接地址进行识别,找出错误网络链接地址的出错位置,并在本地文本字符串中获取正确字符,将获取的正确字符与错误网络链接地址中出错位置的字符进行替换,从而生成正确的网络链接地址。例如,错误的网络链接地址为:<ahref=”sda”>www.baidu.com</a>,经过系统识别后,找出该网络链接地址中的出错位置,并从文本字符串中获取正确字符,通过正确字符对网络链接地址中的出错位置的自己进行替换,替换后的网络链接地址为:<ahref=http://www.baidu.com>www.baidu.com</a>,用户可通过替换后的网络链接地址进行正常链接操作。
步骤206:删除邮件文本字符流中错误的网络链接地址,将正确的网络链接地址保存在邮件文本字符流中,并根据正确的网络链接地址进行链接操作;
步骤207:判断邮件文本字符流中是否存在两个以上的网络链接地址,如果存在两个以上的网络链接地址,则重新执行步骤204,直到遍历完邮件文本字符流中的所有网络链接地址;如果不存在两个以上的网络链接地址,执行步骤208;
步骤208:结束本次校正操作。
请参阅图3,是本发明第一实施例的网页地址校正系统的结构示意图。本发明第一实施例的网页地址校正系统包括邮件接收模块、地址判断模块和地址校正模块;
邮件接收模块用于接收电子邮件,并获取邮件文本字符流;
地址判断模块用于判断邮件文本字符流中的网络链接地址是否是错误网络链接地址,如果邮件文本字符流的网络链接地址是错误网络链接地址,通过地址校正模块对错误网络链接地址进行校正;
地址校正模块用于识别错误网络链接地址的出错位置,并对该错误网络链接地址的出错位置进行校正,生成正确的网络链接地址。
请参阅图4,是本发明第二实施例的网页地址校正系统的结构示意图。本发明第二实施例的网页地址校正系统包括邮件接收模块、存储模块、显示模块、第一判断模块、地址判断模块、地址校正模块和第二判断模块;
邮件接收模块用于接收电子邮件,并获取邮件文本的字符流;其中,邮件接收模块接收电子邮件的方式为通过服务器接收电子邮件,在本发明实施例中,获取的邮件文本格式为HTML文本。邮件接收模块获取邮件文本的字符流的获取方式为:通过Stream方式以字符流格式从服务器中下载邮件文本,完成下载后,本地显示的邮件文本是文件流数据。
存储模块用于将获取的邮件文本字符流保存在本地文本字符串中;
显示模块用于显示邮件文本字符流;
第一判断模块用于判断邮件文本字符流中是否存在网络链接地址,如果邮件文本字符流中不存在网络链接地址,略过该邮件文本字符流不做校正处理;如果邮件文本字符流中存在网络链接地址,通过地址判断模块判断网络链接地址是否是错误网络链接地址;其中,判断邮件文本字符流中是否存在网络链接地址的判断方式为:在HTML文本中有指定链接地址的锚点“<a href/>”,通过解析链接地址的锚点判断邮件文本字符流中是否存在网络链接地址。
地址判断模块用于判断邮件文本字符流中的网络链接地址是否是错误网络链接地址,如果邮件文本字符流中的网络链接地址是有效网络链接地址,略过该邮件文本字符流不做校正处理;如果邮件文本字符流中的网络链接地址是错误网络链接地址,通过地址校正模块对错误网络链接地址进行校正;
其中,判断邮件文本字符流中的网络链接地址是否是错误网络链接地址的判断方式为:建立正则表达式字符串<a.*?href=\s*"([^"]*)".*?>(.*?)</a>,通过此正则表达式字符串过滤HTML文本内容,对网络链接地址进行匹配,从而确定该网络链接地址是否是错误网络链接地址。其中,正则表达式(Regular Expression,在代码中常简写为regex、regexp或RE),又称正规表示法或常规表示法,计算机科学的一个概念。正则表达式使用单个字符串来描述、匹配一系列符合某个句法规则的字符串。在很多文本编辑器里,正则表达式通常被用来检索、替换那些符合某个模式的文本。在本发明实施例中,建立正则表达式字符串如下:
地址校正模块用于识别该网络链接地址的出错位置,从存储模块存储的本地文本字符串中获取正确字符,通过正确字符对该网络链接地址的出错位置进行校正,生成正确的网络链接地址,并删除邮件文本字符流中错误的网络链接地址,将正确的网络链接地址保存在邮件文本字符流中,并根据正确的网络链接地址进行链接操作;其中,正确网络链接地址的生成方式包括:通常网络链接地址错误的原因在于:由于编程或其他原因导致网络链接地址中的部分字符错误,使得网络链接地址无法正常加载,本发明实施例根据WEB地址协议标准从邮件文本字符流中对正确的网络链接地址进行识别,找出错误网络链接地址的出错位置,并在本地文本字符串中获取正确字符,将获取的正确字符与错误网络链接地址中出错位置的字符进行替换,从而生成正确的网络链接地址。例如,错误的网络链接地址为:<a href=”sda”>www.baidu.com</a>,经过系统识别后,找出该网络链接地址中的出错位置,并从文本字符串中获取正确字符,通过正确字符对网络链接地址中的出错位置的自己进行替换,替换后的网络链接地址为:<a href=http://www.baidu.com>www.baidu.com</a>,用户可通过替换后的网络链接地址进行正常链接操作。
第二判断模块用于判断邮件文本字符流中是否存在两个以上的网络链接地址,如果存在两个以上的网络链接地址,则通过地址判断模块重新判断邮件文本字符流中是否还存在错误网络链接地址,直到遍历完邮件文本字符流中的所有网络链接地址;如果不存在两个以上的网络链接地址,结束本次校正操作。
本发明实施例的网页地址校正方法及系统在接收到电子邮件后,通过邮件文本字符流判断该电子邮件中是否存在网络链接地址,如果存在网络链接地址,则进一步检测存在的网络链接地址是否有效,如果网络链接地址错误,则根据WEB地址协议标准找出错误网络链接地址的出错位置,并在本地文本字符串中获取正确字符,将获取的正确字符与错误网络链接地址中出错位置的字符进行替换,从而生成正确的网络链接地址。本发明操作简单,无需用户手动操作,有利于提升用户的使用体验。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。

Claims (10)

1.一种网页地址校正方法,其特征在于:包括以下步骤:
步骤100:接收电子邮件,并获取邮件文本字符流;
步骤101:判断邮件文本字符流中的网络链接地址是否是错误网络链接地址,如果邮件文本字符流的网络链接地址是错误网络链接地址,执行步骤102;
步骤102:识别错误网络链接地址的出错位置,并对该错误网络链接地址的出错位置进行校正,生成正确的网络链接地址。
2.根据权利要求1所述的网页地址校正方法,其特征在于:所述步骤100还包括:将获取的邮件文本字符流保存在本地文本字符串中,并显示邮件文本字符流。
3.根据权利要求2所述的网页地址校正方法,其特征在于:所述步骤101还包括:判断邮件文本字符流中是否存在网络链接地址,如果邮件文本字符流中不存在网络链接地址,略过该邮件文本字符流不做校正处理;如果邮件文本字符流中存在网络链接地址,则判断邮件文本字符流中的网络链接地址是否是错误网络链接地址。
4.根据权利要求3所述的网页地址校正方法,其特征在于:所述判断邮件文本字符流中是否存在网络链接地址的判断方式为:在邮件文本中有指定链接地址的锚点,通过解析链接地址的锚点判断邮件文本字符流中是否存在网络链接地址。
5.根据权利要求1或4所述的网页地址校正方法,其特征在于:所述判断邮件文本字符流中的网络链接地址是否是错误网络链接地址的判断方式为:建立正则表达式字符串,通过正则表达式字符串过滤邮件文本,对网络链接地址进行匹配,从而确定该网络链接地址是否是错误网络链接地址。
6.根据权利要求2所述的网页地址校正方法,其特征在于:在所述步骤102中,所述生成正确的网络链接地址具体包括:根据WEB地址协议标准从邮件文本字符流中对正确的网络链接地址进行识别,找出错误网络链接地址的出错位置,在本地文本字符串中获取正确字符,将获取的正确字符与错误网络链接地址中出错位置的字符进行替换,生成正确的网络链接地址;并删除邮件文本字符流中错误的网络链接地址,将正确的网络链接地址保存在邮件文本字符流中。
7.一种网页地址校正系统,其特征在于,包括邮件接收模块、地址判断模块和地址校正模块,所述邮件接收模块用于接收电子邮件,并获取邮件文本字符流;所述地址判断模块用于判断邮件文本字符流中的网络链接地址是否是错误网络链接地址,如果邮件文本字符流的网络链接地址是错误网络链接地址,通过地址校正模块对错误网络链接地址进行校正;所述地址校正模块用于识别错误网络链接地址的出错位置,并对该错误网络链接地址的出错位置进行校正,生成正确的网络链接地址。
8.根据权利要求7所述的网页地址校正系统,其特征在于:还包括存储模块和显示模块,所述存储模块用于将获取的邮件文本字符流保存在本地文本字符串中;所述显示模块用于显示邮件文本字符流。
9.根据权利要求7或8所述的网页地址校正系统,其特征在于:还包括第一判断模块,第一判断模块用于判断邮件文本字符流中是否存在网络链接地址,如果邮件文本字符流中不存在网络链接地址,略过该邮件文本字符流不做校正处理;如果邮件文本字符流中存在网络链接地址,通过地址判断模块判断网络链接地址是否是错误网络链接地址。
10.根据权利要求8所述的网页地址校正系统,其特征在于:所述地址校正模块生成正确的网络链接地址具体包括:根据WEB地址协议标准从邮件文本字符流中对正确的网络链接地址进行识别,找出错误网络链接地址的出错位置,在本地文本字符串中获取正确字符,将获取的正确字符与错误网络链接地址中出错位置的字符进行替换,生成正确的网络链接地址;并删除邮件文本字符流中错误的网络链接地址,将正确的网络链接地址保存在邮件文本字符流中。
CN201610291185.5A 2016-05-05 2016-05-05 一种网页地址校正方法及系统 Pending CN106021304A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610291185.5A CN106021304A (zh) 2016-05-05 2016-05-05 一种网页地址校正方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610291185.5A CN106021304A (zh) 2016-05-05 2016-05-05 一种网页地址校正方法及系统

Publications (1)

Publication Number Publication Date
CN106021304A true CN106021304A (zh) 2016-10-12

Family

ID=57081621

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610291185.5A Pending CN106021304A (zh) 2016-05-05 2016-05-05 一种网页地址校正方法及系统

Country Status (1)

Country Link
CN (1) CN106021304A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107247790A (zh) * 2017-06-16 2017-10-13 北京小米移动软件有限公司 新建邮件的方法和装置
CN110020366A (zh) * 2017-12-07 2019-07-16 北大方正集团有限公司 邮箱信息抽取方法及装置
CN117218659A (zh) * 2023-08-30 2023-12-12 建银工程咨询有限责任公司 不动产权证中信息的获取方法、装置、电子设备和介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030110295A1 (en) * 2001-12-11 2003-06-12 Pioneer Corporation Automatic URL link destination correcting system, automatic URL link destination correcting apparatus, method of automatically correcting URL link destination, and automatic URL link destination correcting program
CN104036053A (zh) * 2014-07-07 2014-09-10 广州金山网络科技有限公司 一种无效链接地址处理方法及装置
CN104268289A (zh) * 2014-10-21 2015-01-07 中国建设银行股份有限公司 链接url的失效检测方法和装置
CN104750741A (zh) * 2013-12-30 2015-07-01 中国移动通信集团湖南有限公司 一种无效链接处理方法及装置
CN105007215A (zh) * 2015-07-09 2015-10-28 陈包容 一种远程修改电邮的方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030110295A1 (en) * 2001-12-11 2003-06-12 Pioneer Corporation Automatic URL link destination correcting system, automatic URL link destination correcting apparatus, method of automatically correcting URL link destination, and automatic URL link destination correcting program
CN104750741A (zh) * 2013-12-30 2015-07-01 中国移动通信集团湖南有限公司 一种无效链接处理方法及装置
CN104036053A (zh) * 2014-07-07 2014-09-10 广州金山网络科技有限公司 一种无效链接地址处理方法及装置
CN104268289A (zh) * 2014-10-21 2015-01-07 中国建设银行股份有限公司 链接url的失效检测方法和装置
CN105007215A (zh) * 2015-07-09 2015-10-28 陈包容 一种远程修改电邮的方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107247790A (zh) * 2017-06-16 2017-10-13 北京小米移动软件有限公司 新建邮件的方法和装置
CN107247790B (zh) * 2017-06-16 2020-06-02 北京小米移动软件有限公司 新建邮件的方法和装置
CN110020366A (zh) * 2017-12-07 2019-07-16 北大方正集团有限公司 邮箱信息抽取方法及装置
CN117218659A (zh) * 2023-08-30 2023-12-12 建银工程咨询有限责任公司 不动产权证中信息的获取方法、装置、电子设备和介质

Similar Documents

Publication Publication Date Title
US10719898B2 (en) Systems and methods for analyzing documents
US8321396B2 (en) Automatically extracting by-line information
US7606816B2 (en) Record boundary identification and extraction through pattern mining
CN101470728B (zh) 一种中文新闻网页正文的自动抽取方法及装置
Leydesdorff et al. Mapping the geography of science: Distribution patterns and networks of relations among cities and institutes
US8468145B2 (en) Indexing of URLs with fragments
US20110078206A1 (en) Tagging method and apparatus based on structured data set
JP2010086517A (ja) コンピュータによって実施される、ウェブページからデータを抽出する方法
WO2015047920A1 (en) Title and body extraction from web page
CN105260469B (zh) 一种处理网站地图的方法、装置及设备
CN106021304A (zh) 一种网页地址校正方法及系统
CN110134844A (zh) 细分领域舆情监控方法、装置、计算机设备及存储介质
JP2021089668A (ja) 情報処理装置及びプログラム
CN105117434A (zh) 一种网页分类方法和系统
CN113407678A (zh) 知识图谱构建方法、装置和设备
CN113032548A (zh) 信息处理装置、存储介质及信息处理方法
CN110275938B (zh) 基于非结构化文档的知识提取方法及系统
US20070198491A1 (en) System and method for searching and filtering web pages
US20090204889A1 (en) Adaptive sampling of web pages for extraction
JP5063877B2 (ja) 情報処理装置およびコンピュータプログラム
US20050131859A1 (en) Method and system for standard bookmark classification of web sites
CN110750683A (zh) 数据修改方法、装置、计算机设备及存储介质
US20040034626A1 (en) Browsing method and apparatus
US11501074B2 (en) Representing confidence in natural language processing
JP6749865B2 (ja) 情報収集装置、および、情報収集方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20161012