CN1592903A - 通过提供万维网文件布局图像简化因特网搜索的系统和方法 - Google Patents

通过提供万维网文件布局图像简化因特网搜索的系统和方法 Download PDF

Info

Publication number
CN1592903A
CN1592903A CNA018020755A CN01802075A CN1592903A CN 1592903 A CN1592903 A CN 1592903A CN A018020755 A CNA018020755 A CN A018020755A CN 01802075 A CN01802075 A CN 01802075A CN 1592903 A CN1592903 A CN 1592903A
Authority
CN
China
Prior art keywords
www document
user
information
www
laying out
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA018020755A
Other languages
English (en)
Other versions
CN1317661C (zh
Inventor
尹硕晧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CCR Inc
Original Assignee
CCR Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CCR Inc filed Critical CCR Inc
Publication of CN1592903A publication Critical patent/CN1592903A/zh
Application granted granted Critical
Publication of CN1317661C publication Critical patent/CN1317661C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99936Pattern matching access

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

一种系统及其方法,在基于因特网的信息搜索时,除了各万维网文件的信息以外,还将该万维网文件的布局图像提供给用户,使用户期望的万维网文件的检索变得容易。该系统包含:机器人代理10,通过因特网200从各万维网站点中取出各万维网文件的信息及布局图像;万维网文件信息DB 40,保存该机器人代理10取出的万维网文件信息;万维网图像DB 50,保存根据机器人代理10取出的各万维网文件而生成的各布局图像;以及万维网服务部90,按照来自用户400的搜索请求,从万维网文件信息DB 40及万维网图像DB 50中取出万维网文件信息及布局图像。

Description

通过提供万维网文件布局图像简化因特网搜索 的系统和方法
                         技术领域
本发明涉及因特网搜索系统,特别涉及一种系统及其方法,为了在因特网上得到期望的信息,即使不一一直接访问各种万维网(ウエブ)站点,也能将万维网文件的图像提供给用户,从而使万维网站点的搜索变得容易。
                         背景技术
通常,也称为万维网页的万维网文件是具有文本、图形、视频、音频、至其他万维网文件的链接等各种形式的信息的电子文件。最近,作为万维网(www)上很多文件的标准格式,使用HTML(超文本标记语言)。采用该HTML格式的文件具有嵌入其内的HTML代码、即各种命令。为了访问万维网上的各种文件,使用通常称为万维网浏览器的应用软件。该万维网浏览器的软件解析这种HTML,将万维网文件适当地显示在用户的显示装置上。万维网浏览器的软件还解析HTML格式的万维网文件内嵌入着的HTML命令,通过该万维网文件内的链接来进入其他万维网文件,从而在万维网上自动访问其他万维网文件。
万维网站点是服务器保存着的与特定的主题有关的各种万维网文件的集合,通过URL来鉴别。传给访问该万维网站点的用户的第一个文件称为主页。从该主页,用户只需点击万维网文件的链接,就能够得到该万维网站点上链接的所有万维网文件。用户还能够用因特网公司提供的搜索引擎来调出所关心的万维网站点。
通常,搜索系统由Yahoo!、Lycos、Infoseek等可移植的因特网站点来执行,由搜索引擎及分类的目录表构成。通常的搜索引擎大体分为机器人代理(ロボツト·エ—ジエント)、索引程序及搜索程序。例如,软件实现的万维网搜索程序(Webcrawlcr)等机器人代理自动访问各种万维网站点,依次跟踪该万维网站点中嵌入着的超文本链接,将作为其结果而找到的各文件通过所谓的关键词来提取、摘要,附加索引,保存到用于后续访问的大容量数据库中。索引程序取出并登录收集到的万维网文件的索引。搜索程序根据预定的搜索条件,将判断为与用户的搜索查询有关联的万维网站点的列表提供给该用户。目录表将收集到的各万维网文件分类为各种深度等级的主题。各万维网文件例如可以从广义的主题/类别起逐次分类为下位类别。预定分类出的目录的各索引,登录到搜索系统中。
然而,现有的搜索系统只记录关于访问的万维网站点的有限的信息,例如,使通过万维网浏览器来访问该万维网文件成为可能的万维网地址的URL、内容的词、标题及概略、以及HTML标记字段提供的万维网文件的说明。对万维网站点的简单说明通常由运营者作为对该万维网站点的介绍来作成。然而,在很多情况下,用户只观看该简单说明,极难把握某个万维网站点是否具有自己期望的信息。
因此,在现有的搜索系统中,用户为了观看搜索的万维网站点的万维网文件,必须访问该万维网站点。如果搜索结果是内容中没有期望的信息,则用户返回到搜索结果画面并尝试访问其他万维网站点。这种搜索过程一直进行到找出具有用户期望的信息的万维网站点为止。其结果是,用户必须浏览许多万维网站点才能找出自己期望的万维网站点,搜索万维网站点需要相当长的时间,很不方便。此外,即使找出期望的万维网站点,也难以知道该站点当前是否正在提供服务。
因此,要求一种方法,即使不从搜索引擎提供的万维网站点的列表一一访问各站点,也能够容易地观看万维网文件的实际内容。
                          发明内容
因此,本发明的主要目的在于提供一种因特网信息搜索系统及其方法,在基于因特网的信息搜索时,除了各万维网文件的信息以外,还将该万维网文件的画面布局图像提供给用户,从而使用户期望的万维网文件的检索变得更加容易。
为了实现上述目的,本发明一优选实施例的系统按照从用户那里接受的搜索条件来提供搜索结果,包含:机器人代理,经上述因特网,从各万维网站点中取出各万维网文件的信息及布局图像;第1数据库,保存上述机器人代理取出的上述万维网文件信息;第2数据库,保存根据上述机器人代理取出的上述各万维网文件而生成的各布局图像;以及搜索部件,按照来自用户的搜索请求,从上述第1及第2数据库中取出万维网文件信息及布局图像。
本发明另一优选实施例的方法是因特网信息搜索方法,通过因特网来提供具有来自各万维网站点的各万维网文件的信息及各布局图像的搜索结果,该方法包含下述步骤:取出万维网文件信息,根据上述各万维网文件来生成各布局图像,将该万维网文件信息及该布局图像分别保存到第1及第2数据库中;接受来自用户的搜索条件;从上述第1及第2数据库中,分别取出与上述搜索条件对应的各万维网文件的万维网文件信息及布局图像;以及按上述用户预先选择出的视图格式来提供上述取出的万维网文件信息及上述各布局图像。
                        附图说明
图1是本发明实施例的信息搜索系统的概略方框图。
图2是图1中的机器人代理的详细方框图。
图3是本发明的信息搜索系统提供给用户的页面布局的一例示意图。
图4是用于说明本发明的信息搜索系统设置的各种搜索模式的示意图。
图5是提供目录搜索结果的布局的一例示意图。
图6是用于说明万维网服务部进行的提供目录搜索结果的过程的流程图。
图7是提供对各目录的查询检索结果的布局示例的示意图。
图8也是提供对各目录的查询检索结果的布局示例的示意图。
图9是用于说明提供从各种目录中找到的查询搜索结果的过程的流程图。
图10是用于说明提供从各种万维网文件中找到的查询搜索结果的过程的流程图。
图11是提供喜爱站点的显示布局的示例示意图。
图12是用于说明图11所示的提供喜爱站点的过程的流程图。
图13是幻灯片放映的浏览器布局的示例示意图。
图14是用于说明将特定站点追加到喜爱站点列表中的布局例的示意图。
图15是用于说明将特定站点追加到喜爱站点列表中的过程的流程图。
                        具体实施方式
以下,参照附图来更加详细地说明本发明的优选实施例。
图1是本发明实施例的信息搜索系统的概略方框图。如该图所示,该信息搜索系统100经因特网200与多个外部万维网服务器、和多个用户相连。在该图中,为了便于说明,分别只略示了一个外部万维网服务器300及用户400。用户400用通常的因特网万维网浏览器来访问信息搜索系统100。该信息搜索系统100经因特网200向万维网服务器300请求万维网文件,收集有关该万维网文件的信息,将该收集信息经因特网200提供给用户400。本发明的信息搜索系统100除了现有的搜索系统提供的万维网站点的标题、简单说明、访问次数等万维网站点信息(以下,称为万维网文件信息)以外,还将万维网文件的布局图像(以下,称为万维网图像)提供给用户。根据本发明,如果请求按HTML格式编码过的万维网文件,则能辨别由标记等HTML代码定义的万维网文件的布局。详细地说,万维网文件的文本、图形、音频及视频被分别区分,通过数据压缩及/或数据变换用的某种产业标准进行压缩。然后,将重新格式化的万维网内容作为万维网文件图像来重新排列,使得该图像与原来的万维网文件实际上一样。虽然无需在万维网文件图像内重现该万维网文件的所有要素,但是该万维网文件必须包含用户一眼就能容易预知的代表性信息。尺寸缩小了的各万维网图像的生成也要使得信息搜索系统100能够将各种万维网图像以子标题形态同时提供给用户400。此外,该信息搜索系统100具有幻灯片放映功能:按规定的时间间隔以整个画面逐个显示各种万维网图像。此外,用户能够将自己的喜爱站点列表(或书签)登录到信息搜索系统100中,而信息搜索系统100按照用户的访问,将喜爱站点的万维网图像与保存的喜爱站点列表一起提供给用户。
信息搜索系统100包括机器人代理10、用户管理数据库(DB)20、用户管理部25、万维网文件信息DB 40、万维网图像DB 50、索引DB 70、索引服务部80、及万维网服务部90。机器人代理10通过因特网200被连接到外部万维网服务器300,而万维网服务部90通过因特网200被连接到用户400。该信息搜索系统100包括下述等几个主要功能:通过因特网200来收集万维网文件的信息;结构化地保存该收集到的信息;按照用户的请求来提供该保存信息;管理用户的信息及喜爱站点列表。在这些功能中,参照图1来详述信息的收集及保存功能。首先,机器人代理10访问各万维网站点来收集万维网文件信息。详细地说,机器人代理10向各万维网站点所处的各外部万维网服务器请求万维网文件,从接收到的各万维网文件中取出标题、概要文本、链接URL及访问次数等万维网文件信息。该万维网文件信息被保存到万维网文件信息DB 40中。由万维网文件构成的万维网图像被保存到万维网图像DB50中。索引服务部80从各万维网文件的标题及简单说明中取出关键词,将其登录到索引DB 70中。该索引DB 70保存对该万维网文件附加索引的关键词。索引DB 70还保存现有的信息搜索系统中用目录搜索及查询搜索所用的方法而制作的目录表中包含的、对万维网服务部90中登录的各目录预定的关键词。
万维网服务部90将参照目录表的目录列表提供给用户400,接收来自用户400的搜索条件。按照来自用户400的搜索条件,万维网服务部90搜索与该搜索条件对应的万维网文件的目录表及/或索引DB 70。然后,万维网服务部90从万维网文件信息DB 40及万维网图像DB 50中分别取出搜索到的万维网文件的信息及图像,将该取出的信息及图像同时显示以便用户观看。万维网服务部90还如后所述以缩略一览(サムネイル)或幻灯片放映的方式来提供万维网图像,并按对万维网文件的访问次数的顺序来提供其搜索结果。
用户管理部25经万维网服务部90从用户400那里接受具有用户的姓名、口令及喜爱站点等账户信息的用户信息。对用户进行确认后,用户管理部25将该信息登录到用户管理DB 20中进行更新。例如,用户管理部25经万维网服务部90从用户400那里接受取出自己的喜爱站点列表的请求后,按照它来取出用户管理DB 20中保存的该用户的喜爱文件夹及站点的信息,将其通过万维网服务部90提供给用户400。用户管理部25用用户管理DB 20中已经保存的喜爱站点来生成各用户的喜爱站点树,通过该喜爱站点树将各喜爱站点的万维网图像提供给用户400。
图2是图1中的机器人代理10的详细方框图。在该图中,该机器人代理10具有队列管理器11、文本队列12、文本机器人13、图像队列14及图像机器人15。队列管理器11被连接到文本队列12、文本机器人13、图像队列14及图像机器人15。文本队列12及图像队列14分别被连接到文本机器人13及图像机器人15。起初,文本队列12登录各万维网站点的URL,以便文本机器人13按信息搜索系统100的运营者预定的顺序来访问各万维网站点。在文本机器人13向队列管理器11请求访问的URL时,队列管理器11控制文本队列12,将该文本队列12内访问优先级最高的URL提供给文本机器人13。文本机器人13访问由该URL标识的站点,开始从该站点下载万维网文件。然后,文本机器人13从下载的各万维网文件中取出万维网文件信息并传输到队列管理器11。于是,队列管理器11将访问站点的URL保存到图像队列14中,将万维网文件信息登录到万维网文件信息DB 40中。队列管理器11还根据预定的条件对各URL附加等级,将该附加了等级的各URL送至文本队列12,文本队列12重新分配各URL的访问次数优先级。例如,队列管理器11生成具有以前访问过的所有万维网文件的访问次数的平均及偏差的正态分布。然后,队列管理器11根据该生成的正态分布,来计算参照过的各URL的访问次数的可靠性,作为各URL的重要性。然后,队列管理器11将基于计算出的可靠性的访问优先级重新分配给访问URL。
另一方面,在图像机器人15向队列管理器11请求URL时,队列管理器11控制图像队列14,将图像队列14内访问优先级最高的URL提供给图像机器人15。于是,图像机器人15访问该URL的站点,开始从该站点下载万维网文件。然后,图像机器人15从万维网文件中取出万维网图像,将其登录到万维网图像DB 50中。
图3是本发明的信息搜索系统提供给用户400的页面布局的一例示意图。如该图所示,该页面具有用于关键词搜索的查询输入字段510及搜索开始按钮515。用户400可以直接输入搜索查询来搜索万维网,或者选择复选框520或530来限制目录类别。此外,在选择复选框540后,显示各万维网文件的缩略一览图像。按钮560被用来使用或登录喜爱站点列表。搜索结果按用户400预定的显示格式(例如,只有文本、只有万维网图像、或者文本及万维网图像都有)来显示。如该图所示,页眉505及页脚502也可以被用来显示系统提供者的所有权信息。与其他信息搜索系统同样,本发明的信息搜索系统100在主页的中间部分也提供分类化的目录树550。
图4是用于说明本发明的信息搜索系统100设置的各种搜索模式的示意图,可以根据用户的搜索风格或嗜好来选择。在该图中,圆圈110表示作为可从各种搜索模式选择的第1页列表的开始点,圆圈500~800分别表示目录搜索模式、目录的查询搜索模式、万维网文件的查询搜索模式及喜爱站点搜索模式(后述)。
在用户400通过因特网200等通信网来访问本发明的信息搜索系统100时,信息搜索系统100将该主页传输给用户400。于是,用户400选择该主页上列表的目录搜索模式500、目录的查询搜索模式600、万维网文件的查询搜索模式700及喜爱站点搜索模式800中的某一个。
如果选择目录搜索模式500,则信息搜索系统100将用户400选择出的该目录内的子目录及/或各万维网文件提供给用户400。如图4中箭头所示,用户400也可以从目录搜索模式500跳到其他搜索模式中的某一个。如果选择目录的查询搜索模式600,则信息搜索系统100遍览所有目录来检查是否有包含查询词的目录,如果有,则将该目录提供给用户400。同样,用户400可以在需要时移动到搜索模式110、700及800中的某一个。在移动到万维网文件的查询搜索模式700的情况下,信息搜索系统100用搜索引擎来搜索与搜索关键词关联的万维网站点,将其搜索结果、即该万维网站点的URL及简单说明提供给用户400。然后,用户400在需要时可以移动到搜索模式110、600及800中的某一个。根据本发明,各万维网文件的万维网图像也可以作为该搜索结果的一部分而被包含。在移动到喜爱站点搜索模式800的情况下,信息搜索系统100将用户400预先选择出的喜爱站点的列表提供给用户400。从该模式,用户400可以移动到搜索模式110、600及700中的某一个。此外,喜爱站点列表中的所选文件夹中包含的万维网图像被提供给用户400。
图5是提供目录搜索结果的布局的一例示意图,示出从目录中选择出ARTS这一类别/子目录的情况。除了选择出的ARTS类别的子目录620以外,还显示选择出的目录内的万维网站点的缩小比例万维网图像630及万维网文件信息640。由于画面尺寸的限制,在各种万维网站点中,只显示几个万维网站点。其他万维网站点可以通过画面滚动来观看。在万维网文件信息640中,包括标题650及简单说明670。
在用户400点击缩小比例万维网图像630时,一比一尺寸万维网图像(未图示)被显示在别的窗口上。与现有的信息搜索系统同样,用户400可以点击标题650来直接访问该万维网站点。此外,在点击追加喜爱站点按钮680时,图14所示的新的窗口被打开,用户400可以向自己的喜爱站点列表中添加期望的万维网站点。
图6是用于说明万维网服务部90进行的提供目录搜索结果的过程的流程图。首先,页眉505被提供给用户400(S510)。接着,接收选择目录的用户请求(S520)。据此,万维网服务部90从目录表中搜索选择出的目录内的子目录及万维网站点(S530)。此外,万维网服务部90从万维网文件信息DB 40及万维网图像DB 50中,分别取出选择出的目录内的万维网文件信息及万维网图像(S540)。这样选择出的目录510被提供给用户400(S550)。接着,该所选目录内的子目录620被提供给用户400(S560)。万维网服务部90将所选目录610内的万维网文件信息640及万维网图像630提供给用户400(S570),最后提供页脚502(S580)。
图7及图8分别是提供对各目录的查询检索结果的布局的示例示意图。
在图7中,页眉505及页脚502用与图3及图5相同的方法被提供给用户400。找到的目录810及该目录810的目录树820被显示在布局的上部801。如该图所示,该布局的下部802除了找到的站点830及缩略一览视图字段840以外,与图5所示的相同。在用户400点击缩略一览视图字段840时,图7的布局变为图8所示的缩略一览布局。
在图8中,布局的上部901与图7的上部801相同。下部902示出找到的站点的各缩略一览图像910。各站点的标题920被切舍显示,在其上设有相应的图标化万维网图像950及追加喜爱按钮960。在本发明一实施例中,各万维网站点的万维网文件信息也可以只在光标被置于图标化万维网图像950中的某一个上时才显示。在用户400点击图标化万维网图像950中的某一个时,与其对应的全画面的万维网图像被提供在别的窗口上。
提供从各种万维网文件中找到的查询搜索结果的显示布局除了在搜索万维网文件的情况下不包含关于找到的目录的信息以外,与图7及图8相同。
图9是用于说明提供从各种目录中找到的查询搜索结果的过程的流程图。万维网服务部90将页眉505提供给用户400(S610),接受来自用户的选择一个或其以上的目录及万维网文件的请求(S620)。万维网服务部90从图1中的索引DB 70中搜索与该用户的请求对应的一个或其以上的目录及万维网文件,然后分别从万维网文件信息DB 40及万维网图像DB 50中取出找到的万维网文件的万维网文件信息及万维网图像(S640)。此外,万维网服务部90生成目录树820并提供给用户400(S660)。接着,万维网服务部90判断是否选择了缩略一览(S670),如果是,则过程进至步骤S680,如果不是,则进至步骤S690。在步骤S680中,万维网服务部90将选择出的缩略一览图像910提供给用户400。在步骤S690中,万维网服务部90将万维网图像及文本信息都提供给用户400,进至步骤S695。最后,在步骤S695中将页脚502提供给用户400。
图10是用于说明提供从各种万维网文件中找到的查询搜索结果的过程的流程图。首先,万维网服务部90将页眉505提供给用户400(S710),接受来自用户400的选择一个或其以上的万维网文件的请求(S720)。然后,万维网服务部90从图1中的索引DB 70中搜索与该用户的请求对应的一个或其以上的万维网文件,分别从万维网文件信息DB 40及万维网图像DB 50中取出找到的万维网文件的万维网文件信息及万维网图像(S730及S740)。接着,万维网服务部90判断是否选择了缩略一览(S750),如果是,则过程进至步骤S760,如果不是,则进至步骤S770。在步骤S760中,万维网服务部90将选择出的缩略一览图像910提供给用户400。而在步骤S770中,万维网服务部90将万维网图像及文本信息都提供给用户400。最后,在步骤S780中将页脚502提供给用户400。
图11是提供喜爱站点的显示布局的示例示意图。
例如,“X2SEARCH我所喜爱”这一页眉121也可以被显示在布局的上部。在该图的布局中,喜爱站点树122被设在左侧,而喜爱站点树122中的所选文件夹的万维网站点的各图标化万维网图像123被设在右侧。页脚502与图3同样被显示。
图12是用于说明图11所示的提供喜爱站点的过程的流程图,
万维网服务部90接受来自用户400的搜索喜爱站点的请求,提示用户400输入用户信息(S810)。然后,用户管理部25经万维网服务部90从用户400那里接受用户ID及口令的信息,将其与用户管理DB 20中预先登录的用户ID及口令进行比较,对用户400进行确认(S820)。用户管理部25从用户管理DB 20中取出与用户400对应的喜爱站点的列表,将其提供给万维网服务部90(S830)。按照该喜爱站点的列表,万维网服务部90生成喜爱站点树122(S840),提供页脚121(S850)。此外,万维网服务部90取出喜爱站点树122的上层文件夹内的各万维网站点的图标化图像,按缩略一览格式提供给用户400(S860)。页脚502在步骤S870中被提供给用户400。接着,在用户400选择喜爱站点树122中的一个文件夹时,万维网服务部90接受与其对应的文件夹选择输入(S880)。据此,万维网服务部90从万维网图像DB 50中,取出所选文件夹内的各万维网站点的图标化万维网图像123(S890)。最后,万维网服务部90将该取出的图标化万维网图像123按缩略一览格式提供给用户400(S895)。
图13是幻灯片放映的浏览器布局的示例示意图。该幻灯片放映的布局在取出万维网图像后被显示。在两个连续的图像之间设置预定的时间间隔,逐个显示尺寸大的万维网图像。该时间间隔通过点击时间间隔设定按钮165来决定。在该图中,开始/暂停按钮161被用来开始或暂停幻灯片放映,如果在幻灯片放映的途中被点击,则暂停该幻灯片放映。在该暂停时,用户可以通过点击前一幻灯片按钮163或下一幻灯片按钮162,从当前幻灯片切换到前一幻灯片或下一幻灯片。该幻灯片放映通过重新选择按钮161来重新起动。而在暂停时,用户可以通过点击追加喜爱按钮164,将与当前显示的图像对应的万维网站点添加到喜爱站点的列表中。
图14是用于说明将某个站点追加到喜爱站点列表中的布局例的示意图。在该布局中,例如“X2SEARCH追加喜爱”这一页眉171被显示在上部,喜爱站点树172被设在左侧,而该站点的万维网图像173及标题174被设在右侧。在布局的右侧还设有追加文件夹按钮175及追加站点按钮176。通过点击按钮176,将与万维网图像173对应的万维网站点登录到喜爱站点树172的所选文件夹中。通过点击按钮175,将另一文件夹生成在喜爱站点树172的所选文件夹之下。
图15是用于说明将特定站点追加到喜爱站点列表中的过程的流程图。
万维网服务部90接受来自用户的指示将某个万维网文件放入喜爱站点的请求,将该请求送至用户管理部25(S1810)。按照该请求,用户管理部25对用户400进行确认(S1820),从用户管理DB 20中取出与用户400有关的喜爱站点的列表(S1830),将其提供给万维网服务部90。按照这样取出的喜爱站点的列表,万维网服务部90生成喜爱站点树(S1840),将页眉171提供给用户400(S1850)。然后,万维网服务部90将选择出的万维网文件73及标题174、以及页脚502与喜爱站点树172一起提供给用户400(S1860、S1870、S1880)。然后,万维网服务部90在步骤S1890中从用户400接受站点追加请求后,将该追加请求传输到用户管理部25。按照该请求。用户管理部25将该文件夹及万维网站点作为喜爱站点而登录到用户管理DB 20中(S1895)。
以上说明了本发明的优选实施例,但是在不脱离本发明的权利要求的情况下,本领域的技术人员当能进行各种改变。
因此,根据本发明,将机器人代理连续收集的各种万维网图像保存到数据库中,在有来自用户的访问时,将搜索到的所有万维网站点以图像形态提供给用户,从而用户为了观看特定的万维网站点的内容,即使不实际访问该站点,也能够预先观看各种万维网站点,能够进一步提高万维网站点的搜索效率。

Claims (14)

1、一种因特网信息搜索系统,按照从用户那里接受的搜索条件来提供搜索结果,其特征在于,包含:
机器人代理,经所述因特网,从各万维网站点中取出各万维网文件的信息及布局图像;
第1数据库,保存所述机器人代理取出的所述万维网文件信息;
第2数据库,保存根据所述机器人代理取出的所述各万维网文件而生成的各布局图像;以及
搜索部件,按照来自用户的搜索请求,从所述第1及第2数据库中取出万维网文件信息及布局图像。
2、如权利要求1所述的因特网信息搜索系统,其特征在于,所述机器人代理包括:
文本收集部件,访问各万维网站点,从该访问的各万维网站点下载万维网文件,从该万维网文件中取出万维网文件信息;
文本队列,保存所述文本收集部件访问的各万维网站点的URL(UniformResource Locator,统一资源定位符);
图像收集部件,访问各万维网站点,从该访问的各万维网站点下载万维网文件,根据该万维网文件来生成万维网图像并登录到所述第2数据库中;
图像队列,保存所述文本收集部件及所述图像收集部件访问的各万维网站点的URL;以及
队列管理部件,在有来自所述文本收集部件的URL请求时,控制所述文本队列,将所述文本队列中访问优先级最高的URL提供给所述文本收集部件,将来自所述文本收集部件的所述万维网文件信息登录到所述第1数据库中。
3、如权利要求2所述的因特网信息搜索系统,其特征在于,所述队列管理部件计算所述各URL的访问优先级并将该计算结果送至所述文本队列。
4、如权利要求3所述的因特网信息搜索系统,其特征在于,所述搜索部件包括:
索引添加部件,从所述第1数据库中取出所述万维网文件信息的关键词;
第3数据库,保存所述各万维网文件的所述关键词;
索引搜索部件,决定与来自所述用户的关键词对应的、各万维网文件的组;
第1取出部件,从所述第1数据库及所述第2数据库中,分别取出各个所述万维网文件的所述万维网文件信息及所述布局图像;以及
第1输出部件,按照所述取出的各万维网文件的访问次数的顺序,按预先选择出的视图格式来提供所述取出的万维网文件信息及所述取出的布局图像。
5、如权利要求4所述的因特网信息搜索系统,其特征在于,所述预先选择出的视图格式是下述格式中的某一个:第1格式,同时显示各万维网文件的万维网文件信息及布局图像;第2格式,显示与所述各布局图像对应的缩略一览图像;以及第3格式,以预定的时间间隔逐个显示所述各布局图像。
6、如权利要求5所述的因特网信息搜索系统,其特征在于,所述万维网文件信息具有万维网文件的标题及简单说明。
7、如权利要求3所述的因特网信息搜索系统,其特征在于,还包括:
第4数据库,保存具有所述用户预先选择出的各万维网站点的喜爱站点列表;
第2取出部件,按照所述用户的请求,从所述第2数据库中,取出与所述喜爱站点列表内的所述各万维网站点对应的各布局图像;以及
第2输出部件,将所述喜爱站点列表及所述取出的各布局图像以缩略一览方式提供给所述用户。
8、如权利要求7所述的因特网信息搜索系统,其特征在于,还包括:
第5数据库,保存关于各用户的用户信息;
确认部件,在从所述用户那里传输的用户信息与所述第5数据库中保存的信息相同的情况下,控制所述第2输出部件,以缩略一览方式来提供所述喜爱站点列表及所述取出的各布局图像。
9、如权利要求8所述的因特网信息搜索系统,其特征在于,所述用户信息具有所述用户的ID及口令。
10、如权利要求1所述的因特网信息搜索系统,其特征在于,所述搜索部件以缩略一览方式来提供所述各布局图像。
11、如权利要求1所述的因特网信息搜索系统,其特征在于,所述搜索部件以预定的时间间隔逐个提供所述各布局图像。
12、一种因特网信息搜索方法,通过因特网来提供具有来自各万维网站点的各万维网文件的信息及各布局图像的搜索结果,其特征在于,包含下述步骤:
取出万维网文件信息,根据所述各万维网文件来生成各布局图像,将该万维网文件信息及该布局图像分别保存到第1及第2数据库中;
接受来自用户的搜索条件;
从所述第1及第2数据库中,分别取出与所述搜索条件对应的各万维网文件的万维网文件信息及布局图像;以及
按所述用户预先选择出的视图格式来提供所述取出的万维网文件信息及所述各布局图像。
13、如权利要求12所述的因特网信息搜索方法,其特征在于,所述万维网文件信息具有万维网文件的标题及简单说明。
14、如权利要求12所述的因特网信息搜索方法,其特征在于,所述视图格式是下述格式中的某一个:第1格式,同时显示各万维网文件的万维网文件信息及布局图像;第2格式,显示与所述各布局图像对应的各缩略一览图像;以及第3格式,以预定的时间间隔逐个显示所述各布局图像。
CNB018020755A 2000-06-10 2001-06-09 通过提供万维网文件布局图像简化因特网搜索的系统和方法 Expired - Fee Related CN1317661C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR10-2000-0031999A KR100403714B1 (ko) 2000-06-10 2000-06-10 웹문서 레이아웃 이미지 및 웹사이트 구조를 제공하여인터넷 검색을 용이하게 할 수 있는 시스템 및 방법
KR2000/31999 2000-06-10

Publications (2)

Publication Number Publication Date
CN1592903A true CN1592903A (zh) 2005-03-09
CN1317661C CN1317661C (zh) 2007-05-23

Family

ID=19671638

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB018020755A Expired - Fee Related CN1317661C (zh) 2000-06-10 2001-06-09 通过提供万维网文件布局图像简化因特网搜索的系统和方法

Country Status (7)

Country Link
US (1) US7099861B2 (zh)
EP (1) EP1573415A2 (zh)
JP (1) JP2004503854A (zh)
KR (1) KR100403714B1 (zh)
CN (1) CN1317661C (zh)
AU (1) AU6280201A (zh)
WO (1) WO2001096978A2 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101286169B (zh) * 2007-04-13 2012-09-05 奥多比公司 协调内容的下载顺序的客户端管理
CN104102649A (zh) * 2013-04-07 2014-10-15 阿里巴巴集团控股有限公司 一种对网站用户进行分级的方法和装置

Families Citing this family (61)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6564209B1 (en) * 2000-03-08 2003-05-13 Accenture Llp Knowledge management tool for providing abstracts of information
US7350138B1 (en) * 2000-03-08 2008-03-25 Accenture Llp System, method and article of manufacture for a knowledge management tool proposal wizard
KR20020004041A (ko) * 2000-06-30 2002-01-16 임경환 인터넷을 통한 파일 검색 서비스 시스템 및 방법
KR20000063482A (ko) * 2000-07-15 2000-11-06 오성훈 검색 결과의 이미지 출력 방법 및 시스템
JP2002183203A (ja) * 2000-12-18 2002-06-28 Yamaha Corp 情報検索方法及び情報記憶媒体
KR20010069785A (ko) * 2001-05-11 2001-07-25 이강석 웹사이트 검색결과의 트리구조표시서비스
KR100491143B1 (ko) 2001-12-26 2005-05-24 삼성에스디아이 주식회사 블랙매트릭스를 구비한 평판표시장치 및 그 제조방법
US7109653B2 (en) 2002-01-15 2006-09-19 Seiko Epson Corporation Sealing structure with barrier membrane for electronic element, display device, electronic apparatus, and fabrication method for electronic element
US7148508B2 (en) 2002-03-20 2006-12-12 Seiko Epson Corporation Wiring substrate, electronic device, electro-optical device, and electronic apparatus
US7343052B2 (en) * 2002-04-09 2008-03-11 Sonic Solutions End-user-navigable set of zoomed-in images derived from a high-resolution master image
KR100490748B1 (ko) * 2002-04-11 2005-05-24 한국전자통신연구원 유,알,엘 포함관계에 기반한 유사도 재계산을 통한효과적인 홈페이지 검색 방법
US7421096B2 (en) * 2004-02-23 2008-09-02 Delefevre Patrick Y Input mechanism for fingerprint-based internet search
KR100491146B1 (ko) * 2002-11-04 2005-05-24 삼성에스디아이 주식회사 유기전계 발광표시장치 및 그의 제조방법
US7085755B2 (en) 2002-11-07 2006-08-01 Thomson Global Resources Ag Electronic document repository management and access system
US7505984B1 (en) 2002-12-09 2009-03-17 Google Inc. Systems and methods for information extraction
JP4267336B2 (ja) * 2003-01-30 2009-05-27 インターナショナル・ビジネス・マシーンズ・コーポレーション 構造パターン候補を生成する方法、システムおよびプログラム
JP4123172B2 (ja) 2003-04-01 2008-07-23 セイコーエプソン株式会社 薄膜パターンの形成方法及びデバイスの製造方法、電気光学装置及び電子機器
JP4103830B2 (ja) * 2003-05-16 2008-06-18 セイコーエプソン株式会社 パターンの形成方法及びパターン形成装置、デバイスの製造方法、アクティブマトリクス基板の製造方法
CN1791965B (zh) * 2003-05-20 2012-02-22 皇家飞利浦电子股份有限公司 用于半导体布置的结构和制造半导体布置的方法
KR100542997B1 (ko) 2003-08-07 2006-01-20 삼성에스디아이 주식회사 평판표시장치 및 그의 제조방법
US7833612B2 (en) 2003-09-12 2010-11-16 Samsung Mobile Display Co., Ltd. Substrate for inkjet printing and method of manufacturing the same
CN100483370C (zh) * 2003-09-29 2009-04-29 索尼株式会社 页面标题显示方法及装置
US8006197B1 (en) 2003-09-29 2011-08-23 Google Inc. Method and apparatus for output of search results
US20050097089A1 (en) * 2003-11-05 2005-05-05 Tom Nielsen Persistent user interface for providing navigational functionality
US7836038B2 (en) * 2003-12-10 2010-11-16 Google Inc. Methods and systems for information extraction
US7647300B2 (en) 2004-01-26 2010-01-12 Google Inc. Methods and systems for output of search results
ATE434225T1 (de) * 2004-07-20 2009-07-15 Alcatel Lucent Ein verfahren, eine netzdokument- beschreibungssprache, ein netzdokument- übergangsprotokoll und ein computer- softwareprodukt zur wiederauffindung von netzdokumenten
JP4095592B2 (ja) * 2004-08-06 2008-06-04 キヤノン株式会社 情報処理装置、情報処理方法ならびにプログラム
US20060080292A1 (en) * 2004-10-08 2006-04-13 Alanzi Faisal Saud M Enhanced interface utility for web-based searching
KR100671813B1 (ko) * 2004-10-15 2007-01-19 세이코 엡슨 가부시키가이샤 박막 패턴 형성 방법, 반도체 장치, 전기 광학 장치, 및전자 기기
JP2006172853A (ja) * 2004-12-15 2006-06-29 Seiko Epson Corp パターン形成基板、電気光学装置及び電気光学装置の製造方法
JP4539518B2 (ja) * 2005-03-31 2010-09-08 セイコーエプソン株式会社 電気光学装置及び電気光学装置の製造方法
US7433895B2 (en) 2005-06-24 2008-10-07 Microsoft Corporation Adding dominant media elements to search results
KR101209046B1 (ko) 2005-07-27 2012-12-06 삼성디스플레이 주식회사 박막트랜지스터 기판과 박막트랜지스터 기판의 제조방법
KR100696671B1 (ko) * 2005-11-02 2007-03-19 삼성에스디아이 주식회사 유기 발광 표시 장치
KR101212151B1 (ko) 2005-12-29 2012-12-13 엘지디스플레이 주식회사 패턴 형성 방법을 이용한 액정표시소자 제조방법
US8566712B1 (en) * 2006-01-04 2013-10-22 Google Inc. Image management
US8014608B2 (en) * 2006-03-09 2011-09-06 Lexmark International, Inc. Web-based image extraction
JP4341656B2 (ja) 2006-09-26 2009-10-07 ソニー株式会社 コンテンツ管理装置、ウェブサーバ、ネットワークシステム、コンテンツ管理方法、コンテンツ情報管理方法およびプログラム
US20080082419A1 (en) * 2006-10-03 2008-04-03 Webgne.Com, Llc Internet Search and Action Incentivization System and Associated Methods
TW200819974A (en) * 2006-10-31 2008-05-01 Via Tech Inc Music playback systems and methods
US20080155426A1 (en) * 2006-12-21 2008-06-26 Microsoft Corporation Visualization and navigation of search results
US20080208831A1 (en) * 2007-02-26 2008-08-28 Microsoft Corporation Controlling search indexing
US20090063448A1 (en) * 2007-08-29 2009-03-05 Microsoft Corporation Aggregated Search Results for Local and Remote Services
US20090199106A1 (en) * 2008-02-05 2009-08-06 Sony Ericsson Mobile Communications Ab Communication terminal including graphical bookmark manager
US7933473B2 (en) * 2008-06-24 2011-04-26 Microsoft Corporation Multiple resolution image storage
US7983512B2 (en) * 2008-06-24 2011-07-19 Microsoft Corporation Embedding large images within one another
US8064733B2 (en) * 2008-06-24 2011-11-22 Microsoft Corporation Variable resolution images
KR100987284B1 (ko) * 2008-09-12 2010-10-12 주식회사 엔씨소프트 검색엔진의 화이트리스트 생성장치 및 그 방법
US8875261B2 (en) * 2008-10-22 2014-10-28 International Business Machines Corporation Rules driven multiple passwords
WO2010051502A2 (en) 2008-10-31 2010-05-06 Biogen Idec Ma Inc. Light targeting molecules and uses thereof
US9391825B1 (en) 2009-03-24 2016-07-12 Amazon Technologies, Inc. System and method for tracking service results
US7953679B2 (en) * 2009-07-22 2011-05-31 Xerox Corporation Scalable indexing for layout based document retrieval and ranking
US8700646B2 (en) * 2009-08-12 2014-04-15 Apple Inc. Reference file for formatted views
US8606789B2 (en) 2010-07-02 2013-12-10 Xerox Corporation Method for layout based document zone querying
JP5760564B2 (ja) * 2011-03-22 2015-08-12 カシオ計算機株式会社 情報表示装置およびプログラム
SG2012059135A (en) * 2012-08-08 2014-03-28 Highend Pte Ltd Website with enhanced book memos
US9600351B2 (en) 2012-12-14 2017-03-21 Microsoft Technology Licensing, Llc Inversion-of-control component service models for virtual environments
US10229201B2 (en) 2014-07-31 2019-03-12 International Business Machines Corporation Interface for simultaneous display of selected items from search engine results
KR101638953B1 (ko) * 2015-01-12 2016-07-12 김종범 온라인상 텍스트 자동분석·수정시스템
US12072935B2 (en) 2021-09-08 2024-08-27 Microsoft Technology Licensing, Llc Machine-learning of document portion layout

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6564321B2 (en) * 1995-04-28 2003-05-13 Bobo Ii Charles R Systems and methods for storing, delivering, and managing messages
US5907837A (en) * 1995-07-17 1999-05-25 Microsoft Corporation Information retrieval system in an on-line network including separate content and layout of published titles
US5963966A (en) * 1995-11-08 1999-10-05 Cybernet Systems Corporation Automated capture of technical documents for electronic review and distribution
US5899999A (en) * 1996-10-16 1999-05-04 Microsoft Corporation Iterative convolution filter particularly suited for use in an image classification and retrieval system
US5978799A (en) * 1997-01-30 1999-11-02 Hirsch; G. Scott Search engine including query database, user profile database, information templates and email facility
JPH1128270A (ja) * 1997-07-10 1999-02-02 Koyo Jushi:Kk 遊技機構成部品の板材への取付構造
US6202061B1 (en) * 1997-10-24 2001-03-13 Pictra, Inc. Methods and apparatuses for creating a collection of media
JPH11282870A (ja) 1998-03-31 1999-10-15 Nec Corp インターネットドキュメント検索エンジン装置及びインターネットドキュメント検索エンジン装置の制御方法
US6167382A (en) * 1998-06-01 2000-12-26 F.A.C. Services Group, L.P. Design and production of print advertising and commercial display materials over the Internet
JP3298516B2 (ja) 1998-08-28 2002-07-02 日本電気株式会社 インターネット情報探索システムと方法
US6651059B1 (en) * 1999-11-15 2003-11-18 International Business Machines Corporation System and method for the automatic recognition of relevant terms by mining link annotations
KR20000024526A (ko) * 2000-02-18 2000-05-06 김상동 인터넷 상에서의 검색자료 저장방법
US20020038299A1 (en) * 2000-03-20 2002-03-28 Uri Zernik Interface for presenting information
KR20010106925A (ko) * 2000-05-24 2001-12-07 윤희원 인터넷 검색 서비스 방법
JP2004515846A (ja) 2000-10-03 2004-05-27 ラングフォード,ロナルド,エヌ ビジュアル・イメージを利用することによりウェブページを捜し出す方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101286169B (zh) * 2007-04-13 2012-09-05 奥多比公司 协调内容的下载顺序的客户端管理
CN104102649A (zh) * 2013-04-07 2014-10-15 阿里巴巴集团控股有限公司 一种对网站用户进行分级的方法和装置

Also Published As

Publication number Publication date
WO2001096978A2 (en) 2001-12-20
CN1317661C (zh) 2007-05-23
WO2001096978A3 (en) 2007-11-01
AU6280201A (en) 2001-12-24
KR20010112686A (ko) 2001-12-21
US20010056418A1 (en) 2001-12-27
KR100403714B1 (ko) 2003-11-01
US7099861B2 (en) 2006-08-29
EP1573415A2 (en) 2005-09-14
JP2004503854A (ja) 2004-02-05

Similar Documents

Publication Publication Date Title
CN1317661C (zh) 通过提供万维网文件布局图像简化因特网搜索的系统和方法
US8739027B2 (en) Methods and apparatus for enabling use of web content on various types of devices
US9483577B2 (en) Small form factor web browsing
Chen et al. Detecting web page structure for adaptive viewing on small form factor devices
US6338096B1 (en) System uses kernals of micro web server for supporting HTML web browser in providing HTML data format and HTTP protocol from variety of data sources
US8341137B2 (en) Search engine for video and graphics
CN1104696C (zh) 自动添加信息的超级文本链接接收文件的系统和方法
US20060059133A1 (en) Hyperlink generation device, hyperlink generation method, and hyperlink generation program
KR101393839B1 (ko) 링크된 용어들을 포함하는 활성 요약들을 제공하는 검색시스템
MXPA03004445A (es) Un sistema para la extraccion unificada de objetos del medio.
JP4901962B2 (ja) 情報検索装置、情報検索方法及び検索処理プログラム
US7203673B2 (en) Document collection apparatus and method for specific use, and storage medium storing program used to direct computer to collect documents
CA2353533C (en) Search engine for video and graphics
KR20000054312A (ko) 맞춤 웹정보 구축 제공 방법
KR100379635B1 (ko) 월드와이드 웹페이지를 검색하기 위한 시스템과, 이검색결과를 저장하고, 뷰잉하고, 활용하는 방법
US20090313558A1 (en) Semantic Image Collection Visualization
KR100955776B1 (ko) 검색 시스템 및 방법
KR20020083701A (ko) 분산형 인터넷 검색 시스템, 정보 수집 방법, 검색 서비스제공 방법 및 이를 구현하기 위한 캡쳐 로봇 프로그램
KR20080082573A (ko) 특정지역 및 특정키워드에 기반한 실시간 상세 정보 제공방법, 시스템 및 이를 위한 기록매체
KR20030020212A (ko) 한글로 된 일본 웹 디렉토리 검색방법 및 시스템

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C19 Lapse of patent right due to non-payment of the annual fee
CF01 Termination of patent right due to non-payment of annual fee