WO2011069377A1 - 生成微件的方法及装置 - Google Patents

生成微件的方法及装置 Download PDF

Info

Publication number
WO2011069377A1
WO2011069377A1 PCT/CN2010/076466 CN2010076466W WO2011069377A1 WO 2011069377 A1 WO2011069377 A1 WO 2011069377A1 CN 2010076466 W CN2010076466 W CN 2010076466W WO 2011069377 A1 WO2011069377 A1 WO 2011069377A1
Authority
WO
WIPO (PCT)
Prior art keywords
user
webpage
data
resource locator
attribute information
Prior art date
Application number
PCT/CN2010/076466
Other languages
English (en)
French (fr)
Inventor
张�杰
符海芳
季光
王桂玲
Original Assignee
华为技术有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 华为技术有限公司 filed Critical 华为技术有限公司
Publication of WO2011069377A1 publication Critical patent/WO2011069377A1/zh
Priority to US13/339,135 priority Critical patent/US20120102390A1/en

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/451Execution arrangements for user interfaces
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation
    • G06F16/9577Optimising the visualization of content, e.g. distillation of HTML documents

Definitions

  • the present invention relates to the field of network application technologies, and in particular, to a method and an apparatus for generating a widget. Background technique
  • an apparatus for generating a widget comprising:
  • a creating module configured to create attribute information of the data to be acquired according to the webpage specified by the user and the page fragment marked on the webpage;
  • An obtaining module configured to acquire structured data according to attribute information of the to-be-obtained data created by the creating module
  • a conversion module configured to convert the structured data acquired by the obtaining module into visual content.
  • the technical solution provided by the embodiment of the present invention obtains the attribute information of the data to be acquired, and acquires the structured data according to the created attribute information, so that the acquired data content is rich, and the attribute information of the data to be acquired is specified according to the user. Created by web pages, users can participate directly in the process of generating widgets, thus meeting the needs of diverse users. DRAWINGS
  • FIG. 2 is a flowchart of a method for generating a widget according to Embodiment 2 of the present invention
  • FIG. 3 is a schematic structural diagram of a device for generating a widget according to a third embodiment of the present invention
  • FIG. 4 is a schematic structural diagram of a module for creating a module according to Embodiment 3 of the present invention.
  • FIG. 5 is a schematic structural diagram of another creation module according to Embodiment 3 of the present invention.
  • FIG. 6 is a schematic structural diagram of still another creation module according to Embodiment 3 of the present invention.
  • FIG. 7 is a schematic structural diagram of an acquisition module according to Embodiment 3 of the present invention.
  • FIG. 8 is a schematic structural diagram of a device for generating a widget according to a third embodiment of the present invention
  • FIG. 9 is a schematic structural diagram of a device for generating a widget according to a third embodiment of the present invention
  • FIG. A fourth schematic diagram of the structure of the device for generating widgets is provided. detailed description
  • this embodiment provides a method for generating a widget, and the specific process is as follows:
  • the method provided in this embodiment obtains the attribute information of the data to be acquired, and acquires the structured data according to the created attribute information, so that the acquired data content is rich, and the attribute information of the data to be acquired is based on Created by user-specified web pages, users can directly participate in the process of generating widgets, and can meet the needs of diverse users as much as possible.
  • Embodiment 2
  • the embodiment provides a method for generating a widget, which detects a user's action on marking a page segment of a webpage, and acquires structured data that can be reused according to the page segment marked by the user, thereby generating a widget.
  • the process of the method provided in this embodiment is specifically as follows:
  • the user is identified by the user After the similar page fragment of the page fragment, the embodiment extracts the manner of detecting the identified similar page fragment, and adds or deletes the similar page fragment of the page fragment marked by the user according to the detection result. For example, if it is found in the detection that the identified similar page segment is incorrect, it can be deleted.
  • the webpage downloaded according to the uniform resource locator in the attribute information of the data to be acquired is referred to as a "new webpage", because most webpages are constantly refreshed, even if the same resource locator is used according to the uniformity at different times.
  • the content of the web page downloaded by the resource locator is also different.
  • the webpage downloaded by the uniform resource locator in the attribute information of the data to be acquired is collectively referred to as a "new webpage”.
  • the step downloads corresponding new ones according to the uniform resource locators in the attribute information of the data to be acquired.
  • the way the page is different is also different:
  • the user selects to change the value hd of the request parameter q to he, and then downloads the corresponding new webpage according to the uniform resource locator, and needs to download
  • the new page fragment needs to be extracted in the corresponding new webpage according to the path information in the attribute information of the data to be acquired.
  • the method provided in this embodiment further supports processing the obtained structured data according to the personalized requirement of the user.
  • a series of operators such as “ascending sort”, “descending sort”, “filter by condition” and so on.
  • the widget generated by the method provided by the embodiment can be easily operated on a handheld device (for example, a mobile phone) with limited computing capability.
  • a handheld device for example, a mobile phone
  • the widget generated by the method provided by the embodiment can be easily operated on a handheld device (for example, a mobile phone) with limited computing capability.
  • converting the acquired structured data into visual content it is relatively simple to implement, and can be directly used on a normal computer or a browser on a mobile phone.
  • HTML Hyper Text Mark-up Language
  • CSS CSS
  • the method provided by the embodiment can adjust the appearance of the visual content according to the personalized requirements of the user.
  • the widget is converted to visual content, the user interface is composed of elements such as HTML, CSS, and JavaScr ipt. Therefore, the widget's appearance can be adjusted by modifying these elements according to user requirements. For example, adjust the style of various HTML elements and the display position of a certain data. For a combination of multiple structured data, you can use JavaScr ipt (web script language) to display only the data that the user is interested in, thus reducing the number of times the structured data is run, and so on. Finally, save all the settings made by the user.
  • the obtaining module 302 is configured to obtain the structured data according to the attribute information of the data to be acquired created by the creating module 301;
  • the conversion module 303 is configured to convert the structured data acquired by the obtaining module 302 into visual content.
  • the creating module 301 includes:
  • the first obtaining unit 301a is configured to load a webpage specified by the user, and after detecting that the user marks the page fragment of the webpage, obtain path information corresponding to the page fragment marked by the user;
  • the creating module 301 specifically includes:
  • the identifying unit 301c is configured to load a webpage specified by the user, and after detecting that the user marks the page fragment of the webpage, identify a similar page fragment of the page fragment marked by the user;
  • the second obtaining unit 301d is configured to acquire path information corresponding to each of the page segments marked by the user and the similar page segments, and the similar page segment is a similar page segment of the page segment identified by the user identified by the identifying unit 301c;
  • the second creating unit 301e is configured to create attribute information including at least a uniform resource locator and path information for the data to be acquired, where the unified resource locator is a page segment marked by the user and a similar page piece thereof
  • the uniform resource locator corresponding to the webpage where the segments are located, and the path information is path information corresponding to each of the page segments marked by the user and the similar page segments obtained by the second obtaining unit 301d.
  • the extracting unit 302b is configured to extract a new page fragment in the corresponding new webpage according to the path information in the attribute information of the data to be acquired;
  • the organizing unit 302c is configured to organize the page segments extracted by the extracting unit 302b into structured data.
  • the downloading unit 302a is configured to: when the uniform resource locator does not include the request parameter, download a new webpage corresponding to the uniform resource locator; or, when the uniform resource locator includes the request parameter, use the request parameter as a variable
  • the parameter is for the user to select and modify, and the downloading request parameter is a new webpage corresponding to the uniform resource locator modified by the user.
  • the apparatus further includes:
  • the apparatus further includes:
  • the apparatus further includes:
  • the adjustment module 306 is configured to perform appearance adjustment on the visual content converted by the conversion module 303 according to the personalized requirement of the user.
  • the acquired structured data is implemented by the download unit 302a, the extracting unit 302b, and the sorting unit 302c in the obtaining module 302.
  • the structured data acquired by the acquisition module 302 is converted by the conversion module 303 into visual content, thereby generating a piece.
  • the embodiment obtains the attribute information of the data to be acquired, and acquires the structured data according to the created attribute information, so that the acquired data is not only rich in content, but also the attribute information of the data to be acquired is according to the webpage specified by the user.
  • the user can directly participate in the process of generating the widget, and can satisfy the diverse user requirements as much as possible.
  • the device provided by the embodiment can also support the appearance adjustment of the visual content, thereby satisfying The user's personalized needs have improved the user experience.
  • serial numbers of the embodiments of the present invention are merely for the description, and do not represent the advantages and disadvantages of the embodiments. This may be accomplished by a computer program instructing associated hardware, which may be stored in a computer readable storage medium, which, when executed, may include the flow of an embodiment of the methods described above.
  • the storage medium may be a magnetic disk, an optical disk, a read-only memory (ROM), or a random access memory (RAM).

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Human Computer Interaction (AREA)
  • Data Mining & Analysis (AREA)
  • Information Transfer Between Computers (AREA)

Description

生成微件的方法及装置 本申请要求了 2009年 12月 10日提交的, 申请号为 200910258109.4, 发明 名称为 "生成微件的方法及装置" 的中国专利申请的优先权, 其全部内容通过 引用结合在本申请中。
技术领域
本发明涉及网络应用技术领域, 特别涉及一种生成微件的方法及装置。 背景技术
微件 ( Widget )是可以在计算机或手机上运行的小型实用程序, 它一般结 合网络向用户提供天气, 新闻, 备忘等功能。 随着网络的普及, 微件的应用越 来越广泛, 种类也越来越多, 市场前景广泛。
现有两种生成微件的方式: 程序设计式和网页提取式。 其中, 程序设计式 是指开发微件时, 需要先下载它所提供的 SDK ( Sof tware Devel opment K i t , 软件开发工具包) , 进行类似于传统的软件开发, 而且开发人员需要有一定的 编程经验。 而网页提取式是指向用户提供在线工具, 让用户自行在网页上划定 感兴趣的内容, 并以此为模板, 生成微件。 以下缺点:
程序设计式的开发门槛高, 没有编程经验的用户无法参与, 且开发成本相 对较高, 另外, 由于开发人员仅局限于具有编程经验的人员, 因此, 开发出来 的微件种类有限; 而对于网页提取式生成的微件, 如果将用户划定感兴趣内容 的网页称为原始网页, 则生成的 ί件的内容仅取决于原始网页的内容, 由于原 始网页的内容有限, 因此, 将导致该网页提取式生成的微件功能有限。 发明内容
为了使微件的生成过程简单化, 从而尽可能满足多样化的用户需求, 本发 明实施例提供了一种生成微件的方法及装置。 所述技术方案如下:
一方面, 提供了一种生成微件的方法, 所述方法包括:
根据用户指定的网页和在所述网页上标记的页面片段创建待获取数据的属 性信息;
根据创建的所述待获取数据的属性信息获取结构化数据;
将获取到的所述结构化数据转换为可视内容。
另一方面, 提供了一种生成微件的装置, 所述装置包括:
创建模块, 用于根据用户指定的网页和在所述网页上标记的页面片段创建 待获取数据的属性信息;
获取模块, 用于根据所述创建模块创建的所述待获取数据的属性信息获取 结构化数据;
转换模块, 用于将所述获取模块获取到的所述结构化数据转换为可视内容。 本发明实施例提供的技术方案, 通过创建待获取数据的属性信息, 并根据 创建的属性信息获取结构化数据, 从而使得获取的数据内容丰富, 且由于待获 取数据的属性信息是根据用户指定的网页而创建的, 因此, 用户可直接参与到 微件的生成过程中, 从而能够尽可能满足多样化的用户需求。 附图说明
为了更清楚地说明本发明实施例中的技术方案, 下面将对实施例描述中所 需要使用的附图作简单地介绍, 显而易见地, 下面描述中的附图仅仅是本发明 的一些实施例, 对于本领域普通技术人员来讲, 在不付出创造性劳动的前提下, 还可以才艮据这些附图获得其他的附图。
图 1是本发明实施例一提供的生成微件的方法流程图;
图 2是本发明实施例二提供的生成微件的方法流程图;
图 3是本发明实施例三提供的第一种生成微件的装置结构示意图; 图 4是本发明实施例三提供的创建模块结构示意图;
图 5是本发明实施例三提供的另一种创建模块结构示意图;
图 6是本发明实施例三提供的又一种创建模块结构示意图;
图 7是本发明实施例三提供的获取模块结构示意图;
图 8是本发明实施例三提供的第二种生成微件的装置结构示意图; 图 9是本发明实施例三提供的第三种生成微件的装置结构示意图; 图 10是本发明实施例三提供的第四种生成微件的装置结构示意图。 具体实施方式
为使本发明的目的、 技术方案和优点更加清楚, 下面将结合附图对本发明 实施方式作进一步地详细描述。
实施例一
参见图 1 , 本实施例提供了一种生成微件的方法, 具体流程如下:
101: 根据用户指定的网页和在该网页上标记的页面片段创建待获取数据的 属性信息;
102: 根据创建的待获取数据的属性信息获取结构化数据;
103: 将获取到的结构化数据转换为可视内容。
综上所述, 本实施例提供的方法, 通过创建待获取数据的属性信息, 并根 据创建的属性信息获取结构化数据, 从而使得获取的数据内容丰富, 且由于待 获取数据的属性信息是根据用户指定的网页而创建的, 因此, 用户可直接参与 到生成微件的过程中, 能够尽可能满足多样化的用户需求。 实施例二
本实施例提供了一种生成微件的方法, 该方法通过检测用户对网页的页面 片段进行标记的动作, 并根据被用户标记的页面片段获取可被重用的结构化数 据, 从而生成微件。 参见图 2 , 本实施例提供的方法流程具体如下:
201: 根据用户指定的网页和在该网页上标记的页面片段创建待获取数据的 属性信息;
针对该步驟, 为了能够生成满足用户所需的微件, 本实施例提供的方法采 取由用户直接参与的方式, 即由用户指定网页, 并在将用户指定的网页载入之 后, 由用户凭借自己的喜好和操作水平, 选择用难度不同的方式创建简单型或 复杂型的待获取数据的属性信息。 而通过检测用户对网页的页面片段进行标记 的动作, 可确定待获取数据的属性信息。 当用户对某个页面片段进行标记之后, 可将被用户标记的页面片段高亮显示给用户。 至于如何实现标记的动作, 可通 过用户对页面片段进行点击或选取等简单操作实现, 而这些操作均为网站开发 中的基本技术, 此处暂不赘述, 且本实施例不对实现用户标记页面片段的方式 进行具体限定。
如果用户选择创建简单型的待获取数据的属性信息, 则在载入用户指定的 网页, 并在检测到用户对网页的页面片段进行标记之后, 只需获取被用户标记 的页面片段对应的路径信息即可, 而该创建的待获取数据的属性信息至少包括 统一资源定位符及路径信息, 当然, 根据用户的需求, 创建的待获取数据的属 性信息还可以包括其他信息, 例如, 数据大小等, 本实施例对属性信息的具体 内容不做限定。 其中, 统一资源定位符为用户指定的网页对应的统一资源定位 符, 路径信息为被用户标记的页面片段对应的路径信息。 也就是说, 该种简单 型的属性信息仅包含被用户标记的页面片段的属性信息, 当用户在指定的网页 上标记出自己感兴趣的片段后 , 仅获取该被用户标记的页面片段对应的路径信 息。 该路径信息是指该被用户标记的页面片段在其所在网页上的路径信息, 实 际应用过程中, 表示路径信息的方式有多种, 本实施例不对路径信息的具体表 示方式进行限定, 以 XPa th 作为路径信息的表示方式为例, 则表示为 如果用户选择创建复杂型的待获取数据的属性信息, 则在载入用户指定的 网页 , 并在用户对网页的页面片段进行标记之后 , 还需识别被用户标记的页面 自对应的路径信息。 虽然创建复杂型的待获取数据的属性信息同样至少包括统 一资源定位符及路径信息的属性信息, 但其中的统一资源定位符为被用户标记 的页面片段及其相似页面片段各自所在网页对应的统一资源定位符, 路径信息 为被用户标记的页面片段及其相似页面片段各自对应的路径信息。 也就是说, 该种复杂型的属性信息不仅包含被用户标记的页面片段的属性信息 , 还包括该 被用户标记的页面片段的相似页面片段的属性信息。 以用户指定的网页为搜索 结果网页为例, 当用户在该搜索网页中标记出了前两个搜索结果条目后, 与该 搜索结果条目相似的搜索结果条目将被识别出来, 接下来, 不仅需要获取被用 户标记的两个搜索结果条目对应的路径信息, 还需要获取与被用户标记的两个 搜索结果条目相似的搜索结果条目的路径信息。
其中, 载入网页是网站开发的基本技术, 此处不再赘述, 本实施例不对载 入网页的方式进行限定。 而识别相似页面片段的算法在许多公开的学术文献中 算法进行限定。
优选地 , 为了保证识别出的相似页面片段的准确性 , 在识别出被用户标记 的页面片段的相似页面片段之后 , 本实施例釆取了对识别出的相似页面片段进 行检测的方式, 并根据检测结果增加或删除被用户标记的页面片段的相似页面 片段。 例如, 如果在检测中发现识别出的相似页面片段有误, 则可以将其删除。
针对创建复杂型的待获取数据的属性信息, 为了提高识别相似页面片段的 准确率, 用户需要通过实践归纳出如何标记出有代表性的页面片段, 虽然标记 出有代表性的页面片段对用户的要求较高, 但是能提供含有多个页面片段的属 性信息, 进而可以满足获取更广泛数据的要求。 应的路径信息之后, 该待获取数据的属性信息则创建完成, 通过重复创建过程, 可完成多个待获取数据的属性信息的创建。
202: 根据创建的待获取数据的属性信息获取结构化数据;
具体地, 首先, 需要根据待获取数据的属性信息中的统一资源定位符下载 对应的新网页。
此处之所以将根据待获取数据的属性信息中的统一资源定位符下载的网页 称为 "新网页", 是由于大部分网页都会不断刷新, 即使是同一资源定位符, 在 不同时间根据该统一资源定位符下载的网页内容也是不同的。 针对该种情况, 本实施例将才艮据待获取数据的属性信息中的统一资源定位符下载的网页统称为 "新网页"。
由于有些统一资源定位符含有请求参数, 而有些统一资源定位符未含有请 求参数, 则针对不同的统一资源定位符, 该步驟在根据待获取数据的属性信息 中的统一资源定位符下载对应的新网页时的方式也是不同的:
当统一资源定位符中未包含请求参数日寸, ^口: ht tp: //胃. aaaaa. com, 则 根据该统一资源定位符下载对应的新网页时, 可直接下载该统一资源定位符对 应的网页;
当统一资源定位符中含有请求参数时, 以统一资源定位符为 ht tp: //www. aaaaa. com/search?hl=en&q=hd&aq=f 为例, 其中, "? ,, 后的 hl、 q和 aq均为请求参数, 则将请求参数作为可变参数供用户选择修改, 设用户选 择将请求参数 q的值 hd修改为 he ,则根据统一资源定位符下载对应的新网页时, 需要下载请求参数被用户修改后的统一资源定位符对应的新网页, 即下载统一 资源定位符为 ht tp: //www. aaaaa. com/search?hl=en&q=hc&aq=f对应的网页。 其次, 根据待获取数据的属性信息中的统一资源定位符下载对应的新网页 之后, 需要根据待获取数据的属性信息中的路径信息在对应的新网页中提取新 的页面片段。
为了便于说明 , 此处将创建待获取数据的属性信息时载入的用户指定的网 页称为原始网页, 由于新网页与原始网页有很高的相似性, 则可根据待获取数 据的属性信息中的路径信息在对应的新网页中提取新的页面片段。 仍以 XPath, 根据待获取数据的属性信息中的统一资源定位符下载对应的新网页之后 , 可以 用相同的 XPath将新的页面片段正确地提取出来。
最后, 在将新的页面片段提取出来之后, 将提取的新的页面片段整理为结 构化数据。
实际应用过程中, 可以按新的页面片段在页面中的位置临近关系, 将它们 编成组, 整理为结构化数据。 例如, 创建了两个待获取数据的属性信息, 根据 其中的一个属性信息获取的页面片段为搜索结果的标题, 根据另一个属性信息 获取的页面片段为搜索结果的摘要; 在该步驟中, 可根据这些页面片段的临近 关系, 编成 "搜索结果的标题 +搜索结果的摘要" 数据组, 每个数据组的两个页 面片段都从属于同一个搜索结果。 这样就形成了以搜索结果为行, 以属性为列 的结构化数据表格。 最后, 将结构化数据输出。 这里的输出格式可以是程序的 内部数据结构, 也可以是亂 ( Extens ib le Markup Language , 可扩展标记语 言 )或 JS0N ( JavaScr i pt Obj ect Notat ion, JavaScr i pt对象表示法 )等公开 格式。
可选地, 如果获取了多个结构化数据, 需要设定结构化数据之间的组合关 系, 设定方式为: 将一个结构化数据的属性信息设定为另一个结构化数据的输 入参数, 从而使多个结构化数据形成组合关系, 被整理成一个结构化数据。 例 如, 获取了两个结构化数据: 一个无运行参数, 通过提取专业电影网站上的数 据, 直接输出最新热映电影及其票房收入(其属性名设为 "电影名称" 和 "票 房收入" ) ; 另一个以影片的名称为参数(在这里, 参数的名称取决于被标记 的页面片段在原始页面上的参数名, 未必是 "电影名称" ) , 利用电影搜索页 面,提取该电影的放映影院及时间 (其属性名设为 "放映影院"和 "放映时间" )。 把前者的 "电影名称" 属性设定为后者的输入参数, 即对每个 "电影名称" 运 行一次后者, 就完成了两者的组合关系设定。 这样, 就可以同时运行两个结构 化数据, 自动获得含有 "电影名称" , "票房收入" , "放映影院" 和 "放映 时间" 4个属性的热门电影放映日程表。
可选地, 根据用户的个性化需求, 本实施例提供的方法, 还支持对获取到 的结构化数据进行加工。 如提供一系列算子, 如 "升序排序" , "降序排序" , "按条件筛选" 等等。 以前面的电影放映日程表为例, 可以对 "票房收入" 使 用 "降序排序"算子, 从而得到按票房排序的热门电影放映排行榜; 或者用 "按 条件筛选" 选出在自己空闲时间段上放映的电影, 从而更加方便地从中选择。
203: 将获取到的结构化数据转换为可视内容;
具体地, 由于本实施例提供的方法是基于网络的, 通过本实施例提供的方 法生成的微件可以较为容易地在计算能力有限的手持设备(如, 手机)上运行。 在将获取的结构化数据转换为可视内容时, 实现起来比较简单, 直接使用普通 的计算机或手机上的浏览器即可。 例如, 可以将结构化数据转换成 HTML ( Hyper Text Mark-up Language, 超文本标记语言) 的 tab le结构, 从而以一个表格的 形式展现出来; 或者转换成 div结构, 并配合不同的 CSS ( Cascad ing S tyl e Sheet s , 层叠样式表) 实现不同的展现效果。 其中, HTML以及与之配合的 CSS 等不仅可以通过计算机或手机上的浏览器下载, 还可将其封装成 SDK, 以本地应 用程序的方式在计算机或手机上运行。 至此, 在将获取到的结构化数据转换为 可视内容之后, 整个微件生成的过程即可视为结束, 但为了进一步满足用户的 个性化需求, 还可执行下面的可选步驟。
204: 根据用户的个性化需求, 对可视内容进行外观调整。
针对该步驟, 某些实施方式中, 为了满足用户的个性化需求, 同时为了兼 顾微件的外观, 本实施例提供的方法可根据用户的个性化需求, 对可视内容进 行外观调整。由于微件转换为可视内容后,用户界面是由 HTML、 CSS和 JavaScr ipt 等元素组成的, 因此, 可根据用户需求, 通过对这些元素进行修改, 实现微件 外观的调整。 例如, 对 HTML各种元素的样式, 以及某个数据的显示位置进行调 整。 对于组合起来的多个结构化数据, 可以配合使用 JavaScr ipt (网页脚本语 言)只显示用户感兴趣的数据, 从而减少结构化数据的运行次数, 等等。 最后, 将用户进行的所有设置进行保存。
综上所述, 本实施例提供的方法, 通过创建待获取数据的属性信息, 并根 据创建的属性信息获取结构化数据, 使获取的数据不仅内容丰富, 且由于待获 取数据的属性信息是根据用户指定的网页而创建的, 因此, 用户可直接参与到 生成微件的过程中, 能够尽可能满足多样化的用户需求; 另外, 还可根据用户 的个性化需求, 对可视内容进行调整, 从而兼顾了微件的外观, 进一步满足了 用户的多样化需求, 提升了用户体验。 实施例三
参见图 3, 本实施例提供了一种生成微件的装置, 该装置包括:
创建模块 301 ,用于根据用户指定的网页和在该网页上标记的页面片段创建 待获取数据的属性信息;
获取模块 302 ,用于根据创建模块 301创建的待获取数据的属性信息获取结 构化数据;
转换模块 303 , 用于将获取模块 302获取到的结构化数据转换为可视内容。 其中, 参见图 4 , 当用户创建简单型的待获取数据的属性信息时, 该创建模 块 301 , 具体包括:
第一获取单元 301a , 用于载入用户指定的网页, 并在检测到用户对网页的 页面片段进行标记之后 , 获取被用户标记的页面片段对应的路径信息;
第一创建单元 301b, 用于为待获取数据创建至少包括统一资源定位符及路 径信息的属性信息, 统一资源定位符为用户指定的网页对应的统一资源定位符, 路径信息为第一获取单元 301a 获取到的被用户标记的页面片段对应的路径信 息。
参见图 5 , 当用户创建复杂型的待获取数据的属性信息时,该创建模块 301 , 具体包括:
识别单元 301c, 用于载入用户指定的网页, 并在检测到用户对网页的页面 片段进行标记之后, 识别被用户标记的页面片段的相似页面片段;
第二获取单元 301d, 用于获取被用户标记的页面片段及其相似页面片段各 自对应的路径信息, 相似页面片段为识别单元 301c识别出的被用户标记的页面 片段的相似页面片段;
第二创建单元 301e, 用于为待获取数据创建至少包括统一资源定位符及路 径信息的属性信息, 统一资源定位符为被用户标记的页面片段及其相似页面片 段各自所在网页对应的统一资源定位符, 路径信息为第二获取单元 301d获取到 的被用户标记的页面片段及其相似页面片段各自对应的路径信息。
优选地, 参见图 6 , 当用户创建复杂型结构化数据时, 该创建模块还包括: 检测单元 301f ,用于对识别单元 301c识别出的被用户标记的页面片段的相 似页面片段进行检测 , 并根据检测结果增加或删除被用户标记的页面片段的相 似页面片段。
参见图 7 , 上述获取模块 302 , 具体包括:
下载单元 302a, 用于才艮据待获取数据的属性信息中的统一资源定位符下载 对应的新网页;
提取单元 302b, 用于根据待获取数据的属性信息中的路径信息在对应的新 网页中提取新的页面片段;
其中, 新网页为下载单元 302a下载的。
整理单元 302c, 用于将提取单元 302b提取的页面片段整理为结构化数据。 其中, 下载单元 302a , 具体用于在统一资源定位符中未包含请求参数时, 下载统一资源定位符对应的新网页; 或, 在统一资源定位符中包含请求参数时, 将请求参数作为可变参数供用户选择修改, 下载请求参数被用户修改后的统一 资源定位符对应的新网页。
优选地, 参见图 8 , 该装置还包括:
组合模块 304 ,用于将一个结构化数据的属性信息设定为另一个结构化数据 的输入参数, 使多个结构化数据形成组合关系, 被整理成一个结构化数据。
优选地, 参见图 9 , 该装置还包括:
加工模块 305 , 用于根据用户的需求, 对组合模块 304组合后的结构化数据 进行力口工。
其中, 加工模块 305加工的结构化数据还可以是获取模块 302获取的结构 化数据, 本实施例不对加工模块 305加工的结构化数据进行具体限定, 此处以 加工模块 305加工的结构化数据为组合模块 304组合后的结构化数据为例。
进一步地, 参见图 10, 该装置还包括:
调整模块 306 , 用于根据用户的个性化需求, 对转换模块 303转换的可视内 容进行外观调整。
实际应用中, 本发明实施例中的装置, 还可执行上述方法实施例一或二提 供的技术方案, 执行过程如下:
首先, 由创建模块 301 创建待获取数据的属性信息。 如果创建简单型的待 获取数据的属性信息, 则通过创建模块 301中的第一获取单元 301a和第一创建 单元 301b实现; 如果创建复杂型的待获取数据的属性信息, 则由创建模块 301 中的识别单元 301c、 第二获取单元 301d和第二创建单元 301e实现。
其次, 由获取模块 302中的下载单元 302a、提取单元 302b和整理单元 302c 实现获取结构化数据。
最后, 由转换模块 303将获取模块 302获取到的结构化数据转换为可视内 容, 从而生成 件。
综上所述, 本实施例通过创建待获取数据的属性信息, 并根据创建的属性 信息获取结构化数据, 使获取的数据不仅内容丰富, 且由于待获取数据的属性 信息是根据用户指定的网页而创建的, 因此, 用户可直接参与到生成微件的过 程中, 能够尽可能满足多样化的用户需求; 另外, 由于本实施例提供的装置还 可支持对可视内容进行外观调整, 进而满足了用户的个性化需求, 提升了用户 体验。
上述本发明实施例序号仅仅为了描述, 不代表实施例的优劣。 可以通过计算机程序来指令相关的硬件来完成, 所述的程序可存储于一计算机 可读取存储介质中, 该程序在执行时, 可包括如上述各方法的实施例的流程。 其中, 所述的存储介质可为磁碟、 光盘、 只读存储记忆体( Read-Only Memory , ROM )或随机存储记忆体(Random Access Memory, RAM )等。
以上所述仅为本发明的较佳实施例, 并不用以限制本发明, 凡在本发明的 精神和原则之内, 所作的任何修改、 等同替换、 改进等, 均应包含在本发明的 保护范围之内。

Claims

权 利 要 求 书
1、 一种生成微件的方法, 其特征在于, 所述方法包括:
根据用户指定的网页和在所述网页上标记的页面片段创建待获取数据的属 性信息;
根据创建的所述待获取数据的属性信息获取结构化数据;
将获取到的所述结构化数据转换为可视内容。
2、 根据权利要求 1所述的方法, 其特征在于, 所述根据用户指定的网页和 在所述网页上标记的页面片段创建待获取数据的属性信息 , 包括:
载入用户指定的网页, 并在检测到用户对所述网页的页面片段进行标记之 后, 获取被用户标记的页面片段对应的路径信息;
为所述待获取数据创建至少包括统一资源定位符及路径信息的属性信息 , 所述统一资源定位符为所述用户指定的网页对应的统一资源定位符, 所述路径 信息为所述被用户标记的页面片段对应的路径信息。
3、 根据权利要求 1所述的方法, 其特征在于, 所述根据用户指定的网页和 在所述网页上标记的页面片段创建待获取数据的属性信息 , 包括:
载入用户指定的网页 , 并在检测到用户对所述网页的页面片段进行标记之 后, 识别被用户标记的页面片段的相似页面片段;
获取被用户标记的页面片段及其相似页面片段各自对应的路径信息; 为所述待获取数据创建至少包括统一资源定位符及路径信息的属性信息 , 网页对应的统一资源定位符 , 所述路径信息为所述被用户标记的页面片段及其 相似页面片段各自对应的路径信息。
4、 根据权利要求 1至 3任一权利要求所述的方法, 其特征在于, 所述根据 创建的所述待获取数据的属性信息获取结构化数据, 具体包括:
根据所述待获取数据的属性信息中的统一资源定位符下载对应的新网页; 根据所述待获取数据的属性信息中的路径信息在对应的新网页中提取新的 页面片段; 将提取的新的页面片段整理为结构化数据。
5、 根据权利要求 4所述的方法, 其特征在于, 所述根据所述待获取数据的 属性信息中的统一资源定位符下载对应的新网页, 具体包括:
若所述统一资源定位符中未包含请求参数, 则下载所述统一资源定位符对 应的新网页;
若所述统一资源定位符中包含请求参数, 则将所述请求参数作为可变参数 供用户选择修改 , 下载请求参数被用户修改后的统一资源定位符对应的新网页。
6、 一种生成微件的装置, 其特征在于, 所述装置包括:
创建模块, 用于根据用户指定的网页和在所述网页上标记的页面片段创建 待获取数据的属性信息;
获取模块, 用于根据所述创建模块创建的所述待获取数据的属性信息获取 结构化数据;
转换模块, 用于将所述获取模块获取到的所述结构化数据转换为可视内容。
7、 根据权利要求 6所述的装置, 其特征在于, 所述创建模块, 具体包括: 第一获取单元, 用于载入用户指定的网页, 并在检测到用户对所述网页的 页面片段进行标记之后, 获取被用户标记的页面片段对应的路径信息;
第一创建单元, 用于为所述待获取数据创建至少包括统一资源定位符及路 径信息的属性信息, 所述统一资源定位符为所述用户指定的网页对应的统一资 源定位符, 所述路径信息为所述第一获取单元获取到的被用户标记的页面片段 对应的路径信息。
8、 根据权利要求 6所述的装置, 其特征在于, 所述创建模块, 具体包括: 识别单元, 用于载入用户指定的网页, 并在检测到用户对所述网页的页面 片段进行标记之后, 识别被用户标记的页面片段的相似页面片段;
页面片段的相似页面片段; 第二创建单元, 用于为所述待获取数据创建至少包括统一资源定位符及路 径信息的属性信息, 所述统一资源定位符为所述被用户标记的页面片段及其相 似页面片段各自所在网页对应的统一资源定位符, 所述路径信息为所述第二获 信息。 ' 、 ' ^
9、 根据权利要求 6至 8任一权利要求所述的装置, 其特征在于, 所述获取 模块, 具体包括:
下载单元, 用于根据所述待获取数据的属性信息中的统一资源定位符下载 对应的新网页;
提取单元, 用于根据所述待获取数据的属性信息中的路径信息在对应的新 网页中提取新的页面片段, 所述新网页为所述下载单元下载的;
整理单元, 用于将所述提取单元提取的新的页面片段整理为结构化数据。
10、 根据权利要求 9 所述的装置, 其特征在于, 所述下载单元, 具体用于 在所述统一资源定位符中未包含请求参数时, 下载所述统一资源定位符对应的 新网页; 或, 在所述统一资源定位符中包含请求参数时, 将所述请求参数作为 可变参数供用户选择修改, 下载请求参数被用户修改后的统一资源定位符对应 的新网页。
PCT/CN2010/076466 2009-12-10 2010-08-30 生成微件的方法及装置 WO2011069377A1 (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
US13/339,135 US20120102390A1 (en) 2009-12-10 2011-12-28 Method and apparatus for generating widget

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN200910258109.4 2009-12-10
CN200910258109.4A CN102096581B (zh) 2009-12-10 2009-12-10 生成微件的方法及装置

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US13/339,135 Continuation US20120102390A1 (en) 2009-12-10 2011-12-28 Method and apparatus for generating widget

Publications (1)

Publication Number Publication Date
WO2011069377A1 true WO2011069377A1 (zh) 2011-06-16

Family

ID=44129689

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2010/076466 WO2011069377A1 (zh) 2009-12-10 2010-08-30 生成微件的方法及装置

Country Status (3)

Country Link
US (1) US20120102390A1 (zh)
CN (1) CN102096581B (zh)
WO (1) WO2011069377A1 (zh)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102222006A (zh) * 2011-07-22 2011-10-19 武汉天喻信息产业股份有限公司 移动Widget用户界面的实现方法及装置
CN102880679B (zh) * 2012-09-11 2016-01-13 北京易云剪客科技有限公司 一种网页信息存储方法和装置
CN103092945B (zh) * 2013-01-11 2019-11-26 北京百度网讯科技有限公司 一种基于界面返回的搜索方法和装置
CN103120595A (zh) * 2013-02-20 2013-05-29 王水 一种手术用拉钩装置
KR101428365B1 (ko) * 2013-02-25 2014-08-08 주식회사 팬택 모바일 기기의 홈 스크린에서 위젯을 제공하는 방법 및 시스템
CN104144357B (zh) * 2013-05-10 2017-08-04 中国电信股份有限公司 视频播放方法和系统
US20150113451A1 (en) * 2013-10-23 2015-04-23 Steve Kopp Creation of widgets based on a current data context
CN104036028B (zh) * 2014-06-27 2018-02-06 吴涛军 一种电子文档信息片段的处理系统与电子文档信息片段的生成、处理、差异化显示的方法
CN104298705B (zh) * 2014-08-20 2018-07-20 龙国良 一种关系型数据和非结构化数据的转换方法
CN105808221A (zh) * 2014-12-31 2016-07-27 阿里巴巴集团控股有限公司 一种卡片式桌面的实现方法和装置
CN106354727B (zh) * 2015-07-16 2021-01-26 中兴通讯股份有限公司 小部件文件生成方法和装置
CN108304190A (zh) * 2016-09-22 2018-07-20 百度在线网络技术(北京)有限公司 网络店铺生成方法及装置
CN106527937B (zh) * 2016-10-26 2019-10-15 维沃移动通信有限公司 一种移动终端微件的添加方法及移动终端

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008030878A2 (en) * 2006-09-06 2008-03-13 Apple Inc. Web-clip widgets on a portable multifunction device
CN101414239A (zh) * 2007-10-16 2009-04-22 株式会社日立制作所 数据处理装置的信息提供方法
CN101552836A (zh) * 2009-05-18 2009-10-07 浙江大学 应用于手机中移动Widget引擎的实现方法

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020152244A1 (en) * 2000-12-22 2002-10-17 International Business Machines Corporation Method and apparatus to dynamically create a customized user interface based on a document type definition
US7647385B2 (en) * 2003-12-19 2010-01-12 Microsoft Corporation Techniques for limiting network access
JP4335726B2 (ja) * 2004-03-30 2009-09-30 富士通株式会社 画面に表示されたデータを介して異なるアプリケーションで連携を行う方法およびプログラム
CN101206668B (zh) * 2007-12-14 2011-05-04 北大方正集团有限公司 一种网站内容组件生成方法、解析方法及装置
CN101526942A (zh) * 2008-03-05 2009-09-09 徐邦勇 在线、实时及自动生成动态网页的组件实现技术
US9152722B2 (en) * 2008-07-22 2015-10-06 Yahoo! Inc. Augmenting online content with additional content relevant to user interest
US8407576B1 (en) * 2008-09-02 2013-03-26 Sitscape, Inc. Situational web-based dashboard
US8452769B2 (en) * 2008-09-19 2013-05-28 International Business Machines Corporation Context aware search document
US8365082B2 (en) * 2008-10-23 2013-01-29 Savnor Technologies Llc Universal content referencing, packaging, distribution system, and a tool for customizing web content
KR20100127162A (ko) * 2009-05-25 2010-12-03 엘지전자 주식회사 단말 내에서 브로드캐스트 서비스를 통해 관련된 콘텐츠를 검색하고 주문하는 방법 및 장치

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008030878A2 (en) * 2006-09-06 2008-03-13 Apple Inc. Web-clip widgets on a portable multifunction device
CN101414239A (zh) * 2007-10-16 2009-04-22 株式会社日立制作所 数据处理装置的信息提供方法
CN101552836A (zh) * 2009-05-18 2009-10-07 浙江大学 应用于手机中移动Widget引擎的实现方法

Also Published As

Publication number Publication date
CN102096581A (zh) 2011-06-15
US20120102390A1 (en) 2012-04-26
CN102096581B (zh) 2015-03-18

Similar Documents

Publication Publication Date Title
WO2011069377A1 (zh) 生成微件的方法及装置
CN101488151B (zh) 一种聚合Web站点内容的系统和方法
Bila et al. Pagetailor: reusable end-user customization for the mobile web
JP5133984B2 (ja) 入力候補提供装置、入力候補提供システム、入力候補提供方法、および入力候補提供プログラム
TW201013430A (en) Method and system for providing suggested tags associated with a target page for manipulation by a user
TW201250492A (en) Method and system of extracting web page information
JP2013508807A (ja) インターネットナビゲーションページを生成する方法および装置
Huynh et al. Enabling web browsers to augment web sites' filtering and sorting functionalities
CN101174205A (zh) 一种让用户使用网站制作手机电子书、图册、游戏的方法
WO2012141183A1 (ja) 多様な端末機器に対応するコンテンツ提供装置
CN104731815B (zh) 一种网页元素的绘制方法及装置
CN105447198A (zh) 页面脚本便捷导入的方法及装置
US9251281B2 (en) Web browsing using placemarks and contextual relationships in a data processing system
WO2015003664A1 (zh) 一种下载处理方法、装置、服务器及客户端设备
CN108984632A (zh) 一种网页设置方法及装置
CN108959475A (zh) 一种网页设置方法及装置
CN113177168A (zh) 一种基于Web元素属性特征的定位方法
TWI474202B (zh) 分析文件內容的方法、手持式電子裝置及電腦程式產品
CN107622125B (zh) 一种信息爬取方法和装置、电子设备
CN103136314A (zh) 一种舆情监控中剪报生成方法及系统
CN110147477B (zh) Web系统的数据资源模型化提取方法、装置以及设备
JP2007280124A5 (zh)
JP2012168590A (ja) コミック閲覧システム
CN104375931A (zh) 一种移动浏览器特性检测及结果统计方法
JP2011048764A (ja) マッシュアッププログラム、マッシュアップ装置及びマッシュアップ方法

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 10835412

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 10835412

Country of ref document: EP

Kind code of ref document: A1