JP2006065467A5 - - Google Patents

Download PDF

Info

Publication number
JP2006065467A5
JP2006065467A5 JP2004245197A JP2004245197A JP2006065467A5 JP 2006065467 A5 JP2006065467 A5 JP 2006065467A5 JP 2004245197 A JP2004245197 A JP 2004245197A JP 2004245197 A JP2004245197 A JP 2004245197A JP 2006065467 A5 JP2006065467 A5 JP 2006065467A5
Authority
JP
Japan
Prior art keywords
page
mark
data extraction
definition information
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2004245197A
Other languages
English (en)
Japanese (ja)
Other versions
JP2006065467A (ja
Filing date
Publication date
Application filed filed Critical
Priority to JP2004245197A priority Critical patent/JP2006065467A/ja
Priority claimed from JP2004245197A external-priority patent/JP2006065467A/ja
Priority to US11/153,475 priority patent/US20060047693A1/en
Publication of JP2006065467A publication Critical patent/JP2006065467A/ja
Publication of JP2006065467A5 publication Critical patent/JP2006065467A5/ja
Withdrawn legal-status Critical Current

Links

JP2004245197A 2004-08-25 2004-08-25 データ抽出定義情報生成装置およびデータ抽出定義情報生成方法 Withdrawn JP2006065467A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2004245197A JP2006065467A (ja) 2004-08-25 2004-08-25 データ抽出定義情報生成装置およびデータ抽出定義情報生成方法
US11/153,475 US20060047693A1 (en) 2004-08-25 2005-06-16 Apparatus for and method of generating data extraction definition information

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004245197A JP2006065467A (ja) 2004-08-25 2004-08-25 データ抽出定義情報生成装置およびデータ抽出定義情報生成方法

Publications (2)

Publication Number Publication Date
JP2006065467A JP2006065467A (ja) 2006-03-09
JP2006065467A5 true JP2006065467A5 (enExample) 2007-01-25

Family

ID=35944656

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004245197A Withdrawn JP2006065467A (ja) 2004-08-25 2004-08-25 データ抽出定義情報生成装置およびデータ抽出定義情報生成方法

Country Status (2)

Country Link
US (1) US20060047693A1 (enExample)
JP (1) JP2006065467A (enExample)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101094194B (zh) * 2006-06-19 2010-06-23 腾讯科技(深圳)有限公司 一种提取Web页面中用户所需Web信息的方法
US20080033997A1 (en) * 2006-08-04 2008-02-07 Sap Portals (Israel) Ltd. Transformation tool for migration of web-based content to portal
WO2008090908A1 (ja) 2007-01-23 2008-07-31 Nec Corporation マーカ生成及びマーカ検出のシステム、方法とプログラム
US8402373B2 (en) * 2008-10-10 2013-03-19 Sharp Laboratories Of America, Inc. Device cloning method for non-programmatic interfaces
US8683311B2 (en) * 2009-12-11 2014-03-25 Microsoft Corporation Generating structured data objects from unstructured web pages
WO2013054196A2 (en) 2011-10-14 2013-04-18 Open Text S.A. System and method for secure content sharing and synchronization
US8959142B2 (en) 2012-02-29 2015-02-17 Microsoft Corporation Combining server-side and client-side user interface elements
WO2015027425A1 (zh) 2013-08-29 2015-03-05 华为技术有限公司 存储数据的方法和装置
JP6397105B2 (ja) * 2017-10-05 2018-09-26 華為技術有限公司Huawei Technologies Co.,Ltd. データを記憶する方法及び装置
CN110909228A (zh) * 2019-11-21 2020-03-24 上海建工集团股份有限公司 一种基于网络爬虫机制的数据抽取方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3476185B2 (ja) * 1999-12-27 2003-12-10 インターナショナル・ビジネス・マシーンズ・コーポレーション 情報抽出システム、情報処理装置、情報収集装置、文字列抽出方法及び記憶媒体
US20030050969A1 (en) * 2001-03-20 2003-03-13 Sant Philip Anthony Information integration system
JP2003345697A (ja) * 2002-05-27 2003-12-05 Hitachi Ltd 統合インタフェース提供方法、装置及び記憶媒体

Similar Documents

Publication Publication Date Title
US11294968B2 (en) Combining website characteristics in an automatically generated website
CN106682219B (zh) 关联文档获取方法及装置
US7240281B2 (en) System, method and program for printing an electronic document
WO2009011837A1 (en) Extraction and reapplication of design information to existing websites
US20160283606A1 (en) Method for performing webpage loading, device and browser thereof
US20090313539A1 (en) Information processor, information processing method, and recording medium
JP2005339566A (ja) コンテンツを開始テンプレートとターゲットテンプレートとの間でマップするための方法およびシステム
JP2010055483A (ja) 情報再取得手順生成プログラム及び情報再取得手順生成装置
CN113360106B (zh) 一种网页打印方法和装置
CN107220250A (zh) 一种模板配置方法及系统
JP2006065467A5 (enExample)
JP5098605B2 (ja) アノテーションプログラム、アノテーション装置
JP2006065467A (ja) データ抽出定義情報生成装置およびデータ抽出定義情報生成方法
EP0977130A1 (en) Facility for selecting and printing web pages
CN108388796B (zh) 动态域名验证方法、系统、计算机设备和存储介质
JP4133549B2 (ja) 構造化文書ファイル管理装置および構造化文書ファイル管理方法
CN101923463A (zh) 信息处理装置和方法
EP2711838A1 (en) Documentation parser
JP5391738B2 (ja) アノテーションプログラム、アノテーション装置及びアノテーション方法
US20120192046A1 (en) Generation of a source complex document to facilitate content access in complex document creation
JP5712496B2 (ja) アノテーション復元方法、アノテーション付与方法、アノテーション復元プログラム及びアノテーション復元装置
JP2008090404A (ja) 文書検索装置、文書検索方法および文書検索プログラム
JP2008134906A (ja) 業務プロセス定義生成方法、装置及びプログラム
US8230327B2 (en) Identifying statements requiring additional processing when forwarding a web page description
CN109657184B (zh) 富文本处理方法、装置、服务器及计算机可读介质