JP2006065467A5 - - Google Patents
Download PDFInfo
- Publication number
- JP2006065467A5 JP2006065467A5 JP2004245197A JP2004245197A JP2006065467A5 JP 2006065467 A5 JP2006065467 A5 JP 2006065467A5 JP 2004245197 A JP2004245197 A JP 2004245197A JP 2004245197 A JP2004245197 A JP 2004245197A JP 2006065467 A5 JP2006065467 A5 JP 2006065467A5
- Authority
- JP
- Japan
- Prior art keywords
- page
- mark
- data extraction
- definition information
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000013075 data extraction Methods 0.000 description 137
- 238000000034 method Methods 0.000 description 42
- 230000008569 process Effects 0.000 description 27
- 238000000605 extraction Methods 0.000 description 25
- 239000000523 sample Substances 0.000 description 20
- 238000010586 diagram Methods 0.000 description 16
- 230000010354 integration Effects 0.000 description 16
- 238000004891 communication Methods 0.000 description 10
- 239000000047 product Substances 0.000 description 9
- 230000006870 function Effects 0.000 description 8
- 230000010365 information processing Effects 0.000 description 7
- 239000000284 extract Substances 0.000 description 6
- 230000003252 repetitive effect Effects 0.000 description 6
- 238000012804 iterative process Methods 0.000 description 5
- 238000001514 detection method Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000012634 fragment Substances 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 210000001072 colon Anatomy 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2004245197A JP2006065467A (ja) | 2004-08-25 | 2004-08-25 | データ抽出定義情報生成装置およびデータ抽出定義情報生成方法 |
| US11/153,475 US20060047693A1 (en) | 2004-08-25 | 2005-06-16 | Apparatus for and method of generating data extraction definition information |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2004245197A JP2006065467A (ja) | 2004-08-25 | 2004-08-25 | データ抽出定義情報生成装置およびデータ抽出定義情報生成方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2006065467A JP2006065467A (ja) | 2006-03-09 |
| JP2006065467A5 true JP2006065467A5 (enExample) | 2007-01-25 |
Family
ID=35944656
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2004245197A Withdrawn JP2006065467A (ja) | 2004-08-25 | 2004-08-25 | データ抽出定義情報生成装置およびデータ抽出定義情報生成方法 |
Country Status (2)
| Country | Link |
|---|---|
| US (1) | US20060047693A1 (enExample) |
| JP (1) | JP2006065467A (enExample) |
Families Citing this family (10)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN101094194B (zh) * | 2006-06-19 | 2010-06-23 | 腾讯科技(深圳)有限公司 | 一种提取Web页面中用户所需Web信息的方法 |
| US20080033997A1 (en) * | 2006-08-04 | 2008-02-07 | Sap Portals (Israel) Ltd. | Transformation tool for migration of web-based content to portal |
| WO2008090908A1 (ja) | 2007-01-23 | 2008-07-31 | Nec Corporation | マーカ生成及びマーカ検出のシステム、方法とプログラム |
| US8402373B2 (en) * | 2008-10-10 | 2013-03-19 | Sharp Laboratories Of America, Inc. | Device cloning method for non-programmatic interfaces |
| US8683311B2 (en) * | 2009-12-11 | 2014-03-25 | Microsoft Corporation | Generating structured data objects from unstructured web pages |
| WO2013054196A2 (en) | 2011-10-14 | 2013-04-18 | Open Text S.A. | System and method for secure content sharing and synchronization |
| US8959142B2 (en) | 2012-02-29 | 2015-02-17 | Microsoft Corporation | Combining server-side and client-side user interface elements |
| WO2015027425A1 (zh) | 2013-08-29 | 2015-03-05 | 华为技术有限公司 | 存储数据的方法和装置 |
| JP6397105B2 (ja) * | 2017-10-05 | 2018-09-26 | 華為技術有限公司Huawei Technologies Co.,Ltd. | データを記憶する方法及び装置 |
| CN110909228A (zh) * | 2019-11-21 | 2020-03-24 | 上海建工集团股份有限公司 | 一种基于网络爬虫机制的数据抽取方法 |
Family Cites Families (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP3476185B2 (ja) * | 1999-12-27 | 2003-12-10 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 情報抽出システム、情報処理装置、情報収集装置、文字列抽出方法及び記憶媒体 |
| US20030050969A1 (en) * | 2001-03-20 | 2003-03-13 | Sant Philip Anthony | Information integration system |
| JP2003345697A (ja) * | 2002-05-27 | 2003-12-05 | Hitachi Ltd | 統合インタフェース提供方法、装置及び記憶媒体 |
-
2004
- 2004-08-25 JP JP2004245197A patent/JP2006065467A/ja not_active Withdrawn
-
2005
- 2005-06-16 US US11/153,475 patent/US20060047693A1/en not_active Abandoned
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US11294968B2 (en) | Combining website characteristics in an automatically generated website | |
| CN106682219B (zh) | 关联文档获取方法及装置 | |
| US7240281B2 (en) | System, method and program for printing an electronic document | |
| WO2009011837A1 (en) | Extraction and reapplication of design information to existing websites | |
| US20160283606A1 (en) | Method for performing webpage loading, device and browser thereof | |
| US20090313539A1 (en) | Information processor, information processing method, and recording medium | |
| JP2005339566A (ja) | コンテンツを開始テンプレートとターゲットテンプレートとの間でマップするための方法およびシステム | |
| JP2010055483A (ja) | 情報再取得手順生成プログラム及び情報再取得手順生成装置 | |
| CN113360106B (zh) | 一种网页打印方法和装置 | |
| CN107220250A (zh) | 一种模板配置方法及系统 | |
| JP2006065467A5 (enExample) | ||
| JP5098605B2 (ja) | アノテーションプログラム、アノテーション装置 | |
| JP2006065467A (ja) | データ抽出定義情報生成装置およびデータ抽出定義情報生成方法 | |
| EP0977130A1 (en) | Facility for selecting and printing web pages | |
| CN108388796B (zh) | 动态域名验证方法、系统、计算机设备和存储介质 | |
| JP4133549B2 (ja) | 構造化文書ファイル管理装置および構造化文書ファイル管理方法 | |
| CN101923463A (zh) | 信息处理装置和方法 | |
| EP2711838A1 (en) | Documentation parser | |
| JP5391738B2 (ja) | アノテーションプログラム、アノテーション装置及びアノテーション方法 | |
| US20120192046A1 (en) | Generation of a source complex document to facilitate content access in complex document creation | |
| JP5712496B2 (ja) | アノテーション復元方法、アノテーション付与方法、アノテーション復元プログラム及びアノテーション復元装置 | |
| JP2008090404A (ja) | 文書検索装置、文書検索方法および文書検索プログラム | |
| JP2008134906A (ja) | 業務プロセス定義生成方法、装置及びプログラム | |
| US8230327B2 (en) | Identifying statements requiring additional processing when forwarding a web page description | |
| CN109657184B (zh) | 富文本处理方法、装置、服务器及计算机可读介质 |