JP4870809B2 - 関連するウェブページ内コンテンツを分類・整理し自由自在に再構成して表示する方法 - Google Patents
関連するウェブページ内コンテンツを分類・整理し自由自在に再構成して表示する方法 Download PDFInfo
- Publication number
- JP4870809B2 JP4870809B2 JP2009299304A JP2009299304A JP4870809B2 JP 4870809 B2 JP4870809 B2 JP 4870809B2 JP 2009299304 A JP2009299304 A JP 2009299304A JP 2009299304 A JP2009299304 A JP 2009299304A JP 4870809 B2 JP4870809 B2 JP 4870809B2
- Authority
- JP
- Japan
- Prior art keywords
- web page
- text
- related web
- server
- feature word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 45
- 230000008569 process Effects 0.000 claims description 19
- 238000000605 extraction Methods 0.000 claims description 11
- 238000004891 communication Methods 0.000 claims description 9
- 239000000284 extract Substances 0.000 claims description 5
- 238000010586 diagram Methods 0.000 description 8
- 230000010365 information processing Effects 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 230000008520 organization Effects 0.000 description 2
- 239000003086 colorant Substances 0.000 description 1
- 238000010411 cooking Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/954—Navigation, e.g. using categorised browsing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9538—Presentation of query results
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Remote Sensing (AREA)
- Radar, Positioning & Navigation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
- Information Transfer Between Computers (AREA)
Description
この方法では,サーバが,複数の関連ウェブページ内のコンテンツをテキスト,及び画像に分類して,各関連ウェブページのテキスト及び画像の配置を把握する(ウェブ内配置把握工程)。
サーバが,ウェブ内配置把握工程で把握したテキスト及び画像の配置に基づいて,各関連ウェブページを複数の区分に分割する(ウェブ分割工程)。
サーバが,ウェブ分割工程で分割した各関連ウェブページの区分ごとに,当該区分に含まれるテキストに基づいて当該区分の特徴語を抽出する(特徴語抽出工程)。
サーバが,特徴語抽出工程で抽出した各関連ウェブページの区分ごとの特徴語を整理する(特徴語整理工程)。
サーバが,特徴語整理工程で整理した特徴語に基づいて,特徴語に関連したテキスト及び当該特徴語に関連した画像を整理する(表示情報整理工程)。
そして,サーバが,サーバと通信回線を介して接続された端末に,表示情報整理工程で整理された特徴語に関連したテキスト及び整理された特徴語に関連した画像を,複数の関連ウェブページへのリンクとともに表示させる(関連ウェブページ表示工程)。
サーバが,複数の関連ウェブページ内のコンテンツについてタグを用いて,各関連ウェブページのテキスト及び画像の配置を把握する(ウェブ内配置把握工程)。
サーバが,ウェブ内配置把握工程で把握したテキスト及び画像の配置に基づいて,各関連ウェブページを複数の区分に分割する(ウェブ分割工程)。
サーバが,特徴語抽出工程で抽出した各関連ウェブページの区分ごとのタグを整理する(特徴語整理工程)。
サーバが,特徴語整理工程で整理したタグに基づいて,タグに関連したテキスト及び当該タグに関連した画像を整理する(表示情報整理工程)。
サーバが,サーバと通信回線を介して接続された端末に,表示情報整理工程で整理されたタグに関連したテキスト及び整理されたタグに関連した画像を,複数の関連ウェブページへのリンクとともに表示する(関連ウェブページ表示工程)。
複数の関連ウェブページ内のコンテンツを分類・整理し自由自在に再構成して表示するための方法であって,
前記コンピュータが,複数の関連ウェブページ内のコンテンツをテキスト,及び画像に分類して,各関連ウェブページのテキスト及び画像の配置を把握するウェブ内配置把握工程と,
前記コンピュータが,前記ウェブ内配置把握工程で把握したテキスト及び画像の配置に基づいて,各関連ウェブページを複数の区分に分割するウェブ分割工程と,
前記コンピュータが,前記ウェブ分割工程で分割した各関連ウェブページの区分ごとに,当該区分に含まれるテキストに基づいて当該区分の特徴語を抽出する特徴語抽出工程と,
前記コンピュータが,特徴語抽出工程で抽出した各関連ウェブページの区分ごとの特徴語を整理する特徴語整理工程と,
前記コンピュータが,前記特徴語整理工程で整理した特徴語に基づいて,前記特徴語に関連したテキスト及び当該特徴語に関連した画像を整理する表示情報整理工程と,
を含む方法を実行するためのサーバとして機能させるためのプログラムをも提供する。
22 ウェブ分割手段
23 特徴語抽出手段
24 特徴語整理手段
25 表示情報整理手段
26 関連ウェブページ表示手段
Claims (2)
- サーバが,複数の関連ウェブページ内のコンテンツを分類・整理し,再構成して,前記サーバと通信回線を介して接続された端末に表示するための方法であって,
前記複数の関連ウェブページは,あるウェブサイトに含まれる複数のウェブページであり,
前記サーバが,複数の関連ウェブページ内のコンテンツをテキスト,及び画像に分類して,各関連ウェブページのテキスト及び画像の配置を把握するウェブ内配置把握工程と,
前記サーバが,前記ウェブ内配置把握工程で把握したテキスト及び画像の配置に基づいて,各関連ウェブページを,前記テキストのみ又は前記テキスト及び前記画像を含む複数の区分に分割するウェブ分割工程と,
前記サーバが,前記区分の属性を示す複数の特徴語が当該特徴語と関連する単語と関連付けて記憶されている特徴語データベースを参照して,前記ウェブ分割工程で分割した各関連ウェブページの区分ごとに,当該区分に含まれるテキストに基づいて,当該区分の属性を示す特徴語を抽出する特徴語抽出工程と,
前記サーバが,前記各関連ウェブページに含まれる複数の区分ごとに,当該区分に含まれるテキスト又は画像を,前記特徴語抽出工程で抽出した前記特徴語と関連付けてデータベースに記憶する特徴語記憶工程と,
前記サーバが,前記関連ウェブページへのリンク情報と共に前記端末に表示させるためのテキスト又は画像を含む区分の属性を示す一又は複数の特徴語の入力を受け付ける特徴語入力工程と,
前記サーバが,前記端末に入力された検索条件を用いて,前記データベースから当該検索条件を満たす一又は複数の関連ウェブページを抽出する関連ウェブページ抽出工程と,
前記サーバが,前記特徴語記憶工程において前記データベースに記憶されている区分に含まれるテキスト又は画像のうち,前記関連ウェブページ抽出工程で抽出された各関連ウェブページに含まれ,かつ,前記特徴語入力工程で入力された一又は複数の特徴語と関連付けて記憶されている区分に含まれるテキスト又は画像を読み出し,当該テキストの数又は当該画像の数に基づいて,当該テキスト又は当該画像が含まれる各関連ウェブページへのリンク情報とともに,当該テキスト又は当該画像を表示するための表示領域を演算する表示情報整理工程と,
前記サーバが,前記表示情報整理工程において演算した前記表示領域に前記特徴語と関連した前記区分に含まれるテキスト又は画像を割り当て,前記検索条件が入力された前記端末に,前記複数の関連ウェブページへのリンクとともに表示させる関連ウェブページ表示工程を含む,
方法。
- 前記複数の関連ウェブページの全ては,あるウェブサイトに含まれるウェブページであり,
さらに,前記特徴語抽出工程で抽出した特徴語を前記あるウェブサイトのトップページに検索インデックスとして追加する工程を含む,
請求項1に記載の方法。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009299304A JP4870809B2 (ja) | 2009-12-30 | 2009-12-30 | 関連するウェブページ内コンテンツを分類・整理し自由自在に再構成して表示する方法 |
PCT/JP2010/007597 WO2011080926A1 (ja) | 2009-12-30 | 2010-12-28 | コンテンツ構成方法 |
EP10840785.9A EP2521045A4 (en) | 2009-12-30 | 2010-12-28 | CONTENT CONFIGURATION METHOD |
US13/518,081 US20120260161A1 (en) | 2009-12-30 | 2010-12-28 | Method for classifying and organizing content in related web pages and freely reconstructing and displaying the content |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009299304A JP4870809B2 (ja) | 2009-12-30 | 2009-12-30 | 関連するウェブページ内コンテンツを分類・整理し自由自在に再構成して表示する方法 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010183953A Division JP4901985B2 (ja) | 2010-08-19 | 2010-08-19 | 関連するウェブページ内コンテンツを分類・整理し自由自在に再構成して表示する方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011138441A JP2011138441A (ja) | 2011-07-14 |
JP4870809B2 true JP4870809B2 (ja) | 2012-02-08 |
Family
ID=44226350
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009299304A Active JP4870809B2 (ja) | 2009-12-30 | 2009-12-30 | 関連するウェブページ内コンテンツを分類・整理し自由自在に再構成して表示する方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20120260161A1 (ja) |
EP (1) | EP2521045A4 (ja) |
JP (1) | JP4870809B2 (ja) |
WO (1) | WO2011080926A1 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2915343B1 (en) | 2012-11-02 | 2019-10-23 | GE Intelligent Platforms, Inc. | Apparatus and method for geolocation intelligence |
EP2915311B1 (en) * | 2012-11-02 | 2016-11-16 | GE Intelligent Platforms, Inc. | Apparatus and method of content containment |
CN105550165A (zh) * | 2015-12-23 | 2016-05-04 | 深圳市八零年代网络科技有限公司 | 可将网页文章导入网页文本编辑器的插件及方法 |
CN111480153A (zh) * | 2017-12-11 | 2020-07-31 | 三星电子株式会社 | 用于管理网络内容的导航的方法和装置 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03132872A (ja) * | 1989-10-19 | 1991-06-06 | Nippon Telegr & Teleph Corp <Ntt> | 索引情報生成装置 |
JP2937520B2 (ja) * | 1991-03-08 | 1999-08-23 | 株式会社東芝 | 文書検索装置 |
US8065151B1 (en) * | 2002-12-18 | 2011-11-22 | At&T Intellectual Property Ii, L.P. | System and method of automatically building dialog services by exploiting the content and structure of websites |
JP2005267344A (ja) * | 2004-03-19 | 2005-09-29 | Canon Inc | 文書整形装置、文書整形方法及びプログラム |
US7421651B2 (en) * | 2004-12-30 | 2008-09-02 | Google Inc. | Document segmentation based on visual gaps |
JP2009087106A (ja) | 2007-09-30 | 2009-04-23 | Sannetto:Kk | インターネット情報提供サービスシステム |
US8255793B2 (en) * | 2008-01-08 | 2012-08-28 | Yahoo! Inc. | Automatic visual segmentation of webpages |
US20090248707A1 (en) * | 2008-03-25 | 2009-10-01 | Yahoo! Inc. | Site-specific information-type detection methods and systems |
US8849725B2 (en) * | 2009-08-10 | 2014-09-30 | Yahoo! Inc. | Automatic classification of segmented portions of web pages |
-
2009
- 2009-12-30 JP JP2009299304A patent/JP4870809B2/ja active Active
-
2010
- 2010-12-28 US US13/518,081 patent/US20120260161A1/en not_active Abandoned
- 2010-12-28 EP EP10840785.9A patent/EP2521045A4/en not_active Withdrawn
- 2010-12-28 WO PCT/JP2010/007597 patent/WO2011080926A1/ja active Application Filing
Also Published As
Publication number | Publication date |
---|---|
JP2011138441A (ja) | 2011-07-14 |
WO2011080926A1 (ja) | 2011-07-07 |
EP2521045A1 (en) | 2012-11-07 |
EP2521045A4 (en) | 2015-06-03 |
US20120260161A1 (en) | 2012-10-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2427912C2 (ru) | Система для визуального отображения и управления информацией на web-странице с использованием индикатора | |
JP4150415B2 (ja) | ドキュメントデータ表示処理方法、ドキュメントデータ表示処理システム及びドキュメントデータ表示処理用のソフトウェアプログラム | |
US7395498B2 (en) | Apparatus and method for evaluating web pages | |
US20080046254A1 (en) | Electronic Service Manual Generation Method, Additional Data Generation Method, Electronic Service Manual Generation Appartus, Additional Data Generation Apparatus, Electronic ServIce Manual Generation Program, Additional Data Generation Program, And Recording Media On Which These Programs Are Recorded | |
US11170063B2 (en) | User interface element for surfacing related results | |
JP5827208B2 (ja) | 文書管理システムおよび文書管理方法並びに文書管理プログラム | |
JP5150799B1 (ja) | 情報処理装置、情報処理方法、情報処理装置用プログラム、および、記録媒体 | |
WO1999013417A1 (en) | A system, method, and medium for retrieving, organising, and utilizing networked data | |
WO2013036688A2 (en) | Identifying product variants | |
US9390446B2 (en) | Consumer centric online product research | |
CN105005562A (zh) | 检索结果的显示处理方法及装置 | |
KR20140050217A (ko) | 키워드 연관 관계 시각화 제공 시스템 및 방법과, 이를 지원하는 장치 | |
JP4870809B2 (ja) | 関連するウェブページ内コンテンツを分類・整理し自由自在に再構成して表示する方法 | |
KR20160091756A (ko) | 키워드 검색을 통한 웹 페이지의 상대적 품질 지수 평가 장치 | |
JP2006215659A (ja) | カタログ管理装置およびカタログ作成方法およびカタログ検索方法 | |
CN110969501B (zh) | 网络购物车页面的显示方法、系统、设备和存储介质 | |
JP2008009582A (ja) | 広告配信サーバ、広告配信プログラム、広告配信方法、及び広告配信システム | |
US20100191616A1 (en) | Software method and system to enable automatic, real-time extraction of item price and availability from a supplier catalog during a buyer's electronic procurement shopping process | |
US7251622B2 (en) | System and method for searching for information on inventory with virtual warehouses | |
JP4901985B2 (ja) | 関連するウェブページ内コンテンツを分類・整理し自由自在に再構成して表示する方法 | |
WO2016011452A1 (en) | System for aggregating, comparing and acquiring collectibles, methods and uses thereof | |
EP1331580A1 (en) | Facility plan support method, server computer of facility plan support system, and client computer of facility plan support system | |
JP2010039591A (ja) | 商品紹介支援システム | |
JP2009251960A (ja) | 商品情報提供サーバ、及び商品情報提供システム | |
JP5596273B2 (ja) | 商品情報提供サーバ、及び商品情報提供システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111017 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20111117 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4870809 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20171125 Year of fee payment: 6 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |