JP4919870B2 - コンテンツ変換システムおよびコンピュータプログラム - Google Patents
コンテンツ変換システムおよびコンピュータプログラム Download PDFInfo
- Publication number
- JP4919870B2 JP4919870B2 JP2007122527A JP2007122527A JP4919870B2 JP 4919870 B2 JP4919870 B2 JP 4919870B2 JP 2007122527 A JP2007122527 A JP 2007122527A JP 2007122527 A JP2007122527 A JP 2007122527A JP 4919870 B2 JP4919870 B2 JP 4919870B2
- Authority
- JP
- Japan
- Prior art keywords
- content
- division
- primary
- layout
- tag
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0481—Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/103—Formatting, i.e. changing of presentation of documents
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/957—Browsing optimisation, e.g. caching or content distillation
- G06F16/9577—Optimising the visualization of content, e.g. distillation of HTML documents
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Document Processing Apparatus (AREA)
- User Interface Of Digital Computer (AREA)
- Information Transfer Between Computers (AREA)
- Digital Computer Display Output (AREA)
Description
これにより、前述のコンテンツ変換システムがコンピュータを利用して実現できるようになる。
本発明に係るコンテンツは、画像、テキスト、ハイパーリンク等のコンテンツ部品から構成されており、且つ、HTML等のタグ記述を用いて該コンテンツ部品の表示レイアウトが指定されている。本実施形態では、本発明に係るコンテンツの一例としてWebページを挙げて説明する。また、Webページ上に表示されるコンテンツ部品の表示レイアウトを指定するデータの一例として、HTML文書を挙げて説明する。
図2は、図1のコンテンツ変換サーバ1における処理の流れを示すフローチャートである。図2において、ステップS1では、コンテンツデータ取得部11がWebサーバ2からコンテンツデータを取得し、レイアウト関連タグ判定部12が該コンテンツデータ中のHTML文書に記述されているタグの構造を解析する。このとき、レイアウト関連タグ判定部12は、HTML文書中のレイアウト関連タグを浅い階層から深い階層へと順番に検出し、レイアウト関連タグの階層構造を示すツリーを作成する。このツリーは、第1次分割部13で使用される。
図3は、図1のレイアウト関連タグ判定部12における処理の流れを示すフローチャートである。図3において、ステップS11では、コンテンツデータ取得部11によってWebサーバ2から取得されたコンテンツデータ中のHTML文書(HTMLファイル)を取得する。次いで、ステップS12では、HTML文書中のレイアウト関連タグを浅い階層から深い階層へと順番に検索する。
(規則1)あるレイアウト関連タグに着目したときに、同一階層に開始タグと終了タグがペアで存在すること。例えば、tableタグの開始タグ「<table>」と終了タグ「</table>」はペアで存在していることが必須である。但し、終了タグが省略可能なもの(例えば<td>など)は本規則1の適用外とする。
(規則2)タグ名が定義された通りであること。従ってタグ名のスペルミスはエラーとする。但し、アルファベットの大文字と小文字は区別しない。
(規則3)タグが入れ子構造になっていること。従ってタグが交差している場合はエラーとする。
図4、図5は、図1の第1次分割部13における1次分割処理の流れを示すフローチャートである。図4において、ステップS21では、変数iを1に初期化する。変数iは、分割対象のHTML文書に係るレイアウト関連タグの階層構造を示すツリー上の階層の深さを表す。変数iの初期値「1」は、最も浅い第1階層を表す。変数iが「2」である場合は、2番目に浅い第2階層を表す。つまり、変数iはi番目に浅い第i階層を表す。
Dj=Sj÷Nk
図6は、本実施形態に係る表示面積Sjの算出方法の手順を示すフローチャートである。図6において、ステップS41では、ポインタiを1に初期化する。ポインタiは、表示面積Sjの算出対象の1次分割HTML文書中のレイアウト関連タグの番号を表す。ポインタiの初期値「1」は、1次分割HTML文書中の1番目のレイアウト関連タグを表す。ポインタiが「2」である場合は、1次分割HTML文書中の2番目のレイアウト関連タグを表す。つまり、ポインタiは1次分割HTML文書中のi番目のレイアウト関連タグを表す。なお、図6に係るポインタiは、図4および図5に係る変数iとは別個のものである。
テーブルに係る部分表示面積Si=「height属性の画素数(pixel)」×「width属性の画素数(pixel)」
テキストに係る部分表示面積Si=「size属性の画素数(pixel)」×テキスト文字数
なお、「class属性」がある場合はスタイルシートからフォントサイズを取得する。
画像に係る部分表示面積Si=「height属性の画素数(pixel)」×「width属性の画素数(pixel)」
第2次分割部14としては、特許文献2又は非特許文献1に記載の技術を利用することができる。
ステップS112;コンテンツオブジェクト内のコンテンツ部品間距離の最大値(Smax)が、コンテンツオブジェクト内のコンテンツ部品間距離の平均値(Saverage)のN1倍以上であれば、その最大値(Smax)に対応するコンテンツ部品の間の位置を分割点に決定する。
ステップS113;ステップS112の閾値N1による判定が真でない場合において、上記最大値(Smax)が上記平均値(Saverage)のN2倍以上であり、且つ、その最大値(Smax)に対応するコンテンツ部品の位置で分割したときの分割後の一コンテンツオブジェクト内のコンテンツ部品数が閾値M個以上であれば、その最大値(Smax)に対応するコンテンツ部品の間の位置を分割点に決定する。
ステップS115;ステップS112又はステップS113でコンテンツオブジェクトの分割点が新たに発見されない場合には、終了する。
また、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。
また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、フラッシュメモリ等の書き込み可能な不揮発性メモリ、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。
また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。
また、上記プログラムは、前述した機能の一部を実現するためのものであっても良い。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であっても良い。
Claims (6)
- 画面表示されるコンテンツ部品から構成されるコンテンツを端末に表示するためのコンテンツデータであって、前記コンテンツ部品の表示レイアウトがタグを用いて記述されているコンテンツデータを分割するコンテンツ変換システムにおいて、
コンテンツ部品の表示レイアウトに基づいてコンテンツデータを分割する1次分割手段と、
データ記述上のコンテンツ部品間の距離に基づいてコンテンツデータを分割する2次分割手段と、を備え、
前記2次分割手段は、前記1次分割手段による分割後の1次分割コンテンツデータを分割し、
前記1次分割手段は、前記1次分割コンテンツデータに係る表示面積を前記2次分割手段による分割数で除した値を計算し、該値が所定条件を満足するまで再分割を繰り返す
ことを特徴とするコンテンツ変換システム。 - 前記1次分割手段は、コンテンツ部品の大きさを表すタグ属性値を用いて、前記1次分割コンテンツデータに係る表示面積を計算することを特徴とする請求項1又は請求項2に記載のコンテンツ変換システム。
- コンテンツデータ中のレイアウト関連タグの有無を判定するレイアウト関連タグ判定手段を備え、
コンテンツデータ中にレイアウト関連タグがない場合には、前記2次分割手段による分割のみを行うことを特徴とする請求項1又は請求項2に記載のコンテンツ変換システム。 - 前記レイアウト関連タグ判定手段は、コンテンツデータ中のレイアウト関連タグの記述が文法上、正しいか否かを判定し、
レイアウト関連タグの記述が文法上、正しくない場合には、前記2次分割手段による分割のみを行うことを特徴とする請求項4に記載のコンテンツ変換システム。 - 画面表示されるコンテンツ部品から構成されるコンテンツを端末に表示するためのコンテンツデータであって、前記コンテンツ部品の表示レイアウトがタグを用いて記述されているコンテンツデータを分割するコンテンツ変換を行うためのコンピュータプログラムであって、
コンテンツ部品の表示レイアウトに基づいてコンテンツデータを分割する1次分割機能と、
データ記述上のコンテンツ部品間の距離に基づいてコンテンツデータを分割する2次分割機能と、をコンピュータに実現させるコンピュータプログラムであり、
前記2次分割機能は、前記1次分割機能による分割後の1次分割コンテンツデータを分割し、
前記1次分割機能は、前記1次分割コンテンツデータに係る表示面積を前記2次分割手段による分割数で除した値を計算し、該値が所定条件を満足するまで再分割を繰り返す
ことを特徴とするコンピュータプログラム。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007122527A JP4919870B2 (ja) | 2007-05-07 | 2007-05-07 | コンテンツ変換システムおよびコンピュータプログラム |
KR1020097024688A KR20090130418A (ko) | 2007-05-07 | 2008-05-02 | 콘텐츠 변환 시스템 및 컴퓨터 프로그램을 기록한 기록 매체 |
US12/598,503 US8700995B2 (en) | 2007-05-07 | 2008-05-02 | Content conversion system and recording medium storing computer program |
PCT/JP2008/058435 WO2008136514A1 (ja) | 2007-05-07 | 2008-05-02 | コンテンツ変換システムおよびコンピュータプログラムを記録した記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007122527A JP4919870B2 (ja) | 2007-05-07 | 2007-05-07 | コンテンツ変換システムおよびコンピュータプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008276694A JP2008276694A (ja) | 2008-11-13 |
JP4919870B2 true JP4919870B2 (ja) | 2012-04-18 |
Family
ID=39943617
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007122527A Expired - Fee Related JP4919870B2 (ja) | 2007-05-07 | 2007-05-07 | コンテンツ変換システムおよびコンピュータプログラム |
Country Status (4)
Country | Link |
---|---|
US (1) | US8700995B2 (ja) |
JP (1) | JP4919870B2 (ja) |
KR (1) | KR20090130418A (ja) |
WO (1) | WO2008136514A1 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101340885B1 (ko) * | 2011-02-25 | 2013-12-13 | 숭실대학교산학협력단 | 정보 컨텐츠 관리 서버, 정보 컨텐츠 제공 장치 및 방법 |
KR101873917B1 (ko) * | 2011-11-17 | 2018-07-04 | 삼성전자 주식회사 | 디스플레이장치 및 그 제어방법 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001229106A (ja) | 2000-02-18 | 2001-08-24 | Hitachi Ltd | コンテンツ変換システム |
US20040049737A1 (en) * | 2000-04-26 | 2004-03-11 | Novarra, Inc. | System and method for displaying information content with selective horizontal scrolling |
JP3664475B2 (ja) * | 2001-02-09 | 2005-06-29 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 情報処理方法、情報処理システム、プログラムおよび記録媒体 |
US7246306B2 (en) * | 2002-06-21 | 2007-07-17 | Microsoft Corporation | Web information presentation structure for web page authoring |
KR100577084B1 (ko) | 2003-10-27 | 2006-05-10 | 한국전자통신연구원 | 단말기의 웹 페이지 표시 방법 및 장치 |
JP4624086B2 (ja) | 2004-11-29 | 2011-02-02 | Kddi株式会社 | コンテンツ変換システムおよびコンピュータプログラム |
US7421651B2 (en) * | 2004-12-30 | 2008-09-02 | Google Inc. | Document segmentation based on visual gaps |
-
2007
- 2007-05-07 JP JP2007122527A patent/JP4919870B2/ja not_active Expired - Fee Related
-
2008
- 2008-05-02 WO PCT/JP2008/058435 patent/WO2008136514A1/ja active Application Filing
- 2008-05-02 KR KR1020097024688A patent/KR20090130418A/ko not_active Application Discontinuation
- 2008-05-02 US US12/598,503 patent/US8700995B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
WO2008136514A1 (ja) | 2008-11-13 |
KR20090130418A (ko) | 2009-12-23 |
US8700995B2 (en) | 2014-04-15 |
US20100138738A1 (en) | 2010-06-03 |
JP2008276694A (ja) | 2008-11-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8898296B2 (en) | Detection of boilerplate content | |
US9483577B2 (en) | Small form factor web browsing | |
US9026526B1 (en) | Providing images of named resources in response to a search query | |
US8176033B2 (en) | Document processing device and document processing method | |
US10592737B2 (en) | Mathematical formula learner support system | |
JP5232449B2 (ja) | 情報検索装置およびコンピュータプログラム | |
CN102770859A (zh) | 跨语言搜索选项 | |
US20060031760A1 (en) | Adaptive document layout server/client system and process | |
EP3624403A1 (en) | File sending in instant messaging application | |
EP2599008A1 (en) | Method for selecting user desirable content from web pages | |
KR100917458B1 (ko) | 추천검색어 제공 방법 및 시스템 | |
JP4919870B2 (ja) | コンテンツ変換システムおよびコンピュータプログラム | |
US20090313558A1 (en) | Semantic Image Collection Visualization | |
JP2011028509A (ja) | 関連性判定装置、関連性判定方法およびプログラム | |
US20160004697A1 (en) | Bilingual Search Engine for Mobile Devices | |
JP4801555B2 (ja) | 文書処理装置、文書処理方法および文書処理プログラム | |
JPH10134087A (ja) | 文書要求装置および関連文書の先取り方法 | |
JP4624086B2 (ja) | コンテンツ変換システムおよびコンピュータプログラム | |
JP2009140173A (ja) | Webサイトを推奨するサーバ装置、Webサイトの推奨方法、及びWebサイト推奨プログラム | |
JP6578679B2 (ja) | 画像処理装置及びプログラム | |
KR101433830B1 (ko) | Url 기반 이미지 처리 시스템 및 방법 | |
KR100912173B1 (ko) | 검색 결과 제공방법 및 시스템 | |
Sonnenberg | Maintaining Thematic Consistency within Mobile Content Adaptation | |
JP5514002B2 (ja) | 検索装置及び方法及びプログラム | |
KR101448174B1 (ko) | 이미지 검색 방법 및 서버 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100201 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20100202 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110705 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110826 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20110831 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120104 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120131 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150210 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |