JP5263851B1 - 文書変換方法および文書変換プログラム - Google Patents

文書変換方法および文書変換プログラム Download PDF

Info

Publication number
JP5263851B1
JP5263851B1 JP2012224138A JP2012224138A JP5263851B1 JP 5263851 B1 JP5263851 B1 JP 5263851B1 JP 2012224138 A JP2012224138 A JP 2012224138A JP 2012224138 A JP2012224138 A JP 2012224138A JP 5263851 B1 JP5263851 B1 JP 5263851B1
Authority
JP
Japan
Prior art keywords
style
document
file
assigned
conversion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012224138A
Other languages
English (en)
Other versions
JP2014078066A (ja
Inventor
謙二 細田
Original Assignee
株式会社エスキュービズム
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社エスキュービズム filed Critical 株式会社エスキュービズム
Priority to JP2012224138A priority Critical patent/JP5263851B1/ja
Application granted granted Critical
Publication of JP5263851B1 publication Critical patent/JP5263851B1/ja
Publication of JP2014078066A publication Critical patent/JP2014078066A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】マークアップ言語で記述された文書に対して、対象の装置に適したスタイルを割り当てることができる文書変換方法を提供する。
【解決手段】マークアップ言語で記述された、第一の装置で表示するための第一の文書ファイルに対して、前記第一の装置よりも低い表示解像度を持つ第二の装置に適合するスタイルを割り当てるページ変更ステップと、スタイルを割り当てた前記第一の文書ファイルを出力するステップと、を含む文書変換方法において、前記ページ変更ステップは、前記第一の文書ファイルに含まれる複数の要素を解析し、前記複数の要素の中から、所定の用途で利用されていると推定される特定要素を抽出し、抽出された特定要素に対して、前記特定要素と同じ種類の要素であるが前記所定の用途で利用されていない通常の要素に対して割り当てるスタイルとは異なる、前記所定の用途に適合するスタイルを割り当てる。
【選択図】図1

Description

本発明は、マークアップ言語で記述された文書の表示形式を変換する技術に関する。
近年、スマートフォンを中心とする携帯情報端末が普及している。スマートフォンは、電話機能を有する小型のコンピュータであり、パーソナルコンピュータと同様に、ネットワークに接続する機能や、ウェブサイトを閲覧する機能を有している。
従来、携帯電話を用いてウェブサイトを閲覧することは可能であったが、携帯電話向けのウェブサイトには、対象の端末やキャリアに特化したマークアップ言語を用いる必要があり、サービス提供者は、携帯電話専用のコンテンツを製作しなければならなかった。これに対して、スマートフォンは、パーソナルコンピュータと同等のウェブブラウザを搭載しているため、PC向けに作成されたウェブサイトをそのまま閲覧することができる。
しかし、PCとスマートフォンとでは、画面のサイズが大きく異なるため、PC向けに作成されたウェブサイトをそのままスマートフォンで表示すると、画面が縮小表示され、操作性が損なわれるという欠点があった。
一方で、スマートフォンの画面サイズに合ったデザインでウェブサイトを構築し、PC向けのウェブサイトとは別に運営するという方法もある。しかし、このような方法をとった場合、ウェブサイトを構築するためのコストや運営コストが増加してしまう。
この問題を解決するため、PC向けに作成されたウェブページを、スマートフォン向けに変換する技術が考案されている。例えば、特許文献1には、PC向けのウェブページから、スマートフォン向けのウェブページを生成するシステムが記載されている。当該システムでは、既存のウェブページに対して変換ルールをあらかじめ設定する。そして、スマートフォンからアクセスがあった場合に、変換ルールおよび変換プログラムを当該スマートフォンに送信し、スマートフォンが、変換プログラムによってウェブページを変換する。これにより利用者は、スマートフォンに適したレイアウトでウェブページを閲覧することができる。
特許第4936413号公報
特許文献1に記載のシステムを用いると、PC向けのウェブページを、スマートフォンの画面解像度に適したレイアウトに変換することができる。しかし、当該システムは、ページごとにサービス提供者が変換ルールを指定しなければならないため、対象のページが多くなるとコストが増大するという問題がある。この問題を解決するため、PC向けに作成されたウェブページを、自動でスマートフォンの解像度に合わせたレイアウトに変換する技術が求められていた。
PC向けに作成されたウェブページを、スマートフォンに適したレイアウトに変換するためには、HTMLで定義されたページ内の要素に適切なスタイルシートを付与する必要がある。例えば、図9(a)に示したウェブページをスマートフォンで表示したい場合、
単純に画面幅のみを縮小すると、図9(b)のような表示となり、視認性および操作性がともに劣化してしまう。
これを解決するためには、例えば「ロゴ画像については中央上部に配置する」、「左ペインに表示されたメニューに対しては、引き伸ばして画面中央に配置する」など、画面を構成する要素ごとに、スマートフォン向けに設計されたスタイルを適切に割り当てなければならない。しかし、適切なスタイルが何であるかを判別することは、従来の技術では困難であった。
本発明は上記の問題点を考慮してなされたものであり、マークアップ言語で記述された文書に対して、対象の装置に適したスタイルを割り当てることができる文書変換方法を提供することを目的とする。
本発明に係る文書変換方法は、マークアップ言語で記述された、第一の装置で表示するための第一の文書ファイルを取得するページ入力ステップと、取得した前記第一の文書ファイルに対して、前記第一の装置よりも低い表示解像度を持つ第二の装置に適合するスタイルを割り当てるページ変更ステップと、前記スタイルを割り当てた前記第一の文書ファイルを、前記第二の装置で表示するための第二の文書ファイルとして出力するページ出力ステップと、を含む文書変換方法である。
マークアップ言語とは、典型的にはHTML言語である。また、第一の装置とは、典型的にはパーソナルコンピュータである。また、第二の装置とは、第一の装置よりも画面の表示解像度が低いデバイスであり、典型的にはスマートフォンなどの携帯情報端末である(以下、携帯端末と称する)。
本発明に係る文書変換方法が含むページ変更ステップは、前記第一の文書ファイルに含まれる複数の要素をそれぞれ解析し、前記複数の要素の中から、所定の用途で利用されていると推定される特定要素を抽出する特定要素抽出ステップと、
前記特定要素抽出ステップで抽出された特定要素に対して、前記特定要素と同じ種類の要素であるが前記所定の用途で利用されていない通常の要素に対して割り当てるスタイルとは異なる、前記所定の用途に適合するスタイルを割り当てるスタイル変更ステップと、
を含むことを特徴とする。
本発明に係る文書変換方法は、マークアップ言語で記述された文書ファイルを解析し、文書中に定義された特定要素を抽出して、要素単位でスタイルの割り当てを変更する。スタイルとは、文書中の任意のブロックに対して付与された、文書を表示する際の見た目に関する定義であり、CSS(Cascading Style Sheets)といったスタイルシート言語によって記述されたものである。
また、特定要素とは、文書中に定義された要素(エレメント)の構造や、当該要素に割り当てられたスタイルを参照することで、その用途が推定できる要素である。例えば、ある要素内において、リストが定義されており、各リストアイテムに子要素が一つずつ入っていた場合、当該要素はメニューとして利用されていると推定できる。対象の要素は、開始宣言と終了宣言で囲まれたブロックであってもよいし、単独で定義されたものであってもよい。
抽出された特定要素には、推定された用途に適合したスタイルが割り当てられる。例えば、メニューであると推定された要素には、携帯端末に適合したメニュー用のスタイルが割り当てられる。また、用途が推定できない要素には、携帯端末に適合した通常のスタイルが割り当てられる。
従来の文書変換技術が、要素の用途を考慮せず、定義されたスタイルを単純に置き換えるものであるのに対し、本発明に係る文書変換方法では、文書に定義された要素の用途が何であるかを推定し、用途ごとに適したスタイルを適用する。これにより、変換後の画面
が、サービス提供者の意図しないレイアウトになってしまうことを防ぐことができる。
また、前記所定の用途はメニューであり、前記特定要素抽出ステップは、前記第一の文書ファイルに、順序なしリストを表す第一の要素が定義されており、前記第一の要素が、リストアイテムを表す第二の要素を複数包含しており、前記第二の要素の全てが、前記第二の要素を親要素とする子要素を一つずつ含む場合に、前記第一の要素を、メニューの用途で利用されている特定要素として抽出し、前記スタイル変更ステップは、前記抽出した特定要素に対して、前記第二の装置に適合するメニュー用スタイルを割り当てることを特徴としてもよい。
PC向けのスタイルが定義された文書を、携帯端末向けに変換する際、特に扱いに留意する必要があるのがメニューである。メニューのレイアウトが正しく変換されないと、見栄えが悪くなるだけでなく、最悪の場合は画面遷移をすること自体ができなくなる。これを防止するためには、文書内でメニューという役割を持っているブロックには、メニュー専用のスタイルを割り当てることが望ましい。
本発明に係る文書変換方法では、まず、入力された文書から、順序なしリストを表す要素を検出する。そして、当該要素が、複数のリストアイテムを含んでおり、かつ、各リストアイテムに含まれる子要素が全て一つであった場合に、リスト全体をメニューであると判別し、携帯端末に適合するメニュー用のスタイルを割り当てる。子要素が一つであるとは、リストアイテムを親要素とする要素が一つであることを意味し、孫要素は含まれない。このようにすることで、メニューであるブロックを適切に検出し、携帯端末向けのメニュー表示に変換することができる。
また、前記第二の要素を親要素とする子要素が、画像を表示する要素である場合に、前記スタイル変更ステップは、当該画像を表示する要素を削除し、代替となるテキストを挿入することを特徴としてもよい。
メニューを構成するアイテムが画像であった場合、当該画像を適切に変換しないと、レイアウトが意図しないものとなってしまうおそれがある。そこで、メニューアイテムが画像であった場合は、画像の定義を削除し、代替となるテキストに置き換えるようにしてもよい。文書がHTMLで記述されている場合、例えば代替テキストは、画像タグに定義されたAlt属性や、Title属性から取得することができる。このようにすることで、メニューであるブロックを確実に携帯端末上で表示することができるようになる。
また、前記所定の用途は見出しつきアイテムであり、前記特定要素抽出ステップは、前記第一の文書ファイルから、割り当てられたスタイルが、
(1)余白量の指定が自動ではない
(2)背景画像を定義する属性が指定されている
の、双方に該当し、かつ、コンテナではない要素を、見出しつきアイテムの用途で利用されている特定要素として抽出し、前記スタイル変更ステップは、前記抽出した特定要素に対して、余白量が指定されたスタイルを割り当て、前記特定要素以外の通常の要素に対しては、余白量の指定が削除されたスタイルを割り当てることを特徴としてもよい。
本発明における見出しつきアイテムとは、文字列や画像といった要素のうち、当該要素の内容を視覚的にわかりやすくするための画像(アイコン)が近傍に配置されたものを指す。すなわち、見出しタグ等による文字列のマークアップではなく、アイコン画像を配置することによって見出しを表現したものである。
PC向けのスタイルが定義された文書を、携帯端末向けに変換する際には、要素に割り当てられたスタイルから、余白量(パディング)の指定を削除することが好ましい。しかし、見出しつきアイテムに対してこれを実行すると、ページのレイアウトが意図しないも
のとなってしまう可能性がある。すなわち、見出しつきアイテムに限っては、スタイルの余白量指定を削除する操作は、逆に携帯端末に適合しないスタイルを与えてしまうことになる。そこで本発明では、見出しつきアイテムを判別し、該当しない要素に対してのみ、割り当てられたスタイルから余白量の削除を行う。
具体的には、要素に割り当てられているスタイルに、自動パディングが指定されておらず、かつ、背景画像を定義する属性が指定されている要素であって、コンテナではない要素を抽出する。コンテナとは、単一または複数の他の要素を包含する要素であり、典型的にはHTMLタグにおける<DIV>〜</DIV>、<BODY>〜</BODY>等である。抽出した要素は、見出しつきアイテムであると推定できるため、余白量指定の削除を、抽出した要素以外の要素に対してのみ行う。見出しつきアイテムである要素とそうでない要素を上記の基準によって判別することで、意図しない形のスタイル変換を防ぐことができる。
なお、本発明は、上記手段の少なくとも一部を含む文書変換方法として特定することができる。また、文書変換方法を実行させるためのプログラムとして特定することもできる。また、文書変換方法を実行する文書変換装置として特定することもできる。上記処理や手段は、技術的な矛盾が生じない限りにおいて、自由に組み合わせて実施することができる。
本発明によれば、マークアップ言語で記述された文書に対して、対象の装置に適したスタイルを割り当てることができる文書変換方法を提供することができる。
第一の実施形態に係る文書変換システムのシステム構成図である。 第一の実施形態に係る文書変換装置の処理フローチャートである。 メニューを表すブロックを説明する図である。 メニューを表すブロックを説明する第二の図である。 アイコンの判定有無による差異を説明する図である。 アイコンの判別を説明する図である。 第二の実施形態における、メニューのスタイル変換を説明する図である。 第二の実施形態における、メニューの変換結果を説明する図である。 ウェブコンテンツ変換の従来の例を説明する図である。
(第一の実施形態)
以下、本発明の好ましい実施形態について図面を参照しながら説明する。第一の実施形態に係る文書変換システムは、パーソナルコンピュータ(以下、PC)によって表示されることを想定したHTMLファイルおよびスタイルシート(以下、CSS)ファイルを取得し、当該HTMLファイルおよびCSSファイルを、PCよりも解像度が低いスマートフォンによって表示するために変換し、出力するシステムである。例えば、横幅1024ピクセルの画面を想定して作られたHTMLファイルを、横幅640ピクセルの画面で表示するための変換を行う。
<システム構成>
図1は、第一の実施形態に係る文書変換システムのシステム構成図である。
第一の実施形態に係る文書変換システムは、Webサーバ10、および文書変換装置20から構成される。
Webサーバ10は、PC向けに設計されたウェブページを記憶し、HTTPサーバを実行することによって利用者にウェブサービスを提供するコンピュータである。
文書変換装置20は、Webサーバ10から変換対象のファイルを取得し、変換を実行したのちにWebサーバ10に書き戻す機能を持つコンピュータである。文書変換装置20は、通信部21、ページ入出力部22、制御部23、スタイル記憶部24から構成される。文書変換装置20は、補助記憶装置に記憶されたプログラムが主記憶装置にロードされ、CPUによって実行されることによって図1に図示した各手段が機能する。(CPU、補助記憶装置、主記憶装置はいずれも不図示)
また、コンピュータ30およびスマートフォン40は、Webサーバ10にアクセスし、ウェブページを取得して表示する端末である。コンピュータ30およびスマートフォン40は、第一の実施形態に係る文書変換システムの必須構成要件ではないが、補助的に図1に図示している。
文書変換装置20の構成について説明する。
通信部21は、ネットワーク経由で他のコンピュータと通信を行う手段である。本実施形態では、インターネットを通してWebサーバ10と通信を行うことができる。
ページ入出力部22は、変換対象となるHTMLファイルと、当該HTMLファイルが参照しているCSSファイルを取得する手段である。また、変換結果を、HTMLファイルおよびCSSファイルとして出力する手段である。ページ入出力部21は、通信部21を経由して、変換対象のファイルをネットワークから取得、および変換結果のファイルをネットワークへ送信することができる。例えば、利用者からURLの入力を受け取り、当該URLにアクセスすることで対象のファイルを取得することができる。なお、取得するHTMLファイルは単一のものでなくてもよい。例えば、指定されたHTMLファイルからリンクされているHTMLファイルを全て取得するようにしてもよい。また、HTMLファイルからリンクされている画像ファイルを同時に取得するようにしてもよい。
制御部23は、取得したファイルの変換動作を制御する手段である。具体的には、取得したHTMLファイルおよびCSSファイルを解析し、定義されているスタイルについて、スマートフォンに適合したスタイルに変更する処理を行う。スタイルを変更する処理は、二通りの方法がある。一つが、HTMLファイルに定義されているスタイルの名称を、あらかじめ定義されているスマートフォン用の別のスタイルの名称に変更し、スタイルの参照先を切り替える方法である。もう一つは、スタイルの名称はそのままで、参照しているスタイルの定義を直接書き換える方法である。それぞれの具体的な処理方法については後述する。
スタイル記憶部24は、スマートフォン向けのスタイル定義を記憶する手段である。例えば、デザインフレームワークであるTwitter Bootstrapから、スマートフォン向けのス
タイルライブラリを抽出し、CSSファイルを記憶させる。制御部23がスタイルの参照先を切り替える際は、スタイル記憶部24に記憶されているスタイルが指定される。
<文書変換処理>
次に、文書変換装置20が行う文書変換処理の詳細について説明する。図2は、文書変換装置20が行う変換処理のフローチャートである。図2に示した処理は、利用者の指示によって開始される。
ステップS11では、ページ入出力部22が、変換対象のHTMLファイル、および当該HTMLファイルが参照しているCSSファイルを取得する。対象のファイルは、利用者の指示によってネットワーク経由でWebサーバ20から取得される。
ファイルの取得が完了すると、制御部23が、取得したファイルに対して前処理を行う。具体的には、HTMLファイルの文字コードを統一し(例えばUTF−8に変換)、HTMLおよびHTMLから参照されているスタイルの構文解析を実施する。
構文解析は、テキストファイルを構造化したデータに変換する処理である。HTMLの構文解析には、例えばPython用のHTMLパーサであるBeautiful Soup等を利用することができる。これにより、入力されたHTMLファイルを、構造化したデータ(以下、構造化HTMLと称する)に変換することができる。構造化HTMLは、制御部23によって一時的に記憶される。以降のステップにおいて、ファイルの変換は、制御部23によって記憶された構造化HTMLに対して行われる。
また、スタイルの構文解析は、例えばPython用のスタイルライブラリであるcssutils等を利用することができる。構文解析の対象は、インラインで定義されたスタイル、および外部ファイルで定義されたスタイルの双方である。構造化されたスタイル(以下、構造化スタイルと称する)は、制御部23によって一時的に記憶される。以降のステップにおいて、スタイルの変換は、制御部23によって記憶された構造化スタイルに対して行われる。
ステップS12は、制御部23が、定義されたスタイルを対象の機器向けに変更する処理である。スタイルの変更処理は、具体的には、構造化HTMLからメニューとして用いられている要素(ブロック)を検出し、当該ブロックに対してスマートフォン向けのスタイルを割り当てる処理(ステップS121)と、それ以外の要素に割り当てられたスタイルから、PC向けのスタイルを削除する処理(ステップS122)、および、幅の調整が必要な要素に対して幅を定義するスタイルを追加する処理(ステップS123)から構成される。以下、それぞれの処理について詳細に説明する。
ステップS121ではまず、構造化HTMLの中に、以下の条件を満たすブロックが存在するかを確認する。
(1)順序なしリスト(UL)の子要素に、複数のリストアイテム(LI)がある
(2)複数のLIタグについて、当該LIタグを親要素とする子要素が一つずつある
メニューは、選択肢を一つずつ画面に列挙するという性質上、順序なしリストが多く用いられ、また、順序なしリストに複数の要素を入れることが無いため、上記(1)および(2)を満たすブロックを検出することで、メニューであるブロックを推定することができる。条件を満たすブロック(<UL>〜</UL>)が存在する場合、当該ブロックに対して、
スマートフォンに適合するメニュー用のスタイルを割り当てる。
具体的な例を図3に示す。図3(a)は、変換前のHTML文書のタグ構造を簡略化して示したものである。図3(a)は、上記(1)および(2)の条件に合致するため、ULタグで囲まれたブロック全体がメニューと判定される。そして、付与された “pc_style”という名称のスタイルが、スマートフォンのメニュー用に用意された “phone_style
”という名称のスタイルに変更される。切り替え先となるスマートフォン用のスタイルは、スタイル記憶部24に記憶されているスタイルの中から選択される。
なお、図3(c)の例では、LIタグの中に要素が二つ(<a>および<img>)あるが、LIタグを親要素とする子要素は一つのみ(<a>)であり、画像タグ(<img>)は孫要素であるため、メニューであると判定され、スタイル変更の対象となる。
一方、図4は、上記(1)および(2)の条件に合致しない場合の例である。図4の場合、LIタグを親要素とする子要素が二つあるため、メニューではないと判断され、スタイルの変換対象とはならない。
次に、ステップS122の処理について説明する。ステップS122は、構造化HTMLに定義された要素に適用されたスタイルを検出し、当該スタイルから、スマートフォンにとって不必要な属性を除去する処理である。下記の処理で除去する属性は、PCの表示解像度を前提として表示位置やサイズ、背景画像を指定する属性であるため、この処理を行わない場合、スマートフォンの解像度で正しく内容を表示することができなくなるため
である。
ステップS122では、スタイルが割り当てられている要素を抽出し、以下のルールに従って、記憶された構造化スタイルを変換する。
(1)マージン属性を除去する
マージン属性(margin,margin-left,margin-top,margin-right,margin-bottom)が定義されているスタイルがあった場合、当該属性を除去する。
(2)パディング属性を除去する
パディング属性(padding,padding-left,padding-top,padding-right,padding-bottom)が定義されたスタイルがあった場合、当該属性を除去する。
ただし、パディング属性の除去は、対象のスタイルが、以下のいずれかを満たす場合にのみ行われる。以下の全てに該当しない場合、当該スタイルは、アイコンを表示するために設定されたスタイルであることが推定されるため、パディング属性を除去すると正しくアイコン表示が行われなくなる可能性があるためである。
(A)余白量の指定を行う属性(padding)に、値の自動指定(auto)が含まれている
(B)背景画像を定義する属性(background,background-image,list-style-image)が指定されていない
(C)コンテナタグ(<BODY>,<DIV>,<DL>,<UL>等、一つ以上の他の要素を包含する
タグ)自体に適用されているスタイルである
ここで、アイコンを表示するためのスタイルからパディング属性の除去を行ってはいけない理由を説明する。アイコンとは、リンクやラベル等の要素に対して、それが何であるかを視覚的に分かりやすく表現するための小型の画像である。以下、アイコンによる修飾対象の要素をアイテム要素と称する。
アイコンを表示するためによく使われる手法に、背景画像とパディング属性を用いたものがある。具体的には、アイテム要素に付与したスタイルに、背景画像をセットし、パディング属性でアイテム要素の位置をずらす。このようにすることで、背景画像が見えるようになり、アイテム要素の先頭または末尾に画像を表示することができる。
この手法を用いてアイコンを表示している場合、パディング属性を除去してしまうと、アイテム要素の位置が固定され、アイコンが表示されなくなる、もしくはアイテム要素と重なって表示されてしまう。そこで、パディング属性および背景画像属性を参照することで、対象の画像がアイコンであるか否かを判定することができる(上記(A)および(B))。
なお、コンテナタグに含まれるアイテム要素ではなく、コンテナタグ自体にスタイルが付与されている場合があるが、このような場合は、当該スタイルはアイテム要素を修飾するためのものではないと推定できるため、アイコンの判定から除外する(上記(C))。
具体的な例を挙げて説明する。例えば、図5(a)に示したページがあった場合、アイコンの判定を行わずにパディング属性を除去すると、図5(b)のようにアイコン画像が表示されなくなってしまい、非常にわかりづらい画面となってしまう。これに対し、アイコンの判定を行うと、パディング属性が残るため、画面上にアイコンを残すことができる。
HTMLのソースを参照しながら具体例を例示する。図6(a)のケースでは、上記(A)〜(C)のいずれにも該当しないため、画像“icon.gif”はアイコンであると判断され、パディング属性の除去対象とはならない。また、図6(b)のケースでは、上記(A)および(B)に該当するため、パディング属性の除去対象となる。また、図6(c)のケースでは、スタイルがコンテナタグ自体に付与されているため、上記(C)に該当し、パディング属性の除去対象となる。
ステップS122の処理を行うことで、見出しつきアイテムの用途で利用されている要
素(図6(a)では、<p>〜</p>の部分)に対して、適切なスタイルを付与することがで
きる。
スタイル変換の説明を続ける。
(3)幅および高さの属性を除去する
幅および高さの属性(width,height)が定義されているスタイルがあった場合、当該
属性を除去する。ただし、幅もしくは高さが極端に小さい(例えば0ピクセルである)要素は、隠れ要素であると推定できるため、除去は行わない。
(4)背景画像を除去する
背景画像に関する属性(background,background-image,list-style-image)が定義されており、かつ、画像のURLが定義されているスタイルがあった場合、当該属性を除去する。
(5)LIタグに関連するスタイルを除去する
LIタグに適用されたスタイルがあって、背景画像に関する属性(background,background-image,list-style-image)が定義されている場合、当該属性を除去する。
また、LIタグに適用されたスタイルがあって、ボーダー属性(border,border-color,border-style,border-width,border-top,border-bottom,border-left,border-right等、borderで始まる属性)が定義されている場合も、当該属性を除去する。
次に、ステップS123の処理について説明する。ステップS123は、定義された要素に対して、適切な幅を持ったスタイルを追加することでサイズの調整を行う処理である。ステップS123では、以下のルールに従って、記憶された構造化HTMLおよび構造化スタイルを更新する。
(1)IFRAMEタグのサイズを調整する
IFRAMEタグに対して、スマートフォン用のサイズを持ったstyle属性を付与する
。具体的には、display:block,max-width:100%,margin-right:auto,margin-left:autoの各値を持ったstyle属性を付与する。
(2)画像のサイズを調整する
IMGタグまたはINPUTタグで参照されている画像のサイズが、変換対象のスマートフォンの解像度を超えている場合、スマートフォン用のサイズを持ったstyle属性を付
与する。具体的には、display:block,max-width:100%,margin-right:auto,margin-left:autoの各値を持ったstyle属性を付与する。また、HTMLファイルが参照している画
像のファイルを同時に取得している場合は、当該画像の解像度を、変換対象のスマートフォンが持つ画面解像度よりも縮小して保存してもよい。(例えば最大640ピクセルに縮小する)
上記の処理が完了すると、処理はステップS13へ遷移する。
ステップS13は、制御部23が、HTMLタグによって既定された幅や高さのサイズを調整するステップである。具体的には、HTMLタグに、幅(width)または高さ(height)を表す属性が定義されている場合、当該属性を除去する。
サイズの調整が終了すると、ステップS14で、制御部23が、記憶している構造化スタイルと構造化HTMLを、CSSファイルおよびHTMLファイルとしてそれぞれ書き出す。また、スタイル記憶部24に記憶されたCSSファイルが参照されている場合、当該CSSファイルも出力の対象となる。書き出されたファイルは、ページ入出力部22を通して出力され、Webサーバ10へアップロードされる。
Webサーバ10にアップロードされたファイルは、HTTPサーバによって公開され、スマートフォン40での閲覧が可能になる。
第一の実施形態に係る文書変換システムによると、取得したHTMLの中からメニューであるブロックを検出することで、当該メニューについて、スマートフォンに適合したメニュー用スタイルを割り当てることができる。
また、PC向けに記述されたスタイルを検出して除去することで、所望の解像度で対象のページを正しく表示できるようになる。従来のように、スマートフォン用のスタイルを割り当てるだけでは、PC向けのスタイル記述が残ってしまい、正しい表示を妨げる原因となっていたが、本実施形態に係る文書変換システムではこれを解決することができる。また、スタイルの除去においては、見出しつきアイテムとして利用されている要素を判別するため、本来残すべきアイコンが消えたり、望ましくない位置に移動したりすることを防ぐことができる。
このように、第一の実施形態に係る文書変換システムによると、PC向けのスタイルが設定されたHTML文書を、自動でスマートフォン向けに変換することができる。また、サービス提供者が意図しない形のレイアウト変換を防ぐことができる。
なお、第一の実施形態では、ネットワーク経由で変換対象のファイルを取得したが、ページ入出力部22は、記憶媒体から対象のファイルを取得し、変換後のファイルを書き出すようにしてもよい。
また、第一の実施形態では、利用者が文書変換装置20を操作することで、Webサーバから対象ファイルを取得して変換を行ったが、文書変換サービスを提供する事業者が文書変換装置20を有し、サービス利用者に対してネットワーク経由で変換サービスを提供するようにしてもよい。具体的には、サービス利用者がコンピュータ30を通して文書変換装置20に変換リクエストを送信し、文書変換装置20が、変換結果をコンピュータ30に返信するようにしてもよい。その際、変換対象のファイルはコンピュータ30から送信してもよいし、Webサーバ20から取得してもよい。
また、本実施形態では、ステップS122で、参照されているPC向けのスタイルを削除することでHTMLファイルをスマートフォンに適合させたが、定義されたスタイルを全てスマートフォン用のものに更新してもよいし、ステップS121のようにスタイルの参照先を切り替え、あらかじめ定義されたスタイルを参照するようにしてもよい。HTMLタグで定義された要素に対して、スマートフォンに適合したスタイルを割り当てることができれば、更新処理はどのように行ってもよい。
また、本実施形態では、HTMLファイルと、外部参照されているスタイルシートを変換の対象としているが、スタイルがインラインで記述されていれば、変換の対象はHTMLファイルのみであってもよい。
(第二の実施形態)
第一の実施形態では、ステップS121の処理において、メニューを構成するブロックを検出してスタイルの変更を行った。しかし、メニューはリンクつき画像によって構成されている場合が多く、スタイルの変更のみでは適切なレイアウトに変換できないケースがある。第二の実施形態は、これに対応するため、画像によるリンクを、文字によるリンクに置換する実施形態である。なお、第二の実施形態に係る文書変換システムのシステム構成は、第一の実施形態と同様である。
第二の実施形態では、ステップS121の処理を行う際、構造化HTMLの中に、以下の条件を満たすブロックが存在するか確認する。
(1)順序なしリスト(UL)の子要素に、複数のリストアイテム(LI)がある
(2)複数のLIタグについて、当該LIタグを親要素とする子要素が一つずつある
(3)上記子要素が画像を包含している
条件を満たすブロックが存在する場合、当該ULタグについて、スマートフォンに適合したメニュー用スタイルを割り当てる。また、画像を表すタグを削除し、代替となるテキストを挿入する。
具体的な例を図7に示す。図7(a)は、変換前のHTML文書の構造を簡略化して示したものである。図7(a)は、上記(1)〜(3)の条件に合致するため、第一の実施形態と同様に、スタイルの名称が変更される。この際、IMGタグを削除し、タグに定義されているAlt属性を代替テキストとして挿入する。変換の結果は図7(b)のようになる。図7(a)を実際に表示した例が図8(a)であり、図7(b)を実際に表示した例が図8(b)である。
第二の実施形態によると、画像によるメニューを自動でテキストに置換するため、レイアウトの変換による意図しない表示ずれの発生を防ぐことができる。なお、テキストの取得先はAlt属性のほか、Title属性であってもよい。また、属性が定義されていない場合は、IMGタグの削除を行わないようにしてもよい。
(変形例)
上記の実施形態はあくまでも一例であって、本発明はその要旨を逸脱しない範囲内で適宜変更して実施しうる。
例えば、変換の対象はHTML文書だけでなく、マークアップ言語で記述された文書であれば、XHTML文書やXML文書などであってもよい。
また、実施形態の説明では、HTMLファイルからメニューを表すブロックを検出する例について述べたが、メニューを検出することができれば、その方法は、例示したような、ULタグおよびLIタグを用いたものでなくてもよい。例えば、テーブル内の複数のセルにリンクつきの画像が配置されており、当該全ての画像の解像度が同一であった場合、当該テーブルをメニューと判定するなどしてもよい。
また、検出対象の要素はメニューや画像のみである必要はなく、タグの構造や、付与されたスタイルによって用途を推定できるものであれば、どのようなものであってもよい。
10 Webサーバ
20 文書変換装置
21 通信部
22 ページ入出力部
23 制御部
24 スタイル記憶部
30 コンピュータ
40 スマートフォン

Claims (2)

  1. コンピュータが、
    マークアップ言語で記述された、第一の装置で表示するための第一の文書ファイルを取得するページ入力ステップと、
    取得した前記第一の文書ファイルに対して、前記第一の装置よりも低い表示解像度を持つ第二の装置に適合するスタイルを割り当てるページ変更ステップと、
    前記スタイルを割り当てた前記第一の文書ファイルを、前記第二の装置で表示するための第二の文書ファイルとして出力するページ出力ステップと、
    を実行する文書変換方法において、
    前記ページ変更ステップは、
    前記第一の文書ファイルに含まれる複数の要素をそれぞれ解析し、前記第一の文書ファイルから、割り当てられたスタイルが、
    (1)余白量の指定が自動ではない
    (2)背景画像を定義する属性が指定されている
    の、双方に該当し、かつ、コンテナではない要素を、見出しつきアイテムの用途で利用されている特定要素として抽出する特定要素抽出ステップと、
    前記特定要素抽出ステップで抽出された特定要素に対して、余白量が指定されたスタイルを割り当て、前記特定要素以外の通常の要素に対しては、余白量の指定が削除されたスタイルを割り当てるスタイル変更ステップと、
    を含むことを特徴とする、文書変換方法。
  2. 請求項1に記載の文書変換方法の各ステップをコンピュータに実行させる
    ことを特徴とする、文書変換プログラム。
JP2012224138A 2012-10-09 2012-10-09 文書変換方法および文書変換プログラム Active JP5263851B1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012224138A JP5263851B1 (ja) 2012-10-09 2012-10-09 文書変換方法および文書変換プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012224138A JP5263851B1 (ja) 2012-10-09 2012-10-09 文書変換方法および文書変換プログラム

Publications (2)

Publication Number Publication Date
JP5263851B1 true JP5263851B1 (ja) 2013-08-14
JP2014078066A JP2014078066A (ja) 2014-05-01

Family

ID=49053033

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012224138A Active JP5263851B1 (ja) 2012-10-09 2012-10-09 文書変換方法および文書変換プログラム

Country Status (1)

Country Link
JP (1) JP5263851B1 (ja)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000330979A (ja) * 1999-05-18 2000-11-30 Ntt Data Corp 検索対象となる電子文書の解析方法及び電子文書登録システム
JP2001236202A (ja) * 2000-02-22 2001-08-31 Sharp Corp 通信システム
JP2005527057A (ja) * 2002-09-05 2005-09-08 オペラ ソフトウェア エイエスエイ 小画面端末表示部へのhtmlコンテンツ提示
JP2009163326A (ja) * 2007-12-28 2009-07-23 Access Co Ltd マークアップ言語文書変換装置、マークアップ言語文書変換方法、マークアップ言語文書変換プログラム、およびマークアップ言語文書変換システム
JP2009176144A (ja) * 2008-01-25 2009-08-06 Access Co Ltd マークアップ言語文書変換システム、マークアップ言語文書変換装置、マークアップ言語文書変換方法およびマークアップ言語文書変換プログラム
WO2010073592A1 (ja) * 2008-12-26 2010-07-01 日本電気株式会社 情報推定装置、情報推定方法、及びコンピュータ読み取り可能な記録媒体
JP2012141702A (ja) * 2010-12-28 2012-07-26 Toppan Printing Co Ltd 電子文書変換装置及び電子文書変換方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000330979A (ja) * 1999-05-18 2000-11-30 Ntt Data Corp 検索対象となる電子文書の解析方法及び電子文書登録システム
JP2001236202A (ja) * 2000-02-22 2001-08-31 Sharp Corp 通信システム
JP2005527057A (ja) * 2002-09-05 2005-09-08 オペラ ソフトウェア エイエスエイ 小画面端末表示部へのhtmlコンテンツ提示
JP2009163326A (ja) * 2007-12-28 2009-07-23 Access Co Ltd マークアップ言語文書変換装置、マークアップ言語文書変換方法、マークアップ言語文書変換プログラム、およびマークアップ言語文書変換システム
JP2009176144A (ja) * 2008-01-25 2009-08-06 Access Co Ltd マークアップ言語文書変換システム、マークアップ言語文書変換装置、マークアップ言語文書変換方法およびマークアップ言語文書変換プログラム
WO2010073592A1 (ja) * 2008-12-26 2010-07-01 日本電気株式会社 情報推定装置、情報推定方法、及びコンピュータ読み取り可能な記録媒体
JP2012141702A (ja) * 2010-12-28 2012-07-26 Toppan Printing Co Ltd 電子文書変換装置及び電子文書変換方法

Also Published As

Publication number Publication date
JP2014078066A (ja) 2014-05-01

Similar Documents

Publication Publication Date Title
EP2771861B1 (en) Extensible framework for ereader tools
US9516156B2 (en) Apparatus and method for providing bookmark service in communication terminal
CN101957730B (zh) 信息处理设备和信息处理方法
KR100853281B1 (ko) 브라우저 창에 웹 페이지 디스플레이하기 및 웹 페이지처리 방법
US8910039B2 (en) File format conversion by automatically converting to an intermediate form for manual editing in a multi-column graphical user interface
US20120159310A1 (en) Method for converting mobile web application into native application and apparatus using the same
US20210149842A1 (en) System and method for display of document comparisons on a remote device
US20130227398A1 (en) Page based navigation and presentation of web content
US20100299589A1 (en) Keyword display method and keyword display system
US20130179771A1 (en) Selective rendering of electronic messages by an electronic device
CN103761277A (zh) 一种ePub电子书的加载方法和系统
WO2022048141A9 (zh) 一种图像处理方法及装置、计算机可读存储介质
US20140282139A1 (en) System for mobile content management
JP2011022914A (ja) 情報処理装置およびその制御プログラム
US20140282140A1 (en) Method for mobile content management
US20130227391A1 (en) Method and apparatus for displaying webpage
JP2012212473A (ja) 情報処理装置およびその制御プログラム
US20120089895A1 (en) Mobile terminal device and recording medium
US20140282115A1 (en) System and method for retrieving and selecting content
JP5263851B1 (ja) 文書変換方法および文書変換プログラム
KR101438198B1 (ko) 멀티-스크린용 사용자 인터페이스 구현 방법 및 이를 수행하는 멀티-스크린용 사용자 인터페이스 엔진
WO2014031011A1 (en) Website building tool
JP6802591B1 (ja) プログラム、端末及び情報処理システム
KR101131215B1 (ko) 복수의 객체들에 대한 탭 입력의 처리 방법, 상기 처리 방법이 실행되는 휴대용 통신 단말기 및 컴퓨터에서 독출가능한 저장 미디어
KR20120009738A (ko) 모바일 웹 브라우저 상에서 웹 문서를 제공하기 위한 방법, 모바일 단말 장치, 서버 및 컴퓨터 판독 가능한 기록 매체

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130424

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 5263851

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250