JP2006155147A - Content conversion system and computer program - Google Patents
Content conversion system and computer program Download PDFInfo
- Publication number
- JP2006155147A JP2006155147A JP2004343756A JP2004343756A JP2006155147A JP 2006155147 A JP2006155147 A JP 2006155147A JP 2004343756 A JP2004343756 A JP 2004343756A JP 2004343756 A JP2004343756 A JP 2004343756A JP 2006155147 A JP2006155147 A JP 2006155147A
- Authority
- JP
- Japan
- Prior art keywords
- content
- data
- distance
- parts
- dividing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
Abstract
Description
本発明は、コンテンツ変換システムおよびコンピュータプログラムに関する。 The present invention relates to a content conversion system and a computer program.
近年、携帯電話網からインターネットに接続することが実現されており、ユーザは携帯電話機などの携帯端末を使用してインターネット上のWebサイトにアクセスすることができる。一般的に、携帯端末はメモリ容量や表示画面サイズが小さいので、パーソナルコンピュータ向けの標準的なWebページをそのままのサイズで表示することはできない。このため、Webページを分割して携帯端末に順次提供するための従来技術が、例えば特許文献1に開示されている。この従来技術では、HTML(HyperText Markup Language)で記述されたコンテンツデータからタグの切れ目を検出し、携帯端末への容量上限に基づき、該タグの切れ目を境に前後にコンテンツを分割する。また、改行タグ又は見出しタグが存在する場合は、改行タグ又は見出しタグを境に前後に分割している。また、コンテンツ中のテーブルについては、携帯端末への容量上限に基づいて分割数を決定している。
しかし、上述した従来技術では、テキストとテーブルから成る単純なWebページ構成に対してはさほど問題なく分割することができるが、多様なWebページ構成に対して適切な分割を行うことが難しいという問題がある。例えば、画像とテキストから成る記事が複数掲載されたWebページの場合、上記従来技術により、単純にタグの切れ目で分割したり、改行タグ又は見出しタグで分割したりすると、画像とテキストとが分離した形で分割されて非常に見辛くなる恐れがある。また、テーブルタグを階層化して複雑なレイアウトを実現しているWebページの場合、上記従来技術によれば、携帯端末への容量上限に基づいて複数に分割されてしまうので、分割前の元のWebページのイメージが非常に損なわれることになりかねない。 However, with the above-described conventional technology, it is possible to divide a simple Web page configuration composed of text and a table without much problem, but it is difficult to perform appropriate division for various Web page configurations. There is. For example, in the case of a Web page on which a plurality of articles consisting of images and text are posted, the image and text are separated by simply dividing at the tag breaks or by line break tags or heading tags according to the above-mentioned conventional technology. There is a risk that it will be very difficult to see. Also, in the case of a Web page that has a hierarchical layout with table tags hierarchized, according to the above-described conventional technology, the page tag is divided into a plurality based on the upper limit of the capacity to the mobile terminal. The image of a web page can be very damaged.
本発明は、このような事情を考慮してなされたもので、その目的は、Webページ等のコンテンツが、画像やテキスト、ハイパーリンク等のコンテンツ部品から構成されており、且つ、HTML等のタグ記述を用いて該コンテンツ部品の表示レイアウトが指定されている場合において、該コンテンツを分割して携帯端末等に提供する際に分割前の元のコンテンツの内容に対して適切な分割を行うことができるコンテンツ変換システムを提供することにある。 The present invention has been made in consideration of such circumstances, and its purpose is that a content such as a Web page is composed of content parts such as an image, text, and a hyperlink, and a tag such as HTML is used. When the display layout of the content component is specified using a description, when the content is divided and provided to a mobile terminal or the like, the content of the original content before the division may be appropriately divided It is to provide a content conversion system that can be used.
また、本発明の他の目的は、本発明のコンテンツ変換システムをコンピュータを利用して実現するためのコンピュータプログラムを提供することにある。 Another object of the present invention is to provide a computer program for realizing the content conversion system of the present invention using a computer.
上記の課題を解決するために、本発明に係るコンテンツ変換システムは、画面表示されるコンテンツ部品から構成されるコンテンツを端末に表示するためのコンテンツデータであって、前記コンテンツ部品の表示レイアウトがタグを用いて記述されているコンテンツデータを分割するコンテンツ変換システムにおいて、前記コンテンツデータ中のコンテンツ部品間のデータ記述上の距離に基づいて、当該コンテンツデータ中の分割点を決定し、この結果に基づき、当該コンテンツデータを分割する分割手段と、前記分割後のデータを各々前記コンテンツデータとして再構成する再構成手段とを備えたことを特徴とする。 In order to solve the above-described problem, a content conversion system according to the present invention is content data for displaying content composed of content components displayed on a screen on a terminal, and the display layout of the content components is a tag. In the content conversion system that divides content data described by using, the division point in the content data is determined based on the data description distance between the content parts in the content data, and based on the result And dividing means for dividing the content data, and reconstruction means for reconfiguring the divided data as the content data.
本発明に係るコンテンツ変換システムにおいては、前記分割手段は、2つのコンテンツ部品の間に記述されている全タグのネストの深さを積分して前記距離を算出することを特徴とする。 In the content conversion system according to the present invention, the dividing means calculates the distance by integrating the nesting depths of all tags described between two content parts.
本発明に係るコンテンツ変換システムにおいては、前記分割手段は、前記距離の最大値点を分割点に決定することを特徴とする。 In the content conversion system according to the present invention, the dividing means determines the maximum value point of the distance as a dividing point.
本発明に係るコンテンツ変換システムにおいては、前記分割手段は、前記距離と分割後のデータ中のコンテンツ部品数とに応じて、再分割を行うことを特徴とする。 In the content conversion system according to the present invention, the dividing unit performs re-division according to the distance and the number of content parts in the divided data.
本発明に係るコンピュータプログラムは、画面表示されるコンテンツ部品から構成されるコンテンツを端末に表示するためのコンテンツデータであって、前記コンテンツ部品の表示レイアウトがタグを用いて記述されているコンテンツデータを分割するコンテンツ変換を行うためのコンピュータプログラムであって、前記コンテンツデータ中のコンテンツ部品間のデータ記述上の距離に基づいて、当該コンテンツデータ中の分割点を決定し、この結果に基づき、当該コンテンツデータを分割する分割機能と、前記分割後のデータを各々前記コンテンツデータとして再構成する機能とをコンピュータに実現させることを特徴とする。 A computer program according to the present invention is content data for displaying content composed of content components displayed on a screen on a terminal, and content data in which a display layout of the content component is described using a tag. A computer program for converting content to be divided, wherein a division point in the content data is determined based on a data description distance between content parts in the content data, and based on the result, the content A division function for dividing data and a function for reconfiguring the divided data as the content data are realized by a computer.
本発明に係るコンピュータプログラムにおいては、前記分割機能は、2つのコンテンツ部品の間に記述されている全タグのネストの深さを積分して前記距離を算出することを特徴とする。 In the computer program according to the present invention, the division function calculates the distance by integrating the nesting depths of all the tags described between two content parts.
本発明に係るコンピュータプログラムにおいては、前記分割機能は、前記距離の最大値点を分割点に決定することを特徴とする。 In the computer program according to the present invention, the dividing function determines the maximum value point of the distance as a dividing point.
本発明に係るコンピュータプログラムにおいては、前記分割機能は、前記距離と分割後のデータ中のコンテンツ部品数とに応じて、再分割を行うことを特徴とする。
これにより、前述のコンテンツ変換システムがコンピュータを利用して実現できるようになる。
In the computer program according to the present invention, the dividing function performs re-division according to the distance and the number of content parts in the divided data.
As a result, the above-described content conversion system can be realized using a computer.
本発明によれば、コンテンツ内容の区切りに基づいて分割点が決定されるので、分割前の元のコンテンツの内容に対して適切な分割を行うことができる。 According to the present invention, since the division point is determined based on the content content division, it is possible to appropriately divide the content of the original content before the division.
以下、図面を参照し、本発明の一実施形態について説明する。
本発明に係るコンテンツは、画像やテキスト、ハイパーリンク等のコンテンツ部品から構成されており、且つ、HTML等のタグ記述を用いて該コンテンツ部品の表示レイアウトが指定されている。また、コンテンツデータは、当該コンテンツを表示するための例えばHTMLデータである。本実施形態では、本発明に係るコンテンツの一例としてWebページを挙げて説明する。
図1は、本発明の一実施形態に係るコンテンツ変換システム1の構成を示すブロック図である。図1において、コンテンツ変換システム1は、コンテンツ取得部11と分割部12と再構成部13とを備える。
Hereinafter, an embodiment of the present invention will be described with reference to the drawings.
The content according to the present invention is composed of content parts such as images, texts, and hyperlinks, and the display layout of the content parts is specified using a tag description such as HTML. The content data is, for example, HTML data for displaying the content. In the present embodiment, a Web page will be described as an example of content according to the present invention.
FIG. 1 is a block diagram showing a configuration of a
コンテンツ変換システム1は通信ネットワークに接続されている。そして、コンテンツ変換システム1は、携帯電話網等の通信ネットワークを介して携帯端末20との間でデータを送受信することができる。また、コンテンツ変換システム1は、インターネット上に設けられたWebサーバ30にアクセスして、該Webサーバ30が提供するWebページを表示するためのコンテンツデータを該Webサーバ30から取得することができる。
The
携帯端末20は、各種のWebページの閲覧を実現するWebブラウザ21を有する。
The
図1のコンテンツ変換システム1において、コンテンツ取得部11は、携帯端末20で動作するWebブラウザ21からのWebページ取得要求を受信し、この要求に従ってWebサーバ30からコンテンツデータを取得する。該コンテンツデータは、画面表示されるコンテンツ部品(画像、テキスト、ハイパーリンク等)から構成されるWebページを端末に表示するためのものであり、コンテンツ部品の表示レイアウトがタグを用いて記述されている。このコンテンツデータは、具体的には、HTMLで記述されたHTMLデータである。
In the
分割部12は、コンテンツ取得部11が取得したHTMLデータを解析し、当該HTMLデータ中のコンテンツ部品間のHTML記述上の距離に基づいて、当該HTMLデータ中の分割点を決定する。そして、この結果に基づき、当該HTMLデータを分割する。なお、コンテンツ部品は、Webページ上に表示されるものであり、例えば画像、テキスト、ハイパーリンクなどである。
The dividing
再構成部13は、分割部12による分割後のそれぞれのHTMLデータに対してヘッダ付与等を行い、完全なHTMLデータとして再構成する。そして、再構成後のHTMLデータを、Webブラウザ21からの要求に応じて、順次、携帯端末20に返送する。
The
なお、コンテンツ変換システム1は、図1に示されるように独立した一装置として実現されてもよく、或いは、Webサーバ30内部もしくは携帯端末20内部に実装されるものであってもよい。
The
また、コンテンツ変換システム1は、専用のハードウェアにより実現されるものであってもよく、あるいはパーソナルコンピュータ等の汎用のコンピュータシステムにより構成され、図1に示されるコンテンツ変換システム1の各機能を実現するためのプログラムを実行することによりその機能を実現させるものであってもよい。
Further, the
次に、本実施形態のコンテンツ変換システム1によるコンテンツ変換に係る動作を説明する。
Next, the operation | movement which concerns on the content conversion by the
本実施形態では、Webページを表示するためのHTMLデータ中のコンテンツ部品間のHTML記述上の距離に基づいて、当該HTMLデータ中の分割点を決定する。コンテンツ部品は、画像、テキスト、ハイパーリンクなどのWebページ上に表示されるものである。HTML記述上の距離(以下、単に距離と称する)は、HTMLデータ中において、2つのコンテンツ部品の間に記述されている全タグのネストの深さを積分して得られる。タグのネストの深さは、Webページ内の表示レイアウトの区切り度合いを表す。 In the present embodiment, the division point in the HTML data is determined based on the distance on the HTML description between the content parts in the HTML data for displaying the Web page. The content component is displayed on a Web page such as an image, text, or hyperlink. The distance in HTML description (hereinafter simply referred to as distance) is obtained by integrating the nesting depth of all tags described between two content parts in HTML data. The depth of tag nesting represents the degree of partitioning of the display layout in the Web page.
従って、Webページ内の表示レイアウト上、密接なコンテンツ部品同士はその距離が短くなり、一方、疎遠なコンテンツ部品同士はその距離が長くなる。特に、Tableタグ等を多段に利用して複雑なレイアウトを実現しているWebページでは、その傾向が強い。このため、コンテンツ部品間の距離が長いほどより疎遠なコンテンツ部品同士であるとして、HTMLデータ中の分割点を決定する。 Therefore, in the display layout in the Web page, the distance between the close content components is short, while the distance between the distant content components is long. In particular, the tendency is strong in a Web page that implements a complex layout using Table tags and the like in multiple stages. For this reason, the division point in HTML data is determined on the assumption that the content parts are more distant from each other as the distance between the content parts is longer.
以下、コンテンツ変換に係る動作を詳細に説明する。 Hereinafter, operations related to content conversion will be described in detail.
初めに、図1に示される分割部12の動作を説明する。
先ず、分割部12は、コンテンツ取得部11が取得したHTMLデータを解析し、HTMLデータ中のコンテンツ部品を検出する。この検出処理においては、コメントタグで囲まれたコメント行と、Java(登録商標)スクリプトは検出対象から除外する。また、コンテンツ部品の検出対象は、以下の(A−1)〜(A−3)の3種類とする。
First, the operation of the dividing
First, the dividing
(A−1) <img>タグ
<img>タグ中には、画像ファイル(画像のコンテンツ部品)が含まれている。
但し、「alt=””」のように、alt属性に値がない場合は検出対象から除外する。但し、画像が一定以上の大きさ(例えば、縦方向のサイズが100ピクセル以上かつ横方向のサイズが100ピクセル以上)である場合は、alt属性に値がなくても除外しない。また、2つ以上出現する全く同じ画像ファイルを含む<img>タグは、検出対象から除外する。
(A-1) <img> tag
An <img> tag includes an image file (image content component).
However, if there is no value in the alt attribute, such as “alt =” ”, it is excluded from the detection target. However, if the image is a certain size or larger (for example, the vertical size is 100 pixels or more and the horizontal size is 100 pixels or more), it is not excluded even if the alt attribute has no value. Also, an <img> tag including two or more appearing identical image files is excluded from detection targets.
(A−2) <a>と</a>で囲まれた部分
この部分には、<img>タグ、ハイパーリンク、テキストなどの各種コンテンツ部品が含まれる。複数のコンテンツ部品が含まれる場合は、当該複数のコンテンツ部品を一コンテンツ部品として扱う。
(A-2) Portion surrounded by <a> and </a> This portion includes various content components such as <img> tag, hyperlink, text and the like. When a plurality of content parts are included, the plurality of content parts are handled as one content part.
(A−3) 上記(A−2)の<a>と</a>で囲まれた部分以外のテキスト (A-3) Text other than the part enclosed by <a> and </a> in (A-2) above
次いで、分割部12は、検出したコンテンツ部品に係るHTML記述に対して、以下の(B−1)〜(B−4)の加工を施す。これらの加工は、分割後のHTMLデータを使用して表示されるWebページの表示内容を適切に保つことを目的としている。
Next, the dividing
(B−1) <font>、<br>、<b>、<small>等の文字装飾系のタグは削除する。 (B-1) Character decoration tags such as <font>, <br>, <b>, <small> are deleted.
(B−2) 相対URL(Uniform Resource Locator)を絶対URLに変更する。さらに、当該コンテンツ変換システム1経由に変更する。これにより、分割後のWebページから新たなWebページを取得する場合にも、当該コンテンツ変換システム1経由とすることができる。
(B-2) A relative URL (Uniform Resource Locator) is changed to an absolute URL. Further, the content is changed via the
(B−3) 「 (スペースを表す)」等の特殊記号は削除する。 (B-3) Special symbols such as “ ” (representing a space) are deleted.
(B−4) 所定の不要なテキストは削除する。この削除対象テキストは、予めメモリ等に設定されている。 (B-4) A predetermined unnecessary text is deleted. This deletion target text is preset in a memory or the like.
次いで、分割部12は、検出した全コンテンツ部品、及びこのコンテンツ部品に係るHTML記述に含まれない全タグについて、HTMLデータ中のネストの深さを算出する。この算出処理では、<body>と</body>で囲まれた部分を対象とする。コンテンツ部品の深さは、当該コンテンツ部品の直前に記述されるタグの深さと同じとする。また、コンテンツ部品に含まれないタグに関しては、終了タグがないタグ(<input〜>、altがない<img>等)の深さは、当該タグの直前に記述されるタグの深さと同じとする。そして、<body>及び</body>の深さを基準(基準値“0”)として、ネストが一段深くなるごとに、1ずつ加算してネストの深さを算出する。また、ネストが一段浅くなるごとに、ネストの深さから1ずつ減算する。
Next, the dividing
次いで、分割部12は、隣り合う2つのコンテンツ部品の間に記述されている全タグのネストの深さを積分する。この積分結果の値が、該2つのコンテンツ部品間の距離である。図2は、コンテンツ部品間の距離を算出する処理のフローチャートである。図3は、コンテンツ部品間の距離を説明するためのグラフ図である。図3では、コンテンツ部品101,102間の距離Sabを算出している。以下、図2を参照し、図3の例を基に、コンテンツ部品間の距離算出方法を説明する。
Next, the dividing
図2において、ステップS1では、変数SaおよびSbを0に初期化する。また、変数iを図3のコンテンツ部品101のタグ順xaに設定する。
In FIG. 2, in steps S1, variables Sa and Sb are initialized to zero. Also, the variable i is set to the tag order xa of the
次いで、ステップS2では、コンテンツ部品101のネストの深さyaと、関数fab(i)の値との差の絶対値を変数Saに加算する。関数fab(i)は、タグ順iのタグのネストの深さを表す。
Next, in step S2, the absolute value of the difference between the nesting depth ya of the
次いで、ステップS3では、もう一方の図3のコンテンツ部品102のネストの深さybと、関数fab(i)の値との差の絶対値を変数Sbに加算する。
Next, in step S3, the absolute value of the difference between the nesting depth yb of the
次いで、ステップS4では、変数iがコンテンツ部品102のタグ順xb未満であるか判断する。
Next, in step S4, it is determined whether the variable i is less than the tag order xb of the
変数iがコンテンツ部品102のタグ順xb未満である場合、変数iに1加算して(ステップS5)、上記ステップS2に戻る。
If the variable i is less than the tag order xb of the
一方、変数iがコンテンツ部品102のタグ順xbに達した場合、変数Sa,Sbのいずれか大きい方の値を、コンテンツ部品101,102間の距離Sabに設定する。
On the other hand, when the variable i reaches the tag order xb of the
このようにして、分割部12は、全てのコンテンツ部品間の距離をそれぞれ算出する。
In this way, the dividing
次いで、分割部12は、上記検出したコンテンツ部品をグループ分けする。図4は、コンテンツ部品のグループ分け処理のフローチャートである。以下、図4を参照して、コンテンツ部品のグループ分け方法を説明する。
Next, the dividing
図4において、ステップS11では、先ず、上記検出したコンテンツ部品の全てを一つのグループに組み入れ、このグループにポインタを置く(ポインタがあるグループをグループpと称する)。 In FIG. 4, in step S11, first, all the detected content parts are incorporated into one group, and a pointer is placed in this group (a group having a pointer is referred to as group p).
次いで、ステップS12では、グループp内のコンテンツ部品数が2つ以上であるか判断する。この結果、2つ以上の場合はステップS13に進み、一方、2つ未満の場合はステップS20に進む。 Next, in step S12, it is determined whether the number of content parts in the group p is two or more. As a result, when there are two or more, the process proceeds to step S13, and when there are less than two, the process proceeds to step S20.
次いで、ステップS13では、グループp内のコンテンツ部品間の距離の平均値Aを算出する。 Next, in step S13, an average value A of the distances between the content parts in the group p is calculated.
次いで、ステップS14では、グループp内のコンテンツ部品間の距離の最大値を取得する。ここで、最大値の距離を有するコンテンツ部品のペアは、一つとは限らず、複数のペアが存在する場合がある。 Next, in step S14, the maximum value of the distance between the content parts in the group p is acquired. Here, the number of content component pairs having the maximum distance is not limited to one, and there may be a plurality of pairs.
次いで、ステップS15では、該取得した距離の最大値が平均値Aの定数N1倍以上であるか判断する。この結果、定数N1倍以上の場合はステップS16に進み、一方、定数N1倍未満の場合はステップS18に進む。 Next, in step S15, it is determined whether the maximum value of the acquired distance is equal to or greater than a constant N1 times the average value A. As a result, if the constant N1 times or more, the process proceeds to step S16, whereas if it is less than the constant N1, the process proceeds to step S18.
次いで、ステップS16では、該距離の最大値を有するコンテンツ部品のペアの一方(HTML記述上の後方に配置されるコンテンツ部品)を境に、グループp内のコンテンツ部品を新たなグループに組み分けする。ここで、距離の最大値を有するコンテンツ部品のペアがN個であれば、新たなグループは(N+1)個となる。 Next, in step S16, the content parts in the group p are grouped into a new group on the boundary of one of the pair of content parts having the maximum value of the distance (the content part arranged behind the HTML description). . Here, if there are N pairs of content parts having the maximum distance, the number of new groups is (N + 1).
次いで、ステップS17では、新たなグループのうち、最初端のグループ(HTML記述上の最前方に配置されるグループ)にポインタを移動し、ステップS12に戻る。 Next, in step S17, the pointer is moved to the first group (the group arranged at the forefront in the HTML description) among the new groups, and the process returns to step S12.
ステップS18では、ステップS14で取得した距離の最大値が平均値Aの定数N2倍以上であるか判断する。この結果、定数N2倍以上の場合はステップS19に進み、一方、定数N2倍未満の場合はステップS20に進む。 In step S18, it is determined whether the maximum value of the distance acquired in step S14 is equal to or greater than a constant N2 times the average value A. As a result, if the constant is N2 times or more, the process proceeds to step S19, whereas if it is less than the constant N2 times, the process proceeds to step S20.
次いで、ステップS19では、距離の最大値を有するコンテンツ部品のペアの一方を境に、グループp内のコンテンツ部品を新たなグループに組み分けした場合に、新たなグループの全てにおいて、グループ内のコンテンツ部品数が定数N3以上であるか判断する。この結果、定数N3以上の場合はステップS16に進み、一方、定数N3未満の場合はステップS20に進む。 Next, in step S19, when the content parts in group p are grouped into a new group with one of the pair of content parts having the maximum distance as a boundary, the content in the group in all of the new groups. It is determined whether the number of parts is a constant N3 or more. As a result, if the value is greater than or equal to the constant N3, the process proceeds to step S16, whereas if it is less than the constant N3, the process proceeds to step S20.
次いで、ステップS20では、現在の最終端のグループ(HTML記述上の最後方に配置されるグループ)にポインタがあるか判断する。この結果、現在の最終端のグループにポインタがある場合は処理を終了する。一方、現在の最終端のグループにポインタがない場合は、一つ後方のグループにポインタを移動してステップS12に戻る(ステップS21)。 Next, in step S20, it is determined whether or not there is a pointer in the current last group (group arranged at the last position in the HTML description). As a result, if there is a pointer in the current last group, the process ends. On the other hand, if there is no pointer in the current last group, the pointer is moved to the next rear group and the process returns to step S12 (step S21).
なお、上記した定数N1,N2,N3は、任意の値に予め設定される。例えば、定数N1=5.0、定数N2=3.0、定数N3=4とする。 The constants N1, N2, and N3 described above are set in advance to arbitrary values. For example, constant N1 = 5.0, constant N2 = 3.0, and constant N3 = 4.
図5は、上記したコンテンツ部品のグループ分け方法を具体的に説明するための図である。
図5において、Webページを表示するためのHTMLデータ中から、n個のコンテンツ部品(以下、単に部品と称する場合がある)が検出されている。これら全ての部品間の距離の平均値は2である。また、部品間の距離の最大値「10」を有する部品のペアは2つあり、双方ともに平均値「2」のN1(5)倍以上である。これにより、初期のグループpは、部品間の距離の最大値「10」を有する部品の2つのペアの各一端で、それぞれ分割される。この結果、部品1〜5までのグループxと、部品6〜m−1までのグループyと、部品m〜nまでのグループzとが形成される。これら新たなグループに対してさらに分割判定処理を繰り返し行う。
FIG. 5 is a diagram for specifically explaining the above-described method of grouping content parts.
In FIG. 5, n content parts (hereinafter may be simply referred to as parts) are detected from HTML data for displaying a Web page. The average distance between all these parts is 2. In addition, there are two component pairs having a maximum distance “10” between the components, and both are N1 (5) times or more of the average value “2”. Thus, the initial group p is divided at each end of the two pairs of parts having the maximum distance “10” between the parts. As a result, a group x from
そして、グループxについては、グループ内の全ての部品間の距離の平均値は1.5である。また、部品間の距離の最大値は、平均値「1.5」のN1(5)倍未満であるが、平均値「1.5」のN2(3)倍以上であり且つグループxには2個以上の部品がある。これにより、グループxは、部品間の距離の最大値を有する部品のペアの一端で分割される。この結果、部品1及び2のグループ1と、部品3〜5までのグループ2とが形成される。
And about the group x, the average value of the distance between all the components in a group is 1.5. The maximum distance between components is less than N1 (5) times the average value “1.5”, but more than N2 (3) times the average value “1.5”. There are two or more parts. Thereby, the group x is divided at one end of the pair of parts having the maximum value of the distance between the parts. As a result,
このようにして、分割部12は、コンテンツ取得部11が取得したHTMLデータ中のコンテンツ部品をグループ分けする。
In this way, the dividing
次いで、分割部12は、そのグループ分けしたグループ毎に、コンテンツ取得部11が取得したHTMLデータを分割する。
以上が分割部12の動作の説明である。
Next, the dividing
The above is the description of the operation of the dividing
次に、図1に示される再構成部13の動作を説明する。
再構成部13は、分割部12から分割後の各HTMLデータを受け取る。そして、個々のHTMLデータに対して、ヘッダ付与および階層化を行い、完全なHTMLデータとして再構成する。また、再構成したHTMLデータの各々に対して、グループ名を生成する。例えば、グループ内のいずれかのコンテンツ部品が有するコンテンツのファイル名の一部分(例えば最初の10文字)を用いる。
Next, the operation of the
The
次いで、再構成部13は、再構成後のHTMLデータを、Webブラウザ21からの要求に応じて、順次、携帯端末20に返送する。この返送順序は、部品間の距離の平均値が大きなグループ順とする。
Next, the
図6、図7は、本実施形態に係るコンテンツ変換の具体例を示す図である。図6には、Webページを表示するためのHTMLデータの一例が示されている。図7には、本実施形態に係るコンテンツ変換処理によるWebページの分割例が示されている。 6 and 7 are diagrams illustrating specific examples of content conversion according to the present embodiment. FIG. 6 shows an example of HTML data for displaying a Web page. FIG. 7 shows an example of Web page division by content conversion processing according to the present embodiment.
図6のHTMLデータ200は、図7に示されるWebページ300を表示するものである。図6において、HTMLデータ200は、本実施形態に係るコンテンツ変換処理により、3つのグループ201,202,203に分割される。これらグループ201,202,203は、図7のWebページ300の分割部分301,302,303に各々対応している。従って、グループ201,202,203がそれぞれHTMLデータとして再構成されることにより、分割部分301,302,303はそれぞれ携帯端末の画面上に表示可能となる。
The HTML data 200 in FIG. 6 displays the
上述したように本実施形態によれば、Webページを表示するためのHTMLデータ中のコンテンツ部品間のHTML記述上の距離に基づいて、当該HTMLデータ中の分割点を決定する。該コンテンツ部品は、Webページ上に表示されるものである。これにより、Webページ内容の区切りに基づいて分割点が決定されるので、分割前の元のWebページの内容に対して適切な分割を行うことが可能となる。 As described above, according to the present embodiment, the division point in the HTML data is determined based on the distance on the HTML description between the content parts in the HTML data for displaying the Web page. The content component is displayed on the Web page. As a result, since the division point is determined based on the division of the Web page content, it is possible to appropriately divide the content of the original Web page before the division.
また、図1に示すコンテンツ変換システム1の機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することによりコンテンツ変換処理を行ってもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものであってもよい。
また、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。
また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、フラッシュメモリ等の書き込み可能な不揮発性メモリ、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。
Further, the program for realizing the function of the
Further, the “computer system” includes a homepage providing environment (or display environment) if a WWW system is used.
The “computer-readable recording medium” means a flexible disk, a magneto-optical disk, a ROM, a writable nonvolatile memory such as a flash memory, a portable medium such as a CD-ROM, a hard disk built in a computer system, etc. This is a storage device.
さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ(例えばDRAM(Dynamic Random Access Memory))のように、一定時間プログラムを保持しているものも含むものとする。
また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。
また、上記プログラムは、前述した機能の一部を実現するためのものであっても良い。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であっても良い。
Further, the “computer-readable recording medium” means a volatile memory (for example, DRAM (Dynamic DRAM) in a computer system that becomes a server or a client when a program is transmitted through a network such as the Internet or a communication line such as a telephone line. Random Access Memory)), etc., which hold programs for a certain period of time.
The program may be transmitted from a computer system storing the program in a storage device or the like to another computer system via a transmission medium or by a transmission wave in the transmission medium. Here, the “transmission medium” for transmitting the program refers to a medium having a function of transmitting information, such as a network (communication network) such as the Internet or a communication line (communication line) such as a telephone line.
The program may be for realizing a part of the functions described above. Furthermore, what can implement | achieve the function mentioned above in combination with the program already recorded on the computer system, and what is called a difference file (difference program) may be sufficient.
以上、本発明の実施形態を図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、本発明の要旨を逸脱しない範囲の設計変更等も含まれる。
例えば、コンテンツ部品間の距離の計算方法は上述した実施形態に限定されない。単純にコンテンツ部品間に含まれる全タグの個数を当該コンテンツ部品間の距離として用いてもよい。
The embodiment of the present invention has been described in detail with reference to the drawings. However, the specific configuration is not limited to this embodiment, and includes design changes and the like within a scope not departing from the gist of the present invention.
For example, the method for calculating the distance between content parts is not limited to the above-described embodiment. The number of all tags included between content parts may be simply used as the distance between the content parts.
1…コンテンツ変換システム、11…コンテンツ取得部、12…分割部、13…再構成部。
DESCRIPTION OF
Claims (8)
前記コンテンツデータ中のコンテンツ部品間のデータ記述上の距離に基づいて、当該コンテンツデータ中の分割点を決定し、この結果に基づき、当該コンテンツデータを分割する分割手段と、
前記分割後のデータを各々前記コンテンツデータとして再構成する再構成手段と、
を備えたことを特徴とするコンテンツ変換システム。 In a content conversion system that divides content data for displaying content composed of content components displayed on a screen on a terminal, wherein the content component display layout is described using tags,
A dividing means for determining a dividing point in the content data based on a distance in data description between content parts in the content data, and dividing the content data based on the result;
Reconstructing means for reconstructing the divided data as the content data,
A content conversion system comprising:
前記コンテンツデータ中のコンテンツ部品間のデータ記述上の距離に基づいて、当該コンテンツデータ中の分割点を決定し、この結果に基づき、当該コンテンツデータを分割する分割機能と、
前記分割後のデータを各々前記コンテンツデータとして再構成する機能と、
をコンピュータに実現させることを特徴とするコンピュータプログラム。 Content data for displaying content composed of content components displayed on the screen on a terminal, and for content conversion for dividing content data in which the display layout of the content component is described using a tag A computer program,
A division function for determining a division point in the content data based on a distance in data description between content parts in the content data, and dividing the content data based on the result;
A function of reconfiguring the divided data as the content data,
A computer program for causing a computer to realize the above.
6. The computer program according to claim 5, wherein the division function performs re-division according to the distance and the number of content parts in the divided data.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004343756A JP4624086B2 (en) | 2004-11-29 | 2004-11-29 | Content conversion system and computer program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004343756A JP4624086B2 (en) | 2004-11-29 | 2004-11-29 | Content conversion system and computer program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006155147A true JP2006155147A (en) | 2006-06-15 |
JP4624086B2 JP4624086B2 (en) | 2011-02-02 |
Family
ID=36633384
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004343756A Expired - Fee Related JP4624086B2 (en) | 2004-11-29 | 2004-11-29 | Content conversion system and computer program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4624086B2 (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013038519A1 (en) * | 2011-09-14 | 2013-03-21 | 株式会社マイニングブラウニー | Web page analysis device and program for analyzing web page |
US8700995B2 (en) | 2007-05-07 | 2014-04-15 | Kddi Corporation | Content conversion system and recording medium storing computer program |
US9170988B2 (en) | 2006-11-15 | 2015-10-27 | Kyocera Document Solutions Inc. | Method for causing computer to display page view on display area by converting HTML page into new HTML pages, and non-transitory computer readable media recording program |
-
2004
- 2004-11-29 JP JP2004343756A patent/JP4624086B2/en not_active Expired - Fee Related
Non-Patent Citations (2)
Title |
---|
CSNG200500594001, 前川 卓也, "複数のモバイルユーザのためのWebページ分割を用いた協調Webブラウジングシステム", 情報処理学会研究報告, 20041111, 2004−MBL−31,2004−ITS−19, 1−7頁, JP, 社団法人情報処理学会 * |
JPN6009066838, 前川 卓也, "複数のモバイルユーザのためのWebページ分割を用いた協調Webブラウジングシステム", 情報処理学会研究報告, 20041111, 2004−MBL−31,2004−ITS−19, 1−7頁, JP, 社団法人情報処理学会 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9170988B2 (en) | 2006-11-15 | 2015-10-27 | Kyocera Document Solutions Inc. | Method for causing computer to display page view on display area by converting HTML page into new HTML pages, and non-transitory computer readable media recording program |
US8700995B2 (en) | 2007-05-07 | 2014-04-15 | Kddi Corporation | Content conversion system and recording medium storing computer program |
WO2013038519A1 (en) * | 2011-09-14 | 2013-03-21 | 株式会社マイニングブラウニー | Web page analysis device and program for analyzing web page |
Also Published As
Publication number | Publication date |
---|---|
JP4624086B2 (en) | 2011-02-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN100465956C (en) | System, web server and method for adding personalized value to web sites | |
CN103605739B (en) | The display methods and device of thermodynamic chart | |
CN101364979B (en) | Downloaded material parsing and processing system and method | |
US8499099B1 (en) | Converting data into addresses | |
CN103246678B (en) | A kind of web page content preview method and apparatus | |
CN108717437B (en) | Search result display method and device and storage medium | |
CN105549936B (en) | Data table display method and device | |
CN108334508B (en) | Webpage information extraction method and device | |
CN104423991A (en) | Webpage loading and webpage data providing method and device of mobile terminal | |
US20130155463A1 (en) | Method for selecting user desirable content from web pages | |
CN103425631A (en) | Method and device for acquiring font files of target characters in document files | |
CN106201562A (en) | A kind of page switching method and device | |
CN112328939B (en) | Page processing method, device and storage medium | |
CN103336794A (en) | Method and device for providing corresponding presence information on destination page | |
CN110309457B (en) | Webpage data processing method, device, computer equipment and storage medium | |
US20120054598A1 (en) | Method and system for viewing web page and computer Program product thereof | |
CN110968314A (en) | Page generation method and device | |
CN110955855A (en) | Information interception method, device and terminal | |
CN108108381B (en) | Page monitoring method and device | |
JP4624086B2 (en) | Content conversion system and computer program | |
CN111680247A (en) | Local calling method, device, equipment and storage medium of webpage character string | |
CN117032870A (en) | Page jump processing method and device | |
CN115408627A (en) | Menu display method, device, equipment and medium | |
CN112100553B (en) | Webpage configuration method and device, electronic equipment and storage medium | |
US7127681B1 (en) | Method for managing contents of a web site |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070905 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20071011 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20071011 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20091211 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100105 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100305 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20100309 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20100305 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100817 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20101004 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20101005 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20101026 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20101102 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131112 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |