JP2005196711A - Conversion of table information for rendering on area-restricted display - Google Patents

Conversion of table information for rendering on area-restricted display Download PDF

Info

Publication number
JP2005196711A
JP2005196711A JP2004028681A JP2004028681A JP2005196711A JP 2005196711 A JP2005196711 A JP 2005196711A JP 2004028681 A JP2004028681 A JP 2004028681A JP 2004028681 A JP2004028681 A JP 2004028681A JP 2005196711 A JP2005196711 A JP 2005196711A
Authority
JP
Japan
Prior art keywords
label
adjacent
row
column
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004028681A
Other languages
Japanese (ja)
Inventor
Adam Berger
バーガー アダム
Richard Romero
ロメロ リチャード
Gregory Schohn
ショーン グレゴリー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nokia Inc
Original Assignee
Nokia Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nokia Inc filed Critical Nokia Inc
Priority to JP2004028681A priority Critical patent/JP2005196711A/en
Publication of JP2005196711A publication Critical patent/JP2005196711A/en
Pending legal-status Critical Current

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To provide an improved system for converting the table information including at least one table, its related terminal, method and computer program product. <P>SOLUTION: This system for converting the table information to be rendered to the terminal having an area-restricted display, comprises a network entity. The network entity includes a document converter capable of receiving an electronic document including the table information composed of the table. The document converter can convert the table into the straightened display of the table on the basis of the order of each table and on the basis of at least one label when at least one table includes at least one label. <P>COPYRIGHT: (C)2005,JPO&NCIPI

Description

本発明は、一般に、テーブル情報をレンダリングするためのシステム及び方法に係り、より詳細には、表示エリアが限定されたターミナルにレンダリングするためにテーブル情報を変換するためのメモリを保存するシステム、方法及びコンピュータプログラム製品に係る。   The present invention relates generally to a system and method for rendering table information, and more particularly to a system and method for storing memory for converting table information for rendering to a terminal with a limited display area. And computer program products.

ウェブページやe−メールメッセージやワードプロセスファイルのような電子文書を作成する会社や個人は、通常、ターゲットプラットホームを心に描いている。多くの場合、プラットホームは、適度な記憶容量、メモリ、帯域巾及び大きな(通常は少なくとも対角長さ14インチの)ディスプレイをもつデスクトップコンピュータである。このターゲットプラットホームを心に描いて作成されるファイルは、しばしば、テーブル、フレーム、グラフィック、及びナビゲーション補助手段を伴う複雑なフォーマット情報を含み、これらは、全て、文書をいかにレンダリングすべきか定義するものである。   Companies and individuals who create electronic documents such as web pages, e-mail messages, and word process files typically have a target platform in mind. In many cases, the platform is a desktop computer with moderate storage capacity, memory, bandwidth and a large (usually at least 14 inches diagonal) display. Files created with this target platform in mind often contain complex formatting information with tables, frames, graphics, and navigation aids, all of which define how the document should be rendered. is there.

ユーザは、文書が最初に構成されなかったところの媒体、例えば、インターネットイネーブル型移動電話、パーソナルデジタルアシスタント(PDA)又はハンドヘルドコンピュータを介してこのような文書にアクセスするのを希望することがある。これらの装置は、表示エリアや解像度やレンダリング能力に限度があり、最初に構成された通りに文書をレンダリングできないか、或いは非常に低速及び/又は不便な仕方でしかレンダリングできない。例えば、インターネットイネーブル型移動電話は、通常、数行のテキストしか表示できず、一方、像をレンダリングするためのそれらの能力は、グレースケール又はサムネールサイズの映像或いは全く映像のない状態に制限される。表示が制限される媒体の極端な例は、音声である。この点に関して、AT&T Natural Voices(登録商標)「テキスト対スピーチエンジン」は、テキスト対スピーチ変換を使用して電話を介して文書の内容を口述するサービスへ電話でダイヤルすることによりユーザが電子文書にアクセスするのを許す。しかしながら、この口述は、当然、テキストの一次元「レンダリング」であり、二次元テーブルに埋め込まれた複雑なレイアウト情報を表現することができない。   A user may wish to access such a document via the medium on which the document was not originally configured, such as an Internet-enabled mobile phone, a personal digital assistant (PDA), or a handheld computer. These devices have limited display area, resolution, and rendering capabilities and cannot render the document as originally configured, or can only render in a very slow and / or inconvenient manner. For example, Internet-enabled mobile phones can usually display only a few lines of text, while their ability to render images is limited to grayscale or thumbnail size video or no video at all. . An extreme example of a medium that is limited in display is audio. In this regard, AT & T Natural Voices® “Text-to-Speech Engine” allows a user to dial an electronic document by dialing to a service that dictates the content of the document via the phone using text-to-speech conversion. Allow access. However, this dictation is of course a one-dimensional “rendering” of text and cannot represent complex layout information embedded in a two-dimensional table.

従来、スクリーンサイズ、解像度及びレンダリング能力に限度があるために、最初に構成されたように文書をレンダリングできない装置は、コールされたときに、このような文書を自由にレンダリングする。この点に関して、テーブルのように二次元的にフォーマットされた情報を含む文書については、ある従来の装置は、このようなテーブルを排除する。他の装置は、テーブルの巾が広過ぎるときに装置の表示エリア内に適合させるために1つ以上の選択された列を切断する。更に別の装置は、テーブルの機械的「直線化(linearization)」を実行し、通常、テーブル内のセルのコンテンツの自然の順序を無視して、例えば、左から右へ、上から下への所定の順序でテーブル内のセルを訪れながら、テーブルの各セルを独立してレンダリングする。更に、他の装置は、全テーブルの部分的「ビューポート」のみをレンダリングし、装置のユーザがテーブル内のビューポートを例えば左から右へ移動し、ひいては、テーブルの異なる部分を露呈させたい旨を(例えば、矢印キーを押すことで)指示することを必要とする。テーブルをレンダリングするこのような技術は、時々は充分であるが、全てのテーブルデータを与えるように、且つテーブル内の情報を、その情報を見ているユーザに分かり易くするように、エリア限定ディスプレイにレンダリングするためにテーブル情報を変換する改良されたシステム及び方法を構成することが望まれる。   Traditionally, devices that are unable to render a document as originally configured due to limitations in screen size, resolution, and rendering capabilities are free to render such a document when called. In this regard, for documents that contain information that is two-dimensionally formatted, such as tables, certain conventional devices eliminate such tables. Other devices cut one or more selected rows to fit within the display area of the device when the table is too wide. Yet another device performs a mechanical “linearization” of the table, typically ignoring the natural ordering of the contents of the cells in the table, eg from left to right, top to bottom. Each cell of the table is rendered independently while visiting the cells in the table in a predetermined order. In addition, other devices render only a partial “viewport” of the entire table and the user of the device wishes to move the viewport in the table, for example from left to right, thus exposing a different part of the table. (E.g., by pressing an arrow key). Such a technique for rendering a table is sometimes sufficient, but it provides an area-limited display so as to provide all table data and to make the information in the table easier to understand for the user viewing the information. It would be desirable to construct an improved system and method for converting table information for rendering into

以上の背景に鑑み、本発明の実施形態は、少なくとも1つのテーブルを含むテーブル情報を変換するための改良されたシステム及びその関連ターミナル、方法並びにコンピュータプログラム製品を提供する。本発明の実施形態は、従来の技術とは対照的に、例えば、テーブル内のラベルを、各ラベルに関連したセルにローカライズすることにより、情報を見ているユーザに便利で且つ分かり易いようにテーブルのコンテンツを与えるように、限定エリアディスプレイを有するターミナルにより後でレンダリングするためにテーブルを変換することができる。それ故、このようなターミナルにテーブルをレンダリングするための従来の技術とは対照的に、本発明の実施形態は、このようなテーブルの1つ以上の選択された列を切断するのではなく、テーブル内のセルのコンテンツの自然の順序を無視してテーブルの各セルをレンダリングすることによりテーブルの機械的直線化を実行するのではなく、且つ全テーブルの部分的ビューポートだけをレンダリングして、装置のユーザがビューポートの移動を必要とするのではなく、このようなテーブルの全コンテンツをレンダリングすることができる。   In view of the above background, embodiments of the present invention provide an improved system and associated terminals, methods and computer program products for converting table information including at least one table. In contrast to the prior art, embodiments of the present invention are convenient and understandable for the user viewing the information, for example by localizing the labels in the table into cells associated with each label. To provide the contents of the table, the table can be converted for later rendering by a terminal having a limited area display. Therefore, in contrast to conventional techniques for rendering a table to such a terminal, embodiments of the present invention do not cut one or more selected columns of such a table, Rather than performing a mechanical linearization of the table by rendering each cell of the table ignoring the natural order of the contents of the cells in the table, and rendering only a partial viewport of the entire table, Rather than requiring the user of the device to move the viewport, the entire contents of such a table can be rendered.

本発明の1つの特徴によれば、エリアの限定されたディスプレイを有するターミナルにレンダリングするためのテーブル情報を変換するシステムが提供される。このシステムは、移動ターミナル、原点サーバー、プロキシー/ゲートウェイ、ショートメッセージサービスセンター(SMSC)、マルチメディアメッセージサービスセンター(MMSC)、ゲートウェイGPRSサービスノード(GGSN)、ユーザプロセッサ等のネットワークエンティティを備えている。このネットワークエンティティは、テーブル(1つ又は複数)をより成るテーブル情報を含む電子文書を受信することのできる文書コンバータを備えている。この点に関して、文書コンバータは、テーブル(1つ又は複数)を、各テーブルの順序に基づくと共に、少なくとも1つのテーブルが少なくとも1つのラベルを含むときに少なくとも1つのラベルにも基づいて、テーブルの直線化された表示へと変換することができる。より詳細には、文書コンバータは、各テーブルが行主体の順序又は列主体の順序のような所定の順序を有するようにテーブル(1つ又は複数)を構成することにより、テーブルを変換することができる。次いで、文書コンバータは、テーブルが少なくとも1つのラベルを含むときに各ラベルをローカライズし、そしてその後、テーブルを、所定の順序を有するように構成されたテーブルと、更に、テーブルが少なくとも1つのラベルを含むときには各ローカライズされたラベルとに基づいて、直線化することができる。   In accordance with one aspect of the present invention, a system for converting table information for rendering to a terminal having a limited area display is provided. The system comprises network entities such as a mobile terminal, origin server, proxy / gateway, short message service center (SMSC), multimedia message service center (MMSC), gateway GPRS service node (GGSN), user processor and the like. The network entity comprises a document converter capable of receiving an electronic document containing table information consisting of table (s). In this regard, the document converter may determine the table line (s) based on the order of each table and also based on at least one label when at least one table includes at least one label. Can be converted into a customized display. More specifically, the document converter may convert the tables by configuring the table (s) so that each table has a predetermined order, such as a row-oriented order or a column-oriented order. it can. The document converter then localizes each label when the table includes at least one label, and then converts the table into a table configured to have a predetermined order, and the table further includes at least one label. When included, it can be linearized based on each localized label.

文書コンバータは、ターミナルがパンをサポートするかどうか決定することができる。ターミナルがパンをサポートしない場合には、文書コンバータは、テーブルを変換するか、又は電子文書を、テーブルを変換せずにターミナル等へ転送するかのいずれかの選択を受け取ることができる。その後、その選択がテーブルの変換を含むときには、文書コンバータがテーブルを変換することができる。   The document converter can determine whether the terminal supports panning. If the terminal does not support panning, the document converter can receive a choice of either converting the table or transferring the electronic document to the terminal or the like without converting the table. Then, when the selection includes table conversion, the document converter can convert the table.

明らかなように、各テーブルは、少なくとも1行及び少なくとも1列に編成された複数のセルを含むことができ、そして通常それを含む。それ故、文書コンバータは、テーブル(1つ又は複数)の自然の順序を識別することによりテーブルを構成し、そしてテーブルが所定の順序以外の自然の順序を有するときには、所定の順序以外の自然の順序を有するテーブルを、各テーブルが所定の順序を有するように構成することができる。文書コンバータは、多数の異なるやり方で自然の順序を決定することができる。例えば、文書コンバータは、テーブルの各セルに対して特性ベクトルを決定し、そして各セルに対する特性ベクトルに基づいて隣接セル間の距離を決定することができる。その後、文書コンバータは、テーブルの同じ行における隣接セル対間の平均距離と、テーブルの同じ列における隣接セル対間の平均距離とを決定することができる。次いで、文書コンバータは、これら平均距離に基づいてテーブルの自然の順序を識別することができる。   As will be apparent, each table can and usually includes a plurality of cells organized in at least one row and at least one column. Therefore, the document converter constructs a table by identifying the natural order of the table (s), and when the table has a natural order other than a predetermined order, A table having an order can be configured such that each table has a predetermined order. The document converter can determine the natural order in a number of different ways. For example, the document converter can determine a characteristic vector for each cell in the table and determine a distance between adjacent cells based on the characteristic vector for each cell. The document converter can then determine the average distance between adjacent cell pairs in the same row of the table and the average distance between adjacent cell pairs in the same column of the table. The document converter can then identify the natural order of the table based on these average distances.

文書コンバータは、同様に、各テーブル内のラベル(1つ又は複数)を多数の異なるやり方でローカライズすることができる。例えば、文書コンバータは、1つ以上のスパンラベル及び/又は1つ以上のダイレクトラベルを識別することができる。明らかなように、各スパンラベルは、テーブルの複数の列又は行に関連され、そして各ダイレクトラベルは、テーブルの単一の列又は行に関連される。スパンラベル又はダイレクトラベルを識別した後に、文書コンバータは、スパンラベル及び/又はダイレクトラベルに関連したテーブルの各セルに対するラベルストリングを決定し、これにより、ラベルが指すテーブルのセルに対して各スパンラベル及び各ダイレクトラベルをローカライズすることができ、各ラベルストリングは、スパンラベル及びダイレクトラベルの少なくとも1つを含む。   The document converter can similarly localize the label (s) in each table in a number of different ways. For example, the document converter can identify one or more span labels and / or one or more direct labels. As will be apparent, each span label is associated with multiple columns or rows of the table, and each direct label is associated with a single column or row of the table. After identifying the span label or direct label, the document converter determines a label string for each cell of the table associated with the span label and / or direct label, thereby each span label for the table cell to which the label points. And each direct label can be localized, and each label string includes at least one of a span label and a direct label.

文書コンバータは、テーブルの隣接行及び隣接列間の類似性の尺度に基づいてダイレクトラベル(1つ又は複数)を識別することができる。例えば、文書コンバータは、隣接行又は列の各対間の類似性の尺度を決定することができる。例えば、文書コンバータは、隣接行又は列の各対の各セルに対する特性ベクトルを決定し、そして同じ列又は行におけるセル間の距離を、各セルに対する特性ベクトルに基づいて各々決定することにより、類似性の尺度を決定することができる。その後、文書コンバータは、隣接行の列又は隣接列の行を横切る距離を加算して、隣接行又は列間の類似性の尺度を各々決定することができる。次いで、類似性の尺度を決定した後に、文書コンバータは、類似性の尺度に基づいて、隣接行又は列の他の対よりも所与パーセンテージ以上異なる隣接行又は列の対を識別することができる。次いで、文書コンバータは、隣接行又は列の識別された対の行又は列を、少なくとも1つのダイレクトラベルを含むものとして各々識別することができる。   The document converter can identify the direct label (s) based on a measure of similarity between adjacent rows and adjacent columns of the table. For example, the document converter can determine a measure of similarity between each pair of adjacent rows or columns. For example, the document converter determines the characteristic vector for each cell in each pair of adjacent rows or columns, and determines the distance between cells in the same column or row based on the characteristic vector for each cell, respectively. A measure of gender can be determined. The document converter can then add the distances across adjacent row columns or adjacent column rows to determine a measure of similarity between adjacent rows or columns, respectively. Then, after determining the similarity measure, the document converter can identify adjacent row or column pairs that differ by a given percentage or more from other pairs of adjacent rows or columns based on the similarity measure. . The document converter can then identify each identified pair of rows or columns of adjacent rows or columns as including at least one direct label.

本発明の他の特徴によれば、少なくとも1つのテーブルより成るテーブル情報を変換するためのターミナル、方法及びコンピュータプログラム製品が提供される。それ故、本発明の実施形態は、少なくとも1つのテーブルより成るテーブル情報を変換するためのシステム及び関連ターミナル、方法及びコンピュータプログラム製品を提供する。本発明の実施形態のシステム及び関連ターミナル、方法及びコンピュータプログラム製品は、移動電話のようなターミナルによりその後にレンダリングするためにテーブルを変換することができる。従来の技術とは対照的に、このシステム及び関連ターミナル、方法及びコンピュータプログラム製品は、ターミナルがテーブルの全コンテンツを与えることができるようにテーブルを変換することができる。更に、このシステム及び関連ターミナル、方法及びコンピュータプログラム製品は、テーブルの最初の構成と一貫したやり方でテーブルをレンダリングできるように、テーブル内のラベルを、各ラベルに関連したセルへローカライズすることができる。それ故、本発明の実施形態のシステム及び関連ターミナル、方法及びコンピュータプログラム製品は、公知技術により示された問題を解消し、付加的な効果を発揮する。   According to another aspect of the present invention, a terminal, method and computer program product for converting table information comprising at least one table are provided. Therefore, embodiments of the present invention provide a system and associated terminal, method and computer program product for converting table information comprising at least one table. The system and associated terminals, methods, and computer program products of embodiments of the present invention can convert tables for subsequent rendering by terminals such as mobile phones. In contrast to the prior art, the system and associated terminals, methods and computer program products can convert tables so that the terminal can provide the full contents of the table. In addition, the system and associated terminals, methods, and computer program products can localize the labels in the table to the cell associated with each label so that the table can be rendered in a manner consistent with the initial configuration of the table. . Therefore, the system and related terminals, methods, and computer program products of the embodiments of the present invention solve the problems shown by the known technology and exert additional effects.

本発明を以上に一般的に述べたが、添付図面を参照して本発明を以下に詳細に説明する。
本発明の好ましい実施形態が示された添付図面を参照して、本発明を以下に詳細に説明する。しかしながら、本発明は、多数の異なる形態で実施することができ、ここに示す実施形態に限定されるものではなく、むしろ、これらの実施形態は、その開示が本発明の概念を当業者に完全に伝えるために記載するものである。全体を通じて同じ要素は同じ参照番号で示す。
Having generally described the invention, the invention will now be described in detail with reference to the accompanying drawings.
The present invention will now be described in detail with reference to the accompanying drawings, in which preferred embodiments of the invention are shown. The present invention may, however, be embodied in many different forms and should not be construed as limited to the embodiments set forth herein; rather, these embodiments will fully convey the concept of the invention to those skilled in the art. It is described to convey to. Like elements are designated by like reference numerals throughout.

図1には、本発明から利益が得られるターミナル及びシステムの1つの形式が示されている。本発明の実施形態のシステム、ターミナル、方法及びコンピュータプログラム製品は、主として、移動通信アプリケーションに関連して説明する。しかしながら、本発明の実施形態のシステム、ターミナル、方法及びコンピュータプログラム製品は、移動通信産業及びそれ以外の産業において種々の他のアプリケーションに関連して使用できることも理解されたい。例えば、本発明の実施形態のシステム、ターミナル、方法及びコンピュータプログラム製品は、ワイヤライン及び/又はワイヤレスネットワーク(例えば、インターネット)アプリケーションに関連して使用することができる。   FIG. 1 illustrates one type of terminal and system that would benefit from the present invention. The systems, terminals, methods and computer program products of embodiments of the present invention will be described primarily in the context of mobile communication applications. However, it should also be understood that the systems, terminals, methods and computer program products of embodiments of the present invention can be used in connection with various other applications in the mobile communications industry and other industries. For example, the systems, terminals, methods, and computer program products of embodiments of the present invention can be used in connection with wireline and / or wireless network (eg, Internet) applications.

図示されたように、ターミナル10は、ベースサイト又はベースステーション(BS)14へ信号を送信し及びそこから信号を受信するためのアンテナ12を備えている。このベースステーションは、ネットワークを動作するのに必要な要素、例えば、移動交換センター(MSC)16を含むセルラーネットワークの一部分である。当業者に明らかなように、セルラーネットワークは、ベースステーション/MSC/インターワーキングファンクション(BMI)とも称される。動作に際し、MSCは、ターミナルがコールを発信し及び受信するときに、ターミナルへ及びターミナルからコールをルーティングすることができる。又、MSCは、ターミナルがコールに参加するときに地上線トランクへの接続を与えることもできる。更に、MSCは、ターミナルへの及びターミナルからのメッセージの転送を制御できると共に、メッセージセンターへの及びそこからのターミナルメッセージの転送、例えば、SMSセンター(SMSC)17への及びそこからのショートメッセージサービス(SMS)メッセージの転送も制御することができる。   As shown, the terminal 10 includes an antenna 12 for transmitting signals to and receiving signals from a base site or base station (BS) 14. This base station is part of a cellular network that includes the elements necessary to operate the network, such as a mobile switching center (MSC) 16. As will be apparent to those skilled in the art, a cellular network is also referred to as a base station / MSC / interworking function (BMI). In operation, the MSC can route calls to and from the terminal as the terminal places and receives calls. The MSC can also provide a connection to the landline trunk when the terminal joins the call. In addition, the MSC can control the transfer of messages to and from the terminal, as well as the transfer of terminal messages to and from the message center, eg, short message service to and from the SMS Center (SMSC) 17. The transfer of (SMS) messages can also be controlled.

MSC16は、ローカルエリアネットワーク(LAN)、メトロポリタンエリアネットワーク(MAN)及び/又はワイドエリアネットワーク(WAN)のようなデータネットワークに接続することができる。MSCは、データネットワークに直接接続することができる。しかしながら、1つの典型的な実施形態では、MSCは、プロキシー18、ゲートウェイ(GTW)等に接続され、そしてプロキシーは、インターネット20のようなWANに接続される。例えば、MSCは、ワイヤレスアプリケーションプロトコル(WAP)GTWに接続することができ、これは、インターネットに接続される。次いで、処理要素のような装置(例えば、パーソナルコンピュータ、サーバーコンピュータ等)を、インターネットを経てターミナル10に接続することができる。例えば、以下に説明するように、処理要素は、原点サーバー22等に関連した1つ以上の処理要素を含むことができ、その1つが図1に示されている。   The MSC 16 can be connected to a data network such as a local area network (LAN), a metropolitan area network (MAN) and / or a wide area network (WAN). The MSC can be directly connected to the data network. However, in one exemplary embodiment, the MSC is connected to a proxy 18, a gateway (GTW), etc., and the proxy is connected to a WAN, such as the Internet 20. For example, the MSC can connect to a Wireless Application Protocol (WAP) GTW, which is connected to the Internet. Devices such as processing elements (eg, personal computers, server computers, etc.) can then be connected to the terminal 10 via the Internet. For example, as described below, the processing elements can include one or more processing elements associated with origin server 22 or the like, one of which is shown in FIG.

又、BS14は、シグナリングGPRS(汎用パケット無線サービス)サポートノード(SGSN)24に接続することもできる。当業者に知られているように、SGSNは、通常、パケット交換サービスに対してMSC16と同様の機能を遂行することができる。SGSNは、MSCと同様に、インターネット20のようなデータネットワークに接続することができる。SGSNは、データネットワークに直接接続することができる。しかしながら、より一般的な実施形態では、SGSNは、GPRSコアネットワーク26のようなパケット交換コアネットワークに接続される。パケット交換コアネットワークは、次いで、別のGTW、例えば、GTW GPRSサポートノード(GGSN)28に接続され、このGGSNがインターネットに接続される。又、GGSNは、メッセージセンター、例えば、マルチメディアメッセージサービス(MMS)センター30に接続することもできる。この点に関して、GGSN及びSGSNは、MSCと同様に、MMSメッセージのようなメッセージの転送を制御することができる。又、GGSN及びSGSNは、メッセージセンターへの及びそこからのターミナルメッセージの転送も制御することができる。   The BS 14 can also be connected to a signaling GPRS (General Packet Radio Service) support node (SGSN) 24. As known to those skilled in the art, an SGSN can typically perform functions similar to MSC 16 for packet switched services. The SGSN can be connected to a data network such as the Internet 20 like the MSC. The SGSN can be directly connected to the data network. However, in a more general embodiment, the SGSN is connected to a packet switched core network such as GPRS core network 26. The packet-switched core network is then connected to another GTW, for example a GTW GPRS support node (GGSN) 28, which is connected to the Internet. The GGSN can also be connected to a message center, such as a multimedia message service (MMS) center 30. In this regard, the GGSN and SGSN can control the forwarding of messages such as MMS messages, similar to the MSC. The GGSN and SGSN can also control the transfer of terminal messages to and from the message center.

更に、SGSN24をGPRSコアネットワーク26及びGGSN28に接続することにより、原点サーバー22のような装置を、インターネット20、SGSN及びGGSNを経てターミナル10へ接続することができる。この点について、原点サーバーのような装置は、SGSN、GPRS及びGGSNを横切ってターミナルと通信することができる。例えば、原点サーバーは、マルチメディアブロードキャストマルチキャストサービス(MBMS)に基づいてターミナルへコンテンツを供給することができる。MBMSの詳細な情報については、参考としてその内容をここに取り上げる「Multimedia Broadcast Multicast Service (MBMS)」と題する第三世代パートナーシッププロジェクト(3GPP)技術仕様書3GPP TS22.146を参照されたい。   Further, by connecting the SGSN 24 to the GPRS core network 26 and the GGSN 28, a device such as the origin server 22 can be connected to the terminal 10 via the Internet 20, SGSN and GGSN. In this regard, a device such as an origin server can communicate with the terminal across SGSN, GPRS, and GGSN. For example, the origin server can supply content to the terminal based on a multimedia broadcast multicast service (MBMS). For detailed information on MBMS, please refer to 3GPP TS 22.146, 3rd Generation Partnership Project (3GPP) Technical Specification entitled “Multimedia Broadcast Multicast Service (MBMS)”, the contents of which are hereby incorporated by reference.

ターミナル10は、更に、1つ以上のワイヤレスアクセスポイント(AP)32に接続することができる。APは、例えば、WLAN技術を含む高周波(RF)、ブルーツース(BT)、赤外線(IrDA)又は多数の異なるワイヤレスネットワーク技術のような技術に基づいてターミナルと通信するように構成されたアクセスポイントである。それに加えて又はそれとは別に、ターミナルは、1つ以上のユーザプロセッサ34に接続することができる。各ユーザプロセッサは、パーソナルコンピュータ、ラップトップコンピュータ等のコンピュータシステムを含むことができる。この点に関して、ユーザプロセッサは、LAN及び/又はWLAN技術を含むRF、BT、IrDA又は多数の異なるワイヤライン又はワイヤレス通信技術のような技術に基づいてターミナルと通信するように構成することができる。それに加えて又はそれとは別に、ユーザプロセッサの1つ以上は、コンテンツを記憶することのできる取り外し可能なメモリを含むことができ、コンテンツは、その後、ターミナルへ転送することができる。   Terminal 10 may further connect to one or more wireless access points (APs) 32. An AP is an access point configured to communicate with a terminal based on technologies such as, for example, radio frequency (RF), including WLAN technology, Bluetooth (BT), infrared (IrDA), or a number of different wireless network technologies. . In addition or alternatively, the terminal may be connected to one or more user processors 34. Each user processor may include a computer system such as a personal computer or a laptop computer. In this regard, the user processor can be configured to communicate with the terminal based on technologies such as RF, BT, IrDA or many different wireline or wireless communication technologies including LAN and / or WLAN technologies. In addition or alternatively, one or more of the user processors can include a removable memory that can store the content, which can then be transferred to the terminal.

AP32及びユーザプロセッサ34は、インターネット20に接続することができる。MSC16と同様に、AP及びユーザプロセッサは、インターネットに直結することができる。しかしながら、1つの効果的な実施形態では、APは、プロキシー18を経てインターネットに間接的に接続される。明らかなように、ターミナル及び原点サーバー22、並びに多数の他の装置のいずれかをインターネットに直接的又は間接的に接続することにより、ターミナルは、互いに、且つ原点サーバー等と通信して、ターミナルの種々の機能を果たすことができ、例えば、原点サーバーへデータ、コンテンツ等を送信し及び/又は原点サーバーからコンテンツ、データ等を受信することができる。ここで使用する「データ」、「コンテンツ」、「情報」及び同様の用語は、本発明の実施形態に基づいて送信、受信及び/又は記憶することのできるデータを指すように交換可能に使用することができる。従って、このような用語の使用は、本発明の精神及び範囲を限定するものではない。   The AP 32 and the user processor 34 can be connected to the Internet 20. Similar to the MSC 16, the AP and user processor can be directly connected to the Internet. However, in one effective embodiment, the AP is indirectly connected to the Internet via the proxy 18. As will be apparent, by connecting the terminal and origin server 22 and any of a number of other devices directly or indirectly to the Internet, the terminals communicate with each other and with the origin server, etc. Various functions can be performed, for example, data, content, etc. can be sent to and / or received from the origin server. As used herein, “data”, “content”, “information” and like terms are used interchangeably to refer to data that can be transmitted, received and / or stored in accordance with embodiments of the present invention. be able to. Accordingly, the use of such terms does not limit the spirit and scope of the present invention.

図2には、ネットワークエンティティ、例えば、ターミナル10、原点サーバー22、プロキシー18、SMSC17、MMSC30、GGSN28及び/又はユーザプロセッサ34として動作することのできるネットワークエンティティのブロック図が、本発明の一実施形態に基づいて示されている。個別のエンティティとして示されているが、ある実施形態では、論理的に分離されるがエンティティ内に共通配置されるターミナル、プロキシー、原点サーバー及び/又はユーザプロセッサの1つ以上を1つ以上のエンティティでサポートしてもよい。例えば、論理的に別々であるが共通配置されたターミナル及びプロキシーを単一のエンティティでサポートすることができる。又、例えば、論理的に別々であるが共通配置された原点サーバー及びユーザプロセッサを単一のエンティティでサポートすることもできる。   FIG. 2 illustrates a block diagram of a network entity that can operate as a network entity, eg, terminal 10, origin server 22, proxy 18, SMSC 17, MMSC 30, GGSN 28, and / or user processor 34, according to an embodiment of the present invention. Based on. Although shown as separate entities, in some embodiments, one or more of one or more of a terminal, proxy, origin server and / or user processor that are logically separated but co-located within the entity May be supported. For example, logically separate but co-located terminals and proxies can be supported by a single entity. It is also possible, for example, to support logically separate but co-located origin servers and user processors with a single entity.

図示されたように、ネットワークエンティティは、一般に、メモリ38に接続されたプロセッサ36を含むことができる。又、プロセッサは、少なくとも1つのインターフェイス40や、データ、コンテンツ等を送信及び/又は受信するための他の手段にも接続することができる。メモリは、揮発性及び/又は不揮発性メモリであり、通常、コンテンツ、データ等を記憶する。例えば、メモリは、通常、本発明の実施形態に基づきエンティティの動作に関連したステップを実行するためにプロセッサに対するソフトウェアアプリケーション、命令等を記憶する。更に、以下に述べるように、メモリは、ターミナル10によりレンダリングするためにテーブル情報を変換することのできる文書コンバータを記憶することもできる。又、例えば、メモリは、別のネットワークエンティティのようなネットワークエンティティから送信されるか又はそれにより受信されるコンテンツを記憶することもできる。   As shown, the network entity may generally include a processor 36 connected to memory 38. The processor can also be connected to at least one interface 40 and other means for transmitting and / or receiving data, content, etc. The memory is a volatile and / or nonvolatile memory, and usually stores content, data, and the like. For example, the memory typically stores software applications, instructions, etc. for the processor to perform steps related to the operation of the entity in accordance with embodiments of the present invention. Further, as described below, the memory can also store a document converter that can convert table information for rendering by the terminal 10. For example, the memory may also store content that is transmitted from or received by a network entity, such as another network entity.

図3は、本発明の実施形態に基づきターミナル10として動作することのできる移動ステーションの機能図である。図示して以下に説明する移動ステーションは、本発明から利益が得られるターミナルの一形式を単に例示するものに過ぎず、それ故、本発明の範囲を何ら限定するものではないことを理解されたい。移動ステーションの多数の実施形態を図示して以下に説明するが、ポータブルデジタルアシスタント(PDA)、ページャー、ラップトップコンピュータのような他の形式の移動ステーション、並びに他の形式の音声及びテキスト通信システムも、本発明を容易に使用することができる。   FIG. 3 is a functional diagram of a mobile station that can operate as a terminal 10 according to an embodiment of the present invention. It should be understood that the mobile station shown and described below is merely illustrative of one type of terminal that would benefit from the present invention and therefore does not limit the scope of the invention in any way. . Many embodiments of mobile stations are illustrated and described below, but other types of mobile stations such as portable digital assistants (PDAs), pagers, laptop computers, and other types of voice and text communication systems are also available. The present invention can be easily used.

移動ステーションは、送信器42と、受信器44と、これら送信器及び受信器へ信号を供給すると共にそこから信号を受信するコントローラ46のようなプロセッサとを備えている。これらの信号は、適用可能なセルラーシステムのエアインターフェイス規格に基づくシグナリング情報と、ユーザスピーチ及び/又はユーザ発生データも含む。この点に関して、移動ステーションは、1つ以上のエアインターフェイス規格、通信プロトコル、変調形式及びアクセス形式で動作することができる。より詳細には、移動ステーションは、多数の第一世代(1G)、第二世代(2G)、2.5G及び/又は第三世代(3G)通信プロトコル等のいずれかに基づいて動作することができる。例えば、移動ステーションは、2Gワイヤレス通信プロトコルIS−136(TDMA)、GSM及びIS−95(CDMA)に基づいて動作することができる。又、例えば、移動ステーションは、2.5Gワイヤレス通信プロトコルGPRS、エンハンストデータGSMエンビロンメント(EDGE)等に基づいて動作することもできる。それに加えて又はそれとは別に、移動ステーションは、DVB技術(例えば、DVB−T、ETSI規格EN300 744)のような多数の異なるデジタルブロードキャスティング技術のいずれかに基づいて動作することもできる。又、移動ステーションは、MBMS技術(例えば、3GPP TS22.146)のような多数の異なるブロードキャスト及び/又はマルチキャスト技術のいずれかに基づいて動作することもできる。更に、移動ステーションは、ISDB−T、DAB、ATSC技術等に基づいて動作することもできる。ある狭帯域AMPS(NAMPS)並びにTACS移動ステーションも、二重又はそれ以上のモードの移動ステーション(例えば、デジタル/アナログ又はTDMA/CDMAアナログ電話)と同様に、本発明の実施形態から利益を得ることができる。   The mobile station includes a transmitter 42, a receiver 44, and a processor such as a controller 46 that provides signals to and receives signals from these transmitters and receivers. These signals also include signaling information based on applicable cellular system air interface standards and user speech and / or user generated data. In this regard, the mobile station can operate with one or more air interface standards, communication protocols, modulation types, and access types. More specifically, the mobile station may operate based on any of a number of first generation (1G), second generation (2G), 2.5G and / or third generation (3G) communication protocols, etc. it can. For example, the mobile station can operate based on 2G wireless communication protocols IS-136 (TDMA), GSM and IS-95 (CDMA). Also, for example, the mobile station can operate based on 2.5G wireless communication protocol GPRS, Enhanced Data GSM Environment (EDGE), etc. In addition or alternatively, the mobile station may operate based on any of a number of different digital broadcasting technologies such as DVB technology (eg, DVB-T, ETSI standard EN300 744). A mobile station may also operate based on any of a number of different broadcast and / or multicast technologies such as MBMS technology (eg, 3GPP TS 22.146). Furthermore, the mobile station can also operate based on ISDB-T, DAB, ATSC technology, etc. Certain narrowband AMPS (NAMPS) as well as TACS mobile stations can benefit from embodiments of the present invention as well as dual or higher mode mobile stations (eg, digital / analog or TDMA / CDMA analog telephones). Can do.

コントローラ46は、移動ステーションの音声及びロジック機能を実施するのに必要な回路を含む。例えば、コントローラは、デジタル信号プロセッサ装置、マイクロプロセッサ装置、並びに種々のアナログ/デジタルコンバータ、デジタル/アナログコンバータ及び他のサポート回路で構成される。移動ステーションの制御及び信号処理機能は、それらの各能力に基づいてこれらの装置間に割り当てられる。従って、コントローラは、変調及び送信の前にメッセージ及びデータを畳み込み式にエンコード及びインターリーブする機能も含む。コントローラは、更に、内部音声コーダ(VC)46Aを含むことができ、そして内部データモデム(DM)46Bを含んでもよい。更に、コントローラは、メモリに記憶できる1つ以上のソフトウェアアプリケーションを動作する機能を含んでもよい。   The controller 46 includes the circuitry necessary to perform the voice and logic functions of the mobile station. For example, the controller comprises a digital signal processor device, a microprocessor device, and various analog / digital converters, digital / analog converters and other support circuits. Mobile station control and signal processing functions are allocated between these devices based on their respective capabilities. Thus, the controller also includes the ability to convolutionally encode and interleave messages and data prior to modulation and transmission. The controller may further include an internal voice coder (VC) 46A and may include an internal data modem (DM) 46B. Further, the controller may include functionality for operating one or more software applications that can be stored in memory.

又、移動ステーションは、従来のイアホン又はスピーカ48、リンガー50、マイクロホン52、ディスプレイ54及びユーザ入力インターフェイスを含むユーザインターフェイスも備えており、これらは全てコントローラ46に接続される。移動ステーションがデータを受信できるようにするユーザ入力インターフェイスは、移動ステーションがデータを入力できるようにする多数の装置、例えば、キーパッド56、タッチディスプレイ(図示せず)又は他の入力装置のいずれかを含むことができる。キーパッドを含む実施形態では、キーパッドは、従来の数字キー(0−9)及び関連キー(#、*)と、移動ステーションを動作するのに使用される他のキーとを備えている。   The mobile station also includes a user interface including a conventional earphone or speaker 48, a ringer 50, a microphone 52, a display 54, and a user input interface, all connected to the controller 46. The user input interface that allows the mobile station to receive data is any of a number of devices that allow the mobile station to input data, such as a keypad 56, a touch display (not shown), or other input device. Can be included. In embodiments that include a keypad, the keypad comprises conventional numeric keys (0-9) and associated keys (#, *) and other keys used to operate the mobile station.

又、移動ステーションは、多数の異なるワイヤライン及び/又はワイヤレス技術のいずれかに基づいて、別のターミナル10、プロキシー18、原点サーバー22、AP32、ユーザプロセッサ24等の電子装置からデータを得及び/又はそれを共用するための1つ以上の手段を含むことができる。例えば、移動ステーションは、これが高周波及び/又は赤外線技術に基づいてデータを得及び/又はデータを共用できるように高周波(RF)トランシーバ58及び/又は赤外線(IR)トランシーバ60を含むことができる。又、例えば、移動ステーションは、これがブルーツース転送技術に基づいてデータを得及び/又はデータを共用できるようにブルーツース(BT)トランシーバ62を含むことができる。図示されていないが、移動ステーションは、それに加えて又はそれとは別に、LAN及び/又はWLAN技術を含む多数の異なるワイヤライン及び/又はワイヤレスネットワーク技術に基づいて電子装置へデータを送信し及び/又はそこからデータを受信することもできる。   The mobile station can also obtain and / or obtain data from electronic devices such as another terminal 10, proxy 18, origin server 22, AP 32, user processor 24, etc., based on any of a number of different wirelines and / or wireless technologies. Or it may include one or more means for sharing it. For example, the mobile station can include a radio frequency (RF) transceiver 58 and / or an infrared (IR) transceiver 60 so that it can acquire and / or share data based on radio frequency and / or infrared technology. Also, for example, the mobile station can include a Bluetooth (BT) transceiver 62 so that it can obtain and / or share data based on Bluetooth transfer technology. Although not shown, the mobile station may additionally or alternatively send data to the electronic device based on a number of different wireline and / or wireless network technologies, including LAN and / or WLAN technologies, and / or Data can also be received from there.

更に、移動ステーションは、通常、移動加入者に関連した情報エレメントを記憶する加入者認識モジュール(SIM)64、取り外し可能なユーザ認識モジュール(R−UIM)等のメモリを含むことができる。SIMに加えて、移動ステーションは、他のメモリを含むことができる。この点に関して、移動ステーションは、揮発性メモリ66及び/又は他の不揮発性メモリ68を含むことができ、これは、埋め込むこともできるし及び/又は取り外し可能であってもよい。例えば、他の不揮発性メモリは、埋め込まれた又は取り外し可能なマルチメディアメモリカード(MMC)、メモリスティック、EEPROM、フラッシュメモリ、ハードディスク等を含むことができる。   In addition, the mobile station can typically include a memory, such as a subscriber identity module (SIM) 64, a removable user identity module (R-UIM), which stores information elements associated with the mobile subscriber. In addition to the SIM, the mobile station can include other memories. In this regard, the mobile station can include volatile memory 66 and / or other non-volatile memory 68, which can be embedded and / or removable. For example, other non-volatile memories can include embedded or removable multimedia memory cards (MMC), memory sticks, EEPROM, flash memory, hard disks, and the like.

メモリ64、66、68は、移動ステーションの機能を実施するために移動ステーションにより使用される情報及びデータの多数の断片を記憶することもできる。例えば、メモリは、MSC16に対して移動ステーションを独特に識別することのできる国際移動装置識別(IMEI)コード、国際移動加入者識別(IMSI)コード、移動ステーションサービス総合デジタル網(MSISDN)コード等の識別子を記憶することができる。又、メモリは、原点サーバー22及び/又はユーザプロセッサ34から受け取られるようなコンテンツも記憶することができる。又、例えば、メモリは、従来のテキストビューア、音声プレーヤ、映像プレーヤ、マルチメディアビューア等の1つ以上のプレゼンテーションアプリケーションを記憶することもできる。更に、以下に述べるように、メモリは、移動ステーションによりレンダリングするためのテーブル情報を変換することのできる文書コンバータを記憶することもできる。   Memories 64, 66, 68 may also store multiple pieces of information and data used by the mobile station to perform the functions of the mobile station. For example, the memory may include an International Mobile Equipment Identification (IMEI) code, an International Mobile Subscriber Identification (IMSI) code, a Mobile Station Services Integrated Digital Network (MSISDN) code, etc. that can uniquely identify the mobile station to the MSC 16. An identifier can be stored. The memory may also store content such as received from origin server 22 and / or user processor 34. Also, for example, the memory can store one or more presentation applications such as a conventional text viewer, audio player, video player, multimedia viewer, and the like. Further, as described below, the memory can also store a document converter that can convert table information for rendering by the mobile station.

背景技術で説明したように、ターミナル10は、一般に、ターミナルの表示エリア、解像度及びレンダリング能力に限度があるために、電子文書を、その文書が最初に構成された通りにレンダリングすることができない。例えば、多くのターミナルが、通常、ディスプレイ(例えばディスプレイ54)にレンダリングできるのは、数行のテキストと、グレースケール像又はサムネールサイズ像又は全く像のない状態に過ぎない。この点に関して、ターミナルは、一般に、電子文書のテーブル情報を、そのテーブル情報が最初に構成された通りにレンダリングすることができない。例えば、ある従来の装置は、このようなテーブル情報を削除する。他の装置は、テーブルの選択された列(1つ又は複数)を切除するか、又はテーブルの機械的な直線化を実行し、通常、テーブル内のセルのコンテンツの自然の順序を無視してテーブルの各セルを独立してレンダリングする。更に別の装置は、全テーブルの部分的ビューポートだけをレンダリングし、装置のユーザがテーブル内のビューポートを例えば左から右へ移動し、ひいては、テーブルの異なる部分を露呈することを必要とする。   As described in the background art, terminal 10 is generally unable to render an electronic document as it was originally configured due to limitations in terminal display area, resolution, and rendering capabilities. For example, many terminals can usually render on a display (eg, display 54) with only a few lines of text and a grayscale or thumbnail size image or no image at all. In this regard, the terminal is generally unable to render the table information of the electronic document as it was originally configured. For example, some conventional devices delete such table information. Other devices either excise the selected column (s) of the table or perform a mechanical linearization of the table, usually ignoring the natural order of the contents of the cells in the table Render each table cell independently. Yet another device renders only a partial viewport of the entire table, requiring the user of the device to move the viewport in the table, for example from left to right, thus exposing a different portion of the table. .

それ故、本発明の実施形態は、表示エリア、解像度及び/又はレンダリング能力に限度のあるディスプレイを有するターミナルによりレンダリングするために電子文書を変換することができる。より詳細には、本発明の実施形態は、このようなターミナルによりレンダリングするために電子文書のテーブル情報を変換することができる。それ故、このようなターミナルにテーブルをレンダリングする従来の技術とは対照的に、本発明の実施形態は、このようなテーブルの1つ以上の選択された列を切除するのではなく、テーブル内のセルのコンテンツの自然の順序を無視してテーブルの各セルをレンダリングすることによりテーブルの機械的直線化を実行するのではなく、且つ全テーブルの部分的ビューポートだけをレンダリングして、装置のユーザがビューポートを移動するのを必要とするのではなく、このようなテーブルの全コンテンツをレンダリングすることができる。   Thus, embodiments of the present invention can convert an electronic document for rendering by a terminal having a display with limited display area, resolution, and / or rendering capabilities. More particularly, embodiments of the present invention can convert table information of an electronic document for rendering by such a terminal. Thus, in contrast to conventional techniques for rendering a table in such a terminal, embodiments of the present invention do not cut one or more selected columns of such a table, but instead in the table. Rather than performing a mechanical linearization of the table by rendering each cell of the table ignoring the natural order of the contents of the cells, and rendering only a partial viewport of the entire table, Rather than requiring the user to move the viewport, the entire contents of such a table can be rendered.

本発明の実施形態によれば、電子文書のテーブル情報は、一般に、データ、情報等のコンテンツの二次元マトリクスを各々カプセル化する1つ以上のテーブルを備えている。当業者に明らかなように、このような二次元のテーブルは、一般に、少なくとも1つの行及び少なくとも1つの列を含む。又、このようなテーブルは、複雑な構造(例えば、ネスト状のテーブル又は映像)を含んでもよいが、通常は含まない。更に、このようなテーブルの行(1つ又は複数)と列(1つ又は複数)との間には、通常、シンタクチック及びセマンチックの両コヒレンスの高いレベルが存在する。   According to an embodiment of the present invention, the table information of an electronic document generally comprises one or more tables each encapsulating a two-dimensional matrix of content such as data, information, etc. As will be apparent to those skilled in the art, such a two-dimensional table typically includes at least one row and at least one column. Also, such a table may include a complex structure (eg, a nested table or video), but usually does not. In addition, there is typically a high level of both syntactic and semantic coherence between the row (s) and column (s) of such a table.

図4及び5について説明する。これらは、各々、プロキシー18の機能的ブロック図、及び本発明の一実施形態に基づき電子文書のテーブル情報を変換する方法のフローチャートである。より詳細には、図4は、本発明の1つの効果的な実施形態に基づき、ターミナル10、原点サーバー22、SMSC17、MMSC30、GGSN28、ユーザプロセッサ34等のコンテンツソース100から電子文書を受け取りそしてその後に転送するプロキシーの機能的ブロック図である。しかしながら、電子文書を転送する前に、プロキシーは、文書コンバータ102を動作することができ、この文書コンバータは、電子文書を受け取り、その後、ターミナル10によりレンダリングするために文書のテーブル情報を変換することができる。次いで、プロキシーは、変換されたテーブル情報を含む電子文書をターミナルへ転送し、ターミナル、又はより詳細には、ターミナルのディスプレイ(例えばディスプレイ56)によりレンダリングする。   4 and 5 will be described. These are respectively a functional block diagram of the proxy 18 and a flowchart of a method for converting table information of an electronic document according to an embodiment of the present invention. More specifically, FIG. 4 illustrates an electronic document received from a content source 100 such as terminal 10, origin server 22, SMSC 17, MMSC 30, GGSN 28, user processor 34, and the like, and thereafter, according to one advantageous embodiment of the present invention. It is a functional block diagram of the proxy forwarded to. However, prior to transferring the electronic document, the proxy can operate the document converter 102, which receives the electronic document and then converts the table information of the document for rendering by the terminal 10. Can do. The proxy then transfers the electronic document containing the converted table information to the terminal and renders it on the terminal, or more specifically on the terminal display (eg, display 56).

プロキシー18は、図示して説明する文書コンバータ102を動作するが、この文書コンバータは、例えば、ターミナル10自体又はコンテンツソース100を含むシステム内の多数の異なるネットワークエンティティのどれからでも動作できることを理解されたい。この点について、文書コンバータは、単一ネットワークエンティティにおいて実施することもできるし、或いは文書コンバータの各部分を2つ以上のネットワークエンティティにおいて実施することもできる。又、ここに述べるように、文書コンバータは、通常、メモリ(例えばメモリ38)に記憶してプロセッサ(例えばプロセッサ36)により動作できるソフトウェアで構成される。しかしながら、文書コンバータは、本発明の精神及び範囲から逸脱せずに、ファームウェア又はハードウェアで構成されてもよいことを理解されたい。更に、文書コンバータは、ターミナルによる電子文書のレンダリングを容易にするためにテーブルの変換以外のオペレーションを電子文書に対して実行できることを理解されたい。種々のこのようなオペレーションについての詳細な情報は、例えば、参考としてその内容をここに援用する2001年5月8日に出願された「Reorganizing Content of an Electronic Document」と題する米国特許出願第09/851,404号で、2003年3月6日に米国特許出願公告第2003/0046318号として公告されたものを参照されたい。   The proxy 18 operates the document converter 102 shown and described, but it will be understood that the document converter can operate from any of a number of different network entities in the system including, for example, the terminal 10 itself or the content source 100. I want. In this regard, the document converter can be implemented in a single network entity, or each part of the document converter can be implemented in more than one network entity. In addition, as described herein, the document converter is usually composed of software that can be stored in a memory (eg, memory 38) and operated by a processor (eg, processor 36). However, it should be understood that the document converter may be configured in firmware or hardware without departing from the spirit and scope of the present invention. Further, it should be understood that the document converter can perform operations on the electronic document other than table conversion to facilitate rendering of the electronic document by the terminal. Detailed information on various such operations can be found, for example, in US patent application Ser. No. 09/09, filed “Reorganizing Content of an Electronic Document” filed May 8, 2001, the contents of which are incorporated herein by reference. No. 851,404, published March 6, 2003 as US Patent Application Publication No. 2003/0046318.

図5のブロック104に示されたように、少なくとも1つのテーブルを含むテーブル情報を変換する方法は、コンテンツソース100から電子文書を受け取る文書コンバータ102を備えている。本発明の実施形態によれば、電子文書は、1つ以上のテーブルを含み、そして各テーブルは、コンテンツの少なくとも1つの行と、コンテンツの少なくとも1つの列とを含む。電子文書は、多数の異なるフォーマットのいずれかをとることができる。例えば、電子文書は、ハイパーテキスト転送プロトコル(HTTP)文書、e−メール文書、ポータブルドキュメントフォーマット(PDF)文書、ポストスクリプト文書、ASCIIテキストフォーマット(TXT)文書、拡張可能なマークアップ言語(XML)文書、Microsoft Word(登録商標)(DOC)文書、Microsoft Excel(登録商標)(XLS)文書等を含む。   As shown in block 104 of FIG. 5, a method for converting table information including at least one table comprises a document converter 102 that receives an electronic document from a content source 100. According to an embodiment of the present invention, an electronic document includes one or more tables, and each table includes at least one row of content and at least one column of content. Electronic documents can take any of a number of different formats. For example, an electronic document may be a hypertext transfer protocol (HTTP) document, an e-mail document, a portable document format (PDF) document, a postscript document, an ASCII text format (TXT) document, an extensible markup language (XML) document. , Microsoft Word (registered trademark) (DOC) documents, Microsoft Excel (registered trademark) (XLS) documents, and the like.

電子文書を受信した後に、文書コンバータ102は、ブロック106に示すように、電子文書を、電子文書の中間データ構造表示へと変換することができる。文書コンバータは、多数の異なるやり方のいずれかで電子文書を変換して、電子文書を表わすことのできる多数の異なる中間データ構造体のいずれかを発生することができる。この点について、文書コンバータは、電子文書を、電子文書の共通の内部ツリーベース表示より成る中間データ構造体へと変換することができる。例えば、文書コンバータは、電子文書を、電子文書の拡張可能なハイパーテキストマークアップ言語(XHTML)ドキュメントオブジェクトモデル(DOM)表示へと変換することができる。   After receiving the electronic document, document converter 102 may convert the electronic document into an intermediate data structure representation of the electronic document, as shown at block 106. The document converter can convert an electronic document in any of a number of different ways to generate any of a number of different intermediate data structures that can represent the electronic document. In this regard, the document converter can convert an electronic document into an intermediate data structure consisting of a common internal tree-based representation of the electronic document. For example, a document converter can convert an electronic document into an extensible hypertext markup language (XHTML) document object model (DOM) representation of the electronic document.

文書コンバータ102は、電子文書を、多数の異なるやり方でXHTML DOMデータ構造体へと変換することができる。一実施形態では、例えば、データコンバータは、電子文書をHTML文書へ変換し(まだHTML文書でない場合)、次いで、HTML文書をXHTML文書へ変換し、そしてその後、XHTML文書をXHTML DOMデータ構造体へと変換することにより、電子文書を変換する。電子文書を上記フォーマットの文書へ変換して、XHTML DOMデータ構造体を発生するために、文書コンバータは、多数の異なる既知の変換ルーチンのいずれかを実行することができる。   Document converter 102 can convert an electronic document into an XHTML DOM data structure in a number of different ways. In one embodiment, for example, the data converter converts the electronic document to an HTML document (if not already an HTML document), then converts the HTML document to an XHTML document, and then converts the XHTML document to an XHTML DOM data structure. To convert the electronic document. In order to convert an electronic document to a document of the above format and generate an XHTML DOM data structure, the document converter can execute any of a number of different known conversion routines.

それに加えて又はそれとは別に、文書コンバータ102は、プロキシー18又は別のネットワークエンティティで動作している別のソフトウェア、ハードウェア又はファームウェアモジュールと通信することができ、ここで、他のモジュールは、文書コンバータが電子文書をXHTML DOMデータ構造体へ変換するのを助けるために1つ以上の変換ルーチンを実行することができる。例えば、文書コンバータは、wvWareプロジェクトのもとで開発されたwvWareソフトウェアパッケージと通信して、DOC文書をHTML文書へと変換することができる。又、例えば、文書コンバータは、Chicagoプロジェクトのもとで開発されたxlHtmlソフトウェアパッケージと通信して、XLS文書をHTML文書へ変換することができる。次いで、例えば、文書コンバータは、Tidyプロジェクトのもとで開発されたHTML Tidyソフトウェアパッケージと通信して、HTML文書をXHTML文書へ変換することができる。   In addition or alternatively, the document converter 102 can communicate with another software, hardware or firmware module running on the proxy 18 or another network entity, where the other module is a document One or more conversion routines can be executed to help the converter convert the electronic document to an XHTML DOM data structure. For example, a document converter can communicate with a wvWare software package developed under the wvWare project to convert a DOC document into an HTML document. Also, for example, a document converter can communicate with an xlHTML software package developed under the Chicago project to convert an XML document to an HTML document. Then, for example, the document converter can communicate with an HTML Tidy software package developed under the Tidy project to convert the HTML document to an XHTML document.

更に、例えば、文書コンバータ102は、Xerces XMLパーズソフトウェアパッケージ(Apache XMLプロジェクトのもとで開発された)のようなXMLパーザーと通信して、XHTML文書をXHTML DOMデータ構造体へと変換することができる。文書コンバータが、電子文書を、その電子文書を表わすデータ構造体へといかに変換するかに拘らず、データ構造体は、文書コンバータ及び電子文書が通常存在する不揮発性メモリではなく、揮発性メモリに記憶することができるが、そうである必要はない。明らかなように、データ構造体は、通常、基礎となるHTML文書のタグをベースとする変換されたXHTML文書のタグに対応する多数のノードを含む。例えば、HTML文書に対する次のソースコードについて考える。
<html>
<body>
<img src=“http://www.domain.com/img/image.gif”/>
<table>
<tr>
<td> This is the first cell </td>
<td> <img src=”http://www.domain.com/img/image2.gif”/></td>
<td> This is the third cell </td>
</tr>
<tr>
<td> This is the fourth cell </td>
<td> <img src=”http://www.domain.com/img/image3.gif”/></td>
<td> This is the sixth cell </td>
</tr>
</table>
<small>
A text block
</small>
</body>
</html>
Further, for example, the document converter 102 may communicate with an XML parser, such as the Xerces XML Parse software package (developed under the Apache XML project), to convert an XHTML document into an XHTML DOM data structure. it can. Regardless of how the document converter converts an electronic document into a data structure that represents the electronic document, the data structure is stored in volatile memory, not in the non-volatile memory in which the document converter and electronic document normally reside. You can remember, but it doesn't have to be. As will be apparent, the data structure typically includes a number of nodes corresponding to the tags of the transformed XHTML document based on the tags of the underlying HTML document. For example, consider the following source code for an HTML document.
<html>
<body>
<img src = “http://www.domain.com/img/image.gif” />
<table>
<tr>
<td> This is the first cell </ td>
<td><img src = ”http://www.domain.com/img/image2.gif” /></td>
<td> This is the third cell </ td>
</ tr>
<tr>
<td> This is the fourth cell </ td>
<td><img src = ”http://www.domain.com/img/image3.gif” /></td>
<td> This is the sixth cell </ td>
</ tr>
</ table>
<small>
A text block
</ small>
</ body>
</ html>

上記ソースコードで示されたように、HTML文書は、2行3列のテーブルを含み、各行の第2列が像を含む。又、HTML文書は、第3の像と、小さなフォントのテキストのブロックも含む。このようなHTML文書から、文書コンバータは、図6に示すようなXHTML DOMデータ構造体を発生することができる。   As shown in the source code above, the HTML document includes a 2 × 3 table, and the second column of each row includes an image. The HTML document also includes a third image and a small font block of text. From such an HTML document, the document converter can generate an XHTML DOM data structure as shown in FIG.

文書コンバータ102が電子文書を、電子文書の中間データ構造体表示へいかに変換するかに拘らず、文書コンバータが電子文書をその中間データ構造体へと変換するとき又は変換した後に、文書コンバータは、図5のブロック108に示すように、中間データ構造体内の「暗示的」テーブルを識別することができる。明らかなように、電子文書のフォーマットにおいて、例えば、HTML文書のタグ(即ち“<table></table>”)で識別されるテーブルの場合に、文書コンバータは、通常、このようなテーブルを特に識別する必要はない。しかしながら、他のテーブルの場合は、電子文書は、情報がテーブル形態でレンダリングされるが、テーブルのような情報のフォーマット構成を含まないように構成される。文書コンバータは、このような「暗示的」テーブルを識別することができ、ここで、暗示的テーブルは、通常、文書コンバータが電子文書をデータ構造体へと変換した後にデータ構造体のテーブルノードにより表示されない。その後、文書コンバータは、データ構造体を、このようなテーブルに対するテーブルノードを含むように再公式化することができる。   Regardless of how the document converter 102 converts an electronic document into an intermediate data structure representation of the electronic document, when the document converter converts or converts the electronic document into the intermediate data structure, the document converter As shown in block 108 of FIG. 5, an “implicit” table in the intermediate data structure may be identified. Obviously, in the format of an electronic document, for example, in the case of a table identified by an HTML document tag (ie, “<table> </ table>”), the document converter usually makes such a table especially There is no need to identify. However, in the case of other tables, the electronic document is configured such that the information is rendered in table form, but does not include a format configuration of information such as a table. The document converter can identify such an “implicit” table, where the implicit table is usually defined by the table node of the data structure after the document converter converts the electronic document into a data structure. Do not show. The document converter can then reformulate the data structure to include a table node for such a table.

例えば、TXT文書内の次のASCIIフォーマットテキストについて考える。
アクティビティ カロリー/時
エアロビクス 660
バスケットボール 550
ランニング 925
テニス 450
視覚的に、上記ASCIIフォーマットテキストは、明確にテーブルを表わしている。しかしながら、TXTフォーマットは、テーブルのようなテキストを明示的に示すためのメカニズム(例えば、タグ)を含まない。このようなTXT文書をデータ構造体へと変換するために文書コンバータにより使用される技術に基づいて、文書コンバータは、このようなテキストブロックをテーブルとして認識する。しかしながら、種々の他のインスタンスにおいて、文書コンバータ102は、このようなテキストブロックをテーブルとして認識しないことがある。このようなインスタンスでは、文書は、図7Aに示すようなデータ構造体を発生することができる。図示されたように、このデータ構造体は、テキストを、未構成テキストのブロックとして識別する。従って、文書コンバータは、電子文書が、電子文書の変換中に文書コンバータにより認識されない暗示的テーブルを含むか又はデータ構造体のテーブルノードとして表わされた暗示的テーブルを含むようなインスタンスにおいて、暗示的テーブルも識別することができる。
For example, consider the following ASCII format text in a TXT document.
Activity Calories / hour Aerobics 660
Basketball 550
Running 925
Tennis 450
Visually, the ASCII format text clearly represents a table. However, the TXT format does not include a mechanism (eg, a tag) for explicitly indicating text such as a table. Based on the technique used by the document converter to convert such a TXT document into a data structure, the document converter recognizes such a text block as a table. However, in various other instances, the document converter 102 may not recognize such a text block as a table. In such instances, the document can generate a data structure as shown in FIG. 7A. As shown, this data structure identifies the text as a block of unstructured text. Thus, the document converter is implicit in instances where the electronic document includes an implicit table that is not recognized by the document converter during the conversion of the electronic document, or includes an implicit table represented as a table node in the data structure. The target table can also be identified.

文書コンバータ102は、専用パーザー及び自動学習技術によるものを含む多数の異なる既知のやり方のいずれかで暗示的テーブルを識別することができる。暗示的テーブルを識別するための多数の既知の技術の例については、参考としてその全ての内容をここに取り上げるジアニング・ヒュー氏等の「A System of Understanding and Reformulating Tables, Fourth ICPR WORKSHOP ON DOCUMENT ANALYSIS SYSTEM (2000); Mathew Hurst & Shona Douglas, Layout and Language: Preliminary Investigations in Recognizing the Structure of Tables, PROCEEDINGS OF THE INTERNATIONAL CONFERENCE ON DOCUMENT ANALYSIS AND RECOGNITION (ICDAR) 1043-1047 (1997);及びウィ・ツー・ング氏等の「Learning to Recognize Tables in Free Text, Proceedings of the 37th Annual Meeting of ACL 443-450 (1999)」を参照されたい。 The document converter 102 can identify the implicit table in any of a number of different known ways, including through a dedicated parser and automatic learning techniques. For a number of examples of known techniques for identifying implicit tables, see “A System of Understanding and Reformulating Tables, Fourth ICPR WORKSHOP ON DOCUMENT ANALYSIS SYSTEM” by Jianning Hugh et al. (2000); Mathew Hurst & Shona Douglas, Layout and Language: Preliminary Investigations in Recognizing the Structure of Tables, PROCEEDINGS OF THE INTERNATIONAL CONFERENCE ON DOCUMENT ANALYSIS AND RECOGNITION (ICDAR) 1043-1047 (1997); etc. "Learning to Recognize Tables in Free Text, Proceedings of the 37 th Annual Meeting of ACL 443-450 (1999) ", which is incorporated herein by reference.

文書コンバータ102が暗示的テーブルをいかに識別するかに拘らず、文書コンバータが電子文書の1つ以上の暗示的テーブルを識別する場合に、文書コンバータは、テキストをテーブルとして識別するようにデータ構造体を発生し又は再公式化することができる。例えば、文書コンバータは、テキストのブロックをテーブルとして認識し、そして電子文書をHTML文書へと変換する間に、テキストのブロックを適当なHTMLタグ(例えば、<table>、<tr>、<td>等)でカプセル化することにより、テキストのブロックをテーブルとして識別するようにフォーマットされたHTML文書を発生することができる。TXT文書におけるテキストのブロックに対して上記例を続けると、文書コンバータは、テキストのブロックを暗示的テーブルとして識別し、そしてその後、図7Bに示すように、暗示的テーブルを明示的テーブルとして含むようにデータ構造体を発生し又は再公式化することができる。   Regardless of how the document converter 102 identifies the implicit table, if the document converter identifies one or more implicit tables of the electronic document, the document converter will identify the text as a table. Can be generated or reformulated. For example, the document converter recognizes a block of text as a table, and converts the block of text to an appropriate HTML tag (eg, <table>, <tr>, <td> while converting the electronic document to an HTML document. Etc.), an HTML document formatted to identify a block of text as a table can be generated. Continuing the above example for a block of text in a TXT document, the document converter identifies the block of text as an implicit table and then includes the implicit table as an explicit table, as shown in FIG. 7B. A data structure can be generated or reformulated.

文書コンバータ102が、暗示的テーブルを明示的テーブルとして再形成することを含む電子文書のデータ構造体表示を発生した後に、文書コンバータは、ブロック110に示すように、所定の順序を有するように電子文書のテーブルを再構成することができる。この点に関して、文書コンバータは、電子文書のテーブルにおけるセルの自然の順序を、行主体の順序であるか列主体の順序であるかについて識別することができる。当業者に明らかなように、テーブルは、一般的に、テーブルのコンテンツが行により構成されるときには行主体の順序を有する。逆に、テーブルは、一般に、テーブルのコンテンツが列により構成されるときには、列主体の順序を有する。   After the document converter 102 has generated a data structure representation of the electronic document that includes reshaping the implicit table as an explicit table, the document converter has the electronic order to have a predetermined order, as shown at block 110. Document tables can be reconstructed. In this regard, the document converter can identify whether the natural order of cells in the table of electronic documents is row-major or column-major. As will be apparent to those skilled in the art, tables generally have row-major order when the contents of the table are composed of rows. Conversely, a table generally has a column-major order when the contents of the table are composed of columns.

電子文書のテーブルにおけるセルの自然の順序を識別した後、文書コンバータ102は、全てのテーブルが所定の順序を有するようにテーブルを再構成することができる。1つの典型的な実施形態では、例えば、文書コンバータは、全てのテーブルが行主体の順序を有するようにテーブルを再構成することができる。このような場合に、列主体の順序をもつテーブルでは、文書コンバータは、自然の順序が行主体となるようにテーブルを転置することができる。しかしながら、文書コンバータは、テーブルが列主体の順序を有するようにテーブルを再構成することもでき、この場合、文書コンバータの他のオペレーションが適宜調整されることが理解されよう。   After identifying the natural order of the cells in the table of electronic documents, the document converter 102 can reconstruct the tables so that all tables have a predetermined order. In one exemplary embodiment, for example, the document converter can reconstruct the tables so that all tables have a row-based order. In such a case, for a table with column-major order, the document converter can transpose the table so that the natural order is row-dominant. However, it will be appreciated that the document converter can also reconstruct the table so that the table has a column-major order, in which case other operations of the document converter are adjusted accordingly.

文書コンバータ102は、テーブルの自然の順序を多数の異なるやり方のいずれかで識別することができる。例えば、文書コンバータは、各テーブル内の隣接セルの中で類似性のパターンをサーチするように構成できる。この点に関して、例えば、各セルに像を含む第2行を有する列主体のテーブルについて考える。このような行の全てのセルが互いに類似していることは、通常決定的ではないが、テーブルが列主体の順序を有する証拠である。それとは別に、例えば、各セルに像を含む第2の列と、数字の後にパーセンテージ符号を各列に含む第5の列とを有する行主体のテーブルについて考える。列のセルが互いに類似していることも、通常決定的ではないが、テーブルが行主体の順序を有する証拠である。   The document converter 102 can identify the natural order of the table in any of a number of different ways. For example, the document converter can be configured to search for a pattern of similarity among neighboring cells in each table. In this regard, for example, consider a column-based table having a second row that contains an image in each cell. The fact that all cells in such a row are similar to each other is usually not critical, but is evidence that the table has a column-major order. Separately, for example, consider a row-based table having a second column that contains an image in each cell, and a fifth column that contains a percentage sign in each column after a number. The similarity of column cells to each other is also evidence that the table has row-major order, although usually not definitive.

1つの典型的な実施形態では、文書コンバータ102は、各セルの情報を特性ベクトルとして表わすことによりテーブルの自然の順序を識別する。例えば、各セルは、所与の長さNの特性2進ベクトルで表わすことができ、ここで、ベクトルの各位置は、各セルにおける情報の特性を表わす述語(イエス/ノー質問)の値に対応する。明らかなように、特性ベクトル表示は、テーブルの各セルの構造特性をエンコードする方法である。従って、類似に見えるセルは、通常、類似した特性ベクトル表示を有する。   In one exemplary embodiment, document converter 102 identifies the natural order of the table by representing each cell's information as a characteristic vector. For example, each cell can be represented by a characteristic binary vector of a given length N, where each position of the vector is the value of a predicate (yes / no question) that represents the characteristic of the information in each cell. Correspond. Obviously, the characteristic vector display is a method of encoding the structural characteristics of each cell of the table. Thus, cells that look similar usually have similar characteristic vector representations.

特性ベクトルは、多数の異なる述語に対応する多数のビット(N)を含むことができる。例えば、特性ベクトルは、13ビット(即ちN=13)を含むことができ、各ビットは、述語に次のように対応している。
ビット1は、セルが像を含む場合及びその場合だけ「1」である。
ビット2は、セルがデジットを含む場合及びその場合だけ「1」である。
ビット3は、セルがハイパーリングを含む場合及びその場合だけ「1」である。
ビット4は、セルがボールド体テキストを含む場合及びその場合だけ「1」である。
ビット5は、セルがイタリック体テキストを含む場合及びその場合だけ「1」である。
ビット6は、セルが句読点を含む場合及びその場合だけ「1」である。
ビット7は、セルが0から5キャラクタを含む場合及びその場合だけ「1」である。
ビット8は、セルが6から10キャラクタを含む場合及びその場合だけ「1」である。
ビット9は、セルが11から15キャラクタを含む場合及びその場合だけ「1」である。
ビット10は、セルが16から20キャラクタを含む場合及びその場合だけ「1」である。
ビット11は、セルが21から25キャラクタを含む場合及びその場合だけ「1」である。
ビット12は、セルが26から30キャラクタを含む場合及びその場合だけ「1」である。
ビット13は、セルが31キャラクタ以上を含む場合及びその場合だけ「1」である。
The characteristic vector can include a number of bits (N) corresponding to a number of different predicates. For example, the characteristic vector can include 13 bits (ie, N = 13), with each bit corresponding to a predicate as follows:
Bit 1 is “1” if and only if the cell contains an image.
Bit 2 is “1” if and only if the cell contains digits.
Bit 3 is “1” if and only if the cell contains a hyper ring.
Bit 4 is “1” if and only if the cell contains bold text.
Bit 5 is “1” if and only if the cell contains italic text.
Bit 6 is “1” if and only if the cell contains punctuation marks.
Bit 7 is “1” if and only if the cell contains 0 to 5 characters.
Bit 8 is “1” if and only if the cell contains 6 to 10 characters.
Bit 9 is “1” if and only if the cell contains 11 to 15 characters.
Bit 10 is “1” if and only if the cell contains 16 to 20 characters.
Bit 11 is “1” if and only if the cell contains 21 to 25 characters.
Bit 12 is “1” if and only if the cell contains 26 to 30 characters.
Bit 13 is “1” only when the cell includes 31 characters or more.

テーブルと、テーブルのセルに対する特性ベクトルとを各々示した図8A及び8Bを簡単に説明する。このようなテーブルに対して示されたように、例えば、第1行、第1列のセルは、ブランクを含む。従って、第1行、第1列のセルは、特性ベクトル0000001000000で表わすことができ、ここで、唯一の「1」ビット値は、0から5キャラクタを含むセルに対応する。これに対して、第2行、第1列のセルは、「エクイティ・リザーブSMライン(equity reserveSM line)」という句を含み、これは、特性ベクトル0000001000000で表わすことができる。図示されたように、唯一の「1」ビット値は、21から25キャラクタを含むセルに対応する(この句は、21キャラクタのカウンティングスペースを含む)。 8A and 8B showing the table and the characteristic vector for the table cell, respectively, will be briefly described. As shown for such a table, for example, the cells in the first row, first column contain blanks. Thus, the cells in the first row, first column can be represented by the characteristic vector 0000001,000,000, where a unique “1” bit value corresponds to a cell containing 0 to 5 characters. In contrast, the second row, the cells of the first column includes the phrase "equity reserve SM line (equity reserve SM line)", which can be expressed by the feature vector 0000001000000. As shown, a unique “1” bit value corresponds to a cell containing 21 to 25 characters (this phrase includes a counting space of 21 characters).

各セルの情報を特性ベクトルとして表わした後に、文書コンバータ102は、特性ベクトルに基づいてテーブル内のセル間の類似性尺度を決定することができる。文書コンバータは、隣接セル間の類似性の値を多数の異なるやり方で決定することができ、例えば、隣接セル間の「マンハッタン」距離を決定することにより決定できる。この点に関して、距離は、各セルの特性ベクトル間で異なるビットの数を決定することにより2つの隣接セルに対して決定できる。例えば、0111と1110との間の距離は2である。明らかなように、隣接セル間の距離が小さいほど、各セルの類似性が大きい。本発明の実施形態に基づいて決定された図8Aのテーブルのセル間の距離尺度については、図8Bを参照されたい。   After representing the information for each cell as a characteristic vector, document converter 102 can determine a similarity measure between cells in the table based on the characteristic vector. The document converter can determine the value of similarity between adjacent cells in a number of different ways, for example, by determining the “Manhattan” distance between adjacent cells. In this regard, the distance can be determined for two neighboring cells by determining the number of bits that differ between the characteristic vectors of each cell. For example, the distance between 0111 and 1110 is 2. Obviously, the smaller the distance between adjacent cells, the greater the similarity of each cell. See FIG. 8B for distance measures between cells in the table of FIG. 8A determined in accordance with embodiments of the present invention.

又、明らかなように、種々の場合において、特性ベクトルの各ビット値(1つ又は複数)に対応する1つ以上の述語は、他の述語よりもセルの類似性を強く表わす。例えば、上述した13ビット特性ベクトルの第1ビットは、第10ビットよりもセルの類似性を強く表わす。従って、本発明の実施形態によれば、1つ以上のビットに関連重みをもたせて、2つの特性ベクトル間の距離が、隣接セル間で各ビットが異なるときにその関連重みを和として含むようにすることができる。   Also, as will be apparent, in various cases, one or more predicates corresponding to each bit value (s) of the characteristic vector are more strongly indicative of cell similarity than other predicates. For example, the first bit of the 13-bit characteristic vector described above represents the cell similarity more strongly than the tenth bit. Therefore, according to an embodiment of the present invention, one or more bits have an associated weight so that the distance between two characteristic vectors includes the associated weight as a sum when each bit is different between adjacent cells. Can be.

テーブルの隣接セル間の類似性尺度又は距離が厳密にいかに決定されるかにかかわらず、距離が決定された後に、文書コンバータ102は、テーブルが行主体の順序を有するか列主体の順序を有するか決定することができる。より詳細には、文書コンバータは、テーブルの種々の行及び列を横切る距離に基づいてテーブルの順序を決定することができる。例えば、文書コンバータは、テーブル内の同じ行にある隣接セル対間の平均距離SHを決定し、そしてテーブル内の同じ列にある隣接セル対間の平均距離SVを決定することができる。明らかなように、同じ行内の隣接セル間の小さな平均距離は、通常、テーブルの行が類似したセルを含むことを指示し、これは、テーブルが列主体の順序を有することを示唆する。逆に、同じ列内の隣接セル間の小さな平均距離は、テーブルの列が類似したセルを含むことを指示し、これは、テーブルが行主体の順序を有することを示唆する。表示法で書くと、文書コンバータは、SH及びSVを次の式に基づいて決定することができる。

Figure 2005196711

Figure 2005196711
上記式(1)及び(2)に示すように、i=1・・・Rは、テーブルにおける行を表わし、そしてj=1・・・Cは、列を表わす。又、xi,j及びxi+1,jは、テーブルの隣接セルを表わし、そしてΔCは、各隣接セル間の距離を表わす。図8Aのテーブルについては、図8Bに示す距離から、SH=2.4(即ち、24/10)であり、そしてSV=0.583(即ち、7/12)である。 Regardless of how exactly the similarity measure or distance between adjacent cells of the table is determined, after the distance is determined, the document converter 102 has either a row-major order or a table-major order. Can be determined. More specifically, the document converter can determine the order of the table based on the distance across various rows and columns of the table. For example, a document converter can determine the average distance S H between adjacent cell pairs in the same row in the table, and determines the average distance S V between adjacent cell pairs in the same column in the table. As is apparent, a small average distance between adjacent cells in the same row usually indicates that the rows of the table contain similar cells, which suggests that the table has a column-major order. Conversely, a small average distance between adjacent cells in the same column indicates that the table column contains similar cells, which suggests that the table has row-major order. When written in display, the document converter can determine S H and S V based on the following equations:
Figure 2005196711

Figure 2005196711
As shown in equations (1) and (2) above, i = 1... R represents a row in the table, and j = 1... C represents a column. X i, j and x i + 1, j represent adjacent cells in the table, and Δ C represents the distance between each adjacent cell. For the table of FIG. 8A, from the distance shown in FIG. 8B, S H = 2.4 (ie 24/10) and S V = 0.583 (ie 7/12).

文書コンバータ102が、同じ行の隣接セル対間の平均距離SH及び同じ列の隣接セル対間の平均距離SVを決定すると、文書コンバータは、テーブルが行主体の順序を有するか列主体の順序を有するか決定することができる。例えば、文書コンバータは、平均距離を比較することにより順序を決定することができる。同じ列の隣接セル対間の平均距離SVが、同じ行の隣接セル対間の平均距離SHより大きい場合には(即ち、SV>SH)、文書コンバータは、テーブルが列主体の順序を有することを決定でき、さもなければ、テーブルは、行主体の順序を有する。電子文書のテーブルを、行主体の順序のような所定の順序を有するように再構成するために、文書コンバータは、列主体の順序を有するテーブルを、テーブルが全て行主体の順序を有するように転置することができる。表示法の用語では、電子文書のテーブルは、DOMツリーを、各セルxi,jが各セルxj,iと交換されるように再編成することにより転置することができる。 When the document converter 102 determines the average distance S H between adjacent cell pairs in the same row and the average distance S V between adjacent cell pairs in the same column, the document converter may determine whether the table has a row-oriented order or column-oriented. You can decide if you have an order. For example, the document converter can determine the order by comparing the average distances. If the average distance S V between adjacent cell pairs in the same column is greater than the average distance S H between adjacent cell pairs in the same row (ie, S V > S H ), the document converter has the table as column-oriented. It can be determined to have an order, otherwise the table has a row-oriented order. In order to reconstruct a table of an electronic document to have a predetermined order, such as a row-oriented order, the document converter converts a table having a column-oriented order so that all the tables have a row-oriented order. Can be transposed. In display terminology, the table of electronic documents can be transposed by reorganizing the DOM tree such that each cell x i, j is exchanged for each cell x j, i .

明らかなように、種々の場合に、SHとSVは非常に類似し、その結果、テーブルは、希望とは逆の順序を有するように転置される。従って、文書コンバータ102は、比較中にSH又はSVを重み付けして、文書コンバータが所与のテーブルを転置する見込みを若干高くすることができる。例えば、文書コンバータは、SHに、1より大きな値を有するバイアスCを乗算することができる。従って、SHとSVの比較中に(即ち、SV>C*SH)、バイアスが増加するにつれて、文書コンバータは、それが列主体のテーブルを転置し且つSH及びSVが類似した値を有するときには、テーブルを転置する見込みが低くなる。 As will be apparent, in various cases, SH and SV are very similar, so that the table is transposed to have the opposite order as desired. Accordingly, the document converter 102, it is possible to weight the S H or S V in comparison, a document converter is slightly higher the likelihood of transposition a given table. For example, a document converter, the S H, it is possible to multiply the bias C having a value greater than 1. Therefore, in comparison of S H and S V as (i.e., S V> C * S H ), the bias is increased, the document converter transpose and S H and S V are similar it to column major table When it has the value, the likelihood of transposing the table is low.

所定の順序をもつようにテーブルを再構成した後、文書コンバータ102は、テーブルを、テーブルのセルのコンテンツの一次元シーケンスへと直線化することができ、ここで、直線化されたコンテンツはテーブル内に含まれない。しかしながら、便利なことに、テーブルを直線化する前に、文書コンバータは、図5のブロック112に示すように、テーブル内に含まれたラベルをローカライズすることができる。明らかなように、多数のテーブルは、1つ以上の他のセルに対してラベルとして機能するセルを含む。この点に関して、ラベルがセルの単一行又は列を指すときには、ラベルがしばしば「ダイレクト」ラベルと称される。これに対して、ラベルが2つ以上の行又は列を指すときには、ラベルがしばしば「スパン」ラベルと称される。図9のテーブルに示すように、例えば、「YR」、「TM」、「GP」及び「G」のようなラベルは、ダイレクトラベルを構成し、一方、「レギュラーシーズン」及び「ポストシーズン」のラベルは、スパンラベルを構成する。   After restructuring the table to have a predetermined order, the document converter 102 can linearize the table into a one-dimensional sequence of the contents of the cells of the table, where the linearized content is the table. Not included. Conveniently, however, prior to linearizing the table, the document converter can localize the labels contained within the table, as shown in block 112 of FIG. As will be apparent, a number of tables contain cells that serve as labels for one or more other cells. In this regard, when a label refers to a single row or column of cells, the label is often referred to as a “direct” label. In contrast, when a label refers to more than one row or column, the label is often referred to as a “span” label. As shown in the table of FIG. 9, for example, labels such as “YR”, “TM”, “GP” and “G” constitute a direct label, while “Regular Season” and “Post Season” The label constitutes a span label.

又、明らかなように、図9に示すような列ラベルを有する行主体のテーブルを直線化すると、列ラベルを、このようなラベルが指すセルから分離することができる。従って、レンダリングされたテーブルは、表示エリアが限定されたターミナル10において理解することが困難となる。この点に関して、ターミナルディスプレイに図9のテーブルの一部分を示し、テーブルが単純な直線化プロセスにより進められている図10A及び10Bを参照されたい。明らかなように、行ラベルは、このようなラベルが指すセルから分離され、従って、テーブルの理解を困難にしている。より詳細には、図示されたように、多数のダイレクトラベル(例えば、「YR」、「TM」、「GP」、「G」等)を含む列は、それが指すデータ、即ち各ラベルの下にある各列のセルから、視覚的に分離される。   Also, as is apparent, when a row-based table having column labels as shown in FIG. 9 is linearized, the column labels can be separated from the cells pointed to by such labels. Therefore, it is difficult to understand the rendered table in the terminal 10 having a limited display area. In this regard, refer to FIGS. 10A and 10B, which show a portion of the table of FIG. 9 on a terminal display and the table is advanced by a simple linearization process. As is apparent, the row label is separated from the cell to which such a label points, thus making it difficult to understand the table. More specifically, as shown, the column containing a number of direct labels (eg, “YR”, “TM”, “GP”, “G”, etc.) is the data that it points to, ie under each label. Are visually separated from the cells in each column.

従って、列ラベルを、このようなラベルが指すデータから分離するのを回避するために、1つの効果的な実施形態の文書コンバータ102は、電子文書のテーブル内に配置されたラベル(もしあれば)をローカライズする。より詳細には、文書コンバータは、ラベルが、そのラベルが記述するデータの近くに配置されるように、ラベルを再構成する。従って、文書コンバータは、その後にレンダリングされるテーブルについてのユーザの理解を助けることができる。   Thus, in order to avoid separating column labels from the data pointed to by such labels, the document converter 102 of one effective embodiment uses labels (if any) placed in a table of electronic documents. ). More specifically, the document converter reconstructs the label so that the label is placed near the data that the label describes. Thus, the document converter can help the user understand the tables that are subsequently rendered.

文書コンバータ102は、電子文書のテーブル内のラベルを多数の異なる方法のいずれかでローカライズすることができる。ラベルをローカライズするための1つの特に効果的な技術を、図11を参照して以下に説明する。以下に述べるように、文書コンバータは、少なくとも1つのラベルを含む少なくとも1つの行を有する行主体のテーブルに対するラベルをローカライズする。しかしながら、文書コンバータは、多数の他の状態においてラベルをローカライズできることを理解されたい。例えば、文書コンバータは、少なくとも1つのラベルを含む少なくとも1つの列を有する列主体のテーブルに対するラベルをローカライズすることができる。このような場合に、ラベルをローカライズするプロセスは、通常、行に基づいて実行されるオペレーションが列に基づいて実行されそしてそれとは逆にも実行されるようにして、ここに述べるように進めることができる。又、文書コンバータは、特に、ラベルを含まないテーブルに対して、テーブル内のラベルをローカライズする必要がないことを理解されたい。通常、文書コンバータは、それがテーブルを行主体のテーブルに再構成しそしてテーブルがラベルをもつ業を含まないときにもラベルをローカライズしない。   The document converter 102 can localize the labels in the table of electronic documents in any of a number of different ways. One particularly effective technique for localizing labels is described below with reference to FIG. As described below, the document converter localizes labels for row-based tables having at least one row that includes at least one label. However, it should be understood that the document converter can localize labels in a number of other situations. For example, the document converter can localize labels for a column-based table having at least one column that includes at least one label. In such cases, the process of localizing labels usually proceeds as described here, with operations performed based on rows being performed based on columns and vice versa. Can do. It should also be understood that the document converter need not localize the labels in the table, especially for tables that do not contain labels. Normally, a document converter does not localize a label even when it reorganizes the table into a row-based table and the table does not include a work with labels.

1つの技術によれば、文書コンバータ102は、図11のブロック118に示すように、スパンラベル、即ち2つ以上の列にわたるラベルを含む行を最初に識別することによりラベルをローカライズすることができる。より詳細には、文書コンバータは、テーブルデータ(例えば、<td>)又はテーブルヘッダ(例えば、<th>)を含むセルを識別するタグに対して所定の行数(例えば、3行)のセルを検査することができ、ここで、セルは、多列属性(例えば、colspan)も有する。明らかなように、このような属性は、通常、テーブルの2つ以上の列にわたるセルを表わす。例えば、図9のテーブルでは、第1の行は、各々2つ以上の列にわたる2つのセル(即ち、「レギュラーシーズン」及び「ポストシーズン」)を含む。   According to one technique, document converter 102 can localize a label by first identifying a row that contains a span label, ie, a label that spans two or more columns, as shown in block 118 of FIG. . More specifically, the document converter can determine whether a cell has a predetermined number of rows (eg, 3 rows) for a tag that identifies a cell containing table data (eg, <td>) or a table header (eg, <th>). Where the cell also has a multi-column attribute (eg, colspan). As will be apparent, such attributes typically represent cells that span two or more columns of the table. For example, in the table of FIG. 9, the first row includes two cells (ie, “regular season” and “post season”), each spanning two or more columns.

スパンラベルを含む行を識別した後に、文書コンバータ102は、ブロック120に示すように、ダイレクトラベル、即ち単一の列を各々指すラベルを含む行を識別することができる。上記と同様に、文書コンバータは、ダイレクトラベルに対して所定の行数(例えば、3行)のセルを検査することができる。文書コンバータは、多数の異なるやり方のいずれかでダイレクトラベルを探索することができる。例えば、一実施形態では、文書コンバータは、隣接行間の類似性尺度(例えば、距離)に基づいてダイレクトラベルを探索し、ここで、隣接行間の類似性尺度は、上述したように、隣接行のセル間の類似性尺度に基づく。この点に関して、当業者に明らかなように、ダイレクト列ラベルの行は、しばしば、多数の異なる観点においてテーブル内の残りの行と相違する。例えば、ダイレクト列ラベルより成る図9の第2行は、完全に文字で構成され、一方、第2行の下の行は、数字でほぼ完全に構成される。   After identifying rows that contain span labels, document converter 102 may identify rows that contain direct labels, ie, labels that each point to a single column, as shown in block 120. Similar to the above, the document converter can inspect a predetermined number of rows (for example, 3 rows) of cells against the direct label. The document converter can search for direct labels in any of a number of different ways. For example, in one embodiment, the document converter searches for a direct label based on a similarity measure (eg, distance) between adjacent rows, where the similarity measure between adjacent rows is determined as described above. Based on similarity measure between cells. In this regard, as will be apparent to those skilled in the art, direct column label rows often differ from the remaining rows in the table in a number of different ways. For example, the second row of FIG. 9 consisting of direct column labels is composed entirely of letters, while the line below the second row is composed almost entirely of numbers.

テーブルのダイレクトラベルを探索するために、文書コンバータ102は、テーブルの隣接行間の類似性又は距離を決定することができ、ここで、類似性は、各行内の垂直方向に隣接したセルの類似性に基づいて決定される。表示法で書くと、文書コンバータは、次の式(3)に基づきテーブルの隣接行間の距離ΔRを決定することができる。

Figure 2005196711
この式において、mは、少なくとも1つのスパンラベルを含まないテーブルの第1行を表わす。 In order to search the direct labels of the table, the document converter 102 can determine the similarity or distance between adjacent rows of the table, where the similarity is the similarity of vertically adjacent cells in each row. To be determined. Written in notation, the document converter can determine the distance delta R between adjacent rows of the table based on the following equation (3).
Figure 2005196711
In this equation, m represents the first row of the table that does not include at least one span label.

隣接行間の距離を決定した後に、文書コンバータ102は、後続隣接行の対より著しく大きな相違性を有する隣接行の対を識別することができ、ここで、著しく大きな相違性は、ダイレクトラベルを含む各対の第1行を表わす。換言すれば、文書コンバータは、隣接行の対間の距離が、隣接行の後続対間の距離より著しく大きいかどうか決定し、次いで、そのような対の第1行を、ダイレクトラベルを含むものとして識別する。より詳細には、例えば、文書コンバータは、各ΔR(i、i+1)を、ΔR(i+1、i+2)で始めて、隣接行の後続対間の距離と比較することができる。次いで、隣接行の後続対よりも少なくとも所与のパーセンテージ(例えば、50%)大きい第1のΔR(i、i+1)に対して、行iを、ダイレクトラベルを含む行として識別することができる。 After determining the distance between adjacent rows, document converter 102 can identify adjacent row pairs that have significantly greater differences than subsequent adjacent row pairs, where the significantly larger differences include direct labels. Represents the first row of each pair. In other words, the document converter determines whether the distance between a pair of adjacent rows is significantly greater than the distance between subsequent pairs of adjacent rows, and then the first row of such a pair includes a direct label. Identify as. More specifically, for example, the document converter can compare each Δ R (i, i + 1) with the distance between subsequent pairs in adjacent rows, starting with Δ R (i + 1, i + 2). Then, for a first Δ R (i, i + 1) that is at least a given percentage (eg, 50%) greater than the subsequent pair of adjacent rows, row i can be identified as the row containing the direct label. .

文書コンバータ12は、スパンラベル、及び/又はダイレクトラベルを含む行を識別すると、図11のブロック122に示すように、多数の既知の技術のいずれかに基づいてテーブルのラベルツリー表示を発生することができる。より詳細には、例えば、文書コンバータは、ラベルをローカライズするのに使用するための別のデータ構造体を発生することができ、ここで、データ構造体は、テーブルの個々のセルに対するスパン及びダイレクト列ラベルの関連性を反映する。「ラベルツリー」と称されるこのデータ構造体は、既に識別されたスパン及びダイレクト列ラベルの構造体を捕獲することができる。この点について、図12は、1つの実施形態に基づき図9のテーブルのラベルツリー表示を示す。   When document converter 12 identifies a line containing span labels and / or direct labels, it may generate a label tree representation of the table based on any of a number of known techniques, as shown in block 122 of FIG. Can do. More specifically, for example, the document converter can generate another data structure for use in localizing labels, where the data structure is spanned and direct to individual cells of the table. Reflect column label relevance. This data structure, referred to as a “label tree”, can capture the structure of previously identified span and direct column labels. In this regard, FIG. 12 shows a label tree representation of the table of FIG. 9 according to one embodiment.

文書コンバータ102は、これがテーブルのラベルツリー表示を発生した後、テーブルのラベルをローカライズすることができる。ブロック124に示すように、文書コンバータは、ラベルツリー及びデータ構造体表示を横切ることによりラベルをローカライズし、テーブルの直線化された表示内におけるラベルの配置を決定することができる。従って、テーブルは、その後、各テーブルセルに接近して配置されたラベルを含むように直線化することができる。明らかなように、ラベルツリー表示及びデータ構造体は、多数の異なるやり方のいずれかで横断することができる。一実施形態では、例えば、文書コンバータは、コンテンツをもたないセル(即ちブランクセル)、及びスパン又はダイレクトラベルを含むセルを除いて、各行(j=1、・・・R)の各列(i=1、・・・C)の各セルを検査する。   The document converter 102 can localize the labels of the table after it generates a label tree representation of the table. As shown in block 124, the document converter can localize the labels by traversing the label tree and data structure display and determine the placement of the labels within the linearized display of the table. Thus, the table can then be linearized to include a label placed close to each table cell. As will be apparent, the label tree display and data structure can be traversed in any of a number of different ways. In one embodiment, for example, the document converter may include a cell with no content (ie, a blank cell) and a column ( Each cell of i = 1,... C) is inspected.

ブランク及びラベルセルを含む各行の各列に対して、文書コンバータは、テーブルのツリーラベル表示のルートノードからブランチのリーフLへのラベル経路xk={x1、x2、・・・xL}を定義することができ(図12を参照)、ここで、各リーフは、テーブルの各列に関連している。更に、文書コンバータは、ラベルストリングsijを定義することができ、ここで、ラベルストリングは、各セルに対し0の値で初期化される。テーブルのラベルツリー表示の各ラベル経路(k=1、・・・L)の各ノードに対し、xkがスパンラベルを備えそしてxk+1がxkの下の第1ノードを備えている場合に、文書コンバータ102は、新たなラインを、スパンラベル、別の新たなライン及び少なくとも1つのキャラクタスペース(例えば、タブ)と共に、ラベルストリングsijに追加することができる。他方、xkがダイレクトラベルを備えている場合には、文書コンバータは、ダイレクトラベルを、コロンのようなセパレータと共にラベルストリングsijに追加することができる。次いで、テーブルセルを検査し、そしてラベルストリングsijを発生した後に、文書コンバータは、以下に述べるテーブルの直線化の間に、各ラベルストリングを各セルxijに添付することができる。 For each column of each row containing blanks and label cells, document converter label path x k = from tree label the root node of the table to the leaf L branch {x 1, x 2, ··· x L} (See FIG. 12), where each leaf is associated with each column of the table. In addition, the document converter can define a label string s ij , where the label string is initialized with a value of 0 for each cell. For each node in each label path (k = 1,... L) in the label tree display of the table, x k comprises the span label and x k + 1 comprises the first node under x k In some cases, the document converter 102 can add a new line to the label string s ij with a span label, another new line, and at least one character space (eg, a tab). On the other hand, if x k comprises a direct label, the document converter can add the direct label to the label string s ij with a separator such as a colon. Then, after examining the table cells and generating the label strings s ij , the document converter can attach each label string to each cell x ij during table linearization as described below.

例えば、図9のテーブル及び図12のラベルツリー表示について考える。ここで、テーブルは、多数のスパン及びダイレクトラベルを含む。このような場合に、テーブルのセルの検査は、値「84−85」を含むセル(3、1)で始めることができる。ラベルツリー表示のルートノードが第3の行に関連したリーフへ至るのに続いて、文書コンバータ102は、ラベル経路xk={x1=「YR」}を定義することができる。更に、文書コンバータは、ラベルストリングs3,1を定義することができ、ここで、ラベルストリングは、0の値で初期化される。次いで、x1は、ダイレクトラベルを含むので、文書コンバータは、ダイレクトラベルを、コロンと共にラベルストリングsijへ追加して、s3,1={「YR:」}とすることができる。同じプロセスを、セル(3、2)に対して繰り返し、s3,2={「TM:」}とすることができる。一方、セル(3、3)については、文書コンバータは、ラベル経路xk={x1=「レギュラーシーズン」;x2=「GP」}を定義することができる。ラベルストリングs3,3をゼロに初期化した後に、x1はスパンラベルを含み、そしてx2(即ちxi+1)は、x1の下の第1ノードを含むので、文書コンバータは、新たなラインを、スパンラベル、別の新たなライン及びタブと共に、ラベルストリングs3,3に追加することができる。次いで、x2に対して、文書コンバータは、更に、ダイレクトラベル及びコロンをラベルストリングs3,3に追加することができる。それ故、ラベルストリングs3,3は、次のように現われる。
3,3={\n;「レギュラーシーズン」;\n;\t;「GP:」}
但し、「\n」及び「\t」は、ラベルストリングがターミナル10によりレンダリングされるときに新たなライン及びタブを各々表わす。
For example, consider the table of FIG. 9 and the label tree display of FIG. Here, the table includes a number of spans and direct labels. In such a case, the examination of the table cell can begin with cell (3, 1) containing the value “84-85”. Following the root node of the label tree display to the leaf associated with the third row, the document converter 102 can define a label path x k = {x 1 = “YR”}. In addition, the document converter can define a label string s 3,1 , where the label string is initialized with a value of zero. Then x 1 contains the direct label, so the document converter can add the direct label along with the colon to the label string s ij so that s 3,1 = {“YR:”}. The same process can be repeated for cell (3, 2) so that s 3,2 = {“TM:”}. On the other hand, for cell (3, 3), the document converter can define the label path x k = {x 1 = “regular season”; x 2 = “GP”}. After initializing the label string s 3,3 to zero, x 1 contains the span label and x 2 (ie, x i + 1 ) contains the first node under x 1 so that the document converter A new line can be added to the label string s 3,3 with a span label, another new line and tab. Then, with respect to x 2, a document converter further, it is possible to add direct label and colon label string s 3,3. Therefore, the label string s 3,3 appears as follows:
s 3,3 = {\ n; "regular season"; \ n; \ t; "GP:"}
However, “\ n” and “\ t” represent new lines and tabs, respectively, when the label string is rendered by the terminal 10.

再び、図5を参照すれば、文書コンバータ102は、それがラベルストリングsijを決定してラベルをローカライズすると、ブロック114に示すように、タブをセルの一次元シーケンスへと直線化することができる。文書コンバータは、タブを多数の異なるやり方のいずれかで直線化することができる。一実施形態では、例えば、文書コンバータは、テーブルを1つ以上の個々のパラグラフ(例えば、<p>)と置き換えることによりテーブルを直線化することができ、各パラグラフは、最初のテーブルの1つ以上のセルを含む。この点について、特に文書コンバータが電子文書のテーブルを、行主体の順序をもつように構成するときには、文書コンバータは、通常、左上のセルで始めて右下のセルで終わるようにして、行主体の順序を有するテーブルを横断し、そして各セルのコンテンツを、テーブルの直線化された表示の各パラグラフへ移動することができる。 Referring again to FIG. 5, when the document converter 102 determines the label string s ij and localizes the labels, it can linearize the tabs into a one-dimensional sequence of cells, as shown in block 114. it can. The document converter can linearize tabs in any of a number of different ways. In one embodiment, for example, the document converter can linearize the table by replacing the table with one or more individual paragraphs (eg, <p>), each paragraph being one of the first table. Includes the above cells. In this regard, especially when the document converter configures the table of electronic documents to have a row-oriented order, the document converter usually starts with the upper left cell and ends with the lower right cell, so that A table with an order can be traversed and the contents of each cell can be moved to each paragraph of the linearized display of the table.

一実施形態において、文書コンバータ102は、テーブルのデータ構造体表示を検査することによりテーブルを直線化することができる。例えば、図13Aに示すテーブルを含む電子文書のデータ構造体表示について考える。各テーブルノードに対して、文書コンバータは、各テーブルノードと同じレベルにおいてデータ構造体に新たな一時的ノード(図13Bにノード「X」として示す)を生成することができる。次いで、通常、ブランク及びラベルセルを除いて、テーブルのセルを表わす各行ノード(即ち<tr>)の各データノード(即ち<td>)に対し、文書コンバータは、パラグラフノード(例えば<p>)をノード「X」の子として添付することができる。図13Bに示すように、その後、文書コンバータは、各データノードのコンテンツノード(即ちC1、C2等)又はより詳細には、各セルのコンテンツxijを、各パラグラフノードの下へ移動することができ、図13Bには、そのうちの第1及び第2コンテンツノードC1及びC2だけが移動されるとして示されている。各コンテンツノードを各パラグラフノードの下に移動するのに加えて、文書コンバータは、各セルが対応するラベルストリングを有する場合に、各セルのコンテンツに各ラベルストリングsijを添付することができる。 In one embodiment, the document converter 102 can linearize the table by examining the data structure representation of the table. For example, consider the data structure display of an electronic document including the table shown in FIG. 13A. For each table node, the document converter can create a new temporary node (shown as node “X” in FIG. 13B) in the data structure at the same level as each table node. Then, for each data node (ie, <td>) of each row node (ie, <tr>) that typically represents a table cell, except for blanks and label cells, the document converter converts a paragraph node (eg, <p>). It can be attached as a child of node “X”. As shown in FIG. 13B, the document converter can then move the content node of each data node (ie, C1, C2, etc.) or, more specifically, the content x ij of each cell down to each paragraph node. In FIG. 13B, only the first and second content nodes C1 and C2 are shown as being moved. In addition to moving each content node below each paragraph node, the document converter can attach each label string s ij to the contents of each cell if each cell has a corresponding label string.

各行ノードの各データノードのコンテンツノードを各パラグラフノードの下に移動した後に、文書コンバータ102は、テーブルノード及びそれに関連した行ノード、テーブルノードの下のデータノード及びコンテンツノードを削除することができる。文書コンバータは、各行ノードの各データノードのコンテンツノードを移動した後にテーブルノード及びその関連ノードを削除できるが、文書コンバータは、各ノードの全ての子(即ち関連ノード)を移動するか又は削除した後に各ノードを削除することもできる。従って、例えば、文書コンバータは、各コンテンツノード(即ちC1、C2、C3等)を各パラグラフノードの下に移動した後に各テーブルデータノード(即ち<td>)を削除することができる。同様に、例えば、文書コンバータは、各テーブルデータノード(即ち<td>)を削除した後に各テーブル行ノード(即ち<tr>)を削除することができる。   After moving the content node of each data node of each row node under each paragraph node, the document converter 102 can delete the table node and its associated row node, data node and content node under the table node. . The document converter can delete the table node and its related nodes after moving the content node of each data node of each row node, but the document converter has moved or deleted all children (ie related nodes) of each node Each node can be deleted later. Thus, for example, the document converter can delete each table data node (ie, <td>) after moving each content node (ie, C1, C2, C3, etc.) below each paragraph node. Similarly, for example, the document converter can delete each table row node (ie, <tr>) after deleting each table data node (ie, <td>).

しかしながら、文書コンバータ102がテーブルノードをいつ削除するかに拘らず、各行ノードの各データノードのコンテンツノードを各パラグラフノードの下に移動した後に、文書コンバータは、ノード「X」をデータ構造体から取り去り、そして図13Cに示すように、ノード「X」の下の各ノードを電子文書のデータ構造体表示においてアップ方向に移動することができる。従って、図示されたように、テーブルの各セルxij(ブランク及びラベルセルを除く)を表わす各コンテンツノード(即ちC1、C2等)を、電子文書のデータ構造体表示の各パラグラフノード内に含ませることができる。明らかなように、このような場合には、添付されたラベルストリングsijを含む最初のテーブルの各セルを、別のパラグラフノードの下に含ませることができる。しかしながら、文書コンバータは、テーブルのセルの各行が各パラグラフノードの下に含まれるようにテーブルを直線化することができる。このような例として、図9のテーブルの直線化された表示を示す図14を参照されたい。ここでは、テーブルの1つ以上のセルが、添付されたラベルストリングを含む。 However, regardless of when the document converter 102 deletes the table node, after moving the content node of each data node of each row node below each paragraph node, the document converter removes the node “X” from the data structure. As shown in FIG. 13C, each node under node “X” can be moved up in the data structure display of the electronic document. Accordingly, as shown, each content node (ie, C1, C2, etc.) representing each cell x ij (excluding blanks and label cells) of the table is included in each paragraph node of the data structure display of the electronic document. be able to. As will be apparent, in such a case, each cell of the first table containing the attached label string s ij can be included under another paragraph node. However, the document converter can linearize the table so that each row of cells of the table is included under each paragraph node. As such an example, see FIG. 14 which shows a linearized display of the table of FIG. Here, one or more cells of the table contain an attached label string.

文書コンバータ102は、これがテーブルを直線化すると、図5のブロック116に示すように、電子文書のデータ構造体表示(テーブルの直線化された表示を含む)を、電子文書へと変換して戻す。明らかなように、文書コンバータは、データ構造体を多数の異なるやり方で変換することができ、例えば、文書コンバータが電子文書を中間データ構造体へ変換した(ブロック106を参照)のと逆のやり方で変換することができる。次いで、文書コンバータ102がデータ構造体を電子文書へと変換して戻すと、電子文書は、今や、元の電子文書に含まれた各テーブルの直線化された表示を含み、プロキシー18は、ブロック117で示すように、電子文書をターミナル10へ転送することができる。その後、ターミナルは、電子文書をディスプレイ(例えば、ディスプレイ54)にレンダリングすることができる。この点に関して、このようなディスプレイに図9のテーブルをレンダリングする例については、図15を参照されたい。   The document converter 102 converts the data structure representation of the electronic document (including the linearized representation of the table) back into an electronic document, as shown in block 116 of FIG. 5, when this linearizes the table. . As will be apparent, the document converter can convert the data structure in a number of different ways, for example, the opposite of how the document converter converted the electronic document to an intermediate data structure (see block 106). Can be converted. Then, when the document converter 102 converts the data structure back into an electronic document, the electronic document now includes a linearized representation of each table contained in the original electronic document, and the proxy 18 As indicated at 117, the electronic document can be transferred to the terminal 10. The terminal can then render the electronic document on a display (eg, display 54). In this regard, see FIG. 15 for an example of rendering the table of FIG. 9 on such a display.

図示して説明したように、文書コンバータ102は、少なくとも1つのテーブルを含む電子文書を受け取り、そしてその後、ターミナル10によりレンダリングするために文書のテーブル情報を変換することができる。次いで、文書コンバータは、変換されたテーブル情報を含む電子文書を、ターミナル又はより詳細にはターミナルのディスプレイ(例えばディスプレイ56)によりレンダリングするためにターミナルへ転送することができる。種々の場合に、文書コンバータは、電子文書を、その文書のテーブル情報を変換せずに転送できることに注意されたい。この点に関して、明らかなように、種々の場合に、ターミナルは、ターミナルのディスプレイより巾の広いディスプレイウインドウ内で左右のパンをサポートすることができる。従って、文書コンバータは、テーブル情報を変換する前に、電子文書のターミナル受信者が左右のパンをサポートするかどうか決定することができる。次いで、文書コンバータは、電子文書を、テーブル情報を変換せずに転送することができる。或いは又、文書コンバータは、ターミナルのユーザから、電子文書のテーブル情報を変換すべきか、又はテーブル情報を変換せずに電子文書を転送すべきかの選択を要求することができる。   As shown and described, the document converter 102 can receive an electronic document that includes at least one table and then convert the table information of the document for rendering by the terminal 10. The document converter can then transfer the electronic document containing the converted table information to the terminal for rendering by the terminal or, more specifically, the terminal display (eg, display 56). Note that in various cases, the document converter can transfer an electronic document without converting the table information of the document. In this regard, as will be apparent, in various cases, the terminal can support left and right pans within a display window that is wider than the terminal display. Thus, the document converter can determine whether the terminal recipient of the electronic document supports left and right panning before converting the table information. The document converter can then transfer the electronic document without converting the table information. Alternatively, the document converter can request the terminal user to select whether to convert the table information of the electronic document or to transfer the electronic document without converting the table information.

文書コンバータ102は、電子文書をパンするためのターミナル10の能力を多数の異なるやり方で決定することができる。例えば、文書コンバータは、内部「デバイス能力」ルックアップテーブルを維持することができ、これは、1つ以上の受信者装置のリストを含み、その各々が電子文書のパンをサポートするかどうか指示する。このような場合に、文書コンバータは、ターミナルとコンテンツソース100(例えば、HTTP GET)との間に通信セッションを確立する間にターミナル受信者を決定し、そしてその後、「デバイス能力」ルックアップテーブルにおいてターミナルのルックアップを行うことができる。次いで、テーブル情報を変換すべきかどうかの選択を要求した後に、文書コンバータは、その選択を受け取って適宜に処理することができる。この点に関して、ユーザが、テーブル情報を変換せずに電子文書を転送することを選択した場合には、文書コンバータが適宜に動作することができる。さもなければ、ユーザがテーブル情報を変換することを選択するか、又はターミナルがパンをサポートしない場合には、文書コンバータは、ここに述べたやり方でテーブル情報を変換することができる。   The document converter 102 can determine the terminal 10's ability to pan an electronic document in a number of different ways. For example, the document converter may maintain an internal “device capability” lookup table, which includes a list of one or more recipient devices, each indicating whether to support panning of electronic documents. . In such a case, the document converter determines the terminal recipient while establishing a communication session between the terminal and the content source 100 (eg, HTTP GET), and then in a “device capabilities” lookup table. A terminal lookup can be performed. Then, after requesting a selection of whether to convert the table information, the document converter can receive the selection and process it accordingly. In this regard, if the user chooses to transfer the electronic document without converting the table information, the document converter can operate appropriately. Otherwise, if the user chooses to convert the table information or if the terminal does not support panning, the document converter can convert the table information in the manner described here.

又、図示して説明したように、文書コンバータ102は、ターミナル10、プロキシー18、又はコンテンツソース、例えば、原点サーバー22、SMSC17、MMSC30、GGSN28、ユーザプロセッサ34等の多数の異なるネットワークエンティティのいずれからでも動作することができる。しかしながら、明らかなように、文書コンバータの種々の動作、特に、電子文書内の少なくとも1つのテーブルより成るテーブル情報を変換する際の動作は、ネットワークへの接続とは独立して実行することができる。従って、文書コンバータを動作するネットワークエンティティは、ネットワークに接続されないターミナル又はコンテンツソース(例えば、原点サーバー、SMSC、MMSC、ユーザプロセッサ等)のようなエンティティであることを理解されたい。このような場合、例えば、ネットワークエンティティには、ネットワークとは独立した多数の異なるやり方のいずれかで電子文書を与えることができ、その後、文書コンバータは、このような電子文書のテーブルを、上述したやり方で変換することができる。   Also, as shown and described, document converter 102 can be from any of a number of different network entities such as terminal 10, proxy 18, or content source, eg, origin server 22, SMSC 17, MMSC 30, GGSN 28, user processor 34, etc. But it can work. However, as will be appreciated, various operations of the document converter, particularly when converting table information comprising at least one table in an electronic document, can be performed independently of connection to the network. . Thus, it should be understood that the network entity operating the document converter is an entity such as a terminal or content source (eg, origin server, SMSC, MMSC, user processor, etc.) that is not connected to the network. In such a case, for example, the network entity can be provided with an electronic document in any of a number of different ways independent of the network, after which the document converter provides a table of such electronic documents as described above. Can be converted in a way.

本発明の1つの特徴によれば、本発明のシステムの全部又は一部分、例えば、ターミナル10、プロキシー18、原点サーバー22、SMSC17、MMSC30、GGSN28及び/又はユーザプロセッサ34の全部又は一部分は、一般に、コンピュータプログラム製品(例えば、文書コンバータ102)の制御のもとで動作する。本発明の実施形態の方法を実行するためのコンピュータプログラム製品は、不揮発性記憶媒体のようなコンピュータ読み取り可能な記憶媒体や、このコンピュータ読み取り可能な記憶媒体に実施される一連のコンピュータ命令のようなコンピュータ読み取り可能なプログラムコード部分を含む。   In accordance with one aspect of the present invention, all or part of the system of the present invention, eg, all or part of the terminal 10, proxy 18, origin server 22, SMSC 17, MMSC 30, GGSN 28 and / or user processor 34, in general, Operates under the control of a computer program product (eg, document converter 102). A computer program product for performing the method of an embodiment of the present invention includes a computer readable storage medium such as a non-volatile storage medium and a series of computer instructions implemented on the computer readable storage medium. Contains computer readable program code portions.

この点に関して、図5及び11は、本発明による方法、システム及びプログラム製品のフローチャートである。フローチャートの各ブロック又はステップ、並びにフローチャートにおけるブロックの組み合せは、コンピュータプログラム命令により実施できることが理解されよう。これらのコンピュータプログラム命令は、コンピュータ又は他のプログラム可能な装置にロードされて、マシンを生成し、コンピュータ又は他のプログラム可能な装置で実行される命令は、フローチャートのブロック又はステップで指定される機能を実施するための手段を形成する。又、これらのコンピュータプログラム命令は、コンピュータ読み取り可能なメモリに記憶されて、コンピュータ又は他のプログラム可能な装置が特定のやり方で機能するように導くことができ、コンピュータ読み取り可能なメモリに記憶された命令は、フローチャートのブロック又はステップで指定された機能を実施する命令手段を含む製造用品を形成する。又、コンピュータプログラム命令は、コンピュータ又は他のプログラム可能な装置にロードされて、コンピュータ又は他のプログラム可能な装置において一連の動作ステップを実行させて、コンピュータ実施されるプロセスを生成し、コンピュータ又は他のプログラム可能な装置で実行される命令は、フローチャートのブロック又はステップで指定された機能を実施するためのステップを与える。   In this regard, FIGS. 5 and 11 are flowcharts of methods, systems and program products according to the present invention. It will be understood that each block or step of the flowchart, and combinations of blocks in the flowchart, can be implemented by computer program instructions. These computer program instructions are loaded into a computer or other programmable device to generate a machine and the instructions executed on the computer or other programmable device are functions specified in the blocks or steps of the flowchart. Forming means for implementing These computer program instructions may also be stored in a computer readable memory to direct the computer or other programmable device to function in a particular manner and stored in the computer readable memory. The instructions form a manufacturing article that includes instruction means for performing the functions specified in the blocks or steps of the flowchart. Computer program instructions may also be loaded into a computer or other programmable device to cause a series of operational steps to be performed on the computer or other programmable device to produce a computer-implemented process. The instructions executed on the programmable device provide steps for performing the functions specified in the blocks or steps of the flowchart.

従って、フローチャートのブロック又はステップは、指定の機能を実行するための手段の組み合せ、指定の機能を実行するためのステップの組み合せ、並びに指定の機能を実行するためのプログラム命令手段をサポートする。又、フローチャートの各ブロック又はステップ、並びにフローチャートにおけるブロック又はステップの組み合せは、指定の機能又はステップを実行する特殊目的のハードウェアベースのコンピュータシステム、或いは特殊目的のハードウェア及びコンピュータ命令の組み合せによって実施できることが理解されよう。   Thus, a block or step of the flowchart supports a combination of means for performing a specified function, a combination of steps for performing a specified function, and a program instruction means for performing the specified function. Also, each block or step of the flowchart, and combinations of blocks or steps in the flowchart, are implemented by a special purpose hardware-based computer system that performs a specified function or step, or a combination of special purpose hardware and computer instructions. It will be understood that it can be done.

上記説明及び添付図面に示された教示から利益を受ける本発明に係る当業者であれば、本発明の多数の変更や他の実施形態が明らかとなろう。例えば、1つの実施形態において上述したように、文書コンバータは、テーブルが行主体の順序を有するようにテーブルを構成又は再構成し、その後、このような行主体の順序に基づいてテーブルを処理する。しかしながら、別の実施形態では、文書コンバータは、テーブルが列主体の順序を有するようにテーブルを構成又は再構成し、文書コンバータの他の動作をそれに応じて調整することもできる。例えば、文書コンバータは、少なくとも1つのラベルを含む少なくとも1つの列を有する列主体のテーブルに対してラベルをローカライズし、このローカライゼーションプロセスは、通常、行に基づいて実行される動作を列に基づいて実行しそしてその逆にも行うようにして、上述したのと同様に実行することができる。それ故、本発明は、上述した特定の実施形態に限定されるものではなく、特許請求の範囲内で他の実施形態も包含されることを理解されたい。又、特定の用語を使用したが、それらは、説明上一般的に使用されるもので、限定するためのものではない。   Numerous modifications and other embodiments of the invention will become apparent to those skilled in the art who have the benefit of the teachings set forth in the foregoing description and accompanying drawings. For example, as described above in one embodiment, the document converter configures or reconfigures the table such that the table has a row-major order, and then processes the table based on such row-major order. . However, in another embodiment, the document converter may configure or reconfigure the table such that the table has a column-major order, and adjust other operations of the document converter accordingly. For example, a document converter localizes labels for a column-based table having at least one column containing at least one label, and this localization process typically performs operations based on columns based on rows. It can be performed in the same way as described above, with execution and vice versa. Therefore, it is to be understood that the invention is not limited to the specific embodiments described above, but includes other embodiments within the scope of the claims. Also, although specific terms have been used, they are commonly used for purposes of explanation and are not intended to be limiting.

ターミナルがワイヤレスRFリンクを経て両方向接続されたセルラーネットワーク及びデータネットワークを含む本発明の一実施形態によるワイヤレス通信システムのブロック回路図である。1 is a block circuit diagram of a wireless communication system according to an embodiment of the present invention including a cellular network and a data network with terminals connected in both directions via a wireless RF link. FIG. 本発明の実施形態に基づき、ターミナル、原点サーバー、プロキシー/ゲートウェイ、SMSC、MMSC、GGSN及び/又はユーザプロセッサとして動作できるエンティティのブロック回路図である。FIG. 4 is a block circuit diagram of an entity that can operate as a terminal, origin server, proxy / gateway, SMSC, MMSC, GGSN, and / or user processor in accordance with an embodiment of the present invention. 本発明の実施形態に基づきターミナルとして動作できる移動ステーションのブロック回路図である。FIG. 2 is a block circuit diagram of a mobile station that can operate as a terminal according to an embodiment of the present invention. 本発明の一実施形態に基づきテーブルを含む電子文書をダウンロードするか、さもなければ、それを受け取るターミナルの機能的ブロック図である。FIG. 2 is a functional block diagram of a terminal that downloads or otherwise receives an electronic document that includes a table in accordance with one embodiment of the present invention. 本発明の一実施形態に基づき電子文書のテーブル情報を変換する方法の種々のステップを示すフローチャートである。6 is a flowchart illustrating various steps of a method for converting table information of an electronic document according to an embodiment of the present invention. 本発明の一実施形態に基づきテーブルを含む電子文書のツリーベースデータ構造を示すブロック図である。2 is a block diagram illustrating a tree-based data structure of an electronic document including a table according to an embodiment of the present invention. FIG. 本発明の一実施形態に基づき暗示的テーブルを含む電子文書のツリーベースデータ構造を示すブロック図である。FIG. 3 is a block diagram illustrating a tree-based data structure of an electronic document including an implicit table according to an embodiment of the present invention. 本発明の一実施形態に基づき暗示的テーブルが明示的テーブルとして再公式化された図7Aのツリーベースデータ構造を示すブロック図である。FIG. 7B is a block diagram illustrating the tree-based data structure of FIG. 7A with an implicit table reformulated as an explicit table in accordance with one embodiment of the present invention. 本発明の一実施形態に基づき電子文書内に含まれるテーブルを示す図である。It is a figure which shows the table contained in an electronic document based on one Embodiment of this invention. 本発明の一実施形態に基づきテーブルのセルに対する特性ベクトル及びセル間の類似性尺度を含む図8Aのテーブルのブロック図である。FIG. 8B is a block diagram of the table of FIG. 8A including a characteristic vector for the cells of the table and a similarity measure between the cells according to one embodiment of the present invention. 本発明の一実施形態に基づき電子文書内に含まれる別のテーブルを示す図である。It is a figure which shows another table contained in an electronic document based on one Embodiment of this invention. ターミナルディスプレイにレンダリングされた図9のテーブルの一部分を示す概略ブロック図で、テーブルのラベルをローカライズせずにテーブルが直線化されたところを示す図である。FIG. 10 is a schematic block diagram illustrating a portion of the table of FIG. 9 rendered on a terminal display, showing the table linearized without localizing the table labels. ターミナルディスプレイにレンダリングされた図9のテーブルの一部分を示す概略ブロック図で、テーブルのラベルをローカライズせずにテーブルが直線化されたところを示す図である。FIG. 10 is a schematic block diagram illustrating a portion of the table of FIG. 9 rendered on a terminal display, showing the table linearized without localizing the table labels. 本発明の一実施形態に基づき電子文書内に含まれるテーブルのラベルをローカライズする方法の種々のステップを示すフローチャートである。6 is a flowchart illustrating various steps of a method for localizing labels for a table included in an electronic document according to an embodiment of the present invention. 本発明の一実施形態に基づき電子文書内に含まれるテーブルのラベルツリーを示すブロック図である。FIG. 3 is a block diagram showing a label tree of a table included in an electronic document according to an embodiment of the present invention. 本発明の一実施形態に基づき直線化されたテーブルを含む電子文書のツリーベースデータ構造を示すブロック図である。FIG. 3 is a block diagram illustrating a tree-based data structure of an electronic document that includes a linearized table according to one embodiment of the invention. 本発明の一実施形態に基づき直線化されたテーブルを含む電子文書のツリーベースデータ構造を示すブロック図である。FIG. 3 is a block diagram illustrating a tree-based data structure of an electronic document that includes a linearized table according to one embodiment of the invention. 本発明の一実施形態に基づき直線化されたテーブルを含む電子文書のツリーベースデータ構造を示すブロック図である。FIG. 3 is a block diagram illustrating a tree-based data structure of an electronic document that includes a linearized table according to one embodiment of the invention. 本発明の一実施形態に基づき図9のテーブルを直線化したものを示す図である。FIG. 10 is a diagram showing a linearized table of FIG. 9 according to an embodiment of the present invention. ターミナルディスプレイにレンダリングされた図9のテーブルの一部分を示す概略ブロック図で、本発明の一実施形態に基づきテーブルが変換されたところを示す図である。FIG. 10 is a schematic block diagram illustrating a portion of the table of FIG. 9 rendered on a terminal display, showing the table converted according to one embodiment of the present invention.

Claims (40)

エリアが限定されたディスプレイを有するターミナルにレンダリングするためにテーブル情報を変換するシステムにおいて、
少なくとも1つのテーブルより成るテーブル情報を含む電子文書を受け取ることのできる文書コンバータで構成されたネットワークエンティティを備え、上記文書コンバータは、少なくとも1つのテーブルを、各テーブルの順序に基づくと共に、少なくとも1つのテーブルが少なくとも1つのラベルを含むときに少なくとも1つのラベルにも基づいて、少なくとも1つのテーブルの直線化された表示へと変換することができるようにされたシステム。
In a system that converts table information for rendering to a terminal with a limited area display,
Comprising a network entity comprised of a document converter capable of receiving an electronic document comprising table information comprising at least one table, said document converter comprising at least one table based on the order of each table and at least one table A system adapted to convert a linear representation of at least one table based on at least one label when the table includes at least one label.
上記文書コンバータは、少なくとも1つのテーブルが所定の順序を有するように少なくとも1つのテーブルを構成し、少なくとも1つのテーブルが少なくとも1つのラベルを含むときに各ラベルをローカライズし、そしてその後、少なくとも1つのテーブルを、上記所定の順序を有するように構成された少なくとも1つのテーブルに基づくと共に、少なくとも1つのテーブルが少なくとも1つのラベルを含むときに各ローカライズされたラベルにも基づいて直線化することにより、少なくとも1つのテーブルを変換することができる請求項1に記載のシステム。   The document converter configures at least one table such that the at least one table has a predetermined order, localizes each label when the at least one table includes at least one label, and then at least one By linearizing the table based on at least one table configured to have the predetermined order and also based on each localized label when the at least one table includes at least one label, The system of claim 1, wherein at least one table can be converted. 各テーブルは、少なくとも1つの行及び少なくとも1つの列に編成された複数のセルを含み、上記文書コンバータは、少なくとも1つのテーブルの自然の順序を識別することにより少なくとも1つのテーブルを構成し、そして少なくとも1つのテーブルが所定の順序以外の自然の順序を有するときには、所定の順序以外の自然の順序を有する少なくとも1つのテーブルを、各少なくとも1つのテーブルが所定の順序を有するように構成することができる請求項2に記載のシステム。   Each table includes a plurality of cells organized in at least one row and at least one column, wherein the document converter constitutes at least one table by identifying the natural order of the at least one table, and When at least one table has a natural order other than a predetermined order, at least one table having a natural order other than the predetermined order may be configured such that each at least one table has a predetermined order. The system according to claim 2, which is capable. 上記文書コンバータは、テーブルの各セルに対して特性ベクトルを決定し、そして各セルに対する特性ベクトルに基づいて隣接セル間の距離を決定することができ、更に、上記文書コンバータは、テーブルの同じ行における隣接セル対間の平均距離と、テーブルの同じ列における隣接セル対間の平均距離とを決定することができ、その後、これら平均距離に基づいてテーブルの自然の順序を識別することができる請求項3に記載のシステム。   The document converter can determine a characteristic vector for each cell of the table, and determine a distance between adjacent cells based on the characteristic vector for each cell, and the document converter can also determine the same row of the table. The average distance between adjacent cell pairs in and the average distance between adjacent cell pairs in the same column of the table can be determined, and then the natural order of the table can be identified based on these average distances Item 4. The system according to Item 3. 上記文書コンバータは、少なくとも1つのテーブルが行主体の順序及び列主体の順序の一方を有するように少なくとも1つのテーブルを構成することができる請求項2に記載のシステム。   3. The system of claim 2, wherein the document converter can configure at least one table such that the at least one table has one of a row-based order and a column-based order. 上記文書コンバータは、ターミナルがパンをサポートするかどうか決定することができ、ターミナルがパンをサポートする場合には、少なくとも1つのテーブルを変換するか、電子文書を、少なくとも1つのテーブルを変換せずに転送するかの一方の選択を受け取ることができ、更に、上記文書コンバータは、その選択が少なくとも1つのテーブルの変換を含むときには、少なくとも1つのテーブルを変換することができる請求項1に記載のシステム。   The document converter can determine whether the terminal supports panning and, if the terminal supports panning, either converts at least one table or does not convert the electronic document at least one table. The method of claim 1, further comprising receiving a selection of one to transfer to, and wherein the document converter is capable of converting at least one table when the selection includes conversion of at least one table. system. 電子文書内のテーブルの少なくとも1つのラベルをローカライズするシステムであって、上記テーブルは、少なくとも1つの行及び少なくとも1つの列に編成された複数のセルを含むものであるシステムにおいて、
少なくとも1つのスパンラベル及び少なくとも1つのダイレクトラベルの少なくとも一方を識別することのできる文書コンバータで構成されるネットワークエンティティを備え、各スパンラベルは、テーブルの複数の列及び行の一方に関連され、そして各ダイレクトラベルは、テーブルの単一の列及び単一の行の一方に関連され、又、上記文書コンバータは、スパンラベル及びダイレクトラベルの少なくとも一方に関連したテーブルの各セルに対するラベルストリングを決定し、これにより、各スパンラベル及び各ダイレクトラベルをローカライズすることができ、各ラベルストリングは、スパンラベル及びダイレクトラベルの少なくとも1つを含むようにされたシステム。
A system for localizing at least one label of a table in an electronic document, the table including a plurality of cells organized in at least one row and at least one column,
Comprising a network entity comprised of document converters capable of identifying at least one of at least one span label and at least one direct label, each span label being associated with one of a plurality of columns and rows of the table; and Each direct label is associated with one of a single column and a single row of the table, and the document converter determines a label string for each cell of the table associated with at least one of a span label and a direct label. Thus, each span label and each direct label can be localized, and each label string includes at least one of a span label and a direct label.
上記文書コンバータは、テーブルの隣接行及び隣接列の1つの間の類似性の尺度に基づいて少なくとも1つのダイレクトラベルを識別することができる請求項7に記載のシステム。   8. The system of claim 7, wherein the document converter is capable of identifying at least one direct label based on a measure of similarity between one of adjacent rows and adjacent columns of a table. 上記文書コンバータは、隣接行の各対と隣接列の各対の1つの間の類似性の尺度を決定し、上記類似性の尺度に基づいて、隣接行の他の対よりも所与のパーセンテージ以上異なる隣接行の対と、隣接列の他の対よりも所与のパーセンテージ以上異なる隣接列の対との1つを識別し、そしてその後、隣接行の上記識別された対の行と、隣接列の上記識別された対の列との1つを、少なくとも1つのダイレクトラベルを含むものとして識別することにより、少なくとも1つのダイレクトラベルを識別することができる請求項8に記載のシステム。   The document converter determines a measure of similarity between each pair of adjacent rows and one of each pair of adjacent columns, and based on the measure of similarity, a given percentage over other pairs of adjacent rows Identifying one of a pair of adjacent rows that differs by more than a pair of adjacent columns that differs by a given percentage more than other pairs of adjacent columns, and then the row of the identified pair of adjacent rows 9. The system of claim 8, wherein at least one direct label can be identified by identifying one of the identified pair of columns as including at least one direct label. 上記文書コンバータは、隣接行の各対及び隣接列の各対の一方の各セルに対する特性ベクトルを決定し、隣接行内の同じ列のセル間の距離と、隣接列内の同じ行のセル間の距離との一方を、各セルに対する特性ベクトルに基づいて決定し、そしてその後、隣接行の列及び隣接列の行の一方を横切る距離を加算することにより、類似性の尺度を決定することができる請求項9に記載のシステム。   The document converter determines a characteristic vector for each cell in each pair of adjacent rows and each pair of adjacent columns, and the distance between cells in the same column in adjacent rows and between cells in the same row in adjacent columns. One of the distances can be determined based on the characteristic vector for each cell, and then the similarity measure can be determined by adding the distance across one of the adjacent row column and the adjacent column row. The system according to claim 9. 少なくとも1つのテーブルより成るテーブル情報を含む電子文書を記憶することのできるメモリと、
各テーブルの順序に基づくと共に、少なくとも1つのテーブルが少なくとも1つのラベルを含むときに少なくとも1つのラベルにも基づいて、少なくとも1つのテーブルを、少なくとも1つのテーブルの直線化された表示へと変換することのできるコントローラと、
を備えたターミナル。
A memory capable of storing an electronic document including table information comprising at least one table;
Convert at least one table into a linearized representation of at least one table based on the order of each table and also based on at least one label when at least one table includes at least one label A controller that can
With terminal.
上記コントローラは、少なくとも1つのテーブルが所定の順序を有するように少なくとも1つのテーブルを構成し、少なくとも1つのテーブルが少なくとも1つのラベルを含むときに各ラベルをローカライズし、そしてその後、少なくとも1つのテーブルを、所定の順序を有するように構成された少なくとも1つのテーブルに基づくと共に、少なくとも1つのテーブルが少なくとも1つのラベルを含むときに各ローカライズされたラベルにも基づいて直線化することにより、少なくとも1つのテーブルを変換することができる請求項11に記載のターミナル。   The controller configures at least one table such that the at least one table has a predetermined order, localizes each label when the at least one table includes at least one label, and then at least one table Is based on at least one table configured to have a predetermined order, and at least one by linearizing based on each localized label when the at least one table includes at least one label 12. A terminal according to claim 11, wherein two tables can be converted. 各テーブルは、少なくとも1つの行及び少なくとも1つの列に編成された複数のセルを含み、上記コントローラは、少なくとも1つのテーブルの自然の順序を識別することにより少なくとも1つのテーブルを構成し、そして少なくとも1つのテーブルが所定の順序以外の自然の順序を有するときには、所定の順序以外の自然の順序を有する少なくとも1つのテーブルを、各少なくとも1つのテーブルが所定の順序を有するように構成することができる請求項12に記載のターミナル。   Each table includes a plurality of cells organized in at least one row and at least one column, the controller constructs at least one table by identifying a natural order of the at least one table, and at least When one table has a natural order other than a predetermined order, at least one table having a natural order other than the predetermined order can be configured such that each at least one table has a predetermined order. The terminal according to claim 12. 上記コントローラは、テーブルの各セルに対して特性ベクトルを決定し、そして各セルに対する特性ベクトルに基づいて隣接セル間の距離を決定することができ、更に、上記コントローラは、テーブルの同じ行における隣接セル対間の平均距離と、テーブルの同じ列における隣接セル対間の平均距離とを決定することができ、その後、これら平均距離に基づいてテーブルの自然の順序を識別することができる請求項13に記載のターミナル。   The controller can determine a characteristic vector for each cell in the table, and determine a distance between adjacent cells based on the characteristic vector for each cell, and the controller can also determine the adjacent in the same row of the table. 14. The average distance between cell pairs and the average distance between adjacent cell pairs in the same column of the table can be determined, and then the natural order of the table can be identified based on these average distances. The terminal described in. 上記コントローラは、少なくとも1つのテーブルが行主体の順序及び列主体の順序の一方を有するように少なくとも1つのテーブルを構成することができる請求項12に記載のターミナル。   13. The terminal of claim 12, wherein the controller can configure at least one table such that the at least one table has one of a row-major order and a column-major order. 上記コントローラは、ターミナルがパンをサポートするかどうか決定することができ、ターミナルがパンをサポートする場合には、少なくとも1つのテーブルを変換するか、電子文書を、少なくとも1つのテーブルを変換せずに転送するかの一方の選択を受け取ることができ、更に、上記コントローラは、その選択が少なくとも1つのテーブルの変換を含むときには、少なくとも1つのテーブルを変換することができる請求項11に記載のシステム。   The controller can determine whether the terminal supports panning, and if the terminal supports panning, either convert at least one table or convert the electronic document without converting at least one table. The system of claim 11, wherein one of the choices to transfer can be received and the controller is capable of converting at least one table when the selection includes conversion of at least one table. 少なくとも1つのテーブルより成るテーブル情報を含む電子文書を記憶することのできるメモリであって、各テーブルは、少なくとも1つの行及び少なくとも1つの列に編成された複数のセルを含むものであるメモリと、
少なくとも1つのスパンラベル及び少なくとも1つのダイレクトラベルの少なくとも一方を識別することのできるコントローラと、
を備え、各スパンラベルは、テーブルの複数の列及び行の一方に関連され、そして各ダイレクトラベルは、テーブルの単一の列及び単一の行の一方に関連され、又、上記コントローラは、スパンラベル及びダイレクトラベルの少なくとも一方に関連したテーブルの各セルに対するラベルストリングを決定し、これにより、各スパンラベル及び各ダイレクトラベルをローカライズすることができ、各ラベルストリングは、スパンラベル及びダイレクトラベルの少なくとも1つを含むようにされたターミナル。
A memory capable of storing an electronic document comprising table information comprising at least one table, each table comprising a plurality of cells organized in at least one row and at least one column;
A controller capable of identifying at least one of at least one span label and at least one direct label;
Each span label is associated with one of a plurality of columns and rows of the table, and each direct label is associated with one of a single column and single row of the table, and the controller includes: A label string for each cell of the table associated with at least one of the span label and the direct label is determined, whereby each span label and each direct label can be localized, and each label string includes the span label and the direct label. A terminal that contains at least one.
上記コントローラは、テーブルの隣接行及び隣接列の1つの間の類似性の尺度に基づいて少なくとも1つのダイレクトラベルを識別することができる請求項17に記載のターミナル。   The terminal of claim 17, wherein the controller is capable of identifying at least one direct label based on a measure of similarity between one of adjacent rows and adjacent columns of the table. 上記コントローラは、隣接行の各対と隣接列の各対の1つの間の類似性の尺度を決定し、この類似性の尺度に基づいて、隣接行の他の対よりも所与のパーセンテージ以上異なる隣接行の対と、隣接列の他の対よりも所与のパーセンテージ以上異なる隣接列の対との1つを識別し、そしてその後、隣接行の上記識別された対の行と、隣接列の上記識別された対の列との1つを、少なくとも1つのダイレクトラベルを含むものとして識別することにより、少なくとも1つのダイレクトラベルを識別することができる請求項18に記載のターミナル。   The controller determines a measure of similarity between each pair of adjacent rows and one of each pair of adjacent columns, and based on this measure of similarity, a given percentage or more than other pairs of adjacent rows Identifying one of a pair of different adjacent rows and a pair of adjacent columns that differs by a given percentage more than other pairs of adjacent columns, and then the row of the identified pair of adjacent rows and adjacent columns The terminal of claim 18, wherein at least one direct label can be identified by identifying one of the identified pairs of columns as including at least one direct label. 上記コントローラは、隣接行の各対及び隣接列の各対の一方の各セルに対する特性ベクトルを決定し、隣接行内の同じ列のセル間の距離と、隣接列内の同じ行のセル間の距離との一方を、各セルに対する特性ベクトルに基づいて決定し、そしてその後、隣接行の列及び隣接列の行の一方を横切る距離を加算することにより、類似性の尺度を決定することができる請求項19に記載のターミナル。   The controller determines a characteristic vector for each cell in each pair of adjacent rows and each pair of adjacent columns, and the distance between cells in the same column in the adjacent row and the distance between cells in the same row in the adjacent column. Can be determined based on the characteristic vector for each cell, and then the similarity measure can be determined by adding the distance across one of the column of the adjacent row and the row of the adjacent column. Item 20. The terminal according to Item 19. エリアが限定されたディスプレイを有するターミナルにレンダリングするためにテーブル情報を変換する方法において、
少なくとも1つのテーブルより成るテーブル情報を含む電子文書を受け取り、そして
少なくとも1つのテーブルを、各テーブルの順序に基づくと共に、少なくとも1つのテーブルが少なくとも1つのラベルを含むときに少なくとも1つのラベルにも基づいて、少なくとも1つのテーブルの直線化された表示へと変換する、
という段階を備えた方法。
In a method for converting table information for rendering to a terminal having a limited area display,
Receiving an electronic document comprising table information comprising at least one table, and at least one table based on the order of each table and also based on at least one label when at least one table contains at least one label Convert to a linearized representation of at least one table,
A method with a stage.
少なくとも1つのテーブルを変換する上記段階は、
少なくとも1つのテーブルが所定の順序を有するように少なくとも1つのテーブルを構成し、
少なくとも1つのテーブルが少なくとも1つのラベルを含むときに各ラベルをローカライズし、そして
少なくとも1つのテーブルを、上記所定の順序を有するように構成された少なくとも1つのテーブルに基づくと共に、少なくとも1つのテーブルが少なくとも1つのラベルを含むときに各ローカライズされたラベルにも基づいて、直線化する、
という段階を含む請求項21に記載の方法。
The above stage of converting at least one table is:
Configuring at least one table such that the at least one table has a predetermined order;
Each label is localized when the at least one table includes at least one label, and the at least one table is based on at least one table configured to have the predetermined order, and the at least one table is Linearize based on each localized label when it contains at least one label,
The method of claim 21 comprising the steps of:
各テーブルは、少なくとも1つの行及び少なくとも1つの列に編成された複数のセルを含み、そして少なくとも1つのテーブルを構成する上記段階は、
少なくとも1つのテーブルの自然の順序を識別し、そして少なくとも1つのテーブルが所定の順序以外の自然の順序を有するときに、
所定の順序以外の自然の順序を有する少なくとも1つのテーブルを、各少なくとも1つのテーブルが所定の順序を有するように構成する、
という段階を含む請求項22に記載の方法。
Each table includes a plurality of cells organized in at least one row and at least one column, and the steps of constituting at least one table include:
Identifying the natural order of at least one table, and when the at least one table has a natural order other than a predetermined order,
Configuring at least one table having a natural order other than a predetermined order such that each at least one table has a predetermined order;
23. The method of claim 22, comprising the steps of:
自然の順序を識別する上記段階は、各テーブルに対して、
テーブルの各セルに対して特性ベクトルを決定し、
各セルに対する特性ベクトルに基づいて隣接セル間の距離を決定し、
テーブルの同じ行における隣接セル対間の平均距離と、テーブルの同じ列における隣接セル対間の平均距離とを決定し、そして
これら平均距離に基づいてテーブルの自然の順序を識別する、
という段階を含む請求項23に記載の方法。
The above stage of identifying the natural order is for each table:
Determine the characteristic vector for each cell in the table,
Determine the distance between adjacent cells based on the characteristic vector for each cell;
Determining the average distance between adjacent cell pairs in the same row of the table and the average distance between adjacent cell pairs in the same column of the table, and identifying the natural order of the table based on these average distances;
24. The method of claim 23, comprising the steps of:
少なくとも1つのテーブルを構成する上記段階は、少なくとも1つのテーブルが行主体の順序及び列主体の順序の一方を有するように少なくとも1つのテーブルを構成することを含む請求項22に記載の方法。   23. The method of claim 22, wherein configuring the at least one table comprises configuring the at least one table such that the at least one table has one of a row-major order and a column-major order. ターミナルがパンをサポートするかどうか決定し、ターミナルがパンをサポートする場合には、
少なくとも1つのテーブルを変換するか、電子文書を、少なくとも1つのテーブルを変換せずに転送するかの一方の選択を受け取る、
という段階を更に含み、少なくとも1つのテーブルを変換する上記段階は、上記選択が少なくとも1つのテーブルの変換を含むときに、少なくとも1つのテーブルを変換することを含む請求項21に記載の方法。
Decide if the terminal supports panning, and if the terminal supports panning,
Receiving a choice of either converting at least one table or transferring the electronic document without converting at least one table;
24. The method of claim 21, wherein the step of converting at least one table includes converting at least one table when the selection includes conversion of at least one table.
電子文書内のテーブルの少なくとも1つのラベルをローカライズする方法であって、上記テーブルは、少なくとも1つの行及び少なくとも1つの列に編成された複数のセルを含むものである方法において、
少なくとも1つのスパンラベル及び少なくとも1つのダイレクトラベルの少なくとも一方を識別し、各スパンラベルは、テーブルの複数の列及び行の一方に関連され、そして各ダイレクトラベルは、テーブルの単一の列及び単一の行の一方に関連され、
スパンラベル及びダイレクトラベルの少なくとも一方に関連したテーブルの各セルに対するラベルストリングを決定し、これにより、各スパンラベル及び各ダイレクトラベルをローカライズし、各ラベルストリングは、スパンラベル及びダイレクトラベルの少なくとも1つを含む、
という段階を備えた方法。
A method for localizing at least one label of a table in an electronic document, the table comprising a plurality of cells organized in at least one row and at least one column, wherein:
Identifying at least one of at least one span label and at least one direct label, each span label being associated with one of a plurality of columns and rows of the table, and each direct label being a single column and single of the table Associated with one of the rows,
Determining a label string for each cell of the table associated with at least one of the span label and the direct label, thereby localizing each span label and each direct label, wherein each label string is at least one of the span label and the direct label; including,
A method with a stage.
少なくとも1つのダイレクトラベルを識別する上記段階は、テーブルの隣接行及び隣接列の1つの間の類似性の尺度に基づいて少なくとも1つのダイレクトラベルを識別することを含む請求項27に記載の方法。   28. The method of claim 27, wherein the step of identifying at least one direct label comprises identifying at least one direct label based on a measure of similarity between one of adjacent rows and adjacent columns of the table. 少なくとも1つのダイレクトラベルを識別する上記段階は、
隣接行の各対と隣接列の各対の1つの間の類似性の尺度を決定し、
上記類似性の尺度に基づいて、隣接行の他の対よりも所与のパーセンテージ以上異なる隣接行の対と、隣接列の他の対よりも所与のパーセンテージ以上異なる隣接列の対との1つを識別し、そして
隣接行の上記識別された対の行と、隣接列の上記識別された対の列との1つを、少なくとも1つのダイレクトラベルを含むものとして識別する、
という段階を含む請求項28に記載の方法。
The above steps for identifying at least one direct label include:
Determine a measure of similarity between each pair of adjacent rows and one of each pair of adjacent columns;
Based on the similarity measure, one of a pair of adjacent rows that differs by more than a given percentage from other pairs of adjacent rows and a pair of adjacent columns that differs by more than a given percentage than other pairs of adjacent columns And identifying one of the identified pair of rows of adjacent rows and the identified pair of columns of adjacent columns as including at least one direct label;
30. The method of claim 28, comprising the steps of:
類似性の尺度を決定する上記段階は、
隣接行の各対及び隣接列の各対の一方の各セルに対する特性ベクトルを決定し、
隣接行内の同じ列のセル間の距離と、隣接列内の同じ行のセル間の距離との一方を、各セルに対する特性ベクトルに基づいて決定し、そして
隣接行の列及び隣接列の行の一方を横切る距離を加算する、
という段階を含む請求項29に記載の方法。
The above stage of determining a measure of similarity is:
Determine a characteristic vector for each cell in each pair of adjacent rows and each pair of adjacent columns;
One of the distance between cells in the same column in adjacent rows and the distance between cells in the same row in adjacent columns is determined based on the characteristic vector for each cell, and Add distance across one,
30. The method of claim 29, comprising the steps of:
エリアが限定されたディスプレイを有するターミナルにレンダリングするためにテーブル情報を変換するためのコンピュータプログラム製品であって、コンピュータ読み取り可能なプログラムコード部分が記憶されたコンピュータ読み取り可能な記憶媒体を含むコンピュータプログラム製品において、上記コンピュータ読み取り可能なプログラムコード部分が、
少なくとも1つのテーブルより成るテーブル情報を含む電子文書を受け取るための第1の実行可能な部分と、
少なくとも1つのテーブルを、各テーブルの順序に基づくと共に、少なくとも1つのテーブルが少なくとも1つのラベルを含むときに少なくとも1つのラベルにも基づいて、少なくとも1つのテーブルの直線化された表示へ変換するための第2の実行可能な部分と、
を備えているコンピュータプログラム製品。
A computer program product for converting table information for rendering on a terminal having a limited area display, the computer program product comprising a computer readable storage medium storing a computer readable program code portion Wherein the computer readable program code portion is:
A first executable part for receiving an electronic document comprising table information comprising at least one table;
To convert at least one table to a linearized representation of at least one table based on the order of each table and also based on at least one label when the at least one table includes at least one label A second executable part of
A computer program product equipped with.
上記第2の実行可能な部分は、少なくとも1つのテーブルが所定の順序を有するように少なくとも1つのテーブルを構成し、少なくとも1つのテーブルが少なくとも1つのラベルを含むときに各ラベルをローカライズし、そしてその後、少なくとも1つのテーブルを、上記所定の順序を有するように構成された少なくとも1つのテーブルに基づくと共に、少なくとも1つのテーブルが少なくとも1つのラベルを含むときに各ローカライズされたラベルにも基づいて直線化する請求項31に記載のコンピュータプログラム製品。   The second executable portion configures at least one table such that the at least one table has a predetermined order, localizes each label when the at least one table includes at least one label, and Thereafter, the at least one table is based on at least one table configured to have the predetermined order and is also linear based on each localized label when the at least one table includes at least one label. 32. A computer program product as claimed in claim 31. 各テーブルは、少なくとも1つの行及び少なくとも1つの列に編成された複数のセルを含み、上記第2の実行可能な部分は、少なくとも1つのテーブルの自然の順序を識別し、そして少なくとも1つのテーブルが所定の順序以外の自然の順序を有するときには、所定の順序以外の自然の順序を有する少なくとも1つのテーブルを、各少なくとも1つのテーブルが所定の順序を有するように構成する請求項32に記載のコンピュータプログラム製品。   Each table includes a plurality of cells organized in at least one row and at least one column, the second executable portion identifies a natural order of the at least one table, and the at least one table The at least one table having a natural order other than the predetermined order is configured such that each at least one table has a predetermined order when has a natural order other than the predetermined order. Computer program product. 上記第2の実行可能な部分は、テーブルの各セルに対して特性ベクトルを決定し、各セルに対する特性ベクトルに基づいて隣接セル間の距離を決定し、更に、テーブルの同じ行における隣接セル対間の平均距離と、テーブルの同じ列における隣接セル対間の平均距離とを決定し、その後、これら平均距離に基づいてテーブルの自然の順序を識別することにより、各テーブルに対する自然の順序を識別する請求項32に記載のコンピュータプログラム製品。   The second executable portion determines a characteristic vector for each cell of the table, determines a distance between adjacent cells based on the characteristic vector for each cell, and further determines adjacent cell pairs in the same row of the table. Identify the natural order for each table by determining the average distance between and the average distance between pairs of adjacent cells in the same column of the table, and then identifying the natural order of the tables based on these average distances A computer program product according to claim 32. 上記第2の実行可能な部分は、少なくとも1つのテーブルが行主体の順序及び列主体の順序の一方を有するように少なくとも1つのテーブルを構成する請求項32に記載のコンピュータプログラム製品。   33. The computer program product of claim 32, wherein the second executable portion comprises at least one table such that the at least one table has one of a row-major order and a column-major order. ターミナルがパンをサポートするかどうか決定する第3の実行可能な部分と、
ターミナルがパンをサポートする場合に、少なくとも1つのテーブルを変換するか、電子文書を、少なくとも1つのテーブルを変換せずに転送するかの一方の選択を受け取る第4の実行可能な部分と、
を更に備え、上記第2の実行可能な部分は、その選択が少なくとも1つのテーブルの変換を含むときには、少なくとも1つのテーブルを変換する請求項31に記載のコンピュータプログラム製品。
A third executable part that determines whether the terminal supports panning;
A fourth executable portion that receives a choice of either converting at least one table or transferring an electronic document without converting at least one table if the terminal supports panning;
32. The computer program product of claim 31, further comprising: converting the at least one table when the selection includes conversion of at least one table.
電子文書内のテーブルの少なくとも1つのラベルをローカライズするコンピュータプログラム製品であって、上記テーブルは、少なくとも1つの行及び少なくとも1つの列に編成された複数のセルを含み、更に、コンピュータ読み取り可能なプログラムコード部分が記憶されたコンピュータ読み取り可能な記憶媒体を含むコンピュータプログラム製品において、上記コンピュータ読み取り可能なプログラムコード部分が、
少なくとも1つのスパンラベル及び少なくとも1つのダイレクトラベルの少なくとも一方を識別するための第1の実行可能な部分を備え、各スパンラベルは、テーブルの複数の列及び行の一方に関連され、そして各ダイレクトラベルは、テーブルの単一の列及び単一の行の一方に関連され、そして
スパンラベル及びダイレクトラベルの少なくとも一方に関連したテーブルの各セルに対するラベルストリングを決定し、これにより、各スパンラベル及び各ダイレクトラベルをローカライズするための第2の実行可能な部分を備え、各ラベルストリングは、スパンラベル及びダイレクトラベルの少なくとも1つを含むようにされたコンピュータプログラム製品。
A computer program product for localizing at least one label of a table in an electronic document, the table comprising a plurality of cells organized in at least one row and at least one column, and further comprising a computer readable program In a computer program product comprising a computer readable storage medium having a code portion stored thereon, the computer readable program code portion comprises:
A first executable portion for identifying at least one of at least one span label and at least one direct label, each span label being associated with one of a plurality of columns and rows of the table, and each direct The label is associated with one of the single column and single row of the table, and determines a label string for each cell of the table associated with at least one of the span label and the direct label, whereby each span label and A computer program product comprising a second executable portion for localizing each direct label, wherein each label string includes at least one of a span label and a direct label.
上記第1の実行可能な部分は、テーブルの隣接行及び隣接列の1つの間の類似性の尺度に基づいて少なくとも1つのダイレクトラベルを識別する請求項37に記載のコンピュータプログラム製品。   38. The computer program product of claim 37, wherein the first executable portion identifies at least one direct label based on a measure of similarity between one of adjacent rows and adjacent columns of the table. 上記第1の実行可能な部分は、隣接行の各対と隣接列の各対の1つの間の類似性の尺度を決定し、上記類似性の尺度に基づいて、隣接行の他の対よりも所与のパーセンテージ以上異なる隣接行の対と、隣接列の他の対よりも所与のパーセンテージ以上異なる隣接列の対との1つを識別し、そしてその後、隣接行の上記識別された対の行と、隣接列の上記識別された対の列との1つを、少なくとも1つのダイレクトラベルを含むものとして識別する請求項38に記載のコンピュータプログラム製品。   The first executable portion determines a measure of similarity between each pair of adjacent rows and one of each pair of adjacent columns, and based on the similarity measure, Identify one of a pair of adjacent rows that differs by a given percentage and a pair of adjacent columns that differ by a given percentage more than other pairs of adjacent columns, and then the above identified pair of adjacent rows 40. The computer program product of claim 38, wherein one of the row and the identified pair of columns of adjacent columns is identified as including at least one direct label. 上記第1の実行可能な部分は、隣接行の各対及び隣接列の各対の一方の各セルに対する特性ベクトルを決定し、隣接行内の同じ列のセル間の距離と、隣接列内の同じ行のセル間の距離との一方を、各セルに対する特性ベクトルに基づいて決定し、そしてその後、隣接行の列及び隣接列の行の一方を横切る距離を加算することにより、類似性の尺度を決定する請求項39に記載のコンピュータプログラム製品。   The first executable part determines a characteristic vector for each cell in each pair of adjacent rows and each pair of adjacent columns, and the distance between cells in the same column in adjacent rows and the same in adjacent columns One of the distances between the cells in a row is determined based on the characteristic vector for each cell, and then the similarity measure is calculated by adding the distance across one of the adjacent row column and the adjacent column row. 40. The computer program product of claim 39 to be determined.
JP2004028681A 2004-01-05 2004-01-05 Conversion of table information for rendering on area-restricted display Pending JP2005196711A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004028681A JP2005196711A (en) 2004-01-05 2004-01-05 Conversion of table information for rendering on area-restricted display

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004028681A JP2005196711A (en) 2004-01-05 2004-01-05 Conversion of table information for rendering on area-restricted display

Publications (1)

Publication Number Publication Date
JP2005196711A true JP2005196711A (en) 2005-07-21

Family

ID=34824066

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004028681A Pending JP2005196711A (en) 2004-01-05 2004-01-05 Conversion of table information for rendering on area-restricted display

Country Status (1)

Country Link
JP (1) JP2005196711A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009152673A (en) * 2007-12-18 2009-07-09 Fuji Xerox Co Ltd Image processor and image processing program

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009152673A (en) * 2007-12-18 2009-07-09 Fuji Xerox Co Ltd Image processor and image processing program
JP4569622B2 (en) * 2007-12-18 2010-10-27 富士ゼロックス株式会社 Image processing apparatus and image processing program
US8201084B2 (en) 2007-12-18 2012-06-12 Fuji Xerox Co., Ltd. Image processing apparatus and computer readable medium

Similar Documents

Publication Publication Date Title
KR101117396B1 (en) Platform for rendering content for a remote device
US7565605B2 (en) Reorganizing content of an electronic document
KR100490734B1 (en) Annotation-based automatic document generation apparatus and method
KR100461019B1 (en) web contents transcoding system and method for small display devices
US20060107206A1 (en) Form related data reduction
US8645491B2 (en) Methods and apparatus for enabling a hybrid web and native application
EP3226159A1 (en) System and method for managing browsing histories of web browser
US20090157407A1 (en) Methods, Apparatuses, and Computer Program Products for Semantic Media Conversion From Source Files to Audio/Video Files
JP2004527041A (en) System and method for content delivery over a wireless communication medium to a portable computing device
CN102906737A (en) Method and apparatus for expanded content tag sharing
US11580314B2 (en) Document translation method and apparatus, storage medium, and electronic device
CN101390095A (en) Method, apparatus and computer program product for generating a graphical image string to convey an intended message
CN104462051A (en) Word segmentation method and device
CN111046135A (en) Unstructured text processing method and device, computer equipment and storage medium
US20170329863A1 (en) Methods and Systems for Tagging Documents and for Compressing Tagged Documents
EP2972991A2 (en) Detection and reconstruction of right-to-left text direction, ligatures and diacritics in a fixed format document
CN102577334A (en) Method and apparatus for the automatic predictive selection of input methods for web browsers
WO2023280106A1 (en) Information acquisition method and apparatus, device, and medium
US7761590B2 (en) Method, apparatus, mobile terminal and computer program product for converting from a first forms markup language to a second forms markup language
CN116795780A (en) Document format conversion method and device, storage medium and electronic equipment
JP2005196711A (en) Conversion of table information for rendering on area-restricted display
CN1641632B (en) System, method and terminal for converting form information so as to show it on display device with limit area
EP1550961A1 (en) Handling tabular information
KR20050071843A (en) Transforming tabular information for rendering on a limited-area display
JP7179512B2 (en) Information processing method, information processing device, and program