JP2005196711A - Conversion of table information for rendering on area-restricted display - Google Patents
Conversion of table information for rendering on area-restricted display Download PDFInfo
- Publication number
- JP2005196711A JP2005196711A JP2004028681A JP2004028681A JP2005196711A JP 2005196711 A JP2005196711 A JP 2005196711A JP 2004028681 A JP2004028681 A JP 2004028681A JP 2004028681 A JP2004028681 A JP 2004028681A JP 2005196711 A JP2005196711 A JP 2005196711A
- Authority
- JP
- Japan
- Prior art keywords
- label
- adjacent
- row
- column
- document
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
Description
本発明は、一般に、テーブル情報をレンダリングするためのシステム及び方法に係り、より詳細には、表示エリアが限定されたターミナルにレンダリングするためにテーブル情報を変換するためのメモリを保存するシステム、方法及びコンピュータプログラム製品に係る。 The present invention relates generally to a system and method for rendering table information, and more particularly to a system and method for storing memory for converting table information for rendering to a terminal with a limited display area. And computer program products.
ウェブページやe−メールメッセージやワードプロセスファイルのような電子文書を作成する会社や個人は、通常、ターゲットプラットホームを心に描いている。多くの場合、プラットホームは、適度な記憶容量、メモリ、帯域巾及び大きな(通常は少なくとも対角長さ14インチの)ディスプレイをもつデスクトップコンピュータである。このターゲットプラットホームを心に描いて作成されるファイルは、しばしば、テーブル、フレーム、グラフィック、及びナビゲーション補助手段を伴う複雑なフォーマット情報を含み、これらは、全て、文書をいかにレンダリングすべきか定義するものである。 Companies and individuals who create electronic documents such as web pages, e-mail messages, and word process files typically have a target platform in mind. In many cases, the platform is a desktop computer with moderate storage capacity, memory, bandwidth and a large (usually at least 14 inches diagonal) display. Files created with this target platform in mind often contain complex formatting information with tables, frames, graphics, and navigation aids, all of which define how the document should be rendered. is there.
ユーザは、文書が最初に構成されなかったところの媒体、例えば、インターネットイネーブル型移動電話、パーソナルデジタルアシスタント(PDA)又はハンドヘルドコンピュータを介してこのような文書にアクセスするのを希望することがある。これらの装置は、表示エリアや解像度やレンダリング能力に限度があり、最初に構成された通りに文書をレンダリングできないか、或いは非常に低速及び/又は不便な仕方でしかレンダリングできない。例えば、インターネットイネーブル型移動電話は、通常、数行のテキストしか表示できず、一方、像をレンダリングするためのそれらの能力は、グレースケール又はサムネールサイズの映像或いは全く映像のない状態に制限される。表示が制限される媒体の極端な例は、音声である。この点に関して、AT&T Natural Voices(登録商標)「テキスト対スピーチエンジン」は、テキスト対スピーチ変換を使用して電話を介して文書の内容を口述するサービスへ電話でダイヤルすることによりユーザが電子文書にアクセスするのを許す。しかしながら、この口述は、当然、テキストの一次元「レンダリング」であり、二次元テーブルに埋め込まれた複雑なレイアウト情報を表現することができない。 A user may wish to access such a document via the medium on which the document was not originally configured, such as an Internet-enabled mobile phone, a personal digital assistant (PDA), or a handheld computer. These devices have limited display area, resolution, and rendering capabilities and cannot render the document as originally configured, or can only render in a very slow and / or inconvenient manner. For example, Internet-enabled mobile phones can usually display only a few lines of text, while their ability to render images is limited to grayscale or thumbnail size video or no video at all. . An extreme example of a medium that is limited in display is audio. In this regard, AT & T Natural Voices® “Text-to-Speech Engine” allows a user to dial an electronic document by dialing to a service that dictates the content of the document via the phone using text-to-speech conversion. Allow access. However, this dictation is of course a one-dimensional “rendering” of text and cannot represent complex layout information embedded in a two-dimensional table.
従来、スクリーンサイズ、解像度及びレンダリング能力に限度があるために、最初に構成されたように文書をレンダリングできない装置は、コールされたときに、このような文書を自由にレンダリングする。この点に関して、テーブルのように二次元的にフォーマットされた情報を含む文書については、ある従来の装置は、このようなテーブルを排除する。他の装置は、テーブルの巾が広過ぎるときに装置の表示エリア内に適合させるために1つ以上の選択された列を切断する。更に別の装置は、テーブルの機械的「直線化(linearization)」を実行し、通常、テーブル内のセルのコンテンツの自然の順序を無視して、例えば、左から右へ、上から下への所定の順序でテーブル内のセルを訪れながら、テーブルの各セルを独立してレンダリングする。更に、他の装置は、全テーブルの部分的「ビューポート」のみをレンダリングし、装置のユーザがテーブル内のビューポートを例えば左から右へ移動し、ひいては、テーブルの異なる部分を露呈させたい旨を(例えば、矢印キーを押すことで)指示することを必要とする。テーブルをレンダリングするこのような技術は、時々は充分であるが、全てのテーブルデータを与えるように、且つテーブル内の情報を、その情報を見ているユーザに分かり易くするように、エリア限定ディスプレイにレンダリングするためにテーブル情報を変換する改良されたシステム及び方法を構成することが望まれる。 Traditionally, devices that are unable to render a document as originally configured due to limitations in screen size, resolution, and rendering capabilities are free to render such a document when called. In this regard, for documents that contain information that is two-dimensionally formatted, such as tables, certain conventional devices eliminate such tables. Other devices cut one or more selected rows to fit within the display area of the device when the table is too wide. Yet another device performs a mechanical “linearization” of the table, typically ignoring the natural ordering of the contents of the cells in the table, eg from left to right, top to bottom. Each cell of the table is rendered independently while visiting the cells in the table in a predetermined order. In addition, other devices render only a partial “viewport” of the entire table and the user of the device wishes to move the viewport in the table, for example from left to right, thus exposing a different part of the table. (E.g., by pressing an arrow key). Such a technique for rendering a table is sometimes sufficient, but it provides an area-limited display so as to provide all table data and to make the information in the table easier to understand for the user viewing the information. It would be desirable to construct an improved system and method for converting table information for rendering into
以上の背景に鑑み、本発明の実施形態は、少なくとも1つのテーブルを含むテーブル情報を変換するための改良されたシステム及びその関連ターミナル、方法並びにコンピュータプログラム製品を提供する。本発明の実施形態は、従来の技術とは対照的に、例えば、テーブル内のラベルを、各ラベルに関連したセルにローカライズすることにより、情報を見ているユーザに便利で且つ分かり易いようにテーブルのコンテンツを与えるように、限定エリアディスプレイを有するターミナルにより後でレンダリングするためにテーブルを変換することができる。それ故、このようなターミナルにテーブルをレンダリングするための従来の技術とは対照的に、本発明の実施形態は、このようなテーブルの1つ以上の選択された列を切断するのではなく、テーブル内のセルのコンテンツの自然の順序を無視してテーブルの各セルをレンダリングすることによりテーブルの機械的直線化を実行するのではなく、且つ全テーブルの部分的ビューポートだけをレンダリングして、装置のユーザがビューポートの移動を必要とするのではなく、このようなテーブルの全コンテンツをレンダリングすることができる。 In view of the above background, embodiments of the present invention provide an improved system and associated terminals, methods and computer program products for converting table information including at least one table. In contrast to the prior art, embodiments of the present invention are convenient and understandable for the user viewing the information, for example by localizing the labels in the table into cells associated with each label. To provide the contents of the table, the table can be converted for later rendering by a terminal having a limited area display. Therefore, in contrast to conventional techniques for rendering a table to such a terminal, embodiments of the present invention do not cut one or more selected columns of such a table, Rather than performing a mechanical linearization of the table by rendering each cell of the table ignoring the natural order of the contents of the cells in the table, and rendering only a partial viewport of the entire table, Rather than requiring the user of the device to move the viewport, the entire contents of such a table can be rendered.
本発明の1つの特徴によれば、エリアの限定されたディスプレイを有するターミナルにレンダリングするためのテーブル情報を変換するシステムが提供される。このシステムは、移動ターミナル、原点サーバー、プロキシー/ゲートウェイ、ショートメッセージサービスセンター(SMSC)、マルチメディアメッセージサービスセンター(MMSC)、ゲートウェイGPRSサービスノード(GGSN)、ユーザプロセッサ等のネットワークエンティティを備えている。このネットワークエンティティは、テーブル(1つ又は複数)をより成るテーブル情報を含む電子文書を受信することのできる文書コンバータを備えている。この点に関して、文書コンバータは、テーブル(1つ又は複数)を、各テーブルの順序に基づくと共に、少なくとも1つのテーブルが少なくとも1つのラベルを含むときに少なくとも1つのラベルにも基づいて、テーブルの直線化された表示へと変換することができる。より詳細には、文書コンバータは、各テーブルが行主体の順序又は列主体の順序のような所定の順序を有するようにテーブル(1つ又は複数)を構成することにより、テーブルを変換することができる。次いで、文書コンバータは、テーブルが少なくとも1つのラベルを含むときに各ラベルをローカライズし、そしてその後、テーブルを、所定の順序を有するように構成されたテーブルと、更に、テーブルが少なくとも1つのラベルを含むときには各ローカライズされたラベルとに基づいて、直線化することができる。 In accordance with one aspect of the present invention, a system for converting table information for rendering to a terminal having a limited area display is provided. The system comprises network entities such as a mobile terminal, origin server, proxy / gateway, short message service center (SMSC), multimedia message service center (MMSC), gateway GPRS service node (GGSN), user processor and the like. The network entity comprises a document converter capable of receiving an electronic document containing table information consisting of table (s). In this regard, the document converter may determine the table line (s) based on the order of each table and also based on at least one label when at least one table includes at least one label. Can be converted into a customized display. More specifically, the document converter may convert the tables by configuring the table (s) so that each table has a predetermined order, such as a row-oriented order or a column-oriented order. it can. The document converter then localizes each label when the table includes at least one label, and then converts the table into a table configured to have a predetermined order, and the table further includes at least one label. When included, it can be linearized based on each localized label.
文書コンバータは、ターミナルがパンをサポートするかどうか決定することができる。ターミナルがパンをサポートしない場合には、文書コンバータは、テーブルを変換するか、又は電子文書を、テーブルを変換せずにターミナル等へ転送するかのいずれかの選択を受け取ることができる。その後、その選択がテーブルの変換を含むときには、文書コンバータがテーブルを変換することができる。 The document converter can determine whether the terminal supports panning. If the terminal does not support panning, the document converter can receive a choice of either converting the table or transferring the electronic document to the terminal or the like without converting the table. Then, when the selection includes table conversion, the document converter can convert the table.
明らかなように、各テーブルは、少なくとも1行及び少なくとも1列に編成された複数のセルを含むことができ、そして通常それを含む。それ故、文書コンバータは、テーブル(1つ又は複数)の自然の順序を識別することによりテーブルを構成し、そしてテーブルが所定の順序以外の自然の順序を有するときには、所定の順序以外の自然の順序を有するテーブルを、各テーブルが所定の順序を有するように構成することができる。文書コンバータは、多数の異なるやり方で自然の順序を決定することができる。例えば、文書コンバータは、テーブルの各セルに対して特性ベクトルを決定し、そして各セルに対する特性ベクトルに基づいて隣接セル間の距離を決定することができる。その後、文書コンバータは、テーブルの同じ行における隣接セル対間の平均距離と、テーブルの同じ列における隣接セル対間の平均距離とを決定することができる。次いで、文書コンバータは、これら平均距離に基づいてテーブルの自然の順序を識別することができる。 As will be apparent, each table can and usually includes a plurality of cells organized in at least one row and at least one column. Therefore, the document converter constructs a table by identifying the natural order of the table (s), and when the table has a natural order other than a predetermined order, A table having an order can be configured such that each table has a predetermined order. The document converter can determine the natural order in a number of different ways. For example, the document converter can determine a characteristic vector for each cell in the table and determine a distance between adjacent cells based on the characteristic vector for each cell. The document converter can then determine the average distance between adjacent cell pairs in the same row of the table and the average distance between adjacent cell pairs in the same column of the table. The document converter can then identify the natural order of the table based on these average distances.
文書コンバータは、同様に、各テーブル内のラベル(1つ又は複数)を多数の異なるやり方でローカライズすることができる。例えば、文書コンバータは、1つ以上のスパンラベル及び/又は1つ以上のダイレクトラベルを識別することができる。明らかなように、各スパンラベルは、テーブルの複数の列又は行に関連され、そして各ダイレクトラベルは、テーブルの単一の列又は行に関連される。スパンラベル又はダイレクトラベルを識別した後に、文書コンバータは、スパンラベル及び/又はダイレクトラベルに関連したテーブルの各セルに対するラベルストリングを決定し、これにより、ラベルが指すテーブルのセルに対して各スパンラベル及び各ダイレクトラベルをローカライズすることができ、各ラベルストリングは、スパンラベル及びダイレクトラベルの少なくとも1つを含む。 The document converter can similarly localize the label (s) in each table in a number of different ways. For example, the document converter can identify one or more span labels and / or one or more direct labels. As will be apparent, each span label is associated with multiple columns or rows of the table, and each direct label is associated with a single column or row of the table. After identifying the span label or direct label, the document converter determines a label string for each cell of the table associated with the span label and / or direct label, thereby each span label for the table cell to which the label points. And each direct label can be localized, and each label string includes at least one of a span label and a direct label.
文書コンバータは、テーブルの隣接行及び隣接列間の類似性の尺度に基づいてダイレクトラベル(1つ又は複数)を識別することができる。例えば、文書コンバータは、隣接行又は列の各対間の類似性の尺度を決定することができる。例えば、文書コンバータは、隣接行又は列の各対の各セルに対する特性ベクトルを決定し、そして同じ列又は行におけるセル間の距離を、各セルに対する特性ベクトルに基づいて各々決定することにより、類似性の尺度を決定することができる。その後、文書コンバータは、隣接行の列又は隣接列の行を横切る距離を加算して、隣接行又は列間の類似性の尺度を各々決定することができる。次いで、類似性の尺度を決定した後に、文書コンバータは、類似性の尺度に基づいて、隣接行又は列の他の対よりも所与パーセンテージ以上異なる隣接行又は列の対を識別することができる。次いで、文書コンバータは、隣接行又は列の識別された対の行又は列を、少なくとも1つのダイレクトラベルを含むものとして各々識別することができる。 The document converter can identify the direct label (s) based on a measure of similarity between adjacent rows and adjacent columns of the table. For example, the document converter can determine a measure of similarity between each pair of adjacent rows or columns. For example, the document converter determines the characteristic vector for each cell in each pair of adjacent rows or columns, and determines the distance between cells in the same column or row based on the characteristic vector for each cell, respectively. A measure of gender can be determined. The document converter can then add the distances across adjacent row columns or adjacent column rows to determine a measure of similarity between adjacent rows or columns, respectively. Then, after determining the similarity measure, the document converter can identify adjacent row or column pairs that differ by a given percentage or more from other pairs of adjacent rows or columns based on the similarity measure. . The document converter can then identify each identified pair of rows or columns of adjacent rows or columns as including at least one direct label.
本発明の他の特徴によれば、少なくとも1つのテーブルより成るテーブル情報を変換するためのターミナル、方法及びコンピュータプログラム製品が提供される。それ故、本発明の実施形態は、少なくとも1つのテーブルより成るテーブル情報を変換するためのシステム及び関連ターミナル、方法及びコンピュータプログラム製品を提供する。本発明の実施形態のシステム及び関連ターミナル、方法及びコンピュータプログラム製品は、移動電話のようなターミナルによりその後にレンダリングするためにテーブルを変換することができる。従来の技術とは対照的に、このシステム及び関連ターミナル、方法及びコンピュータプログラム製品は、ターミナルがテーブルの全コンテンツを与えることができるようにテーブルを変換することができる。更に、このシステム及び関連ターミナル、方法及びコンピュータプログラム製品は、テーブルの最初の構成と一貫したやり方でテーブルをレンダリングできるように、テーブル内のラベルを、各ラベルに関連したセルへローカライズすることができる。それ故、本発明の実施形態のシステム及び関連ターミナル、方法及びコンピュータプログラム製品は、公知技術により示された問題を解消し、付加的な効果を発揮する。 According to another aspect of the present invention, a terminal, method and computer program product for converting table information comprising at least one table are provided. Therefore, embodiments of the present invention provide a system and associated terminal, method and computer program product for converting table information comprising at least one table. The system and associated terminals, methods, and computer program products of embodiments of the present invention can convert tables for subsequent rendering by terminals such as mobile phones. In contrast to the prior art, the system and associated terminals, methods and computer program products can convert tables so that the terminal can provide the full contents of the table. In addition, the system and associated terminals, methods, and computer program products can localize the labels in the table to the cell associated with each label so that the table can be rendered in a manner consistent with the initial configuration of the table. . Therefore, the system and related terminals, methods, and computer program products of the embodiments of the present invention solve the problems shown by the known technology and exert additional effects.
本発明を以上に一般的に述べたが、添付図面を参照して本発明を以下に詳細に説明する。
本発明の好ましい実施形態が示された添付図面を参照して、本発明を以下に詳細に説明する。しかしながら、本発明は、多数の異なる形態で実施することができ、ここに示す実施形態に限定されるものではなく、むしろ、これらの実施形態は、その開示が本発明の概念を当業者に完全に伝えるために記載するものである。全体を通じて同じ要素は同じ参照番号で示す。
Having generally described the invention, the invention will now be described in detail with reference to the accompanying drawings.
The present invention will now be described in detail with reference to the accompanying drawings, in which preferred embodiments of the invention are shown. The present invention may, however, be embodied in many different forms and should not be construed as limited to the embodiments set forth herein; rather, these embodiments will fully convey the concept of the invention to those skilled in the art. It is described to convey to. Like elements are designated by like reference numerals throughout.
図1には、本発明から利益が得られるターミナル及びシステムの1つの形式が示されている。本発明の実施形態のシステム、ターミナル、方法及びコンピュータプログラム製品は、主として、移動通信アプリケーションに関連して説明する。しかしながら、本発明の実施形態のシステム、ターミナル、方法及びコンピュータプログラム製品は、移動通信産業及びそれ以外の産業において種々の他のアプリケーションに関連して使用できることも理解されたい。例えば、本発明の実施形態のシステム、ターミナル、方法及びコンピュータプログラム製品は、ワイヤライン及び/又はワイヤレスネットワーク(例えば、インターネット)アプリケーションに関連して使用することができる。 FIG. 1 illustrates one type of terminal and system that would benefit from the present invention. The systems, terminals, methods and computer program products of embodiments of the present invention will be described primarily in the context of mobile communication applications. However, it should also be understood that the systems, terminals, methods and computer program products of embodiments of the present invention can be used in connection with various other applications in the mobile communications industry and other industries. For example, the systems, terminals, methods, and computer program products of embodiments of the present invention can be used in connection with wireline and / or wireless network (eg, Internet) applications.
図示されたように、ターミナル10は、ベースサイト又はベースステーション(BS)14へ信号を送信し及びそこから信号を受信するためのアンテナ12を備えている。このベースステーションは、ネットワークを動作するのに必要な要素、例えば、移動交換センター(MSC)16を含むセルラーネットワークの一部分である。当業者に明らかなように、セルラーネットワークは、ベースステーション/MSC/インターワーキングファンクション(BMI)とも称される。動作に際し、MSCは、ターミナルがコールを発信し及び受信するときに、ターミナルへ及びターミナルからコールをルーティングすることができる。又、MSCは、ターミナルがコールに参加するときに地上線トランクへの接続を与えることもできる。更に、MSCは、ターミナルへの及びターミナルからのメッセージの転送を制御できると共に、メッセージセンターへの及びそこからのターミナルメッセージの転送、例えば、SMSセンター(SMSC)17への及びそこからのショートメッセージサービス(SMS)メッセージの転送も制御することができる。
As shown, the terminal 10 includes an
MSC16は、ローカルエリアネットワーク(LAN)、メトロポリタンエリアネットワーク(MAN)及び/又はワイドエリアネットワーク(WAN)のようなデータネットワークに接続することができる。MSCは、データネットワークに直接接続することができる。しかしながら、1つの典型的な実施形態では、MSCは、プロキシー18、ゲートウェイ(GTW)等に接続され、そしてプロキシーは、インターネット20のようなWANに接続される。例えば、MSCは、ワイヤレスアプリケーションプロトコル(WAP)GTWに接続することができ、これは、インターネットに接続される。次いで、処理要素のような装置(例えば、パーソナルコンピュータ、サーバーコンピュータ等)を、インターネットを経てターミナル10に接続することができる。例えば、以下に説明するように、処理要素は、原点サーバー22等に関連した1つ以上の処理要素を含むことができ、その1つが図1に示されている。
The
又、BS14は、シグナリングGPRS(汎用パケット無線サービス)サポートノード(SGSN)24に接続することもできる。当業者に知られているように、SGSNは、通常、パケット交換サービスに対してMSC16と同様の機能を遂行することができる。SGSNは、MSCと同様に、インターネット20のようなデータネットワークに接続することができる。SGSNは、データネットワークに直接接続することができる。しかしながら、より一般的な実施形態では、SGSNは、GPRSコアネットワーク26のようなパケット交換コアネットワークに接続される。パケット交換コアネットワークは、次いで、別のGTW、例えば、GTW GPRSサポートノード(GGSN)28に接続され、このGGSNがインターネットに接続される。又、GGSNは、メッセージセンター、例えば、マルチメディアメッセージサービス(MMS)センター30に接続することもできる。この点に関して、GGSN及びSGSNは、MSCと同様に、MMSメッセージのようなメッセージの転送を制御することができる。又、GGSN及びSGSNは、メッセージセンターへの及びそこからのターミナルメッセージの転送も制御することができる。
The
更に、SGSN24をGPRSコアネットワーク26及びGGSN28に接続することにより、原点サーバー22のような装置を、インターネット20、SGSN及びGGSNを経てターミナル10へ接続することができる。この点について、原点サーバーのような装置は、SGSN、GPRS及びGGSNを横切ってターミナルと通信することができる。例えば、原点サーバーは、マルチメディアブロードキャストマルチキャストサービス(MBMS)に基づいてターミナルへコンテンツを供給することができる。MBMSの詳細な情報については、参考としてその内容をここに取り上げる「Multimedia Broadcast Multicast Service (MBMS)」と題する第三世代パートナーシッププロジェクト(3GPP)技術仕様書3GPP TS22.146を参照されたい。
Further, by connecting the
ターミナル10は、更に、1つ以上のワイヤレスアクセスポイント(AP)32に接続することができる。APは、例えば、WLAN技術を含む高周波(RF)、ブルーツース(BT)、赤外線(IrDA)又は多数の異なるワイヤレスネットワーク技術のような技術に基づいてターミナルと通信するように構成されたアクセスポイントである。それに加えて又はそれとは別に、ターミナルは、1つ以上のユーザプロセッサ34に接続することができる。各ユーザプロセッサは、パーソナルコンピュータ、ラップトップコンピュータ等のコンピュータシステムを含むことができる。この点に関して、ユーザプロセッサは、LAN及び/又はWLAN技術を含むRF、BT、IrDA又は多数の異なるワイヤライン又はワイヤレス通信技術のような技術に基づいてターミナルと通信するように構成することができる。それに加えて又はそれとは別に、ユーザプロセッサの1つ以上は、コンテンツを記憶することのできる取り外し可能なメモリを含むことができ、コンテンツは、その後、ターミナルへ転送することができる。
AP32及びユーザプロセッサ34は、インターネット20に接続することができる。MSC16と同様に、AP及びユーザプロセッサは、インターネットに直結することができる。しかしながら、1つの効果的な実施形態では、APは、プロキシー18を経てインターネットに間接的に接続される。明らかなように、ターミナル及び原点サーバー22、並びに多数の他の装置のいずれかをインターネットに直接的又は間接的に接続することにより、ターミナルは、互いに、且つ原点サーバー等と通信して、ターミナルの種々の機能を果たすことができ、例えば、原点サーバーへデータ、コンテンツ等を送信し及び/又は原点サーバーからコンテンツ、データ等を受信することができる。ここで使用する「データ」、「コンテンツ」、「情報」及び同様の用語は、本発明の実施形態に基づいて送信、受信及び/又は記憶することのできるデータを指すように交換可能に使用することができる。従って、このような用語の使用は、本発明の精神及び範囲を限定するものではない。
The
図2には、ネットワークエンティティ、例えば、ターミナル10、原点サーバー22、プロキシー18、SMSC17、MMSC30、GGSN28及び/又はユーザプロセッサ34として動作することのできるネットワークエンティティのブロック図が、本発明の一実施形態に基づいて示されている。個別のエンティティとして示されているが、ある実施形態では、論理的に分離されるがエンティティ内に共通配置されるターミナル、プロキシー、原点サーバー及び/又はユーザプロセッサの1つ以上を1つ以上のエンティティでサポートしてもよい。例えば、論理的に別々であるが共通配置されたターミナル及びプロキシーを単一のエンティティでサポートすることができる。又、例えば、論理的に別々であるが共通配置された原点サーバー及びユーザプロセッサを単一のエンティティでサポートすることもできる。
FIG. 2 illustrates a block diagram of a network entity that can operate as a network entity, eg, terminal 10,
図示されたように、ネットワークエンティティは、一般に、メモリ38に接続されたプロセッサ36を含むことができる。又、プロセッサは、少なくとも1つのインターフェイス40や、データ、コンテンツ等を送信及び/又は受信するための他の手段にも接続することができる。メモリは、揮発性及び/又は不揮発性メモリであり、通常、コンテンツ、データ等を記憶する。例えば、メモリは、通常、本発明の実施形態に基づきエンティティの動作に関連したステップを実行するためにプロセッサに対するソフトウェアアプリケーション、命令等を記憶する。更に、以下に述べるように、メモリは、ターミナル10によりレンダリングするためにテーブル情報を変換することのできる文書コンバータを記憶することもできる。又、例えば、メモリは、別のネットワークエンティティのようなネットワークエンティティから送信されるか又はそれにより受信されるコンテンツを記憶することもできる。
As shown, the network entity may generally include a
図3は、本発明の実施形態に基づきターミナル10として動作することのできる移動ステーションの機能図である。図示して以下に説明する移動ステーションは、本発明から利益が得られるターミナルの一形式を単に例示するものに過ぎず、それ故、本発明の範囲を何ら限定するものではないことを理解されたい。移動ステーションの多数の実施形態を図示して以下に説明するが、ポータブルデジタルアシスタント(PDA)、ページャー、ラップトップコンピュータのような他の形式の移動ステーション、並びに他の形式の音声及びテキスト通信システムも、本発明を容易に使用することができる。 FIG. 3 is a functional diagram of a mobile station that can operate as a terminal 10 according to an embodiment of the present invention. It should be understood that the mobile station shown and described below is merely illustrative of one type of terminal that would benefit from the present invention and therefore does not limit the scope of the invention in any way. . Many embodiments of mobile stations are illustrated and described below, but other types of mobile stations such as portable digital assistants (PDAs), pagers, laptop computers, and other types of voice and text communication systems are also available. The present invention can be easily used.
移動ステーションは、送信器42と、受信器44と、これら送信器及び受信器へ信号を供給すると共にそこから信号を受信するコントローラ46のようなプロセッサとを備えている。これらの信号は、適用可能なセルラーシステムのエアインターフェイス規格に基づくシグナリング情報と、ユーザスピーチ及び/又はユーザ発生データも含む。この点に関して、移動ステーションは、1つ以上のエアインターフェイス規格、通信プロトコル、変調形式及びアクセス形式で動作することができる。より詳細には、移動ステーションは、多数の第一世代(1G)、第二世代(2G)、2.5G及び/又は第三世代(3G)通信プロトコル等のいずれかに基づいて動作することができる。例えば、移動ステーションは、2Gワイヤレス通信プロトコルIS−136(TDMA)、GSM及びIS−95(CDMA)に基づいて動作することができる。又、例えば、移動ステーションは、2.5Gワイヤレス通信プロトコルGPRS、エンハンストデータGSMエンビロンメント(EDGE)等に基づいて動作することもできる。それに加えて又はそれとは別に、移動ステーションは、DVB技術(例えば、DVB−T、ETSI規格EN300 744)のような多数の異なるデジタルブロードキャスティング技術のいずれかに基づいて動作することもできる。又、移動ステーションは、MBMS技術(例えば、3GPP TS22.146)のような多数の異なるブロードキャスト及び/又はマルチキャスト技術のいずれかに基づいて動作することもできる。更に、移動ステーションは、ISDB−T、DAB、ATSC技術等に基づいて動作することもできる。ある狭帯域AMPS(NAMPS)並びにTACS移動ステーションも、二重又はそれ以上のモードの移動ステーション(例えば、デジタル/アナログ又はTDMA/CDMAアナログ電話)と同様に、本発明の実施形態から利益を得ることができる。
The mobile station includes a
コントローラ46は、移動ステーションの音声及びロジック機能を実施するのに必要な回路を含む。例えば、コントローラは、デジタル信号プロセッサ装置、マイクロプロセッサ装置、並びに種々のアナログ/デジタルコンバータ、デジタル/アナログコンバータ及び他のサポート回路で構成される。移動ステーションの制御及び信号処理機能は、それらの各能力に基づいてこれらの装置間に割り当てられる。従って、コントローラは、変調及び送信の前にメッセージ及びデータを畳み込み式にエンコード及びインターリーブする機能も含む。コントローラは、更に、内部音声コーダ(VC)46Aを含むことができ、そして内部データモデム(DM)46Bを含んでもよい。更に、コントローラは、メモリに記憶できる1つ以上のソフトウェアアプリケーションを動作する機能を含んでもよい。
The
又、移動ステーションは、従来のイアホン又はスピーカ48、リンガー50、マイクロホン52、ディスプレイ54及びユーザ入力インターフェイスを含むユーザインターフェイスも備えており、これらは全てコントローラ46に接続される。移動ステーションがデータを受信できるようにするユーザ入力インターフェイスは、移動ステーションがデータを入力できるようにする多数の装置、例えば、キーパッド56、タッチディスプレイ(図示せず)又は他の入力装置のいずれかを含むことができる。キーパッドを含む実施形態では、キーパッドは、従来の数字キー(0−9)及び関連キー(#、*)と、移動ステーションを動作するのに使用される他のキーとを備えている。
The mobile station also includes a user interface including a conventional earphone or
又、移動ステーションは、多数の異なるワイヤライン及び/又はワイヤレス技術のいずれかに基づいて、別のターミナル10、プロキシー18、原点サーバー22、AP32、ユーザプロセッサ24等の電子装置からデータを得及び/又はそれを共用するための1つ以上の手段を含むことができる。例えば、移動ステーションは、これが高周波及び/又は赤外線技術に基づいてデータを得及び/又はデータを共用できるように高周波(RF)トランシーバ58及び/又は赤外線(IR)トランシーバ60を含むことができる。又、例えば、移動ステーションは、これがブルーツース転送技術に基づいてデータを得及び/又はデータを共用できるようにブルーツース(BT)トランシーバ62を含むことができる。図示されていないが、移動ステーションは、それに加えて又はそれとは別に、LAN及び/又はWLAN技術を含む多数の異なるワイヤライン及び/又はワイヤレスネットワーク技術に基づいて電子装置へデータを送信し及び/又はそこからデータを受信することもできる。
The mobile station can also obtain and / or obtain data from electronic devices such as another terminal 10,
更に、移動ステーションは、通常、移動加入者に関連した情報エレメントを記憶する加入者認識モジュール(SIM)64、取り外し可能なユーザ認識モジュール(R−UIM)等のメモリを含むことができる。SIMに加えて、移動ステーションは、他のメモリを含むことができる。この点に関して、移動ステーションは、揮発性メモリ66及び/又は他の不揮発性メモリ68を含むことができ、これは、埋め込むこともできるし及び/又は取り外し可能であってもよい。例えば、他の不揮発性メモリは、埋め込まれた又は取り外し可能なマルチメディアメモリカード(MMC)、メモリスティック、EEPROM、フラッシュメモリ、ハードディスク等を含むことができる。
In addition, the mobile station can typically include a memory, such as a subscriber identity module (SIM) 64, a removable user identity module (R-UIM), which stores information elements associated with the mobile subscriber. In addition to the SIM, the mobile station can include other memories. In this regard, the mobile station can include
メモリ64、66、68は、移動ステーションの機能を実施するために移動ステーションにより使用される情報及びデータの多数の断片を記憶することもできる。例えば、メモリは、MSC16に対して移動ステーションを独特に識別することのできる国際移動装置識別(IMEI)コード、国際移動加入者識別(IMSI)コード、移動ステーションサービス総合デジタル網(MSISDN)コード等の識別子を記憶することができる。又、メモリは、原点サーバー22及び/又はユーザプロセッサ34から受け取られるようなコンテンツも記憶することができる。又、例えば、メモリは、従来のテキストビューア、音声プレーヤ、映像プレーヤ、マルチメディアビューア等の1つ以上のプレゼンテーションアプリケーションを記憶することもできる。更に、以下に述べるように、メモリは、移動ステーションによりレンダリングするためのテーブル情報を変換することのできる文書コンバータを記憶することもできる。
背景技術で説明したように、ターミナル10は、一般に、ターミナルの表示エリア、解像度及びレンダリング能力に限度があるために、電子文書を、その文書が最初に構成された通りにレンダリングすることができない。例えば、多くのターミナルが、通常、ディスプレイ(例えばディスプレイ54)にレンダリングできるのは、数行のテキストと、グレースケール像又はサムネールサイズ像又は全く像のない状態に過ぎない。この点に関して、ターミナルは、一般に、電子文書のテーブル情報を、そのテーブル情報が最初に構成された通りにレンダリングすることができない。例えば、ある従来の装置は、このようなテーブル情報を削除する。他の装置は、テーブルの選択された列(1つ又は複数)を切除するか、又はテーブルの機械的な直線化を実行し、通常、テーブル内のセルのコンテンツの自然の順序を無視してテーブルの各セルを独立してレンダリングする。更に別の装置は、全テーブルの部分的ビューポートだけをレンダリングし、装置のユーザがテーブル内のビューポートを例えば左から右へ移動し、ひいては、テーブルの異なる部分を露呈することを必要とする。 As described in the background art, terminal 10 is generally unable to render an electronic document as it was originally configured due to limitations in terminal display area, resolution, and rendering capabilities. For example, many terminals can usually render on a display (eg, display 54) with only a few lines of text and a grayscale or thumbnail size image or no image at all. In this regard, the terminal is generally unable to render the table information of the electronic document as it was originally configured. For example, some conventional devices delete such table information. Other devices either excise the selected column (s) of the table or perform a mechanical linearization of the table, usually ignoring the natural order of the contents of the cells in the table Render each table cell independently. Yet another device renders only a partial viewport of the entire table, requiring the user of the device to move the viewport in the table, for example from left to right, thus exposing a different portion of the table. .
それ故、本発明の実施形態は、表示エリア、解像度及び/又はレンダリング能力に限度のあるディスプレイを有するターミナルによりレンダリングするために電子文書を変換することができる。より詳細には、本発明の実施形態は、このようなターミナルによりレンダリングするために電子文書のテーブル情報を変換することができる。それ故、このようなターミナルにテーブルをレンダリングする従来の技術とは対照的に、本発明の実施形態は、このようなテーブルの1つ以上の選択された列を切除するのではなく、テーブル内のセルのコンテンツの自然の順序を無視してテーブルの各セルをレンダリングすることによりテーブルの機械的直線化を実行するのではなく、且つ全テーブルの部分的ビューポートだけをレンダリングして、装置のユーザがビューポートを移動するのを必要とするのではなく、このようなテーブルの全コンテンツをレンダリングすることができる。 Thus, embodiments of the present invention can convert an electronic document for rendering by a terminal having a display with limited display area, resolution, and / or rendering capabilities. More particularly, embodiments of the present invention can convert table information of an electronic document for rendering by such a terminal. Thus, in contrast to conventional techniques for rendering a table in such a terminal, embodiments of the present invention do not cut one or more selected columns of such a table, but instead in the table. Rather than performing a mechanical linearization of the table by rendering each cell of the table ignoring the natural order of the contents of the cells, and rendering only a partial viewport of the entire table, Rather than requiring the user to move the viewport, the entire contents of such a table can be rendered.
本発明の実施形態によれば、電子文書のテーブル情報は、一般に、データ、情報等のコンテンツの二次元マトリクスを各々カプセル化する1つ以上のテーブルを備えている。当業者に明らかなように、このような二次元のテーブルは、一般に、少なくとも1つの行及び少なくとも1つの列を含む。又、このようなテーブルは、複雑な構造(例えば、ネスト状のテーブル又は映像)を含んでもよいが、通常は含まない。更に、このようなテーブルの行(1つ又は複数)と列(1つ又は複数)との間には、通常、シンタクチック及びセマンチックの両コヒレンスの高いレベルが存在する。 According to an embodiment of the present invention, the table information of an electronic document generally comprises one or more tables each encapsulating a two-dimensional matrix of content such as data, information, etc. As will be apparent to those skilled in the art, such a two-dimensional table typically includes at least one row and at least one column. Also, such a table may include a complex structure (eg, a nested table or video), but usually does not. In addition, there is typically a high level of both syntactic and semantic coherence between the row (s) and column (s) of such a table.
図4及び5について説明する。これらは、各々、プロキシー18の機能的ブロック図、及び本発明の一実施形態に基づき電子文書のテーブル情報を変換する方法のフローチャートである。より詳細には、図4は、本発明の1つの効果的な実施形態に基づき、ターミナル10、原点サーバー22、SMSC17、MMSC30、GGSN28、ユーザプロセッサ34等のコンテンツソース100から電子文書を受け取りそしてその後に転送するプロキシーの機能的ブロック図である。しかしながら、電子文書を転送する前に、プロキシーは、文書コンバータ102を動作することができ、この文書コンバータは、電子文書を受け取り、その後、ターミナル10によりレンダリングするために文書のテーブル情報を変換することができる。次いで、プロキシーは、変換されたテーブル情報を含む電子文書をターミナルへ転送し、ターミナル、又はより詳細には、ターミナルのディスプレイ(例えばディスプレイ56)によりレンダリングする。
4 and 5 will be described. These are respectively a functional block diagram of the
プロキシー18は、図示して説明する文書コンバータ102を動作するが、この文書コンバータは、例えば、ターミナル10自体又はコンテンツソース100を含むシステム内の多数の異なるネットワークエンティティのどれからでも動作できることを理解されたい。この点について、文書コンバータは、単一ネットワークエンティティにおいて実施することもできるし、或いは文書コンバータの各部分を2つ以上のネットワークエンティティにおいて実施することもできる。又、ここに述べるように、文書コンバータは、通常、メモリ(例えばメモリ38)に記憶してプロセッサ(例えばプロセッサ36)により動作できるソフトウェアで構成される。しかしながら、文書コンバータは、本発明の精神及び範囲から逸脱せずに、ファームウェア又はハードウェアで構成されてもよいことを理解されたい。更に、文書コンバータは、ターミナルによる電子文書のレンダリングを容易にするためにテーブルの変換以外のオペレーションを電子文書に対して実行できることを理解されたい。種々のこのようなオペレーションについての詳細な情報は、例えば、参考としてその内容をここに援用する2001年5月8日に出願された「Reorganizing Content of an Electronic Document」と題する米国特許出願第09/851,404号で、2003年3月6日に米国特許出願公告第2003/0046318号として公告されたものを参照されたい。
The
図5のブロック104に示されたように、少なくとも1つのテーブルを含むテーブル情報を変換する方法は、コンテンツソース100から電子文書を受け取る文書コンバータ102を備えている。本発明の実施形態によれば、電子文書は、1つ以上のテーブルを含み、そして各テーブルは、コンテンツの少なくとも1つの行と、コンテンツの少なくとも1つの列とを含む。電子文書は、多数の異なるフォーマットのいずれかをとることができる。例えば、電子文書は、ハイパーテキスト転送プロトコル(HTTP)文書、e−メール文書、ポータブルドキュメントフォーマット(PDF)文書、ポストスクリプト文書、ASCIIテキストフォーマット(TXT)文書、拡張可能なマークアップ言語(XML)文書、Microsoft Word(登録商標)(DOC)文書、Microsoft Excel(登録商標)(XLS)文書等を含む。
As shown in
電子文書を受信した後に、文書コンバータ102は、ブロック106に示すように、電子文書を、電子文書の中間データ構造表示へと変換することができる。文書コンバータは、多数の異なるやり方のいずれかで電子文書を変換して、電子文書を表わすことのできる多数の異なる中間データ構造体のいずれかを発生することができる。この点について、文書コンバータは、電子文書を、電子文書の共通の内部ツリーベース表示より成る中間データ構造体へと変換することができる。例えば、文書コンバータは、電子文書を、電子文書の拡張可能なハイパーテキストマークアップ言語(XHTML)ドキュメントオブジェクトモデル(DOM)表示へと変換することができる。
After receiving the electronic document,
文書コンバータ102は、電子文書を、多数の異なるやり方でXHTML DOMデータ構造体へと変換することができる。一実施形態では、例えば、データコンバータは、電子文書をHTML文書へ変換し(まだHTML文書でない場合)、次いで、HTML文書をXHTML文書へ変換し、そしてその後、XHTML文書をXHTML DOMデータ構造体へと変換することにより、電子文書を変換する。電子文書を上記フォーマットの文書へ変換して、XHTML DOMデータ構造体を発生するために、文書コンバータは、多数の異なる既知の変換ルーチンのいずれかを実行することができる。
それに加えて又はそれとは別に、文書コンバータ102は、プロキシー18又は別のネットワークエンティティで動作している別のソフトウェア、ハードウェア又はファームウェアモジュールと通信することができ、ここで、他のモジュールは、文書コンバータが電子文書をXHTML DOMデータ構造体へ変換するのを助けるために1つ以上の変換ルーチンを実行することができる。例えば、文書コンバータは、wvWareプロジェクトのもとで開発されたwvWareソフトウェアパッケージと通信して、DOC文書をHTML文書へと変換することができる。又、例えば、文書コンバータは、Chicagoプロジェクトのもとで開発されたxlHtmlソフトウェアパッケージと通信して、XLS文書をHTML文書へ変換することができる。次いで、例えば、文書コンバータは、Tidyプロジェクトのもとで開発されたHTML Tidyソフトウェアパッケージと通信して、HTML文書をXHTML文書へ変換することができる。
In addition or alternatively, the
更に、例えば、文書コンバータ102は、Xerces XMLパーズソフトウェアパッケージ(Apache XMLプロジェクトのもとで開発された)のようなXMLパーザーと通信して、XHTML文書をXHTML DOMデータ構造体へと変換することができる。文書コンバータが、電子文書を、その電子文書を表わすデータ構造体へといかに変換するかに拘らず、データ構造体は、文書コンバータ及び電子文書が通常存在する不揮発性メモリではなく、揮発性メモリに記憶することができるが、そうである必要はない。明らかなように、データ構造体は、通常、基礎となるHTML文書のタグをベースとする変換されたXHTML文書のタグに対応する多数のノードを含む。例えば、HTML文書に対する次のソースコードについて考える。
<html>
<body>
<img src=“http://www.domain.com/img/image.gif”/>
<table>
<tr>
<td> This is the first cell </td>
<td> <img src=”http://www.domain.com/img/image2.gif”/></td>
<td> This is the third cell </td>
</tr>
<tr>
<td> This is the fourth cell </td>
<td> <img src=”http://www.domain.com/img/image3.gif”/></td>
<td> This is the sixth cell </td>
</tr>
</table>
<small>
A text block
</small>
</body>
</html>
Further, for example, the
<html>
<body>
<img src = “http://www.domain.com/img/image.gif” />
<table>
<tr>
<td> This is the first cell </ td>
<td><img src = ”http://www.domain.com/img/image2.gif” /></td>
<td> This is the third cell </ td>
</ tr>
<tr>
<td> This is the fourth cell </ td>
<td><img src = ”http://www.domain.com/img/image3.gif” /></td>
<td> This is the sixth cell </ td>
</ tr>
</ table>
<small>
A text block
</ small>
</ body>
</ html>
上記ソースコードで示されたように、HTML文書は、2行3列のテーブルを含み、各行の第2列が像を含む。又、HTML文書は、第3の像と、小さなフォントのテキストのブロックも含む。このようなHTML文書から、文書コンバータは、図6に示すようなXHTML DOMデータ構造体を発生することができる。 As shown in the source code above, the HTML document includes a 2 × 3 table, and the second column of each row includes an image. The HTML document also includes a third image and a small font block of text. From such an HTML document, the document converter can generate an XHTML DOM data structure as shown in FIG.
文書コンバータ102が電子文書を、電子文書の中間データ構造体表示へいかに変換するかに拘らず、文書コンバータが電子文書をその中間データ構造体へと変換するとき又は変換した後に、文書コンバータは、図5のブロック108に示すように、中間データ構造体内の「暗示的」テーブルを識別することができる。明らかなように、電子文書のフォーマットにおいて、例えば、HTML文書のタグ(即ち“<table></table>”)で識別されるテーブルの場合に、文書コンバータは、通常、このようなテーブルを特に識別する必要はない。しかしながら、他のテーブルの場合は、電子文書は、情報がテーブル形態でレンダリングされるが、テーブルのような情報のフォーマット構成を含まないように構成される。文書コンバータは、このような「暗示的」テーブルを識別することができ、ここで、暗示的テーブルは、通常、文書コンバータが電子文書をデータ構造体へと変換した後にデータ構造体のテーブルノードにより表示されない。その後、文書コンバータは、データ構造体を、このようなテーブルに対するテーブルノードを含むように再公式化することができる。
Regardless of how the
例えば、TXT文書内の次のASCIIフォーマットテキストについて考える。
アクティビティ カロリー/時
エアロビクス 660
バスケットボール 550
ランニング 925
テニス 450
視覚的に、上記ASCIIフォーマットテキストは、明確にテーブルを表わしている。しかしながら、TXTフォーマットは、テーブルのようなテキストを明示的に示すためのメカニズム(例えば、タグ)を含まない。このようなTXT文書をデータ構造体へと変換するために文書コンバータにより使用される技術に基づいて、文書コンバータは、このようなテキストブロックをテーブルとして認識する。しかしながら、種々の他のインスタンスにおいて、文書コンバータ102は、このようなテキストブロックをテーブルとして認識しないことがある。このようなインスタンスでは、文書は、図7Aに示すようなデータ構造体を発生することができる。図示されたように、このデータ構造体は、テキストを、未構成テキストのブロックとして識別する。従って、文書コンバータは、電子文書が、電子文書の変換中に文書コンバータにより認識されない暗示的テーブルを含むか又はデータ構造体のテーブルノードとして表わされた暗示的テーブルを含むようなインスタンスにおいて、暗示的テーブルも識別することができる。
For example, consider the following ASCII format text in a TXT document.
Activity Calories /
Running 925
Visually, the ASCII format text clearly represents a table. However, the TXT format does not include a mechanism (eg, a tag) for explicitly indicating text such as a table. Based on the technique used by the document converter to convert such a TXT document into a data structure, the document converter recognizes such a text block as a table. However, in various other instances, the
文書コンバータ102は、専用パーザー及び自動学習技術によるものを含む多数の異なる既知のやり方のいずれかで暗示的テーブルを識別することができる。暗示的テーブルを識別するための多数の既知の技術の例については、参考としてその全ての内容をここに取り上げるジアニング・ヒュー氏等の「A System of Understanding and Reformulating Tables, Fourth ICPR WORKSHOP ON DOCUMENT ANALYSIS SYSTEM (2000); Mathew Hurst & Shona Douglas, Layout and Language: Preliminary Investigations in Recognizing the Structure of Tables, PROCEEDINGS OF THE INTERNATIONAL CONFERENCE ON DOCUMENT ANALYSIS AND RECOGNITION (ICDAR) 1043-1047 (1997);及びウィ・ツー・ング氏等の「Learning to Recognize Tables in Free Text, Proceedings of the 37th Annual Meeting of ACL 443-450 (1999)」を参照されたい。
The
文書コンバータ102が暗示的テーブルをいかに識別するかに拘らず、文書コンバータが電子文書の1つ以上の暗示的テーブルを識別する場合に、文書コンバータは、テキストをテーブルとして識別するようにデータ構造体を発生し又は再公式化することができる。例えば、文書コンバータは、テキストのブロックをテーブルとして認識し、そして電子文書をHTML文書へと変換する間に、テキストのブロックを適当なHTMLタグ(例えば、<table>、<tr>、<td>等)でカプセル化することにより、テキストのブロックをテーブルとして識別するようにフォーマットされたHTML文書を発生することができる。TXT文書におけるテキストのブロックに対して上記例を続けると、文書コンバータは、テキストのブロックを暗示的テーブルとして識別し、そしてその後、図7Bに示すように、暗示的テーブルを明示的テーブルとして含むようにデータ構造体を発生し又は再公式化することができる。
Regardless of how the
文書コンバータ102が、暗示的テーブルを明示的テーブルとして再形成することを含む電子文書のデータ構造体表示を発生した後に、文書コンバータは、ブロック110に示すように、所定の順序を有するように電子文書のテーブルを再構成することができる。この点に関して、文書コンバータは、電子文書のテーブルにおけるセルの自然の順序を、行主体の順序であるか列主体の順序であるかについて識別することができる。当業者に明らかなように、テーブルは、一般的に、テーブルのコンテンツが行により構成されるときには行主体の順序を有する。逆に、テーブルは、一般に、テーブルのコンテンツが列により構成されるときには、列主体の順序を有する。
After the
電子文書のテーブルにおけるセルの自然の順序を識別した後、文書コンバータ102は、全てのテーブルが所定の順序を有するようにテーブルを再構成することができる。1つの典型的な実施形態では、例えば、文書コンバータは、全てのテーブルが行主体の順序を有するようにテーブルを再構成することができる。このような場合に、列主体の順序をもつテーブルでは、文書コンバータは、自然の順序が行主体となるようにテーブルを転置することができる。しかしながら、文書コンバータは、テーブルが列主体の順序を有するようにテーブルを再構成することもでき、この場合、文書コンバータの他のオペレーションが適宜調整されることが理解されよう。
After identifying the natural order of the cells in the table of electronic documents, the
文書コンバータ102は、テーブルの自然の順序を多数の異なるやり方のいずれかで識別することができる。例えば、文書コンバータは、各テーブル内の隣接セルの中で類似性のパターンをサーチするように構成できる。この点に関して、例えば、各セルに像を含む第2行を有する列主体のテーブルについて考える。このような行の全てのセルが互いに類似していることは、通常決定的ではないが、テーブルが列主体の順序を有する証拠である。それとは別に、例えば、各セルに像を含む第2の列と、数字の後にパーセンテージ符号を各列に含む第5の列とを有する行主体のテーブルについて考える。列のセルが互いに類似していることも、通常決定的ではないが、テーブルが行主体の順序を有する証拠である。
The
1つの典型的な実施形態では、文書コンバータ102は、各セルの情報を特性ベクトルとして表わすことによりテーブルの自然の順序を識別する。例えば、各セルは、所与の長さNの特性2進ベクトルで表わすことができ、ここで、ベクトルの各位置は、各セルにおける情報の特性を表わす述語(イエス/ノー質問)の値に対応する。明らかなように、特性ベクトル表示は、テーブルの各セルの構造特性をエンコードする方法である。従って、類似に見えるセルは、通常、類似した特性ベクトル表示を有する。
In one exemplary embodiment,
特性ベクトルは、多数の異なる述語に対応する多数のビット(N)を含むことができる。例えば、特性ベクトルは、13ビット(即ちN=13)を含むことができ、各ビットは、述語に次のように対応している。
ビット1は、セルが像を含む場合及びその場合だけ「1」である。
ビット2は、セルがデジットを含む場合及びその場合だけ「1」である。
ビット3は、セルがハイパーリングを含む場合及びその場合だけ「1」である。
ビット4は、セルがボールド体テキストを含む場合及びその場合だけ「1」である。
ビット5は、セルがイタリック体テキストを含む場合及びその場合だけ「1」である。
ビット6は、セルが句読点を含む場合及びその場合だけ「1」である。
ビット7は、セルが0から5キャラクタを含む場合及びその場合だけ「1」である。
ビット8は、セルが6から10キャラクタを含む場合及びその場合だけ「1」である。
ビット9は、セルが11から15キャラクタを含む場合及びその場合だけ「1」である。
ビット10は、セルが16から20キャラクタを含む場合及びその場合だけ「1」である。
ビット11は、セルが21から25キャラクタを含む場合及びその場合だけ「1」である。
ビット12は、セルが26から30キャラクタを含む場合及びその場合だけ「1」である。
ビット13は、セルが31キャラクタ以上を含む場合及びその場合だけ「1」である。
The characteristic vector can include a number of bits (N) corresponding to a number of different predicates. For example, the characteristic vector can include 13 bits (ie, N = 13), with each bit corresponding to a predicate as follows:
Bit 3 is “1” if and only if the cell contains a hyper ring.
Bit 4 is “1” if and only if the cell contains bold text.
Bit 8 is “1” if and only if the cell contains 6 to 10 characters.
Bit 9 is “1” if and only if the cell contains 11 to 15 characters.
テーブルと、テーブルのセルに対する特性ベクトルとを各々示した図8A及び8Bを簡単に説明する。このようなテーブルに対して示されたように、例えば、第1行、第1列のセルは、ブランクを含む。従って、第1行、第1列のセルは、特性ベクトル0000001000000で表わすことができ、ここで、唯一の「1」ビット値は、0から5キャラクタを含むセルに対応する。これに対して、第2行、第1列のセルは、「エクイティ・リザーブSMライン(equity reserveSM line)」という句を含み、これは、特性ベクトル0000001000000で表わすことができる。図示されたように、唯一の「1」ビット値は、21から25キャラクタを含むセルに対応する(この句は、21キャラクタのカウンティングスペースを含む)。
8A and 8B showing the table and the characteristic vector for the table cell, respectively, will be briefly described. As shown for such a table, for example, the cells in the first row, first column contain blanks. Thus, the cells in the first row, first column can be represented by the
各セルの情報を特性ベクトルとして表わした後に、文書コンバータ102は、特性ベクトルに基づいてテーブル内のセル間の類似性尺度を決定することができる。文書コンバータは、隣接セル間の類似性の値を多数の異なるやり方で決定することができ、例えば、隣接セル間の「マンハッタン」距離を決定することにより決定できる。この点に関して、距離は、各セルの特性ベクトル間で異なるビットの数を決定することにより2つの隣接セルに対して決定できる。例えば、0111と1110との間の距離は2である。明らかなように、隣接セル間の距離が小さいほど、各セルの類似性が大きい。本発明の実施形態に基づいて決定された図8Aのテーブルのセル間の距離尺度については、図8Bを参照されたい。
After representing the information for each cell as a characteristic vector,
又、明らかなように、種々の場合において、特性ベクトルの各ビット値(1つ又は複数)に対応する1つ以上の述語は、他の述語よりもセルの類似性を強く表わす。例えば、上述した13ビット特性ベクトルの第1ビットは、第10ビットよりもセルの類似性を強く表わす。従って、本発明の実施形態によれば、1つ以上のビットに関連重みをもたせて、2つの特性ベクトル間の距離が、隣接セル間で各ビットが異なるときにその関連重みを和として含むようにすることができる。 Also, as will be apparent, in various cases, one or more predicates corresponding to each bit value (s) of the characteristic vector are more strongly indicative of cell similarity than other predicates. For example, the first bit of the 13-bit characteristic vector described above represents the cell similarity more strongly than the tenth bit. Therefore, according to an embodiment of the present invention, one or more bits have an associated weight so that the distance between two characteristic vectors includes the associated weight as a sum when each bit is different between adjacent cells. Can be.
テーブルの隣接セル間の類似性尺度又は距離が厳密にいかに決定されるかにかかわらず、距離が決定された後に、文書コンバータ102は、テーブルが行主体の順序を有するか列主体の順序を有するか決定することができる。より詳細には、文書コンバータは、テーブルの種々の行及び列を横切る距離に基づいてテーブルの順序を決定することができる。例えば、文書コンバータは、テーブル内の同じ行にある隣接セル対間の平均距離SHを決定し、そしてテーブル内の同じ列にある隣接セル対間の平均距離SVを決定することができる。明らかなように、同じ行内の隣接セル間の小さな平均距離は、通常、テーブルの行が類似したセルを含むことを指示し、これは、テーブルが列主体の順序を有することを示唆する。逆に、同じ列内の隣接セル間の小さな平均距離は、テーブルの列が類似したセルを含むことを指示し、これは、テーブルが行主体の順序を有することを示唆する。表示法で書くと、文書コンバータは、SH及びSVを次の式に基づいて決定することができる。
上記式(1)及び(2)に示すように、i=1・・・Rは、テーブルにおける行を表わし、そしてj=1・・・Cは、列を表わす。又、xi,j及びxi+1,jは、テーブルの隣接セルを表わし、そしてΔCは、各隣接セル間の距離を表わす。図8Aのテーブルについては、図8Bに示す距離から、SH=2.4(即ち、24/10)であり、そしてSV=0.583(即ち、7/12)である。
Regardless of how exactly the similarity measure or distance between adjacent cells of the table is determined, after the distance is determined, the
As shown in equations (1) and (2) above, i = 1... R represents a row in the table, and j = 1... C represents a column. X i, j and x i + 1, j represent adjacent cells in the table, and Δ C represents the distance between each adjacent cell. For the table of FIG. 8A, from the distance shown in FIG. 8B, S H = 2.4 (
文書コンバータ102が、同じ行の隣接セル対間の平均距離SH及び同じ列の隣接セル対間の平均距離SVを決定すると、文書コンバータは、テーブルが行主体の順序を有するか列主体の順序を有するか決定することができる。例えば、文書コンバータは、平均距離を比較することにより順序を決定することができる。同じ列の隣接セル対間の平均距離SVが、同じ行の隣接セル対間の平均距離SHより大きい場合には(即ち、SV>SH)、文書コンバータは、テーブルが列主体の順序を有することを決定でき、さもなければ、テーブルは、行主体の順序を有する。電子文書のテーブルを、行主体の順序のような所定の順序を有するように再構成するために、文書コンバータは、列主体の順序を有するテーブルを、テーブルが全て行主体の順序を有するように転置することができる。表示法の用語では、電子文書のテーブルは、DOMツリーを、各セルxi,jが各セルxj,iと交換されるように再編成することにより転置することができる。
When the
明らかなように、種々の場合に、SHとSVは非常に類似し、その結果、テーブルは、希望とは逆の順序を有するように転置される。従って、文書コンバータ102は、比較中にSH又はSVを重み付けして、文書コンバータが所与のテーブルを転置する見込みを若干高くすることができる。例えば、文書コンバータは、SHに、1より大きな値を有するバイアスCを乗算することができる。従って、SHとSVの比較中に(即ち、SV>C*SH)、バイアスが増加するにつれて、文書コンバータは、それが列主体のテーブルを転置し且つSH及びSVが類似した値を有するときには、テーブルを転置する見込みが低くなる。
As will be apparent, in various cases, SH and SV are very similar, so that the table is transposed to have the opposite order as desired. Accordingly, the
所定の順序をもつようにテーブルを再構成した後、文書コンバータ102は、テーブルを、テーブルのセルのコンテンツの一次元シーケンスへと直線化することができ、ここで、直線化されたコンテンツはテーブル内に含まれない。しかしながら、便利なことに、テーブルを直線化する前に、文書コンバータは、図5のブロック112に示すように、テーブル内に含まれたラベルをローカライズすることができる。明らかなように、多数のテーブルは、1つ以上の他のセルに対してラベルとして機能するセルを含む。この点に関して、ラベルがセルの単一行又は列を指すときには、ラベルがしばしば「ダイレクト」ラベルと称される。これに対して、ラベルが2つ以上の行又は列を指すときには、ラベルがしばしば「スパン」ラベルと称される。図9のテーブルに示すように、例えば、「YR」、「TM」、「GP」及び「G」のようなラベルは、ダイレクトラベルを構成し、一方、「レギュラーシーズン」及び「ポストシーズン」のラベルは、スパンラベルを構成する。
After restructuring the table to have a predetermined order, the
又、明らかなように、図9に示すような列ラベルを有する行主体のテーブルを直線化すると、列ラベルを、このようなラベルが指すセルから分離することができる。従って、レンダリングされたテーブルは、表示エリアが限定されたターミナル10において理解することが困難となる。この点に関して、ターミナルディスプレイに図9のテーブルの一部分を示し、テーブルが単純な直線化プロセスにより進められている図10A及び10Bを参照されたい。明らかなように、行ラベルは、このようなラベルが指すセルから分離され、従って、テーブルの理解を困難にしている。より詳細には、図示されたように、多数のダイレクトラベル(例えば、「YR」、「TM」、「GP」、「G」等)を含む列は、それが指すデータ、即ち各ラベルの下にある各列のセルから、視覚的に分離される。 Also, as is apparent, when a row-based table having column labels as shown in FIG. 9 is linearized, the column labels can be separated from the cells pointed to by such labels. Therefore, it is difficult to understand the rendered table in the terminal 10 having a limited display area. In this regard, refer to FIGS. 10A and 10B, which show a portion of the table of FIG. 9 on a terminal display and the table is advanced by a simple linearization process. As is apparent, the row label is separated from the cell to which such a label points, thus making it difficult to understand the table. More specifically, as shown, the column containing a number of direct labels (eg, “YR”, “TM”, “GP”, “G”, etc.) is the data that it points to, ie under each label. Are visually separated from the cells in each column.
従って、列ラベルを、このようなラベルが指すデータから分離するのを回避するために、1つの効果的な実施形態の文書コンバータ102は、電子文書のテーブル内に配置されたラベル(もしあれば)をローカライズする。より詳細には、文書コンバータは、ラベルが、そのラベルが記述するデータの近くに配置されるように、ラベルを再構成する。従って、文書コンバータは、その後にレンダリングされるテーブルについてのユーザの理解を助けることができる。
Thus, in order to avoid separating column labels from the data pointed to by such labels, the
文書コンバータ102は、電子文書のテーブル内のラベルを多数の異なる方法のいずれかでローカライズすることができる。ラベルをローカライズするための1つの特に効果的な技術を、図11を参照して以下に説明する。以下に述べるように、文書コンバータは、少なくとも1つのラベルを含む少なくとも1つの行を有する行主体のテーブルに対するラベルをローカライズする。しかしながら、文書コンバータは、多数の他の状態においてラベルをローカライズできることを理解されたい。例えば、文書コンバータは、少なくとも1つのラベルを含む少なくとも1つの列を有する列主体のテーブルに対するラベルをローカライズすることができる。このような場合に、ラベルをローカライズするプロセスは、通常、行に基づいて実行されるオペレーションが列に基づいて実行されそしてそれとは逆にも実行されるようにして、ここに述べるように進めることができる。又、文書コンバータは、特に、ラベルを含まないテーブルに対して、テーブル内のラベルをローカライズする必要がないことを理解されたい。通常、文書コンバータは、それがテーブルを行主体のテーブルに再構成しそしてテーブルがラベルをもつ業を含まないときにもラベルをローカライズしない。
The
1つの技術によれば、文書コンバータ102は、図11のブロック118に示すように、スパンラベル、即ち2つ以上の列にわたるラベルを含む行を最初に識別することによりラベルをローカライズすることができる。より詳細には、文書コンバータは、テーブルデータ(例えば、<td>)又はテーブルヘッダ(例えば、<th>)を含むセルを識別するタグに対して所定の行数(例えば、3行)のセルを検査することができ、ここで、セルは、多列属性(例えば、colspan)も有する。明らかなように、このような属性は、通常、テーブルの2つ以上の列にわたるセルを表わす。例えば、図9のテーブルでは、第1の行は、各々2つ以上の列にわたる2つのセル(即ち、「レギュラーシーズン」及び「ポストシーズン」)を含む。
According to one technique,
スパンラベルを含む行を識別した後に、文書コンバータ102は、ブロック120に示すように、ダイレクトラベル、即ち単一の列を各々指すラベルを含む行を識別することができる。上記と同様に、文書コンバータは、ダイレクトラベルに対して所定の行数(例えば、3行)のセルを検査することができる。文書コンバータは、多数の異なるやり方のいずれかでダイレクトラベルを探索することができる。例えば、一実施形態では、文書コンバータは、隣接行間の類似性尺度(例えば、距離)に基づいてダイレクトラベルを探索し、ここで、隣接行間の類似性尺度は、上述したように、隣接行のセル間の類似性尺度に基づく。この点に関して、当業者に明らかなように、ダイレクト列ラベルの行は、しばしば、多数の異なる観点においてテーブル内の残りの行と相違する。例えば、ダイレクト列ラベルより成る図9の第2行は、完全に文字で構成され、一方、第2行の下の行は、数字でほぼ完全に構成される。
After identifying rows that contain span labels,
テーブルのダイレクトラベルを探索するために、文書コンバータ102は、テーブルの隣接行間の類似性又は距離を決定することができ、ここで、類似性は、各行内の垂直方向に隣接したセルの類似性に基づいて決定される。表示法で書くと、文書コンバータは、次の式(3)に基づきテーブルの隣接行間の距離ΔRを決定することができる。
この式において、mは、少なくとも1つのスパンラベルを含まないテーブルの第1行を表わす。
In order to search the direct labels of the table, the
In this equation, m represents the first row of the table that does not include at least one span label.
隣接行間の距離を決定した後に、文書コンバータ102は、後続隣接行の対より著しく大きな相違性を有する隣接行の対を識別することができ、ここで、著しく大きな相違性は、ダイレクトラベルを含む各対の第1行を表わす。換言すれば、文書コンバータは、隣接行の対間の距離が、隣接行の後続対間の距離より著しく大きいかどうか決定し、次いで、そのような対の第1行を、ダイレクトラベルを含むものとして識別する。より詳細には、例えば、文書コンバータは、各ΔR(i、i+1)を、ΔR(i+1、i+2)で始めて、隣接行の後続対間の距離と比較することができる。次いで、隣接行の後続対よりも少なくとも所与のパーセンテージ(例えば、50%)大きい第1のΔR(i、i+1)に対して、行iを、ダイレクトラベルを含む行として識別することができる。
After determining the distance between adjacent rows,
文書コンバータ12は、スパンラベル、及び/又はダイレクトラベルを含む行を識別すると、図11のブロック122に示すように、多数の既知の技術のいずれかに基づいてテーブルのラベルツリー表示を発生することができる。より詳細には、例えば、文書コンバータは、ラベルをローカライズするのに使用するための別のデータ構造体を発生することができ、ここで、データ構造体は、テーブルの個々のセルに対するスパン及びダイレクト列ラベルの関連性を反映する。「ラベルツリー」と称されるこのデータ構造体は、既に識別されたスパン及びダイレクト列ラベルの構造体を捕獲することができる。この点について、図12は、1つの実施形態に基づき図9のテーブルのラベルツリー表示を示す。
When
文書コンバータ102は、これがテーブルのラベルツリー表示を発生した後、テーブルのラベルをローカライズすることができる。ブロック124に示すように、文書コンバータは、ラベルツリー及びデータ構造体表示を横切ることによりラベルをローカライズし、テーブルの直線化された表示内におけるラベルの配置を決定することができる。従って、テーブルは、その後、各テーブルセルに接近して配置されたラベルを含むように直線化することができる。明らかなように、ラベルツリー表示及びデータ構造体は、多数の異なるやり方のいずれかで横断することができる。一実施形態では、例えば、文書コンバータは、コンテンツをもたないセル(即ちブランクセル)、及びスパン又はダイレクトラベルを含むセルを除いて、各行(j=1、・・・R)の各列(i=1、・・・C)の各セルを検査する。
The
ブランク及びラベルセルを含む各行の各列に対して、文書コンバータは、テーブルのツリーラベル表示のルートノードからブランチのリーフLへのラベル経路xk={x1、x2、・・・xL}を定義することができ(図12を参照)、ここで、各リーフは、テーブルの各列に関連している。更に、文書コンバータは、ラベルストリングsijを定義することができ、ここで、ラベルストリングは、各セルに対し0の値で初期化される。テーブルのラベルツリー表示の各ラベル経路(k=1、・・・L)の各ノードに対し、xkがスパンラベルを備えそしてxk+1がxkの下の第1ノードを備えている場合に、文書コンバータ102は、新たなラインを、スパンラベル、別の新たなライン及び少なくとも1つのキャラクタスペース(例えば、タブ)と共に、ラベルストリングsijに追加することができる。他方、xkがダイレクトラベルを備えている場合には、文書コンバータは、ダイレクトラベルを、コロンのようなセパレータと共にラベルストリングsijに追加することができる。次いで、テーブルセルを検査し、そしてラベルストリングsijを発生した後に、文書コンバータは、以下に述べるテーブルの直線化の間に、各ラベルストリングを各セルxijに添付することができる。
For each column of each row containing blanks and label cells, document converter label path x k = from tree label the root node of the table to the leaf L branch {x 1, x 2, ··· x L} (See FIG. 12), where each leaf is associated with each column of the table. In addition, the document converter can define a label string s ij , where the label string is initialized with a value of 0 for each cell. For each node in each label path (k = 1,... L) in the label tree display of the table, x k comprises the span label and x k + 1 comprises the first node under x k In some cases, the
例えば、図9のテーブル及び図12のラベルツリー表示について考える。ここで、テーブルは、多数のスパン及びダイレクトラベルを含む。このような場合に、テーブルのセルの検査は、値「84−85」を含むセル(3、1)で始めることができる。ラベルツリー表示のルートノードが第3の行に関連したリーフへ至るのに続いて、文書コンバータ102は、ラベル経路xk={x1=「YR」}を定義することができる。更に、文書コンバータは、ラベルストリングs3,1を定義することができ、ここで、ラベルストリングは、0の値で初期化される。次いで、x1は、ダイレクトラベルを含むので、文書コンバータは、ダイレクトラベルを、コロンと共にラベルストリングsijへ追加して、s3,1={「YR:」}とすることができる。同じプロセスを、セル(3、2)に対して繰り返し、s3,2={「TM:」}とすることができる。一方、セル(3、3)については、文書コンバータは、ラベル経路xk={x1=「レギュラーシーズン」;x2=「GP」}を定義することができる。ラベルストリングs3,3をゼロに初期化した後に、x1はスパンラベルを含み、そしてx2(即ちxi+1)は、x1の下の第1ノードを含むので、文書コンバータは、新たなラインを、スパンラベル、別の新たなライン及びタブと共に、ラベルストリングs3,3に追加することができる。次いで、x2に対して、文書コンバータは、更に、ダイレクトラベル及びコロンをラベルストリングs3,3に追加することができる。それ故、ラベルストリングs3,3は、次のように現われる。
s3,3={\n;「レギュラーシーズン」;\n;\t;「GP:」}
但し、「\n」及び「\t」は、ラベルストリングがターミナル10によりレンダリングされるときに新たなライン及びタブを各々表わす。
For example, consider the table of FIG. 9 and the label tree display of FIG. Here, the table includes a number of spans and direct labels. In such a case, the examination of the table cell can begin with cell (3, 1) containing the value “84-85”. Following the root node of the label tree display to the leaf associated with the third row, the
s 3,3 = {\ n; "regular season"; \ n; \ t; "GP:"}
However, “\ n” and “\ t” represent new lines and tabs, respectively, when the label string is rendered by the terminal 10.
再び、図5を参照すれば、文書コンバータ102は、それがラベルストリングsijを決定してラベルをローカライズすると、ブロック114に示すように、タブをセルの一次元シーケンスへと直線化することができる。文書コンバータは、タブを多数の異なるやり方のいずれかで直線化することができる。一実施形態では、例えば、文書コンバータは、テーブルを1つ以上の個々のパラグラフ(例えば、<p>)と置き換えることによりテーブルを直線化することができ、各パラグラフは、最初のテーブルの1つ以上のセルを含む。この点について、特に文書コンバータが電子文書のテーブルを、行主体の順序をもつように構成するときには、文書コンバータは、通常、左上のセルで始めて右下のセルで終わるようにして、行主体の順序を有するテーブルを横断し、そして各セルのコンテンツを、テーブルの直線化された表示の各パラグラフへ移動することができる。
Referring again to FIG. 5, when the
一実施形態において、文書コンバータ102は、テーブルのデータ構造体表示を検査することによりテーブルを直線化することができる。例えば、図13Aに示すテーブルを含む電子文書のデータ構造体表示について考える。各テーブルノードに対して、文書コンバータは、各テーブルノードと同じレベルにおいてデータ構造体に新たな一時的ノード(図13Bにノード「X」として示す)を生成することができる。次いで、通常、ブランク及びラベルセルを除いて、テーブルのセルを表わす各行ノード(即ち<tr>)の各データノード(即ち<td>)に対し、文書コンバータは、パラグラフノード(例えば<p>)をノード「X」の子として添付することができる。図13Bに示すように、その後、文書コンバータは、各データノードのコンテンツノード(即ちC1、C2等)又はより詳細には、各セルのコンテンツxijを、各パラグラフノードの下へ移動することができ、図13Bには、そのうちの第1及び第2コンテンツノードC1及びC2だけが移動されるとして示されている。各コンテンツノードを各パラグラフノードの下に移動するのに加えて、文書コンバータは、各セルが対応するラベルストリングを有する場合に、各セルのコンテンツに各ラベルストリングsijを添付することができる。
In one embodiment, the
各行ノードの各データノードのコンテンツノードを各パラグラフノードの下に移動した後に、文書コンバータ102は、テーブルノード及びそれに関連した行ノード、テーブルノードの下のデータノード及びコンテンツノードを削除することができる。文書コンバータは、各行ノードの各データノードのコンテンツノードを移動した後にテーブルノード及びその関連ノードを削除できるが、文書コンバータは、各ノードの全ての子(即ち関連ノード)を移動するか又は削除した後に各ノードを削除することもできる。従って、例えば、文書コンバータは、各コンテンツノード(即ちC1、C2、C3等)を各パラグラフノードの下に移動した後に各テーブルデータノード(即ち<td>)を削除することができる。同様に、例えば、文書コンバータは、各テーブルデータノード(即ち<td>)を削除した後に各テーブル行ノード(即ち<tr>)を削除することができる。
After moving the content node of each data node of each row node under each paragraph node, the
しかしながら、文書コンバータ102がテーブルノードをいつ削除するかに拘らず、各行ノードの各データノードのコンテンツノードを各パラグラフノードの下に移動した後に、文書コンバータは、ノード「X」をデータ構造体から取り去り、そして図13Cに示すように、ノード「X」の下の各ノードを電子文書のデータ構造体表示においてアップ方向に移動することができる。従って、図示されたように、テーブルの各セルxij(ブランク及びラベルセルを除く)を表わす各コンテンツノード(即ちC1、C2等)を、電子文書のデータ構造体表示の各パラグラフノード内に含ませることができる。明らかなように、このような場合には、添付されたラベルストリングsijを含む最初のテーブルの各セルを、別のパラグラフノードの下に含ませることができる。しかしながら、文書コンバータは、テーブルのセルの各行が各パラグラフノードの下に含まれるようにテーブルを直線化することができる。このような例として、図9のテーブルの直線化された表示を示す図14を参照されたい。ここでは、テーブルの1つ以上のセルが、添付されたラベルストリングを含む。
However, regardless of when the
文書コンバータ102は、これがテーブルを直線化すると、図5のブロック116に示すように、電子文書のデータ構造体表示(テーブルの直線化された表示を含む)を、電子文書へと変換して戻す。明らかなように、文書コンバータは、データ構造体を多数の異なるやり方で変換することができ、例えば、文書コンバータが電子文書を中間データ構造体へ変換した(ブロック106を参照)のと逆のやり方で変換することができる。次いで、文書コンバータ102がデータ構造体を電子文書へと変換して戻すと、電子文書は、今や、元の電子文書に含まれた各テーブルの直線化された表示を含み、プロキシー18は、ブロック117で示すように、電子文書をターミナル10へ転送することができる。その後、ターミナルは、電子文書をディスプレイ(例えば、ディスプレイ54)にレンダリングすることができる。この点に関して、このようなディスプレイに図9のテーブルをレンダリングする例については、図15を参照されたい。
The
図示して説明したように、文書コンバータ102は、少なくとも1つのテーブルを含む電子文書を受け取り、そしてその後、ターミナル10によりレンダリングするために文書のテーブル情報を変換することができる。次いで、文書コンバータは、変換されたテーブル情報を含む電子文書を、ターミナル又はより詳細にはターミナルのディスプレイ(例えばディスプレイ56)によりレンダリングするためにターミナルへ転送することができる。種々の場合に、文書コンバータは、電子文書を、その文書のテーブル情報を変換せずに転送できることに注意されたい。この点に関して、明らかなように、種々の場合に、ターミナルは、ターミナルのディスプレイより巾の広いディスプレイウインドウ内で左右のパンをサポートすることができる。従って、文書コンバータは、テーブル情報を変換する前に、電子文書のターミナル受信者が左右のパンをサポートするかどうか決定することができる。次いで、文書コンバータは、電子文書を、テーブル情報を変換せずに転送することができる。或いは又、文書コンバータは、ターミナルのユーザから、電子文書のテーブル情報を変換すべきか、又はテーブル情報を変換せずに電子文書を転送すべきかの選択を要求することができる。
As shown and described, the
文書コンバータ102は、電子文書をパンするためのターミナル10の能力を多数の異なるやり方で決定することができる。例えば、文書コンバータは、内部「デバイス能力」ルックアップテーブルを維持することができ、これは、1つ以上の受信者装置のリストを含み、その各々が電子文書のパンをサポートするかどうか指示する。このような場合に、文書コンバータは、ターミナルとコンテンツソース100(例えば、HTTP GET)との間に通信セッションを確立する間にターミナル受信者を決定し、そしてその後、「デバイス能力」ルックアップテーブルにおいてターミナルのルックアップを行うことができる。次いで、テーブル情報を変換すべきかどうかの選択を要求した後に、文書コンバータは、その選択を受け取って適宜に処理することができる。この点に関して、ユーザが、テーブル情報を変換せずに電子文書を転送することを選択した場合には、文書コンバータが適宜に動作することができる。さもなければ、ユーザがテーブル情報を変換することを選択するか、又はターミナルがパンをサポートしない場合には、文書コンバータは、ここに述べたやり方でテーブル情報を変換することができる。
The
又、図示して説明したように、文書コンバータ102は、ターミナル10、プロキシー18、又はコンテンツソース、例えば、原点サーバー22、SMSC17、MMSC30、GGSN28、ユーザプロセッサ34等の多数の異なるネットワークエンティティのいずれからでも動作することができる。しかしながら、明らかなように、文書コンバータの種々の動作、特に、電子文書内の少なくとも1つのテーブルより成るテーブル情報を変換する際の動作は、ネットワークへの接続とは独立して実行することができる。従って、文書コンバータを動作するネットワークエンティティは、ネットワークに接続されないターミナル又はコンテンツソース(例えば、原点サーバー、SMSC、MMSC、ユーザプロセッサ等)のようなエンティティであることを理解されたい。このような場合、例えば、ネットワークエンティティには、ネットワークとは独立した多数の異なるやり方のいずれかで電子文書を与えることができ、その後、文書コンバータは、このような電子文書のテーブルを、上述したやり方で変換することができる。
Also, as shown and described,
本発明の1つの特徴によれば、本発明のシステムの全部又は一部分、例えば、ターミナル10、プロキシー18、原点サーバー22、SMSC17、MMSC30、GGSN28及び/又はユーザプロセッサ34の全部又は一部分は、一般に、コンピュータプログラム製品(例えば、文書コンバータ102)の制御のもとで動作する。本発明の実施形態の方法を実行するためのコンピュータプログラム製品は、不揮発性記憶媒体のようなコンピュータ読み取り可能な記憶媒体や、このコンピュータ読み取り可能な記憶媒体に実施される一連のコンピュータ命令のようなコンピュータ読み取り可能なプログラムコード部分を含む。
In accordance with one aspect of the present invention, all or part of the system of the present invention, eg, all or part of the terminal 10,
この点に関して、図5及び11は、本発明による方法、システム及びプログラム製品のフローチャートである。フローチャートの各ブロック又はステップ、並びにフローチャートにおけるブロックの組み合せは、コンピュータプログラム命令により実施できることが理解されよう。これらのコンピュータプログラム命令は、コンピュータ又は他のプログラム可能な装置にロードされて、マシンを生成し、コンピュータ又は他のプログラム可能な装置で実行される命令は、フローチャートのブロック又はステップで指定される機能を実施するための手段を形成する。又、これらのコンピュータプログラム命令は、コンピュータ読み取り可能なメモリに記憶されて、コンピュータ又は他のプログラム可能な装置が特定のやり方で機能するように導くことができ、コンピュータ読み取り可能なメモリに記憶された命令は、フローチャートのブロック又はステップで指定された機能を実施する命令手段を含む製造用品を形成する。又、コンピュータプログラム命令は、コンピュータ又は他のプログラム可能な装置にロードされて、コンピュータ又は他のプログラム可能な装置において一連の動作ステップを実行させて、コンピュータ実施されるプロセスを生成し、コンピュータ又は他のプログラム可能な装置で実行される命令は、フローチャートのブロック又はステップで指定された機能を実施するためのステップを与える。 In this regard, FIGS. 5 and 11 are flowcharts of methods, systems and program products according to the present invention. It will be understood that each block or step of the flowchart, and combinations of blocks in the flowchart, can be implemented by computer program instructions. These computer program instructions are loaded into a computer or other programmable device to generate a machine and the instructions executed on the computer or other programmable device are functions specified in the blocks or steps of the flowchart. Forming means for implementing These computer program instructions may also be stored in a computer readable memory to direct the computer or other programmable device to function in a particular manner and stored in the computer readable memory. The instructions form a manufacturing article that includes instruction means for performing the functions specified in the blocks or steps of the flowchart. Computer program instructions may also be loaded into a computer or other programmable device to cause a series of operational steps to be performed on the computer or other programmable device to produce a computer-implemented process. The instructions executed on the programmable device provide steps for performing the functions specified in the blocks or steps of the flowchart.
従って、フローチャートのブロック又はステップは、指定の機能を実行するための手段の組み合せ、指定の機能を実行するためのステップの組み合せ、並びに指定の機能を実行するためのプログラム命令手段をサポートする。又、フローチャートの各ブロック又はステップ、並びにフローチャートにおけるブロック又はステップの組み合せは、指定の機能又はステップを実行する特殊目的のハードウェアベースのコンピュータシステム、或いは特殊目的のハードウェア及びコンピュータ命令の組み合せによって実施できることが理解されよう。 Thus, a block or step of the flowchart supports a combination of means for performing a specified function, a combination of steps for performing a specified function, and a program instruction means for performing the specified function. Also, each block or step of the flowchart, and combinations of blocks or steps in the flowchart, are implemented by a special purpose hardware-based computer system that performs a specified function or step, or a combination of special purpose hardware and computer instructions. It will be understood that it can be done.
上記説明及び添付図面に示された教示から利益を受ける本発明に係る当業者であれば、本発明の多数の変更や他の実施形態が明らかとなろう。例えば、1つの実施形態において上述したように、文書コンバータは、テーブルが行主体の順序を有するようにテーブルを構成又は再構成し、その後、このような行主体の順序に基づいてテーブルを処理する。しかしながら、別の実施形態では、文書コンバータは、テーブルが列主体の順序を有するようにテーブルを構成又は再構成し、文書コンバータの他の動作をそれに応じて調整することもできる。例えば、文書コンバータは、少なくとも1つのラベルを含む少なくとも1つの列を有する列主体のテーブルに対してラベルをローカライズし、このローカライゼーションプロセスは、通常、行に基づいて実行される動作を列に基づいて実行しそしてその逆にも行うようにして、上述したのと同様に実行することができる。それ故、本発明は、上述した特定の実施形態に限定されるものではなく、特許請求の範囲内で他の実施形態も包含されることを理解されたい。又、特定の用語を使用したが、それらは、説明上一般的に使用されるもので、限定するためのものではない。 Numerous modifications and other embodiments of the invention will become apparent to those skilled in the art who have the benefit of the teachings set forth in the foregoing description and accompanying drawings. For example, as described above in one embodiment, the document converter configures or reconfigures the table such that the table has a row-major order, and then processes the table based on such row-major order. . However, in another embodiment, the document converter may configure or reconfigure the table such that the table has a column-major order, and adjust other operations of the document converter accordingly. For example, a document converter localizes labels for a column-based table having at least one column containing at least one label, and this localization process typically performs operations based on columns based on rows. It can be performed in the same way as described above, with execution and vice versa. Therefore, it is to be understood that the invention is not limited to the specific embodiments described above, but includes other embodiments within the scope of the claims. Also, although specific terms have been used, they are commonly used for purposes of explanation and are not intended to be limiting.
Claims (40)
少なくとも1つのテーブルより成るテーブル情報を含む電子文書を受け取ることのできる文書コンバータで構成されたネットワークエンティティを備え、上記文書コンバータは、少なくとも1つのテーブルを、各テーブルの順序に基づくと共に、少なくとも1つのテーブルが少なくとも1つのラベルを含むときに少なくとも1つのラベルにも基づいて、少なくとも1つのテーブルの直線化された表示へと変換することができるようにされたシステム。 In a system that converts table information for rendering to a terminal with a limited area display,
Comprising a network entity comprised of a document converter capable of receiving an electronic document comprising table information comprising at least one table, said document converter comprising at least one table based on the order of each table and at least one table A system adapted to convert a linear representation of at least one table based on at least one label when the table includes at least one label.
少なくとも1つのスパンラベル及び少なくとも1つのダイレクトラベルの少なくとも一方を識別することのできる文書コンバータで構成されるネットワークエンティティを備え、各スパンラベルは、テーブルの複数の列及び行の一方に関連され、そして各ダイレクトラベルは、テーブルの単一の列及び単一の行の一方に関連され、又、上記文書コンバータは、スパンラベル及びダイレクトラベルの少なくとも一方に関連したテーブルの各セルに対するラベルストリングを決定し、これにより、各スパンラベル及び各ダイレクトラベルをローカライズすることができ、各ラベルストリングは、スパンラベル及びダイレクトラベルの少なくとも1つを含むようにされたシステム。 A system for localizing at least one label of a table in an electronic document, the table including a plurality of cells organized in at least one row and at least one column,
Comprising a network entity comprised of document converters capable of identifying at least one of at least one span label and at least one direct label, each span label being associated with one of a plurality of columns and rows of the table; and Each direct label is associated with one of a single column and a single row of the table, and the document converter determines a label string for each cell of the table associated with at least one of a span label and a direct label. Thus, each span label and each direct label can be localized, and each label string includes at least one of a span label and a direct label.
各テーブルの順序に基づくと共に、少なくとも1つのテーブルが少なくとも1つのラベルを含むときに少なくとも1つのラベルにも基づいて、少なくとも1つのテーブルを、少なくとも1つのテーブルの直線化された表示へと変換することのできるコントローラと、
を備えたターミナル。 A memory capable of storing an electronic document including table information comprising at least one table;
Convert at least one table into a linearized representation of at least one table based on the order of each table and also based on at least one label when at least one table includes at least one label A controller that can
With terminal.
少なくとも1つのスパンラベル及び少なくとも1つのダイレクトラベルの少なくとも一方を識別することのできるコントローラと、
を備え、各スパンラベルは、テーブルの複数の列及び行の一方に関連され、そして各ダイレクトラベルは、テーブルの単一の列及び単一の行の一方に関連され、又、上記コントローラは、スパンラベル及びダイレクトラベルの少なくとも一方に関連したテーブルの各セルに対するラベルストリングを決定し、これにより、各スパンラベル及び各ダイレクトラベルをローカライズすることができ、各ラベルストリングは、スパンラベル及びダイレクトラベルの少なくとも1つを含むようにされたターミナル。 A memory capable of storing an electronic document comprising table information comprising at least one table, each table comprising a plurality of cells organized in at least one row and at least one column;
A controller capable of identifying at least one of at least one span label and at least one direct label;
Each span label is associated with one of a plurality of columns and rows of the table, and each direct label is associated with one of a single column and single row of the table, and the controller includes: A label string for each cell of the table associated with at least one of the span label and the direct label is determined, whereby each span label and each direct label can be localized, and each label string includes the span label and the direct label. A terminal that contains at least one.
少なくとも1つのテーブルより成るテーブル情報を含む電子文書を受け取り、そして
少なくとも1つのテーブルを、各テーブルの順序に基づくと共に、少なくとも1つのテーブルが少なくとも1つのラベルを含むときに少なくとも1つのラベルにも基づいて、少なくとも1つのテーブルの直線化された表示へと変換する、
という段階を備えた方法。 In a method for converting table information for rendering to a terminal having a limited area display,
Receiving an electronic document comprising table information comprising at least one table, and at least one table based on the order of each table and also based on at least one label when at least one table contains at least one label Convert to a linearized representation of at least one table,
A method with a stage.
少なくとも1つのテーブルが所定の順序を有するように少なくとも1つのテーブルを構成し、
少なくとも1つのテーブルが少なくとも1つのラベルを含むときに各ラベルをローカライズし、そして
少なくとも1つのテーブルを、上記所定の順序を有するように構成された少なくとも1つのテーブルに基づくと共に、少なくとも1つのテーブルが少なくとも1つのラベルを含むときに各ローカライズされたラベルにも基づいて、直線化する、
という段階を含む請求項21に記載の方法。 The above stage of converting at least one table is:
Configuring at least one table such that the at least one table has a predetermined order;
Each label is localized when the at least one table includes at least one label, and the at least one table is based on at least one table configured to have the predetermined order, and the at least one table is Linearize based on each localized label when it contains at least one label,
The method of claim 21 comprising the steps of:
少なくとも1つのテーブルの自然の順序を識別し、そして少なくとも1つのテーブルが所定の順序以外の自然の順序を有するときに、
所定の順序以外の自然の順序を有する少なくとも1つのテーブルを、各少なくとも1つのテーブルが所定の順序を有するように構成する、
という段階を含む請求項22に記載の方法。 Each table includes a plurality of cells organized in at least one row and at least one column, and the steps of constituting at least one table include:
Identifying the natural order of at least one table, and when the at least one table has a natural order other than a predetermined order,
Configuring at least one table having a natural order other than a predetermined order such that each at least one table has a predetermined order;
23. The method of claim 22, comprising the steps of:
テーブルの各セルに対して特性ベクトルを決定し、
各セルに対する特性ベクトルに基づいて隣接セル間の距離を決定し、
テーブルの同じ行における隣接セル対間の平均距離と、テーブルの同じ列における隣接セル対間の平均距離とを決定し、そして
これら平均距離に基づいてテーブルの自然の順序を識別する、
という段階を含む請求項23に記載の方法。 The above stage of identifying the natural order is for each table:
Determine the characteristic vector for each cell in the table,
Determine the distance between adjacent cells based on the characteristic vector for each cell;
Determining the average distance between adjacent cell pairs in the same row of the table and the average distance between adjacent cell pairs in the same column of the table, and identifying the natural order of the table based on these average distances;
24. The method of claim 23, comprising the steps of:
少なくとも1つのテーブルを変換するか、電子文書を、少なくとも1つのテーブルを変換せずに転送するかの一方の選択を受け取る、
という段階を更に含み、少なくとも1つのテーブルを変換する上記段階は、上記選択が少なくとも1つのテーブルの変換を含むときに、少なくとも1つのテーブルを変換することを含む請求項21に記載の方法。 Decide if the terminal supports panning, and if the terminal supports panning,
Receiving a choice of either converting at least one table or transferring the electronic document without converting at least one table;
24. The method of claim 21, wherein the step of converting at least one table includes converting at least one table when the selection includes conversion of at least one table.
少なくとも1つのスパンラベル及び少なくとも1つのダイレクトラベルの少なくとも一方を識別し、各スパンラベルは、テーブルの複数の列及び行の一方に関連され、そして各ダイレクトラベルは、テーブルの単一の列及び単一の行の一方に関連され、
スパンラベル及びダイレクトラベルの少なくとも一方に関連したテーブルの各セルに対するラベルストリングを決定し、これにより、各スパンラベル及び各ダイレクトラベルをローカライズし、各ラベルストリングは、スパンラベル及びダイレクトラベルの少なくとも1つを含む、
という段階を備えた方法。 A method for localizing at least one label of a table in an electronic document, the table comprising a plurality of cells organized in at least one row and at least one column, wherein:
Identifying at least one of at least one span label and at least one direct label, each span label being associated with one of a plurality of columns and rows of the table, and each direct label being a single column and single of the table Associated with one of the rows,
Determining a label string for each cell of the table associated with at least one of the span label and the direct label, thereby localizing each span label and each direct label, wherein each label string is at least one of the span label and the direct label; including,
A method with a stage.
隣接行の各対と隣接列の各対の1つの間の類似性の尺度を決定し、
上記類似性の尺度に基づいて、隣接行の他の対よりも所与のパーセンテージ以上異なる隣接行の対と、隣接列の他の対よりも所与のパーセンテージ以上異なる隣接列の対との1つを識別し、そして
隣接行の上記識別された対の行と、隣接列の上記識別された対の列との1つを、少なくとも1つのダイレクトラベルを含むものとして識別する、
という段階を含む請求項28に記載の方法。 The above steps for identifying at least one direct label include:
Determine a measure of similarity between each pair of adjacent rows and one of each pair of adjacent columns;
Based on the similarity measure, one of a pair of adjacent rows that differs by more than a given percentage from other pairs of adjacent rows and a pair of adjacent columns that differs by more than a given percentage than other pairs of adjacent columns And identifying one of the identified pair of rows of adjacent rows and the identified pair of columns of adjacent columns as including at least one direct label;
30. The method of claim 28, comprising the steps of:
隣接行の各対及び隣接列の各対の一方の各セルに対する特性ベクトルを決定し、
隣接行内の同じ列のセル間の距離と、隣接列内の同じ行のセル間の距離との一方を、各セルに対する特性ベクトルに基づいて決定し、そして
隣接行の列及び隣接列の行の一方を横切る距離を加算する、
という段階を含む請求項29に記載の方法。 The above stage of determining a measure of similarity is:
Determine a characteristic vector for each cell in each pair of adjacent rows and each pair of adjacent columns;
One of the distance between cells in the same column in adjacent rows and the distance between cells in the same row in adjacent columns is determined based on the characteristic vector for each cell, and Add distance across one,
30. The method of claim 29, comprising the steps of:
少なくとも1つのテーブルより成るテーブル情報を含む電子文書を受け取るための第1の実行可能な部分と、
少なくとも1つのテーブルを、各テーブルの順序に基づくと共に、少なくとも1つのテーブルが少なくとも1つのラベルを含むときに少なくとも1つのラベルにも基づいて、少なくとも1つのテーブルの直線化された表示へ変換するための第2の実行可能な部分と、
を備えているコンピュータプログラム製品。 A computer program product for converting table information for rendering on a terminal having a limited area display, the computer program product comprising a computer readable storage medium storing a computer readable program code portion Wherein the computer readable program code portion is:
A first executable part for receiving an electronic document comprising table information comprising at least one table;
To convert at least one table to a linearized representation of at least one table based on the order of each table and also based on at least one label when the at least one table includes at least one label A second executable part of
A computer program product equipped with.
ターミナルがパンをサポートする場合に、少なくとも1つのテーブルを変換するか、電子文書を、少なくとも1つのテーブルを変換せずに転送するかの一方の選択を受け取る第4の実行可能な部分と、
を更に備え、上記第2の実行可能な部分は、その選択が少なくとも1つのテーブルの変換を含むときには、少なくとも1つのテーブルを変換する請求項31に記載のコンピュータプログラム製品。 A third executable part that determines whether the terminal supports panning;
A fourth executable portion that receives a choice of either converting at least one table or transferring an electronic document without converting at least one table if the terminal supports panning;
32. The computer program product of claim 31, further comprising: converting the at least one table when the selection includes conversion of at least one table.
少なくとも1つのスパンラベル及び少なくとも1つのダイレクトラベルの少なくとも一方を識別するための第1の実行可能な部分を備え、各スパンラベルは、テーブルの複数の列及び行の一方に関連され、そして各ダイレクトラベルは、テーブルの単一の列及び単一の行の一方に関連され、そして
スパンラベル及びダイレクトラベルの少なくとも一方に関連したテーブルの各セルに対するラベルストリングを決定し、これにより、各スパンラベル及び各ダイレクトラベルをローカライズするための第2の実行可能な部分を備え、各ラベルストリングは、スパンラベル及びダイレクトラベルの少なくとも1つを含むようにされたコンピュータプログラム製品。 A computer program product for localizing at least one label of a table in an electronic document, the table comprising a plurality of cells organized in at least one row and at least one column, and further comprising a computer readable program In a computer program product comprising a computer readable storage medium having a code portion stored thereon, the computer readable program code portion comprises:
A first executable portion for identifying at least one of at least one span label and at least one direct label, each span label being associated with one of a plurality of columns and rows of the table, and each direct The label is associated with one of the single column and single row of the table, and determines a label string for each cell of the table associated with at least one of the span label and the direct label, whereby each span label and A computer program product comprising a second executable portion for localizing each direct label, wherein each label string includes at least one of a span label and a direct label.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004028681A JP2005196711A (en) | 2004-01-05 | 2004-01-05 | Conversion of table information for rendering on area-restricted display |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004028681A JP2005196711A (en) | 2004-01-05 | 2004-01-05 | Conversion of table information for rendering on area-restricted display |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005196711A true JP2005196711A (en) | 2005-07-21 |
Family
ID=34824066
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004028681A Pending JP2005196711A (en) | 2004-01-05 | 2004-01-05 | Conversion of table information for rendering on area-restricted display |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2005196711A (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009152673A (en) * | 2007-12-18 | 2009-07-09 | Fuji Xerox Co Ltd | Image processor and image processing program |
-
2004
- 2004-01-05 JP JP2004028681A patent/JP2005196711A/en active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009152673A (en) * | 2007-12-18 | 2009-07-09 | Fuji Xerox Co Ltd | Image processor and image processing program |
JP4569622B2 (en) * | 2007-12-18 | 2010-10-27 | 富士ゼロックス株式会社 | Image processing apparatus and image processing program |
US8201084B2 (en) | 2007-12-18 | 2012-06-12 | Fuji Xerox Co., Ltd. | Image processing apparatus and computer readable medium |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101117396B1 (en) | Platform for rendering content for a remote device | |
US7565605B2 (en) | Reorganizing content of an electronic document | |
KR100490734B1 (en) | Annotation-based automatic document generation apparatus and method | |
KR100461019B1 (en) | web contents transcoding system and method for small display devices | |
US20060107206A1 (en) | Form related data reduction | |
US8645491B2 (en) | Methods and apparatus for enabling a hybrid web and native application | |
EP3226159A1 (en) | System and method for managing browsing histories of web browser | |
US20090157407A1 (en) | Methods, Apparatuses, and Computer Program Products for Semantic Media Conversion From Source Files to Audio/Video Files | |
JP2004527041A (en) | System and method for content delivery over a wireless communication medium to a portable computing device | |
CN102906737A (en) | Method and apparatus for expanded content tag sharing | |
US11580314B2 (en) | Document translation method and apparatus, storage medium, and electronic device | |
CN101390095A (en) | Method, apparatus and computer program product for generating a graphical image string to convey an intended message | |
CN104462051A (en) | Word segmentation method and device | |
CN111046135A (en) | Unstructured text processing method and device, computer equipment and storage medium | |
US20170329863A1 (en) | Methods and Systems for Tagging Documents and for Compressing Tagged Documents | |
EP2972991A2 (en) | Detection and reconstruction of right-to-left text direction, ligatures and diacritics in a fixed format document | |
CN102577334A (en) | Method and apparatus for the automatic predictive selection of input methods for web browsers | |
WO2023280106A1 (en) | Information acquisition method and apparatus, device, and medium | |
US7761590B2 (en) | Method, apparatus, mobile terminal and computer program product for converting from a first forms markup language to a second forms markup language | |
CN116795780A (en) | Document format conversion method and device, storage medium and electronic equipment | |
JP2005196711A (en) | Conversion of table information for rendering on area-restricted display | |
CN1641632B (en) | System, method and terminal for converting form information so as to show it on display device with limit area | |
EP1550961A1 (en) | Handling tabular information | |
KR20050071843A (en) | Transforming tabular information for rendering on a limited-area display | |
JP7179512B2 (en) | Information processing method, information processing device, and program |