JP2010129057A - 情報処理装置、表示データ翻訳方法、及びプログラム - Google Patents

情報処理装置、表示データ翻訳方法、及びプログラム Download PDF

Info

Publication number
JP2010129057A
JP2010129057A JP2008306644A JP2008306644A JP2010129057A JP 2010129057 A JP2010129057 A JP 2010129057A JP 2008306644 A JP2008306644 A JP 2008306644A JP 2008306644 A JP2008306644 A JP 2008306644A JP 2010129057 A JP2010129057 A JP 2010129057A
Authority
JP
Japan
Prior art keywords
character information
display data
information
translation
translated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008306644A
Other languages
English (en)
Inventor
Shigeo Negoro
茂夫 根来
Seiji Takahashi
征司 高橋
Yuichiro Sakuta
雄一郎 作田
Masaki Tasaka
政樹 田坂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2008306644A priority Critical patent/JP2010129057A/ja
Publication of JP2010129057A publication Critical patent/JP2010129057A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】予め登録された文字情報は勿論のこと、予め登録されていない文字情報を含め、表示データをそれぞれ同義の異なる表示形式で表示する情報処理装置等を提供する。
【解決手段】文字情報を翻訳する汎用翻訳手段と、表示データとして予め登録された静的文字情報に特化して翻訳する専用翻訳手段とを有し、要求された言語形式に応じた表示データを生成する情報処理装置であって、第一の言語形式で文字情報を含む表示データを生成する表示データ生成手段と、生成された表示データの中から、専用翻訳手段で翻訳可能な静的文字情報と、専用翻訳手段で翻訳不可能な動的文字情報とを分別して取得する分別取得手段とを有し、専用翻訳手段は静的文字情報を、汎用翻訳手段は動的文字情報を要求された第二の言語形式に翻訳し、第二の言語形式に翻訳された静的文字情報及び動的文字情報による前記表示データを生成する。
【選択図】図3

Description

本発明は、情報処理装置、表示データ翻訳方法、及びプログラムの分野に関する。
近年、インターネット上で種々の情報を提供するための表示データであるWebページにおいて、デザインや情報の表示形式をユーザにあわせて提供するものが知られている。同一の情報を異なる表示形式で表示する顕著な例としては、異なる言語による表示が挙げられる。即ち、Webページを利用するユーザは、それぞれ同じ言語を使うとは限らず、様々な言語で情報を見るのが一般的である。あるユーザは日本語での表示を要求し、別のユーザは英語やフランス語等による表示を要求する。
一方、最近では画像処理装置のような組み込み機器において、機器のステータスや、保管された文書情報、スプールされているジョブ、FAXやe−mail等に使用されるアドレス帳等を、ネットワークを介して接続される端末等にWebページによって提供するものが存在する。Webページによってこれらの情報を提供する利点としては、端末側には汎用的なWebブラウザがあれば特別なソフトウェアをインストールしなくても良い、端末側のプラットフォームに依存しない、機器の側にいなくとも遠隔地において情報を確認できる等が挙げられる。このような機器によって提供されるWebページにおいても、一般的なWebサーバによるものと同様、同一の情報をユーザによって異なる言語や表示形式により表示できることが望ましい。
機器に関する情報を様々な表示形式や言語形式で提供するための手法としては、予め変換後の表示データや翻訳後の複数の言語形式による文字情報等を保持しておく手法(例えば、特許文献1参照)が知られている。機器はWebブラウザからの要求に応じた表示形式や言語形式に対応する予め保持された表示データに変換(翻訳)してからWebページを提供することで、Webブラウザの要求に応じることができる。
特開2004−110131号公報
しかしながら、特許文献1に記載される発明では、Webページに含まれる文字情報等を要求に応じた言語形式で翻訳するときに、翻訳できない文字情報等があった。即ち予め翻訳処理された言語形式の文字情報等を保持しておく手法なので、予め想定されていない文字情報等については対応する言語形式(翻訳文)を有しておらず翻訳できなかった。例えば、翻訳できない文字情報等としてコメント(自由記述欄)が代表例である。コメントは、事前に想定されていない文字情報を含んでいることが考えられる。これら想定外の文字情報は、ユーザに事後的に作成されたものであるので、予め翻訳文を準備できないのである。この場合、コメント欄内のコメントは翻訳されない状態のまま表示されていた。
従って、ユーザは表示されたWebページのコメントに対して別途汎用翻訳アプリケーション等で翻訳を行なうなどの手間が必要であった。また、Webページ(HTML)を生成後、汎用翻訳アプリケーション等で一律に翻訳処理を行ってからユーザに対して表示することも可能であるが、機器に関する情報は機器専用に用いられている用語であったり、専門性の高い用語であったりする場合が多いため、このような用語が汎用翻訳アプリケーション等で適切に翻訳されることは難しく、予め翻訳処理された言語形式の文字情報等を保持しておく手法と比べるとその翻訳品質に劣ると言わざるをえない。
勿論、端末側のWebブラウザで表示されるWebページについてはあくまで一例であり、端末側が専用ビューアで表示データ(表示画面)を表示する場合であっても同様に生じる問題ということができる。
そこで本発明では上記のような問題に鑑みて、予め登録された文字情報は勿論のこと、予め登録されていない文字情報を含め、表示データをそれぞれ同義の異なる表示形式で表示する情報処理装置、表示データ翻訳方法、及びプログラムを提供することを目的とする。
上記課題を解決するため、本発明に係る情報処理装置は、表示データに関する文字情報を他言語に翻訳する汎用翻訳手段と、表示データとして予め登録された静的文字情報に特化して他言語に翻訳する専用翻訳手段とを有し、要求された言語形式に応じた表示データを生成する情報処理装置であって、第一の言語形式で文字情報を含む前記表示データを生成する表示データ生成手段と、前記表示データ生成手段により生成された前記表示データの中から、表示データとして予め登録され前記専用翻訳手段で翻訳可能な前記静的文字情報と、表示データとして予め登録されていない文字情報であって前記専用翻訳手段で翻訳不可能な動的文字情報とを分別して取得する分別取得手段とを有し、前記専用翻訳手段は前記静的文字情報を要求された第二の言語形式に翻訳し、前記汎用翻訳手段は前記動的文字情報を要求された第二の言語形式に翻訳し、第二の言語形式に翻訳された前記静的文字情報及び前記動的文字情報による前記表示データを生成することを特徴とする。
また、上記課題を解決するため、前記情報処理装置において、前記画像データに含まれる画像内から画像文字を文字情報として取得する文字情報抽出手段と、前記画像データに基づいて画像データを生成する画像データ生成手段とを有し、前記分別取得手段は、前記文字情報抽出手段により抽出された文字情報を前記動的文字情報として分別して取得し、前記専用翻訳手段は、前記動的文字情報とされた文字情報を要求された第二の言語形式に翻訳し、前記画像データ生成手段は、前記第二の言語形式に翻訳された文字情報を、前記文字情報抽出手段により抽出された対応する文字情報に代え、前記画像データに基づいて画像データを生成することを特徴とする。
また、上記課題を解決するため、本発明に係る表示データ翻訳方法は、表示データに関する文字情報を他言語に翻訳する汎用翻訳手段と、表示データとして予め登録された静的文字情報に特化して他言語に翻訳する専用翻訳手段とを有し、要求された言語形式に応じた表示データを生成する情報処理装置における表示データ翻訳方法であって、コンピュータが、第一の言語形式で文字情報を含む前記表示データを生成する表示データ生成手順と、前記表示データ生成手順により生成された前記表示データの中から、表示データとして予め登録され前記専用翻訳手段で翻訳可能な前記静的文字情報と、表示データとして予め登録されていない文字情報であって前記専用翻訳手段で翻訳不可能な動的文字情報とを分別して取得する分別取得手順と、前記専用翻訳手段により前記静的文字情報を要求された第二の言語形式に翻訳する手順と、前記汎用翻訳手段により前記動的文字情報を要求された第二の言語形式に翻訳する手順と、第二の言語形式に翻訳された前記静的文字情報及び前記動的文字情報による前記表示データを生成する手順とを有することを特徴とする。
なお、本発明の構成要素、表現または構成要素の任意の組合せを、方法、装置、システム、コンピュータプログラム、記録媒体、などに適用したものも本発明の態様として有効である。
本発明によれば、予め登録された文字情報は勿論のこと、予め登録されていない文字情報を含め、表示データをそれぞれ同義の異なる表示形式で表示する情報処理装置、表示データ翻訳方法、及びプログラムを提供することができる。
以下、本発明を実施するための最良の形態を各実施形態において図面を用いて説明する。以下、画像処理装置(画像形成装置)1に本発明を適用した実施形態を示す。
多種の画像形成機能を融合する本発明の実施の一形態に係る画像処理装置は、例えば、図1に示すような構成を成す。画像処理装置10は、コピー機能、ファクシミリ(FAX)機能、プリント機能、スキャナ機能及び入力画像を配信する機能等を複合したいわゆるMFP(Multi Function Peripheral)と称されるデジタル複合機である。画像処理装置10は、後述するようにWebサーバ機能を有しており、ネットワーク上に接続された端末からWebブラウザを通じて、各種装置情報や、格納される画像及び付帯情報(属性情報)などを閲覧できるようになっている。以下、説明する。
<システム>
(画像処理装置)
図1は、画像処理装置10のハードウェア構成例を示す図である。図1において、画像処理装置10は、CPU1102と、メモリユニット1104と、ハードディスク(HD)1106とをASIC1108に接続したコントローラボード1101と、操作部1111と、USB(Universal Serial Bus)1112と、IEEE13941113と、スキャナ1231と、プロッタ1232と、FAX1233とを有する。
そして、操作部1111はASIC1108に接続され、USB(Universal Serial Bus)1112と、IEEE13941113と、スキャナ処理を行うためのハードウェア資源であるスキャナ1231と、印刷処理を行うためのハードウェア資源であるプロッタ1232と、FAX処理を行うためのハードウェア資源であるFAX1233とは、PCIバス1109を介してASIC1108に接続されている。
メモリユニット1104には、画像処理装置10を制御するのに必要なプログラム等が格納されている。HD1106には、文書ファイル、画像データ、プログラム、フォントデータ及びフォームが蓄積される。操作部1111は、ユーザからの入力操作の受け付け並びにユーザに向けた表示を行う。
このようなハードウェア構成を採用することにより、異なる画像処理を行うためのデバイスを共有化でき低コスト設計が可能となる。
次に、図1に示すCPU1102によって制御される画像処理装置10の機能構成について説明する。図2は、画像処理装置の機能構成例を示す図である。図2において、画像処理装置10は、スキャナ1231、プロッタ1232及びFAX1233等の個別の画像処理を行うためのハードウェア資源と、エンジン制御ボード1201と、エンジンI/F1202と、OS1203と、API(Application Program Interface)1204と、スキャナアプリ1211、プリンタアプリ1212、ファックスアプリ1213及びWebアプリ1214等の各種アプリケーションを有している。
エンジン制御ボード1201は、スキャナ1231、プロッタ1232、FAX1233等の画像処理装置10の個別機能を制御する。エンジンI/F1202は、エンジン制御ボード1201に対するインタフェースを、OS1203やAPI1204に提供する。
OS1203は、UNIX(登録商標)などのオペレーティング・システムであり、スキャナアプリ1211、プリンタアプリ1212等、アプリケーションとして実装されている各種ソフトウェアをプロセスとして並列実行する。
API1204は、スキャナアプリ1211、プリンタアプリ1212等のアプリケーションへのインタフェースを提供する。
スキャナアプリ1211は、スキャナ用アプリケーションであり、プリンタアプリ1212は、ページ記述言語(PDL)、PCL及びポストスクリプト(PS)を有するプリンタ用アプリケーションである。ファックスアプリ1213は、ファクシミリ用アプリケーションである。また、Webアプリ1214は、画像処理装置10にネットワークを介して接続されるWebクライアントに対して画像処理装置10の各種アプリケーションの機能を提供するためのアプリケーションである。
このように、OS1203及びAPI1204上に各種アプリケーションを搭載するよう構成しているので、各画像処理の処理部分を共有することが可能となる。従って、画像処理装置10全体の生産性を高めるとともに、各アプリケーションの開発効率を高めることができる。
(機能)
図3は、本発明に係る画像処理装置10の主要機能を示す機能ブロック図である。即ち、本発明の機能的観点からみて本発明実施装置(情報処理装置)の有する機能を示す。情報処理装置に含むことができる画像処理装置10は、主要な機能として、表示データ生成部301、分別取得部302、専用翻訳部303、及び汎用翻訳部304を有する。また、例えばDB(Data Base)形式等で、専用翻訳辞書313及び汎用翻訳辞書314を有する。
図3は本発明の機能を説明するにあたっての一構成例を示したものであり、各機能部は、独立して他の装置やサーバに分散して構成することもできる。例えば、汎用翻訳部304及び汎用翻訳辞書314)は他のサーバ上に配置しその処理結果を受信可能なように構成することができるし、更新を容易にするため辞書(DB)を外部に配置し利用可能なように構成することもできる。以下、各機能部について説明する。
表示データ生成部301は、第一の言語形式で文字情報を含む表示データを生成する機能を有している。例えば、画像処理装置10の基本言語(初期設定等による)を日本語とすると、第一の言語形式は日本語に相当し、表示データ生成部301はまずユーザに提供すべき表示データ(文字情報部分)を日本語で表現し生成する。本実施形態においてこれは翻訳される前の表示データとなる。なお表示データは、表示画面、画面データを構成するコンテンツであり、例えば、機器情報、設定情報、画像情報、コメントなどである。もし表示画面を利用するユーザが日本語表記による表示のままでよい場合は、このまま表示データは(例えばHTML形式の表示画面として)生成されればよい。
また、表示データ生成部301は、専用翻訳部303により翻訳された動的文字情報と、汎用翻訳部304により翻訳された静的文字情報とによる表示データを生成する機能を有している。生成された表示データは、画像処理装置10の画面やネットワーク上の端末の画面などに翻訳後の言語で表示される。
分別取得部302は、表示データ生成部301により生成された表示データの中から、表示データとして予め登録され専用翻訳303で翻訳可能な静的文字情報と、表示データとして予め登録されていない文字情報であって専用翻訳部303で翻訳不可能な動的文字情報とを分別して取得する機能を有している。
「静的」文字情報とは、前述の予め翻訳処理された複数の言語形式による文字情報等を保持(登録)しておく手法により翻訳可能な文字情報である。従って、専用翻訳辞書313において静的文字情報に対応する異なる言語形式の翻訳語が予め登録(格納)されている。これに対して「動的」文字情報とは、予め想定されていない文字情報等であり、従って専用翻訳辞書313において動的文字情報に対応する異なる言語形式の翻訳語は登録(格納)されておらず、専用翻訳部303で翻訳不可能な文字情報である。例えば、翻訳できない文字情報等としては、コメント(自由記述欄)などが考えられる。これら想定外の文字情報は、ユーザが事後的(動的)に入力、設定、作成したものであるので、予めそれらに対応する翻訳文を準備(登録)できないのである。こうした動的(ダイナミック)に作成される文字情報との意味合いから動的文字情報という。また、一貫して固定的で変化なく静的(スタティック)な文字情報を静的文字情報という。一貫して固定的で変化ないゆえ、予め対応する翻訳語を専用翻訳辞書313において準備することができるのである。
専用翻訳部303は、表示データとして予め登録された静的文字情報に特化して他言語に翻訳する機能を有している。この翻訳にあたっては翻訳専用翻訳辞書313が参照される。
汎用翻訳部304は、汎用的な文字や文章を含む文字情報を他言語に翻訳する機能を有している。この翻訳にあたっては汎用翻訳辞書314が参照される。汎用翻訳部304として、従来からの汎用の翻訳アプリケーションを採用することができる。
(Webに係る機能)
次に、Webアプリ1214及びAPI1204の一部の機能によるWebサーバとしての前述の画像処理装置10の機能構成の詳細について説明する。図4は、画像処理装置のWebサーバとしての機能構成例を示す図である。図4において画像処理装置10は、Webサーバプログラム11、Webアプリケーション12、XSLT(XSL Transformations)プロセッサ13、XSL(eXtensible Stylesheet Language)ファイル14、日本語用言語リソースファイル15及び英語用言語リソースファイル16、汎用言語リソースファイル17等から構成される。Webクライアント100は、画像処理装置10とネットワークを介して接続される端末であり、Webページを表示するWebブラウザ101を備えている。
Webサーバプログラム11は、一般にHTTPd(HTTP daemon)と呼ばれるプログラムに相当し、画像処理装置10をWebサーバとして機能させるためのものである。Webサーバプログラム11は、Webクライアント100のWebブラウザ101からのHTTPリクエストに応じて、Webアプリケーション12を起動する。またWebサーバプログラム11は、Webアプリケーション12が生成したHTML(HyperText Markup Language)データを要求元のWebブラウザ101に送信する。なお、Webサーバプログラム11は、図2において、API1204の一部の機能として画像処理装置10に実装されている。
Webアプリケーション12は、図2におけるWebアプリ1214に相当するものであり、Webクライアント100からの要求に対する処理を実行し、その処理結果をWebクライアント10において表示する表示データであるWebページを生成するプログラムである(表示データ生成部301に相当)。例えばWebアプリケーション12は、表示データとしてのWebページを生成する。より詳しくは、Webアプリケーション12は処理結果をXMLデータとして生成し、XSLTプロセッサ13によってそのXMLデータに格納されている処理結果をWebページ上での表示データとしたHTMLデータ(Webページ)に変換することによりWebページを生成する。但し、XMLデータは必ずしもWebアプリケーション12が生成したものだけに限られず、ファイルとして保存されているXMLデータをWebアプリケーションが表示データとして特定し、そのXMLデータを変換することによりWebページを生成してもよい。
ここでWebアプリケーション12が生成するXMLデータに格納されている(含まれている)表示データは、実際にWebページ上で表示される表示形式では記載されておらず、各表示対象を識別するためID(キーともいう)などの識別情報により記載されている。即ちWebアプリケーション12は、表示データの生成処理は行うが、その表示形式については関知しない。
XSLTプロセッサ13は、前述の本発明に係る各機能を実現する。まずXSLTプロセッサ13は、XMLデータ内の表示データ(文字情報を含む表示データ)の中から、静的文字情報と動的文字情報とを分別する(分別取得部302)。日本語用言語リソースファイル15又は英語用言語リソースファイル16等の専用言語リソースファイル(これらは専用翻訳辞書313に相当)内のIDにより特定される表示データは、静的文字情報であるといえる。日本語用言語リソースファイル15又は英語用言語リソースファイル16等の専用言語リソースファイルにはIDに対応するように言語変換(翻訳)されるべき文字情報(又は表示情報)が格納されており、IDをキーとして専用言語リソースファイルを参照して翻訳が可能だからである。一方、専用言語リソースファイル内のIDにより特定されない表示データは、動的文字情報であるといえる。
そして、XSLTプロセッサ13は、静的文字情報についてはIDをキーとして、例えば英語用言語リソースファイル16からそのIDに対応する文字情報(英語表記による翻訳語、表示文字列)を取得する(専用翻訳部303)。一方、XSLTプロセッサ13は、動的文字情報については、汎用言語リソースファイル17(汎用翻訳辞書314に相当)から動的文字情報に対応する文字情報(英語表記による翻訳語、表示文字列)を取得する(汎用翻訳部304)。
なお、画像処理装置10の基本言語(初期設定等による)を日本語とし他の言語へ翻訳要求されない場合、静的文字情報についてのIDをキーとして、日本語用言語リソースファイル15からそのIDに対応する文字情報を取得する。また、動的文字情報については、ユーザ入力による言語が日本語である場合には、翻訳の必要はないので入力された表記のままの文字情報を取得すればよい。
そして、XSLTプロセッサ13は、専用言語リソースファイルからそのIDに対応する文字情報と、汎用言語リソースファイル17から動的文字情報に対応する表示文字列と含む表示データを、XSLファイル14に定義されている書式情報に従ってHTMLデータに変換する(表示データ生成部301)。
XSLファイル14には、表示データ内のIDを専用言語リソースファイルに記されている表示形式に変換するための処理や、表示情報データをHTMLデータへ変換するための書式情報が定義されている。また、XSLファイル14においても表示データがIDとして記述されており、それらの表示形式への変換についても定義されている。
日本語用言語リソースファイル15は、表示データ内のIDに対する表示形式として日本語による文字情報(表示文字列)が定義されているXMLファイルであり、英語用言語リソースファイル16は、表示データ内のIDに対する表示形式として英語による文字情報(表示文字列)が定義されているXMLファイルである。なお、図示されていないが、専用言語リソースファイルは日本語用、英語用だけに限られず、例えばドイツ語、フランス語等、他の言語で表示されるWebページの生成も必要な場合は、それらに対応する言語リソースファイルを用意すればよい。
汎用言語リソースファイル17は、汎用言語翻訳アプリケーションが翻訳処理の際に利用する文字情報(翻訳語、表示文字列)が定義されているファイルである。日本語、英語、ドイツ語、フランス語、その他の言語含めて定義されている言語辞書である。
上述したように、Webアプリケーション12が生成するWebページに表示される静的文字情報はID(キー)として表示データ内に生成され、表示データ内の各IDの表示文字列は専用言語リソースファイルにより定義され、更に表示データをWebページに変換する際の書式情報はXSLファイル14によって定義されている。以下、具体的にWebページ例を参照しながら、画像処理装置10のWebページ生成処理について説明していく。
<動作>
以下、画像処理装置10の処理手順について説明する。図5は、画像処理装置のWebページ生成処理を説明するためのシーケンス図である。まず図5のシーケンスに沿って全体的な流れに触れた後、各ステップについて詳細に説明していく。
ステップS10において、Webクライアント100のWebブラウザ101は、ユーザからのURLの入力等に基づいて、例えば画像処理装置10のプリンタ名等の設定情報を日本語又は英語等で表示するWebページの送信要求(HTTPリクエスト)を画像処理装置10のWebサーバプログラム11に送信する。
ステップS11に進み、HTTPリクエストを受信したWebサーバプログラム11は、URLの指定に応じ、画像処理情報10の設定情報を表示するWebページの生成を行うWebアプリケーション12を呼び出す。ここでWebサーバプログラム11は、Webクライアント100から要求された言語でWebページを生成するように指定して、Webアプリケーション12を呼び出す。なお、要求された言語は「日本語」である場合と「英語」である場合を例にして以下説明していく。
ステップS12に進み、Webアプリケーション12は、画像処理装置10の設定情報を取得し、その結果をXMLデータとして生成する。XMLデータの例については後ほど詳しく説明を行う。
ステップS13に進み、Webアプリケーション12は、表示データにXSLファイルを適用してHTMLデータを生成するように、XSLTプロセッサ13に要求する。
ステップS14に進み、XSLTプロセッサ13は、表示データにXSLファイルを適用してHTMLデータを生成する。この際、XSLTプロセッサ13は、表示データのlang要素の記載に従って、表示データ又はXSLファイル内記載されたIDキーをどの言語に置換すべきか、即ちどの専用言語リソースファイルを利用すべきかを判断し、専用言語リソースファイルに定義されている表現に置換する。XSLTプロセッサ13は、表示データを日本語で表示するWebページを生成する場合は、前述したXSLファイル及び日本語リソースファイル15を適用してHTMLデータを生成し、英語で表示するWebページを生成する場合は、日本語よるWebページの生成と同一のXSLファイル及び英語用言語リソースファイル16を適用してHTMLデータを生成する。当ステップの詳細については再度後述する。
ステップS15に進み、XSLTプロセッサ13は、生成したHTMLデータ、即ちWebページをWebアプリケーション12に対して出力する。
ステップS16に進み、Webアプリケーション12は、WebページをWebサーバプログラム11に出力する。
ステップS17に進み、Webサーバプログラム11は、Webページを要求元のWebブラウザ101に送信する。
ステップS18に進み、Webブラウザ101は受信したWebページを表示する。
以上、画像処理装置10のWebページ生成処理手順の全体的な流れである。次に、特定のステップについてさらに詳細に説明する。
ステップS12に関して、Webアプリケーション12は、画像処理装置10の設定情報を取得し、その結果をXMLデータとして生成する。図6は、XMLデータを示す図の一例である。つまり、Webアプリケーション12の処理結果として生成されるXMLデータの例を示す図であって、日本語のWebページが要求された場合の例である。XMLデータにおいて、langタグ601は、表示データをどの言語によるWebページに変換すべきかを示す。本実施形態において「ja」の記載は、日本語に変換すべきことを意味する。例えば英語へ変換すべき旨の記載が「en」である場合に、英語のWebページが要求されると、langタグ601には「en」と記載される。
resultタグ602は、Webアプリケーション12の処理結果のステータスを示す。ここで「SUCCESS」は、処理が正常終了したことを示す。
settingタグ603は、画像処理装置10の設定情報が記されているタグであり、各設定情報を表すitemタグ604を有している。各itemタグは、更に設定情報の各項目を示す項目名(Nameタグ)とその値(Valueタグ)を有している。
具体的には、itemタグ604において、Nameタグ605は、「S_MENU1」であり、またその値を示すVALUEタグ606は、「s_menu1」であることが分かる。ここで「s_menu1」は表示データを識別するためのID(キー)に該当し、言語によって表示文字列が異なる対象である。そして、日本語用言語リソースファイル15や英語用言語リソースファイル16内のIDと関連付けられている。即ち「s_menu1」は静的文字情報に相当する。そして、このように専用言語リソースファイル内の翻訳語とIDで関連付けられているタイプの値は、タイプ1(value type="1")として区分しておく。
Nameタグ607のVALUEタグ608において、そのタイプはタイプ2(value type="2")となっている。また、Nameタグ609のVALUEタグ610において、そのタイプはタイプ3(value type="3")となっている。このようなタイプ2及び3とされる値(Value)は、当該装置の機器情報DB等に格納されている機器情報が挿入される。即ち、タイプ2及び3に区分されるValue値(例えば、s_name2やs_comment2)は、DB等から機器情報の一項目情報として取得される情報となる。このような項目情報の一例として、名前(機器名)、ホスト名、所属(場所)、コメント等が挙げられる。このような情報は、機器情報としてDB等に格納(登録)されている情報である。
またさらに、タイプ3は本発明に係る翻訳の対象となる値であることを示す。このような値、項目情報の例として、コメントが挙げられる。DB等から機器情報の一項目情報として取得される情報ではあるが、例えば英語表記による表示を要求された場合、前述の専用言語リソースファイル(言語辞書)に登録されていないので、当該値はこの専用言語リソースファイルを利用して翻訳することはできない。従って、タイプ3に区分される値は、汎用言語リソースファイル17を利用して翻訳される。即ちタイプ3に区分される値は、動的文字情報に相当する。
次にステップS14に関して、XSLTプロセッサ13は、表示データにXSLファイルを適用してHTMLデータを生成するが、表示データを日本語で表示するWebページを生成する場合は、静的文字情報については、上述したXSLファイル(langタグ=「ja」)及び日本語用言語リソースファイル15を適用してHTMLデータを生成する。また、英語で表示するWebページを生成する場合は、静的文字情報については、日本語よるWebページの生成と同一のXSLファイル(但し、langタグ=「en」)及び英語用言語リソースファイル16を適用してHTMLデータを生成する。
図7は、日本語用言語リソースファイル15を示す図の一例である。また図8は、英語用言語リソースファイル16を示す図の一例である。図6のVALUEタグがID(キー)となるように、gentextタグのkey属性と関連付けられており、さらにその場合のstring属性(いわば翻訳語)が登録されている。例えば、図6のVALUEタグ606「s_menu1」は、図7のkey="s_menu1"701に関連付いており、よってstr="ホーム"702を翻訳語として取得することができる。勿論、これは前述のlangタグ601は「ja」の場合であり、langタグ601が「en」である場合には、図8のkey="s_menu1"801に関連付いており、よってstr="HOME"802を翻訳語として取得することができる。専用言語リソースファイルにより翻訳されるVALUEタグ値はタイプ1であることは、前述した通りである。
一方、タイプ2に区分されるVALUEタグ値は、前述したように当該装置の機器情報DB等に格納されている機器情報の一項目情報として取得される情報となる。このタイプ2に区分される項目情報は、名前(機器名)、ホスト名などが挙げられる。これらの項目情報は、いわば固有名称等であり、翻訳の対象とし難い情報であるといえる。即ち、機器名やホスト名は日本語入力である場合でも英字で入力されることが多いし、日本語で入力された場合であっても固有名詞であるため対応する翻訳語は存在しない。つまり、固有名詞は固有名詞のままオリジナル言語表記で表示されるべきであるといえ、機器情報DB等に格納されている機器情報のままの表記で表示されるべきである。
タイプ3に区分されるVALUEタグ値は、前述したように当該装置の機器情報DB等に格納されている機器情報の一項目情報として取得される情報となる。このタイプ3に区分される項目情報はコメントなどが挙げられる。これらの項目情報は、いわば普通名称や文章等の文字情報であり、翻訳の対象とすべき情報であるといえる。即ち、コメントは文章で入力されることが多いし、例えば日本語で入力された場合であっても、これに対応する英語で表示したい場合がある。従って、このようなタイプ3に区分される値は、汎用言語リソースファイル17を利用して翻訳される。なお、タイプ2又は3との区分は、上述の項目情報毎の性格(特徴)を考慮して予め定義されればよい。また、タイプとの区分はVALUEタグ値に対する処理を識別するためのもので、勿論これに限定されることなくその他の方法によってもよい。
次にステップS15に関して、XSLTプロセッサ13は、生成したHTMLデータ、即ちWebページをWebアプリケーション12に対して出力する。図9は、Webページ(日本語)を示す図の一例である。図9のWebページにおいて、メニュー文字列や機器情報を示す各項目は日本語で表示されている。また、各項目の値(「管理者コメント」、「名前」、「コメント」等)についても日本語で表示されているのが分かる。
702は、前述のタイプ1の静的文字情報に相当し、この文字列は日本語用言語リソースファイル15内の文字情報からが取得し表示された項目である。
902及び903は、前述のタイプ2の情報に相当し、前述したように当該装置の機器情報DB等に格納されている機器情報の一項目情報として取得されており、機器情報DB等に格納されている機器情報のままの表記で表示されている。
901、904、及び905は、前述したように当該装置の機器情報DB等に格納されている機器情報の一項目情報として取得されており、さらに汎用言語リソースファイル17を利用して翻訳された後表示されている。なお、入力された言語形式が日本語である場合には汎用言語リソースファイル17を介さず表示してもよい。汎用言語リソースファイル17を介して翻訳される場合、文字コード等が参照されて結果入力された日本語が出力結果とされ維持される。
次に図10を参照する。図10は、Webページ(英語)を示す図の一例である。図10のWebページにおいて、メニュー文字列や機器情報を示す各項目は英語で表示されている。また、各項目の値(「ADMINISTRATOR COMMENT」、「NAME」、「COMMENT」等)についても英語で表示されているのが分かる。
801は、前述のタイプ1の静的文字情報に相当し、英語用言語リソースファイル16内の文字情報が取得されて表示された項目である。
1002及び1003は、前述のタイプ2の情報に相当し、前述したように当該装置の機器情報DB等に格納されている機器情報の一項目情報として取得されており、機器情報DB等に格納されている機器情報のままの表記で表示されている。また、図9の902及び903を同じ表示である。
1001、1004、及び1005は、前述のタイプ3の動的文字情報に相当し、当該装置の機器情報DB等に格納されている機器情報の一項目情報として取得されている。そしてさらに汎用言語リソースファイル17を利用して翻訳(英語翻訳)された後表示されている。
なお、言語表示の切り替えボタン(図9の906及び図10の1006)により、異なる言語表示の切り替えを行うことができるようになっている。例えば、日本語のWebページから英語のWebページに切り替えを行なう場合、「英語」を選択の上図9の切り替えボタン906を押下すると、図10に示される英語のWebページが表示される。英語のWebページの生成はこれまで説明した処理により要求の際に行われてもよいし、予め生成しておいてもよい。また、言語表示の切り替えにおいて、例えば「日本語及び英語」などのような複数の言語併記の選択肢を設け、複数の言語表示でWebページを生成することも可能である。
以上、本発明に係る画像処理装置10によれば、Webページに含まれる文字情報等を要求に応じた言語形式で翻訳するときに、表示データとして予め登録されている(静的)文字情報と予め登録されていない文字情報とを分別してそれぞれ適切な方法で翻訳を行なうので、機器情報等を含む機器専門用語は適切に翻訳しつつ、コメント等を含む自由記述文章やユーザ入力語についても翻訳を行なうことができる。また、予め登録されていない文字情報であっても固有名詞など翻訳すべきでない用語については翻訳を行なわないことでより自然で適切な表示を行なうことができる。
(画像内の文字列に関しての処理)
次に、上述したようなWebページに画像データが表示される場合であって、同画像内に文字列が含まれるような場合の処理について説明を行う。
図11は、画像を含むWebページを示す図の一例である。ところで、前述の例でいえば、画像(データ)はタイプ3として区分されることができる。タイプ3に区分されるVALUEタグ値は、前述したように当該装置の機器情報DB等に格納されている機器情報の一項目情報として取得される情報としたが、画像データについても機器情報(又はその付帯情報)の一つといえる。そして、VALUEタグ値と、画像DB等の画像とは関連付けられており、VALUEタグ値に対応する、当該装置の画像DB等に格納されている画像データが挿入される。このような構成によるため、画像(データ)については、勿論タイプ2として区分することも可能である。しかしながら、本発明に係る画像処理装置10においては、このような画像(データ)についてタイプ3として区分し、画像内に含まれる文字列について翻訳処理を行うものである。以下、詳しく説明する。
図3に示した本発明に係る画像処理装置10の主要機能を示す機能ブロック図において、さらに文字情報抽出部、ドキュメント生成部、画像データ生成部を有する構成である(非図示)。再び図11を参照して、まず、文字情報抽出部は、図中の文字領域を対象にして画像(データ)から文字情報を抽出、取得する処理を行う。画像から文字情報を抽出、取得する方法としては、文字認識に係る従来の手法によればよい。そして、汎用翻訳部304は、取得された文字情報について上述したような翻訳処理(汎用翻訳)を実施する。ドキュメント生成部は、画像(データ)と抽出した文字情報を元にドキュメントの構築を行う。即ち例えば、英語文字列を含む画像を、日本語文字列に翻訳した画像を生成する。なお、この際に設定されたフォント(フォントタイプ、フォントサイズ、フォント色等)に従い文字列の変換を行うこともできる。最後に画像データ生成部は、ドキュメント生成部により生成されたドキュメントの画像化を行う。
以上このように、Webページに含まれる画像(データ)に関して、画像内に含まれる文字列について翻訳処理を行うことができる。従って、ユーザ所望の言語表記に応じWebページ全体が同一の言語形式でもって表示され、好適にページ閲覧することができる。
以上、本発明によれば、予め登録された文字情報は勿論のこと、予め登録されていない文字情報を含め、表示データをそれぞれ同義の異なる表示形式で表示する情報処理装置、表示データ翻訳方法、及びプログラムを提供することができる。
なお、本発明は係る特定の実施形態に限定されるものではなく、特許請求の範囲に記載された本発明の要旨の範囲内において、種々の変形・変更が可能である。
例えば、端末側のWebブラウザで表示されるWebページについてはあくまで一例であり、端末側が専用ビューアで表示データ(表示画面)を表示する場合であっても同様に本発明を適用できる。
画像処理装置10のハードウェア構成例を示す図である。 画像処理装置の機能構成例を示す図である。 本発明に係る画像処理装置10の主要機能を示す機能ブロック図である。 画像処理装置のWebサーバとしての機能構成例を示す図である。 画像処理装置のWebページ生成処理を説明するためのシーケンス図である。 XMLデータを示す図の一例である。 日本語用言語リソースファイル15を示す図の一例である。 英語用言語リソースファイル16を示す図の一例である。 Webページ(日本語)を示す図の一例である。 Webページ(英語)を示す図の一例である。 画像を含むWebページを示す図の一例である。
符号の説明
10 画像処理装置
11 Webサーバプログラム
12 Webアプリケーション
13 XSLTプロセッサ
14 XSLファイル
15 日本語用言語リソースファイル
16 英語用言語リソースファイル
17 汎用言語リソースファイル
100 Webクライアント
101 Webブラウザ
301 表示データ部
302 分別取得部
303 専用翻訳部
304 汎用翻訳部
313 専用翻訳辞書
314 汎用翻訳辞書
1101 コントローラ
1102 CPU
1104 メモリユニット
1108 ASIC
1109 PCI
1111 操作部
1112 USB
1113 IEEE1394
1201 エンジン制御ボード
1202 エンジンI/F
1203 OS
1204 API
1211 プリンタアプリ
1212 スキャナアプリ
1213 ファックスアプリ
1215 Webアプリ
1231 スキャナ
1232 プロッタ
1233 FAX

Claims (4)

  1. 表示データに関する文字情報を他言語に翻訳する汎用翻訳手段と、表示データとして予め登録された静的文字情報に特化して他言語に翻訳する専用翻訳手段とを有し、要求された言語形式に応じた表示データを生成する情報処理装置であって、
    第一の言語形式で文字情報を含む前記表示データを生成する表示データ生成手段と、
    前記表示データ生成手段により生成された前記表示データの中から、表示データとして予め登録され前記専用翻訳手段で翻訳可能な前記静的文字情報と、表示データとして予め登録されていない文字情報であって前記専用翻訳手段で翻訳不可能な動的文字情報とを分別して取得する分別取得手段とを有し、
    前記専用翻訳手段は前記静的文字情報を要求された第二の言語形式に翻訳し、前記汎用翻訳手段は前記動的文字情報を要求された第二の言語形式に翻訳し、第二の言語形式に翻訳された前記静的文字情報及び前記動的文字情報による前記表示データを生成すること、
    を特徴とする情報処理装置。
  2. 前記画像データに含まれる画像内から画像文字を文字情報として取得する文字情報抽出手段と、
    前記画像データに基づいて画像データを生成する画像データ生成手段とを有し、
    前記分別取得手段は、前記文字情報抽出手段により抽出された文字情報を前記動的文字情報として分別して取得し、前記専用翻訳手段は、前記動的文字情報とされた文字情報を要求された第二の言語形式に翻訳し、前記画像データ生成手段は、前記第二の言語形式に翻訳された文字情報を、前記文字情報抽出手段により抽出された対応する文字情報に代え、前記画像データに基づいて画像データを生成すること、
    を特徴とする請求項1に記載の情報処理装置。
  3. 表示データに関する文字情報を他言語に翻訳する汎用翻訳手段と、表示データとして予め登録された静的文字情報に特化して他言語に翻訳する専用翻訳手段とを有し、要求された言語形式に応じた表示データを生成する情報処理装置における表示データ翻訳方法であって、
    コンピュータが、
    第一の言語形式で文字情報を含む前記表示データを生成する表示データ生成手順と、
    前記表示データ生成手順により生成された前記表示データの中から、表示データとして予め登録され前記専用翻訳手段で翻訳可能な前記静的文字情報と、表示データとして予め登録されていない文字情報であって前記専用翻訳手段で翻訳不可能な動的文字情報とを分別して取得する分別取得手順と、
    前記専用翻訳手段により前記静的文字情報を要求された第二の言語形式に翻訳する手順と、
    前記汎用翻訳手段により前記動的文字情報を要求された第二の言語形式に翻訳する手順と、
    第二の言語形式に翻訳された前記静的文字情報及び前記動的文字情報による前記表示データを生成する手順と、
    を有することを特徴とする表示データ翻訳方法。
  4. 請求項3に記載の表示データ翻訳方法をコンピュータに実行させるためのプログラム。
JP2008306644A 2008-12-01 2008-12-01 情報処理装置、表示データ翻訳方法、及びプログラム Pending JP2010129057A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008306644A JP2010129057A (ja) 2008-12-01 2008-12-01 情報処理装置、表示データ翻訳方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008306644A JP2010129057A (ja) 2008-12-01 2008-12-01 情報処理装置、表示データ翻訳方法、及びプログラム

Publications (1)

Publication Number Publication Date
JP2010129057A true JP2010129057A (ja) 2010-06-10

Family

ID=42329367

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008306644A Pending JP2010129057A (ja) 2008-12-01 2008-12-01 情報処理装置、表示データ翻訳方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP2010129057A (ja)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012058947A (ja) * 2010-09-08 2012-03-22 Sharp Corp 翻訳装置、翻訳方法、コンピュータプログラムおよび記録媒体
JP2013250703A (ja) * 2012-05-31 2013-12-12 Bs Partners Inc 地域情報伝達システム
JP2015225555A (ja) * 2014-05-28 2015-12-14 富士通株式会社 出力プログラム、出力装置、および出力方法
JP2018041474A (ja) * 2013-02-08 2018-03-15 マシーン・ゾーン・インコーポレイテッドMachine Zone, Inc. マルチユーザ多言語通信のためのシステムおよび方法
US10063725B2 (en) 2015-07-06 2018-08-28 Ricoh Company, Ltd. Information processing apparatus, information processing method, and information processing system
US10346543B2 (en) 2013-02-08 2019-07-09 Mz Ip Holdings, Llc Systems and methods for incentivizing user feedback for translation processing
US10614171B2 (en) 2013-02-08 2020-04-07 Mz Ip Holdings, Llc Systems and methods for multi-user multi-lingual communications
US10650103B2 (en) 2013-02-08 2020-05-12 Mz Ip Holdings, Llc Systems and methods for incentivizing user feedback for translation processing
US10657333B2 (en) 2013-02-08 2020-05-19 Mz Ip Holdings, Llc Systems and methods for multi-user multi-lingual communications
US10699073B2 (en) 2014-10-17 2020-06-30 Mz Ip Holdings, Llc Systems and methods for language detection
US10769387B2 (en) 2017-09-21 2020-09-08 Mz Ip Holdings, Llc System and method for translating chat messages
US10765956B2 (en) 2016-01-07 2020-09-08 Machine Zone Inc. Named entity recognition on chat data

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012058947A (ja) * 2010-09-08 2012-03-22 Sharp Corp 翻訳装置、翻訳方法、コンピュータプログラムおよび記録媒体
JP2013250703A (ja) * 2012-05-31 2013-12-12 Bs Partners Inc 地域情報伝達システム
US10417351B2 (en) 2013-02-08 2019-09-17 Mz Ip Holdings, Llc Systems and methods for multi-user mutli-lingual communications
JP2018041474A (ja) * 2013-02-08 2018-03-15 マシーン・ゾーン・インコーポレイテッドMachine Zone, Inc. マルチユーザ多言語通信のためのシステムおよび方法
US10346543B2 (en) 2013-02-08 2019-07-09 Mz Ip Holdings, Llc Systems and methods for incentivizing user feedback for translation processing
US10614171B2 (en) 2013-02-08 2020-04-07 Mz Ip Holdings, Llc Systems and methods for multi-user multi-lingual communications
US10650103B2 (en) 2013-02-08 2020-05-12 Mz Ip Holdings, Llc Systems and methods for incentivizing user feedback for translation processing
US10657333B2 (en) 2013-02-08 2020-05-19 Mz Ip Holdings, Llc Systems and methods for multi-user multi-lingual communications
US10685190B2 (en) 2013-02-08 2020-06-16 Mz Ip Holdings, Llc Systems and methods for multi-user multi-lingual communications
JP2015225555A (ja) * 2014-05-28 2015-12-14 富士通株式会社 出力プログラム、出力装置、および出力方法
US10699073B2 (en) 2014-10-17 2020-06-30 Mz Ip Holdings, Llc Systems and methods for language detection
US10063725B2 (en) 2015-07-06 2018-08-28 Ricoh Company, Ltd. Information processing apparatus, information processing method, and information processing system
US10765956B2 (en) 2016-01-07 2020-09-08 Machine Zone Inc. Named entity recognition on chat data
US10769387B2 (en) 2017-09-21 2020-09-08 Mz Ip Holdings, Llc System and method for translating chat messages

Similar Documents

Publication Publication Date Title
JP2010129057A (ja) 情報処理装置、表示データ翻訳方法、及びプログラム
US10353999B2 (en) Information processing system, server apparatus, control method, and storage medium
JP5885527B2 (ja) 印刷システム、印刷サーバ、制御方法およびコンピュータプログラム
EP2569703B1 (en) Executing transcription requests on files
JP2009271930A (ja) プリンタ定義ファイルを用いてjdfを生成するための方法、システムおよびプログラム
JP2012088790A (ja) 情報処理装置、その情報処理方法及びプログラム
JP2009038526A (ja) 印刷サーバ装置
JP5261250B2 (ja) ページ記述言語を処理する印刷データ処理装置、方法及びコンピュータ可読媒体
US20100195142A1 (en) Print information conversion apparatus, printing apparatus, printing system, and computer readable medium
KR20210122147A (ko) 문자열을 취득하기 위한 정보 처리 장치
US8194269B2 (en) Image forming method and system using XHTML-print data
US8699076B2 (en) Image forming apparatus, server, image forming system, and storage medium, outputting superimposed text strings in a variable form page
US10817646B2 (en) Information processing system and control method therefor
KR102296939B1 (ko) 다중 모드를 지원하는 pdf 등의 전자문서를 관리하는 장치 및 방법
JP4203287B2 (ja) 情報処理装置、情報処理方法及び情報処理システム
JP5955245B2 (ja) 画像処理装置
JP2009020553A (ja) 電子ファイル管理装置および電子ファイル管理プログラム
JP4903078B2 (ja) 電子装置、Webページ生成方法、及びWebページ生成プログラム
JP2008257354A (ja) 電子装置、Webページ生成方法、及びWebページ生成プログラム
JP5052058B2 (ja) 情報処理装置、情報処理方法及び情報処理プログラム
JP2009037404A (ja) 電子文書管理システム
JP5552893B2 (ja) 情報処理装置
JP2011150644A (ja) 情報処理装置および制御方法およびプログラム
JP6564910B2 (ja) 変換装置、変換方法、及びプログラム
JP2006146490A (ja) 印刷制御装置及び印刷制御プログラム