JP2014089637A - 画像データ中の訳し分けされるべき単語又はフレーズに対応する訳語を決定する方法、並びにそのコンピュータ及びコンピュータ・プログラム - Google Patents

画像データ中の訳し分けされるべき単語又はフレーズに対応する訳語を決定する方法、並びにそのコンピュータ及びコンピュータ・プログラム Download PDF

Info

Publication number
JP2014089637A
JP2014089637A JP2012239982A JP2012239982A JP2014089637A JP 2014089637 A JP2014089637 A JP 2014089637A JP 2012239982 A JP2012239982 A JP 2012239982A JP 2012239982 A JP2012239982 A JP 2012239982A JP 2014089637 A JP2014089637 A JP 2014089637A
Authority
JP
Japan
Prior art keywords
translation
data
gui element
word
computer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2012239982A
Other languages
English (en)
Inventor
佐和 ▲たか▼野
Sawa Takano
Tadayuki Yoshida
忠行 吉田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Priority to JP2012239982A priority Critical patent/JP2014089637A/ja
Priority to US14/045,545 priority patent/US10372827B2/en
Publication of JP2014089637A publication Critical patent/JP2014089637A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/451Execution arrangements for user interfaces
    • G06F9/454Multi-language systems; Localisation; Internationalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • User Interface Of Digital Computer (AREA)
  • Machine Translation (AREA)

Abstract

【課題】本発明は、画像データ又は画像データを含む電子データ、例えばグラフィカル・ユーザ・インタフェース(GUI)画像文書が提供される場合において、当該画像データ中の第1の言語における訳し分けされるべき単語又はフレーズを、第2の言語における対応する訳語に適切に訳し分けすることを目的とする。
【解決手段】本発明は、第1の言語における訳し分けされるべき単語又はフレーズ(すなわち、翻訳対象の語である)を第2の言語における対応する訳語に翻訳する方法、コンピュータ及びコンピュータ・プログラムを提供する。本発明は、上記第1の言語における単語又はフレーズに対応する訳語が複数ある場合において上記対応する複数の訳語候補のうちから上記単語又はフレーズの訳語として相応しい訳語を決定することを可能にする。
【選択図】図3

Description

本発明は、画像データ中の訳し分けされるべき単語又はフレーズに対応する訳語を決定する技法に関する。詳細には、本発明は、複数の訳語候補のうちから上記単語又はフレーズの訳語として相応しい訳語を決定する技法に関する。
1つの語を他の言語に翻訳する場合において、当該1つの語に対応する訳語が複数ある場合には、当該1つの語を文脈又は場面などに従って適切に訳し分けをする必要がある。翻訳者が上記訳し分けをする場合には、当該翻訳者は当該1つの語を含む文を参照して、当該1つの語を含む行の上下10行程度内にある周辺用語を参照して、又は当該1つの語が記載されている場面を参照して、当該1つの語に対する適切な訳語を選択する必要がある。
また、翻訳者が例えばグラフィカル・ユーザ・インタフェース(以下、GUIともいう)を用いたコンピュータ・ソフトウェアの画面又は当該画面を含む文書(以下、GUI画像文書という)を翻訳する場合又は翻訳希望者が上記GUI画像文書の翻訳を外部の翻訳者に依頼する場合において、翻訳者又は翻訳希望者がGUI画像文書内の特定の語を予めリストアップし、当該特定の語に対応する訳語を複数の訳語のうちから決定しておく場合がある。しかし、上記リストアップにおいて、上記特定の語がアルファベット順にソートされている場合がある。上記特定の語がアルファベット順にソートされている場合には、上記特定の語とその周辺用語との関係が失われているために、翻訳者又は翻訳依頼者は上記特定の語についての訳し分けをすることが困難である。
また、翻訳ソフトウェアが相応しい訳語を選択する方法は、例えば主語、目的語及び述語の意味的な情報から判断して訳し分けする方法と、翻訳対象の文章の分野に応じて訳し分けする方法との2つに大別できる。例えば、前者の方法は小説及び手紙文の翻訳において有効であり、後者の方法はマニュアル及び科学技術文の翻訳において有効である。現在の翻訳ソフトウェアの対象は主にマニュアル及び科学技術文であるので、訳文の品質向上のために後者の方法が改善されるように更なる改良が続けられている。しかしながら、翻訳ソフトウェアが上記GUI画像文書中の特定の語を訳す場合には、適切な意味を持つ訳語に訳し分けをすることは現状の方法では依然として困難である。
例えば、図16A及び図16Bは、上記GUI画像文書上で、英語「From/To」を、日本語「開始日時/終了日時」及び「差出人/宛先」のいずれかに訳し分けする必要がある場合を示す。
図16Aは、カレンダ画面(1601)での英語「From/To」の訳し分けを示す。カレンダにおいて、英語「From/To」は、日本語「差出人/宛先」(1603)でなく、日本語「開始日時/終了日時」(1602)と訳し分けされるべきである。
図16Bは、メール画面(1611)での英語「From/To」の訳し分けを示す。メールにおいて、英語「From/To」は、日本語「開始日時/終了日時」(1613)でなく、日本語「差出人/宛先」(1612)と訳し分けされるべきである。
下記特許文献1は、コンピュータを利用して翻訳処理を実行する機械翻訳システムにおいて、入力された原文の語句に対して、複数の訳語候補が存在する場合に、その複数の訳語候補の中から訳語として最も相応しい適訳語を選択する適訳語選択方式を記載する(段落0001)。また、特許文献1は、上記機械翻訳システムには、共起辞書と、複数の訳語候補の中から適訳語を選択する適訳語選択処理を前記共起辞書を利用して実行する適訳語選択部とを装備するとともに、前記共起辞書は、見出し語として設定した目的言語による語句に対して、この見出し語と一緒に出現する語句を共起語として設定し、かつ、見出し語とその共起語とが一緒に訳文上に出現する度合いを示す評価値Kを各共起語毎に記述した構成をなし、かつ、前記適訳語選択部における適訳語選択処理では、前記共起辞書を利用して各訳語候補毎にその訳語候補に対する共起語を調べ、さらに、その共起語自体を訳語候補とする共起関連語が翻訳すべき原文中に存在するか否かを調べ、共起関連語が存在する場合には、適訳語を付与すべき原文中の語句Tjに対する前記共起関連語の原文上での出現位置や出現回数や前記共起辞書に記述されている共起語の評価値Kを考慮して、その訳語候補が適訳語として使用される度合いを示す評価値Viを各訳語候補i毎に計算し、原文中の語句Tjに対する複数の訳語候補の中から、前記評価値Viが最大となる訳語候補iを、その語句Tjの適訳語として選択することを記載する(請求項1)。
下記特許文献2は、自然言語処理を行う機械翻訳装置を記載する(段落0001)。また、特許文献2は、上記機械翻訳装置が、ソース言語の文書中の翻訳対象領域を選別するための情報を記憶する翻訳対象領域選別情報記憶手段と、当該記憶手段に記憶されている情報に基づき翻訳対象領域を決定する翻訳対象領域決定手段とを含んでおり、翻訳対象領域を選別するための手がかりとなる情報に基づいて決定した特定領域のみを翻訳することによって、迅速に翻訳結果を提示することができることを記載する(段落0019、請求項1)。
下記特許文献3は、機械翻訳装置及び機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体に関し、詳しくは、慣用表現を用いて表現された文と、そうでない文を適切に翻訳し分ける技術を記載する(段落0001)。
下記特許文献4は、機械翻訳装置に関し、特に、所定の定型的な文に対し、そのような定型文に対応する翻訳文を記録したテーブルを検索する手法により、翻訳を行う機械翻訳装置を記載する(段落0001)。
下記特許文献5は、第一言語から第二言語に翻訳する際、翻訳辞書を用いた通常の翻訳処理と、定型文辞書を用いた定型文処理とを併用して行う機械翻訳装置を記載する(段落0001)。
下記特許文献6は、コンピュータを用いて自然言語の翻訳を行う自然言語翻訳装置を記載する(請求項1)。
下記特許文献7は、互いに異なる言語を話す者同士のコミュニケーションを支援するためのコミュニケーション支援装置、コミュニケーション支援方法及びプログラムを記載する(段落0001)。
下記特許文献8は、自然言語解析装置に関し、より詳細には、機械翻訳など、自然言語の解析処理を行う自然言語解析装置を記載する(段落0001)。
下記特許文献9は、英語などの第1言語の文章を日本語などの第2言語の文章に変換する機械翻訳装置および機械翻訳プログラムを記載する(段落0001)。また、特許文献9は、原文をキー入力またはWebページやスキャナで取り込んで得た文字列を機械翻訳する際に単語が未知語や非文として検出されることを低減し、翻訳精度を向上すると共に作業効率を向上することのできる機械翻訳装置および機械翻訳プログラムを提供することを記載する(段落0015)。
下記特許文献10は、所定のキーワードの入力を受け付けると、キーワードに対応するコンテンツを出力する情報処理装置および方法に関し、特に、電子辞書、あるいは、例文とその訳文とを表示する翻訳装置などの情報処理装置および当該情報処理装置を用いた情報処理方法を記載する(段落0015)。
下記特許文献11は、機械翻訳装置による翻訳結果の後処理を支援する機械翻訳支援装置及び方法を記載する(段落0001)。
下記特許文献12は、自然言語の認識処理に関し、特に、自然言語の文章の意味内容に対応して処理を実行する自然言語処理装置とその自然言語処理方法、及び自然言語処理プログラムを記載する(段落0001)。
特開平05−094472号公報 特開平09−179865号公報 特開平11−272669号公報 特開2002−091966号公報 特開平06−035955号公報 特開平11−232275号公報 特開2005−025380号公報 特開平07−105214号公報 特開2007−052700号公報 特開2010−033160号公報 特開平10−049534号公報 特開2005−316830号公報
本発明は、画像データ又は画像データを含む電子データ、例えば上記GUI画像文書が提供される場合において、当該画像データ中の第1の言語における訳し分けされるべき単語又はフレーズを、第2の言語における対応する訳語に自動的に適切に訳し分けすることを目的とする。
また、本発明は、画像データ中の翻訳対象である単語又はフレーズがリスト・アップされてアルファベット順にソートされている場合においても、当該画像データ中の第1の言語における訳し分けされるべき単語又はフレーズを、第2の言語における対応する訳語に自動的に適切に訳し分けすることを目的とする。
本発明は、画像データ中の第1の言語における訳し分けされるべき単語又はフレーズ(すなわち、翻訳対象の単語又はフレーズである)を第2の言語における対応する訳語に翻訳する技法を提供する。当該技法は、上記第1の言語における単語又はフレーズに対応する訳語が複数ある場合において上記対応する複数の訳語(以下、訳語候補ともいう)のうちから上記第1の言語における単語又はフレーズの訳語として相応しい訳語(適切な訳語ともいえる)を決定することを可能にする。当該技法は、相応しい訳語を決定する方法、コンピュータ、コンピュータ・プログラム及びコンピュータ・プログラム製品を包含しうる。
本発明の上記方法は、
上記画像データ中又は上記画像データを含む上記電子データ中の少なくとも1以上の閉領域が特定されることに応じて、当該特定された閉領域それぞれが、事前定義された複数のGUI要素グループのうちのいずれのGUI要素グループに該当するかを、第1のデータを使用して決定するステップであって、上記第1のデータは、画像データ中の少なくとも1つのGUI要素の構造の条件式と、当該条件式に関連付けられた少なくとも1つのGUI要素グループに関連付けられたテキスト・データとを一組のデータとして含む、上記決定するステップと、
上記特定された閉領域のうちの1つ又は当該1つの閉領域に関連付けられたファイルからテキスト・データを抽出するステップと、
上記第1の言語における単語又はフレーズを上記第2の言語における対応する訳語に翻訳するために用いられる第2のデータ中にリストされている訳し分けされるべき第1の言語の単語又はフレーズが上記抽出されたテキスト・データ中に存在することに応じて、当該存在する単語又はフレーズの訳語を上記第2のデータ中の複数の訳語候補のうちから選択するステップと
を含む。
本発明の上記コンピュータは、
画像データ又は画像データを含む電子データを受け取る受信手段と、
上記画像データ中又は上記画像データを含む上記電子データ中の少なくとも1以上の閉領域が特定されることに応じて、当該特定された閉領域それぞれが、事前定義された複数のGUI要素グループのうちのいずれのGUI要素グループに該当するかを、第1のデータを使用して決定するGUI要素グループ決定手段であって、上記第1のデータは、画像データ中の少なくとも1つのGUI要素の構造の条件式と、当該条件式に関連付けられた少なくとも1つのGUI要素グループに関連付けられたテキスト・データとを一組のデータとして含む、上記GUI要素グループ決定手段と、
上記特定された閉領域のうちの1つ又は当該1つの閉領域に関連付けられたファイルからテキスト・データを抽出するテキスト・データ抽出手段と、
上記第1の言語における単語又はフレーズを上記第2の言語における対応する訳語に翻訳するために用いられる第2のデータ中にリストされている訳し分けされるべき第1の言語の単語又はフレーズが上記抽出されたテキスト・データ中に存在することに応じて、当該存在する単語又はフレーズの訳語を上記第2のデータ中の複数の訳語候補のうちから選択する訳語候補選択手段と
を備えている。
また、本発明は、コンピュータに、本発明に従う方法の各ステップを実行させるコンピュータ・プログラム、及びコンピュータ・プログラム製品を提供する。
本発明の機能を実行するためのコンピュータ・プログラムは、フレキシブル・ディスク、MO、CD−ROM、DVD、BD、ハードディスク装置、USBに接続可能なメモリ媒体、ROM、MRAM、RAM等の任意のコンピュータ読み取り可能な記録媒体に格納することができる。当該コンピュータ・プログラムは、記録媒体への格納のために、通信回線で接続する他のデータ処理システムからダウンロードしたり、又は他の記録媒体から複製したりすることができる。また、当該コンピュータ・プログラムは、圧縮し、又は複数に分割して、単一又は複数の記録媒体に格納することもできる。また、様々な形態で、本発明を実施するコンピュータ・プログラム製品を提供することも勿論可能であることにも留意されたい。コンピュータ・プログラム製品は、例えば、上記コンピュータ・プログラムを記録した記憶媒体、又は、上記コンピュータ・プログラムを伝送する伝送媒体を包含しうる。
本発明の上記概要は、本発明の必要な特徴の全てを列挙したものではなく、これらの構成要素のコンビネーション又はサブコンビネーションもまた、本発明となりうることに留意すべきである。
本発明の実施態様において使用されるコンピュータの各ハードウェア構成要素を、複数のマシンと組み合わせ、それらに機能を配分し実施する等の種々の変更は当業者によって容易に想定され得ることは勿論である。それらの変更は、当然に本発明の思想に包含される概念である。ただし、これらの構成要素は例示であり、そのすべての構成要素が本発明の必須構成要素となるわけではない。
また、本発明は、ハードウェア、ソフトウェア、又は、ハードウェア及びソフトウェアの組み合わせとして実現可能である。ハードウェアとソフトウェアとの組み合わせによる実行において、上記コンピュータ・プログラムのインストールされた装置における実行が典型的な例として挙げられる。かかる場合、当該コンピュータ・プログラムが当該装置のメモリにロードされて実行されることにより、当該コンピュータ・プログラムは、当該装置を制御し、本発明にかかる処理を実行させる。当該コンピュータ・プログラムは、任意の言語、コード、又は、表記によって表現可能な命令群から構成されうる。そのような命令群は、当該装置が特定の機能を直接的に、又は、1.他の言語、コード若しくは表記への変換及び、2.他の媒体への複製、のいずれか一方若しくは双方が行われた後に、実行することを可能にするものである。
本発明の実施態様に従うと、画像データ中で閉領域を特定することによって、画像データ中の翻訳対象の語に対応する相応しい訳語を選択する上での周辺用語とすべき領域を任意に局所化することが可能になる。
また、本発明の実施態様に従うと、GUI要素グループを決定するために用いられる第1のデータ、及び、第1の言語における単語又はフレーズを第2の言語における対応する訳語に翻訳するために用いられる第2のデータをそれぞれ適切に作成することによって、人間が介在すること無しに、画像データ中の翻訳対象の語に対応する相応しい訳語を決定することが可能になる。
また、本発明の実施態様に従うと、GUI要素グループを決定するために用いられる上記第1のデータを用いることによって、事前定義されたGUI要素グループを考慮した相応しい訳語を決定することが可能になる。
また、本発明の実施態様に従うと、事前定義されたGUI要素グループを決定することによって、翻訳対象の語がある周辺のGUI要素によって相応しい訳語を決定することが可能になる。
また、本発明の実施態様に従うと、訳し分けがされるべき語又はフレーズのみを第2のデータ中において翻訳対象の語として適切に定義することによって、当該第2のデータ中にリストされている翻訳対象の語のみを対象として、画像データ中の単語又はフレーズの相応しい訳語を、人間を介さずに自動的に決定することが可能になる。
また、本発明の実施態様に従うと、単語だけでなく、第2のデータ中に翻訳対象の語として定義された数単語からなるフレーズについても、当該第2のデータを使用して相応しい訳語を選択することが可能になる。
また、本発明の実施態様に従うと、画像データ中の翻訳対象である単語又はフレーズがリストアップされてアルファベット順にソートされている場合においても、画像データ中の翻訳対象の語に対応する相応しい訳語を決定することが可能になる。
本発明の実施態様に従うコンピュータを実現するためのハードウェア構成の一例を示した図である。 本発明の実施態様において使用されうる、翻訳対象であるウェブ画面データの例である。 本発明の実施態様に従い、図2Aに記載のウェブ画面データ中の語を翻訳した結果の例である。 本発明の実施態様に従い、第1の言語における単語又はフレーズを第2の言語における相応しい訳語に翻訳するためのフローチャートを示す。 図3に示すフローチャートのステップのうち、画像データ中の閉領域及び当該閉領域中のGUI要素を特定する処理のためのフローチャートを示す。 図3に示すフローチャートのステップのうち、第1のデータを使用して、各閉領域のGUI要素グループを決定する処理のためのフローチャートを示す。 図3に示すフローチャートのステップのうち、第2のデータ中の複数の訳語候補のうちから、画像データ中の1つの単語又はフレーズの訳語として相応しい訳語を選択する処理のためのフローチャートを示す。 図5Aに示すフローチャートのサブフローチャートを示す。 図5Aに示すフローチャートのサブフローチャートを示す。 本発明の実施態様に従い、図2Aに示すウェブ画面データ上をスキャンすることを示す。 本発明の実施態様に従い、図2Aに示すウェブ画面データ上で閉領域が特定されていることを示す。 本発明の実施態様に従い、図2Aに示すウェブ画面データ上で閉領域、及び当該閉領域中のGUI要素を特定する態様を示す。 本発明の実施態様に従い、図2Aに示すウェブ画面データ上で閉領域の特定において、閉領域リスト中の終点座標が最大であるGUI要素とスキャンによって検出されたGUI要素のうちの始点座標が最小であるGUI要素との距離を求める態様を示す。 本発明の実施態様において使用されうる、第1のデータの一実施態様であるGUI要素グループ・データベースを示す。 図4Bのステップ423〜427に示す処理をプログラム的に模式化したものであり、本発明の実施態様において使用されうる、第1のデータ中のGUI要素の構造の条件式の例を示す。 本発明の実施態様において使用されうる、第1のデータ中のGUI要素の構造の条件式の例を示す。 本発明の実施態様に従い、図2Aに示すウェブ画面データ上の各閉領域のGUI要素グループが決定された例を示す。 本発明の実施態様に従い、図2Aに示すウェブ画面データ上の各閉領域からテキスト・データを抽出した例を示す。 本発明の実施態様において使用されうる、第2のデータの一実施態様である訳し分けデータベースを示す。 本発明の実施態様において使用されうる、第2のデータの一実施態様である訳し分けデータベースを示す。 本発明の実施態様に従い、図10Aに示す訳し分けデータベースを使用して相応しい訳語を選択するために、抽出されたテキスト・データと2つの訳語候補それぞれに関連付けられた周辺用語とをそれぞれ突き合わせて、訳語候補毎に合致した数をそれぞれ求める例を示す。 本発明の実施態様に従い、図10Aに示す訳し分けデータベースを使用して相応しい訳語を選択するために、抽出されたテキスト・データ及びGUI要素グループに関連付けられたテキスト・データと2つの訳語候補それぞれに関連付けられた周辺用語とをそれぞれ突き合わせて、訳語候補毎に合致した数をそれぞれ求める例を示す。 本発明の実施態様に従い、図10Aに示す訳し分けデータベースを使用して相応しい訳語を選択するために、抽出されたテキスト・データと2つの訳語候補それぞれに関連付けられた周辺用語とをそれぞれ突き合わせて、訳語候補毎に合致した数をそれぞれ求める例を示す。 本発明の実施態様に従い、図10Aに示す訳し分けデータベースを使用して相応しい訳語を選択するために、抽出されたテキスト・データ及びGUI要素グループに関連付けられたテキスト・データと2つの訳語候補それぞれに関連付けられた周辺用語とをそれぞれ突き合わせて、訳語候補毎に合致した数をそれぞれ求める例を示す。 本発明の実施態様に従い、図10Bに示す訳し分けデータベースを使用して相応しい訳語を選択するために、抽出されたテキスト・データと2つの訳語候補それぞれに関連付けられた周辺用語とをそれぞれ突き合わせて、訳語候補毎に合致した数から求められる値(重みを加味した値)をそれぞれ求める例を示す。 本発明の実施態様に従い、図10Bに示す訳し分けデータベースを使用して相応しい訳語を選択するために、抽出されたテキスト・データ及びGUI要素グループに関連付けられたテキスト・データと2つの訳語候補それぞれに関連付けられた周辺用語とをそれぞれ突き合わせて、訳語候補毎に合致した数から求められる値(重みを加味した値)をそれぞれ求める例を示す。 本発明の実施態様に従い、図10Bに示す訳し分けデータベースを使用して相応しい訳語を選択するために、抽出されたテキスト・データと2つの訳語候補それぞれに関連付けられた周辺用語とをそれぞれ突き合わせて、訳語候補毎に合致した数から求められる値(重みを加味した値)をそれぞれ求める例を示す。 本発明の実施態様に従い、図10Bに示す訳し分けデータベースを使用して相応しい訳語を選択するために、抽出されたテキスト・データ及びGUI要素グループに関連付けられたテキスト・データと2つの訳語候補それぞれに関連付けられた周辺用語とをそれぞれ突き合わせて、訳語候補毎に合致した数から求められる値(重みを加味した値)をそれぞれ求める例を示す。 本発明の実施態様に従い、図2Aに示すウェブ画面データ上の各閉領域から抽出されたテキスト・データ中の語を翻訳した結果の例である。 本発明の実施態様において使用されうる訳し分けDB(1401)の例を示し、本発明の実施態様に従い訳し分けがされうる第1の言語が英語である場合の翻訳対象の単語の例を示す。 図1に従うハードウェア構成を好ましくは備えており、本発明の実施態様に従うコンピュータの機能ブロック図の一例を示した図である。 カレンダにおいて、英語「From/To」は、「差出人/宛先」でなく、「開始日時/終了日時」と訳し分けされるべきであることを示す。 メールにおいて、英語「From/To」は、「開始日時/終了日時」でなく、「差出人/宛先」と訳し分けされるべきであることを示す。
本発明の実施形態を、以下に図面に従って説明する。以下の図を通して、特に断らない限り、同一の符号は同一の対象を指す。本発明の実施形態は、本発明の好適な態様を説明するためのものであり、本発明の範囲をここで示すものに限定する意図はないことを理解されたい。
図1は、本発明の実施態様に従うコンピュータを実現するためのハードウェア構成の一例を示した図である。
コンピュータ(101)は、CPU(102)とメイン・メモリ(103)とを備えており、これらはバス(104)に接続されている。CPU(102)は好ましくは、32ビット又は64ビットのアーキテクチャに基づくものであり、例えば、インテル社のCore i(商標)シリーズ、Core 2(商標)シリーズ、Atom(商標)シリーズ、Xeon(商標)シリーズ、Pentium(登録商標)シリーズ若しくはCeleron(登録商標)シリーズ、AMD社のAシリーズ、Phenom(商標)シリーズ、Athlon(商標)シリーズ、Turion(商標)シリーズ若しくはSempron(商標)、アップル社(登録商標)のAシリーズ、又は、アンドロイド端末用のCPUが使用されうる。バス(104)には、ディスプレイ・コントローラ(105)を介して、ディスプレイ(106)、例えば液晶ディスプレイ(LCD)、タッチ液晶ディスプレイ又はマルチタッチ液晶ディスプレイが接続されうる。ディスプレイ(106)は、コンピュータ上で動作中のソフトウェア、例えば本発明に従うコンピュータ・プログラムが稼働することによって表示される情報を、適当なグラフィック・インタフェースで表示するために使用されうる。バス(104)にはまた、SATA又はIDEコントローラ(107)を介して、ディスク(108)、例えばハードディスク又はシリコン・ディスクと、ドライブ(109)、例えばCD、DVD又はBDドライブとが接続されうる。バス(104)にはさらに、キーボード・マウス・コントローラ(110)又はUSBバス(図示せず)を介して、キーボード(111)及びマウス(112)が接続されうる。
ディスク(108)には、オペレーティング・システム、例えばWindows(登録商標)、UNIX(登録商標)、MacOS(登録商標)及びスマートフォン用OS(商標)、J2EEなどのJava(登録商標)処理環境、Java(登録商標)アプリケーション、Java(登録商標)仮想マシン(VM)、Java(登録商標)実行時(JIT)コンパイラを提供するプログラム、その他のプログラム、及びデータが、メイン・メモリ(103)にロード可能なように記憶されうる。
ドライブ(109)は、必要に応じて、CD−ROM、DVD−ROM又はBDからプログラムをディスク(108)にインストールするために使用されうる。
通信インタフェース(114)は、例えばイーサネット(登録商標)・プロトコルに従う。通信インタフェース(114)は、通信コントローラ(113)を介してバス(104)に接続され、コンピュータ(101)を通信回線(115)に物理的に接続する役割を担い、コンピュータ(101)のオペレーティング・システムの通信機能のTCP/IP通信プロトコルに対して、ネットワーク・インタフェース層を提供する。なお、通信回線は、有線LAN環境、又は例えばIEEE802.11a/b/g/nなどの無線LAN接続規格に基づく無線LAN環境でありうる。
コンピュータは、パーソナル・コンピュータ、例えばデスクトップ・コンピュータ、ノートブック・コンピュータ、若しくはクラウド利用端末;タブレット端末、パーソナル・ディジタル・アシスタントでありうるが、これらに制限されない。
図2Aは、本発明の実施態様において使用されうる、翻訳対象であるウェブ画面データの例である。
図2Aに示すウェブ画面データは、それ全体が画像データであるか、又は、その一部が画像データでありうる。図2Aに示すウェブ画面データそれ全体が画像データである場合には、当該ウェブ画面データは、例えばJPEG,GIF,PNG若しくはBMPの形式で、又はPDFの形式で保存されたデータでありうる。図2Aに示すウェブ画面データの一部が画像データである場合には、当該ウェブ画面はHTML形式で保存されたデータであり、当該HTMLデータが画像データを例えば、<img>タグを使用して表示可能なデータでありうる。図2Aに示すウェブ画面データの一部が画像データである場合には、画像データはGUI要素でありうる。GUI要素は、例えばラベル、入力領域、アイコン若しくはメニュー・バー、又は特定の形状(例えば矩形、多角形又は円形を持つ領域)でありうる。ラベルは、入力領域の前後にあるような入力領域を説明するGUI要素である。ラベルは例えば、氏名の入力欄にある「氏名:」又は検索の入力欄にある「キーワード:」でありうる。入力領域は、文字を入力することが可能な領域である。アイコンは、プログラムの内容を図又は絵にして分かりやすくしているものである。ユーザがアイコン上にカーソルを移動させて、ポインティング・デバイス(例えばマウス又はトラックボール)のボタンをクリックすることで又は当該アイコンが表示されている表示装置の画面上を指でタッチすることで、当該アイコンに関連付けられた機能を呼び出したり又はプログラムを開始したりすることができる。
図2Aに示すウェブ画面データは、タイトル・バー(202)、URL記入のための入力領域(203)、メニュー・バー(204)、アイコン(205)、文字フォント又はサイズ設定のための入力領域、文字修飾又は書式設定のためのアイコン(206)、頁レイアウトのための設定領域(207)、文字等の記入領域(208)、及び、頁移動のためのアイコン(209)を有する。
また、図2Aに示すウェブ画面データは、アイコン(211)のバルーン・ヘルプ(文字列「Top」)及びアイコン(212)のバルーン・ヘルプ(文字列「Bottom」)を表示している。バルーン・ヘルプの表示は例えば、アイコン上にポインティング・デバイスを重ねることによって表示されうる。
図2Aに示すウェブ画面データの例では、アイコン(211)のバルーン・ヘルプ(文字列「Top」)と頁移動のためのアイコン(209)中の文字列「Top」(221)において、並びに、アイコン(212)のバルーン・ヘルプ(文字列「Bottom」)と頁移動のためのアイコン(209)中の文字列「Bottom」(224)において、訳し分けが必要である。すなわち、「Top」は、「上詰め」又は「最初の頁」と訳し分けされる必要があり、及び、「Bottom」は、「下詰め」又は「最後の頁」と訳し分けされる必要がある。
図2Bは、本発明の実施態様に従い、図2Aに記載のウェブ画面データ中の語を翻訳した結果の例である。
本発明の実施態様に従うと、アイコン(211)のバルーン・ヘルプ(文字列「Top」)は「上詰め」と訳し分けされ、頁移動のためのアイコン(209)中の文字列「Top」(221)は「最初の頁」(231)と訳し分けされている。
また、本発明の実施態様に従うと、アイコン(212)のバルーン・ヘルプ(文字列「Bottom」)は「下詰め」と訳し分けされ、頁移動のためのアイコン(209)中の文字列「Bottom」(224)は「最後の頁」(234)と訳し分けされている。
上記に述べた通り、本発明の実施態様に従うと、図2Aに記載のウェブ画面データ中の語が相応しい訳語に訳し分けされる。
以下に示す図3〜図5Cは、本発明の実施態様に従い上記訳し分けをするためのフローチャートの例を示す。
図3は、本発明の実施態様に従い、第1の言語における単語又はフレーズを第2の言語における相応しい訳語に翻訳するためのフローチャートを示す。
ステップ301において、コンピュータ(101)は、第1の言語における単語又はフレーズを第2の言語における対応する訳語に翻訳する処理を開始する。図2A及び図2Bに示した例では、第1の言語は英語であり且つ第2の言語は日本語であるが、第1の言語及び第2の言語は特定の言語に限定されず、第1の言語の語又はフレーズに対して第2の言語が対応する複数の訳語を有していれば特に限定されない。また、第1の言語が或る言語での第1の方言であり、第2の言語が上記と同じ或る言語での第2の方言であってもよい。
ステップ302において、コンピュータ(101)は、画像データ又は、画像データを含む電子データをそのメモリ(103)又はディスク(108)内に受け取る。画像データは、コンピュータ(101)に接続された画像読み取り装置(例えば、スキャナ)が、紙上に印刷されたデータを画像データに電子化することによって、電子データを画像データ化するアプリケーション・ソフトウェア(例えば、Adobe社のAdobe Acrobat(登録商標)シリーズ、又はその互換機能を有するアプリケーション・ソフトウェア)で画像データ化することによって、又は、表示装置上の画面又はアクティブ・ウィンドウを画像データ化することによって入手することが可能である。画像データは、例えばJPEG,GIF,PNG若しくはBMPの形式で、又はPDFの形式で保存されたデータでありうる。また、画像データを含む電子データは、例えばワードプロセッサ・ソフトウェア、表計算ソフトウェア又はプレゼンテーション・ソフトウェアの文書中に挿入された又は埋め込まれた画像データを含む電子データ(例えば、電子ファイル)として入手されうる。また、コンピュータ(101)は、画像データ又は画像データを含む電子データを、当該コンピュータ(101)に接続可能な記憶デバイスを介して、又は、通信回線(115)(例えば、インターネット又はイントラネット)を介して他のコンピュータ又はネットワーク(115)上の記憶装置から入手しうる。
ステップ303において、コンピュータ(101)は、ステップ302で受け取った画像データ中の又は画像データを含む電子データ中の少なくとも1以上の閉領域と、当該閉領域中の少なくとも1以上のGUI要素とを、上記画像データを又は上記画像データを含む電子データをスキャンすることによって特定しうる。代替的には、ステップ302で受け取った画像データ中の又は画像データを含む電子データ中の少なくとも1以上の閉領域の特定は、ユーザが表示装置の画面上で、例えばポインティング・デバイスで又はユーザの指で閉領域を作成するように軌跡を描くことによって又はテンプレートとなる閉領域の形状を例えばポインティング・デバイスで又はユーザの指で拡大若しくは縮小することによって行われてもよい。そして、ユーザにより少なくとも1以上の閉領域が特定された後に、コンピュータ(101)は、当該特定された閉領域中のGUI要素をさらに特定しうる。閉領域は例えば、矩形領域、円領域、楕円領域、多角形領域(例えば、星形)を含みうる。ステップ303の詳細な処理内容を、図4Aに記載のフローチャートに従って下記において別途説明する。また、当該画像データを又は画像データを含む電子データをスキャンする例を、図6Aの記載に従って下記において別途説明する。また、閉領域が特定された画像データの例を、図6Bの記載に従って下記において別途説明する。また、閉領域中のGUI要素を特定する具体例を、図7Aの記載に従って下記において別途説明する。また、画像データ中又は画像データを含む電子データ中の閉領域を特定する具体例を、図7Bの記載に従って下記において別途説明する。
ステップ304において、コンピュータ(101)は、ステップ303において閉領域及びGUI要素が特定されることに応じて、各閉領域のGUI要素グループ(「画面領域カテゴリ」ともいう)を決定する。各閉領域のGUI要素グループを決定する際に、コンピュータ(101)は、GUI要素グループを決定するために用いられる第1のデータ(例えば、図8Aに記載の「GUI要素グループDB)を使用する。当該第1のデータは、画像データ中の少なくとも1つのGUI要素の構造の条件式と、当該条件式に関連付けられた少なくとも1つのGUI要素グループに関連付けられたテキスト・データとを一組のデータとして含む。ステップ304の詳細な処理内容を、図4Bに記載のフローチャートに従って下記において別途説明する。また、第1のデータの詳細なデータ内容を、図8A〜図8Cの記載の第1のデータの具体例に従って下記において別途説明する。
ステップ305において、コンピュータ(101)は、ステップ303において特定された閉領域毎に、テキスト・データを抽出する。当該テキスト・データの抽出は例えば、画像データの場合には、当該画像データ中のテキストを光学式文字読取手段(例えば、OCRソフトウェア)によって処理することによってテキスト・データとして抽出しうる。別の実施態様として、画像データ中においてGUI要素上に例えば吹き出しで表示されたテキストがある場合(例えば、アイコンに関連付けられたバルーン・ヘルプ(テキストである)が表示されている場合)には、コンピュータ(101)は、当該テキストを光学式文字読取手段(例えば、OCRソフトウェア)によって処理することによってテキスト・データとして抽出しうる。また、画像データを含む電子データの場合には、コンピュータ(101)は、当該電子データに埋め込まれたテキスト・データを当該電子データ内から読み取ることによってテキスト・データを抽出しうる。例えば、コンピュータ(101)は、GUI要素に関連付けられた電子データがある場合には、当該電子データから当該GUI要素に関連付けられたテキスト・データを抽出しうる。なお、コンピュータ(101)は、ステップ305をステップ304よりも前に又はステップ304と同時に実行しうる。ステップ305において抽出されたテキスト・データの例を、図9に記載の具体例に従って下記において別途説明する。
ステップ306において、コンピュータ(101)は、第1の言語における単語又はフレーズを第2の言語における対応する訳語に翻訳するために用いられる第2のデータ(例えば、図10Aに記載の「訳し分けデータベース」(以下「訳し分けDB」ともいう)である)中にある第1の言語の単語又はフレーズ(以下、「翻訳対象の語」ともいう)が、ステップ305で抽出されたテキスト・データ中に存在するかどうかを判定する。コンピュータ(101)は、上記第2のデータ中の翻訳対象の語がステップ305で抽出されたテキスト・データ中に存在することに応じて、当該テキスト・データ中に存在する語の訳語を上記第2のデータ中の上記翻訳対象の語に関連付けられた複数の訳語候補のうちから選択する。ステップ306の詳細な処理内容を、図5A〜図5Cに記載のフローチャートに従って下記において別途説明する。また、第2のデータの詳細なデータ内容を、図10A〜図10Bの具体例に従って下記において別途説明する。また、訳し分けデータベース中にある翻訳対象の語がステップ305で抽出されたテキスト・データ中に存在するかどうかの判定の具体例を、図11A〜図11D及び図12A〜図12Dに記載の具体例に従って下記において別途説明する。
ステップ307において、コンピュータ(101)は、ステップ306で選択された訳語を決定訳語として、例えば表示装置上に表示しうる。決定訳語を表示装置上に表示する例を、図13に記載の具体例に従って下記において別途説明する。
ステップ308において、コンピュータ(101)は、ステップ307に記載の訳語決定が終了することに応じて、第1の言語における単語又はフレーズを第2の言語における対応する訳語に翻訳する処理を終了する。
図4Aは、図3に示すフローチャートのステップのうち、画像データ中の閉領域及び当該閉領域中のGUI要素を特定する処理のためのフローチャートを示す。
ステップ401において、コンピュータ(101)は、画像データ中の閉領域及び当該閉領域中のGUI要素を特定する処理を開始する。
ステップ402において、コンピュータ(101)は、画像データ又は画像データを含む電子データのスキャンを開始する前に、現在の背景色のデフォルトが黒であると設定する。デフォルトを黒と設定する理由は、コンピュータ(101)が黒以外の背景色を画像データ中又は画像データを含む電子データ中にスキャンにおいて検出した場合に、黒以外の背景色を有する領域を認識するようにするためである。また、コンピュータ(101)は、画像データ又は画像データを含む電子データのスキャンを開始する前に、1つの閉領域中にあるGUI要素をリストするためのGUI要素リストを空に設定する。
ステップ403において、コンピュータ(101)は、画像データ又は画像データを含む電子データのスキャンを開始する。当該スキャンは例えば、下記図6Aに記載の通り、画像データ上又は画像データを含む電子データ上の左端点上を開始点として右側へ移動し、右端点に到達すると次にスキャン済みの真下に移動して同様に、左端点から右端点に向けてスキャンすることを繰り返すことによって行われうる(601,602,603,604,605及び606,・・・の順)。
ステップ404において、コンピュータ(101)は、上記スキャン中に、現在の背景色と異なる色を持つ領域があるかどうかを判定する。コンピュータ(101)は、現在の背景色と異なる色を持つ領域があることに応じて、処理をステップ405に進める。一方、コンピュータ(101)は、現在の背景色と異なる色を持つ領域がないことに応じて、処理をステップ411に進める。現在の背景色と異なる色を持つかどうかはRGB値を元に計算し、RGB値に一定以上の差異があれば、現在の背景色と異なる色を持つとみなす。一定以上の定義は、ユーザが任意に設定しうる。
ステップ405において、コンピュータ(101)は、現在の背景色と異なる色を持つ領域があることに応じて、現在の背景色と異なる色を持つ領域を画像データ又は画像データを含む電子データ上で検出する。一方、ステップ411において、コンピュータ(101)は、現在の背景色と異なる色を持つ領域がないことに応じて、現在のGUI要素リストを出力して、さらにGUI要素リストを空に設定する。現在のGUI要素リストを出力することによって、或る1つの閉領域中のGUI要素がリストされたGUI要素リストができる。また、GUI要素リストを空に設定することによって、画像データ中又は画像データを含む電子データ中の新たな閉領域をステップ404〜411において検索することとなる。
ステップ406において、コンピュータ(101)は、上記検出した領域において、画像データの左上を起点として、各GUI要素の各座標をデータ化する。例えば、データ化された座標は次の通りである:
[形状,(x1,y1),(x2,y2),…]
各GUI要素の各座標をデータ化することによって、上記検出した領域内でのスキャン済みGUI要素のリストを作成する。
ステップ407において、コンピュータ(101)は、GUI要素リストが空かどうかを判定する。コンピュータ(101)は、GUI要素リストが空でないことに応じて、処理をステップ408に進める。一方、コンピュータ(101)は、GUI要素リストが空であることに応じて、処理をステップ409に進める。
ステップ408において、コンピュータ(101)は、GUI要素リストが空でないことに応じて、既存のGUI要素リスト内で終点座標が最大のGUI要素と、上記検出した領域内でのスキャン済みGUI要素のうちの始点座標が最小のGUI要素との距離を計算する。当該距離は、画像データのスキャン方向に対して垂直の方向である(下記図7Bの符号711を参照)。当該距離を求めるのは、上記検出した領域と既存のGUI要素リスト中にあるGUI要素を含む1つの閉領域とを組み合わせて(すなわち結合して)新たな1つの閉領域を形成するか又は形成しないかを決定するためである。一方、ステップ409において、コンピュータ(101)は、GUI要素リストが空であることに応じて、GUI要素リスト中に、上記検出した領域内でのスキャン済みGUI要素を追加する。当該追加によって、上記検出した領域中に存在するGUI要素が追加されるということは、上記検出した領域と既存のGUI要素リスト中にあるGUI要素を含む1つの閉領域とを組み合わせて(すなわち結合して)新たな1つの閉領域を形成することを意味する。コンピュータ(101)は、スキャン済みGUI要素をGUI要素リスト中に追加後に、処理をステップ404に戻す。
ステップ410において、コンピュータ(101)は、ステップ408での距離が一定の範囲内にあるかどうかを判定する。コンピュータ(101)は、上記距離が一定の範囲内にないことに応じて、処理をステップ411に進める。一方、コンピュータ(101)は、上記距離が一定の範囲内にあることに応じて、処理をステップ409に進める。
上記一定の範囲は、例えばピクセル単位で指定することが可能でありうる。例えば、上記距離が50ピクセル未満である場合には、コンピュータ(101)は、上記検出した領域と既存のGUI要素リスト中にあるGUI要素を含む1つの閉領域とを組み合わせて新たな1つの閉領域を形成する。一方、例えば、上記距離が50ピクセル以上である場合には、コンピュータ(101)は、上記検出した領域と既存のGUI要素リスト中にあるGUI要素を含む1つの閉領域とは別の閉領域であるとして、当該別の閉領域を新たな閉領域として特定する。上記一定の範囲は、絶対的な基準を設ける必要はなく、ユーザがどのように1つの閉領域を特定したいか(すなわち、どのように1つの閉領域を局所化したいか)によって適宜変更しうる。すなわち、ユーザが1つの閉領域の範囲をより細かく設定したり、又は逆に大ざっぱに設定したりするかどうかは、ユーザの裁量に依存しうる。このことは、将来的に画像データのピクセル数が増大して、1つの閉領域に必要な領域が増大した場合であっても、当該ピクセル数の増大に応じて、ユーザが上記一定の範囲を拡大することによって、1つの閉領域として組み合わせてもよい領域を適切に指定することが可能であることを意味する。
ステップ411において、コンピュータ(101)は、上記距離が一定の範囲内にないことに応じて、現在のGUI要素リストを出力して、さらにGUI要素リストを空に設定する。GUI要素リストを出力することによって、或る1つの閉領域中のGUI要素がリストされたGUI要素リストができる。また、GUI要素リストを空に設定することによって、画像データ中又は画像データを含む電子データ中の新たな閉領域をステップ404〜411において検索することとなる。
ステップ412において、コンピュータ(101)は、スキャン済みGUI要素があるかどうかを判定する。コンピュータ(101)は、スキャン済みGUI要素があることに応じて、処理をステップ409に進める。一方、コンピュータ(101)は、スキャン済みGUI要素がないことに応じて、処理をステップ413の終了処理に進める。
ステップ409において、コンピュータ(101)は、スキャン済みGUI要素があることに応じて、GUI要素リスト中に、上記検出した領域内でのスキャン済みGUI要素を追加する。コンピュータ(101)は、スキャン済みGUI要素をGUI要素リスト中に追加後に、処理をステップ404に戻す。
ステップ413において、コンピュータ(101)は、画像データ中の閉領域及び当該閉領域中のGUI要素を特定する処理を終了する。
図4Aに示すフローチャートは、スキャンの基になる背景色と異なる色を有する領域がなくなるまで処理を続けるループを有している。
図4Aに示すフローチャートでは、閉領域の特定と、閉領域中のGUI要素の特定とを共に行う処理を示す。しかしながら、閉領域がユーザによって特定される場合には、当該特定された閉領域それぞれ中のGUI要素を特定するように、当業者は図4Aに示すフローチャートを適宜変更しうる。
図4Bは、図3に示すフローチャートのステップのうち、第1のデータを使用して、各閉領域のGUI要素グループを決定する処理のためのフローチャートを示す。
ステップ421において、コンピュータ(101)は、各閉領域のGUI要素グループを決定する処理を開始する。
ステップ422において、コンピュータ(101)は、閉領域中の各GUI要素の座標を、始点座標が最小であるGUI要素を基準として相対座標に変換する。
「相対座標に変換する」について、下記に説明する。例えば、4つのGUI要素C11,C12,C13及びC14があり、各GUI要素の座標列が下記に示す通りに特定されているとする。
C11 = [矩形,(50,70),(300,90)]
C12 = [矩形,(100,100),(140,110)]
C13 = [矩形,(150,100),(190,110)]
C14 = [矩形,(200,100),(260,110)]
4つのGUI要素C11,C12,C13及びC14のうち、始点座標が最小であるGUI要素はC11である。従って、「相対座標に変換する」とは、GUI要素C11を基準点として、GUI要素C12,C13及びC14の座標を相対座標によって表現することを意味する。4つのGUI要素C11,C12,C13及びC14を、GUI要素C11を基準点として相対座標に変換すると下記の通りである。
C11 = [矩形,(0,0),(250,20)]
C12 = [矩形,(50,30),(90,40)]
C13 = [矩形,(100,30),(140,40)]
C14 = [矩形,(150,30),(210,40)]
すなわち、相対座標に変換後の各GUI要素C11,C12,C13及びC14の各座標は、各座標値から(50,70)を減じた座標で置き換えられている。
ステップ423において、コンピュータ(101)は、1つの閉領域のGUI要素グループを判定するために、GUI要素の構造の条件式(以下、単に「条件式」という場合がある)の1つをロードする。GUI要素の構造の条件式は例えば、当該条件式(例えば、図8Cに記載の条件式(841)を参照)を格納した第1のデータ(例えば、図8Aに記載のGUI要素グループDB(801)を参照)から取り出されうる。GUI要素の構造の条件式の例を、図8Cに記載の具体例に従って下記において別途説明する。
ステップ424において、コンピュータ(101)は、ステップ423でロードした条件式と、GUI要素リストとを突き合わせる。
ステップ425において、コンピュータ(101)は、ステップ424での突き合わせの結果、ロードした条件式をGUI要素リスト中のGUI要素が満足するかどうかを判定する。コンピュータ(101)は、GUI要素リスト中のGUI要素がロードした条件式を満足する場合には、処理をステップ426に進める。一方、コンピュータ(101)は、GUI要素リスト中のGUI要素がロードした条件式を満足しない場合には、処理をステップ427に進める。
ステップ426において、コンピュータ(101)は、GUI要素リスト中のGUI要素がロードした条件式を満足することに応じて、当該条件式に対応するGUI要素グループに関連付けられたテキスト・データ(例えば、GUI要素グループ名である)をGUI要素グループDBから取り出して、当該取り出したGUI要素グループ名を例えばメモリ上に出力する。一方、ステップ427において、コンピュータ(101)は、GUI要素リスト中のGUI要素がロードした条件式を満足しないことに応じて、GUI要素の構造の条件式について未判定の条件式があるかどうかを判断する。
ステップ427において、コンピュータ(101)は、未判定の条件式があることに応じて処理をステップ423に戻し、未判定の条件式がなくなるまでステップ423〜427を繰り返す。一方、コンピュータ(101)は、未判定の条件式がないことに応じて、処理をステップ428に進める。
ステップ428において、コンピュータ(101)は、未判定の条件式がないことに応じて、対応するGUI要素グループ名を「@@@@@@」として例えばメモリ上に出力する。GUI要素グループ名「@@@@@@」は、GUI要素グループDB中に、画面カテゴリを判定中の閉領域のGUI要素グループがないこと、すなわちGUI要素グループを決定できないことを意味する。ここで、GUI要素グループ名「@@@@@@」としたのは、周辺用語として登録される可能性が極めて低い文字列として「@@@@@@」を採用することによって、下記において述べる図5のステップ518において、第2のデータ中の周辺用語とGUI要素グループ名とが不用意にマッチングすることを避けるためである。
ステップ429において、コンピュータ(101)は、各閉領域のGUI要素グループを決定する処理を終了する。
図4Bに示すフローチャートにおいて、各GUI要素の座標を、始点座標が最小であるGUI要素を基準として相対座標に変換する理由は、例えば下記図8Aに示すGUI要素の構造の条件式のうちの符号811で示される条件式を満たすかどうかを判断するために、例えば下記図8Cに示す条件2を満たすかどうかの評価を行う場合において、どのような座標列がデータ化されている場合であっても、その座標列がある点からの相対座標になっていれば、当該座標列を評価することが可能になるためである。
図5Aは、図3に示すフローチャートのステップのうち、第2のデータ中の複数の訳語候補のうちから、画像データ中の1つの単語又はフレーズの訳語として相応しい訳語を選択する処理のためのフローチャートを示す。
ステップ501において、コンピュータ(101)は、画像データ中の単語又はフレーズの訳語として相応しい訳語を選択する処理を開始する。
ステップ502において、コンピュータ(101)は、第2のデータ(例えば、図10Aに記載の訳し分けDB(1001)を参照)中にリストされている訳し分けされるべき第1の言語の単語又はフレーズ(すなわち、第2のデータ中にリストされている訳し分けされるべき翻訳対象の語である)のうちから、未処理の翻訳対象の語を1つ選択する。
ステップ503において、コンピュータ(101)は、図3に記載のステップ303において特定された閉領域のうちから、未処理の閉領域を1つ選択する。
ステップ504において、コンピュータ(101)は、ステップ502において選択された翻訳対象の1つの語が、ステップ503において選択された1つの閉領域から抽出されたテキスト・データ中に存在するかどうかを判定する。コンピュータ(101)は、選択された翻訳対象の1つの語が選択された1つの閉領域から抽出されたテキスト・データ中に存在することに応じて、処理をステップ505に進める。一方、選択された翻訳対象の1つの語が選択された1つの閉領域から抽出されたテキスト・データ中に存在しないことに応じて、処理をステップ506に進める。
ステップ505において、コンピュータ(101)は、選択された翻訳対象の1つの語が選択された1つの閉領域から抽出されたテキスト・データ中に存在することに応じて、当該テキスト・データ中に存在する語の訳語を、第2のデータ中の当該テキスト・データ中に存在する語に関連付けられた複数の訳語候補のうちから相応しい訳語を選択する。ステップ505の詳細な処理内容を、図5B〜図5Cに示すサブフローチャートに従って下記において別途説明する。一方、ステップ506において、コンピュータ(101)は、選択された翻訳対象の1つの語が選択された1つの閉領域から抽出されたテキスト・データ中に存在しないことに応じて、未処理の閉領域があるかどうかを判定する。コンピュータ(101)は、未処理の閉領域があることに応じて、処理をステップ503に戻して、未処理の閉領域がなくなるまでステップ503〜504、及び/又はステップ505を繰り返す。コンピュータ(101)は、未処理の閉領域がないことに応じて、処理をステップ507に進める。
ステップ507において、コンピュータ(101)は、未処理の閉領域がないことに応じて、第2のデータ中にリストされている翻訳対象の語のうち、未処理の翻訳対象の語があるかどうかを判定する。コンピュータ(101)は、未処理の翻訳対象の語があることに応じて、処理をステップ502に戻して、未処理の翻訳対象の語がなくなるまで、ステップ503〜ステップ506の処理を繰り返す。コンピュータ(101)は、未処理の翻訳対象の語がないことに応じて、処理をステップ508に進める。
ステップ508において、コンピュータ(101)は、画像データ中の単語又はフレーズの訳語として相応しい訳語を選択する処理を終了する。
本発明の実施態様に従うと、画像データ中の単語又はフレーズの語全てが訳されるわけではない。本発明の実施態様に従うと、第2のデータ中にリストされている翻訳対象の語のみを対象として、画像データ中の単語又はフレーズの訳語の訳し分けをする。このことによって、ユーザは、訳し分けが必要な語又はフレーズのみを第2のデータ中において翻訳対象の語としてリストする(定義する)ことが可能である。
図5Aに示すフローチャートは、ステップ502において未処理の翻訳対象の語を1つ選択した後に、ステップ503において未処理の閉領域を選択する態様を示す。しかしながら、ステップ507に示す第2のデータ中に未処理の翻訳対象の語があるかどうかの処理ループと、ステップ506に示す未処理の閉領域があるかどうかの処理ループとは互いに独立している。従って、コンピュータ(101)は、ステップ502に示す処理とステップ503に示す処理の順序を逆にし、且つ、ステップ506に示す処理とステップ507に示す処理の順序を逆にして、図5Aに示すフローチャートを実行してもよい。
図5B及び図5Cは、図5Aに示すフローチャートのステップ505についてのサブフローチャートを示す。
ステップ511において、コンピュータ(101)は、選択された翻訳対象の1つの語が選択された1つの閉領域から抽出されたテキスト・データ中に存在すること(図5Aのステップ504を参照)に応じて、図5B及び図5Cに示すサブフローチャートの処理を開始する。
ステップ512において、コンピュータ(101)は、ステップ503において選択された閉領域において、ステップ502において選択された翻訳対象の1つの語に関連付けられた値(以下、「作業値」ともいう)(作業バッファ中にある)を初期化する。当該初期化は例えば、作業値をゼロにセットすることである。また、コンピュータ(101)は、当該翻訳対象の1つの語についての決定訳語(作業バッファ中にある)を空文字列にセットする。当該決定訳語は、第2のデータ中の当該翻訳対象の語に関連付けられた複数の訳語候補のうちから選択される1つの訳語である。
ステップ513において、コンピュータ(101)は、ステップ502において選択された翻訳対象の語に関連付けられた複数の訳語候補(第2のデータ中にリストされている)のうちから、1つの訳語候補を選択する。また、コンピュータ(101)は、当該選択された1つの訳語候補に関連付けられた得点(合計候補得点値)(作業バッファ中にある)を初期化する。当該初期化は例えば、合計候補得点値をゼロにセットすることである。合計候補得点値は、図5Cのステップ521及びステップ522にそれぞれ記載の計算式W又は計算式Zに従い求められる。また、コンピュータ(101)は、合計候補得点値を求めるために使用される候補得点値A(下記ステップ516を参照)及び候補得点値B(下記ステップ519を参照)を初期化する。当該初期化は例えば、候補得点値A及び候補得点値Bをいずれもゼロにセットすることである。
ステップ514において、コンピュータ(101)は、ステップ513において選択された1つの訳語候補に対応する複数の周辺用語(第2のデータ中にリストされている)のうちから1つの周辺用語を選択する。
ステップ515において、コンピュータ(101)は、ステップ514において選択された1つの周辺用語が、図3のステップ305において抽出されたテキスト・データ中に存在するかどうかを判定する。コンピュータ(101)は、上記選択された1つの周辺用語が抽出されたテキスト・データ中に存在することに応じて、処理をステップ516に進める。一方、コンピュータ(101)は、上記選択された1つの周辺用語が抽出されたテキスト・データ中に存在しないことに応じて、処理をステップ518に進める。
ステップ517において、コンピュータ(101)は、ステップ513において選択された1つの訳語候補に関連付けられた訳語候補に対応する未処理の周辺用語があるかどうかを判定する。コンピュータ(101)は、未処理の周辺用語があることに応じて、処理をステップ514に戻して、未処理の周辺用語がなくなるまでステップ514〜516及び、任意的にステップ514〜519を繰り返す。一方、コンピュータ(101)は、未処理の周辺用語がないことに応じて、処理をステップ520に進める。
ステップ516において、コンピュータ(101)は、上記選択された1つの周辺用語が抽出されたテキスト・データ中に存在することに応じて、候補得点値Aに1を加算する。候補得点値Aは、周辺用語が上記抽出されたテキスト・データ中に存在する場合の合致数を格納する為の変数(中間値)である。
ステップ518において、コンピュータ(101)は、上記選択された1つの周辺用語が、図3のステップ304において決定されたGUI要素グループに関連付けられたテキスト・データ(例えば、GUI要素グループ名である)中に存在するかどうかを判定する。コンピュータ(101)は、上記選択された1つの周辺用語が決定されたGUI要素グループに関連付けられたテキスト・データ中に存在することに応じて、処理をステップ519に進める。一方、コンピュータ(101)は、上記選択された1つの周辺用語が決定されたGUI要素グループに関連付けられたテキスト・データ中に存在しないことに応じて、処理をステップ519に進めて、ステップ513において選択された1つの訳語候補に関連付けられた訳語候補に対応する未処理の周辺用語がなくなるまでステップ514〜516及び、任意的にステップ514〜519を繰り返す。
ステップ519において、コンピュータ(101)は、上記選択された1つの周辺用語が上記決定されたGUI要素グループに関連付けられたテキスト・データ中に存在することに応じて、候補得点値Bに1を加算する。候補得点値Bは、周辺用語が上記決定されたGUI要素グループに関連付けられたテキスト・データ中に存在する場合の合致数を格納する為の変数(中間値)である。
ステップ518及びステップ519は、任意のステップである。従って、ステップ518及びステップ519を実施しない場合には、コンピュータ(101)は、ステップ515に示す判断処理おいて上記選択された1つの周辺用語が抽出されたテキスト・データ中に存在しないことに応じて、又は、ステップ516の処理が終了することに応じて、処理をステップ517に進めてもよい。ステップ518及びステップ519を実施することで、上記選択された1つの周辺用語が上記決定されたGUI要素グループに関連付けられたテキスト・データ中に存在することを訳語決定の判断として使用できることから、ステップ518及びステップ519を実施しない場合に比べてさらに相応しい訳語決定をすることが可能になりうる。
ステップ520において、コンピュータ(101)は、重みを加味するかどうかを判定する。コンピュータ(101)は、重みを加味しない場合には処理をステップ521に進める。一方、コンピュータ(101)は、重みを加味する場合には処理をステップ522に進める。
ステップ521において、コンピュータ(101)は、重みを加味しない場合には、例えば下記計算式Wを使用して、合計候補得点値を計算しうる:
計算式W
合計候補得点値=候補得点値A+候補得点値B
上記に示した計算式Wは、候補得点値Aと候補得点値Bを加算した場合を示す。代替的には、上記合計候補得点値は、候補得点値Aと候補得点値Bとを乗算して得られる値又は累乗して得られる値であってもよい。当業者は、合計候補得点値が本発明に従う相応しい訳語候補を決定できるように、計算式Wを候補得点値A及び候補得点値Bを使用した任意の式を設定しうる。
上記計算式Wは、より簡単には、候補得点値A(以下、A)及び候補得点値B(以下、B)を用いた2変数関数f(A,B)で(A,B)のみを用いる式として表されうる。例えば、f(A,B)=A+Bであるとすると、(A=4,B=1)である場合には、f(A,B)=5である。
ステップ522において、コンピュータ(101)は、重みを加味する場合には、例えば下記計算式Zを使用して、合計候補得点値を計算しうる:
計算式Z
合計候補得点値=突き合わせられた訳語候補に関連付けられた重み加味情報×候補得点値A+GUI要素グループに関連付けられたテキスト・データに関連付けられた重み加味情報×候補得点値B
GUI要素グループに関連付けられたテキスト・データに関連付けられた重み加味情報は例えば、GUI要素グループ名の重みである。
上記に示した計算式Zは、突き合わせられた訳語候補に関連付けられた重み加味情報を候補得点値Aに乗算して得られる値(以下、値Aともいう)と、GUI要素グループに関連付けられたテキスト・データに関連付けられた重み加味情報を候補得点値に乗算して得られる値(以下、値Bともいう)とを加算した場合を示す。代替的には、上記合計候補得点値は、値Aと値Bとを乗算して得られる値又は累乗して得られる値であってもよい。当業者は、合計候補得点値が本発明に従う相応しい訳語候補を決定できるように、計算式Zを、候補得点値A、及び候補得点値B、並びに、突き合わせられた訳語候補に関連付けられた重み加味情報、及びGUI要素グループに関連付けられたテキスト・データに関連付けられた重み加味情報を使用した任意の式を設定しうる。
上記計算式Zは、より簡単には、候補得点値A(以下、A)、及び候補得点値B(以下、B)、並びに、突き合わせられた訳語候補に関連付けられた重み加味情報(以下、P)、及びGUI要素グループに関連付けられたテキスト・データに関連付けられた重み加味情報(以下、Q)を用いた2変数関数f(A,B)で(A,B,P,Q)を用いる式として表されうる。例えば、P=8,Q=50として、f(A,B)=P×A+Q×Bであるとすると、f(A,B)=8×A+50×Bであり、(A=4,B=1)である場合には、f(A,B)=82である。
重みの加味の詳細を、下記図12A〜図12Dに記載の具体例に従って下記において別途説明する。
上記に述べた通り、図5Bに記載のステップ518及びステップ519は、任意のステップである。従って、ステップ518及びステップ519を実施しない場合には、コンピュータ(101)は、ステップ517の処理が終了することに応じて、ステップ520に処理を直接進めてもよい。その場合には、合計候補得点値を計算する際に、候補得点値Bは0として扱うことになる。
ステップ523において、コンピュータ(101)は、合計候補得点値と作業値とを比較して、合計候補得点値が作業値よりも高いかどうかを判定する。コンピュータ(101)は、合計候補得点値が作業値よりも高いことに応じて、処理をステップ524に進める。一方、コンピュータ(101)は、合計候補得点値が作業値よりも高くないことに応じて、処理をステップ526に進める。
ステップ524において、コンピュータ(101)は、合計候補得点値が作業値よりも高いことに応じて、合計候補得点値で作業値を置き換える。また、コンピュータ(101)は、当該置き換えに使用した合計候補得点値に対応する周辺用語を持つ訳語候補の文字列で決定訳語を置き換える。
ステップ525において、コンピュータ(101)は、第2のデータ中に未処理の訳語候補があるかどうかを判定する。コンピュータ(101)は、未処理の訳語候補があることに応じて、処理をステップ513に戻し、未処理の訳語候補がなくなるまで、ステップ513〜525を繰り返す。一方、コンピュータ(101)は、未処理の訳語候補がないことに応じて、処理をステップ526に進める。
ステップ526において、コンピュータ(101)は、作業バッファ中にある決定訳語を、ステップ504において第2のデータ中の翻訳対象の語が上記抽出されたテキスト・データ中に存在すると判定された語の相応しい訳語として出力する。相応しい訳語の出力の例を、図13に記載の具体例に従って下記において別途説明する。
ステップ527において、コンピュータ(101)は、上記サブフローの処理を終了する。
図5Bに示すフローチャートのステップ512において作業値をゼロにセットした場合には、訳語候補の得点(候補得点値)が0点であった場合には、決定訳語を採用しないようにすることができる。このことは、最悪のケースとして、或る閉領域から抽出されたテキスト・データ中において複数の訳語候補それぞれに対応する周辺用語が全く出現していない場合には、全ての訳語候補の候補得点値が0点になってしまう。そのために、図5Bに示すフローチャートは決定訳語が空文字列のまま終了してしまうことになる。しかしながら、本発明の実施態様では、作業値をゼロにセットすることによって、敢えてそのように終了することを許容しうる。
図6Aは、本発明の実施態様に従い、ウェブ画面データ上をスキャンすることを示す。
図6Aに示すウェブ画面データは図2Aに示すウェブ画面データと同じであり、翻訳対象であるウェブ画面データの例である。
コンピュータ(101)は、任意の方法によって、例えば画像読み取り装置(例えばスキャナ)を使用して、ウェブ画面データをスキャンする(読み取る)ことができる。図6Aでは、画像読み取り装置が、ウェブ画面データの左上を起点から右下の終点に向けて、横方向に順(601,602,603,604,605,606,・・・)に画像データをスキャンしていることを示す。1スキャンでの横方向の読み取り幅は、例えばピクセル単位でユーザが任意に設定しうる。また、代替的には、コンピュータ(101)は、画像データが多くある箇所について小さいピクセル単位で、一方、画像データが少ない箇所については大きいピクセル単位でスキャンできるように調整されてもよい。また、代替的には、画像読み取り装置は例えば、ウェブ画面データを上方向から下方向に向けて横幅全体を一度に、又は左方向から右方向に向けて縦幅全体を一度に画像データを読み取ってもよい。
図6Bは、本発明の実施態様に従い、図2Aに示すウェブ画面データ上で閉領域が特定されていることを示す。
図6Bの左側は、図2Aに示すウェブ画面データと同じである。
図6Bの右側は、上記ウェブ画面上で3つの閉領域、すなわち領域(611)、領域(612)及び領域(613)、が特定されていることを示す。閉領域の特定は例えば、各領域の線分(両端)又は矩形(例えば、(左上,右下)の組み合わせ)の座標列を形状の種類とともにデータ化することによって行われうる。例えば、データ化された座標列は、[矩形,(0,0),(20,20)],[矩形,(25,0),(45,20)],… である。
図7Aは、本発明の実施態様に従い、図2Aに示すウェブ画面データ上で閉領域、及び当該閉領域中のGUI要素を特定する態様を示す。
図7Aに示すウェブ画面データ(201)は図2Aに示すウェブ画面データ(201)と同じであり、翻訳対象であるウェブ画面データの例である。
画像読み取り装置が、ウェブ画面データ(201)をどの方向にスキャンするかは、ユーザが任意に設定しうる。図7Aでは、画像読み取り装置が、ウェブ画面データ(201)の左上を起点として横方向に順に、当該ウェブ画面データ(201)をスキャンしていることを示す。
画像読み取り装置が、Aに示す位置で右方向のスキャンを開始したとする。コンピュータ(101)は、画像読み取り装置がAに示す位置で右方向のスキャンを開始することに応じて、デフォルトに設定された背景色(黒)と異なる背景色(B10)を検出する。そして、コンピュータ(101)は、当該背景色(B10)中にあるGUI要素(C11及びC12〜C18)を認識し、当該GUI要素それぞれの座標をデータ化する(701)。コンピュータ(101)は、閉領域リストが空であるために、当該座標化されたデータを閉領域リストに追加する。従って、閉領域リストLは、L = {C11,C12,・・・,C18} で表される。
画像読み取り装置が、Bに示す位置で右方向のスキャンを開始したとする。コンピュータ(101)は、画像読み取り装置がBに示す位置で右方向のスキャンを開始することに応じて、背景色(B10)と異なる背景色(B20)を検出する。そして、コンピュータ(101)は、当該背景色(B20)中にあるGUI要素(C19〜C36)を認識し、当該GUI要素それぞれの座標をデータ化する(702)。コンピュータ(101)は、閉領域リスト中の終点座標が最大であるGUI要素(C18)と、背景色(B20)の領域で検出したGUI要素(C19〜C36)のうちの始点座標が最小であるGUI要素(C19)との距離(スキャン方向に直交する縦方向の距離)を求める。コンピュータ(101)は、当該距離は一定の範囲内にあるために、背景色(B20)の領域を背景色(B10)の領域と組み合わせる。また、コンピュータ(101)は、背景色(B20)の領域で検出されたGUI要素(C19〜C36)の座標化されたデータを閉領域リストに追加する。従って、閉領域リストLは、L = {C11,C12,・・・,C18,C19,C20,・・・,C36} で表される。
画像読み取り装置が、Cに示す位置で右方向のスキャンを開始したとする。コンピュータ(101)は、画像読み取り装置がCに示す位置で右方向のスキャンを開始することに応じて、背景色(B20)と異なる背景色(B30)を検出する。そして、コンピュータ(101)は、当該背景色(B30)中にあるGUI要素(C37〜C48)を認識し、当該GUI要素それぞれの座標をデータ化する(703)。コンピュータ(101)は、閉領域リスト中の終点座標が最大であるGUI要素(C36)と、背景色(B30)の領域で検出されたGUI要素(C37〜C48)のうちの始点座標が最小であるGUI要素(C37)との距離(スキャン方向に直交する縦方向の距離)を求める。コンピュータ(101)は、当該距離は一定の範囲内にあるために、背景色(B30)の領域を背景色(B10〜B20)の領域と組み合わせる。また、コンピュータ(101)は、背景色(B30)の領域で検出されたGUI要素(C37〜C48)の座標化されたデータを閉領域リストに追加する。従って、閉領域リストLは、L = {C11,C12,・・・,C18,C19,C20,・・・,C36,C37,C38,・・・,C48} で表される。
画像読み取り装置が、Dに示す位置で右方向のスキャンを開始したとする。コンピュータ(101)は、画像読み取り装置がDに示す位置で右方向のスキャンを開始することに応じて、背景色(B30)と異なる背景色(B40)を検出する。そして、コンピュータ(101)は、当該背景色(B40)中にあるGUI要素(C49〜C51)を認識し、当該GUI要素それぞれの座標をデータ化する(704)。コンピュータ(101)は、閉領域リスト中の終点座標が最大であるGUI要素(C48)と、背景色(B40)の領域で検出されたGUI要素(C49〜C51)のうちの始点座標が最小であるGUI要素(C49)との距離(スキャン方向に直交する縦方向の距離)を求める。コンピュータ(101)は、当該距離は一定の範囲内にあるために、背景色(B40)の領域を背景色(B10〜B30)の領域と組み合わせる。また、コンピュータ(101)は、背景色(B40)の領域で検出されたGUI要素(C49〜C51)の座標化されたデータを閉領域リストに追加する。従って、閉領域リストLは、L = {C11,C12,・・・,C18,C19,C20,・・・,C36,C37,C38,・・・,C48,C49,C50,C51} で表される。
画像読み取り装置が、Eに示す位置で右方向のスキャンを開始したとする。コンピュータ(101)は、背景色(B40)と異なる背景色(B50)を検出する。そして、コンピュータ(101)は、当該背景色(B50)中にあるGUI要素(C52)(図示せず)を認識し、当該GUI要素それぞれの座標をデータ化する(704)。コンピュータ(101)は、閉領域リスト中の終点座標が最大であるGUI要素(C51)と、背景色(B50)の領域で検出されたGUI要素(C52)(始点座標が最小である)との距離(縦方向の距離)を求める。コンピュータ(101)は、当該距離は一定の範囲内にないために、背景色(B50)の領域を背景色(B10〜B40)の領域と組み合わせない。従って、コンピュータ(101)は、背景色(B10〜B40)の領域を1つの閉領域であると特定する。また、コンピュータ(101)は、背景色(B50)の領域で検出されたGUI要素(C52)の座標化されたデータを新たな閉領域リストに追加する。従って、閉領域リストLは、L = {C52} で表される。
図7Bは、本発明の実施態様に従い、図2Aに示すウェブ画面データ上での閉領域の特定において、閉領域リスト中の終点座標が最大であるGUI要素とスキャンによって検出されたGUI要素のうちの始点座標が最小であるGUI要素との距離を求める態様を示す。
図7Bは、閉領域リスト中の終点座標が最大であるGUI要素(C18)と、背景色(B20)の領域で検出されたGUI要素(C19〜C36)のうちの始点座標が最小であるGUI要素(C19)との距離(縦方向の距離)を求めることを示す。距離(711)は、スキャン方向(B)に対して直交する軸方向の距離である。
終点座標が最大であるGUI要素(C18)と始点座標が最小であるGUI要素(C19)との距離は一般的には、(20,140)−(260,110)となり、一般的な距離計算に従えば、X座標同士、Y座標同士の差の2乗の和の平方根(ピタゴラスの定理)で求められる。しかしながら、本発明の実施態様においては、ピタゴラスの定義に従って距離を求めるのではなく、上記した通りスキャン方向(B)(X軸)に対して直交する軸方向(Y軸)の距離を求める。従って、上記例では、終点座標が最大であるGUI要素(C18)と始点座標が最小であるGUI要素(C19)との距離は、140−110=30である。
図8Aは、本発明の実施態様において使用されうる、第1のデータの一実施態様であるGUI要素グループDBを示す。
図8Aは、第1のデータの一実施態様を示す。当該第1のデータは、GUI要素グループ(すなわち、画面領域カテゴリ)を決定するために用いられる。図8Aでは、第1のデータは、GUI要素グループDB(801)として表されているが、必ずしもDBの形態でなくともよい。GUI要素グループDB(801)は、GUI要素の数、配列、面積、形状及び種類の少なくとも1つによって特定されている画面構造から、閉領域がどのような画面(例えば、スケジュール画面,E−メール画面,エディタ画面,レポート画面,ツールボックス画面,及び頁移動画面)であるのかをルール化したデータベースである。
GUI要素グループDB(801)は、GUI要素の構造の条件式、及び当該条件式に関連付けられたGUI要素グループに関連付けられたテキスト・データを1組のデータとして含む。また、GUI要素グループDB(801)は、任意的に、GUI要素グループに関連付けられたテキスト・データに関連付けられた重みを含んでいてもよい。GUI要素グループに関連付けられたテキスト・データに関連付けられた重みは、例えば、GUI要素グループ名の重み加味情報である。
GUI要素の構造の条件式は、GUI要素の数、配列、面積、形状及び種類の少なくとも1つによって特定されている画面構造を表すものである。従って、GUI要素の構造の条件式は、画面構造を表す条件式でもありうる。図8Aにおいて、GUI要素の構造の条件式が符号811,812,813及び814に示すように定義されている。図8Aでは、GUI要素の構造の条件式はテキストで特定されているが、テキストで特定する以外に、例えばGUI要素の座標の関係を示す式であってもよい。
GUI要素グループに関連付けられたテキスト・データは、例えばGUI要素グループ名、又は、GUI要素の構造の条件式によって特定されるGUI要素グループの特徴を表現した語である。GUI要素グループ名は、閉領域中にあるGUI要素によって、当該閉領域がどのような画面領域であるかをカテゴライズした名称でもある。従って、GUI要素グループ名は、画面領域カテゴリ名とも称しうる。図8Aにおいて、GUI要素グループ名は、SCHEDULE,EMAIL,EDITOR,REPORT,TOOLBOX,及びMOVE PAGEである。図8Aに示すGUI要素グループ名は一例であり、ユーザは、その他のGUI要素グループ名を適宜設定しうる。1つのGUI要素の構造の条件式は、1つ又は複数のGUI要素グループ名に関連付けられる。図8Aにおいて、符号811,813及び814で示されているGUI要素の構造の条件式は、それぞれ1つのGUI要素グループ名に関連付けられている。また、符号812で示されているGUI要素の構造の条件式は、複数のGUI要素グループ名(EMAIL,EDITOR,REPORT)に関連付けられている。
重み加味情報は、図5Bに示すステップ518において、選択された周辺用語が、決定されたGUI要素グループに関連付けられたテキスト・データ中に存在する場合に、候補得点値に加えるボーナス得点として使用されうる。GUI要素グループ名の重み加味情報をどのように使用するかについては、図12B及び図12Dに記載の具体例を使用して下記に別途説明する。
GUI要素グループDBの作成は例えば、ユーザによって行われうる。GUI要素グループDBの作成において、ユーザは、例えば過去にある画像データを参照して、GUI要素の構造の条件式を決定しうる。GUI要素の構造の条件式は、当該条件式が互いに排他的になるようにユーザが調整して決定しうる。また、ユーザは、GUI要素グループ名として、GUI要素の構造の条件式を表現するのに適切な名称を設定しうる。また、重み加味情報は、ユーザがGUI要素の構造の条件式それぞれを考慮して、適宜設定しうる。
図8Bは、図4Bのステップ423〜427に示す処理をプログラム的に模式化したものであり、本発明の実施態様において使用されうる、第1のデータ中のGUI要素の構造の条件式の例を示す。
GUI要素グループ決定ルール(821)は、図8Aに示すGUI要素の構造の各条件式を判定する処理を示す。符号831,832,833及び834に示すそれぞれの条件命令において、GUI要素グループが決定される。
図8Cは、本発明の実施態様において使用されうる、第1のデータ中のGUI要素の構造の条件式の例を示す。
図8Cは、図8Aに示すGUI要素の構造の条件式のうちの符号811で示される条件式を満たすかどうかを判断するための条件を手続き及び条件に分けて具体的に記述したものである(841)。コンピュータ(101)は、図4Bに記載のフローチャートのステップ425の「条件式を満足するかどうか?」を判定する場合に、当該記述(841)をロードし、上から順に手続き又は条件を評価することによって、上記条件式を満足するかどうかを判断することが可能である。コンピュータ(101)は、当該記述(841)の途中で上記条件を満たさなければその時点で評価を終了して処理をステップ427に進め、一方当該記述(841)の最後までの条件の評価が完了すれば、処理中の領域は上記条件1〜3の全てを満たす。従って、コンピュータ(101)は、処理を図4Bに記載のフローチャートのステップ426に進めることになる。
上記記述(841)は、手続き1、条件1、手続き2、条件2、そして条件3の順に評価される。
・手続き1では、連続した矩形(851,852,853,854,855,856,及び857)を取得する。
・条件1では、7つの矩形(851〜857)の面積がほぼ等しいので、条件1を満たすと評価される。
・手続き2では、1番目の矩形(851)の座標を(sx1,sy1)(sx2,sy2)とし、7番目の矩形(857)の座標を(ex1,ey1)(ex2,ey2)とする。
・条件2では、1番目の矩形(851)のsy1と7番目の矩形(857)のey1がほぼ等しく、且つ、1番目の矩形(851)のsy2と7番目の矩形(857)のey2がほぼ等しいので、条件2を満たすと評価される。
・条件3では、手続き1から条件2までを繰り返し、4回以上成立するかどうか(すなわち、4週分以上である)を評価する。
図8Dは、本発明の実施態様に従い、図2Aに示すウェブ画面データ上の各閉領域のGUI要素グループが決定された例を示す。
図8Dの左側に示すウェブ画面データ(201)は、図6D及び図2Aに示すウェブ画面データ(201)と同じである。
図8Dの右側に示すウェブ画面データ(201)は、上記ウェブ画面上で3つの閉領域、すなわち領域A(611)、領域B(612)及び領域C(613)についての各GUI要素グループが特定されていることを示す。
領域A(611)は、図8Aに示すGUI要素の構造の条件式(811〜814)のうち、「等しい大きさのGUI要素が8つ以上規則的に並んでいる画面」という条件式(813)を満たす。従って、コンピュータ(101)は、領域A(611)のGUI要素グループ名が「TOOLBOX」(861)であると特定する。
領域B(612)は、図8Aに示すGUI要素の構造の条件式(811〜814)のいずれも満たさない。従って、コンピュータ(101)は、図4Bに示すフローチャートのステップ428に従い、領域B(612)のGUI要素グループ名が「@@@@@」(862)であると特定する。GUI要素グループ名「@@@@@」は、領域B(612)が第1のデータ中にリストされているGUI要素の構造の条件式をいずれも満たさなかったことを示す。
領域C(613)は、図8Aに示すGUI要素の構造の条件式(811〜814)のうち、「横長のGUI要素が4つ並んでいる画面」という条件式(814)を満たす。従って、コンピュータ(101)は、領域C(613)のGUI要素グループ名は「MOVE PAGE」(863)であると特定する。
図9は、本発明の実施態様に従い、図2Aに示すウェブ画面データ上の各閉領域からテキストを抽出した例を示す。
テキスト・データ(901)は、領域A(611)から抽出されたものである。テキスト・データ(901)中、「New」,「Open」,「Edit」,「Cut」,「Copy」,「Paste」,「Delete」,「Undo」,及び「Redo」は、各アイコン(205)に関連付けられたテキスト・データから抽出されたものである。
テキスト・データ(902)は、領域B(612)から抽出されたものである。
テキスト・データ(903)は、領域C(613)から抽出されたものである。
図10A及び図10Bはそれぞれ、本発明の実施態様において使用されうる、第2のデータの一実施態様である訳し分けデータベースを示す。
図10A及び図10Bはそれぞれ、第2のデータの一実施態様を示す。当該第2のデータは、第1の言語における訳し分けされるべき単語又はフレーズを第2の言語における対応する訳語に翻訳するために用いられる。図10A及び図10Bでは、第2のデータは、訳し分けDB(1001)として表されているが、必ずしもDBの形態でなくともよい。
訳し分けDB(1001)は、第1の言語における訳し分けされるべき単語又はフレーズと、当該単語又はフレーズに関連付けられた少なくとも2つの訳語候補と、当該少なくとも2つの訳語候補それぞれに関連付けられた少なくとも1つの単語(周辺用語)とを一組のデータとして含む。また、訳し分けDB(1001)は、任意的に、訳語候補それぞれに関連付けられた重み加味情報を含んでいてもよい。
訳し分けDB(1001)中の第1の言語における訳し分けされるべき単語又はフレーズは翻訳対象の語であり、画像データ中又は画像データを含む電子データ中の少なくとも1以上の閉領域のうちの1つ又は当該1つの閉領域に関連付けられたファイルから抽出されたテキスト・データ中の単語又はフレーズを訳し分けするためのものである。図10A及び図10Bでは、翻訳対象の語が英語である場合を示している。
訳し分けDB(1001)において、一つの翻訳対象の語に対して、少なくとも2つの訳語候補が関連付けられている。図10A及び図10Bでは、訳語候補が日本語である場合を示している。図10A及び図10Bは、翻訳対象の英語が「Top」である場合に、当該「Top」に関連付けられた訳語候補が「最初の頁」及び「上詰め」であることを示し、また、翻訳対象の英語が「Bottom」である場合に、当該「Bottom」に関連付けられた訳語候補が「最後の頁」及び「下詰め」であることを示す。
訳し分けDB(1001)において、一つの訳語候補に対して、少なくとも1以上の周辺用語が関連付けられている。当該周辺用語が、図3に示すステップ305において抽出されたテキスト・データ中及び、任意的に、図3に示すステップ304において決定されたGUI要素グループに関連付けられたテキスト・データ中に存在する場合において、当該周辺用語を持つ訳語候補が翻訳対象の語に対する相応しい訳語であることを選択するために使用される。
図10Aでは、訳し分けDB(1001)は加点情報として1を有する。加点情報は、周辺用語が図3に示すステップ305において抽出されたテキスト・データ中に存在する場合(図5Bのステップ515)に、訳語候補に関連付けられた値(候補得点値A)に1を加算するために使用される(図5Bのステップ516)。また、当該加点情報は、周辺用語が図3に示すステップ304において決定されたGUI要素グループに関連付けられたテキスト・データ(例えば、GUI要素グループ名)中に存在する場合(図5Bのステップ518)に、訳語候補に関連付けられた値(候補得点値B)に1を加算するために使用される(図5Bのステップ519)。
図10Bでは、訳し分けDB(1001)は重み加味情報を有する。当該重み加味情報は、各訳語候補に関連付けられている。当該重み加味情報は、候補得点値Aに重みを加味するために使用されうる。例えば、候補得点値Aが3であり、当該重み加味情報が5である場合には、例えば、候補得点値Aの3に重み加味情報の5が乗算される(図5Cのステップ522)。
図11Aは、本発明の実施態様に従い、図10Aに示す訳し分けDB(1001)を使用して相応しい訳語を選択するために、抽出されたテキスト・データ(901)と2つの訳語候補(1012,1013)それぞれに関連付けられた周辺用語とをそれぞれ突き合わせて、訳語候補毎に合致した数をそれぞれ求める例を示す。
図11Aは、コンピュータ(101)が訳し分けDB(1001)中の翻訳対象の英語「Top」(1011)についてのデータ・セットをロードし、且つ、抽出されたテキスト・データが図9に示す領域A(611)から抽出されたテキスト・データ(901)である場合を示す。また、図11Aに示す例は、図5Bに示すステップ518〜519を実施せず、且つ図5Cに示すステップ521を経由して重みを加味しない場合の例である。
翻訳対象の英語「Top」(1011)は、訳語候補「最初の頁」(1012)及び「上詰め」(1013)の2つを有する。
コンピュータ(101)は、訳語候補「最初の頁」(1012)に関連付けられた周辺用語が上記抽出されたテキスト・データ(901)中に存在するかどうかを判定する。周辺用語「bottom」が、テキスト・データ(901)中に存在するので、合致した数は1である。従って、訳語候補「最初の頁」(1012)の候補得点値A(図5Bのステップ516)は1である。ステップ518〜519は実施されないので、合計候補得点値(図5Cのステップ521)は候補得点値Aと同じ1である。
コンピュータ(101)は、訳語候補「上詰め」(1013)に関連付けられた周辺用語が上記抽出されたテキスト・データ(901)中に存在するかどうかを判定する。周辺用語「center」,「left」,「right」及び「bottom」がテキスト・データ(901)中に存在するので、合致した数は4である。従って、訳語候補「上詰め」(1013)の候補得点値A(図5Bのステップ516)は4である。ステップ518〜519は実施されないので、合計候補得点値(図5Cのステップ521)は候補得点値Aと同じ4である。
以上の通り、訳語候補「上詰め」(1013)の合計候補得点値4が訳語候補「最初の頁」(1012)の合計候補得点値1よりも高いので、作業値には訳語候補「上詰め」(1013)の合計候補得点値4が入っている。従って、作業値の置き換えに使用された合計候補得点値に対応する訳語候補「上詰め」(1013)が、上記抽出されたテキスト・データ(901)中の「Top」に対する相応しい訳語であると決定される。
図11Bは、本発明の実施態様に従い、図10Aに示す訳し分けDB(1001)を使用して相応しい訳語を選択するために、抽出されたテキスト・データ(901)及びGUI要素グループに関連付けられたテキスト・データと2つの訳語候補(1012,1013)それぞれに関連付けられた周辺用語とをそれぞれ突き合わせて、訳語候補毎に合致した数をそれぞれ求める例を示す。
図11Bに示す例では図11Aに示す例の場合と異なり、図9に示す領域A(611)から抽出されたテキスト・データ(901)に加えて、GUI要素グループ名「TOOLBOX」が考慮される場合を示す。また、図11Bに示す例は、図5Cに示すステップ521を経由して重みを加味しない場合の例である。
コンピュータ(101)は、訳語候補「最初の頁」(1012)に関連付けられた周辺用語が上記抽出されたテキスト・データ中(901)及びGUI要素グループ名「TOOLBOX」中に存在するかどうかを判定する。周辺用語「bottom」が、テキスト・データ(901)中に存在するので、合致した数は1である。よって、訳語候補「最初の頁」(1012)の候補得点値A(図5Bのステップ516)は1である。また、周辺用語はGUI要素グループ名を有していないので、候補得点値Bは0である。従って、訳語候補「最初の頁」(1012)の合計候補得点値(図5Bのステップ521)は1(1+0)である。
コンピュータ(101)は、訳語候補「上詰め」(1013)に関連付けられた周辺用語が上記抽出されたテキスト・データ(901)中及びGUI要素グループ名「TOOLBOX」中に存在するかどうかを判定する。周辺用語「center」,「left」,「right」及び「bottom」がテキスト・データ(901)中に存在するので、合致した数は4である。よって、訳語候補「上詰め」(1013)の候補得点値Aは4である。また、周辺用語「toolbox」がGUI要素グループ名中に存在するので、合致した数は1である。よって、訳語候補「上詰め」(1013)の候補得点値Bは1である。従って、訳語候補「上詰め」(1013)の合計候補得点値(図5Cのステップ521)は5(4+1)である。
以上の通り、訳語候補「上詰め」(1013)の合計候補得点値5が訳語候補「最初の頁」(1012)の合計候補得点値1よりも高いので、作業値には訳語候補「上詰め」(1013)の候補得点値5が入っている。従って、作業値の置き換えに使用された合計候補得点値に対応する訳語候補「上詰め」(1013)が、上記抽出されたテキスト・データ(901)中の「Top」に対する相応しい訳語であると決定される。
図11Cは、本発明の実施態様に従い、図10Aに示す訳し分けDB(1001)を使用して相応しい訳語を選択するために、抽出されたテキスト・データ(903)と2つの訳語候補(1012,1013)それぞれに関連付けられた周辺用語とをそれぞれ突き合わせて、訳語候補毎に合致した数をそれぞれ求める例を示す。
図11Cは、コンピュータ(101)が訳し分けDB(1001)中の翻訳対象の英語「Top」についてのデータ・セットをロードし、且つ、抽出されたテキスト・データが図9に示す領域C(613)から抽出されたテキスト・データ(903)である場合を示す。また、図11Cに示す例は、図5Bに示すステップ518〜519を実施せず、且つ図5Cに示すステップ521を経由して重みを加味しない場合の例である。
翻訳対象の英語「Top」(1011)は、訳語候補「最初の頁」(1012)及び「上詰め」(1013)の2つを有する。
コンピュータ(101)は、訳語候補「最初の頁」(1012)に関連付けられた周辺用語が上記抽出されたテキスト・データ(903)中に存在するかどうかを判定する。周辺用語「up」,「down」及び「bottom」が、テキスト・データ(903)中に存在するので、合致した数は3である。従って、訳語候補「最初の頁」(1012)の候補得点値A(図5Bのステップ516)は3である。ステップ518〜519は実施されないので、合計候補得点値(図5Cのステップ521)は候補得点値Aと同じ3である。
コンピュータ(101)は、訳語候補「上詰め」(1013)に関連付けられた周辺用語が上記抽出されたテキスト・データ(903)中に存在するかどうかを判定する。周辺用語「bottom」が、テキスト・データ(903)中に存在するので、合致した数は1である。従って、訳語候補「上詰め」(1013)の候補得点値A(図5Bのステップ516)は1である。ステップ518〜519は実施されないので、合計候補得点値(図5Cのステップ521)は候補得点値Aと同じ1である。
以上の通り、訳語候補「最初の頁」(1012)の合計候補得点値3が訳語候補「上詰め」(1013)の合計候補得点値1よりも高いので、作業値には訳語候補「最初の頁」(1012)の合計候補得点値3が入っている。従って、作業値の置き換えに使用された合計候補得点値に対応する訳語候補「最初の頁」(1012)が、上記抽出されたテキスト・データ(903)中の「Top」に対する相応しい訳語であると決定される。
図11Dは、本発明の実施態様に従い、図10Aに示す訳し分けDB(1001)を使用して相応しい訳語を選択するために、抽出されたテキスト・データ(903)及びGUI要素グループに関連付けられたテキスト・データと2つの訳語候補(1012,1013)それぞれに関連付けられた周辺用語とをそれぞれ突き合わせて、訳語候補毎に合致した数をそれぞれ求める例を示す。
図11Dに示す例では図11Cに示す例の場合と異なり、図9に示す領域C(613)から抽出されたテキスト・データ(903)に加えて、GUI要素グループ名「MOVE PAGE」が考慮される場合を示す。また、図11Dに示す例は、図5Cに示すステップ521を経由して重みを加味しない場合の例である。
コンピュータ(101)は、訳語候補「最初の頁」(1012)に関連付けられた周辺用語が上記抽出されたテキスト・データ中(903)及びGUI要素グループ名「MOVE PAGE」中に存在するかどうかを判定する。周辺用語「up」,「down」及び「bottom」がテキスト・データ(903)中に存在するので、合致した数は3である。よって、訳語候補「最初の頁」(1012)の候補得点値A(図5Bのステップ516)は3である。また、周辺用語「move」及び「page」がGUI要素グループ名中に存在するので、合致した数は2である。よって、訳語候補「最初の頁」(1012)の候補得点値Bは、2である。従って、訳語候補「最初の頁」(1012)の合計候補得点値(図5Bのステップ521)は5(3+2)である。
コンピュータ(101)は、訳語候補「上詰め」(1013)に関連付けられた周辺用語が上記抽出されたテキスト・データ(903)中及びGUI要素グループ名「MOVE PAGE」中に存在するかどうかを判定する。周辺用語「bottom」が、テキスト・データ(903)中に存在するので合致した数は1である。よって、訳語候補「上詰め」(1013)の候補得点値Aは1である。また、周辺用語はGUI要素グループ名を有していないので、候補得点値Bは0である。従って、訳語候補「上詰め」(1013)の合計候補得点値(図5Bのステップ521)は1(1+0)である。
以上の通り、訳語候補「最初の頁」(1012)の合計候補得点値5が訳語候補「上詰め」(1013)の合計候補得点値1よりも高いので、作業値には訳語候補「最初の頁」(1012)の候補得点値5が入っている。従って、作業値の置き換えに使用された合計候補得点値に対応する訳語候補「最初の頁」(1012)が、上記抽出されたテキスト・データ(903)中の「Top」に対する相応しい訳語であると決定される。
図12Aは、本発明の実施態様に従い、図10Bに示す訳し分けDB(1031)を使用して相応しい訳語を選択するために、抽出されたテキスト・データ(901)と2つの訳語候補(1042,1042)それぞれに関連付けられた周辺用語とをそれぞれ突き合わせて、訳語候補毎に合致した数から求められる値(重みを加味した値)をそれぞれ求める例を示す。
図12Aに示す例では図11Aに示す例の場合と異なり、加点情報を含む訳し分けDB(1001)の代わりに、重み加味情報を含む訳し分けDB(1031)が使用される場合を示す。
図12Aは、コンピュータ(101)が訳し分けDB(1031)中の翻訳対象の英語「Top」についてのデータ・セットをロードし、且つ、抽出されたテキスト・データが図9に示す領域A(611)から抽出されたテキスト・データ(901)である場合を示す。また、図12Aに示す例は、図5Bに示すステップ518〜519を実施しない場合の例である。
翻訳対象の英語「Top」(1041)は、訳語候補「最初の頁」(1042)及び「上詰め」(1043)の2つを有する。
コンピュータ(101)は、訳語候補「最初の頁」(1042)に関連付けられた周辺用語が上記抽出されたテキスト・データ(901)中に存在するかどうかを判定する。周辺用語「bottom」が、テキスト・データ(901)中に存在するので、合致した数は1である。従って、訳語候補「最初の頁」(1042)の候補得点値A(図5Bのステップ516)は1である。ステップ518〜519は実施されない。従って、訳語候補「最初の頁」(1042)の合計候補得点値(図5Cのステップ522)は、候補得点値Aに訳語候補「最初の頁」(1042)の重み加味情報5を掛けた値5(1×5)である。
コンピュータ(101)は、訳語候補「上詰め」(1043)に関連付けられた周辺用語が上記抽出されたテキスト・データ(901)中に存在するかどうかを判定する。周辺用語「center」,「left」,「right」及び「bottom」が、上記抽出されたテキスト・データ(901)中に存在するので、合致した数は4である。従って、訳語候補「上詰め」(1043)の候補得点値A(図5Bのステップ516)は4である。ステップ518〜519は実施されない。従って、訳語候補「上詰め」(1043)の合計候補得点値(図5Cのステップ522)は、候補得点値Aに訳語候補「上詰め」(1043)の重み加味情報8を掛けた値32(4×8)である。
以上の通り、訳語候補「上詰め」(1043)の合計候補得点値32が訳語候補「最初の頁」(1042)の合計候補得点値5よりも高いので、作業値には訳語候補「上詰め」(1043)の候補得点値32が入っている。従って、作業値の置き換えに使用された合計候補得点値に対応する訳語候補「上詰め」(1043)が、上記抽出されたテキスト・データ(901)中の「Top」に対する相応しい訳語であると決定される。
図12Bは、本発明の実施態様に従い、図10Bに示す訳し分けDB(1031)を使用して相応しい訳語を選択するために、抽出されたテキスト・データ(901)及びGUI要素グループに関連付けられたテキスト・データと2つの訳語候補(1042,1043)それぞれに関連付けられた周辺用語とをそれぞれ突き合わせて、訳語候補毎に合致した数から求められる値(重みを加味した値)をそれぞれ求める例を示す。
図12Bに示す例は図12Aに示す例の場合と異なり、図9に示す領域A(611)から抽出されたテキスト・データ(901)に加えて、GUI要素グループ名「TOOLBOX」が考慮される場合を示す。
コンピュータ(101)は、訳語候補「最初の頁」(1042)に関連付けられた周辺用語が上記抽出されたテキスト・データ中(901)及びGUI要素グループ名「TOOLBOX」中に存在するかどうかを判定する。周辺用語「bottom」が上記抽出されたテキスト・データ(901)中に存在するので、合致した数は1である。よって、訳語候補「最初の頁」(1042)の候補得点値A(図5Bのステップ516)は1である。また、周辺用語はGUI要素グループ名を有していないので、候補得点値Bは0である。従って、訳語候補「最初の頁」(1042)の合計候補得点値(図5Cのステップ522)は、候補得点値Aに訳語候補「最初の頁」(1042)の重み加味情報5を掛けた値5(1×5+0×8)である。
コンピュータ(101)は、訳語候補「上詰め」(1043)に関連付けられた周辺用語が上記抽出されたテキスト・データ(901)中及びGUI要素グループ名「TOOLBOX」中に存在するかどうかを判定する。周辺用語「center」,「left」,「right」及び「bottom」が上記抽出されたテキスト・データ(901)中に存在するので、合致した数は4である。よって、訳語候補「上詰め」(1043)の候補得点値A(図5Bのステップ516)は4である。また、周辺用語「toolbox」がGUI要素グループ名中に存在するので、合致した数は1である。よって、訳語候補「上詰め」(1043)の候補得点値B(図5Bのステップ519)は1である。従って、訳語候補「上詰め」(1043)の合計候補得点値(図5Cのステップ522)は、候補得点値Aに訳語候補「上詰め」(1043)の重み加味情報8を掛けた値32(4×8)と、候補得点値BにGUI要素グループ名「TOOLBOX」の重み加味情報50を掛けた値50(1×50)とを加えた値82(32+50)である。
以上の通り、訳語候補「上詰め」(1043)の合計候補得点値82が訳語候補「最初の頁」(1042)の合計候補得点値5よりも高いので、作業値には訳語候補「上詰め」(1043)の候補得点値82が入っている。従って、作業値の置き換えに使用された合計候補得点値に対応する訳語候補「上詰め」(1043)が、上記抽出されたテキスト・データ(901)中の「Top」に対する相応しい訳語であると決定される。
図12Cは、本発明の実施態様に従い、図10Bに示す訳し分けDB(1031)を使用して相応しい訳語を選択するために、抽出されたテキスト・データ(903)と2つの訳語候補(1042,1043)それぞれに関連付けられた周辺用語とをそれぞれ突き合わせて、訳語候補毎に合致した数から求められる値(重みを加味した値)をそれぞれ求める例を示す。
図12Cは、コンピュータ(101)が訳し分けDB(1001)中の翻訳対象の英語「Top」についてのデータ・セットをロードし、且つ、抽出されたテキスト・データが図9に示す領域C(613)から抽出されたテキスト・データ(903)である場合を示す。また、図12Cに示す例は、図5Bに示すステップ518〜519を実施しない場合の例である。
翻訳対象の英語「Top」(1041)は、訳語候補「最初の頁」(1042)及び「上詰め」(1043)の2つを有する。
コンピュータ(101)は、訳語候補「最初の頁」(1042)に関連付けられた周辺用語が上記抽出されたテキスト・データ(903)中に存在するかどうかを判定する。周辺用語「up」,「down」及び「bottom」が、テキスト・データ(903)中に存在するので、合致した数は3である。従って、訳語候補「最初の頁」(1042)の候補得点値A(図5Bのステップ516)は3である。ステップ518〜519は実施されない。従って、訳語候補「最初の頁」(1042)の合計候補得点値(図5Cのステップ522)は、候補得点値Aに訳語候補「最初の頁」(1042)の重み加味情報10を掛けた値30(3×10)である。
コンピュータ(101)は、訳語候補「上詰め」(1043)に関連付けられた周辺用語が上記抽出されたテキスト・データ(903)中に存在するかどうかを判定する。周辺用語「bottom」が上記抽出されたテキスト・データ(903)中に存在するので、合致した数は1である。従って、訳語候補「上詰め」(1043)の候補得点値A(図5Bのステップ516)は1である。
ステップ518〜519は実施されない。従って、訳語候補「上詰め」(1043)の合計候補得点値(図5Cのステップ522)は、候補得点値Aに訳語候補「上詰め」(1043)の重み加味情報15を掛けた値15(1×15)である。
以上の通り、訳語候補「最初の頁」(1042)の合計候補得点値30が訳語候補「上詰め」(1043)の合計候補得点値15よりも高いので、作業値には訳語候補「最初の頁」(1042)の候補得点値30が入っている。従って、作業値の置き換えに使用された合計候補得点値に対応する訳語候補「最初の頁」(1042)が、上記抽出されたテキスト・データ(903)中の「Top」に対する相応しい訳語であると決定される。
図12Dは、本発明の実施態様に従い、図10Bに示す訳し分けDB(1031)を使用して相応しい訳語を選択するために、抽出されたテキスト・データ(903)及びGUI要素グループに関連付けられたテキスト・データと2つの訳語候補(102,1043)それぞれに関連付けられた周辺用語とをそれぞれ突き合わせて、訳語候補毎に合致した数から求められる値(重みを加味した値)をそれぞれ求める例を示す。
図12Dに示す例では図12Cに示す例の場合と異なり、図9に示す領域C(613)から抽出されたテキスト・データ(903)に加えて、GUI要素グループ名「MOVE PAGE」が考慮される場合を示す。
コンピュータ(101)は、訳語候補「最初の頁」(1042)に関連付けられた周辺用語が上記抽出されたテキスト・データ中(903)及びGUI要素グループ名「MOVE PAGE」中に存在するかどうかを判定する。周辺用語「up」,「down」及び「bottom」が上記抽出されたテキスト・データ(903)中に存在するので、合致した数は3である。よって、訳語候補「最初の頁」(1042)の候補得点値A(図5Bのステップ516)は3である。また、周辺用語「move」及び「page」がGUI要素グループ名中に存在するので、合致した数は2である。よって、訳語候補「最初の頁」(1042)の候補得点値B(図5Bのステップ519)は2である。従って、訳語候補「最初の頁」(1042)の合計候補得点値(図5Cのステップ522)は、候補得点値Aに訳語候補「最初の頁」(1042)の重み加味情報10を掛けた値30(3×10)と、候補得点値BにGUI要素グループ名「MOVE PAGE」の重み加味情報25を掛けた値50(2×25)とを加えた値80(30+50)である。
コンピュータ(101)は、訳語候補「上詰め」(1043)に関連付けられた周辺用語が上記抽出されたテキスト・データ(903)中及びGUI要素グループ名「MOVE PAGE」中に存在するかどうかを判定する。周辺用語「bottom」が上記抽出されたテキスト・データ(903)中に存在するので、合致した数は1である。よって、訳語候補「上詰め」(1043)の候補得点値A(図5Bのステップ516)は1である。また、周辺用語はGUI要素グループ名を有していないので、候補得点値Bは0である。従って、訳語候補「上詰め」(1043)の合計候補得点値(図5Cのステップ522)は、候補得点値Aに訳語候補「上詰め」(1043)の重み加味情報15を掛けた値15(1×15+0×25)である。
以上の通り、訳語候補「最初の頁」(1042)の合計候補得点値80が訳語候補「上詰め」(1043)の合計候補得点値15よりも高いので、作業値には訳語候補「最初の頁」(1042)の候補得点値80が入っている。従って、作業値の置き換えに使用された合計候補得点値に対応する訳語候補「最初の頁」(1042)が、上記抽出されたテキスト・データ(903)中の「Top」に対する相応しい訳語であると決定される。
図13は、本発明の実施態様に従い、図2Aに示すウェブ画面データ上の各閉領域から抽出されたテキスト・データ中の語を翻訳した結果の例である。
図2Aに示すウェブ画面データ(201)中の領域A(611)について、抽出されたテキスト・データ(901)中、「Top」及び「Bottom」がそれぞれ「上詰め」及び「下詰め」と訳し分けされている(1301)。また、同ウェブ画面データ(201)中の領域C(613)について、抽出されたテキスト・データ(903)中、「Top」及び「Bottom」がそれぞれ「最初の頁」及び「最後の頁」と訳し分けされている(1302)。
コンピュータ(101)は、訳し分けされた翻訳結果を、図13に示すように、抽出されたテキスト・データのうち、相応しい訳語が決定された第1の言語の語を第2の言語(日本語)で置換して表示し、それ以外の第1の言語(英語)をそのまま表示してもよい。代替的には、コンピュータ(101)は、訳し分けされた翻訳結果のみを、第1の言語(英語)−第2の言語(日本語)に対応付けて表示してもよい。例えば、領域A(611)について、「Top」=「上詰め」、「Bottom」=「下詰め」と表示し、領域C(613)について、「Top」=「最初の頁」と、「Bottom」=「最後の頁」と表示してもよい。代替的には、図2Bに示すように、相応しい訳語が決定された第1の言語の語を第2の言語(日本語)で置換して、ウェブ画面データ(201)を表示してもよい。
コンピュータ(101)は、抽出されたテキスト(901及び903)を画面上に表示しても表示しなくてもよい。
図14は本発明の実施態様において使用されうる訳し分けDB(1401)の例を示し、本発明の実施態様に従い訳し分けがされる第1の言語が英語である場合の翻訳対象の単語の例を示す。図14では、翻訳対象が単語である場合のみを示しているが、フレーズについても単語と同様に当該訳し分けDB(1401)中に定義することができる。図14に示されているように、1つの第1の言語の単語に対して2以上の第2の言語(この例では日本語)の訳語候補が関連付けられており、また当該2以上の訳語候補それぞれについて周辺用語が定義されている。
図15は、図1に従うハードウェア構成を好ましくは備えており、本発明の実施態様に従うコンピュータの機能ブロック図の一例を示した図である。
コンピュータ(101)は、画像データ受信手段(1501)、画像データ・スキャン手段(1502)、GUI要素グループ決定手段(1503)、テキスト・データ抽出手段(1504)、訳語候補選択手段(1505)及び決定訳語表示手段(1506)を備えている。また、コンピュータ(101)は、第1のデータがGUI要素グループDBとして実装される場合には、GUI要素グループDB(1507)を格納した内部記憶装置又は外部記憶装置にアクセスすることが可能である。また、コンピュータ(101)は、第2のデータが訳し分けDBとして実装される場合には、訳し分けDB(1508)を格納した内部記憶装置又は外部記憶装置にアクセスすることが可能である。
画像データ受信手段(1501)は、図3に示すステップ302を実行しうる。
画像データ・スキャン手段(1502)は、図3に示すステップ303の画像データ中の閉領域、及び、当該閉領域中のGUI要素を特定する為に、画像データを又は画像データを含む電子データをスキャンしうる。画像データ・スキャン手段(1502)は例えば、画像読み取り装置(例えば、スキャナー、又はスキャナー機能を備えているプリンター、ファクシミリ若しくは複合機)でありうる。
GUI要素グループ決定手段(1503)は、図3に示すステップ304を実行しうる。
テキスト・データ抽出手段(1504)は、図3に示すステップ305を実行する。テキスト・データ抽出手段(1504)は例えば、光学式文字読取手段の機能を備えうる。
訳語候補選択手段(1505)は、図3に示すステップ306を実行しうる。
決定訳語表示手段(1506)は、図3に示すステップ307を実行しうる。決定訳語表示手段(1506)は例えば、コンピュータ(101)にケーブルを介して又は無線を介して接続された表示装置(106)又はコンピュータ(101)内に一体として埋め込まれた表示装置(106)でありうる。また、決定訳語表示手段(1506)は例えば、決定訳語を印刷するためのプリンターでありうる。

Claims (20)

  1. 第1の言語における単語又はフレーズを第2の言語における対応する訳語に翻訳する方法において、前記第1の言語における単語又はフレーズに対応する訳語が複数ある場合において前記対応する複数の訳語(以下、訳語候補という)のうちから前記単語又はフレーズの訳語として相応しい訳語を決定する方法であって、コンピュータが、
    画像データ又は画像データを含む電子データを受け取るステップと、
    前記画像データ中又は前記画像データを含む前記電子データ中の少なくとも1以上の閉領域が特定されることに応じて、当該特定された閉領域それぞれが、事前定義された複数のグラフィカル・ユーザ・インタフェース(以下、GUIという)要素グループのうちのいずれのGUI要素グループに該当するかを、第1のデータを使用して決定するステップであって、前記第1のデータは、画像データ中の少なくとも1つのGUI要素の構造の条件式と、当該条件式に関連付けられた少なくとも1つのGUI要素グループに関連付けられたテキスト・データとを一組のデータとして含む、前記決定するステップと、
    前記特定された閉領域のうちの1つ又は当該1つの閉領域に関連付けられたファイルからテキスト・データを抽出するステップと、
    前記第1の言語における単語又はフレーズを前記第2の言語における対応する訳語に翻訳するために用いられる第2のデータ中にリストされている訳し分けされるべき第1の言語の単語又はフレーズが前記抽出されたテキスト・データ中に存在することに応じて、当該存在する単語又はフレーズの訳語を前記第2のデータ中の複数の訳語候補のうちから選択するステップと
    を実行することを含む、前記方法。
  2. 前記第2のデータは、前記第1の言語における単語又はフレーズと、当該単語又はフレーズに関連付けられた少なくとも2つの訳語候補と、前記少なくとも2つの訳語候補それぞれに関連付けられた少なくとも1つの単語(以下、周辺用語という)とを一組のデータとして含む、請求項1に記載の方法。
  3. 前記選択するステップが、
    前記第2のデータ中にリストされている前記1つの単語又はフレーズが前記抽出されたテキスト・データ中に存在することに応じて、前記抽出されたテキスト・データと前記少なくとも2つの訳語候補それぞれに関連付けられた前記周辺用語とを突き合わせて合致した数又は当該合致した数から求められる値をそれぞれ算出して、当該算出された値の最高値を有する訳語候補を前記相応しい訳語として決定するステップ
    を含む、請求項2に記載の方法。
  4. 前記選択するステップが、
    前記第2のデータ中にリストされている前記1つの単語又はフレーズが前記抽出されたテキスト・データ中に存在するかどうかを検索するステップと、
    前記第2のデータ中にリストされている前記1つの単語又はフレーズが前記抽出されたテキスト・データ中に存在することに応じて、当該1つの単語又はフレーズに関連付けられた値(以下、作業値という)を初期化するステップと、
    前記抽出されたテキスト・データと前記少なくとも2つの訳語候補のうちの1つに関連付けられた前記周辺用語とを突き合わせて合致した数又は当該合致した数から求められる値(以下、候補得点値という)を算出するステップと、
    前記候補得点値と前記作業値とを比較して、前記候補得点値が前記作業値よりも高い場合に、前記候補得点値で前記作業値を置き換えるステップと、
    前記算出するステップ及び前記置き換えるステップを、前記第2のデータ中にリストされている前記少なくとも2つの訳語候補のうちの残りについて繰り返し行うステップと、
    前記繰り返し行うステップの後に前記置き換えに使用した候補得点値に対応する周辺用語を持つ訳語候補を前記訳語として選択するステップと
    を含む、請求項2に記載の方法。
  5. 前記合致した数から求められる値が、前記合致した数に、当該突き合わせられた訳語候補に関連付けられた重みを加味することによって得られる値である、請求項4に記載の方法。
  6. 前記突き合わせが、前記抽出されたテキスト・データ及び前記決定されたGUI要素グループに関連付けられたテキスト・データと前記少なくとも2つの訳語候補のうちの1つに関連付けられた前記周辺用語とを突き合わせることによって行われる、請求項4に記載の方法。
  7. 前記合致した数から求められる値が、前記合致した数に、当該突き合わせられたGUI要素グループに関連付けられたテキスト・データに関連付けられた重みを加味することによって得られる値である、請求項6に記載の方法。
  8. 前記GUI要素グループを決定するステップが、
    1つの閉領域についてのGUI要素リスト中にリストされているGUI要素のうちの始点座標が最小であるGUI要素を基準として、前記GUI要素リスト中にリストされているGUI要素の各座標を相対座標に変換するステップと、
    前記第1のデータ中の条件式のうちの1つをロードするステップと、
    前記ロードした1つの条件式と前記相対座標に変換されたGUI要素とを突き合わせるステップと、
    前記条件式を満足する場合に、当該満足した条件式に対応するGUI要素グループを、前記1つの閉領域のGUI要素グループとして決定するステップと、
    前記条件式を満足しない場合に、前記ロードするステップ及び前記突き合わせるステップを繰り返すステップと
    を含む、請求項1に記載の方法。
  9. 前記コンピュータが、
    前記受け取った画像データ又は前記画像データを含む電子データをスキャンして、各閉領域中の少なくとも1つのGUI要素を識別するステップ
    をさらに実行することを含む、請求項1に記載の方法。
  10. 前記コンピュータが、
    前記受け取った画像データ又は前記画像データを含む電子データをスキャンして、少なくとも1以上の閉領域及び当該各閉領域中の少なくとも1つのGUI要素を識別するステップ
    をさらに実行することを含む、請求項1に記載の方法。
  11. 前記GUI要素を識別するステップが、
    前記受け取った画像データ又は前記画像データを含む電子データのスキャンを開始するステップと、
    デフォルトの背景色と異なる色を持つ領域を検出することに応じて、当該検出した領域中のGUI要素の各座標をデータ化するステップと、
    既存のGUI要素リスト内で終点座標が最大のGUI要素と、前記検出した領域内で始点座標が最小のGUI要素との距離を検出するステップと、
    前記距離が一定の範囲内であることに応じて、前記検出した領域中のGUI要素を前記GUI要素リストに追加するステップと、
    前記距離が一定の範囲内でないことに応じて、前記GUI要素リストを出力するステップであって、当該GUI要素リストの出力によって、1つの閉領域が確定される、前記出力するステップと
    をさらに含む、請求項10に記載の方法。
  12. 前記コンピュータが、
    前記抽出されたテキスト・データを表示装置上に表示するステップであって、前記抽出されたテキスト・データのうち、前記選択するステップにおいて前記訳語が選択されている第1の言語の単語又はフレーズについては、当該第1の言語の単語又はフレーズが当該選択された訳語に置き換えられて表示される、前記表示するステップ
    をさらに実行することを含む、請求項1に記載の方法。
  13. 前記コンピュータが、
    前記抽出するステップ及び前記選択するステップを、前記特定された閉領域の残りそれぞれについて繰り返すステップ
    をさらに実行することを含む、請求項1に記載の方法。
  14. 前記第1のデータ中の条件式が、GUI要素の数、配列、面積、形状及び種類の少なくとも1つによって特定されている、請求項1に記載の方法。
  15. 前記第1のデータ中の条件式が、GUI要素の座標の関係を示す式によって特定されている、請求項1に記載の方法。
  16. 前記画像データが少なくとも1つのGUI要素を有しており、
    前記テキスト・データを抽出するステップが、前記GUI要素上に吹き出しで表示されたテキストを光学式文字読取手段によって読み取り、テキスト・データとして取得するステップを含む、
    請求項1に記載の方法。
  17. 前記画像データが少なくとも1つのGUI要素を有しており、
    前記テキスト・データを抽出するステップが、前記GUI要素に関連付けられた電子データから当該GUI要素に関連付けられたテキスト・データを取り出すステップを含む、
    請求項1に記載の方法。
  18. 前記画像データが画像データ化されたテキストを有しており、
    前記テキスト・データを抽出するステップが、前記画像データ化されたテキストを光学式文字読取手段によって読み取り、テキスト・データとして取得するステップを含む、
    請求項1に記載の方法。
  19. 第1の言語における単語又はフレーズから第2の言語における対応する訳語に翻訳するコンピュータにおいて、前記第1の言語における単語又はフレーズに対応する訳語が複数ある場合において前記対応する複数の訳語(以下、訳語候補という)のうちから前記単語又はフレーズの訳語として相応しい訳語を決定するコンピュータであって、
    画像データ又は画像データを含む電子データを受け取る受信手段と、
    前記画像データ中又は前記画像データを含む前記電子データ中の少なくとも1以上の閉領域が特定されることに応じて、当該特定された閉領域それぞれが、事前定義された複数のグラフィカル・ユーザ・インタフェース(以下、GUIという)要素グループのうちのいずれのGUI要素グループに該当するかを、第1のデータを使用して決定するGUI要素グループ決定手段であって、前記第1のデータは、画像データ中の少なくとも1つのGUI要素の構造の条件式と、当該条件式に関連付けられた少なくとも1つのGUI要素グループに関連付けられたテキスト・データとを一組のデータとして含む、前記GUI要素グループ決定手段と、
    前記特定された閉領域のうちの1つ又は当該1つの閉領域に関連付けられたファイルからテキスト・データを抽出するテキスト・データ抽出手段と、
    前記第1の言語における単語又はフレーズを前記第2の言語における対応する訳語に翻訳するために用いられる第2のデータ中にリストされている訳し分けされるべき第1の言語の単語又はフレーズが前記抽出されたテキスト・データ中に存在することに応じて、当該存在する単語又はフレーズの訳語を前記第2のデータ中の複数の訳語候補のうちから選択する訳語候補選択手段と
    を備えている、前記コンピュータ。
  20. 第1の言語における単語又はフレーズから第2の言語における対応する訳語に翻訳するコンピュータ・プログラムにおいて、前記第1の言語における単語又はフレーズに対応する訳語が複数ある場合において前記対応する複数の訳語(以下、訳語候補という)のうちから前記単語又はフレーズの訳語として相応しい訳語を決定するコンピュータ・プログラムであって、コンピュータに、請求項1〜18のいずれか一項に記載の方法の各ステップを実行させる、前記コンピュータ・プログラム。
JP2012239982A 2012-10-31 2012-10-31 画像データ中の訳し分けされるべき単語又はフレーズに対応する訳語を決定する方法、並びにそのコンピュータ及びコンピュータ・プログラム Pending JP2014089637A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2012239982A JP2014089637A (ja) 2012-10-31 2012-10-31 画像データ中の訳し分けされるべき単語又はフレーズに対応する訳語を決定する方法、並びにそのコンピュータ及びコンピュータ・プログラム
US14/045,545 US10372827B2 (en) 2012-10-31 2013-10-03 Translating phrases from image data on a GUI

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012239982A JP2014089637A (ja) 2012-10-31 2012-10-31 画像データ中の訳し分けされるべき単語又はフレーズに対応する訳語を決定する方法、並びにそのコンピュータ及びコンピュータ・プログラム

Publications (1)

Publication Number Publication Date
JP2014089637A true JP2014089637A (ja) 2014-05-15

Family

ID=50548142

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012239982A Pending JP2014089637A (ja) 2012-10-31 2012-10-31 画像データ中の訳し分けされるべき単語又はフレーズに対応する訳語を決定する方法、並びにそのコンピュータ及びコンピュータ・プログラム

Country Status (2)

Country Link
US (1) US10372827B2 (ja)
JP (1) JP2014089637A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016136619A (ja) * 2011-12-28 2016-07-28 株式会社東芝 半導体発光素子
JP2016151981A (ja) * 2015-02-19 2016-08-22 富士通株式会社 学習装置、学習方法及び学習プログラム

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9588675B2 (en) 2013-03-15 2017-03-07 Google Inc. Document scale and position optimization
US9372672B1 (en) * 2013-09-04 2016-06-21 Tg, Llc Translation in visual context
GB201417948D0 (en) * 2014-10-10 2014-11-26 Ibm Enhanced documentation validation
JP6259804B2 (ja) 2014-11-26 2018-01-10 ネイバー コーポレーションNAVER Corporation コンテンツ参加翻訳装置、及びそれを利用したコンテンツ参加翻訳方法
JP2016143310A (ja) * 2015-02-04 2016-08-08 ソニー株式会社 情報処理装置、画像処理方法及びプログラム
US9881003B2 (en) * 2015-09-23 2018-01-30 Google Llc Automatic translation of digital graphic novels
US10409623B2 (en) * 2016-05-27 2019-09-10 Microsoft Technology Licensing, Llc Graphical user interface for localizing a computer program using context data captured from the computer program
KR102637338B1 (ko) * 2017-01-26 2024-02-16 삼성전자주식회사 번역 보정 방법 및 장치와 번역 시스템
US11822896B2 (en) * 2020-07-08 2023-11-21 International Business Machines Corporation Contextual diagram-text alignment through machine learning
US11354485B1 (en) * 2021-05-13 2022-06-07 iCIMS, Inc. Machine learning based classification and annotation of paragraph of resume document images based on visual properties of the resume document images, and methods and apparatus for the same

Family Cites Families (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3045832B2 (ja) 1991-10-01 2000-05-29 沖電気工業株式会社 適訳語選択方式
JPH0635955A (ja) 1992-07-20 1994-02-10 Brother Ind Ltd 機械翻訳装置
JP3300131B2 (ja) 1993-10-04 2002-07-08 株式会社リコー 自然言語解析装置
JPH09179865A (ja) 1995-12-25 1997-07-11 Sharp Corp 翻訳対象領域決定機能付き機械翻訳装置
US5801699A (en) * 1996-01-26 1998-09-01 International Business Machines Corporation Icon aggregation on a graphical user interface
US5974372A (en) * 1996-02-12 1999-10-26 Dst Systems, Inc. Graphical user interface (GUI) language translator
JPH1049534A (ja) 1996-08-06 1998-02-20 Sharp Corp 機械翻訳支援装置及び方法
JPH11120185A (ja) * 1997-10-09 1999-04-30 Canon Inc 情報処理装置及びその方法
JPH11232275A (ja) 1998-02-10 1999-08-27 Oki Electric Ind Co Ltd 自然言語翻訳装置
JP4149555B2 (ja) 1998-03-23 2008-09-10 ブラザー工業株式会社 機械翻訳装置及び機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体
GB2348520B (en) * 1999-03-31 2003-11-12 Ibm Assisting user selection of graphical user interface elements
US6426761B1 (en) * 1999-04-23 2002-07-30 Internation Business Machines Corporation Information presentation system for a graphical user interface
JP2002091966A (ja) 2000-07-10 2002-03-29 Fujitsu Ltd 機械翻訳装置、機械翻訳プログラムを記録したコンピュータ読み取り可能な記録媒体及びコンピュータ・プログラム
EP1205843A3 (en) * 2000-11-13 2004-10-20 Canon Kabushiki Kaisha User interfaces
US20020173946A1 (en) * 2001-03-28 2002-11-21 Christy Samuel T. Translation and communication of a digital message using a pivot language
US7752572B1 (en) * 2002-12-16 2010-07-06 Sap Ag Method of grouping objects in a graphical user interface
US7627817B2 (en) * 2003-02-21 2009-12-01 Motionpoint Corporation Analyzing web site for translation
US7328409B2 (en) * 2003-04-17 2008-02-05 International Business Machines Corporation Method, system, and computer program product for user customization of menu items
JP3863507B2 (ja) 2003-06-30 2006-12-27 株式会社東芝 コミュニケーション支援装置、コミュニケーション支援方法及びプログラム
JP3785439B2 (ja) 2004-04-30 2006-06-14 株式会社ソノテック 自然言語処理装置とその自然言語処理方法、及び自然言語処理プログラム
US7703036B2 (en) * 2004-08-16 2010-04-20 Microsoft Corporation User interface for displaying selectable software functionality controls that are relevant to a selected object
JP4886244B2 (ja) 2005-08-19 2012-02-29 株式会社東芝 機械翻訳装置および機械翻訳プログラム
US8050519B2 (en) * 2005-12-19 2011-11-01 Olympus Corporation Image combining apparatus
US7730422B2 (en) * 2006-01-25 2010-06-01 Microsoft Corporation Smart icon placement across desktop size changes
US20080163119A1 (en) * 2006-12-28 2008-07-03 Samsung Electronics Co., Ltd. Method for providing menu and multimedia device using the same
US20080172637A1 (en) * 2007-01-15 2008-07-17 International Business Machines Corporation Method and system for using image globalization in dynamic text generation and manipulation
US8533601B2 (en) * 2007-09-06 2013-09-10 Oracle International Corporation System and method for monitoring servers of a data center
JP5791861B2 (ja) 2008-07-25 2015-10-07 シャープ株式会社 情報処理装置および情報処理方法
US20100050112A1 (en) * 2008-08-22 2010-02-25 Inventec Corporation System and method of immediate translation display
CN101667176A (zh) * 2008-09-01 2010-03-10 株式会社东芝 基于短语的统计机器翻译方法和系统
US8258947B2 (en) * 2009-09-29 2012-09-04 International Business Machines Corporation Auto-translation of source strings in global verification testing in a functional testing tool
AU2009251018C1 (en) * 2009-12-17 2013-07-25 Canon Kabushiki Kaisha Generating object representation from bitmap image
US9117453B2 (en) * 2009-12-31 2015-08-25 Volt Delta Resources, Llc Method and system for processing parallel context dependent speech recognition results from a single utterance utilizing a context database
US9465782B2 (en) * 2010-07-13 2016-10-11 Motionpoint Corporation Dynamic language translation of web site content
AU2010257298B2 (en) * 2010-12-17 2014-01-23 Canon Kabushiki Kaisha Finding text regions from coloured image independent of colours
KR20120099328A (ko) * 2011-01-18 2012-09-10 엘지전자 주식회사 적어도 하나 이상의 아이템을 북마킹 하는 네트워크 tv의 제어 방법 및 상기 네트워크 tv
US8566923B2 (en) * 2011-02-01 2013-10-22 Rockwell Automation Technologies, Inc. Enhanced organization and automatic navigation of display screens facilitating automation control
US9690770B2 (en) * 2011-05-31 2017-06-27 Oracle International Corporation Analysis of documents using rules
KR101870729B1 (ko) * 2011-09-01 2018-07-20 삼성전자주식회사 휴대용 단말기의 번역 트리구조를 이용한 번역장치 및 방법
US9216835B2 (en) * 2012-09-17 2015-12-22 Intel Corporation Translating application labels
US10084650B2 (en) * 2013-07-09 2018-09-25 Tail-f Systems AB Graphical user interface for customizing graphical representations based on registry data

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016136619A (ja) * 2011-12-28 2016-07-28 株式会社東芝 半導体発光素子
JP2016151981A (ja) * 2015-02-19 2016-08-22 富士通株式会社 学習装置、学習方法及び学習プログラム

Also Published As

Publication number Publication date
US10372827B2 (en) 2019-08-06
US20140122054A1 (en) 2014-05-01

Similar Documents

Publication Publication Date Title
JP2014089637A (ja) 画像データ中の訳し分けされるべき単語又はフレーズに対応する訳語を決定する方法、並びにそのコンピュータ及びコンピュータ・プログラム
US8675012B2 (en) Selective display of OCR&#39;ed text and corresponding images from publications on a client device
US8869023B2 (en) Conversion of a collection of data to a structured, printable and navigable format
JP2007164648A (ja) 類似画像検索装置、類似画像検索方法、プログラム及び情報記録媒体
JP2012059248A (ja) フォーム・フィールドを検出および生成するシステム、方法およびプログラム
JP5689402B2 (ja) 文章を編集するための方法、並びにその装置及びコンピュータ・プログラム
US20130036113A1 (en) System and Method for Automatically Providing a Graphical Layout Based on an Example Graphic Layout
JP2009169536A (ja) 情報処理装置、画像形成装置、ドキュメント生成方法、ドキュメント生成プログラム
US8755091B2 (en) Method for adding scan data to computer work area
US9881001B2 (en) Image processing device, image processing method and non-transitory computer readable recording medium
JP2014056503A (ja) 多言語環境でのコミュニケーションに適する非テキスト要素を特定するためのコンピュータ実装方法、プログラム、および、システム
JP5430312B2 (ja) データ処理装置、データ名生成方法及びコンピュータプログラム
JP2008129793A (ja) 文書処理システムおよび装置および方法、およびプログラムを記録した記録媒体
JP6262708B2 (ja) 深い検索性を有するオブジェクト化及びハードコピーからオリジナルの電子ファイルを検出するドキュメント検出方法
JP2008040753A (ja) 画像処理装置、方法、プログラムおよび記録媒体
JP5959072B2 (ja) 入力文字列に関連付けられた変換候補を表示する方法、その電子装置及びサーバ・コンピュータ、並びに電子装置用プログラム及びサーバ・コンピュータ用プログラム
JP2002169637A (ja) ドキュメント表示態様変換装置、ドキュメント表示態様変換方法、記録媒体
JP6601143B2 (ja) 印刷装置
JP5721052B2 (ja) 画像処理装置およびプログラム
JP5389880B2 (ja) 電子ブック処理装置、電子ブック処理方法、およびプログラム
JPWO2004107203A1 (ja) 対訳文対応付け装置
JP5202598B2 (ja) ワークフロー管理装置、及びワークフロー管理プログラム
JP2007087197A (ja) 文書処理装置、文書処理方法およびプログラム
JP2016085681A (ja) 特許書類品質検査装置、特許書類品質検査方法、およびプログラム
JP6192603B2 (ja) 文書処理装置および文書処理プログラム