JP6746947B2 - 翻訳プログラム及び情報処理装置 - Google Patents

翻訳プログラム及び情報処理装置 Download PDF

Info

Publication number
JP6746947B2
JP6746947B2 JP2016034460A JP2016034460A JP6746947B2 JP 6746947 B2 JP6746947 B2 JP 6746947B2 JP 2016034460 A JP2016034460 A JP 2016034460A JP 2016034460 A JP2016034460 A JP 2016034460A JP 6746947 B2 JP6746947 B2 JP 6746947B2
Authority
JP
Japan
Prior art keywords
text
image
translated
display area
sentence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016034460A
Other languages
English (en)
Other versions
JP2017151786A (ja
Inventor
透 大塚
透 大塚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2016034460A priority Critical patent/JP6746947B2/ja
Priority to US15/211,562 priority patent/US20170249301A1/en
Publication of JP2017151786A publication Critical patent/JP2017151786A/ja
Application granted granted Critical
Publication of JP6746947B2 publication Critical patent/JP6746947B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/51Translation evaluation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Description

本発明は、翻訳プログラム及び情報処理装置に関する。
従来の技術として、翻訳される原文と翻訳結果である訳文を対訳表示する情報処理装置が提案されている(例えば、特許文献1参照)。
特許文献1に開示された情報処理装置は、ひとまとまりの文章を識別するための文番号を表示する文番号ウインドウと、文番号ウインドウで選択された文番号に該当する日本語の原文を表示する日本語原文ウインドウと、日本語原文ウインドウに表示された日本語の原文を翻訳した結果である英語の訳文を表示する英語訳文ウインドウとを有し、文番号を選択されることで対応する原文と訳文とを対訳表示する。
特開2006−127270号公報
画像から原文となるテキストを抽出して翻訳し、その訳文が適切か否か確認する際、該訳文が画像中のどこの原文に対する訳文なのかを、ユーザーはまず把握する必要がある。
従って、本発明の目的は、画像から原文となるテキストを抽出して翻訳し、訳文を表示する場合に、画像中の抽出箇所、原文及び訳文の対応関係を提示する翻訳プログラム及び情報処理装置を提供することにある。
本発明の一態様は、上記目的を達成するため、以下の翻訳プログラム及び情報処理装置を提供する。
[1]コンピュータを、
受け付けた画像情報からテキストの画像が含まれる全ての領域を抽出して得られた前記テキストの画像を前記テキストの画像の数に依らず1つの第1表示領域に表示し、前記テキストの画像を文字認識し翻訳して得られた訳文を前記訳文の数に依らず前記第1表示領域とは異なる1つの第2表示領域に表示するとともに、前記領域がフレーズ単位で抽出された場合であっても、対応関係にある前記テキストの画像及び前記訳文を横方向又は縦方向に出現順に配置することで前記テキストの画像と前記訳文との対応関係がわかるように前記第1表示領域及び前記第2表示領域を同一の画面に表示する表示制御手段として機能させるための翻訳プログラム。
]受け付けた画像情報からテキストの画像が含まれる全ての領域を抽出して得られた前記テキストの画像を前記テキストの画像の数に依らず1つの第1表示領域に表示し、前記テキストの画像を文字認識し翻訳して得られた訳文を前記訳文の数に依らず前記第1表示領域とは異なる1つの第2表示領域に表示するとともに、前記領域がフレーズ単位で抽出された場合であっても、対応関係にある前記テキストの画像及び前記訳文を横方向又は縦方向に配置することで前記テキストの画像と前記訳文との対応関係がわかるように前記第1表示領域及び前記第2表示領域を同一の画面に表示する表示制御手段を有する情報処理装置。
請求項1又はに係る発明によれば、画像から原文となるテキストを抽出して翻訳し、訳文を表示する場合に、画像中の抽出箇所、テキストの画像及び訳文の対応関係を提示することができる。
図1は、実施の形態に係る情報処理装置の構成例を示すブロック図である。 図2は、文書の翻訳を受け付ける際に表示する画面の構成の一例を示す概略図である。 図3は、文書受付手段が受け付けた画像情報の構成の一例を示す概略図である。 図4は、テキスト領域抽出手段が抽出したテキスト領域の例を示す概略図である。 図5は、原文訳文対照情報の構成例を示す表である。 図6は、表示制御手段によって表示される画面の構成例を示す概略図である。 図7は、情報処理装置の動作例を示すフローチャートである。 図8は、表示制御手段によって表示される画面の構成の他の例を示す概略図である。
[実施の形態]
(情報処理装置の構成)
図1は、実施の形態に係る情報処理装置の構成例を示すブロック図である。
情報処理装置1は、CPU(Central Processing Unit)等から構成され、各部を制御するとともに、各種のプログラムを実行する制御部10と、フラッシュメモリ等の記憶媒体から構成され情報を記憶する記憶部11と、ネットワークを介して外部と通信する通信部12とを備える。
制御部10は、後述する翻訳プログラム110を実行することで、文書受付手段100、テキスト領域抽出手段101、テキスト認識手段102、翻訳手段103、及び表示制御手段104等として機能する。
文書受付手段100は、通信部12を介して外部から文書情報を受け付ける。なお、文書情報は文字や画像を含んだ印刷物をスキャンした画像情報又は文字や画像を含んだ画像情報である。
テキスト領域抽出手段101は、文書受付手段100が受け付けた画像情報にテキストが含まれる場合にテキストが配置された領域をテキスト領域として抽出する。なお、テキスト領域抽出手段101は、抽出したテキスト領域の座標、高さ及び幅を原文訳文対照情報111に登録する。
テキスト認識手段102は、テキスト領域抽出手段101が抽出したテキスト領域に含まれるテキストをOCR等の技術により認識し、テキスト情報を生成する。また、テキスト認識手段102は、生成したテキスト情報を原文として原文訳文対照情報111に登録する。
翻訳手段103は、テキスト認識手段102が生成したテキスト情報を原文とし、他の言語へ翻訳して訳文を生成する。また、翻訳手段103は、生成した訳文を原文訳文対照情報111に登録する。
表示制御手段104は、操作用の画面を表示したり、原文訳文対照情報111を参照したりして、受け付けた画像情報と、原文と、訳文とを対応付けて表示する。
記憶部11は、制御部10を上述した各手段100−104として動作させる翻訳プログラム110、原文訳文対照情報111等を記憶する。
また、情報処理装置1は、通信部12を介して図示しない端末等にネットワークを介して接続され、端末の要求に応じて動作し、動作結果を端末に送信する。端末は動作結果を受信して後述する画面を表示部に表示する。
(情報処理装置の動作)
次に、本実施の形態の作用を説明する。
まず、利用者は図示しない端末を操作して情報処理装置1にアクセスし、文書の翻訳を要求する。
情報処理装置1は、端末から要求を受け付けて、以下に示す画面を端末の表示部に表示させる。
図2は、文書の翻訳を受け付ける際に表示する画面の構成の一例を示す概略図である。
画面104aは、原文の言語を選択するための選択欄104aと、訳文の言語を選択するための選択欄104aと、翻訳する文書を選択するための選択欄104aと、翻訳対象とする文書のページを選択する選択欄104aと、翻訳の実行又はキャンセルを行うためのボタン104aとを有する。
利用者は、原文の言語を選択欄104aで選択し、訳文となる言語を選択欄104aで選択し、対象となる文書情報を選択欄104aで指定して、ページを選択欄104aで選択した後、翻訳を実行するボタン104aを押下する。
図7は、情報処理装置1の動作例を示すフローチャートである。
まず、文書受付手段100は、選択欄104aで指定された文書情報を受け付ける(S1)。文書情報は、例えば、以下に示すような画像情報である。
図3は、文書受付手段100が受け付けた画像情報の構成の一例を示す概略図である。
画像情報100aは、「5.Correlation of diagram of seller and buyer」と記載されたタイトル部と、「Key Issue」及び「environment」の項目からなる表組部とを有する。
次に、テキスト領域抽出手段101は、文書受付手段100が受け付けた画像情報100aの1ページ目から(S2)、テキストが配置された領域をテキスト領域として抽出する(S3)。なお、テキスト領域の抽出には文書のレイアウト構造認識等の技術を用いる。
図4は、テキスト領域抽出手段101が抽出したテキスト領域の例を示す概略図である。
テキスト領域101a、101a、…、101a10…101a15は、画像情報100aからテキスト領域抽出手段101によって抽出された領域である。テキスト領域101a10…101a15のように、単語単位やフレーズ単位で抽出されるべきであるが、テキスト領域101a、101a、…のように文字単位で抽出される場合もある。
次に、テキスト認識手段102は、テキスト領域抽出手段101が抽出したテキスト領域に含まれるテキストをOCR等の技術により認識し(S4)、テキスト情報を生成する。
次に、翻訳手段103は、テキスト認識手段102が生成した文字、単語、フレーズ、文や文章等のテキスト情報を原文とし、当該原文を他の言語へ翻訳して訳文を生成する(S5)。
なお、テキスト領域抽出手段101は抽出したテキスト領域の座標、高さ及び幅を、テキスト認識手段102は生成したテキスト情報を、翻訳手段103は生成した訳文を原文訳文対照情報111に登録する(S6)。
図5は、原文訳文対照情報111の構成例を示す表である。
原文訳文対照情報111は、テキスト領域中の画像を文字認識した結果である原文と、原文を翻訳した訳文と、テキスト領域の座標、幅及び高さと、テキスト領域に含まれるテキストの画像とを有する。図5に示すように、テキストの画像が影付き文字のような場合、「C」が「@」と誤って文字認識される場合もあり、利用者は原文や訳文だけを確認しても、画像中のいずれの文字の認識結果か判別できない場合がある。
上記したステップS3−S6は、文書情報のすべてのページについて繰り返される(S7、S8)。
次に、表示制御手段104は、原文訳文対照情報111を参照して、受け付けた画像情報と、原文と、訳文とを対応付けて表示する(S9)。
図6は、表示制御手段104によって表示される画面の構成例を示す概略図である。
画面104bは、受け付けた画像情報及び抽出したテキスト領域を表示する文書表示領域104bと、原文及び訳文を対にして表示する翻訳結果表示領域104bと、文書情報のページが複数ある場合にページを切り替えるためのページ切替ボタン104bと、画面104bの表示を終了するためのOKボタン104bと、画像情報のテキスト領域を選択することで表示される選択枠104bと、原文及び訳文の対を選択することで表示される選択枠104bとを有する。
選択枠104bと選択枠104bは、一方を選択することで対応する他方が自動的に選択される。つまり、画像中のテキスト領域を選択枠104bで選択すれば、利用者は、当該テキスト領域に含まれるテキストがどのような文字として認識され、その認識結果がどのように翻訳されたのかがわかる。また、原文及び訳文を選択枠104bで選択すれば、利用者は、当該原文及び訳文が画像中のいずれのテキスト領域に含まれるテキストであるのかがわかる。
テキスト領域と、当該テキスト領域に対応する原文及び訳文の対とに、共通する符号を付して対応関係を示してもよいし、共通する色の枠や矢印を付して対応関係を示すものであってもよい。
(実施の形態の効果)
上記した実施の形態によれば、画像からテキストを抽出した領域であるテキスト領域と、原文及び訳文との対応を、選択枠を用いて対応表示するようにしたため、画像中の抽出箇所、原文及び訳文の対応関係を提示することができる。つまり、テキスト領域の抽出箇所が誤っている、又はテキスト認識の結果が誤ったものであっても、画像中のいずれのテキスト領域から抽出した原文及び訳文であるかを利用者が認識でき、原文及び訳文の編集時に、誤った文字列を編集してしまう頻度を抑制することができる。
[他の実施の形態]
なお、本発明は、上記実施の形態に限定されず、本発明の趣旨を逸脱しない範囲で種々な変形が可能である。例えば、図6に示した文書表示領域104bを省略し、以下の図8に示すように、テキスト領域に含まれる画像を、原文及び訳文と対にして表示するようにしてもよい。
図8は、表示制御手段104によって表示される画面の構成の他の例を示す概略図である。
画面104cは、テキスト領域に含まれる画像を示すテキスト領域104cと、テキスト領域から認識されたテキストを示す原文104cと、原文を翻訳した訳文を示す訳文104cと、文書情報のページが複数である場合にページを切り替えるためのページ切替ボタン104cと、画面104cの表示を終了するためのOKボタン104cとを有する。
上記実施の形態では制御部10の各手段100〜104の機能をプログラムで実現したが、各手段の全て又は一部をASIC等のハードウエアによって実現してもよい。また、上記実施の形態で用いたプログラムをCD−ROM等の記録媒体に記憶して提供することもできる。また、上記実施の形態で説明した上記ステップの入れ替え、削除、追加等は本発明の要旨を変更しない範囲内で可能である。
1 情報処理装置
10 制御部
11 記憶部
12 通信部
100 文書受付手段
101 テキスト領域抽出手段
102 テキスト認識手段
103 翻訳手段
104 表示制御手段
110 翻訳プログラム
111 原文訳文対照情報

Claims (2)

  1. コンピュータを、
    受け付けた画像情報からテキストの画像が含まれる全ての領域を抽出して得られた前記テキストの画像を前記テキストの画像の数に依らず1つの第1表示領域に表示し、前記テキストの画像を文字認識し翻訳して得られた訳文を前記訳文の数に依らず前記第1表示領域とは異なる1つの第2表示領域に表示するとともに、前記領域がフレーズ単位で抽出された場合であっても、対応関係にある前記テキストの画像及び前記訳文を横方向又は縦方向に出現順に配置することで前記テキストの画像と前記訳文との対応関係がわかるように前記第1表示領域及び前記第2表示領域を同一の画面に表示する表示制御手段として機能させるための翻訳プログラム。
  2. 受け付けた画像情報からテキストの画像が含まれる全ての領域を抽出して得られた前記テキストの画像を前記テキストの画像の数に依らず1つの第1表示領域に表示し、前記テキストの画像を文字認識し翻訳して得られた訳文を前記訳文の数に依らず前記第1表示領域とは異なる1つの第2表示領域に表示するとともに、前記領域がフレーズ単位で抽出された場合であっても、対応関係にある前記テキストの画像及び前記訳文を横方向又は縦方向に配置することで前記テキストの画像と前記訳文との対応関係がわかるように前記第1表示領域及び前記第2表示領域を同一の画面に表示する表示制御手段を有する情報処理装置。
JP2016034460A 2016-02-25 2016-02-25 翻訳プログラム及び情報処理装置 Active JP6746947B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2016034460A JP6746947B2 (ja) 2016-02-25 2016-02-25 翻訳プログラム及び情報処理装置
US15/211,562 US20170249301A1 (en) 2016-02-25 2016-07-15 Information processing apparatus, information processing method, and non-transitory computer readable medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016034460A JP6746947B2 (ja) 2016-02-25 2016-02-25 翻訳プログラム及び情報処理装置

Publications (2)

Publication Number Publication Date
JP2017151786A JP2017151786A (ja) 2017-08-31
JP6746947B2 true JP6746947B2 (ja) 2020-08-26

Family

ID=59678494

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016034460A Active JP6746947B2 (ja) 2016-02-25 2016-02-25 翻訳プログラム及び情報処理装置

Country Status (2)

Country Link
US (1) US20170249301A1 (ja)
JP (1) JP6746947B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11593570B2 (en) * 2019-04-18 2023-02-28 Consumer Ledger, Inc. System and method for translating text
CN115543495A (zh) * 2021-06-30 2022-12-30 腾讯科技(深圳)有限公司 界面管理方法、装置、设备及可读存储介质

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0756924A (ja) * 1993-06-30 1995-03-03 Ricoh Co Ltd 対訳装置
JP2002230480A (ja) * 2001-01-30 2002-08-16 Toshiba Corp 文字認識装置および文字認識結果修正方法
JP2003016065A (ja) * 2002-04-01 2003-01-17 Ricoh Co Ltd 対訳画像形成装置
JP2005135210A (ja) * 2003-10-31 2005-05-26 Hitachi Ltd 文字認識機能を有する携帯機器
CN1697515A (zh) * 2004-05-14 2005-11-16 创新科技有限公司 字幕翻译引擎
US9262409B2 (en) * 2008-08-06 2016-02-16 Abbyy Infopoisk Llc Translation of a selected text fragment of a screen
US9064191B2 (en) * 2012-01-26 2015-06-23 Qualcomm Incorporated Lower modifier detection and extraction from devanagari text images to improve OCR performance
US9087046B2 (en) * 2012-09-18 2015-07-21 Abbyy Development Llc Swiping action for displaying a translation of a textual image
US9411801B2 (en) * 2012-12-21 2016-08-09 Abbyy Development Llc General dictionary for all languages
US9582913B1 (en) * 2013-09-25 2017-02-28 A9.Com, Inc. Automated highlighting of identified text
JP5586772B1 (ja) * 2013-11-22 2014-09-10 株式会社バイトルヒクマ 翻訳システム及び翻訳プログラム、並びに翻訳方法

Also Published As

Publication number Publication date
US20170249301A1 (en) 2017-08-31
JP2017151786A (ja) 2017-08-31

Similar Documents

Publication Publication Date Title
EP2637128B1 (en) Multimodal text input by a keyboard/camera text input module replacing a conventional keyboard text input module on a mobile device
CN110188365B (zh) 一种取词翻译的方法和装置
JP2016519797A (ja) 外国語の文字セットおよびそれらの翻訳を資源に制約のあるモバイル機器上にリアルタイムで表示するためのシステムおよび方法
EP3522038A1 (en) Method for translating characters and apparatus therefor
US20140298164A1 (en) Electronic book production apparatus, electronic book system, electronic book production method, and non-transitory computer-readable medium
JP2006276914A (ja) 翻訳処理方法、文書処理装置およびプログラム
KR20120069699A (ko) 정보 표시 장치
US11363217B2 (en) Subtitle generation apparatus, subtitle generation method, and non-transitory storage medium
JP6746947B2 (ja) 翻訳プログラム及び情報処理装置
JP2022055305A (ja) テキスト要約を生成するテキスト処理方法、装置、デバイス及び記憶媒体
JPH09138802A (ja) 文字認識翻訳システム
JP2006276905A (ja) 翻訳装置、画像処理装置、画像形成装置、翻訳方法及びプログラム
US11593570B2 (en) System and method for translating text
JP7098897B2 (ja) 画像処理装置、プログラム及び画像データ
JP2017151768A (ja) 翻訳プログラム及び情報処理装置
US20210182477A1 (en) Information processing apparatus and non-transitory computer readable medium storing program
US20210042555A1 (en) Information Processing Apparatus and Table Recognition Method
JPH05108716A (ja) 機械翻訳装置
JP6408055B2 (ja) 情報処理装置、方法及びプログラム
JP2018055256A (ja) 情報処理装置、情報処理方法及びプログラム
JP6822261B2 (ja) 情報処理装置、プログラムおよび情報処理方法
JP5604276B2 (ja) 文書画像生成装置および文書画像生成方法
JP2008004116A (ja) 映像中の文字検索方法及び装置
CN109522437A (zh) 一种纸质文件的信息搜索方法、装置、存储介质及终端
JP6203083B2 (ja) 未知語抽出装置及び未知語抽出方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20181221

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190621

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190723

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190918

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20190918

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200212

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200323

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200707

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200720

R150 Certificate of patent or registration of utility model

Ref document number: 6746947

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350