JP4626777B2 - 情報処理装置及び情報処理プログラム - Google Patents
情報処理装置及び情報処理プログラム Download PDFInfo
- Publication number
- JP4626777B2 JP4626777B2 JP2008065504A JP2008065504A JP4626777B2 JP 4626777 B2 JP4626777 B2 JP 4626777B2 JP 2008065504 A JP2008065504 A JP 2008065504A JP 2008065504 A JP2008065504 A JP 2008065504A JP 4626777 B2 JP4626777 B2 JP 4626777B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- recognized
- translation
- feature
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/53—Processing of non-Latin text
Description
本発明は、かかる課題を解決するようにした情報処理装置及び情報処理プログラムを提供することを目的としている。
請求項1の発明は、画像内の文字画像領域を抽出する領域抽出手段と、前記領域抽出手段によって抽出された文字画像領域内の文字を行ごとに認識する文字認識手段と、画像を文字認識した場合に認識文字として出力される文字と、文字画像領域でない画像を文字認識した可能性を示す点数とを対応させて記憶する記憶手段と、前記文字認識手段によって認識された結果である認識文字に対応する点数を前記記憶手段を参照して取得し、該取得した点数によって行ごとの文字列の点数を算出し、該算出した点数から予め定めた文字数あたりの点数を算出し、該点数を認識文字の特徴として取得する認識文字特徴取得手段と、前記認識文字特徴取得手段によって取得された特徴と閾値との比較によって、前記認識文字を翻訳すべきか否かを判断する翻訳判断手段と、前記翻訳判断手段によって翻訳すべきと判断された場合に、前記認識文字を翻訳する翻訳手段を具備することを特徴とする情報処理装置である。
請求項8の発明は、コンピュータを、画像内の文字を認識する文字認識手段と、前記文字認識手段によって認識された結果である認識文字の特徴を取得する認識文字特徴取得手段と、前記認識文字特徴取得手段によって取得された特徴に基づいて、前記認識文字を翻訳すべきか否かを判断する翻訳判断手段と、前記翻訳判断手段によって翻訳すべきと判断された場合に、前記認識文字を翻訳する翻訳手段として機能させ、前記認識文字特徴取得手段は、認識文字の特徴として、認識文字内に含まれているその言語における単語の数、認識文字数に対してのその言語における単語を構成している文字数の割合、又は行毎の認識文字数を取得し、前記翻訳判断手段は、前記認識文字の特徴と閾値との比較によって、前記認識文字を翻訳すべきか否かを判断することを特徴とする情報処理プログラムである。
請求項9の発明は、コンピュータを、画像内の文字を認識する文字認識手段と、前記文字認識手段によって認識された結果である認識文字の特徴として、認識文字の大きさを取得する認識文字特徴取得手段と、前記認識文字特徴取得手段によって取得された文字の大きさが所定の範囲内の偏差に収まっているか否かによって、前記認識文字を翻訳すべきか否かを判断する翻訳判断手段と、前記翻訳判断手段によって翻訳すべきと判断された場合に、前記認識文字を翻訳する翻訳手段として機能させることを特徴とする情報処理プログラムである。
請求項10の発明は、コンピュータを、画像内の画像領域として、文字画像領域と文字画像領域以外の領域を抽出する領域抽出手段と、前記領域抽出手段によって抽出された文字画像領域内の文字を認識する文字認識手段と、前記文字認識手段によって認識された結果である認識文字の特徴を取得する認識文字特徴取得手段と、前記認識文字特徴取得手段によって取得された特徴に基づいて、前記認識文字を翻訳すべきか否かを判断する翻訳判断手段と、前記翻訳判断手段によって翻訳すべきと判断された場合に、前記認識文字を翻訳する翻訳手段として機能させ、前記認識文字特徴取得手段は、前記領域抽出手段によって抽出された画像領域を用いて、認識文字の特徴として、認識対象の文字画像領域に隣接している画像領域の種類を取得し、前記翻訳判断手段は、前記認識対象に隣接している画像領域の種類が文字画像領域の場合は、翻訳すべきと判断することを特徴とする情報処理プログラムである。
請求項8の情報処理プログラムによれば、画像内の文字を認識して翻訳させる場合にあって、文字以外の画像領域を文字として認識して翻訳させることを抑制することができる。
請求項9の情報処理プログラムによれば、画像内の文字を認識して翻訳させる場合にあって、文字以外の画像領域を文字として認識して翻訳させることを抑制することができる。
請求項10の情報処理プログラムによれば、画像内の文字を認識して翻訳させる場合にあって、文字以外の画像領域を文字として認識して翻訳させることを抑制することができる。
図1は、本実施の形態の構成例についての概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア(コンピュータ・プログラム)、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはコンピュータ・プログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、コンピュータ・プログラム、システム及び方法の説明をも兼ねている。ただし、説明の都合上、「記憶する」、「記憶させる」、これらと同等の文言を用いるが、これらの文言は、実施の形態がコンピュータ・プログラムの場合は、記憶装置に記憶させる、又は記憶装置に記憶させるように制御するの意である。また、モジュールは機能にほぼ一対一に対応しているが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。なお、1つのモジュールに他のモジュールが含まれていてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続(データの授受、指示、データ間の参照関係等)を含む。
また、システム又は装置とは、複数のコンピュータ、ハードウェア、装置等がネットワーク(一対一対応の通信接続を含む)等の通信手段で接続されて構成されるほか、1つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。「装置」と「システム」とは、互いに同義の用語として用いる。
画像受付モジュール110〜文字認識モジュール125の処理例については、図8〜10等を用いて後述する。
例えば、文字以外の画像を認識した場合の認識文字を含んでいることに関する特徴を取得するようにしてもよい。
また、例えば、文字以外の画像を認識した場合の認識文字の並びに関する特徴を取得するようにしてもよい。
また、例えば、認識文字の所定文字数あたりの特徴を取得するようにしてもよい。
認識文字特徴取得モジュール130によって取得された特徴に基づいて、認識文字を翻訳すべきか否かを判断し、その結果を翻訳モジュール140へ渡す。
認識文字特徴取得モジュール130、翻訳判断モジュール135の処理例については、図4〜6等を用いて後述する。
翻訳判断モジュール135によって翻訳すべきと判断された場合に、文字認識モジュール125による認識文字であって翻訳すべきと判断されたものを翻訳し、翻訳文を訳文特徴取得モジュール145へ渡す。翻訳とは、第1の言語を別の第2の言語で意味として対応するものに変換することであり、既存の方法を用いるようにしてよい。
翻訳モジュール140によって翻訳された結果である翻訳結果の特徴を取得し、その翻訳結果の特徴を出力判断モジュール150へ渡す。
訳文特徴取得モジュール145は、翻訳文内にその言語における単語を含むことに関する情報を取得するようにしてもよい。具体的には、その言語における単語を記憶している辞書(文字認識モジュール125又は翻訳モジュール140が用いる辞書を流用してもよい)を用意し、翻訳文内にその辞書に記憶されている単語がいくつ含まれているかを取得する。例えば、出力判断モジュール150は、所定の閾値と比較して、含まれている単語数が多い場合は、出力要と判断するようにしてもよい。
また、訳文特徴取得モジュール145は、翻訳文の構文解析を行い、その構文解析結果を取得するようにしてもよい。例えば、出力判断モジュール150は、正当な構文解析結果である場合は、出力要と判断するようにしてもよい。
また、訳文特徴取得モジュール145は、前述した翻訳文の複数の特徴を抽出するようにしてもよい。
訳文特徴取得モジュール145によって取得された特徴に基づいて、翻訳文を出力すべきか否かを判断し、その結果を出力モジュール155へ渡す。
また、訳文特徴取得モジュール145が、前述した翻訳文の複数の特徴を抽出するようにした場合、出力判断モジュール150は、複数の特徴を組み合わせて判断するようにしてもよい。その場合、特徴に対して重み付けを行うようにしてもよい。
出力モジュール155の処理例については、図7を用いて後述する。
ステップS204では、領域抽出モジュール115が、ステップS202で受け付けられた画像から文字画像領域を抽出する。
ステップS206では、行抽出モジュール120が、ステップS204で抽出された文字画像領域から文字行を抽出する。ここで、行抽出モジュール120は処理テーブル300に対して、抽出した文字行を順にNo.欄302にその順番を記憶させ、その文字行の左上のx座標をx座標欄304に、y座標をy座標欄306に、文字行の高さを高さ欄308に、文字行の幅を幅欄310にそれぞれ記憶させる。
ステップS208では、文字認識モジュール125が、ステップS206で抽出された文字行を対象として文字認識処理を行う。そして、処理テーブル300内の文字認識結果欄312に認識文字を記憶させる。
ステップS212では、翻訳判断モジュール135が、ステップS210で取得された特徴に基づいて、その認識文字は翻訳対象とすべきか否かを判断する。その文字行を翻訳不要と判断した場合(Y)はステップS214へ進み、それ以外の場合(N)はステップS216へ進む。そして、翻訳判断モジュール135が、ステップS214では対応する翻訳要否欄314に「N」を記憶させ、ステップS216では対応する翻訳要否欄314に「Y」を記憶させる。なお、ステップS210〜ステップS216の処理例については、図4〜6等を用いて後述する。
ステップS218では、ステップS206で抽出した全ての文字行に対して、ステップS212の判断処理が完了したか否かを判断する。完了していない場合(N)はステップS210へ戻り、完了している場合(Y)はステップS220へ進む。
ステップS222では、訳文特徴取得モジュール145が、ステップS220での翻訳文の特徴を取得する。つまり、翻訳結果欄316内の文字を対象として、文字行毎にその特徴を抽出する。
ステップS224では、出力判断モジュール150が、ステップS222で取得された特徴に基づいて、その翻訳文は有意か否か、つまり出力対象とすべきか否かを判断する。その文字行を有意と判断した場合(Y)はステップS226へ進み、それ以外の場合(N)はステップS228へ進む。そして、出力判断モジュール150が、ステップS226では対応する出力要否欄318に「Y」を記憶させ、ステップS228では対応する出力要否欄318に「N」を記憶させる。
ステップS230では、ステップS206で抽出した全ての文字行に対して、ステップS224の判断処理が完了したか否かを判断する。完了していない場合(N)はステップS222へ戻り、完了している場合(Y)はステップS232へ進む。
ステップS232では、出力モジュール155が出力すべき翻訳文が確定し、出力モジュール155がステップS202で受け付けられた画像の構成に応じて、翻訳文を出力する。
図5を用いて、ポイント設定テーブル500の例を説明する。ポイント設定テーブル500では、ポイントを3段階(ポイント:3、ポイント:2、ポイント:1)に分けている。つまり、文字画像領域でない画像を文字認識した場合に、頻繁に認識文字として出力される「−」、「一」、「1」、「I」等を3ポイントとし、1文字領域内に「トン」の文字があるもの、「ノ」、「レ」、「{」等を2ポイントとし、それ以外の文字を1ポイントと定めたものである。つまり、ポイント設定テーブル500は、ポイント数と文字を対応させて記憶したものである。そして、認識処理の各言語毎(例えば、日本語用、中国用、韓国語用、英語用等)にその文字を記憶させておく。
文字認識結果欄312内の各文字が、ポイント設定テーブル500内のどのポイント数に該当する文字であるかを取得することによって、各文字のポイントを取得する。
図6を用いて、重み付け設定テーブル600の例を説明する。重み付け設定テーブル600は、重み付けの係数とその係数が適用される状況を示したルールを対応させて記憶したものである。例えば、「ポイント:2又はポイント:3の特定の文字の組み合わせ(その文字行の方向でn文字以上並んでいる)」である状況(具体例として、「一一」等)の場合は、その文字のポイント数を4倍する。また、「ポイント:2又はポイント:3の文字がn文字以上並んでいる」状況の場合は、その文字のポイント数を2倍にする等である。
文字認識結果欄312内の文字の並びが、重み付け設定テーブル600内のルールに該当するかによって重み付け係数を決定する。
ステップS406では、ステップS402で取得されたポイント数、ステップS404で決定された重み付け係数に基づいて、各文字行のポイント数を計算する。
ステップS408では、その行内の文字数にポイント数が左右されないようにするために、文字認識結果欄312内の文字数を計数し、ステップS406で計算されたポイント数を除算して文字あたりの平均ポイント数を計算する。
なお、ステップS402〜ステップS408は認識文字特徴取得モジュール130によって行われる。ステップS410〜ステップS414は翻訳判断モジュール135によって行われ、図2に示すフローチャートにおけるステップS212〜ステップS216に対応する。
また、認識文字特徴取得モジュール130は、文字認識モジュール125が出力する行毎の認識文字数を取得するようにしてもよい。例えば、翻訳判断モジュール135は、所定の閾値と比較して文字数が少ない行は、翻訳不要と判断するようにしてもよい。
また、認識文字特徴取得モジュール130は、対象とする行が隣接している画像領域の種類(文字画像領域、文字画像領域以外の画像領域等)に関する情報を取得するようにしてもよい。例えば、翻訳判断モジュール135は、対象としている行の画像領域が文字画像領域に囲まれている場合は、翻訳要と判断するようにしてもよい。
また、認識文字特徴取得モジュール130は、認識文字の構文解析を行い、その構文解析結果を取得するようにしてもよい。例えば、翻訳判断モジュール135は、正当な構文解析結果である場合は、翻訳要と判断するようにしてもよい。
また、認識文字特徴取得モジュール130は、前述した認識文字の複数の特徴を抽出するようにしてもよい。そして、翻訳判断モジュール135は、複数の特徴を組み合わせて判断するようにしてもよい。その場合、特徴に対して重み付けを行うようにしてもよい。
画像受付モジュール110が例えばオリジナル原稿700を受け付ける。オリジナル原稿700は、文章領域702、文章領域704、画像領域706、画像領域708を有している。文章領域702、704は、文字認識モジュール125による文字認識の対象、そして翻訳モジュール140による翻訳の対象になる。また、画像領域706、708は、領域抽出モジュール115によって文字画像領域ではないと判断されてそのまま出力される。
画像受付モジュール110が例えばオリジナル原稿800を受け付ける。オリジナル原稿800は、画像領域801、文章領域802、文章領域803を有している。つまり、文章領域802、803は文字認識、翻訳の対象となるべきものであり、画像領域801内の文章領域802以外の領域はそのまま出力すべきものである。
さらに、領域抽出モジュール115は、2値画像810に対して、文字画像領域を抽出する。ここで、領域抽出モジュール115は、文章領域828、829を文字画像領域として抽出するが、画像領域821内の文章領域826、827も文字画像領域として抽出してしまう。これは、自然画等の多値画像を2値化した場合、文字画像領域の特徴を備えているような領域が発生してしまうことによるものである。
この結果(文章領域826〜829を文字画像領域として抽出)のまま、行抽出モジュール120、文字認識モジュール125によって処理を行わせると、文章領域826は『レ〆』、文章領域827は『、≠ノ徴』、文章領域828は『絵柄中の文字列』、文章領域829は『本文中の文字列です。』の認識文字となってしまう。ここで、認識文字特徴取得モジュール130、翻訳判断モジュール135による処理によって、文章領域826、827の認識文字は翻訳対象とならないようにする。
画像受付モジュール110が例えば原画像900を受け付ける。原画像900には、文字画像領域がなく、そのまま出力すべきものである。
次に、領域抽出モジュール115が、原画像900に対して、2値化を行い2値画像910を生成する。領域抽出モジュール115は、2値画像910に対して、文字画像領域を抽出してしまう。
文字認識モジュール125がこの文字画像領域に対して文字認識を行うと、図9に示すような日本語文字認識結果920となる。さらに、日本語文字認識結果920を翻訳モジュール140が翻訳してしまうと、例えば、図9に示すような中国語訳930、英語訳940となってしまう。
ここで、訳文特徴取得モジュール145、出力判断モジュール150は前述に示すような処理を行い、中国語訳930、英語訳940のような翻訳文は出力させない。
図10に示す韓国語文字認識結果1010、中国語文字認識結果1020、英語文字認識結果1030は、2値画像910に対して、それぞれ韓国語、中国語、英語を対象とした文字認識モジュール125による処理結果である。
これらの認識文字は、図9に示した日本語文字認識結果920と同様の性質を有している。したがって、文字認識モジュール125が日本語以外の言語を対象としたものであっても、認識文字特徴取得モジュール130、翻訳判断モジュール135はポイント設定テーブル500、重み付け設定テーブル600等を用いることによって、前述の日本語を対象とした処理と同様の処理を行うことができる。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通などのために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD−R、DVD−RW、DVD−RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD−ROM)、CDレコーダブル(CD−R)、CDリライタブル(CD−RW)等、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去及び書換可能な読出し専用メモリ(EEPROM)、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)等が含まれる。
そして、前記のプログラム又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、あるいは無線通信ネットワーク、さらにこれらの組み合わせ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分であってもよく、あるいは別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して
記録されていてもよい。また、圧縮や暗号化など、復元可能であればどのような態様で記録されていてもよい。
115…領域抽出モジュール
120…行抽出モジュール
125…文字認識モジュール
130…認識文字特徴取得モジュール
135…翻訳判断モジュール
140…翻訳モジュール
145…訳文特徴取得モジュール
150…出力判断モジュール
155…出力モジュール
300…処理テーブル
Claims (10)
- 画像内の文字画像領域を抽出する領域抽出手段と、
前記領域抽出手段によって抽出された文字画像領域内の文字を行ごとに認識する文字認識手段と、
画像を文字認識した場合に認識文字として出力される文字と、文字画像領域でない画像を文字認識した可能性を示す点数とを対応させて記憶する記憶手段と、
前記文字認識手段によって認識された結果である認識文字に対応する点数を前記記憶手段を参照して取得し、該取得した点数によって行ごとの文字列の点数を算出し、該算出した点数から予め定めた文字数あたりの点数を算出し、該点数を認識文字の特徴として取得する認識文字特徴取得手段と、
前記認識文字特徴取得手段によって取得された特徴と閾値との比較によって、前記認識文字を翻訳すべきか否かを判断する翻訳判断手段と、
前記翻訳判断手段によって翻訳すべきと判断された場合に、前記認識文字を翻訳する翻訳手段
を具備することを特徴とする情報処理装置。 - 画像内の文字を認識する文字認識手段と、
前記文字認識手段によって認識された結果である認識文字の特徴を取得する認識文字特徴取得手段と、
前記認識文字特徴取得手段によって取得された特徴に基づいて、前記認識文字を翻訳すべきか否かを判断する翻訳判断手段と、
前記翻訳判断手段によって翻訳すべきと判断された場合に、前記認識文字を翻訳する翻訳手段
を具備し、
前記認識文字特徴取得手段は、認識文字の特徴として、認識文字内に含まれているその言語における単語の数、認識文字数に対してのその言語における単語を構成している文字数の割合、又は行毎の認識文字数を取得し、
前記翻訳判断手段は、前記認識文字の特徴と閾値との比較によって、前記認識文字を翻訳すべきか否かを判断する
ことを特徴とする情報処理装置。 - 画像内の文字を認識する文字認識手段と、
前記文字認識手段によって認識された結果である認識文字の特徴として、認識文字の大きさを取得する認識文字特徴取得手段と、
前記認識文字特徴取得手段によって取得された文字の大きさが所定の範囲内の偏差に収まっているか否かによって、前記認識文字を翻訳すべきか否かを判断する翻訳判断手段と、
前記翻訳判断手段によって翻訳すべきと判断された場合に、前記認識文字を翻訳する翻訳手段
を具備することを特徴とする情報処理装置。 - 画像内の画像領域として、文字画像領域と文字画像領域以外の領域を抽出する領域抽出手段と、
前記領域抽出手段によって抽出された文字画像領域内の文字を認識する文字認識手段と、
前記文字認識手段によって認識された結果である認識文字の特徴を取得する認識文字特徴取得手段と、
前記認識文字特徴取得手段によって取得された特徴に基づいて、前記認識文字を翻訳すべきか否かを判断する翻訳判断手段と、
前記翻訳判断手段によって翻訳すべきと判断された場合に、前記認識文字を翻訳する翻訳手段
を具備し、
前記認識文字特徴取得手段は、前記領域抽出手段によって抽出された画像領域を用いて、認識文字の特徴として、認識対象の文字画像領域に隣接している画像領域の種類を取得し、
前記翻訳判断手段は、前記認識対象に隣接している画像領域の種類が文字画像領域の場合は、翻訳すべきと判断する
ことを特徴とする情報処理装置。 - 前記翻訳手段によって翻訳された結果である翻訳結果の特徴を取得する翻訳結果特徴取得手段と、
前記翻訳結果特徴取得手段によって取得された特徴と閾値との比較によって、前記翻訳文を出力すべきか否かを判断する出力判断手段
を具備し、
前記翻訳結果特徴取得手段は、翻訳結果の特徴として、翻訳文内でのその言語における単語の数又は翻訳文の文字数に対してのその言語における単語を構成している文字数の割合を取得
することを特徴とする請求項1から4のいずれか一項に記載の情報処理装置。 - 画像を受け付ける画像受付手段と、
前記出力判断手段によって出力すべきと判断された場合に、前記画像受付手段によって受け付けられた画像内の文字の位置に基づいて、前記翻訳結果を出力する出力手段
をさらに具備し、
前記文字認識手段は、前記画像受付手段によって受け付けられた画像内の文字を認識する
ことを特徴とする請求項1から5のいずれか一項に記載の情報処理装置。 - コンピュータを、
画像内の文字画像領域を抽出する領域抽出手段と、
前記領域抽出手段によって抽出された文字画像領域内の文字を行ごとに認識する文字認識手段と、
画像を文字認識した場合に認識文字として出力される文字と、文字画像領域でない画像を文字認識した可能性を示す点数とを対応させて記憶する記憶手段と、
前記文字認識手段によって認識された結果である認識文字に対応する点数を前記記憶手段を参照して取得し、該取得した点数によって行ごとの文字列の点数を算出し、該算出した点数から予め定めた文字数あたりの点数を算出し、該点数を認識文字の特徴として取得する認識文字特徴取得手段と、
前記認識文字特徴取得手段によって取得された特徴と閾値との比較によって、前記認識文字を翻訳すべきか否かを判断する翻訳判断手段と、
前記翻訳判断手段によって翻訳すべきと判断された場合に、前記認識文字を翻訳する翻訳手段
として機能させることを特徴とする情報処理プログラム。 - コンピュータを、
画像内の文字を認識する文字認識手段と、
前記文字認識手段によって認識された結果である認識文字の特徴を取得する認識文字特徴取得手段と、
前記認識文字特徴取得手段によって取得された特徴に基づいて、前記認識文字を翻訳すべきか否かを判断する翻訳判断手段と、
前記翻訳判断手段によって翻訳すべきと判断された場合に、前記認識文字を翻訳する翻訳手段
として機能させ、
前記認識文字特徴取得手段は、認識文字の特徴として、認識文字内に含まれているその言語における単語の数、認識文字数に対してのその言語における単語を構成している文字数の割合、又は行毎の認識文字数を取得し、
前記翻訳判断手段は、前記認識文字の特徴と閾値との比較によって、前記認識文字を翻訳すべきか否かを判断する
ことを特徴とする情報処理プログラム。 - コンピュータを、
画像内の文字を認識する文字認識手段と、
前記文字認識手段によって認識された結果である認識文字の特徴として、認識文字の大きさを取得する認識文字特徴取得手段と、
前記認識文字特徴取得手段によって取得された文字の大きさが所定の範囲内の偏差に収まっているか否かによって、前記認識文字を翻訳すべきか否かを判断する翻訳判断手段と、
前記翻訳判断手段によって翻訳すべきと判断された場合に、前記認識文字を翻訳する翻訳手段
として機能させることを特徴とする情報処理プログラム。 - コンピュータを、
画像内の画像領域として、文字画像領域と文字画像領域以外の領域を抽出する領域抽出手段と、
前記領域抽出手段によって抽出された文字画像領域内の文字を認識する文字認識手段と、
前記文字認識手段によって認識された結果である認識文字の特徴を取得する認識文字特徴取得手段と、
前記認識文字特徴取得手段によって取得された特徴に基づいて、前記認識文字を翻訳すべきか否かを判断する翻訳判断手段と、
前記翻訳判断手段によって翻訳すべきと判断された場合に、前記認識文字を翻訳する翻訳手段
として機能させ、
前記認識文字特徴取得手段は、前記領域抽出手段によって抽出された画像領域を用いて、認識文字の特徴として、認識対象の文字画像領域に隣接している画像領域の種類を取得し、
前記翻訳判断手段は、前記認識対象に隣接している画像領域の種類が文字画像領域の場合は、翻訳すべきと判断する
ことを特徴とする情報処理プログラム。
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008065504A JP4626777B2 (ja) | 2008-03-14 | 2008-03-14 | 情報処理装置及び情報処理プログラム |
US12/211,543 US8751214B2 (en) | 2008-03-14 | 2008-09-16 | Information processor for translating in accordance with features of an original sentence and features of a translated sentence, information processing method, and computer readable medium |
AU2008221525A AU2008221525B2 (en) | 2008-03-14 | 2008-09-18 | Information processor, information processing method, and information processing program |
KR1020080098515A KR101248449B1 (ko) | 2008-03-14 | 2008-10-08 | 정보 처리 장치, 정보 처리 방법 및 컴퓨터 판독 가능한 기억 매체 |
CN2008101715133A CN101533392B (zh) | 2008-03-14 | 2008-10-17 | 信息处理装置及信息处理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008065504A JP4626777B2 (ja) | 2008-03-14 | 2008-03-14 | 情報処理装置及び情報処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009223477A JP2009223477A (ja) | 2009-10-01 |
JP4626777B2 true JP4626777B2 (ja) | 2011-02-09 |
Family
ID=41063991
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008065504A Expired - Fee Related JP4626777B2 (ja) | 2008-03-14 | 2008-03-14 | 情報処理装置及び情報処理プログラム |
Country Status (5)
Country | Link |
---|---|
US (1) | US8751214B2 (ja) |
JP (1) | JP4626777B2 (ja) |
KR (1) | KR101248449B1 (ja) |
CN (1) | CN101533392B (ja) |
AU (1) | AU2008221525B2 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5372110B2 (ja) * | 2011-10-28 | 2013-12-18 | シャープ株式会社 | 情報出力装置、情報出力方法、及びコンピュータプログラム |
JP5862260B2 (ja) * | 2011-12-09 | 2016-02-16 | 富士ゼロックス株式会社 | 情報処理装置及び情報処理プログラム |
CN102609408B (zh) * | 2012-01-11 | 2014-11-26 | 清华大学 | 基于多文种文档图像识别的跨文种理解方法 |
US9411801B2 (en) * | 2012-12-21 | 2016-08-09 | Abbyy Development Llc | General dictionary for all languages |
CN104933068A (zh) * | 2014-03-19 | 2015-09-23 | 阿里巴巴集团控股有限公司 | 一种信息搜索的方法和装置 |
JP6888410B2 (ja) * | 2017-05-15 | 2021-06-16 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置及び情報処理プログラム |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006350664A (ja) * | 2005-06-15 | 2006-12-28 | Fuji Xerox Co Ltd | 文書処理装置 |
JP2007336062A (ja) * | 2006-06-13 | 2007-12-27 | Fuji Xerox Co Ltd | 画像処理システムおよび画像処理装置 |
Family Cites Families (41)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02249064A (ja) * | 1989-03-22 | 1990-10-04 | Oki Electric Ind Co Ltd | 電子辞書 |
US5175684A (en) * | 1990-12-31 | 1992-12-29 | Trans-Link International Corp. | Automatic text translation and routing system |
US5517409A (en) * | 1992-03-24 | 1996-05-14 | Ricoh Company, Ltd. | Image forming apparatus and method having efficient translation function |
JPH05324720A (ja) | 1992-05-19 | 1993-12-07 | Ricoh Co Ltd | 対訳画像形成装置 |
US5675815A (en) * | 1992-11-09 | 1997-10-07 | Ricoh Company, Ltd. | Language conversion system and text creating system using such |
JPH0765012A (ja) * | 1993-08-27 | 1995-03-10 | Ricoh Co Ltd | 対訳画像形成装置 |
JP3294919B2 (ja) | 1993-10-21 | 2002-06-24 | 松下電器産業株式会社 | 機械翻訳装置 |
JPH086948A (ja) | 1994-06-22 | 1996-01-12 | Matsushita Electric Ind Co Ltd | 機械翻訳機 |
US5821929A (en) * | 1994-11-30 | 1998-10-13 | Canon Kabushiki Kaisha | Image processing method and apparatus |
JPH0981566A (ja) * | 1995-09-08 | 1997-03-28 | Toshiba Corp | 翻訳装置及び翻訳方法 |
JPH11167623A (ja) * | 1997-12-03 | 1999-06-22 | Canon Inc | 画像処理装置及び画像処理方法 |
JP2002132765A (ja) | 2000-10-30 | 2002-05-10 | Sharp Corp | 翻訳システム |
JP2003178067A (ja) * | 2001-12-10 | 2003-06-27 | Mitsubishi Electric Corp | 携帯端末型画像処理システム、携帯端末およびサーバ |
JP4251629B2 (ja) * | 2003-01-31 | 2009-04-08 | キヤノン株式会社 | 画像処理システム及び情報処理装置、並びに制御方法及びコンピュータプログラム及びコンピュータ可読記憶媒体 |
US7496230B2 (en) * | 2003-06-05 | 2009-02-24 | International Business Machines Corporation | System and method for automatic natural language translation of embedded text regions in images during information transfer |
JP4788106B2 (ja) * | 2004-04-12 | 2011-10-05 | 富士ゼロックス株式会社 | 画像辞書作成装置、符号化装置、画像辞書作成方法及びそのプログラム |
JP2005301664A (ja) * | 2004-04-12 | 2005-10-27 | Fuji Xerox Co Ltd | 画像辞書作成装置、符号化装置、データファイル、画像辞書作成方法及びそのプログラム |
JP4419871B2 (ja) * | 2005-03-02 | 2010-02-24 | 富士ゼロックス株式会社 | 翻訳依頼装置およびプログラム |
JP4517895B2 (ja) * | 2005-03-04 | 2010-08-04 | 富士ゼロックス株式会社 | 翻訳文出力装置 |
JP2006251902A (ja) * | 2005-03-08 | 2006-09-21 | Fuji Xerox Co Ltd | 翻訳文書画像生成装置、翻訳文書画像生成プログラム及び翻訳文書画像生成方法 |
JP2006252048A (ja) * | 2005-03-09 | 2006-09-21 | Fuji Xerox Co Ltd | 翻訳装置、翻訳プログラムおよび翻訳方法 |
JP2006252047A (ja) * | 2005-03-09 | 2006-09-21 | Fuji Xerox Co Ltd | 言語処理装置および言語処理プログラム |
JP2006259830A (ja) * | 2005-03-15 | 2006-09-28 | Toshiba Corp | 光学的文字認識装置および光学的文字認識結果確認方法 |
US7865353B2 (en) * | 2005-03-22 | 2011-01-04 | Fuji Xerox Co., Ltd. | Translation device, image processing device, translation method, and recording medium |
JP4428266B2 (ja) * | 2005-03-22 | 2010-03-10 | 富士ゼロックス株式会社 | 翻訳装置およびプログラム |
JP2006268372A (ja) * | 2005-03-23 | 2006-10-05 | Fuji Xerox Co Ltd | 翻訳装置、画像処理装置、画像形成装置、翻訳方法及びプログラム |
JP4311365B2 (ja) * | 2005-03-25 | 2009-08-12 | 富士ゼロックス株式会社 | 文書処理装置およびプログラム |
JP4419893B2 (ja) * | 2005-03-25 | 2010-02-24 | 富士ゼロックス株式会社 | 画像処理装置及び画像処理方法 |
JP2006276911A (ja) * | 2005-03-25 | 2006-10-12 | Fuji Xerox Co Ltd | 電子機器およびプログラム |
JP2006277103A (ja) * | 2005-03-28 | 2006-10-12 | Fuji Xerox Co Ltd | 文書翻訳方法および文書翻訳装置 |
EP1987471A2 (en) * | 2006-02-17 | 2008-11-05 | Lumex As | Method and system for verification of uncertainly recognized words in an ocr system |
US8031940B2 (en) * | 2006-06-29 | 2011-10-04 | Google Inc. | Recognizing text in images using ranging data |
JP2008052439A (ja) * | 2006-08-23 | 2008-03-06 | Fuji Xerox Co Ltd | 画像処理システムおよび画像処理プログラム |
US7650035B2 (en) * | 2006-09-11 | 2010-01-19 | Google Inc. | Optical character recognition based on shape clustering and multiple optical character recognition processes |
US8045808B2 (en) * | 2006-12-04 | 2011-10-25 | Trend Micro Incorporated | Pure adversarial approach for identifying text content in images |
US8144990B2 (en) * | 2007-03-22 | 2012-03-27 | Sony Ericsson Mobile Communications Ab | Translation and display of text in picture |
JP5066977B2 (ja) * | 2007-03-29 | 2012-11-07 | 富士ゼロックス株式会社 | 画像処理装置、画像形成装置、及びプログラム |
US8023725B2 (en) * | 2007-04-12 | 2011-09-20 | Samsung Electronics Co., Ltd. | Identification of a graphical symbol by identifying its constituent contiguous pixel groups as characters |
JP5011508B2 (ja) * | 2007-04-27 | 2012-08-29 | 日本電産サンキョー株式会社 | 文字列認識方法及び文字列認識装置 |
CN101354746B (zh) * | 2007-07-23 | 2011-08-31 | 夏普株式会社 | 文字图像抽出装置及文字图像抽出方法 |
CN101354704B (zh) * | 2007-07-23 | 2011-01-12 | 夏普株式会社 | 字形特征字典制作装置及具备该装置的文档图像处理装置 |
-
2008
- 2008-03-14 JP JP2008065504A patent/JP4626777B2/ja not_active Expired - Fee Related
- 2008-09-16 US US12/211,543 patent/US8751214B2/en not_active Expired - Fee Related
- 2008-09-18 AU AU2008221525A patent/AU2008221525B2/en not_active Ceased
- 2008-10-08 KR KR1020080098515A patent/KR101248449B1/ko active IP Right Grant
- 2008-10-17 CN CN2008101715133A patent/CN101533392B/zh not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006350664A (ja) * | 2005-06-15 | 2006-12-28 | Fuji Xerox Co Ltd | 文書処理装置 |
JP2007336062A (ja) * | 2006-06-13 | 2007-12-27 | Fuji Xerox Co Ltd | 画像処理システムおよび画像処理装置 |
Also Published As
Publication number | Publication date |
---|---|
AU2008221525B2 (en) | 2010-04-22 |
JP2009223477A (ja) | 2009-10-01 |
US8751214B2 (en) | 2014-06-10 |
KR20090098650A (ko) | 2009-09-17 |
US20090234637A1 (en) | 2009-09-17 |
CN101533392B (zh) | 2011-06-15 |
CN101533392A (zh) | 2009-09-16 |
AU2008221525A1 (en) | 2009-10-01 |
KR101248449B1 (ko) | 2013-03-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4569622B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP4623169B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP4626777B2 (ja) | 情報処理装置及び情報処理プログラム | |
US20180225541A1 (en) | Image processing apparatuses and non-transitory computer readable medium | |
JP2009251872A (ja) | 情報処理装置及び情報処理プログラム | |
JP6221220B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP4780184B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP5742283B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP5262778B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP5928714B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP4973765B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP6682827B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP4793429B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP7342518B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP6003375B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP2012022359A (ja) | 画像処理装置及び画像処理プログラム | |
JP5062076B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP6606885B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP2010049336A (ja) | 画像処理装置及び画像処理プログラム | |
JP4973536B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP2008084186A (ja) | 画像処理システム及び画像処理プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090825 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100316 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100406 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20101013 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20101026 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131119 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4626777 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |