JP6328409B2 - 翻訳装置 - Google Patents
翻訳装置 Download PDFInfo
- Publication number
- JP6328409B2 JP6328409B2 JP2013246529A JP2013246529A JP6328409B2 JP 6328409 B2 JP6328409 B2 JP 6328409B2 JP 2013246529 A JP2013246529 A JP 2013246529A JP 2013246529 A JP2013246529 A JP 2013246529A JP 6328409 B2 JP6328409 B2 JP 6328409B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- condition
- character string
- lines
- consecutive
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/58—Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/158—Segmentation of character regions using character size, text spacings or pitch estimation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Description
本発明の一実施形態において、図1〜3、および7に基づいて説明すれば以下のとおりである。まず、図1および図2を参照して、本実施形態に係るスマートフォン1の概要について説明する。図1は、スマートフォン1の要部構成を示すブロック図であり、図2は、文字列の翻訳における結合条件の一例を示す模式図である。
次に、本発明の別の実施形態について、図1、図4〜5、および図7を参照して説明すれば、以下のとおりである。実施形態1では、条件判定部24は、結合条件を満たすか否かを判定する構成であったが、本実施形態では、条件判定部24は、結合条件に加え、上記連続する2つの抽出行が、分離条件格納部32に格納された分離条件を満たすか否かを判定する構成である。分離条件格納部32は、条件判定部24が抽出行を結合するか否かを判定するための分離条件を格納している。本実施形態に係る分離条件格納部32は少なくとも、後述する分離条件(4)〜(7)を格納している。
〔実施形態3〕
次に、本発明のさらに別の実施形態について、図6を参照して説明すれば、以下のとおりである。本実施形態では、実施形態2で説明した分離条件における所定の値を、文字サイズに応じて決定する構成について説明する。すなわち、本実施形態に係る条件判定部24は、特定した上記文字のサイズに応じて、上記分離条件(5)および(7)における所定の値を決定する。一般に、文字列に含まれる行の文字のサイズが大きくなると、連続する2つの行の距離や、連続する2つの行の先頭文字のずれは大きくなることが多い。つまり、これらを判定するための値が文字のサイズによらず一定だった場合、文字のサイズが大きくなると、本来分離条件を満たしていないと判定されるべき連続する2つの行が、分離条件を満たすと誤判定されるおそれがある。このため、上記所定の値を文字のサイズに応じて変化させることで、誤判定の可能性を低くすることができる。
スマートフォン1の制御ブロック(特に、操作特定部21、画像取得部22、文字列抽出部23、条件判定部24、抽出行結合部25、翻訳部26、表示制御部27)は、集積回路(ICチップ)等に形成された論理回路(ハードウェア)によって実現してもよいし、CPU(Central Processing Unit)を用いてソフトウェアによって実現してもよい。
本発明の態様1に係る翻訳装置(スマートフォン1)は、撮像された画像に含まれる文字列を翻訳する翻訳装置であって、複数の行からなる上記文字列を行単位で抽出する文字列抽出手段(文字列抽出部23)と、上記文字列抽出手段により抽出された行のうち、上記画像において連続する2つの行が上記文字列の言語の特徴に基づく条件である結合条件を満たすか否かを判定する判定手段(条件判定部24)と、上記判定手段により上記結合条件を満たすと判定された場合、上記連続する2つの行を結合して翻訳し、上記結合条件を満たさないと判定された場合、上記連続する2つの行をそれぞれ翻訳する翻訳手段(抽出行結合部25、翻訳部26)と、を備える。
Claims (5)
- 撮像された画像に含まれる文字列を翻訳する翻訳装置であって、
複数の行からなる上記文字列を行単位で抽出する文字列抽出手段と、
上記文字列抽出手段により抽出された行のうち、上記画像において連続する2つの行が上記文字列の言語の特徴に基づく条件である結合条件を満たすか否かを判定する判定手段と、
上記判定手段により上記結合条件を満たすと判定された場合、上記連続する2つの行を結合して翻訳し、上記結合条件を満たさないと判定された場合、上記連続する2つの行をそれぞれ翻訳する翻訳手段と、を備え、
上記文字列の言語は英語であり、
上記判定手段は、上記結合条件として、
(1)上記連続する2つの行のうち、後に位置する行の先頭文字が小文字であること、
(2)上記連続する2つの行のうち、前に位置する行の最後に配置された単語の品詞が接続詞、前置詞、または冠詞のいずれかであること、および、
(3)上記連続する2つの行のうち、後に位置する行がすべて大文字で構成されていること、
のうち少なくともいずれか1つを満たすか否かを判定することを特徴とする翻訳装置。 - 上記判定手段は、上記連続する2つの行を構成する文字の特徴、および、上記連続する2つの行の位置関係のうち少なくとも一方に基づく条件である分離条件を満たすか否かをさらに判定し、
上記翻訳手段は、上記分離条件を満たす場合は上記結合条件を満たす上記連続する2つの行を結合せず、それぞれ翻訳することを特徴とする請求項1に記載の翻訳装置。 - 上記判定手段は、上記分離条件として、
(4)上記連続する2つの行のうち一方を構成する文字のサイズと、他方を構成する文字のサイズとの差が所定の文字サイズ閾値を超えること、
(5)上記連続する2つの行の距離が所定の距離閾値を超えること、
(6)上記連続する2つの行のうち一方を構成する文字の色と、他方を構成する文字の色とが異なること、および、
(7)上記文字列の行方向における、上記連続する2つの行の先頭文字の位置が所定の文字位置閾値を超えて離れていること、
のうち少なくともいずれか1つを満たすか否かを判定することを特徴とする請求項2に記載の翻訳装置。 - 上記文字列抽出手段によって抽出された行を構成する上記文字のサイズを判定する文字サイズ判定手段をさらに備え、
上記判定手段は、上記文字サイズ判定手段によって判定された上記文字のサイズに応じて、上記距離閾値および上記文字位置閾値を決定することを特徴とする請求項3に記載の翻訳装置。 - 撮像された画像に含まれる文字列を翻訳する翻訳装置であって、
複数の行からなる上記文字列を行単位で抽出する文字列抽出手段と、
上記文字列抽出手段により抽出された行のうち、上記画像において連続する2つの行が上記文字列の言語の特徴に基づく条件である結合条件を満たすか否かを判定する判定手段と、
上記判定手段により上記結合条件を満たすと判定された場合、上記連続する2つの行を結合して翻訳し、上記結合条件を満たさないと判定された場合、上記連続する2つの行をそれぞれ翻訳する翻訳手段と、を備え、
上記判定手段は、上記連続する2つの行を構成する文字の特徴、および、上記連続する2つの行の位置関係のうち少なくとも一方に基づく条件である分離条件を満たすか否かをさらに判定し、
上記翻訳手段は、上記分離条件を満たす場合は上記結合条件を満たす上記連続する2つの行を結合せず、それぞれ翻訳し、
上記判定手段は、上記分離条件として、
(4)上記連続する2つの行のうち一方を構成する文字のサイズと、他方を構成する文字のサイズとの差が所定の文字サイズ閾値を超えること、
(5)上記連続する2つの行の距離が所定の距離閾値を超えること、
(6)上記連続する2つの行のうち一方を構成する文字の色と、他方を構成する文字の色とが異なること、および、
(7)上記文字列の行方向における、上記連続する2つの行の先頭文字の位置が所定の文字位置閾値を超えて離れていること、
のうち少なくともいずれか1つを満たすか否かを判定し、
上記文字列抽出手段によって抽出された行を構成する上記文字のサイズを判定する文字サイズ判定手段をさらに備え、
上記判定手段は、上記文字サイズ判定手段によって判定された上記文字のサイズに応じて、上記距離閾値および上記文字位置閾値を決定することを特徴とする翻訳装置。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013246529A JP6328409B2 (ja) | 2013-11-28 | 2013-11-28 | 翻訳装置 |
PCT/JP2014/071786 WO2015079751A1 (ja) | 2013-11-28 | 2014-08-20 | 翻訳装置 |
US15/038,742 US9824086B2 (en) | 2013-11-28 | 2014-08-20 | Translation device that determines whether two consecutive lines in an image should be translated together or separately |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013246529A JP6328409B2 (ja) | 2013-11-28 | 2013-11-28 | 翻訳装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015106184A JP2015106184A (ja) | 2015-06-08 |
JP6328409B2 true JP6328409B2 (ja) | 2018-05-23 |
Family
ID=53198708
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013246529A Active JP6328409B2 (ja) | 2013-11-28 | 2013-11-28 | 翻訳装置 |
Country Status (3)
Country | Link |
---|---|
US (1) | US9824086B2 (ja) |
JP (1) | JP6328409B2 (ja) |
WO (1) | WO2015079751A1 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015069365A (ja) * | 2013-09-27 | 2015-04-13 | シャープ株式会社 | 情報処理装置、および制御プログラム |
JP7356332B2 (ja) * | 2019-12-03 | 2023-10-04 | ポケトーク株式会社 | 翻訳結果表示制御システム、翻訳結果表示制御方法及びプログラム |
US11227096B2 (en) * | 2020-05-08 | 2022-01-18 | Micro Focus Llc | Error detection in text string within displayed layout |
CN112764549B (zh) * | 2021-04-09 | 2021-08-06 | 北京亮亮视野科技有限公司 | 翻译方法、装置、介质和近眼显示设备 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2199680A (en) | 1986-11-28 | 1988-07-13 | Sharp Kk | Translating apparatus |
JPS63136269A (ja) * | 1986-11-28 | 1988-06-08 | Sharp Corp | 自動翻訳装置 |
JPH052605A (ja) * | 1990-10-29 | 1993-01-08 | Ricoh Co Ltd | 機械翻訳方式 |
JP2989387B2 (ja) | 1992-08-31 | 1999-12-13 | シャープ株式会社 | 入力文字処理装置における句点認識装置及び句点認識方法 |
GB2279164A (en) * | 1993-06-18 | 1994-12-21 | Canon Res Ct Europe Ltd | Processing a bilingual database. |
JP3752698B2 (ja) | 1994-11-21 | 2006-03-08 | カシオ計算機株式会社 | 文書処理装置 |
JPH0981566A (ja) * | 1995-09-08 | 1997-03-28 | Toshiba Corp | 翻訳装置及び翻訳方法 |
US6085162A (en) * | 1996-10-18 | 2000-07-04 | Gedanken Corporation | Translation system and method in which words are translated by a specialized dictionary and then a general dictionary |
DE69818796T2 (de) * | 1997-06-26 | 2004-08-05 | Koninklijke Philips Electronics N.V. | Maschinenorganisiertes verfahren und vorrichtung zum übersetzen einer wortorganisierten textquelle in einen wortorganisierten zieltext |
DE69837979T2 (de) * | 1997-06-27 | 2008-03-06 | International Business Machines Corp. | System zum Extrahieren einer mehrsprachigen Terminologie |
US6195631B1 (en) * | 1998-04-15 | 2001-02-27 | At&T Corporation | Method and apparatus for automatic construction of hierarchical transduction models for language translation |
US8041555B2 (en) * | 2007-08-15 | 2011-10-18 | International Business Machines Corporation | Language translation based on a location of a wireless device |
JP5647779B2 (ja) | 2009-10-05 | 2015-01-07 | 新日鉄住金ソリューションズ株式会社 | 情報処理装置、情報処理方法、及びプログラム |
JP5862260B2 (ja) | 2011-12-09 | 2016-02-16 | 富士ゼロックス株式会社 | 情報処理装置及び情報処理プログラム |
-
2013
- 2013-11-28 JP JP2013246529A patent/JP6328409B2/ja active Active
-
2014
- 2014-08-20 US US15/038,742 patent/US9824086B2/en active Active
- 2014-08-20 WO PCT/JP2014/071786 patent/WO2015079751A1/ja active Application Filing
Also Published As
Publication number | Publication date |
---|---|
WO2015079751A1 (ja) | 2015-06-04 |
JP2015106184A (ja) | 2015-06-08 |
US9824086B2 (en) | 2017-11-21 |
US20160321246A1 (en) | 2016-11-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6328409B2 (ja) | 翻訳装置 | |
US20200026766A1 (en) | Method for translating characters and apparatus therefor | |
KR102236616B1 (ko) | 정보 처리 장치, 그의 제어 방법, 및 기억 매체 | |
EP3493110A1 (en) | Electronic device recognizing text in image | |
JP2018128996A (ja) | 情報処理装置、制御方法、およびプログラム | |
US10142499B2 (en) | Document distribution system, document distribution apparatus, information processing method, and storage medium | |
JP6170241B2 (ja) | 文字特定装置、および制御プログラム | |
WO2015045676A1 (ja) | 情報処理装置、および制御プログラム | |
JP6206581B2 (ja) | 端末装置、表示制御方法及びプログラム | |
US20150146265A1 (en) | Method and apparatus for recognizing document | |
WO2015031702A1 (en) | Multiple hypothesis testing for word detection | |
JP6531738B2 (ja) | 画像処理装置 | |
US20160283786A1 (en) | Image processor, image processing method, and non-transitory recording medium | |
JP2014063318A (ja) | 文字認識装置、文字認識装置の制御方法、制御プログラム、および制御プログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JP6206580B2 (ja) | 端末装置、表示制御方法及びプログラム | |
JP6164361B2 (ja) | 端末装置、表示制御方法及びプログラム | |
US10362193B2 (en) | Information conversion apparatus capable of changing attribution information of an image based on viewer information and non-transitory computer readable medium storing program | |
JP2015090625A (ja) | 帳票読取装置、プログラムおよび帳票読取システム | |
WO2015045679A1 (ja) | 情報機器および制御プログラム | |
US9396405B2 (en) | Image processing apparatus, image processing method, and image processing program | |
KR20170029866A (ko) | 서버, 사용자 단말 및 이들의 제어 방법. | |
KR20160133335A (ko) | 음성인식형 입체적 디지털영상 구현시스템 | |
JP6364182B2 (ja) | 文字列認識装置および文字列認識方法 | |
JP6647149B2 (ja) | 情報表示装置 | |
KR101669799B1 (ko) | 잉크 텍스트 처리 장치 및 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160923 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20171003 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20171201 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180327 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180418 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6328409 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |