RU2007118667A - Электронное устройство и способ визуальной интерпретации текста - Google Patents
Электронное устройство и способ визуальной интерпретации текста Download PDFInfo
- Publication number
- RU2007118667A RU2007118667A RU2007118667/09A RU2007118667A RU2007118667A RU 2007118667 A RU2007118667 A RU 2007118667A RU 2007118667/09 A RU2007118667/09 A RU 2007118667/09A RU 2007118667 A RU2007118667 A RU 2007118667A RU 2007118667 A RU2007118667 A RU 2007118667A
- Authority
- RU
- Russia
- Prior art keywords
- subject area
- words
- structured
- captured
- information
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/58—Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/768—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using context analysis, e.g. recognition aided by known co-occurring patterns
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/1444—Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/26—Techniques for post-processing, e.g. correcting the recognition result
- G06V30/262—Techniques for post-processing, e.g. correcting the recognition result using context analysis, e.g. lexical, syntactic or semantic context
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Machine Translation (AREA)
- Character Discrimination (AREA)
- Character Input (AREA)
Claims (10)
1. Способ, используемый в электронном устройстве для визуальной интерпретации текста, содержащий этапы, на которых:
захватывают изображение, которое включает в себя текстовую информацию, имеющую захваченные слова, которые организованы в захваченной компоновке;
выполняют оптическое распознавание символов в части изображения, чтобы сформировать совокупность распознанных слов, которые организованы в захваченной компоновке;
выбирают наиболее вероятную предметную область из множества предметных областей, причем каждая предметная область имеет ассоциативно связанный набор компоновок предметных областей, при этом каждая компоновка предметной области содержит набор структур признаков и правил отношений;
формируют структурированную совокупность структур признаков из набора компоновок предметных областей, которая по существу совпадает с захваченной компоновкой;
организуют совокупность распознанных слов согласно структурированной совокупности структур признаков в структурированную информацию предметной области и
используют структурированную информацию предметной области в приложении, которое является характерным для предметной области.
2. Способ по п. 1, в котором захваченные слова представлены на первом языке и в котором использование структурированной информации предметной области содержит этапы, на которых:
переводят структурированную информацию предметной области в переведенные слова второго языка с помощью характерного для предметной области машинного переводчика второго языка и
представляют переведенные слова визуально, используя захваченную компоновку.
3. Способ по п. 2, в котором характерный для предметной области машинный переводчик включает в себя переводы значков и в котором, когда изображение включает в себя значок, перевод включает в себя этап, на котором переводят значок в переведенный значок, который включает в себя, по меньшей мере, одно из переведенного изображения и переведенного слова с помощью характерного для предметной области машинного переводчика второго языка, и в котором представление включает в себя этап, на котором представляют переведенные слова и переведенный значок с помощью захваченной компоновки.
4. Способ по п.2, в котором использование структурированной информации предметной области дополнительно содержит этапы, на которых:
идентифицируют выбранную пользователем часть переведенных слов и
представляют соответствующую часть захваченных слов, которая соответствует выбранной пользователем части переведенных слов.
5. Способ по п.1, в котором использование структурированной информации предметной области дополнительно содержит этапы, на которых:
идентифицируют выбранную пользователем часть захваченной компоновки;
переводят соответствующую часть структурированной информации предметной области в переведенные слова второго языка с помощью характерного для предметной области машинного переводчика второго языка и
представляют переведенные слова соответствующей части с помощью структурированной компоновки.
6. Способ по п. 1, в котором наиболее вероятная предметная область, по меньшей мере, частично выбирается с помощью одного или более вводов от пользователя.
7. Способ по п. 1, в котором наиболее вероятная предметная область, по меньшей мере, частично выбирается с помощью словаря предметной области и одного или более слов из совокупности распознанных слов.
8. Способ по п. 1, в котором наиболее вероятная предметная область выбирается с помощью информации о географическом местоположении, получаемой электронным устройством, и базы данных местоположений по предметной области, сохраненной в электронном устройстве.
9. Способ по п. 1, дополнительно содержащий этап, на котором выбирают приложение, которое является характерным для предметной области, из набора характерных для предметной области приложений.
10. Электронное устройство для визуальной интерпретации текста, содержащее:
средство захвата для захвата изображения, которое включает в себя текстовую информацию, имеющую захваченные слова, которые организованы в захваченной компоновке;
средство оптического распознавания символов для выполнения оптического распознавания символов (OCR) в части изображения, чтобы сформировать совокупность распознанных слов, которые организованы в захваченной компоновке;
средство определения предметной области для выбора наиболее вероятной предметной области из множества предметных областей, причем каждая предметная область имеет ассоциативно связанный набор компоновок предметных областей, при этом каждая компоновка предметной области содержит набор структур признаков и правил отношений;
средство формирования структуры для формирования структурированной совокупности структур признаков из набора компоновок предметных областей, которая по существу совпадает с захваченной компоновкой;
средство организации информации для организации совокупности распознанных слов согласно структурированной совокупности структур признаков в структурированную информацию предметной области и
множество конкретных для характерных области приложений, из которых выбирается одно, чтобы использовать структурированную информацию предметной области.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10/969,372 | 2004-10-20 | ||
US10/969,372 US20060083431A1 (en) | 2004-10-20 | 2004-10-20 | Electronic device and method for visual text interpretation |
Publications (1)
Publication Number | Publication Date |
---|---|
RU2007118667A true RU2007118667A (ru) | 2008-11-27 |
Family
ID=36180812
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2007118667/09A RU2007118667A (ru) | 2004-10-20 | 2005-10-05 | Электронное устройство и способ визуальной интерпретации текста |
Country Status (7)
Country | Link |
---|---|
US (1) | US20060083431A1 (ru) |
EP (1) | EP1803076A4 (ru) |
KR (1) | KR20070058635A (ru) |
CN (1) | CN101044494A (ru) |
BR (1) | BRPI0516979A (ru) |
RU (1) | RU2007118667A (ru) |
WO (1) | WO2006044207A2 (ru) |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8296808B2 (en) * | 2006-10-23 | 2012-10-23 | Sony Corporation | Metadata from image recognition |
US20080094496A1 (en) * | 2006-10-24 | 2008-04-24 | Kong Qiao Wang | Mobile communication terminal |
US20080153963A1 (en) * | 2006-12-22 | 2008-06-26 | 3M Innovative Properties Company | Method for making a dispersion |
CN101620680B (zh) * | 2008-07-03 | 2014-06-25 | 三星电子株式会社 | 字符图像的识别和翻译方法以及装置 |
US9323854B2 (en) * | 2008-12-19 | 2016-04-26 | Intel Corporation | Method, apparatus and system for location assisted translation |
US8373724B2 (en) * | 2009-01-28 | 2013-02-12 | Google Inc. | Selective display of OCR'ed text and corresponding images from publications on a client device |
JP4759638B2 (ja) * | 2009-12-25 | 2011-08-31 | 株式会社スクウェア・エニックス | リアルタイムなカメラ辞書 |
US9092674B2 (en) * | 2011-06-23 | 2015-07-28 | International Business Machines Corportion | Method for enhanced location based and context sensitive augmented reality translation |
CN102831200A (zh) * | 2012-08-07 | 2012-12-19 | 北京百度网讯科技有限公司 | 一种基于图像文字识别的商品推送方法和装置 |
CN102855480A (zh) * | 2012-08-07 | 2013-01-02 | 北京百度网讯科技有限公司 | 一种图像文字识别方法和装置 |
US9519641B2 (en) * | 2012-09-18 | 2016-12-13 | Abbyy Development Llc | Photography recognition translation |
US20140156412A1 (en) * | 2012-12-05 | 2014-06-05 | Good Clean Collective, Inc. | Rating personal care products based on ingredients |
US20150310767A1 (en) * | 2014-04-24 | 2015-10-29 | Omnivision Technologies, Inc. | Wireless Typoscope |
KR20160071144A (ko) * | 2014-12-11 | 2016-06-21 | 엘지전자 주식회사 | 이동단말기 및 그 제어 방법 |
CN107273106B (zh) * | 2016-04-08 | 2021-07-06 | 北京三星通信技术研究有限公司 | 物体信息翻译、以及衍生信息获取方法和装置 |
CN108415906B (zh) * | 2018-03-28 | 2021-08-17 | 中译语通科技股份有限公司 | 基于领域自动识别篇章机器翻译方法、机器翻译系统 |
CN114254660A (zh) * | 2020-09-22 | 2022-03-29 | 北京三星通信技术研究有限公司 | 多模态翻译方法、装置、电子设备及计算机可读存储介质 |
Family Cites Families (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US216922A (en) * | 1879-06-24 | Improvement in governors for engines | ||
US202683A (en) * | 1878-04-23 | Improvement in buckle loop and fastener for carfilage-tops, harness | ||
US195749A (en) * | 1877-10-02 | Improvement in compositions for making hydraulic cement | ||
US2198713A (en) * | 1937-08-16 | 1940-04-30 | Grotelite Company | Injection molding machine |
CA2155891A1 (en) * | 1994-10-18 | 1996-04-19 | Raymond Amand Lorie | Optical character recognition system having context analyzer |
US5903860A (en) * | 1996-06-21 | 1999-05-11 | Xerox Corporation | Method of conjoining clauses during unification using opaque clauses |
US5933531A (en) * | 1996-08-23 | 1999-08-03 | International Business Machines Corporation | Verification and correction method and system for optical character recognition |
US6182029B1 (en) * | 1996-10-28 | 2001-01-30 | The Trustees Of Columbia University In The City Of New York | System and method for language extraction and encoding utilizing the parsing of text data in accordance with domain parameters |
US6049622A (en) * | 1996-12-05 | 2000-04-11 | Mayo Foundation For Medical Education And Research | Graphic navigational guides for accurate image orientation and navigation |
US6298158B1 (en) * | 1997-09-25 | 2001-10-02 | Babylon, Ltd. | Recognition and translation system and method |
ITUD980032A1 (it) * | 1998-03-03 | 1998-06-03 | Agostini Organizzazione Srl D | Sistema di traduzione a macchina e rispettivo tradsistema di traduzione a macchina e rispettivo traduttore che comprende tale sistema uttore che comprende tale sistema |
US6356865B1 (en) * | 1999-01-29 | 2002-03-12 | Sony Corporation | Method and apparatus for performing spoken language translation |
US20010032070A1 (en) * | 2000-01-10 | 2001-10-18 | Mordechai Teicher | Apparatus and method for translating visual text |
US6823084B2 (en) * | 2000-09-22 | 2004-11-23 | Sri International | Method and apparatus for portably recognizing text in an image sequence of scene imagery |
US7031553B2 (en) * | 2000-09-22 | 2006-04-18 | Sri International | Method and apparatus for recognizing text in an image sequence of scene imagery |
US7085708B2 (en) * | 2000-09-23 | 2006-08-01 | Ravenflow, Inc. | Computer system with natural language to machine language translator |
US20020131636A1 (en) * | 2001-03-19 | 2002-09-19 | Darwin Hou | Palm office assistants |
JP4304268B2 (ja) * | 2001-08-10 | 2009-07-29 | 独立行政法人情報通信研究機構 | 複数言語対訳テキスト入力による第3言語テキスト生成アルゴリズム及び装置、プログラム |
US20030061022A1 (en) * | 2001-09-21 | 2003-03-27 | Reinders James R. | Display of translations in an interleaved fashion with variable spacing |
US7424129B2 (en) * | 2001-11-19 | 2008-09-09 | Ricoh Company, Ltd | Printing system with embedded audio/video content recognition and processing |
US20030200078A1 (en) * | 2002-04-19 | 2003-10-23 | Huitao Luo | System and method for language translation of character strings occurring in captured image data |
US20030202683A1 (en) * | 2002-04-30 | 2003-10-30 | Yue Ma | Vehicle navigation system that automatically translates roadside signs and objects |
WO2004042620A1 (en) * | 2002-11-04 | 2004-05-21 | Deepq Technologies, A General Partnership | Document processing based on a digital document image input with a confirmatory receipt output |
US20040210444A1 (en) * | 2003-04-17 | 2004-10-21 | International Business Machines Corporation | System and method for translating languages using portable display device |
US20050197825A1 (en) * | 2004-03-05 | 2005-09-08 | Lucent Technologies Inc. | Personal digital assistant with text scanner and language translator |
-
2004
- 2004-10-20 US US10/969,372 patent/US20060083431A1/en not_active Abandoned
-
2005
- 2005-10-05 WO PCT/US2005/035816 patent/WO2006044207A2/en active Application Filing
- 2005-10-05 CN CNA2005800358398A patent/CN101044494A/zh active Pending
- 2005-10-05 EP EP05803434A patent/EP1803076A4/en not_active Withdrawn
- 2005-10-05 BR BRPI0516979-8A patent/BRPI0516979A/pt not_active IP Right Cessation
- 2005-10-05 RU RU2007118667/09A patent/RU2007118667A/ru not_active Application Discontinuation
- 2005-10-05 KR KR1020077009015A patent/KR20070058635A/ko active IP Right Grant
Also Published As
Publication number | Publication date |
---|---|
WO2006044207A2 (en) | 2006-04-27 |
US20060083431A1 (en) | 2006-04-20 |
WO2006044207A3 (en) | 2006-09-21 |
EP1803076A2 (en) | 2007-07-04 |
BRPI0516979A (pt) | 2008-09-30 |
EP1803076A4 (en) | 2008-03-05 |
KR20070058635A (ko) | 2007-06-08 |
CN101044494A (zh) | 2007-09-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2007118667A (ru) | Электронное устройство и способ визуальной интерпретации текста | |
US8874604B2 (en) | Method and system for searching an electronic map | |
CN109657068B (zh) | 面向智慧博物馆的文物知识图谱生成与可视化方法 | |
US7340450B2 (en) | Data search system and data search method using a global unique identifier | |
Baroni et al. | WebBootCaT. instant domain-specific corpora to support human translators | |
JP5501967B2 (ja) | 間接話法内の意味論的関係の識別 | |
EP2144189A3 (en) | Method for recognizing and translating characters in camera-based image | |
CN105045852A (zh) | 一种教学资源的全文搜索引擎系统 | |
CN1685313A (zh) | 由指针发起的对电子文档中文本信息的即时双语注释 | |
CN1894685A (zh) | 翻译工具 | |
US20120162244A1 (en) | Image search color sketch filtering | |
CN106384108A (zh) | 文字内容检索方法及词语解读装置和移动终端 | |
EP2806336A1 (en) | Text prediction in a text input associated with an image | |
Chaves et al. | A geographic knowledge base for semantic web applications | |
KR101709055B1 (ko) | 오픈 웹 질의응답을 위한 질문분석 장치 및 방법 | |
US20050004902A1 (en) | Information retrieving system, information retrieving method, and information retrieving program | |
JP5484113B2 (ja) | 文書画像関連情報提供装置、及び文書画像関連情報取得システム | |
Dorr et al. | Lexical conceptual structure of literal and metaphorical spatial language: A case study of “push” | |
KR100745367B1 (ko) | 템플릿에 기반한 기록정보 색인 및 검색 방법과 이를이용한 질의응답 시스템 | |
JPWO2014170965A1 (ja) | 文書処理方法、文書処理装置および文書処理プログラム | |
JP2018112806A (ja) | 画像関連付け装置、画像データベース、画像検索装置、画像検索システム及びプログラム | |
CN116303990B (zh) | 一种古籍数据库管理方法、系统、终端及介质 | |
JP2005025478A (ja) | 情報検索方法、情報検索プログラムおよび情報検索装置 | |
KR20020006223A (ko) | 자동 색인 로봇 시스템 및 이를 이용한 처리 방법 | |
Katz et al. | Viewing the Web as a Virtual Database for Question Answering. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FA92 | Acknowledgement of application withdrawn (lack of supplementary materials submitted) |
Effective date: 20090216 |