RU2007118667A - Электронное устройство и способ визуальной интерпретации текста - Google Patents

Электронное устройство и способ визуальной интерпретации текста Download PDF

Info

Publication number
RU2007118667A
RU2007118667A RU2007118667/09A RU2007118667A RU2007118667A RU 2007118667 A RU2007118667 A RU 2007118667A RU 2007118667/09 A RU2007118667/09 A RU 2007118667/09A RU 2007118667 A RU2007118667 A RU 2007118667A RU 2007118667 A RU2007118667 A RU 2007118667A
Authority
RU
Russia
Prior art keywords
subject area
words
structured
captured
information
Prior art date
Application number
RU2007118667/09A
Other languages
English (en)
Inventor
Гарри М. БЛИСС (US)
Гарри М. БЛИСС
Original Assignee
Моторола, Инк. (US)
Моторола, Инк.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Моторола, Инк. (US), Моторола, Инк. filed Critical Моторола, Инк. (US)
Publication of RU2007118667A publication Critical patent/RU2007118667A/ru

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/768Arrangements for image or video recognition or understanding using pattern recognition or machine learning using context analysis, e.g. recognition aided by known co-occurring patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/1444Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/26Techniques for post-processing, e.g. correcting the recognition result
    • G06V30/262Techniques for post-processing, e.g. correcting the recognition result using context analysis, e.g. lexical, syntactic or semantic context
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Machine Translation (AREA)
  • Character Discrimination (AREA)
  • Character Input (AREA)

Claims (10)

1. Способ, используемый в электронном устройстве для визуальной интерпретации текста, содержащий этапы, на которых:
захватывают изображение, которое включает в себя текстовую информацию, имеющую захваченные слова, которые организованы в захваченной компоновке;
выполняют оптическое распознавание символов в части изображения, чтобы сформировать совокупность распознанных слов, которые организованы в захваченной компоновке;
выбирают наиболее вероятную предметную область из множества предметных областей, причем каждая предметная область имеет ассоциативно связанный набор компоновок предметных областей, при этом каждая компоновка предметной области содержит набор структур признаков и правил отношений;
формируют структурированную совокупность структур признаков из набора компоновок предметных областей, которая по существу совпадает с захваченной компоновкой;
организуют совокупность распознанных слов согласно структурированной совокупности структур признаков в структурированную информацию предметной области и
используют структурированную информацию предметной области в приложении, которое является характерным для предметной области.
2. Способ по п. 1, в котором захваченные слова представлены на первом языке и в котором использование структурированной информации предметной области содержит этапы, на которых:
переводят структурированную информацию предметной области в переведенные слова второго языка с помощью характерного для предметной области машинного переводчика второго языка и
представляют переведенные слова визуально, используя захваченную компоновку.
3. Способ по п. 2, в котором характерный для предметной области машинный переводчик включает в себя переводы значков и в котором, когда изображение включает в себя значок, перевод включает в себя этап, на котором переводят значок в переведенный значок, который включает в себя, по меньшей мере, одно из переведенного изображения и переведенного слова с помощью характерного для предметной области машинного переводчика второго языка, и в котором представление включает в себя этап, на котором представляют переведенные слова и переведенный значок с помощью захваченной компоновки.
4. Способ по п.2, в котором использование структурированной информации предметной области дополнительно содержит этапы, на которых:
идентифицируют выбранную пользователем часть переведенных слов и
представляют соответствующую часть захваченных слов, которая соответствует выбранной пользователем части переведенных слов.
5. Способ по п.1, в котором использование структурированной информации предметной области дополнительно содержит этапы, на которых:
идентифицируют выбранную пользователем часть захваченной компоновки;
переводят соответствующую часть структурированной информации предметной области в переведенные слова второго языка с помощью характерного для предметной области машинного переводчика второго языка и
представляют переведенные слова соответствующей части с помощью структурированной компоновки.
6. Способ по п. 1, в котором наиболее вероятная предметная область, по меньшей мере, частично выбирается с помощью одного или более вводов от пользователя.
7. Способ по п. 1, в котором наиболее вероятная предметная область, по меньшей мере, частично выбирается с помощью словаря предметной области и одного или более слов из совокупности распознанных слов.
8. Способ по п. 1, в котором наиболее вероятная предметная область выбирается с помощью информации о географическом местоположении, получаемой электронным устройством, и базы данных местоположений по предметной области, сохраненной в электронном устройстве.
9. Способ по п. 1, дополнительно содержащий этап, на котором выбирают приложение, которое является характерным для предметной области, из набора характерных для предметной области приложений.
10. Электронное устройство для визуальной интерпретации текста, содержащее:
средство захвата для захвата изображения, которое включает в себя текстовую информацию, имеющую захваченные слова, которые организованы в захваченной компоновке;
средство оптического распознавания символов для выполнения оптического распознавания символов (OCR) в части изображения, чтобы сформировать совокупность распознанных слов, которые организованы в захваченной компоновке;
средство определения предметной области для выбора наиболее вероятной предметной области из множества предметных областей, причем каждая предметная область имеет ассоциативно связанный набор компоновок предметных областей, при этом каждая компоновка предметной области содержит набор структур признаков и правил отношений;
средство формирования структуры для формирования структурированной совокупности структур признаков из набора компоновок предметных областей, которая по существу совпадает с захваченной компоновкой;
средство организации информации для организации совокупности распознанных слов согласно структурированной совокупности структур признаков в структурированную информацию предметной области и
множество конкретных для характерных области приложений, из которых выбирается одно, чтобы использовать структурированную информацию предметной области.
RU2007118667/09A 2004-10-20 2005-10-05 Электронное устройство и способ визуальной интерпретации текста RU2007118667A (ru)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/969,372 2004-10-20
US10/969,372 US20060083431A1 (en) 2004-10-20 2004-10-20 Electronic device and method for visual text interpretation

Publications (1)

Publication Number Publication Date
RU2007118667A true RU2007118667A (ru) 2008-11-27

Family

ID=36180812

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2007118667/09A RU2007118667A (ru) 2004-10-20 2005-10-05 Электронное устройство и способ визуальной интерпретации текста

Country Status (7)

Country Link
US (1) US20060083431A1 (ru)
EP (1) EP1803076A4 (ru)
KR (1) KR20070058635A (ru)
CN (1) CN101044494A (ru)
BR (1) BRPI0516979A (ru)
RU (1) RU2007118667A (ru)
WO (1) WO2006044207A2 (ru)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8296808B2 (en) * 2006-10-23 2012-10-23 Sony Corporation Metadata from image recognition
US20080094496A1 (en) * 2006-10-24 2008-04-24 Kong Qiao Wang Mobile communication terminal
US20080153963A1 (en) * 2006-12-22 2008-06-26 3M Innovative Properties Company Method for making a dispersion
CN101620680B (zh) * 2008-07-03 2014-06-25 三星电子株式会社 字符图像的识别和翻译方法以及装置
US9323854B2 (en) * 2008-12-19 2016-04-26 Intel Corporation Method, apparatus and system for location assisted translation
US8373724B2 (en) * 2009-01-28 2013-02-12 Google Inc. Selective display of OCR'ed text and corresponding images from publications on a client device
JP4759638B2 (ja) * 2009-12-25 2011-08-31 株式会社スクウェア・エニックス リアルタイムなカメラ辞書
US9092674B2 (en) * 2011-06-23 2015-07-28 International Business Machines Corportion Method for enhanced location based and context sensitive augmented reality translation
CN102831200A (zh) * 2012-08-07 2012-12-19 北京百度网讯科技有限公司 一种基于图像文字识别的商品推送方法和装置
CN102855480A (zh) * 2012-08-07 2013-01-02 北京百度网讯科技有限公司 一种图像文字识别方法和装置
US9519641B2 (en) * 2012-09-18 2016-12-13 Abbyy Development Llc Photography recognition translation
US20140156412A1 (en) * 2012-12-05 2014-06-05 Good Clean Collective, Inc. Rating personal care products based on ingredients
US20150310767A1 (en) * 2014-04-24 2015-10-29 Omnivision Technologies, Inc. Wireless Typoscope
KR20160071144A (ko) * 2014-12-11 2016-06-21 엘지전자 주식회사 이동단말기 및 그 제어 방법
CN107273106B (zh) * 2016-04-08 2021-07-06 北京三星通信技术研究有限公司 物体信息翻译、以及衍生信息获取方法和装置
CN108415906B (zh) * 2018-03-28 2021-08-17 中译语通科技股份有限公司 基于领域自动识别篇章机器翻译方法、机器翻译系统
CN114254660A (zh) * 2020-09-22 2022-03-29 北京三星通信技术研究有限公司 多模态翻译方法、装置、电子设备及计算机可读存储介质

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US216922A (en) * 1879-06-24 Improvement in governors for engines
US202683A (en) * 1878-04-23 Improvement in buckle loop and fastener for carfilage-tops, harness
US195749A (en) * 1877-10-02 Improvement in compositions for making hydraulic cement
US2198713A (en) * 1937-08-16 1940-04-30 Grotelite Company Injection molding machine
CA2155891A1 (en) * 1994-10-18 1996-04-19 Raymond Amand Lorie Optical character recognition system having context analyzer
US5903860A (en) * 1996-06-21 1999-05-11 Xerox Corporation Method of conjoining clauses during unification using opaque clauses
US5933531A (en) * 1996-08-23 1999-08-03 International Business Machines Corporation Verification and correction method and system for optical character recognition
US6182029B1 (en) * 1996-10-28 2001-01-30 The Trustees Of Columbia University In The City Of New York System and method for language extraction and encoding utilizing the parsing of text data in accordance with domain parameters
US6049622A (en) * 1996-12-05 2000-04-11 Mayo Foundation For Medical Education And Research Graphic navigational guides for accurate image orientation and navigation
US6298158B1 (en) * 1997-09-25 2001-10-02 Babylon, Ltd. Recognition and translation system and method
ITUD980032A1 (it) * 1998-03-03 1998-06-03 Agostini Organizzazione Srl D Sistema di traduzione a macchina e rispettivo tradsistema di traduzione a macchina e rispettivo traduttore che comprende tale sistema uttore che comprende tale sistema
US6356865B1 (en) * 1999-01-29 2002-03-12 Sony Corporation Method and apparatus for performing spoken language translation
US20010032070A1 (en) * 2000-01-10 2001-10-18 Mordechai Teicher Apparatus and method for translating visual text
US6823084B2 (en) * 2000-09-22 2004-11-23 Sri International Method and apparatus for portably recognizing text in an image sequence of scene imagery
US7031553B2 (en) * 2000-09-22 2006-04-18 Sri International Method and apparatus for recognizing text in an image sequence of scene imagery
US7085708B2 (en) * 2000-09-23 2006-08-01 Ravenflow, Inc. Computer system with natural language to machine language translator
US20020131636A1 (en) * 2001-03-19 2002-09-19 Darwin Hou Palm office assistants
JP4304268B2 (ja) * 2001-08-10 2009-07-29 独立行政法人情報通信研究機構 複数言語対訳テキスト入力による第3言語テキスト生成アルゴリズム及び装置、プログラム
US20030061022A1 (en) * 2001-09-21 2003-03-27 Reinders James R. Display of translations in an interleaved fashion with variable spacing
US7424129B2 (en) * 2001-11-19 2008-09-09 Ricoh Company, Ltd Printing system with embedded audio/video content recognition and processing
US20030200078A1 (en) * 2002-04-19 2003-10-23 Huitao Luo System and method for language translation of character strings occurring in captured image data
US20030202683A1 (en) * 2002-04-30 2003-10-30 Yue Ma Vehicle navigation system that automatically translates roadside signs and objects
WO2004042620A1 (en) * 2002-11-04 2004-05-21 Deepq Technologies, A General Partnership Document processing based on a digital document image input with a confirmatory receipt output
US20040210444A1 (en) * 2003-04-17 2004-10-21 International Business Machines Corporation System and method for translating languages using portable display device
US20050197825A1 (en) * 2004-03-05 2005-09-08 Lucent Technologies Inc. Personal digital assistant with text scanner and language translator

Also Published As

Publication number Publication date
WO2006044207A2 (en) 2006-04-27
US20060083431A1 (en) 2006-04-20
WO2006044207A3 (en) 2006-09-21
EP1803076A2 (en) 2007-07-04
BRPI0516979A (pt) 2008-09-30
EP1803076A4 (en) 2008-03-05
KR20070058635A (ko) 2007-06-08
CN101044494A (zh) 2007-09-26

Similar Documents

Publication Publication Date Title
RU2007118667A (ru) Электронное устройство и способ визуальной интерпретации текста
US8874604B2 (en) Method and system for searching an electronic map
CN109657068B (zh) 面向智慧博物馆的文物知识图谱生成与可视化方法
US7340450B2 (en) Data search system and data search method using a global unique identifier
Baroni et al. WebBootCaT. instant domain-specific corpora to support human translators
JP5501967B2 (ja) 間接話法内の意味論的関係の識別
EP2144189A3 (en) Method for recognizing and translating characters in camera-based image
CN105045852A (zh) 一种教学资源的全文搜索引擎系统
CN1685313A (zh) 由指针发起的对电子文档中文本信息的即时双语注释
CN1894685A (zh) 翻译工具
US20120162244A1 (en) Image search color sketch filtering
CN106384108A (zh) 文字内容检索方法及词语解读装置和移动终端
EP2806336A1 (en) Text prediction in a text input associated with an image
Chaves et al. A geographic knowledge base for semantic web applications
KR101709055B1 (ko) 오픈 웹 질의응답을 위한 질문분석 장치 및 방법
US20050004902A1 (en) Information retrieving system, information retrieving method, and information retrieving program
JP5484113B2 (ja) 文書画像関連情報提供装置、及び文書画像関連情報取得システム
Dorr et al. Lexical conceptual structure of literal and metaphorical spatial language: A case study of “push”
KR100745367B1 (ko) 템플릿에 기반한 기록정보 색인 및 검색 방법과 이를이용한 질의응답 시스템
JPWO2014170965A1 (ja) 文書処理方法、文書処理装置および文書処理プログラム
JP2018112806A (ja) 画像関連付け装置、画像データベース、画像検索装置、画像検索システム及びプログラム
CN116303990B (zh) 一种古籍数据库管理方法、系统、终端及介质
JP2005025478A (ja) 情報検索方法、情報検索プログラムおよび情報検索装置
KR20020006223A (ko) 자동 색인 로봇 시스템 및 이를 이용한 처리 방법
Katz et al. Viewing the Web as a Virtual Database for Question Answering.

Legal Events

Date Code Title Description
FA92 Acknowledgement of application withdrawn (lack of supplementary materials submitted)

Effective date: 20090216