KR20190099852A - 문자를 인식하기 위한 전자 장치 및 방법 - Google Patents

문자를 인식하기 위한 전자 장치 및 방법 Download PDF

Info

Publication number
KR20190099852A
KR20190099852A KR1020180019847A KR20180019847A KR20190099852A KR 20190099852 A KR20190099852 A KR 20190099852A KR 1020180019847 A KR1020180019847 A KR 1020180019847A KR 20180019847 A KR20180019847 A KR 20180019847A KR 20190099852 A KR20190099852 A KR 20190099852A
Authority
KR
South Korea
Prior art keywords
image
text
server
data
electronic device
Prior art date
Application number
KR1020180019847A
Other languages
English (en)
Other versions
KR102585645B1 (ko
Inventor
최주용
김진현
김미수
최정인
임연욱
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020180019847A priority Critical patent/KR102585645B1/ko
Priority to PCT/KR2019/001903 priority patent/WO2019164196A1/ko
Priority to CN201980014395.1A priority patent/CN111801690A/zh
Priority to US16/963,628 priority patent/US11308317B2/en
Priority to EP19757504.6A priority patent/EP3731142A4/en
Publication of KR20190099852A publication Critical patent/KR20190099852A/ko
Application granted granted Critical
Publication of KR102585645B1 publication Critical patent/KR102585645B1/ko

Links

Images

Classifications

    • G06K9/3258
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • G06F17/289
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/123Storage facilities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N5/225
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/765Interface circuits between an apparatus for recording and another apparatus
    • H04N5/77Interface circuits between an apparatus for recording and another apparatus between a recording apparatus and a television camera
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/765Interface circuits between an apparatus for recording and another apparatus
    • H04N5/77Interface circuits between an apparatus for recording and another apparatus between a recording apparatus and a television camera
    • H04N5/772Interface circuits between an apparatus for recording and another apparatus between a recording apparatus and a television camera the recording apparatus and the television camera being placed in the same enclosure
    • G06K2209/01
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Abstract

본 문서에 개시되는 일 실시 예에 따른 전자 장치는, 이미지 데이터를 생성하기 위한 이미징 장치(an imaging device), 통신 회로(a communication circuit), 상기 이미징 장치 및 상기 통신 회로와 작동적으로 연결되는 적어도 하나의 프로세서(at least one processor), 상기 프로세서와 작동적으로 연결되고 명령어를 저장하는 메모리(a memory)를 포함하고, 상기 명령어는 상기 프로세서로 하여금 상기 이미징 장치로부터 제1 이미지(a first image)를 포함하는 제1 이미지 데이터(first image data)를 수신하고, 상기 통신 회로를 통해 제1 서버(a first server)로 상기 제1 이미지 데이터를 전송하고, 상기 통신 회로를 통해 상기 제1 서버로부터 상기 제1 이미지 데이터로부터 인식된 제1 텍스트(a first text)를 포함하는 제1 텍스트 데이터(first text data)를 수신하고, 상기 이미징 장치로부터 상기 제1 이미지의 일부를 포함하는 제2 이미지(a second image)를 포함하는 제2 이미지 데이터(second image data)를 수신하고, 상기 제1 텍스트 데이터의 적어도 일부를 포함하는 제2 텍스트 데이터(second text data) 및 상기 제2 이미지 데이터의 전체가 아닌 일부를 상기 통신 회로를 통해 상기 제1 서버로 전송하도록 할 수 있다. 이 외에도 명세서를 통해 파악되는 다양한 실시 예가 가능하다.

Description

문자를 인식하기 위한 전자 장치 및 방법{ELECTRONIC DEVICE AND METHOD FOR RECOGNIZING CHARACTER}
본 문서에서 개시되는 실시 예들은 위한 문자 인식 기술과 관련된다.
광학 문자 인식(Optical character recognition; OCR)은 사람이 수기로 작성하거나 기계에 의해 인쇄된 문자를 전자 장치(예: 스마트 폰)가 인식할 수 있는 데이터로 변환하는 기술을 의미한다. 예컨대, 전자 장치가 간판을 향하도록 사용자가 전자 장치를 회전시킬 경우, 전자 장치는 OCR 기술을 통해 상기 간판에 기재된 문자를 인식할 수 있다.
상기 OCR 기술은 전자 장치 내에서 수행되는 Embedded OCR 기술과 서버에서 수행되는 Server OCR 기술로 분류될 수 있다. Embedded OCR 기술의 경우 처리 속도는 빠르지만, 전자 장치 성능의 한계로 정확도가 떨어질 수 있다. 반면, Server OCR 기술의 경우 전자 장치가 서버로 데이터를 전송해야 하므로 처리 속도는 느리지만, 높은 정확도를 가질 수 있다.
최근에는 정교한 문자 인식을 요구하는 사용자들이 증가함에 따라 Server OCR 기술에 대한 관심과 요구 또한 증가하고 있다. 그러나, 앞서 언급한 바와 같이 상기 Server OCR 기술의 경우 전자 장치가 서버로 데이터를 전송해야 하므로 처리 속도가 느릴 수 있다. 특히 상기 데이터의 양이 많을 경우 문자를 인식하는데 걸리는 시간은 더욱 느릴 수 있다.
본 문서에서 개시되는 실시 예들은, 전술한 문제 및 본 문서에서 제기되는 과제들을 해결하기 위한 전자 장치를 제공하고자 한다.
본 문서에 개시되는 일 실시 예에 따른 전자 장치는, 이미지 데이터를 생성하기 위한 이미징 장치(an imaging device), 통신 회로(a communication circuit), 상기 이미징 장치 및 상기 통신 회로와 작동적으로 연결되는 적어도 하나의 프로세서(at least one processor), 상기 프로세서와 작동적으로 연결되고 명령어를 저장하는 메모리(a memory)를 포함하고, 상기 명령어는 상기 프로세서로 하여금 상기 이미징 장치로부터 제1 이미지(a first image)를 포함하는 제1 이미지 데이터(first image data)를 수신하고, 상기 통신 회로를 통해 제1 서버(a first server)로 상기 제1 이미지 데이터를 전송하고, 상기 통신 회로를 통해 상기 제1 서버로부터 상기 제1 이미지 데이터로부터 인식된 제1 텍스트(a first text)를 포함하는 제1 텍스트 데이터(first text data)를 수신하고, 상기 이미징 장치로부터 상기 제1 이미지의 일부를 포함하는 제2 이미지(a second image)를 포함하는 제2 이미지 데이터(second image data)를 수신하고, 상기 제1 텍스트 데이터의 적어도 일부를 포함하는 제2 텍스트 데이터(second text data) 및 상기 제2 이미지 데이터의 전체가 아닌 일부를 상기 통신 회로를 통해 상기 제1 서버로 전송하도록 할 수 있다.
또한, 본 문서에 개시되는 일 실시 예에 따른 방법은, 이미징 장치로부터 제1 이미지(a first image)를 포함하는 제1 이미지 데이터(first image data)를 수신하는 동작, 통신 회로를 통해 제1 서버(a first server)로 상기 제1 이미지 데이터를 전송하는 동작, 상기 통신 회로를 통해 상기 제1 서버로부터 상기 제1 이미지 데이터로부터 인식된 제1 텍스트(a first text)를 포함하는 제1 텍스트 데이터(first text data)를 수신하는 동작, 상기 이미징 장치로부터 상기 제1 이미지의 일부를 포함하는 제2 이미지(a second image)를 포함하는 제2 이미지 데이터(second image data)를 수신하는 동작, 및 상기 제1 텍스트 데이터의 적어도 일부를 포함하는 제2 텍스트 데이터(second text data) 및 상기 제2 이미지 데이터의 전체가 아닌 일부를 상기 통신 회로를 통해 상기 제1 서버로 전송하는 동작을 포함할 수 있다.
본 문서에 개시되는 일 실시 예에 따른 전자 장치는, 카메라(a camera), 상기 카메라를 통해 인식되는 이미지를 출력하는 디스플레이(a display), 상기 이미지를 제1 서버로 전송하는 통신 회로(a communication circuit), 상기 카메라, 상기 디스플레이, 및 상기 통신 회로와 전기적으로 연결되는 프로세서(a processor), 및 상기 프로세서와 작동적으로 연결되고, 명령어 및 상기 이미지를 캡쳐(capture)하는 어플리케이션을 저장하는 메모리(memory)를 포함하고, 상기 명령어는 상기 상기 프로세서로 하여금 상기 어플리케이션을 실행하는 사용자 입력에 응답하여 상기 디스플레이를 통해 출력되는 제1 이미지를 캡쳐하고, 상기 제1 이미지를 상기 제1 서버로 전송하고, 상기 제1 이미지에서 추출된 제1 텍스트를 상기 제1 서버로부터 수신하여 상기 디스플레이를 통해 출력하고, 상기 디스플레이를 통해 상기 제1 이미지의 적어도 일부를 포함하는 제2 이미지가 출력되면, 상기 제2 이미지 중 상기 제1 이미지와 중첩하는 영역에 위치하고 상기 제1 텍스트의 적어도 일부를 포함하는 제2 텍스트는 제1 타입 데이터로 상기 제1 서버에 전송하고, 상기 제2 이미지 중 상기 제1 이미지와 중첩하지 않는 영역은 제2 타입 데이터로 상기 제1 서버에 전송하고, 상기 제1 타입 데이터 및 상기 제2 타입 데이터에서 추출된 제3 텍스트를 상기 제1 서버로부터 수신하여 상기 디스플레이를 통해 출력하도록 할 수 있다.
본 문서에 개시되는 일 실시 예에 따른 방법은, 사용자 입력에 응답하여 디스플레이를 통해 출력되는 제1 이미지를 캡쳐하는 동작, 상기 제1 이미지를 제1 서버로 전송하는 동작, 상기 제1 이미지에서 추출된 제1 텍스트를 상기 제1 서버로부터 수신하여 상기 디스플레이를 통해 출력하는 동작, 상기 디스플레이를 통해 상기 제1 이미지의 적어도 일부를 포함하는 제2 이미지가 출력되면, 상기 제2 이미지 중 상기 제1 이미지와 중첩하는 영역에 위치하고 상기 제1 텍스트의 적어도 일부를 포함하는 제2 텍스트는 제1 타입 데이터로 상기 제1 서버에 전송하고, 상기 제2 이미지 중 상기 제1 이미지와 중첩하지 않는 영역은 제2 타입 데이터로 상기 제1 서버에 전송하는 동작, 및 상기 제1 타입 데이터 및 상기 제2 타입 데이터에서 추출된 제3 텍스트를 상기 제1 서버로부터 수신하여 상기 디스플레이를 통해 출력하는 동작을 포함할 수 있다.
본 문서에 개시되는 실시 예들에 따르면, 문자 인식 시간을 단축시킬 수 있다.
이 외에, 본 문서를 통해 직접적 또는 간접적으로 파악되는 다양한 효과들이 제공될 수 있다.
도 1은 다양한 실시예들에 따른 네트워크 환경 내의 전자 장치의 블럭도이다.
도 2는 다양한 실시예에 따른 프로그램의 블록도이다.
도 3은 본 발명의 일 실시 예에 따른 텍스트 인식 시스템을 나타낸다.
도 4a는 본 발명의 일 실시 예에 따른 텍스트 인식 시스템의 동작 흐름도를 나타낸다.
도 4b는 본 발명의 일 실시 예에 따른 전자 장치의 동작 흐름도를 나타낸다.
도 5는 본 발명의 일 실시 예에 따른 디스플레이를 통해 출력되는 화면 및 제1 이미지를 나타낸다.
도 6a는 본 발명의 일 실시 예에 따른 제1 텍스트를 나타낸다.
도 6b는 본 발명의 다른 실시 예에 따른 제1 텍스트를 나타낸다.
도 7a는 본 발명의 일 실시 예에 따른 전자 장치의 이미지의 변경 여부를 확인하는 예시도이다.
도 7b는 본 발명의 다른 실시 예에 따른 전자 장치의 이미지의 변경 여부를 확인하는 예시도이다.
도 8a는 본 발명의 일 실시 예에 따른 제1 이미지를 나타낸다.
도 8b는 본 발명의 일 실시 예에 따른 제2 이미지를 나타낸다.
도 9는 본 발명의 일 예에 따른 전자 장치의 동작 환경을 나타낸다.
도 1은 다양한 실시예들에 따른 네트워크 환경 내의 전자 장치의 블럭도이다.
도 1을 참조하면, 네트워크 환경(100)에서 전자 장치(101)는 제 1 네트워크(198)(예: 근거리 무선 통신 네트워크)를 통하여 전자 장치(102)와 통신하거나, 또는 제 2 네트워크(199)(예: 원거리 무선 통신 네트워크)를 통하여 전자 장치(104) 또는 서버(108)와 통신할 수 있다. 일실시예에 따르면, 전자 장치(101)는 서버(108)를 통하여 전자 장치(104)와 통신할 수 있다. 일실시예에 따르면, 전자 장치(101)는 프로세서(120), 메모리(130), 입력 장치(150), 음향 출력 장치(155), 표시 장치(160), 오디오 모듈(170), 센서 모듈(176), 인터페이스(177), 햅틱 모듈(179), 카메라 모듈(180), 전력 관리 모듈(188), 배터리(189), 통신 모듈(190), 가입자 식별 모듈(196), 또는 안테나 모듈(197)을 포함할 수 있다. 어떤 실시예에서는, 전자 장치(101)에는, 이 구성요소들 중 적어도 하나(예: 표시 장치(160) 또는 카메라 모듈(180))가 생략되거나, 하나 이상의 다른 구성 요소가 추가될 수 있다. 어떤 실시예에서는, 이 구성요소들 중 일부들은 하나의 통합된 회로로 구현될 수 있다. 예를 들면, 센서 모듈(176)(예: 지문 센서, 홍채 센서, 또는 조도 센서)은 표시 장치(160)(예: 디스플레이)에 임베디드된 채 구현될 수 있다
프로세서(120)는, 예를 들면, 소프트웨어(예: 프로그램(140))를 실행하여 프로세서(120)에 연결된 전자 장치(101)의 적어도 하나의 다른 구성요소(예: 하드웨어 또는 소프트웨어 구성요소)을 제어할 수 있고, 다양한 데이터 처리 또는 연산을 수행할 수 있다. 일실시예에 따르면, 데이터 처리 또는 연산의 적어도 일부로서, 프로세서(120)는 다른 구성요소(예: 센서 모듈(176) 또는 통신 모듈(190))로부터 수신된 명령 또는 데이터를 휘발성 메모리(132)에 로드하고, 휘발성 메모리(132)에 저장된 명령 또는 데이터를 처리하고, 결과 데이터를 비휘발성 메모리(134)에 저장할 수 있다. 일실시예에 따르면, 프로세서(120)는 메인 프로세서(121)(예: 중앙 처리 장치 또는 어플리케이션 프로세서), 및 이와는 독립적으로 또는 함께 운영 가능한 보조 프로세서(123)(예: 그래픽 처리 장치, 이미지 시그널 프로세서, 센서 허브 프로세서, 또는 커뮤니케이션 프로세서)를 포함할 수 있다. 추가적으로 또는 대체적으로, 보조 프로세서(123)은 메인 프로세서(121)보다 저전력을 사용하거나, 또는 지정된 기능에 특화되도록 설정될 수 있다. 보조 프로세서(123)는 메인 프로세서(121)와 별개로, 또는 그 일부로서 구현될 수 있다.
보조 프로세서(123)는, 예를 들면, 메인 프로세서(121)가 인액티브(예: 슬립) 상태에 있는 동안 메인 프로세서(121)를 대신하여, 또는 메인 프로세서(121)가 액티브(예: 어플리케이션 실행) 상태에 있는 동안 메인 프로세서(121)와 함께, 전자 장치(101)의 구성요소들 중 적어도 하나의 구성요소(예: 표시 장치(160), 센서 모듈(176), 또는 통신 모듈(190))와 관련된 기능 또는 상태들의 적어도 일부를 제어할 수 있다. 일실시예에 따르면, 보조 프로세서(123)(예: 이미지 시그널 프로세서 또는 커뮤니케이션 프로세서)는 기능적으로 관련 있는 다른 구성 요소(예: 카메라 모듈(180) 또는 통신 모듈(190))의 일부로서 구현될 수 있다.
메모리(130)는, 전자 장치(101)의 적어도 하나의 구성요소(예: 프로세서(120) 또는 센서모듈(176))에 의해 사용되는 다양한 데이터를 저장할 수 있다. 데이터는, 예를 들어, 소프트웨어(예: 프로그램(140)) 및, 이와 관련된 명령에 대한 입력 데이터 또는 출력 데이터를 포함할 수 있다. 메모리(130)는, 휘발성 메모리(132) 또는 비휘발성 메모리(134)를 포함할 수 있다.
프로그램(140)은 메모리(130)에 소프트웨어로서 저장될 수 있으며, 예를 들면, 운영 체제(142), 미들 웨어(144) 또는 어플리케이션(146)을 포함할 수 있다.
입력 장치(150)는, 전자 장치(101)의 구성요소(예: 프로세서(120))에 사용될 명령 또는 데이터를 전자 장치(101)의 외부(예: 사용자)로부터 수신할 수 있다. 입력 장치(150)은, 예를 들면, 마이크, 마우스, 또는 키보드를 포함할 수 있다.
음향 출력 장치(155)는 음향 신호를 전자 장치(101)의 외부로 출력할 수 있다. 음향 출력 장치(155)는, 예를 들면, 스피커 또는 리시버를 포함할 수 있다. 스피커는 멀티미디어 재생 또는 녹음 재생과 같이 일반적인 용도로 사용될 수 있고, 리시버는 착신 전화를 수신하기 위해 사용될 수 있다. 일실시예에 따르면, 리시버는 스피커와 별개로, 또는 그 일부로서 구현될 수 있다.
표시 장치(160)는 전자 장치(101)의 외부(예: 사용자)로 정보를 시각적으로 제공할 수 있다. 표시 장치(160)은, 예를 들면, 디스플레이, 홀로그램 장치, 또는 프로젝터 및 해당 장치를 제어하기 위한 제어 회로를 포함할 수 있다. 일실시예에 따르면, 표시 장치(160)는 터치를 감지하도록 설정된 터치 회로(touch circuitry), 또는 상기 터치에 의해 발생되는 힘의 세기를 측정하도록 설정된 센서 회로(예: 압력 센서)를 포함할 수 있다.
오디오 모듈(170)은 소리를 전기 신호로 변환시키거나, 반대로 전기 신호를 소리로 변환시킬 수 있다. 일실시예에 따르면, 오디오 모듈(170)은, 입력 장치(150)를 통해 소리를 획득하거나, 음향 출력 장치(155), 또는 전자 장치(101)와 직접 또는 무선으로 연결된 외부 전자 장치(예: 전자 장치(102)) (예: 스피커 또는 헤드폰))를 통해 소리를 출력할 수 있다.
센서 모듈(176)은 전자 장치(101)의 작동 상태(예: 전력 또는 온도), 또는 외부의 환경 상태(예: 사용자 상태)를 감지하고, 감지된 상태에 대응하는 전기 신호 또는 데이터 값을 생성할 수 있다. 일실시예에 따르면, 센서 모듈(176)은, 예를 들면, 제스처 센서, 자이로 센서, 기압 센서, 마그네틱 센서, 가속도 센서, 그립 센서, 근접 센서, 컬러 센서, IR(infrared) 센서, 생체 센서, 온도 센서, 습도 센서, 또는 조도 센서를 포함할 수 있다.
인터페이스(177)는 전자 장치(101)이 외부 전자 장치(예: 전자 장치(102))와 직접 또는 무선으로 연결되기 위해 사용될 수 있는 하나 이상의 지정된 프로토콜들을 지원할 수 있다. 일실시예에 따르면, 인터페이스(177)는, 예를 들면, HDMI(high definition multimediainterface), USB(universal serial bus) 인터페이스, SD카드 인터페이스, 또는 오디오 인터페이스를 포함할 수 있다.
연결 단자(178)는, 그를 통해서 전자 장치(101)가 외부 전자 장치(예: 전자 장치(102))와 물리적으로 연결될 수 있는 커넥터를 포함할 수 있다. 일실시예에 따르면, 연결 단자(178)은, 예를 들면, HDMI 커넥터, USB 커넥터, SD 카드 커넥터, 또는 오디오 커넥터(예: 헤드폰 커넥터)를 포함할 수 있다.
햅틱 모듈(179)은 전기적 신호를 사용자가 촉각 또는 운동 감각을 통해서 인지할 수 있는 기계적인 자극(예: 진동 또는 움직임) 또는 전기적인 자극으로 변환할 수 있다. 일실시예에 따르면, 햅틱 모듈(179)은, 예를 들면, 모터, 압전 소자, 또는 전기 자극 장치를 포함할 수 있다.
카메라 모듈(180)은 정지 영상 및 동영상을 촬영할 수 있다. 일실시예에 따르면, 카메라 모듈(180)은 하나 이상의 렌즈들, 이미지 센서들, 이미지 시그널 프로세서들, 또는 플래시들을 포함할 수 있다.
전력 관리 모듈(188)은 전자 장치(101)에 공급되는 전력을 관리할 수 있다. 일실시예에 따르면, 전력 관리 모듈(388)은, 예를 들면, PMIC(power management integrated circuit)의 적어도 일부로서 구현될 수 있다.
배터리(189)는 전자 장치(101)의 적어도 하나의 구성 요소에 전력을 공급할 수 있다. 일실시예에 따르면, 배터리(189)는, 예를 들면, 재충전 불가능한 1차 전지, 재충전 가능한 2차 전지 또는 연료 전지를 포함할 수 있다.
통신 모듈(190)은 전자 장치(101)와 외부 전자 장치(예: 전자 장치(102), 전자 장치(104), 또는 서버(108))간의 직접(예: 유선) 통신 채널 또는 무선 통신 채널의 수립, 및 수립된 통신 채널을 통한 통신 수행을 지원할 수 있다. 통신 모듈(190)은 프로세서(120)(예: 어플리케이션 프로세서)와 독립적으로 운영되고, 직접(예: 유선) 통신 또는 무선 통신을 지원하는 하나 이상의 커뮤니케이션 프로세서를 포함할 수 있다. 일실시예에 따르면, 통신 모듈(190)은 무선 통신 모듈(192)(예: 셀룰러 통신 모듈, 근거리 무선 통신 모듈, 또는 GNSS(global navigation satellite system) 통신 모듈) 또는 유선 통신 모듈(194)(예: LAN(local area network) 통신 모듈, 또는 전력선 통신 모듈)을 포함할 수 있다. 이들 통신 모듈 중 해당하는 통신 모듈은 제 1 네트워크(198)(예: 블루투스, WiFi direct 또는 IrDA(infrared data association) 같은 근거리 통신 네트워크) 또는 제 2 네트워크(199)(예: 셀룰러 네트워크, 인터넷, 또는 컴퓨터 네트워크(예: LAN 또는 WAN)와 같은 원거리 통신 네트워크)를 통하여 외부 전자 장치와 통신할 수 있다. 이런 여러 종류의 통신 모듈들은 하나의 구성 요소(예: 단일 칩)으로 통합되거나, 또는 서로 별도의 복수의 구성 요소들(예: 복수 칩들)로 구현될 수 있다. 무선 통신 모듈(192)은 가입자 식별 모듈(196)에 저장된 가입자 정보(예: 국제 모바일 가입자 식별자(IMSI))를 이용하여 제 1 네트워크(198) 또는 제 2 네트워크(199)와 같은 통신 네트워크 내에서 전자 장치(101)를 확인 및 인증할 수 있다.
안테나 모듈(197)은 신호 또는 전력을 외부(예: 외부 전자 장치)로 송신하거나 외부로부터 수신할 수 있다. 일실시예에 따르면, 안테나 모듈(197)은 하나 이상의 안테나들을 포함할 수 있고, 이로부터, 제 1 네트워크 198 또는 제 2 네트워크 199와 같은 통신 네트워크에서 사용되는 통신 방식에 적합한 적어도 하나의 안테나가, 예를 들면, 통신 모듈(190)에 의하여 선택될 수 있다. 신호 또는 전력은 상기 선택된 적어도 하나의 안테나를 통하여 통신 모듈(190)과 외부 전자 장치 간에 송신되거나 수신될 수 있다.
상기 구성요소들 중 적어도 일부는 주변 기기들간 통신 방식(예: 버스, GPIO(general purposeinput and output),SPI(serial peripheral interface), 또는 MIPI(mobile industry processor interface))를 통해 서로 연결되고 신호(예: 명령 또는 데이터)를 상호간에 교환할 수 있다.
일실시예에 따르면, 명령 또는 데이터는 제 2 네트워크(199)에 연결된 서버(108)를 통해서 전자 장치(101)와 외부의 전자 장치(104)간에 송신 또는 수신될 수 있다. 전자 장치(102, 104) 각각은 전자 장치(101)와 동일한 또는 다른 종류의 장치일 수 있다. 일실시예에 따르면, 전자 장치(101)에서 실행되는 동작들의 전부 또는 일부는 외부 전자 장치들(102, 104, or 108) 중 하나 이상의 외부 장치들에서 실행될 수 있다. 예를 들면, 전자 장치(101)가 어떤 기능이나 서비스를 자동으로, 또는 사용자 또는 다른 장치로부터의 요청에 반응하여 수행해야 할 경우에, 전자 장치(101)는 기능 또는 서비스를 자체적으로 실행시키는 대신에 또는 추가적으로, 하나 이상의 외부 전자 장치들에게 그 기능 또는 그 서비스의 적어도 일부를 수행하라고 요청할 수 있다. 상기 요청을 수신한 하나 이상의 외부 전자 장치들은 요청된 기능 또는 서비스의 적어도 일부, 또는 상기 요청과 관련된 추가 기능 또는 서비스를 실행하고, 그 실행의 결과를 전자 장치(101)로 전달할 수 있다. 전자 장치(101)는 상기 결과를, 그대로 또는 추가적으로 처리하여, 상기 요청에 대한 응답의 적어도 일부로서 제공할 수 있다.. 이를 위하여, 예를 들면, 클라우드 컴퓨팅, 분산 컴퓨팅, 또는 클라이언트-서버 컴퓨팅 기술이 이용될 수 있다.
도 2은 다양한 실시예에 따른 프로그램을 예시하는 블록도이다.
일실시예에 따르면, 프로그램(140)은 전자 장치(101)의 하나 이상의 리소스들을 제어하기 위한 운영 체제(142), 미들웨어(144), 또는 상기 운영 체제(142)에서 실행 가능한 어플리케이션(146)을 포함할 수 있다. 운영 체제(142)는, 예를 들면, AndroidTM, iOSTM, WindowsTM, SymbianTM, TizenTM, 또는 BadaTM를 포함할 수 있다. 프로그램(140) 중 적어도 일부 프로그램은, 예를 들면, 제조 시에 전자 장치(101)에 프리로드되거나, 또는 사용자에 의해 사용 시 외부 전자 장치(예: 전자 장치(102 또는 104), 또는 서버(108))로부터 다운로드되거나 갱신 될 수 있다.
운영 체제(142)는 전자 장치(101)의 하나 이상의 시스템 리소스들(예: 프로세스, 메모리, 또는 전원)의 관리(예: 할당 또는 회수)를 제어할 수 있다. 운영 체제(142)는, 추가적으로 또는 대체적으로, 전자 장치(101)의 다른 하드웨어 디바이스, 예를 들면, 입력 장치(150), 음향 출력 장치(155), 표시 장치(160), 오디오 모듈(170), 센서 모듈(176), 인터페이스(177), 햅틱 모듈(179), 카메라 모듈(180), 전력 관리 모듈(188), 배터리(189), 통신 모듈(190), 가입자 식별 모듈(196), 또는 안테나 모듈(197)을 구동하기 위한 하나 이상의 드라이버 프로그램들을 포함할 수 있다.
미들웨어(144)는 전자 장치(101)의 하나 이상의 리소스들로부터 제공되는 기능 또는 정보가 어플리케이션(146)에 의해 사용될 수 있도록 다양한 기능들을 어플리케이션(146)으로 제공할 수 있다. 미들웨어(144)는, 예를 들면, 어플리케이션 매니저(201), 윈도우 매니저(203), 멀티미디어 매니저(205), 리소스 매니저(207), 파워 매니저(209), 데이터베이스 매니저(211), 패키지 매니저(213), 커넥티비티 매니저(215), 노티피케이션 매니저(217), 로케이션 매니저(219), 그래픽 매니저(221), 시큐리티 매니저(223), 통화 매니저(225), 또는 음성 인식 매니저(227)를 포함할 수 있다.
어플리케이션 매니저(201)는, 예를 들면, 어플리케이션(146)의 생명 주기를 관리할 수 있다. 윈도우 매니저(203)는, 예를 들면, 화면에서 사용되는 하나 이상의 GUI 자원들을 관리할 수 있다. 멀티미디어 매니저(205)는, 예를 들면, 미디어 파일들의 재생에 필요한 하나 이상의 포맷들을 파악하고, 그 중 선택된 해당하는 포맷에 맞는 코덱을 이용하여 상기 미디어 파일들 중 해당하는 미디어 파일의 인코딩 또는 디코딩을 수행할 수 있다. 리소스 매니저(207)는, 예를 들면, 어플리케이션(146)의 소스 코드 또는 메모리(130)의 메모리의 공간을 관리할 수 있다. 파워 매니저(209)는, 예를 들면, 배터리(189)의 용량, 온도 또는 전원을 관리하고, 이 중 해당 정보를 이용하여 전자 장치(101)의 동작에 필요한 관련 정보를 결정 또는 제공할 수 있다. 일실시예에 따르면, 파워 매니저(209)는 전자 장치(101)의 바이오스(BIOS: basic input/output system)(미도시)와 연동할 수 있다.
데이터베이스 매니저(211)는, 예를 들면, 어플리케이션(146)에 의해 사용될 데이터베이스를 생성, 검색, 또는 변경할 수 있다. 패키지 매니저(213)는, 예를 들면, 패키지 파일의 형태로 배포되는 어플리케이션의 설치 또는 갱신을 관리할 수 있다. 커넥티비티 매니저(215)는, 예를 들면, 전자 장치(101)와 외부 전자 장치 간의 무선 연결 또는 직접 연결을 관리할 수 있다. 노티피케이션 매니저(217)는, 예를 들면, 지정된 이벤트(예: 착신 통화, 메시지, 또는 알람)의 발생을 사용자에게 알리기 위한 기능을 제공할 수 있다. 로케이션 매니저(219)는, 예를 들면, 전자 장치(101)의 위치 정보를 관리할 수 있다. 그래픽 매니저(221)는, 예를 들면, 사용자에게 제공될 하나 이상의 그래픽 효과들 또는 이와 관련된 사용자 인터페이스를 관리할 수 있다.
시큐리티 매니저(223)는, 예를 들면, 시스템 보안 또는 사용자 인증을 제공할 수 있다. 통화(telephony) 매니저(225)는, 예를 들면, 전자 장치(101)에 의해 제공되는 음성 통화 기능 또는 영상 통화 기능을 관리할 수 있다. 음성 인식 매니저(227)는, 예를 들면, 사용자의 음성 데이터를 서버(108)로 전송하고, 그 음성 데이터에 적어도 일부 기반하여 전자 장치(101)에서 수행될 기능에 대응하는 명령어(command), 또는 그 음성 데이터에 적어도 일부 기반하여 변환된 문자 데이터를 서버(108)로부터 수신할 수 있다. 일 실시예에 따르면, 미들웨어(244)는 동적으로 기존의 구성요소를 일부 삭제하거나 새로운 구성요소들을 추가할 수 있다. 일 실시예에 따르면, 미들웨어(144)의 적어도 일부는 운영 체제(142)의 일부로 포함되거나, 또는 운영 체제(142)와는 다른 별도의 소프트웨어로 구현될 수 있다.
어플리케이션(146)은, 예를 들면, 홈(251), 다이얼러(253), SMS/MMS(255), IM(instant message)(257), 브라우저(259), 카메라(261), 알람(263), 컨택트(265), 음성 인식(267), 이메일(269), 달력(271), 미디어 플레이어(273), 앨범(275), 와치(277), 헬스(279)(예: 운동량 또는 혈당과 같은 생체 정보를 측정), 또는 환경 정보(281)(예: 기압, 습도, 또는 온도 정보 측정) 어플리케이션을 포함할 수 있다. 일실시예에 따르면, 어플리케이션(146)은 전자 장치(101)와 외부 전자 장치 사이의 정보 교환을 지원할 수 있는 정보 교환 어플리케이션(미도시)을 더 포함할 수 있다. 정보 교환 어플리케이션은, 예를 들면, 외부 전자 장치로 지정된 정보 (예: 통화, 메시지, 또는 알람)를 전달하도록 설정된 노티피케이션 릴레이 어플리케이션, 또는 외부 전자 장치를 관리하도록 설정된 장치 관리 어플리케이션을 포함할 수 있다. 노티피케이션 릴레이 어플리케이션은, 예를 들면, 전자 장치(101)의 다른 어플리케이션(예: 이메일 어플리케이션(269))에서 발생된 지정된 이벤트(예: 메일 수신)에 대응하는 알림 정보를 외부 전자 장치로 전달할 수 있다. 추가적으로 또는 대체적으로, 노티피케이션 릴레이 어플리케이션은 외부 전자 장치로부터 알림 정보를 수신하여 전자 장치(101)의 사용자에게 제공할 수 있다.
장치 관리 어플리케이션은, 예를 들면, 전자 장치(101)와 통신하는 외부 전자 장치 또는 그 일부 구성 요소(예: 표시 장치(160) 또는 카메라 모듈(180))의 전원(예: 턴-온 또는 턴-오프) 또는 기능(예: 표시 장치(160) 또는 카메라 모듈(180)의 밝기, 해상도, 또는 포커스)을 제어할 수 있다. 장치 관리 어플리케이션은, 추가적으로 또는 대체적으로, 외부 전자 장치에서 동작하는 어플리케이션의 설치, 삭제, 또는 갱신을 지원할 수 있다.
본 문서에 개시된 다양한 실시예들에 따른 전자 장치는 다양한 형태의 장치가 될 수 있다. 전자 장치는, 예를 들면, 휴대용 통신 장치 (예: 스마트폰), 컴퓨터 장치, 휴대용 멀티미디어 장치, 휴대용 의료 기기, 카메라, 웨어러블 장치, 또는 가전 장치를 포함할 수 있다. 본 문서의 실시예에 따른 전자 장치는 전술한 기기들에 한정되지 않는다.
본 문서의 다양한 실시예들 및 이에 사용된 용어들은 본 문서에 기재된 기술적 특징들을 특정한 실시예들로 한정하려는 것이 아니며, 해당 실시예의 다양한 변경, 균등물, 또는 대체물을 포함하는 것으로 이해되어야 한다. 도면의 설명과 관련하여, 유사한 또는 관련된 구성요소에 대해서는 유사한 참조 부호가 사용될 수 있다. 아이템에 대응하는 명사의 단수 형은 관련된 문맥상 명백하게 다르게 지시하지 않는 한, 상기 아이템 한 개 또는 복수 개를 포함할 수 있다. 본 문서에서, "A 또는 B", "A 및 B 중 적어도 하나", “A 또는 B 중 적어도 하나,”"A, B 또는 C," "A, B 및 C 중 적어도 하나,”및 “A, B, 또는 C 중 적어도 하나"와 같은 문구들 각각은 그 문구들 중 해당하는 문구에 함께 나열된 항목들의 모든 가능한 조합을 포함할 수 있다. "제 1", "제 2", 또는 "첫째" 또는 "둘째"와 같은 용어들은 단순히 해당 구성요소를 다른 해당 구성요소와 구분하기 위해 사용될 수 있으며, 해당 구성요소들을 다른 측면(예: 중요성 또는 순서)에서 한정하지 않는다. 어떤(예: 제 1) 구성요소가 다른(예: 제 2) 구성요소에, “기능적으로” 또는 “통신적으로”라는 용어와 함께 또는 이런 용어 없이, “커플드” 또는 “커넥티드”라고 언급된 경우, 그것은 상기 어떤 구성요소가 상기 다른 구성요소에 직접적으로(예: 유선으로), 무선으로, 또는 제 3 구성요소를 통하여 연결될 수 있다는 것을 의미한다.
본 문서에서 사용된 용어 "모듈"은 하드웨어, 소프트웨어 또는 펌웨어로 구현된 유닛을 포함할 수 있으며, 예를 들면, 로직, 논리 블록, 부품, 또는 회로 등의 용어와 상호 호환적으로 사용될 수 있다. 모듈은, 일체로 구성된 부품 또는 하나 또는 그 이상의 기능을 수행하는, 상기 부품의 최소 단위 또는 그 일부가 될 수 있다. 예를 들면, 일실시예에 따르면, 모듈은 ASIC(application-specific integrated circuit)의 형태로 구현될 수 있다.
본 문서의 다양한 실시예들은 기기(machine)(예: 전자 장치(101)) 의해 읽을 수 있는 저장 매체(storage medium)(예: 내장 메모리(136) 또는 외장 메모리(138))에 저장된 하나 이상의 명령어들을 포함하는 소프트웨어(예: 프로그램(140))로서 구현될 수 있다. 예를 들면, 기기(예: 전자 장치(101))의 프로세서(예: 프로세서(120))는, 저장 매체로부터 저장된 하나 이상의 명령어들 중 적어도 하나의 명령을 호출하고, 그것을 실행할 수 있다. 이것은 기기가 상기 호출된 적어도 하나의 명령어에 따라 적어도 하나의 기능을 수행하도록 운영되는 것을 가능하게 한다. 상기 하나 이상의 명령어들은 컴파일러에 의해 생성된 코드 또는 인터프리터에 의해 실행될 수 있는 코드를 포함할 수 있다. 기기로 읽을 수 있는 저장매체 는, 비일시적(non-transitory) 저장매체의 형태로 제공될 수 있다. 여기서, ‘비일시적’은 저장매체가 실재(tangible)하는 장치이고, 신호(signal)(예: 전자기파)를 포함하지 않는다는 것을 의미할 뿐이며, 이 용어는 데이터가 저장매체에 반영구적으로 저장되는 경우와 임시적으로 저장되는 경우를 구분하지 않는다.
일실시예에 따르면, 본 문서에 개시된 다양한 실시예들에 따른 방법은 컴퓨터 프로그램 제품(computer program product)에 포함되어 제공될 수 있다. 컴퓨터 프로그램 제품은 상품으로서 판매자 및 구매자 간에 거래될 수 있다. 컴퓨터 프로그램 제품은 기기로 읽을 수 있는 저장 매체(예: compact disc read only memory (CD-ROM))의 형태로 배포되거나, 또는 어플리케이션 스토어(예: 플레이 스토어TM)를 통해 또는 두개의 사용자 장치들(예: 스마트폰들) 간에 직접, 온라인으로 배포(예: 다운로드 또는 업로드)될 수 있다. 온라인 배포의 경우에, 컴퓨터 프로그램 제품의 적어도 일부는 제조사의 서버, 어플리케이션 스토어의 서버, 또는 중계 서버의 메모리와 같은 기기로 읽을 수 있는 저장 매체에 적어도 일시 저장되거나, 임시적으로 생성될 수 있다.
다양한 실시예들에 따르면, 상기 기술한 구성요소들의 각각의 구성요소(예: 모듈 또는 프로그램)는 단수 또는 복수의 개체를 포함할 수 있다. 다양한 실시예들에 따르면, 전술한 해당 구성요소들 중 하나 이상의 구성요소들 또는 동작들이 생략되거나, 또는 하나 이상의 다른 구성요소들 또는 동작들이 추가될 수 있다. 대체적으로 또는 추가적으로, 복수의 구성요소들(예: 모듈 또는 프로그램)은 하나의 구성요소로 통합될 수 있다. 이런 경우, 통합된 구성요소는 상기 복수의 구성요소들 각각의 구성요소의 하나 이상의 기능들을 상기 통합 이전에 상기 복수의 구성요소들 중 해당 구성요소에 의해 수행되는 것과 동일 또는 유사하게 수행할 수 있다. 다양한 실시예들에 따르면, 모듈, 프로그램 또는 다른 구성요소에 의해 수행되는 동작들은 순차적으로, 병렬적으로, 반복적으로, 또는 휴리스틱하게 실행되거나, 상기 동작들 중 하나 이상이 다른 순서로 실행되거나, 생략되거나, 또는 하나 이상의 다른 동작들이 추가될 수 있다.
도 3은 본 발명의 일 실시 예에 따른 텍스트 인식 시스템을 나타낸다.
도 3을 참조하면 텍스트 인식 시스템(300)은 전자 장치(예: 도 1의 전자 장치(101)), 제1 서버(310), 제2 서버(320), 제3 서버(330), 및 제4 서버(340)를 포함할 수 있다.
전자 장치(101)는 이미지를 캡쳐하여 제1 서버(310)로 전송할 수 있다. 예컨대, 전자 장치(101)의 일 면(예: 전면 또는 후면)에는 카메라(예: 도 1의 카메라 모듈(180))가 배치될 수 있으며, 사용자는 상기 카메라(180)를 통해 사용자의 주변 환경을 촬영할 수 있다. 전자 장치(101)는 상기 촬영된 이미지를 제1 서버(310)로 전송할 수 있다.
제1 서버(310)는 상기 촬영된 이미지에서 텍스트를 추출하고, 상기 추출된 텍스트를 전자 장치(101)로 전송할 수 있다. 예컨대, 상기 촬영된 이미지가 간판이면 제1 서버(310)는 상기 간판에 기재된 상호명, 전화 번호 등을 추출할 수 있다. 다른 실시 예로, 상기 촬영된 이미지가 칠판이면 제1 서버(310)는 상기 칠판에 기재된 글자를 추출할 수 있다. 추출된 상호명, 전화 번호, 글자 등은 전자 장치(101)로 전송될 수 있다. 본 문서에서 제1 서버(310)는 OCR(optical character recognition) 서버로 참조될 수 있다.
전자 장치(101)는 제1 서버(310)에서 수신한 텍스트를 제2 서버(320), 제3 서버(330), 및 제4 서버(340) 중 적어도 어느 하나에 전송할 수 있다. 예컨대, 텍스트에 글자(letter)가 포함될 경우, 전자 장치(101)는 텍스트를 제2 서버(320)로 전송할 수 있다. 다른 실시 예로 텍스트에 물리량 단위가 포함될 경우 전자 장치(101)는 텍스트를 제3 서버(330)로 전송할 수 있다. 또 다른 실시 예로 텍스트에 화폐 단위가 포함될 경우, 전자 장치(101)는 텍스트를 제4 서버(340)로 전송할 수 있다. 상술한 실시 예는 일 실시 예일 뿐이며, 텍스트에 포함되는 구성, 전자 장치(101)가 텍스트를 전송하는 서버 등은 상술한 실시 예에 한정되지 않는다.
전자 장치(101)가 텍스트를 제2 서버(320)에 전송하면, 제2 서버(320)는 텍스트에 포함되는 글자를 번역할 수 있다. 번역된 글자는 다시 전자 장치(101)로 전송될 수 있다. 예컨대, 텍스트에 중국어가 포함될 경우, 제2 서버(320)는 상기 중국어를 한국어로 번역하여 전자 장치(101)로 전송할 수 있다. 다른 실시 예로, 텍스트에 영어가 포함될 경우, 제2 서버(320)는 상기 영어를 한국어로 번역하여 전자 장치(101)로 전송할 수 있다. 본 문서에서 제2 서버(320)는 번역 서버로 참조될 수 있다.
제3 서버(330)는 물리량 단위를 변경할 수 있다. 변경된 물리량 단위는 다시 전자 장치(101)로 전송될 수 있다. 예컨대, 텍스트에 마일(mile)이 포함될 경우, 제3 서버(330)는 상기 마일을 킬로미터(km)로 변경하여 전자 장치(101)로 전송할 수 있다. 다른 실시 예로, 텍스트에 갤런(gallon)이 포함될 경우, 제3 서버(330)는 상기 갤런을 리터(l)로 변경하여 전자 장치(101)로 전송할 수 있다. 본 문서에서 제3 서버(330)는 유닛 변환 서버로 참조될 수 있다.
제4 서버(340)는 화폐 단위를 변경할 수 있다. 변경된 화폐 단위는 다시 전자 장치(101)로 전송될 수 있다. 예컨대, 텍스트에 달러($)가 포함될 경우, 제4 서버(340)는 상기 달러를 원(\)으로 변경하여 전자 장치(101)로 전송할 수 있다. 다른 실시 예로, 텍스트에 엔(¥)이 포함될 경우, 제4 서버(340)는 상기 엔을 원(\)으로 변경하여 전자 장치(101)로 전송할 수 있다. 본 문서에서 제4 서버(340)는 환율 변환 서버로 참조될 수 있다.
전자 장치(101)는 제2 서버(320) 내지 제4 서버(340)로부터 번역된 글자, 변환된 물리량 단위, 및 변환된 화폐 단위 중 적어도 어느 하나가 수신되면, 상기 수신된 텍스트를 출력할 수 있다. 예컨대, 카메라(180)에서 촬영된 이미지에 "Hello"가 포함될 경우 전자 장치(100)는 "Hello" 대신 번역된 글자인 "안녕"을 출력할 수 있다.
다른 실시 예로 상기 수신된 텍스트가 출력되는 영역은 상기 카메라(180)에서 촬영된 이미지에 인접할 수 있다. 예컨대, 상기 카메라(180)에서 촬영된 이미지에 "Hello"가 포함될 경우, 전자 장치(101)는 상기 카메라(180)에서 촬영된 이미지와 인접하는 영역에 "안녕"을 출력할 수 있다.
본 문서에서 도 1 내지 도 3에 도시된 전자 장치(101) 및 텍스트 인식 시스템(300)의 구성들과 동일한 참조부호를 갖는 구성들은 도 1 내지 도 3에서 설명한 내용이 동일하게 적용될 수 있다.
도 4a는 본 발명의 일 실시 예에 따른 텍스트 인식 시스템의 동작 흐름도를 나타낸다. 도 4a는 도 3에 포함되는 구성들의 동작을 상세히 설명하기 위한 도면이다.도 4a를 참조하면 동작 411에서 전자 장치(101)(예: 프로세서(120))는 제1 이미지를 캡쳐할 수 있다. 예컨대, 전자 장치(101)는 사용자 입력에 응답하여 텍스트를 인식하기 위한 어플리케이션을 실행할 수 있다. 상기 어플리케이션이 실행되면 전자 장치(101)는 카메라(180)를 통해 사용자의 주변 환경을 촬영할 수 있다. 또한, 전자 장치(101)는 상기 주변 환경을 캡쳐할 수 있다. 본 문서에서 제1 이미지는 디스플레이(예: 도 1 의 표시 장치(160))를 통해 캡쳐된 이미지를 의미할 수 있다.
동작 413에서 전자 장치(101)(예: 도 1 의 통신 모듈(190))는 상기 캡쳐된 제1 이미지를 제1 서버(310)로 전송할 수 있다.
동작 415에서 제1 서버(310)는 제1 이미지에서 제1 텍스트를 추출할 수 있다. 예컨대, 제1 이미지에 간판이 포함되어 있으면 제1 서버(310)는 상기 간판에 기재된 상호명, 전화 번호 등을 추출할 수 있다.
동작 417에서 제1 서버(310)는 상기 추출된 제1 텍스트를 전자 장치(101)로 전송할 수 있다. 상기 실시 예에서, 제1 서버(310)는 추출된 상호명, 전화 번호 등을 전자 장치(101)로 전송할 수 있다. 일 실시 예에 따르면 제1 서버(310)는 상기 추출된 제1 텍스트를 JSON(javascript object notation) 형식을 갖는 데이터로 전자 장치(101)에 전송할 수 있다.
동작 419에서 전자 장치(101)는 제1 서버(310)로부터 제1 텍스트를 수신하고, 상기 수신한 제1 텍스트를 제2 서버(320)로 전송할 수 있다. 도 4a에서는 전자 장치(101)가 제1 텍스트를 제2 서버(320)로 전송하는 것으로 도시되었으나, 전자 장치(101)는 제1 텍스트를 제3 서버(330) 및/또는 제4 서버(340)로 전송할 수 있다.
동작 421에서 제2 서버(320)는 전자 장치(101)로부터 수신한 제1 텍스트를 번역할 수 있다. 상기 실시 예에서 제1 텍스트에 중국어 상호명이 포함되어 있을 경우, 제2 서버(320)는 중국어 상호명을 한국어 상호명으로 번역할 수 있다.
동작 423에서 제2 서버(320)는 번역된 제1 텍스트를 전자 장치(101)로 전송할 수 있다. 상기 실시 예에서 제2 서버(320)는 한국어 상호명을 전자 장치(101)로 전송할 수 있다.
동작 425에서 전자 장치(101)는 번역된 제1 텍스트를 출력할 수 있다. 일 실시 예로, 전자 장치(101)는 상기 번역된 제1 텍스트를 제1 텍스트를 대체하여 출력할 수 있다. 예컨대, 전자 장치(101)는 한국어 상호명을 중국어 상호명을 대체하여 출력할 수 있다.
동작 427에서 전자 장치(101)는 디스플레이(예: 표시 장치(160))를 통해 출력되는 이미지의 변경 여부를 확인할 수 있다. 예컨대, 사용자가 전자 장치(101)를 이동시킬 경우, 카메라(180)를 통해 출력되는 이미지 또한 변경될 수 있다. 이에 따라, 제1 이미지가 아닌 제2 이미지가 출력될 수 있다.
본 문서에서 제2 이미지는 제1 이미지의 적어도 일부를 포함하는 이미지를 의미할 수 있다. 예컨대, 제1 이미지에 간판이 포함되어 있을 경우, 제2 이미지에도 간판의 적어도 일부가 포함될 수 있다. 다시 말해, 사용자가 전자 장치(101)를 일정 범위 내에서 이동시킬 경우 제2 이미지는 제1 이미지의 적어도 일부를 포함하여 출력될 수 있다. 그러나 사용자가 전자 장치(101)를 반대 방향으로 회전시킬 경우 디스플레이(예: 표시 장치(160))를 통해 제1 이미지의 반대편에 있는 환경이 출력될 뿐 제1 이미지 및 제2 이미지가 출력될 수 없다..
제2 이미지가 출력되면, 동작 429에서 전자 장치(101)는 제2 이미지를 캡쳐할 수 있다.
동작 431에서 전자 장치(101)는 제1 이미지와 제2 이미지를 비교할 수 있다. 전자 장치(101)는 제2 이미지 중 제1 이미지와 중첩하는 영역에 대응되는 제1 텍스트의 일부를 포함하는 제2 텍스트 와 제2 이미지 중 제1 이미지와 중첩하지 않는 영역에 대응되는 제2 이미지 의 일부를 제1 서버(310)로 전송할 수 있다. 예컨대, 제1 이미지가 A 간판을 포함하고, 제2 이미지가 A 간판의 일부 및 B 간판을 포함할 수 있다. 전자 장치(101)는 제2 이미지 중 제1 이미지와 중첩하는 영역인 A 간판의 일부는 제1 타입 데이터로 전송할 수 있다. 전자 장치(101)는 제2 이미지 중 제1 영역과 중첩하지 않는 영역인 B 간판은 제2 타입 데이터로 전송할 수 있다. 본 문서에서 제1 타입 데이터와 제2 타입 데이터는 서로 다른 형식을 갖는 데이터로서, 제1 타입 데이터는 제2 텍스트를 포함할 수 있고, 제2 타입 데이터는 제2 이미지 중 제1 이미지와 중첩하지 않는 영역을 포함할 수 있다.
일 실시 예에 따르면, 제1 타입 데이터의 크기는 제2 타입 데이터의 크기보다 작을 수 있다. 예컨대, 제1 타입 데이터는 JSON(javascript object notation) 형식을 갖는 데이터로 제1 서버(310)에 전송될 수 있다. 제2 타입 데이터는 이미지 데이터(예: JPG 데이터)로 제1 서버(310)에 전송될 수 있다.
한편, 도 4a에 도시된 실시 예는 일 실시 예일 뿐이며, 본 발명의 실시 예들은 도 4a에 도시된 바에 한정되지 않는다. 예컨대, 전자 장치(101)는 제2 이미지 중 제1 이미지와 중첩하는 영역은 전송하지 않고, 제2 이미지 중 제1 이미지와 중첩하지 않는 영역을 전송할 수 있다.
본 발명의 일 실시 예에 따르면, 제1 타입 데이터는 크기가 작은 데이터 형식으로 전자 장치(101)가 제1 서버(310)로 전송하는 데이터의 크기를 감소시킬 수 있다. 이에 따라, 전자 장치(101)가 텍스트를 출력하기까지 소요되는 시간을 단축시킬 수 있다.
동작 433에서 제1 서버(310)는 제1 타입 데이터 및 제2 타입 데이터에서 제3 텍스트를 추출할 수 있다. 예컨대, 제1 이미지가 A 간판을 포함하고, 제2 이미지가 A 간판의 일부 및 B 간판을 포함할 경우, 제1 서버(310)는 A 간판의 일부 및 B 간판에 기재된 상호명, 전화 번호 등에 대응되는 제1 타입 데이터 및 제2 타입 데이터에서 제3 텍스트를 추출할 수 있다.
동작 435에서 제1 서버(310)는 추출된 제3 텍스트를 전자 장치(101)로 전송할 수 있다. 상기 실시 예에서, 제1 서버(310)는 A 간판의 일부 및 B 간판에서 추출한 상호명, 전화 번호 등을 전자 장치(101)로 전송할 수 있다.
다른 실시 예로 동작 435에서 제1 서버(310)는 추출된 제3 텍스트를 제2 서버(320)로 전송할 수 있다. 제2 서버(320)는 제3 텍스트를 번역하고 번역된 제3 텍스트를 전자 장치(101)로 전송할 수 있다. 전자 장치(101)는 번역된 제3 텍스트를 제3 서버(330) 및/또는 제4 서버(340)로 전송할 수 있다. 제3 서버(330) 및/또는 제4 서버(340)는 물리량 단위 및/또는 화폐 단위를 변경하고, 변경된 물리량 단위 및/또는 화폐 단위를 전자 장치(101)로 전송할 수 있다.
동작 437 내지 동작 441에서 전자 장치(101)는 제3 텍스트를 제2 서버(320)에 전송할 수 있고, 제2 서버(320)는 제3 텍스트를 번역할 수 있다. 번역된 제3 텍스트는 전자 장치(101)로 전송될 수 있다. 동작 419 내지 동작 423에 대한 설명은 동작 437 내지 441에도 적용될 수 있다.
동작 443에서 전자 장치(101)는 번역된 제3 텍스트를 제2 서버(320)로부터 수신할 수 있다. 전자 장치(101)는 제3 텍스트를 출력할 수 있다. 상기 실시 예에서, 전자 장치(101)는 A 간판의 일부에 기재된 상호명 및 B 간판에 기재된 상호명을 출력할 수 있다.
도 4b는 본 발명의 일 실시 예에 따른 전자 장치의 동작 흐름도를 나타낸다. 도 4b는 도 3에 도시된 전자 장치(101)의 동작을 상세히 설명하기 위한 도면이다.
도 4b를 참조하면 동작 451에서 프로세서(120)는 이미징 장치(imaging device)로부터 제1 이미지 데이터를 수신할 수 있다. 본 문서에서 이미징 장치는 제1 이미지 데이터를 생성할 수 있는 장치로서 카메라 모듈(180) 등으로 참조될 수 있다. 제1 이미지 데이터는 디스플레이(160)를 통해 출력되는 제1 이미지를 포함하는 이미지 데이터를 의미할 수 있다.
동작 453에서 프로세서(120)는 통신 회로(190)를 통해 제1 이미지 데이터를 제1 서버(310)로 전송할 수 있다. 제1 서버(310)는 제1 이미지 데이터에서 제1 텍스트를 추출하고 상기 추출된 제1 텍스트를 포함하는 제1 텍스트 데이터를 다시 전자 장치(101)로 전송할 수 있다. 예컨대, 제1 이미지에 간판이 포함되어 있으면, 제1 서버(310)는 간판에 기재된 상호명 등을 추출할 수 있다. 제1 서버(310)는 OCR(optical character recognition) 서버로 참조될 수 있다.
동작 455에서 프로세서(120)는 통신 회로(190)를 통해 제1 텍스트 데이터를 수신할 수 있다. 상기 제1 텍스트 데이터가 수신되면 프로세서(120)는 제1 텍스트를 디스플레이(160)를 통해 출력할 수 있다. 예컨대, 제1 이미지에 간판이 포함되어 있으면, 프로세서(120)는 간판에 기재된 상호명을 디스플레이(160)를 통해 출력할 수 있다.
동작 457에서 프로세서(120)는 이미징 장치로부터 제2 이미지 데이터를 수신할 수 있다. 제2 이미지 데이터는 제1 이미지와 적어도 일부 중첩하는 제2 이미지를 포함하는 이미지 데이터를 의미할 수 있다.
동작 459에서 프로세서(120)는 통신 회로(190)를 통해 제2 텍스트 데이터 및 제2 이미지 데이터의 일부를 제1 서버(310)로 전송할 수 있다. 본 문서에서 제2 텍스트 데이터는 제1 이미지와 제2 이미지가 중첩하는 영역 중 제1 텍스트 데이터의 적어도 일부를 포함하는 텍스트 데이터를 의미할 수 있다. 즉, 동작 459에서 프로세서(120)는 제2 텍스트 데이터와 제2 이미지 데이터 중 제1 이미지 데이터와 중첩하지 않는 영역을 제1 서버(310)로 전송할 수 있다.
도 5는 본 발명의 일 실시 예에 따른 디스플레이를 통해 출력되는 화면 및 제1 이미지를 나타낸다. 도 5는 도 4에 도시된 동작 411 및 413을 상세히 설명하기 위한 도면을 나타낸다.
도 5를 참조하면 전자 장치(예: 도 1 의 전자 장치(101))는 사용자 입력에 응답하여 텍스트를 인식하기 위한 어플리케이션을 실행할 수 있다. 상기 어플리케이션이 실행되면 전자 장치(101)는 카메라(예: 도 1 의 카메라 모듈(180))를 통해 사용자의 주변 환경을 촬영할 수 있다. 예컨대, 도 5에 도시된 바와 같이 사용자는 전자 장치(101)를 통해 여행지의 간판들(510)을 촬영할 수 있다. 전자 장치(101)는 상기 간판들(510)을 디스플레이 화면을 통해 출력할 수 있다.
일 실시 예에 따르면, 전자 장치(101)는 제1 이미지(511)를 캡쳐할 수 있다. 제1 이미지(511)는 디스플레이 화면을 통해 출력되는 이미지를 의미할 수 있다. 제1 이미지(511)가 캡쳐되면, 전자 장치(101)는 제1 이미지(511)를 제1 서버(310)로 전송할 수 있다.
도 6a는 본 발명의 일 실시 예에 따른 제1 텍스트를 나타낸다. 도 6b는 본 발명의 다른 실시 예에 따른 제1 텍스트를 나타낸다. 도 6a 및 도 6b는 도 4에 도시된 동작 415를 상세히 설명하기 위한 도면이다.
도 6a 및 도 6b를 참조하면 제1 서버(예: 도 3 의 제 1 서버(310))는 제1 이미지(예: 도 5의 제1 이미지(511))에서 서로 다른 형식을 갖는 제1 텍스트(610)를 추출할 수 있다. 추출된 제1 텍스트(610)는 전자 장치(예; 도 1 의 전자 장치(101))로 전송될 수 있다. 예컨대, 도 6a에 도시된 바와 같이 제1 서버(310)는 제1 이미지에서 제1 텍스트(610), 제1 텍스트(610)에 대한 위치 정보, 및 제1 텍스트(610)에 포함된 각 단어에 대한 위치 정보를 추출하여 전자 장치(101)로 전송할 수 있다. 이 때 제1 텍스트(610), 위치 정보, 및 각 단어에 대한 위치 정보는 제1 타입 데이터 형태(예: JSON(javascript object notation) 형식)로 전자 장치에 전송될 수 있다. 다른 실시 예로, 도 6b에 도시된 바와 같이 제1 서버(310)는 제1 이미지에서 제1 텍스트(610)를 추출하고, 상기 제1 텍스트(610)를 구분하여 표시할 수 있다. 예컨대, 제1 서버(310)는 제1 텍스트(610)를 문장의 구성요소로 분석해서 블록(621), 줄(622), 단어(623), 및/또는 글자(624) 단위로 구분하여 표시할 수 있다.
일 실시 예에 따르면, 전자 장치(101)는 제1 이미지를 전송할 때 제1 텍스트(610)의 형식을 결정하는 명령어를 함께 제1 서버(310)로 전송할 수 있다. 제1 서버(310)는 상기 명령어에 기초하여 제1 텍스트(610)를 추출할 수 있다. 예컨대, 제1 서버(310)는 상기 명령어에 기초하여 제1 텍스트(610), 위치 정보, 및 각 단어에 대한 위치 정보를 추출하여 전자 장치(101)로 전송할 수 있다. 다른 실시 예로, 제1 서버(310)는 상기 명령어에 기초하여 제1 텍스트(610)를 블록(621), 줄(622), 단어(623), 및/또는 글자(624) 단위로 구분하여 전자 장치(101)로 전송할 수 있다.
도 7a는 본 발명의 일 실시 예에 따른 전자 장치의 이미지의 변경 여부를 확인하는 예시도이다. 도 7b는 본 발명의 다른 실시 예에 따른 이미지의 변경 여부를 확인하는 예시도이다. 도 7a 및 도 7b는 도 4에 도시된 동작 427을 상세히 설명하기 위한 도면이다.
도 7a를 참조하면 전자 장치(예: 도 1 의 전자 장치(101))는 디스플레이를 통해 출력되는 이미지를 비교할 수 있다. 비교 결과 유의미한 변경이 없을 경우, 전자 장치(101)는 변경된 이미지를 제1 서버(예: 도 3 의 제1 서버(310))로 전송하지 않을 수 있다. 예컨대, 좌측 이미지(710)와 우측 이미지(720)를 비교하면, 좌측 이미지(710)와 우측 이미지(720)에 포함되는 텍스트는 실질적으로 동일할 수 있다. 좌측 이미지(710)와 우측 이미지(720)에 포함되는 텍스트가 실질적으로 동일하므로, 전자 장치(101)는 우측 이미지(720)를 제1 서버(310)로 전송하지 않을 수 있다.
도 7b를 참조하면 전자 장치(101)는 디스플레이(예: 도 1 의 표시 장치(160))를 통해 출력되는 이미지가 변경될 경우, 변경된 이미지를 제1 서버(310)로 전송할 수 있다. 예컨대, 사용자는 전자 장치(101)를 좌측 방향(730)에서 우측 방향(740)으로 이동시킬 수 있다. 전자 장치를 이동시킴에 따라 디스플레이를 통해 출력되는 화면 또한 변경될 수 있다. 예컨대, 좌측 방향(730)에서는 제1 이미지(731)가 출력될 수 있으나, 전자 장치(101)가 이동함에 따라 우측 방향(740)에서는 제2 이미지(741)가 출력될 수 있다. 제2 이미지(741)는 제1 이미지와 중첩하는 영역(741a)과 중첩하지 않는 영역(741b)을 모두 포함할 수 있다.
도 8a는 본 발명의 일 실시 예에 따른 제1 이미지를 나타낸다. 도 8b는 본 발명의 일 실시 예에 따른 제2 이미지를 나타낸다. 도 8a 및 도 8b는 도 4에 도시된 동작 431을 상세히 설명하기 위한 도면이다.
도 8a 및 도 8b를 참조하면 전자 장치(예: 도 1 의 전자 장치(101))는 제1 이미지(810)(예: 도 7 의 제1 이미지(731))와 제2 이미지(820)(예: 도 7 의 제2 이미지(741))를 비교하고 제2 이미지(820) 중 제1 이미지(810)와 중첩하는 영역(820a)은 제1 타입 데이터(820-1)로 제1 서버(예: 도 3 의 제1 서버(310))에 전송할 수 있다. 전자 장치(101)는 제2 이미지(820) 중 제1 이미지(810)와 중첩하지 않는 영역(820b)은 제2 타입 데이터(820-2)로 제1 서버(310)에 전송할 수 있다. 예컨대, 제2 이미지(820) 중 좌측 영역(820a)은 제1 이미지(810)와 중첩할 수 있으나, 제2 이미지(820) 중 우측 영역(820b)은 제1 이미지(810)와 중첩하지 않을 수 있다. 이에 따라, 전자 장치(101)는 좌측 영역(820a)은 JSON(javascript object notation) 형식을 갖는 데이터(820-1)로 제1 서버(310)에 전송할 수 있다. 전자 장치(101)는 우측 영역(820b)은 이미지 데이터(820-2)(예: JPG 데이터)로 제1 서버(310)로 전송할 수 있다.
한편, 도 8a 및 도 8b에 도시된 실시 예는 일 실시 예일 뿐이며, 본 발명의 실시 예들은 도 8a 및 도 8b에 도시된 바에 한정되지 않는다. 예컨대, 전자 장치(101)는 제2 이미지(820) 중 좌측 영역(820a)은 전송하지 않고, 제2 이미지(820) 중 우측 영역(820b)을 제1 서버(310)로 전송할 수 있다.
본 발명의 일 실시 예에 따르면, 제1 서버(310)로 이미 전송한 이미지는 크기가 작은 데이터 형식으로 서버에 전송하거나, 서버에 전송하지 않음으로써 전자 장치(101)가 전송하는 데이터의 크기를 감소시킬 수 있다. 이에 따라, 전자 장치(101)가 텍스트를 출력하기까지 소요되는 시간을 단축시킬 수 있다.
일 실시 예에 따르면 제1 서버(310)는 제2 이미지(820)를 수신한 후, 제2 이미지(820) 중 제1 이미지(810)와 중첩하지 않는 영역(820b)에서 제3 텍스트를 추출할 수 있다. 예컨대, 제2 이미지(820)에서 "Baby I am sorry"는 제1 이미지(810)에서 추출되었으므로, 제1 서버(310)는 "Baby I am sorry"를 추출하지 않고 "but I love you"를 추출할 수 있다. 비교 예에 따른 텍스트 인식 시스템에 따르면 이미지에 중첩하는 영역이 있더라도 이미지에 포함된 모든 텍스트를 추출할 수 있다. 그러나 본 발명의 일 실시 예에 따른 텍스트 인식 시스템(예: 도 3 의 텍스트 인식 시스템(300))에 따르면 중첩되지 않는 영역(예: 820b)에 대한 텍스트만 추출함으로써 텍스트 인식 시간을 단축시킬 수 있다.
도 9는 본 발명의 일 예에 따른 전자 장치의 동작 환경을 나타낸다. 도 9는 도 4에 도시된 동작 431을 상세히 설명하기 위한 도면이다.
도 9를 참조하면 사용자는 전자 장치(예: 도 1 의 전자 장치(101))를 통해 수업 시간 중 강사(이하 오브젝트(911))가 칠판 앞에서 설명하는 환경을 촬영할 수 있다. 이 경우 오브젝트(911)에 의해 칠판의 일부가 가려질 수 있다. 전자 장치(101)는 상기 촬영된 환경을 제1 이미지(910)로 캡쳐할 수 있다. 캡쳐된 제1 이미지(910)는 제1 서버(예: 도 3 의 제1 서버(310))로 전송될 수 있으며, 제1 서버(310)는 오브젝트(911)에 의해 가려지지 않는 영역(910a)의 텍스트를 추출할 수 있다.
일 실시 예에 따르면, 오브젝트(911)가 이동함에 따라 오브젝트(911)에 의해 가려지는 영역(910b)이 변경될 수 있다. 이 경우 전자 장치(101)는 오브젝트(911)가 이동된 상태에서의 화면을 제2 이미지(920)로 캡쳐할 수 있다. 전자 장치(101)는 제1 이미지(910)와 제2 이미지(920)를 비교하고, 비교 결과 제1 이미지(910)와 제2 이미지(920)가 중첩하는 영역(920a)은 제1 타입 데이터(예: JSON(javascript object notation) 형식을 갖는 데이터)로 제1 서버(310)에 전송할 수 있다. 전자 장치(101)는 비교 결과 중첩하지 않는 영역(920b)은 제2 타입 데이터(예: JPG 데이터)로 제1 서버(310)로 전송할 수 있다. 제1 서버(310)는 중첩하지 않는 영역(920b)에서 텍스트를 추출할 수 있다.
한편, 도 9에 도시된 실시 예는 일 실시 예일 뿐이며, 본 발명의 실시 예들은 도 9에 도시된 바에 한정되지 않는다. 예컨대, 제1 이미지(910)와 제2 이미지가 중첩하는 영역은 제1 서버(310)로 전송하지 않고, 제1 이미지(910)와 제2 이미지가 중첩하지 않는 영역(910a)을 제1 서버(310)로 전송할 수 있다.
본 발명의 일 실시 예에 따르면, 서버로 이미 전송한 이미지는 크기가 작은 데이터 형식으로 서버에 전송하거나, 서버에 전송하지 않음으로써 전자 장치(101)가 전송하는 데이터의 크기를 감소시킬 수 있다. 이에 따라, 전자 장치(101)가 텍스트를 출력하기까지 소요되는 시간을 단축시킬 수 있다.

Claims (20)

  1. 전자 장치에 있어서,
    이미지 데이터를 생성하기 위한 이미징 장치(an imaging device),
    통신 회로(a communication circuit),
    상기 이미징 장치 및 상기 통신 회로와 작동적으로 연결되는 적어도 하나의 프로세서(at least one processor),
    상기 프로세서와 작동적으로 연결되고 명령어를 저장하는 메모리(a memory)를 포함하고,
    상기 명령어는 상기 프로세서로 하여금:
    상기 이미징 장치로부터 제1 이미지(a first image)를 포함하는 제1 이미지 데이터(first image data)를 수신하고,
    상기 통신 회로를 통해 제1 서버(a first server)로 상기 제1 이미지 데이터를 전송하고,
    상기 통신 회로를 통해 상기 제1 서버로부터 상기 제1 이미지 데이터로부터 인식된 제1 텍스트(a first text)를 포함하는 제1 텍스트 데이터(first text data)를 수신하고
    상기 이미징 장치로부터 상기 제1 이미지의 일부를 포함하는 제2 이미지(a second image)를 포함하는 제2 이미지 데이터(second image data)를 수신하고,
    상기 제1 텍스트 데이터의 적어도 일부를 포함하는 제2 텍스트 데이터(second text data) 및 상기 제2 이미지 데이터의 전체가 아닌 일부를 상기 통신 회로를 통해 상기 제1 서버로 전송하도록 하는, 전자 장치.
  2. 청구항 1에 있어서,
    상기 명령어는 상기 프로세서로 하여금 상기 제1 이미지, 상기 제2 이미지 및 상기 제1 텍스트 데이터 중 하나 이상에 적어도 부분적으로 기초하여 상기 제2 이미지 데이터의 일부를 결정하도록 하는, 전자 장치.
  3. 청구항 2에 있어서,
    상기 제2 이미지 데이터의 일부는 상기 제1 이미지의 적어도 부분적으로 연관된 데이터를 포함하지 않는, 전자 장치.
  4. 청구항 1에 있어서,
    상기 제1 텍스트 데이터는 JSON(javascript object notation) 형식을 갖는, 전자 장치.
  5. 청구항 4에 있어서,
    상기 제1 텍스트 데이터는 상기 제1 이미지 내의 상기 제1 텍스트와 연관된 적어도 하나의 좌표에 대한 데이터를 포함하는, 전자 장치.
  6. 전자 장치의 문자 인식 방법에 있어서,
    이미징 장치로부터 제1 이미지(a first image)를 포함하는 제1 이미지 데이터(first image data)를 수신하는 동작,
    통신 회로를 통해 제1 서버(a first server)로 상기 제1 이미지 데이터를 전송하는 동작,
    상기 통신 회로를 통해 상기 제1 서버로부터 상기 제1 이미지 데이터로부터 인식된 제1 텍스트(a first text)를 포함하는 제1 텍스트 데이터(first text data)를 수신하는 동작,
    상기 이미징 장치로부터 상기 제1 이미지의 일부를 포함하는 제2 이미지(a second image)를 포함하는 제2 이미지 데이터(second image data)를 수신하는 동작, 및
    상기 제1 텍스트 데이터의 적어도 일부를 포함하는 제2 텍스트 데이터(second text data) 및 상기 제2 이미지 데이터의 전체가 아닌 일부를 상기 통신 회로를 통해 상기 제1 서버로 전송하는 동작을 포함하는, 방법.
  7. 청구항 6에 있어서,
    상기 제1 이미지, 상기 제2 이미지 및 상기 제1 텍스트 데이터 중 하나 이상에 적어도 부분적으로 기초하여 상기 제2 이미지 데이터의 일부를 결정하는 동작을 더 포함하는, 방법.
  8. 청구항 7에 있어서,
    상기 제2 이미지 데이터의 일부는 상기 제1 이미지의 적어도 부분적으로 연관된 데이터를 포함하지 않는, 방법.
  9. 청구항 6에 있어서,
    상기 제1 텍스트 데이터는 JSON(javascript object notation) 형식을 갖는, 방법.
  10. 청구항 9에 있어서,
    상기 제1 텍스트 데이터는 상기 제1 이미지 내의 상기 제1 텍스트와 연관된 적어도 하나의 좌표에 대한 데이터를 포함하는, 방법.
  11. 전자 장치에 있어서,
    카메라(a camera),
    상기 카메라를 통해 인식되는 이미지를 출력하는 디스플레이(a display),
    상기 이미지를 제1 서버로 전송하는 통신 회로(a communication circuit),
    상기 카메라, 상기 디스플레이, 및 상기 통신 회로와 전기적으로 연결되는 프로세서(a processor), 및
    상기 프로세서와 작동적으로 연결되고, 명령어 및 상기 이미지를 캡쳐(capture)하는 어플리케이션을 저장하는 메모리(memory)를 포함하고,
    상기 명령어는 상기 상기 프로세서로 하여금:
    상기 어플리케이션을 실행하는 사용자 입력에 응답하여 상기 디스플레이를 통해 출력되는 제1 이미지를 캡쳐하고,
    상기 제1 이미지를 상기 제1 서버로 전송하고,
    상기 제1 이미지에서 추출된 제1 텍스트를 상기 제1 서버로부터 수신하여 상기 디스플레이를 통해 출력하고,
    상기 디스플레이를 통해 상기 제1 이미지의 적어도 일부를 포함하는 제2 이미지가 출력되면, 상기 제2 이미지 중 상기 제1 이미지와 중첩하는 영역에 위치하고 상기 제1 텍스트의 적어도 일부를 포함하는 제2 텍스트는 제1 타입 데이터로 상기 제1 서버에 전송하고, 상기 제2 이미지 중 상기 제1 이미지와 중첩하지 않는 영역은 제2 타입 데이터로 상기 제1 서버에 전송하고,
    상기 제1 타입 데이터 및 상기 제2 타입 데이터에서 추출된 제3 텍스트를 상기 제1 서버로부터 수신하여 상기 디스플레이를 통해 출력하도록 하는, 전자 장치.
  12. 청구항 11에 있어서,
    상기 명령어는 상기 프로세서로 하여금 상기 제1 텍스트를 제2 서버로 전송하고,
    상기 제1 텍스트를 지정된 언어로 변환한 제1 번역 텍스트를 상기 제2 서버로부터 수신하여 상기 디스플레이를 통해 출력하도록 하는, 전자 장치.
  13. 청구항 12에 있어서,
    상기 명령어는 상기 프로세서로 하여금 상기 제3 텍스트를 상기 제2 서버로 전송하고,
    상기 제3 텍스트를 상기 지정된 언어로 변환한 제2 번역 텍스트를 상기 제2 서버로부터 수신하여 상기 디스플레이를 통해 출력하도록 하는, 전자 장치.
  14. 청구항 11에 있어서,
    상기 제1 텍스트는 제1 물리량 단위를 포함하고,
    상기 명령어는 상기 프로세서로 하여금 상기 제1 텍스트를 제2 서버로 전송하고, 상기 제1 물리량 단위를 지정된 단위로 변환한 제2 물리량 단위를 상기 제2 서버로부터 수신하고, 상기 제2 물리량 단위를 상기 디스플레이를 통해 출력하도록 하는, 전자 장치.
  15. 청구항 11에 있어서,
    상기 제1 텍스트는 제1 화폐 단위를 포함하고,
    상기 명령어는 상기 프로세서로 하여금 상기 제1 텍스트를 제2 서버로 전송하고, 상기 제1 화폐 단위를 지정된 단위로 변환한 제2 화폐 단위를 상기 제2 서버로부터 수신하고, 상기 제2 화폐 단위를 상기 디스플레이를 통해 출력하도록 하는, 전자 장치.
  16. 청구항 11에 있어서,
    상기 명령어는 상기 프로세서로 하여금 상기 제1 텍스트 또는 상기 제3 텍스트의 형식을 결정하는 명령어를 상기 제1 서버로 전송하고, 상기 명령어에 대응하는 형식을 갖는 제1 텍스트 또는 제3 텍스트를 상기 제1 서버로부터 수신하도록 하는, 전자 장치.
  17. 전자 장치의 문자 인식 방법에 있어서,
    사용자 입력에 응답하여 디스플레이를 통해 출력되는 제1 이미지를 캡쳐하는 동작,
    상기 제1 이미지를 제1 서버로 전송하는 동작,
    상기 제1 이미지에서 추출된 제1 텍스트를 상기 제1 서버로부터 수신하여 상기 디스플레이를 통해 출력하는 동작,
    상기 디스플레이를 통해 상기 제1 이미지의 적어도 일부를 포함하는 제2 이미지가 출력되면, 상기 제2 이미지 중 상기 제1 이미지와 중첩하는 영역에 위치하고 상기 제1 텍스트의 적어도 일부를 포함하는 제2 텍스트는 제1 타입 데이터로 상기 제1 서버에 전송하고, 상기 제2 이미지 중 상기 제1 이미지와 중첩하지 않는 영역은 제2 타입 데이터로 상기 제1 서버에 전송하는 동작, 및
    상기 제1 타입 데이터 및 상기 제2 타입 데이터에서 추출된 제3 텍스트를 상기 제1 서버로부터 수신하여 상기 디스플레이를 통해 출력하는 동작을 포함하는, 방법.
  18. 청구항 17에 있어서,
    상기 제1 텍스트를 제2 서버로 전송하는 동작, 및
    상기 제1 텍스트를 지정된 언어로 변환한 제1 번역문을 상기 제2 서버로부터 수신하여 상기 디스플레이를 통해 출력하는 동작을 더 포함하는, 방법.
  19. 청구항 17에 있어서,
    상기 제1 텍스트는 제1 물리량 단위를 포함하고,
    상기 제1 텍스트를 제2 서버로 전송하고, 상기 제1 물리량 단위를 지정된 단위로 변환한 제2 물리량 단위를 상기 제2 서버로부터 수신하고, 상기 제2 물리량 단위를 상기 디스플레이를 통해 출력하는 동작을 더 포함하는, 방법.
  20. 청구항 17에 있어서,
    상기 제1 텍스트는 제1 화폐 단위를 포함하고,
    상기 프로세서는 상기 제1 텍스트를 제2 서버로 전송하고, 상기 제1 화폐 단위를 지정된 단위로 변환한 제2 화폐 단위를 상기 제2 서버로부터 수신하고, 상기 제2 화폐 단위를 상기 디스플레이를 통해 출력하는 동작을 더 포함하는, 방법.
KR1020180019847A 2018-02-20 2018-02-20 문자를 인식하기 위한 전자 장치 및 방법 KR102585645B1 (ko)

Priority Applications (5)

Application Number Priority Date Filing Date Title
KR1020180019847A KR102585645B1 (ko) 2018-02-20 2018-02-20 문자를 인식하기 위한 전자 장치 및 방법
PCT/KR2019/001903 WO2019164196A1 (ko) 2018-02-20 2019-02-18 문자를 인식하기 위한 전자 장치 및 방법
CN201980014395.1A CN111801690A (zh) 2018-02-20 2019-02-18 用于识别字符的电子设备和方法
US16/963,628 US11308317B2 (en) 2018-02-20 2019-02-18 Electronic device and method for recognizing characters
EP19757504.6A EP3731142A4 (en) 2018-02-20 2019-02-18 ELECTRONIC DEVICE AND METHOD OF CHARACTER RECOGNITION

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180019847A KR102585645B1 (ko) 2018-02-20 2018-02-20 문자를 인식하기 위한 전자 장치 및 방법

Publications (2)

Publication Number Publication Date
KR20190099852A true KR20190099852A (ko) 2019-08-28
KR102585645B1 KR102585645B1 (ko) 2023-10-10

Family

ID=67687843

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180019847A KR102585645B1 (ko) 2018-02-20 2018-02-20 문자를 인식하기 위한 전자 장치 및 방법

Country Status (5)

Country Link
US (1) US11308317B2 (ko)
EP (1) EP3731142A4 (ko)
KR (1) KR102585645B1 (ko)
CN (1) CN111801690A (ko)
WO (1) WO2019164196A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210092345A (ko) * 2019-11-22 2021-07-26 (주)에스유지 Ocr기술을 활용한 옥외광고물 측정기기 및 그와 연동되는 운영시스템

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113420167A (zh) * 2021-05-14 2021-09-21 北京达佳互联信息技术有限公司 多媒体资源处理方法、装置、电子设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07220025A (ja) * 1994-01-31 1995-08-18 Canon Inc 画像処理装置
JP2008134683A (ja) * 2006-11-27 2008-06-12 Fuji Xerox Co Ltd 画像処理装置および画像処理プログラム
US20170330048A1 (en) * 2016-05-13 2017-11-16 Abbyy Development Llc Optical character recognition of series of images

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE519405C2 (sv) 2000-07-19 2003-02-25 Jacob Weitman Tillämpningar för en avancerad digitalkamera som tolkar den tagna bilden utifrån dess informationsinnehåll, såsom att överföra bilden, beordra en tjänst, styra ett flöde mm
US7840033B2 (en) * 2004-04-02 2010-11-23 K-Nfb Reading Technology, Inc. Text stitching from multiple images
TWI333365B (en) * 2006-11-22 2010-11-11 Ind Tech Res Inst Rending and translating text-image method and system thereof
US20100331043A1 (en) * 2009-06-23 2010-12-30 K-Nfb Reading Technology, Inc. Document and image processing
EP2682901A4 (en) * 2011-03-04 2014-09-03 Glory Kogyo Kk CUTTING PROCEDURE FOR TEXT ELEMENTS CUTTING DEVICE FOR TEXT ELEMENTS
US9715625B2 (en) * 2012-01-27 2017-07-25 Recommind, Inc. Hierarchical information extraction using document segmentation and optical character recognition correction
KR101552252B1 (ko) * 2014-01-23 2015-09-09 박정호 화면 재로딩없이 복사페이지를 생성하는 멀티페이지 표출시스템
US9514376B2 (en) * 2014-04-29 2016-12-06 Google Inc. Techniques for distributed optical character recognition and distributed machine language translation
WO2015165524A1 (en) * 2014-04-30 2015-11-05 Longsand Limited Extracting text from video
US9652896B1 (en) 2015-10-30 2017-05-16 Snap Inc. Image based tracking in augmented reality systems
KR101758712B1 (ko) * 2016-01-20 2017-07-26 주식회사 빌몬스터즈 영수증 관리 방법 및 이를 위한 장치
US10679089B2 (en) * 2016-12-30 2020-06-09 Business Imaging Systems, Inc. Systems and methods for optical character recognition
US20180260376A1 (en) * 2017-03-08 2018-09-13 Platinum Intelligent Data Solutions, LLC System and method to create searchable electronic documents
RU2661760C1 (ru) * 2017-08-25 2018-07-19 Общество с ограниченной ответственностью "Аби Продакшн" Использование нескольких камер для выполнения оптического распознавания символов

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07220025A (ja) * 1994-01-31 1995-08-18 Canon Inc 画像処理装置
JP2008134683A (ja) * 2006-11-27 2008-06-12 Fuji Xerox Co Ltd 画像処理装置および画像処理プログラム
US20170330048A1 (en) * 2016-05-13 2017-11-16 Abbyy Development Llc Optical character recognition of series of images

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210092345A (ko) * 2019-11-22 2021-07-26 (주)에스유지 Ocr기술을 활용한 옥외광고물 측정기기 및 그와 연동되는 운영시스템

Also Published As

Publication number Publication date
EP3731142A1 (en) 2020-10-28
WO2019164196A1 (ko) 2019-08-29
CN111801690A (zh) 2020-10-20
EP3731142A4 (en) 2021-03-24
KR102585645B1 (ko) 2023-10-10
US11308317B2 (en) 2022-04-19
US20210064864A1 (en) 2021-03-04

Similar Documents

Publication Publication Date Title
US11943399B2 (en) Electronic device for providing various functions through application using a camera and operating method thereof
US10936095B2 (en) Electronic device for executing various functions based on signal received from electric pen
US11182071B2 (en) Apparatus and method for providing function associated with keyboard layout
US20210374342A1 (en) Electronic device for inputting characters and method of operation of same
US11308317B2 (en) Electronic device and method for recognizing characters
KR102524517B1 (ko) 전자 장치 및 그의 동작 방법
US20190227705A1 (en) Method for displaying user interface of application and electronic device thereof
US11482024B2 (en) Electronic device and method for processing writing input
US11630574B2 (en) Screen control method for providing notification of objects having different meanings for each region and electronic device supporting same
US11392282B2 (en) Electronic device for providing graphical content and method for controlling same
US20210027765A1 (en) Electronic device and operating method thereof
US11188227B2 (en) Electronic device and key input method therefor
KR102616156B1 (ko) 컨텐츠를 생성하기 위한 전자 장치
KR102653267B1 (ko) 전자 장치의 키 입력 방법 및 이를 사용하는 전자 장치
US10602336B2 (en) Method for providing service using near field communication and electronic device for supporting the same
US20230049621A1 (en) Electronic device and operation method of electronic device
KR20210109202A (ko) 제스쳐 입력에 대응하는 시각적 효과를 제공하기 위한 전자 장치 및 그의 동작 방법
KR20200100379A (ko) 전자 장치의 단축 기능 제공 방법 및 이를 사용하는 전자 장치
KR20200069058A (ko) 전자 장치 및 그의 사용자 입력에 기반한 서비스 제공 방법

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right