KR20180056728A - 이미지 처리 장치를 제어하는 방법 - Google Patents

이미지 처리 장치를 제어하는 방법 Download PDF

Info

Publication number
KR20180056728A
KR20180056728A KR1020187011158A KR20187011158A KR20180056728A KR 20180056728 A KR20180056728 A KR 20180056728A KR 1020187011158 A KR1020187011158 A KR 1020187011158A KR 20187011158 A KR20187011158 A KR 20187011158A KR 20180056728 A KR20180056728 A KR 20180056728A
Authority
KR
South Korea
Prior art keywords
image
additional information
image processing
data
user
Prior art date
Application number
KR1020187011158A
Other languages
English (en)
Inventor
비탈리이 비탈리비치 아베리아노브
안드레이 발레리예비치 코미사로브
Original Assignee
비탈리이 비탈리비치 아베리아노브
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 비탈리이 비탈리비치 아베리아노브 filed Critical 비탈리이 비탈리비치 아베리아노브
Publication of KR20180056728A publication Critical patent/KR20180056728A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/55Clustering; Classification
    • G06F17/30247
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • G06K9/62
    • G06K9/68
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/20Scenes; Scene-specific elements in augmented reality scenes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/30Scenes; Scene-specific elements in albums, collections or shared content, e.g. social network photos or video
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/63Control of cameras or camera modules by using electronic viewfinders
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/66Remote control of cameras or camera parts, e.g. by remote control devices
    • H04N23/661Transmitting camera control signals through networks, e.g. control via the Internet
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Library & Information Science (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Signal Processing (AREA)
  • Processing Or Creating Images (AREA)
  • Information Transfer Between Computers (AREA)
  • Studio Devices (AREA)
  • Telephonic Communication Services (AREA)
  • Facsimiles In General (AREA)

Abstract

이미지 처리 장치를 제어하는 본 방법은 그것이 다른 사용자들의 이미지 처리 장치 상에서 재생될 수 있도록 데이터를 송신하는 데 있다. 이미지 신호는 이미지 생성기를 사용하여 생성되고 이미지는 디스플레이를 사용하여 디스플레이되고, 그 다음, 수신된 이미지에 대한 데이터가 획득되고 추가 정보가 수신된 이미지에 대한 데이터에 링크된다. 데이터의 송신은 수신된 이미지에 대한 데이터에 링크되는 추가 정보의 송신을 구성하며, 상기 정보는 인터넷을 통해 서버에 송신된다. 추가 정보는 수신된 이미지에 대해 획득된 데이터가 추가 정보가 생성되며, 차례로 이미지에 링크된 것에 관해 이미지를 처리하기 위한 다른 장치들 상의 수신된 이미지에 대한 데이터와 일치하면, 디스플레이된다.

Description

이미지 처리 장치를 제어하는 방법
본 발명은 정보 기술, 컴퓨터 기술, 즉 이미지 데이터를 처리 및 생성하는 컴퓨터 그래픽용 이미지 처리의 분야에 관한 것이고, 이미지 데이터를 탐색, 검색 및 처리하고 디스플레이하기 위해 사용될 수 있다.
이미지를 캡처하기 위한 공지된 방법은 다음 단계들을 포함한다: 디지털 이미지를 캡처하는 단계; 디지털 이미지가 캡처되는 위치를 나타내는 이미지 캡처 위치 정보를 수신하는 단계; 디지털 이미지가 캡처되는 방향을 나타내는 이미지 그립(image grip)의 방향 정보를 수신하는 단계; 디지털 이미지가 캡처되는 방향을 나타내는 이미지 그립의 방향 정보를 수신하는 단계; 복수의 추가 정보 요소들을 저장하는 추가 정보 스토리지 장치로부터 복수의 추가 정보 요소들을 수신하는 단계 - 복수의 부가 정보 요소들 중 각각의 요소는 미리 결정된 객체에 대응하고, 각각의 요소는 대응하는 객체의 위치를 나타내는 객체 위치 정보를 포함함 -; 이미지 픽업 위치 정보 및 서브필드들로 분할되는 이미지 획득 방향 정보에 의해 뷰 공간을 결정하는 단계; 및 서브필드들에 포함되는 위치들을 각각 나타내는, 객체들의 복수의 아이템 정보 아이템들을 포함하는 추가 정보까지 복수의 요소들 중에서 서브필드들 중 대응하는 하나에 설정되는 양을 초과하지 않는 양을 갖는 하나 이상의 추가 정보 요소에 대응하는 서브필드들 각각에 대해 선택되는 단계; 및 디지털 이미지 상에 오버레이되는(overlaid) 복수의 부가 정보 요소들로부터 대응하는 하나 이상의 요소들을 디스플레이하는 단계 - 복수의 부가 정보 아이템들로부터 대응하는 하나 이상의 요소들은 상기 선택 단계에서 선택됨 -(RU 2463663 C2, cl. G06T19/00, G06T11/60 참조).
공지된 방법은 카메라에 의해 캡처되는 지형 이미지 상에 중첩되는 추가 랜드마크 정보를 시각화하고 필터링하도록 구현될 수 있다.
공지된 방법의 단점은 지형의 랜드마크들의 매핑에서만 그것의 제한된 응용이 있고 그것이 캡처의 방향 및 위치에 대한 데이터를 획득하는 것을 요구하는 것이다. 공지된 방법은 이동 가능한 객체들 또는 지형과 관련 있지 않은 객체들에 대한 추가 정보를 디스플레이하기 위해 사용될 수 없다. 이들 결점들은 공지된 방법의 적용의 범위를 제한한다.
기술적인 본질에서 가장 근접한 프로토타입은 사용자에 의해 등록되는 메시지를 다른 사용자에게 게재하기 위한 마이크로블로깅(microblogging) 기능을 제공하고 이미지 데이터를 저장하도록 구성되는 데이터 저장 유닛을 포함하는 서버와 통신할 수 있는 이미지 처리 장치를 관리하기 위한 방법이다. 방법은 다음 단계들을 포함한다:
이미지 데이터가 데이터 저장 유닛에 저장되어 있으면, 서버 상의 제1 메시지를 등록 유닛으로 등록하는 단계;
등록시에 등록되는 제1 메시지에 대해 재등록되는 제2 메시지를 추적 유닛에 의해 추적하는 단계;
제2 메시지가 추적 동안에 검출되면 분석 유닛에 의해 제2 메시지를 분석하는 단계; 및
분석 시에 분석 결과에 기초하여 송신 유닛에 의해 송신되는 이미지 데이터를 데이터 저장 유닛에 저장하는 단계(RU 2013158163A, cl. G06F13/00 참조).
공지된 해결책은 추가 정보를 이미지에 제공하고 그것을 다른 사용자에게 제공하는 것을 허용한다.
공지된 방법의 단점은 이미지를 캡처하는 환경에 관계없이, 이미지와 관련되는 추가 정보의 과도한 축적이며, 디지털 정보의 저장의 용량 및 속도에 대한 높은 요건들을 초래하고 큰 정보 볼륨으로부터 정보를 선택하기 위한 필요로 인해 필요에 따라 추가 정보를 적용하는 것을 배제하거나 그것을 어렵게 만든다.
공지된 해결책은 정적 이미지 또는 과거에 획득된 이미지인 이미지에 관한 메시지들의 교환을 제공한다. 이러한 이미지는 실시간으로 획득되는 이미지일 수 없다.
게다가, 공지된 해결책의 본질은 사용자와의 메시지들의 교환에 대한 감소이며, 즉, 다수의 잠재적인 수신자들의 존재에서 수락 가능하지 않은 수신인을 필요로하는 어드레스 통신이 있다는 것이다.
본 명세서에서 달성되는 기술적 결과들은 다음과 같다:
- 이용되는 무선 통신 라인들에 대한 요건들을 감소시키는 것에 의한 구현의 단순화,
- 이미지 내의 객체들과 관련되지 않은 디스플레이 추가 정보의 가능성을 배제함으로써 사용의 편의성의 향상,
- 증강 현실로 실시간으로 획득되는 이미지를 사용하는 가능성의 보장,
- 무제한의 사용자들 수에 대한 추가 정보를 획득하는 가능성을 제공.
본 발명은 도면들을 사용하여 더 설명되고 예시되며, 도 1은 이미지 처리 장치를 제어하기 위한 방법의 일 구현의 개략적인 표현이며; 도 2는 이미지 처리 장치의 블록도이며; 도 3은 이미지 처리 장치의 컴퓨팅 수단의 알고리즘이다.
다음 기호들이 도면들에 이루어진다.
1 - 이미지 처리 장치, 2 - 다른 등록된 사용자의 이미지 처리 장치, 3 - 이미지 상에서 검출 및 인식되는 객체, 4 - 추가 정보의 이미지, 5 - 건축 객체, 6 - 인터넷, 7 - 빌트-인 카메라, 8 - 9 - 이미지 처리 장치의 디지털 저장 장치, 10 - 입력 수단, 11 - 디스플레이(스크린), 12 - 서버와의 통신용 모듈, 13 - 지리위치 모듈, 14 - 서버 데이터 처리 도구들(서버), 15 - 카메라 이미지들을 수신 및 입력, 지리위치 데이터를 수신 및 입력, 서버로부터의 데이터를 획득 및 입력, 16 - 디지털 스토리지의 메모리를 액세스, 인식용 객체 이미지들을 검색, 17 - 이미지 내의 객체들을 검출 및 인식, 18 - 이미지 내의 검출된 객체와 연관되는 다른 등록된 사용자들에 의해 생성되는 서버로부터의 수신된 데이터에서 추가적인 데이터(코멘트들)의 가용성을 체크, 19 - 다른 등록된 사용자들에 의해 생성되는 객체와 관련되는 코멘트들을 디스플레이, 20 - 서버 상의 객체 또는 지리적 좌표들과 관련되는 코멘트들을 송신, 21 - 이들 좌표들에 남겨진 다른 등록된 사용자들의 추가 정보를 체크, 22 - 다른 등록된 사용자들에 의해 형성되는 좌표들과 관련되는 코멘트들을 디스플레이, 23 - 서버에 송신하기 위한 입력 코멘트를 처리, 24 - 산출 프로그램으로부터의 종료 명령의 존재를 체크, 25 - 수신된 이미지의 다음 프레임의 분석으로의 전환, 26, 27 - 산출 프로그램 각각의 시작 및 종료, 28 - 인식 수단, 29 - 지리적 좌표 데이터의 비교 수단, 30 - 추가 정보의 오보레이(overlay)를 갖는 최종 이미지를 형성하기 위한 수단.
이미지 처리 장치를 제어하기 위한 방법은 다음과 같이 제공된다. 방법의 설명은 다음 용어들을 정의하기 위한 필요성과 관련된다. 최종 이미지 - 카메라 출력 또는 디지털 구동 메모리로부터 획득되는 이미지 신호. 추가 정보 -최종 이미지 및/또는 사운드의 상단 상에 사용자 입력 수단에 의해 입력되는 텍스트, 이미지, 사운드 또는 그들의 조합의 데이터, 지리위치 데이터 - GPS, GLONASS, GSM 기지국들 또는 유사물의 도움으로 획득되는, 이미지 처리 장치의 지리적 좌표들. 수신된 이미지에 관한 데이터 - 이미지 처리 장치가 이미지를 수신하고 추가 정보를 입력한 장소의 지리위치 데이터뿐만 아니라, 최종 이미지 상의 검출 및 인식된 객체에 관한 데이터. 등록된 사용자들 - 소셜, 교육, 전문 또는 다른 방향의 인터넷 자원의 회원들은 그러한 자원에 대해 설정된 순서에 따라 등록되고 그들의 이미지 처리 장치들을 사용하여 최종 이미지와 연관되는 추가 정보를 생성 및 게재(publish)하는 능력을 가짐. 수신된 이미지와 관련되는 추가 정보의 게재 - 수신된 이미지와 관련되는 추가 정보에 그들의 이미지 처리 장치들을 통해 등록된 사용자들에 대한 액세스를 제공하는 서버 상의 데이터 처리 설비들에 대응하는 신호들의 전송. 추가 정보를 최종 이미지에 링크 - 이미지 상에서 검출되는 객체의 대응하는 이미지를 지칭할 때 스크린 상에 디스플레이되고/되거나 재생 수단에 의해 재생되는 단일 데이터 블록의 형성.
서버-기반 데이터 처리 도구들은 서로 연결되고 예를 들어 SaaS, PaaS, IaaS, 유틸리티 컴퓨팅, MSP와 같은 클라우드 기술 모델들 중 하나를 구현하는 원격 서버 또는 한 세트의 서버들이다.
각각의 등록된 사용자는 그의 식별 데이터를 서버 처리 설비들에 사전에 송신하며, 이것에 의해 이들 데이터를 자원 관리자에게 제공하며, 그 후에 등록되며, 새로 등록된 사용자를 생성한다.
빌트-인 카메라 또는 디지털 스토리지에 의해, 이미지 신호는 생성되고 이미지 처리 장치의 스크린 상으로 변환되어(translated) 그것을 실시간으로 디스플레이하고 그것을 이미지 처리 장치의 산출 수단으로 공급한다.
산출 도구들의 도움으로, 카메라로부터 수신되는 이미지는 서버 상에 또는 이미지 처리 장치의 메모리에 저장되는 객체들의 이미지들과 비교되고, 필요할 경우, 빌트-인 지리위치 모듈을 사용하여 지리위치 데이터를 수신한다.
사용자에게 카메라로부터 수신되고 스크린 상에 디스플레이되는 이미지에 관한 추가 정보를 입력하는 능력을 제공한다. 이 경우, 추가 정보는 이미지 처리 장치의 실제 또는 가상 (스크린) 키보드 또는 아카이브(archive)로부터 생성 또는 선택되는 이미지, 또는 이미지 처리 장치의 마이크로폰을 사용하여 생성되거나 아카이브 또는 위의 조합으로부터 선택되는 오디오 파일을 사용하여 텍스트로 입력될 수 있다.
객체가 최종 이미지 상에서 검출되는 경우, 사용자는 추가 정보를 입력하고 사용자에 의해 입력되는 이러한 추가 정보를 인식된 객체의 이미지와 연관시켜 단일 데이터 블록을 형성하도록 프롬프트된다. 이러한 단일 데이터 블록은 필요할 경우, 이미지가 획득된 장소의 지리위치 데이터를 포함한다.
다른 등록된 사용자들에 의해 그러한 정보를 수신할 가능성을 가지고, 객체의 특정 이미지 상에서 검출되는 이미지와 연관되는 추가 정보의 이미지 신호들을 서버와 통신하기 위한 이미지 처리 장치 통신 수단에 의해 서버 데이터 처리 수단에 송신한다.
다른 사용자의 이미지 처리 장치의 컴퓨터 수단에 의해 검출된 특정 객체들과 연관되는 추가 정보를 획득한다.
연관이 그러한 다른 이미지 처리 장치 상에서 이루어진 수신된 이미지 상의객체를 인식할 때, 다른 이미지 처리 장치들의 도움으로 다른 사용자에 의해 수신되는 정보를 디스플레이하거나 재생한다.
추가 정보는 텍스트 및/또는 이미지 및/또는 사운드 및/또는 그 조합의 형태로 형성된다.
이미지 처리 장치는 미리 저장된 이미지들이 저장되는 빌트-인 카메라 또는 디지털 저장 장치, 키보드 및/또는 빌트-인 마이크로폰 버튼들로서 제공되는 입력 수단, 컴퓨팅 수단, 디지털 스토리지, 지리위치 모듈, 디스플레이 및 사운드 재생 모듈을 포함한다.
다른 이미지 처리 장치들의 도움으로 먼저 도입되는(introduced) 추가 정보의 디스플레이는 수신된 이미지의 상단 상에서 수행되고, 오디오 추가 정보의 재생은 우선 순위로 수행된다.
이미지 처리 장치를 제어하기 위한 방법은 다음과 같이 구현된다.
이미지 상에 출현하는 것으로 예상되는 객체들의 이미지들은 서버 데이터 처리 수단들 또는 디지털 저장 장치의 메모리에 미리 형성 및 저장된다.
전문 또는 소셜 인터넷 자원의 사용자들을 등록한다. 이 경우, 등록은 자원의 관리자에 의해 또는 등록된 사용자들 중 임의의 사용자의 초대에 기초하여 중앙에서 수행된다.
가장 단순한 경우, 빌트-인 카메라가 객체의 이미지는 위치될 수 있는 이미지를 수신하는, 이미지 신호를 형성하기 위한 수단을 사용하여, 상기 객체의 이미지는 서버 상에 또는 이미지 처리 장치의 메모리에 저장된다. 또한, 대응하는 빌트-인 지리위치 모듈로부터 지리위치 데이터를 수신한다.
인식이 발생하면, 즉, 데이터가 수신된 이미지에 대해 수신되고 사용자가 인식된 객체에 관한 추가 정보를 생성하기를 희망하면, 그것은 정보 입력 수단을 통해 텍스트 또는 멀티미디어 정보를 입력하고, 추가 정보를 인식된 객체와 연관시키고 추가 정보를 서버 상에 게재하기 위한 명령을 생성한다.
그러한 게재 후에, 임의의 등록된 사용자는 그의 이미지 처리 장치의 카메라가 이미지를 캡처할 때 증강 현실에 있게 될 기회를 가지며, 그 상에서 객체는 인식되고 상기 생성된 추가 정보는 이미지 처리 장치에 의해 수신된다.
등록된 사용자는 추가 정보를 갖는 수개의 메시지들이 있으면 추가 정보의 소스를 선택할 기회를 갖는다.
증강 현실은 빌트-인 카메라의 출력으로부터 획득되거나 우선 순위로 재생되는 이미지 상에 부과함으로써 실시간으로 이미지 처리 장치의 스크린 상에 디스플레이되는 추가 정보의 형태로 제공되어, 다른 동시 응용들의 재생 볼륨을 감소시킨다.
이미지 처리 장치는 이미지 형성 수단을 포함하며, 이는 이미지 및/또는 오디오 데이터, 입력 수단, 컴퓨터 수단, 지리위치 수단, 및 디스플레이를 갖는 카메라 또는 디지털 저장 장치일 수 있다.
본 발명의 실시예들은 이제 도면들을 참조하여 설명될 것이다. 이들 실시예들에서 공식화되는 구성요소들, 수치 표현들 및 수치 값들의 배열은 특별히 지시되지 않으면 본 발명의 범위를 제한하지 않는다.
이미지 처리 장치는 그것 상에 저장된 멀티미디어 콘텐츠를 갖는 카메라 또는 외부 디지털 저장 장치로 표현되는 이미지 형성 수단, 실제 또는 온 스크린 키보드 및/또는 마이크로폰으로 표현되는 입력 수단, 프로세서 및 소프트웨어로 구현되는 산출 수단, GPS 또는 GLONASS 모듈들 또는 GSM 기지국들에 따라 위치를 결정하기 위한 모듈에 의해 구현되는 위성항법장치를 위한 지리위치 모듈, 디스플레이 및 사운드 모듈, 및 Wi-Fi 표준들 또는 GPRS 또는 LTE 표준들 등의 제한들 내에서, 무선 데이터 통신을 위한 무선 데이터 송신 노드로서 구현되는, 서버에 대한 통신용 모듈을 포함한다. 이 경우, 이미지 형성 수단, 입력 수단, 지리위치 모듈 및 디스플레이는 산출 수단에 연결된다.
산출 수단은 이미지 상의 객체를 인식하기 위한 수단, 지리적 좌표 데이터를 비교하기 위한 수단, 디스플레이를 위한 최종 이미지를 형성하기 위한 수단을 포함한다.
이미지 형성 수단의 출력으로부터, 카메라로 획득되거나 외부 디지털 저장 장치의 메모리에 저장되는 비디오 이미지에 대응하는 신호는 산출 수단의 입력에 입력되며, 이는 획득된 이미지 상의 특정 객체의 검출 및 인식을 제공한다. 이 경우, 객체들을 인식하기 위한 이미지들은 산출 도구들의 내부 디지털 스토리지로부터 추출되거나 서버와의 통신 모듈을 사용하여 인터넷을 통해 산출의 수단에 연결되는 서버로부터 수신된다.
최종 이미지는 스크린 상에 디스플레이되며, 이는 또한 예를 들어 인식된 객체의 경계들을 강조함으로써 객체의 인식의 사실의 표시를 디스플레이한다.
객체가 인식되고, 사용자가 코멘트를 남기는 것을 희망하면, 그는 실제 또는 온-스크린 키보드를 사용하여 텍스트 입력을 형성하고/하거나 마이크로폰을 사용하여 음성 코멘트를 입력하고/하거나 인식된 객체와 연관하는 미디어 파일을 생성한다. 멀티미디어 파일은 소프트웨어 편집 도구들을 사용하여 생성되거나 빌트-인 디지털 스토리지로부터 추출될 수 있다. 사용자의 주해(commentary)는 수신된 이미지에 대한 추가 정보를 형성한다.
생성된 코멘트는 입력 도구들에 의해 생성되는 사용자의 명령에 따라 인식된 객체와 연관되고 서버와의 통신을 위한 통신 모듈을 사용하여 서버에 송신된다. 코멘트들을 서버에 송신하는 것은 생성된 추가 정보의 게재(publication)이다.
서버와의 통신을 위한 통신 모듈은 그러한 객체가 인식된 경우, 사용자가 다른 등록된 사용자들로부터 수신된 이미지 상의 객체들과 연관되는 코멘트들을 수신하는 것을 허용한다.
산출 수단을 위한 처리 알고리즘은 다음의 주요 단계들을 포함한다.
산출 프로그램은 대응하는 사용자 명령이 실행될 때 시작된다. 다음으로, 생성된 이미지, 지리위치 데이터 및 서버로부터의 데이터는 검색되고(15), 이미지는 이미지 상의 객체를 인식하기 위해 추출되고(16), 객체 인식의 사실을 체크하고(17), 인식된 객체와 연관되는 다른 등록된 사용자들의 코멘트들의 존재를 체크하고(18), 다른 등록된 사용자들의 코멘트들을 디스플레이한다(19). 서버에 대응하는 신호들의 송신을 위한 객체와 연관되는 코멘트들을 생성 및 처리하는 것은 서버에 송신하기 위한 데이터 패킷의 형성이다(23).
단계(21)에서, 이미지가 수신된 좌표들과 연관되는 다른 사용자들의 코멘트들의 존재를 체크하여, 추가 정보가 이들 좌표들을 특징으로 하는 위치에서 다른 등록된 사용자들에 의해 남겨졌는지가 체크된다. 단계(22)에서, 사용자의 이미지 처리 장치의 위치 좌표들과 연관되는 다른 등록된 사용자들로부터의 코멘트들이 디스플레이된다.
이미지와 연관되는 추가 정보를 포함하는 신호를 생성하고 그것을 서버에 전송하는 것을 명령한다(20).
단계(24)에서, 프로그램으로부터의 종료 명령이 있는지가 체크된다. 있으면, 그 다음, 프로그램은 종료되며(27), 그렇지 않으면, 그 다음, 이미지의 다음 프레임들이 처리된다(25).
실시예 1
카메라, 소프트웨어를 갖는 프로세서, 통합 스토리지, 지리위치 모듈, 디스플레이 및 무선 통신 모듈, 예를 들어 GPRS를 장착한 전화기가 이미지 처리 장치로 사용된다.
관련 소셜 인터넷 자원의 그의 블로그들에 대한 구독자들을 갖는 사용자는 -상기 구독자들은 이후 다른 등록된 사용자들로서 지칭됨 -, 로마에 있는 동안에, 전화기의 카메라를 관심 있는 x 건축 구조에 안내한다(도 1). 이 경우, 사용자의 전화기는 이미지들이 공지된 건축 객체들을 인식하기 위해 저장되는, 서버의 데이터베이스를 액세스한다. 사용자에 의해 캡처되는 이미지는 카메라의 시야에 들어온 건축 객체가 콜로세움으로서의 특정 개연성으로 인식될 수 있도록 이미지 상의 건축 객체를 인식하기 위해 서버에서 산출 수단에 의해 처리된다.
사용자의 전화기의 산출 수단은 또한 인식 프로세스에 수반될 수 있으며, 이 경우 사용자의 전화기의 데이터는 원격 서버에 계속 송신되므로, 이러한 지리적 위치에 위치되는 건축 객체들의 이미지들은 인터넷을 통해 사용자의 전화기의 디지털 스토리지에 펌핑되고(pumped) 산출 수단에 대한 사용자의 전화기는 이미지 내의 특정 객체들을 인식하기 위해 사용된다.
객체가 전화기의 산출 수단에 의해 인식된 후에, 대응하는 메시지가 디스플레이 상에 형성 및 디스플레이되어, 사용자에게 인식의 사실에 대해 통지한다. 그러한 메시지는 이미지에서 인식된 객체의 강조 또는 다른 선택의 형태일 수 있다.
사용자는 증강 현실을 형성하는 능력을 갖는다. 공지된 장소를 방문한 사실에 시선을 고정시키고자, 사용자는 입력 수단 모듈의 도움으로 그의 이름으로 텍스트를 도입하고 송신을 위한 명령을 형성한다. 이 경우, 입력된 메시지는 지정된 건축 객체가 전화기 카메라의 시야에 수신되어 인식되면, 인식된 객체의 이미지와 전화기의 산출 수단에 의해 연관되고 다른 등록된 사용자의 전화기의 디스플레이 상에 디스플레이될 수 있다.
따라서, 임의의 등록된 사용자는 증강 현실을 생성하는 프로세스에 참여할 수 있고, 동시에, 다른 등록된 사용자들로부터 추가 정보를 갖는 메시지들을 수신하는 가능성으로 인해 다른 등록된 사용자들에 의해 생성되는 증강 현실의 조건들에 있는 기회를 갖는다. 이들 메시지들은 메시지들이 다른 등록된 사용자들에 의해 이전에 입력된 객체들의 전화를 산출하는 것에 의해 인식함으로써 획득될 수 있다.
객체의 인식은 예를 들어, 성공적이지 못한 카메라 각도, 불충분한 조명, 또는 객체의 이미지의 부족으로 인해 발생하지 않을 수 있다. 이 경우, 사용자에 의해 남겨진 메시지는 사용자의 메시지가 이루어진 장소의 좌표들과 연관되므로, 동일한 또는 유사한 지리적 좌표들을 특징으로 하는 위치에서 자신을 발견하는 등록된 사용자의 다른 전화기는 그의 전화기 디스플레이 상에서 제1 사용자에 의해 이전에 입력된 상기 메시지를 수신한다. 메시지는 이러한 다른 등록된 사용자의 전화기의 빌트-인 카메라의 출력으로부터 획득되는 이미지의 상단 상에 출력된다.
실시예 2
이미지 처리 장치를 제어하는 방법은 외국어의 학습 과정 내에서 학생의 지식을 테스트하기 위해 사용된다. 이동 통신 장치는 이미지 처리 장치로서 사용되며, 상기 통신 장치는 내장된 카메라, 소프트웨어를 갖는 프로세서, 빌트-인 저장 장치, 디스플레이 및 오디오 재생 수단, 마이크로폰 및 무선 통신 모듈, 예를 들어 서버와의 통신을 위한 Wi-Fi를 포함한다.
교사 및 학생들은 등록된 사용자들로서 관련 교육 인터넷 자원에 함께 참여한다.
교사는 학생들에게 방과 후 또는 학교에 오는 길에 특정 역사적 사건과 연관되는 도시 내의 공지된 건물들을 방문하고 역사, 도시를 위한 중요성, 소유자 또는 다른 것의 특성들에 대해 외국어로 그들을 간략하게 특징짓거나, 상기 건물들에 관한 질문들에 답하도록 지시한다.
건물을 지나가는 동안, 학생은 그것을 빌트-인 카메라로 캡처하고, 필요한 텍스트를 발음하고 그것을 추가 정보로 송신한다.
결과들을 체크 아웃하는 과정 동안에, 교사는 도시의 건축 객체들 또는 단순 건물들 및 기관들의 미리 생성된 이미지들을 포함하는 데이터베이스를 사용하여, 그의 업무와 직접 관련되는 객체들을 선택한다.
객체가 그것의 이미지 처리 장치에 의해 인식된 후에, 교사는 그들이 선택한 객체에 그들의 코멘트들을 남긴 학생들의 리스트를 수신하고 원하는 성을 선택함으로써 대응하는 학생의 독백을 청취한다.
그러한 업무들은 그들의 특이한 성격 및 참신성을 갖는 학생들에 대해 매력적이며, 그러한 업무들을 사용하는 것은 도시의 생활의 실제 상황들에서 학생의 지식을 체크하고, 또한 업무가 특정 기간 후에 반복될 때 과정에 대한 학생의 숙달의 역동성들의 아이디어를 얻는 것을 가능하게 한다.
실시예 3
이미지 처리 장치를 제어하는 방법은 교사와 학생의 부모들 사이에서 메시지들을 교환하기 위한 수단으로 사용된다.
이미지 처리 장치로서, 내장된 카메라, 소프트웨어를 갖는 프로세서, 빌트-인 저장 장치, 디스플레이 및 오디오 재생 수단, 마이크로폰 및 무선 통신 모듈, 예를 들어 서버와의 통신을 위한 Wi-Fi를 장착한 이동 통신 장치가 사용된다.
교사, 학생들 및 그들의 부모들은 교육 과정에서 생성되는 자원의 등록된 사용자들이다. 학생들의 얼굴들의 인식을 위해 사용되는 이미지들은 미리 생성되고 서버의 메모리에 저장된다.
훈련의 과정에서, 교사는 부모들에게 그들의 자녀에게 일어난 성공들 또는 문제들에 대해 주기적으로 알릴 필요가 있다. 교사는 그의 전화기의 빌트-인 카메라로 전화기의 산출 수단에 의해 인식되는 학생의 얼굴의 이미지를 캡처하고 부모들을 위한 오디오 또는 텍스트 메시지를 기록한다.
교사로부터의 메시지들의 가용성에 대해 배우고 그들의 콘텐츠를 아는 것을 희망하는 부모들은 그들의 통신 수단의 카메라로 그들의 아이들의 얼굴의 이미지를 캡처하고 인식 후에 교사에 의해 남겨진 대응하는 사운드 또는 텍스트 메시지를 수신한다.
응답으로서, 부모들은 그들의 통신 도구들을 통해, 그들이 학생을 보고 그들의 통신 장치의 카메라를 사용하여 학생의 얼굴의 이미지를 캡처할 때 e-메일 메시지를 그것을 수신할 교사에게 남길 수 있다.
따라서, 메시지들은 그들에게 편리한 그들의 여유 시간에서 등록된 사용자들에 의해 생성되고, 학생은 메시지들이 형성되는 사람들과 관련하여, 대화에서 참가자가 되거나, 적어도, 교사의 피드백을 전달하였다.
이미지 처리 장치를 제어하기 위한 방법은 공지된 및 인식된 객체의 이미지가 캡처된 이미지 상에 출현할 때, 또는 사용자가 이러한 추가 정보가 생성될 지리적 좌표들에 있을 때에만 추가 정보의 디스플레이 또는 재생을 허용한다. 많은 양의 정보를 등록된 이미지 처리 장치에 전달할 필요가 없으며 이는 무선 통신 라인들의 데이터 전송의 속도에 대한 요건들 감소시킨다. 게다가, 디스플레이를 위해 송신되는 그러한 정보의 자동 선택은 이미지 처리 장치의 유용성을 향상시키며, 이는 장치의 구현을 용이하게 하고 수신된 추가 정보로 생산적인 작업을 가능하게 한다.
이미지 처리 장치를 제어하는 방법은 사용자가 실시간으로 획득되는 이미지 상의 추가 정보를 획득하는 것을 허용하여, 증강 현실의 조건들에서 그 자신이 느끼는 것을 허용한다. 이 경우, 사용자는 그가 생성한 추가 정보에 대한 목적지를 결정할 필요가 없으며, 이는 객체 인식의 조건이 수행되거나, 필요할 경우, 즉, 추가 정보가 생성된 지리적 좌표들의 근접성이 무제한의 사용자들의 수를 위한 것일 때 임의의 등록된 사용자의 장치 이미지 처리에 송신된다.
이미지 처리 장치를 제어하기 위한 방법은 표준 구성요소들 및 카메라, 디스플레이, 프로세서 등과 같은 독립 모듈들을 포함하는 한 세트의 전자 구성요소들을 사용하여 구현될 수 있다.
따라서, 이미지 처리 장치를 제어하는 방법은 사용되는 무선 통신 라인들에 대한 요건들을 감소시킴으로써 구현에 있어 더 단순하고, 그것이 이미지 상에서 검출되는 객체들과 관련되지 않은 추가 정보의 디스플레이를 배제하므로 사용하기에 더 편리하고, 증강 현실의 실시간 형성 조건들에서 이미지를 사용하는 가능성을 제공하고, 또한 무제한의 사용자들 범위에 대한 추가 정보를 획득하는 기회를 제공한다.

Claims (10)

  1. 이미지 처리 장치를 제어하기 위한 방법으로서, 재생될 데이터를 다른 등록된 사용자의 이미지 처리 장치 상에 송신하는 단계를 포함하며,
    a. 이미지 신호 형성 수단에 의해 이미지 신호를 획득하고 스크린에 의해 실시간으로 디스플레이하는 단계,
    b. 획득된 이미지 상에서 적어도 하나의 객체를 인식하는 단계,
    c. 입력 수단에 의해 입력되는 추가 정보를 상기 인식된 객체의 이미지에 연관시키는 단계,
    d. 데이터의 송신은 인터넷을 사용하여 다른 등록된 사용자들의 이미지 처리 장치들 상에서 데이터를 수신하는 가능성으로, 상기 인식된 객체의 상기 이미지와 관련되는 추가 정보의 전송이고,
    e. 최종 이미지 상의 상기 관련 객체의 인식의 사실이 이용 가능한, 상기 디스플레이 추가 정보이면, 다른 등록된 사용자들의 상기 이미지 처리 장치들로 먼저 입력된 추가 정보를 수신 및 디스플레이하는 단계,
    상기 획득된 이미지 상의 객체들의 인식 및 추가 정보를 상기 인식된 객체의 상기 이미지와 연관시키는 것은 실시간으로 수행되며, 다른 이미지 처리 장치들의 도움으로 먼저 도입된 추가 정보의 출력은 상기 이미지 신호 형성 수단의 출력으로부터 획득되는 상기 이미지에 대해 수행되는 것을 특징으로 하는 방법.
  2. 제1항에 있어서,
    상기 이미지 상의 상기 객체의 상기 인식은 상기 객체들의 저장된 이미지들과 상기 획득된 이미지의 비교에 기초하여 산출 수단에 의해 수행되는 방법.
  3. 제1항에 있어서,
    상기 추가 정보는 텍스트 및/또는 오디오 신호, 및/또는 그 조합을 포함하는 이미지로서 형성되는 방법.
  4. 제1항에 있어서,
    상기 이미지 형성 수단은 빌트-인 카메라인 방법.
  5. 제1항에 있어서,
    상기 이미지 신호 형성 수단은 디지털 데이터 스토어(store)인 방법.
  6. 제1항에 있어서,
    상기 인식된 객체의 상기 이미지와 연관되는 추가 정보의 상기 전송은 상기 인터넷를 통해 다른 등록된 사용자들의 이미지 처리 장치들과 연관되는 서버 데이터 처리 수단에 수행되는 방법.
  7. 제1항에 있어서,
    상기 등록된 사용자의 출현은 다음 단계들: 즉, 이미 등록된 관리자 또는 사용자에게 사용자 등록 요청을 제공하는 단계, 상기 사용자에게 등록 응답 메시지를 생성 및 송신하는 단계를 포함하는 방법.
  8. 제1항에 있어서,
    상기 인식된 객체에 대한 추가 정보의 상기 연관은 단일 데이터 블록을 형성하는 단계를 포함하여, 상기 대응하는 객체가 상기 이미지에서 인식될 때, 상기 객체와 연관되는 추가 정보는 이러한 데이터 블록에 포함되는 것을 특징으로 하는 방법.
  9. 제1항에 있어서,
    상기 인식된 객체에 대한 추가 정보의 상기 연관은 추가 정보가 이미지 처리 장치 상에서 임의의 등록된 사용자에 의해 생성될 때 수행되는 것을 특징으로 하는 방법.
  10. 제1항에 있어서,
    상기 이미지 처리 장치는 이미지 신호 형성 수단, 입력 수단, 컴퓨팅 수단, 및 디스플레이를 포함하는 방법.
KR1020187011158A 2015-09-24 2016-09-09 이미지 처리 장치를 제어하는 방법 KR20180056728A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
RU2015140595A RU2622843C2 (ru) 2015-09-24 2015-09-24 Способ управления устройством обработки изображения
RU2015140595 2015-09-24
PCT/RU2016/050031 WO2017052420A1 (ru) 2015-09-24 2016-09-09 Способ управления устройством обработки изображения

Publications (1)

Publication Number Publication Date
KR20180056728A true KR20180056728A (ko) 2018-05-29

Family

ID=58386761

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020187011158A KR20180056728A (ko) 2015-09-24 2016-09-09 이미지 처리 장치를 제어하는 방법

Country Status (6)

Country Link
US (1) US20180249063A1 (ko)
EP (1) EP3358505A4 (ko)
KR (1) KR20180056728A (ko)
CN (1) CN108351973A (ko)
RU (1) RU2622843C2 (ko)
WO (1) WO2017052420A1 (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10469755B2 (en) 2017-05-16 2019-11-05 Google Llc Storing metadata related to captured images
US20200219214A1 (en) * 2019-01-09 2020-07-09 Charles Isgar System for interaction regarding real estate sales
US20200219205A1 (en) * 2019-01-09 2020-07-09 Charles Isgar System for social interaction regarding features based on geolocation

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5184217B2 (ja) * 2007-05-31 2013-04-17 パナソニック株式会社 画像撮影装置、付加情報提供サーバ及び付加情報フィルタリングシステム
US20080317346A1 (en) * 2007-06-21 2008-12-25 Microsoft Corporation Character and Object Recognition with a Mobile Photographic Device
JP5436559B2 (ja) * 2008-09-02 2014-03-05 エコール・ポリテクニーク・フェデラル・ドゥ・ローザンヌ(エーペーエフエル) ポータブル・デバイス上での画像アノテーション
US8155698B2 (en) * 2009-03-25 2012-04-10 Embarq Holdings LLC System and method for storing and displaying data with digital images
JP5343676B2 (ja) * 2009-04-08 2013-11-13 ソニー株式会社 画像処理装置、画像処理方法およびコンピュータプログラム
US9195898B2 (en) * 2009-04-14 2015-11-24 Qualcomm Incorporated Systems and methods for image recognition using mobile devices
US20130259387A1 (en) * 2012-03-29 2013-10-03 Otter Creek Holdings, Llc Systems and methods for landmark detection
US20130287256A1 (en) * 2012-04-30 2013-10-31 Telibrahma Convergent Communications Private Limited Method and system for real time image recognition on a mobile device
US10216996B2 (en) * 2014-09-29 2019-02-26 Sony Interactive Entertainment Inc. Schemes for retrieving and associating content items with real-world objects using augmented reality and object recognition

Also Published As

Publication number Publication date
RU2015140595A (ru) 2017-03-29
CN108351973A (zh) 2018-07-31
RU2622843C2 (ru) 2017-06-20
WO2017052420A1 (ru) 2017-03-30
EP3358505A4 (en) 2019-04-24
EP3358505A1 (en) 2018-08-08
US20180249063A1 (en) 2018-08-30

Similar Documents

Publication Publication Date Title
US11783862B2 (en) Routing messages by message parameter
US11803345B2 (en) Gallery of messages from individuals with a shared interest
US9854219B2 (en) Gallery of videos set to an audio time line
US11871109B2 (en) Interactive application adapted for use by multiple users via a distributed computer-based system
US20160277885A1 (en) Location information sharing method and apparatus
AU2019201980B2 (en) A collaborative virtual environment
KR20180056728A (ko) 이미지 처리 장치를 제어하는 방법
US20230031587A1 (en) System and method of controlling image processing devices
US20200285852A1 (en) Method of controlling an image processing device
US11195336B2 (en) Framework for augmented reality applications
CN112115284B (zh) 多媒体推荐方法、装置、设备及存储介质
US20210247894A1 (en) Social Matching Games in Dating Software
NZ792078A (en) Interactive application adapted for use by multiple users via a distributed computer-based system
CN117128994A (zh) 一种基于ar弹幕的导航方法、装置、计算机设备和存储介质
CN117612417A (zh) 基于ar技术的课堂教学方法
CN115171000A (zh) 一种在线健身授课方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application