KR20080004772A - 메타 데이터를 생성하는 데이터 기록 및 재생 장치 및 방법 - Google Patents

메타 데이터를 생성하는 데이터 기록 및 재생 장치 및 방법 Download PDF

Info

Publication number
KR20080004772A
KR20080004772A KR1020060063487A KR20060063487A KR20080004772A KR 20080004772 A KR20080004772 A KR 20080004772A KR 1020060063487 A KR1020060063487 A KR 1020060063487A KR 20060063487 A KR20060063487 A KR 20060063487A KR 20080004772 A KR20080004772 A KR 20080004772A
Authority
KR
South Korea
Prior art keywords
metadata
data
image file
image
text data
Prior art date
Application number
KR1020060063487A
Other languages
English (en)
Other versions
KR100856407B1 (ko
Inventor
고창석
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020060063487A priority Critical patent/KR100856407B1/ko
Priority to US11/650,539 priority patent/US7831598B2/en
Priority to EP07101296A priority patent/EP1876596A3/en
Priority to CN2007100069295A priority patent/CN101101779B/zh
Publication of KR20080004772A publication Critical patent/KR20080004772A/ko
Application granted granted Critical
Publication of KR100856407B1 publication Critical patent/KR100856407B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/11Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information not detectable on the record carrier
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/222Studio circuitry; Studio devices; Studio equipment
    • H04N5/262Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/031Electronic editing of digitised analogue information signals, e.g. audio or video signals
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • G11B27/30Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on the same track as the main recording
    • G11B27/3027Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on the same track as the main recording used signal is digitally coded
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • G11B27/30Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on the same track as the main recording
    • G11B27/3027Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on the same track as the main recording used signal is digitally coded
    • G11B27/3036Time code signal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/235Processing of additional data, e.g. scrambling of additional data or processing content descriptors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/4223Cameras
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/435Processing of additional data, e.g. decrypting of additional data, reconstructing software from modules extracted from the transport stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/4402Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
    • H04N21/440236Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display by media transcoding, e.g. video is transformed into a slideshow of still pictures, audio is converted into text
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/84Generation or processing of descriptive data, e.g. content descriptors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/84Generation or processing of descriptive data, e.g. content descriptors
    • H04N21/8405Generation or processing of descriptive data, e.g. content descriptors represented by keywords
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/91Television signal processing therefor
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N2201/3201Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N2201/3225Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document
    • H04N2201/3226Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document of identification information or the like, e.g. ID code, index, title, part of an image, reduced-size image
    • H04N2201/3228Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document of identification information or the like, e.g. ID code, index, title, part of an image, reduced-size image further additional information (metadata) being comprised in the identification information
    • H04N2201/3229Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document of identification information or the like, e.g. ID code, index, title, part of an image, reduced-size image further additional information (metadata) being comprised in the identification information further additional information (metadata) being comprised in the file name (including path, e.g. directory or folder names at one or more higher hierarchical levels)

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Library & Information Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Television Signal Processing For Recording (AREA)
  • Studio Devices (AREA)
  • Management Or Editing Of Information On Record Carriers (AREA)

Abstract

본 발명은 메타 데이터를 생성하는 데이터를 기록 및 재생하는 장치 및 방법에 관한 것이다. 본 발명에 따른 데이터 기록 및 재생 장치는 영상을 촬영하고 촬영된 영상을 영상 데이터로 생성하여 영상 데이터를 포함하는 영상 파일을 생성하는 신호 처리부; 음성을 인식하여 텍스트 데이터로 변환하는 음성 인식부; 및 텍스트 데이터를 메타 데이터로 생성하고, 영상 파일에 메타 데이터를 부가하여 메타 데이터를 포함하는 영상 파일을 생성하는 제어부를 포함한다. 본 발명에 따르면, 영상 콘텐츠를 기록하는 시점에서 영상 콘텐츠 기록 장치를 이용하여 영상 콘텐츠에 대한 관리 정보로서 메타 데이터를 생성할 수 있으므로, 신뢰성 있는 메타 데이터가 포함된 영상 파일을 생성할 수 있다.
영상 데이터, 메타 데이터, 영상 파일, 음성 인식, 텍스트 데이터

Description

메타 데이터를 생성하는 데이터 기록 및 재생 장치 및 방법{Data recording and reproducing apparatus for generating metadata and method therefor}
도 1은 본 발명의 일 실시예에 따른 메타 데이터를 생성하는 데이터 기록 및 재생 장치의 구성을 나타내는 블록도.
도 2는 본 발명의 일 실시예에 따른 음성 인식을 이용하여 변환된 텍스트 데이터에 기초하여 생성된 폴더의 이름 및 영상 파일에 포함되는 메타 데이터를 나타내는 도면.
도 3은 본 발명의 다른 실시예에 따른 메타 데이터를 생성하는 데이터 기록 방법을 나타내는 흐름도.
도 4는 본 발명의 다른 실시예에 따른 메타 데이터를 생성하는 데이터 기록 방법을 나타내는 흐름도.
도 5는 본 발명의 일 실시예에 따른 메타 데이터를 포함하는 영상 파일을 기록 및 재생하는 방법을 나타내는 흐름도.
본 발명은 데이터를 기록 및/또는 재생하는 장치 및 방법에 관한 것으로, 더 욱 상세하게는 영상 콘텐츠를 관리하고 검색하기 위한 관리 정보로서 메타 데이터를 생성하는 데이터 기록 및/또는 재생 장치 및 방법에 관한 것이다.
디지털 카메라 보급이 일반화되면서 사용자가 디지털 영상을 검색하거나 관리하여야 하는 기회가 많아지고 있다. 디지털 영상을 검색하거나 관리하기 위해서는 사용자는 카메라에 저장되어 있는 영상 파일을 컴퓨터로 옮긴 다음, 컴퓨터상의 영상 관리 및 편집 프로그램을 이용하여 사진이나 동영상에 부가 정보를 별도로 기록한다. 또한, 사용자는 컴퓨터의 영상 관리 및 편집 프로그램을 이용하여 사진이나 동영상을 촬영 장소, 촬영 시간과 같은 카테고리로 분류하기도 한다.
그러나, 영상 관리 및 편집 프로그램을 이용하여 영상을 관리하는 경우, 사용자가 영상 관리 및 편집 프로그램상에서 영상 콘텐츠에 부가적인 메모를 하려고 하더라도 영상을 촬영한 장소나 인물을 정확하게 기억하지 못하는 경우가 있다. 또한, 카메라에 저장되어 있는 영상을 우선 컴퓨터로 다운로드 하여야 영상 파일을 관리할 수 있으며, 하나의 영상 관리 및 편집 프로그램상에서 영상에 대한 메모와 같은 부가 정보를 부가하더라도, 다른 영상 관리 및 편집 프로그램에서는 이러한 부가 정보가 판독되지 않을 수 있다.
본 발명이 이루고자 하는 기술적 과제는 상기의 문제점을 해결하기 위한 것으로, 영상을 기록하는 장치상에서 영상 파일에 대한 관리 정보로서 메타 데이터를 생성하여 영상 파일을 쉽게 관리할 수 있도록 하는 데이터를 기록 및/또는 재생하는 장치 및 방법을 제공하는 데 있다.
본 발명이 이루고자 하는 다른 기술적 과제는 음성 인식을 통하여 영상 콘텐츠에 대한 메타 데이터를 생성할 수 있는 데이터를 기록 및/또는 재생하는 장치 및 방법을 제공하는 데 있다.
상기의 기술적 과제를 해결하기 위한 본 발명의 일 특징에 따른 데이터 기록 및 재생 장치는 영상을 촬영하고 촬영된 영상을 영상 데이터로 생성하여 영상 데이터를 포함하는 영상 파일을 생성하는 신호 처리부; 음성을 인식하여 텍스트 데이터로 변환하는 음성 인식부; 및 텍스트 데이터를 메타 데이터로 생성하고, 영상 파일에 메타 데이터를 부가하여 메타 데이터를 포함하는 영상 파일을 생성하는 제어부를 포함한다.
바람직하게는, 제어부는, 텍스트 데이터를 설명 태그로 생성하고, 텍스트 데이터로부터 키워드를 추출하여 추출된 키워드를 키워드 태그로 생성하여 메타 데이터를 생성한다.
바람직하게는, 생성된 영상 파일을 저장하는 저장부를 더 포함한다.
바람직하게는, 제어부는 텍스트 데이터에 기초한 이름을 가지는 폴더를 생성한다.
바람직하게는, 제어부는 영상 파일을 텍스트 데이터에 기초한 이름을 가지는 폴더에 저장한다.
바람직하게는, 영상 파일에 포함된 영상 데이터를 표시하거나 또는 영상 데이터와 함께 메타 데이터를 표시하는 표시부를 더 포함한다.
바람직하게는, 표시부에서 영상 파일이 표시되고 있는 동안에, 음성 인식부에 의해 새로 입력된 음성이 텍스트 데이터로 변환되면, 제어부는 변환된 텍스트 데이터로부터 메타 데이터를 생성하고, 생성되는 메타 데이터를 영상 파일에 포함되어 있는 메타 데이터와 비교하고, 생성되는 메타 데이터가 영상 파일에 포함되어 있는 메타 데이터와 다른 경우, 생성되는 메타 데이터를 영상 파일의 메타 데이터에 부가한다.
바람직하게는, 표시부에 영상 데이터가 표시되고 있지 않은 동안에, 음성 인식부에 의해 입력된 음성이 텍스트 데이터로 변환되면, 제어부는 영상 파일을 텍스트 데이터에 기초한 이름을 가지는 폴더를 생성한다.
바람직하게는, 오디오 데이터를 출력하는 오디오 출력부를 더 포함하고, 표시부에 영상 파일이 표시되고 있는 동안, 제어부는 표시되고 있는 영상 파일에 포함된 메타 데이터를 오디오 신호로 변환하여 오디오 출력부로 출력한다.
상기의 기술적 과제를 해결하기 위한 본 발명의 다른 특징에 따른 데이터 기록 및 재생 방법은 영상을 촬영하고 촬영된 영상을 영상 데이터로 생성하여 영상 데이터를 포함하는 영상 파일을 생성하는 단계; 음성을 인식하여 텍스트 데이터로 변환하는 단계; 텍스트 데이터를 메타 데이터로 생성하는 단계; 및 영상 파일에 메타 데이터를 부가하여 메타 데이터를 포함하는 영상 파일을 생성하는 단계를 포함한다.
이하, 첨부한 도면을 참조하여 본 발명의 바람직한 실시예에 대하여 상세하게 설명한다.
도 1은 본 발명의 일 실시예에 따른 메타 데이터를 생성하는 데이터 기록 및 재생 장치의 구성을 나타내는 블록도이다.
본 발명의 일 실시예에 따른 메타 데이터를 생성하는 데이터 기록 및 재생 장치(100)는 신호 처리부(110), 음성 인식부(120), 제어부(130), 저장부(140), 사용자 입력 장치(150), 표시부(160), 및 오디오 출력부(170)를 포함한다. 본 발명의 메타 데이터를 생성하는 데이터 기록 및 재생 장치(100)는 정지 영상 및 동영상을 기록 및 재생할 수 있는 디지털 카메라 또는 캠코더로 구성될 수 있다.
신호 처리부(110)는 영상을 촬영하고 촬영된 영상을 처리하여 영상 데이터를 생성한다. 신호 처리부(110)는 CCD(Charged Coupled Device, 111), CDS-ADC(Correlation Double Sampler-Analog to Digital Converter) 부(113) 및 DSP(Digital Signal Processor, 115)를 포함한다. CCD(111)는 렌즈(도시되지 않음)로부터 결상된 상을 광학적으로 처리하고 전기적 아날로그 신호로 변환하여 CDS-ADC부(113)로 공급한다. CDS-ADC부(113)는 입력된 아날로그 신호를 처리하여 디지털 신호로 변환한다. DSP부(115)는 디지털 신호를 설정된 해상도에 따라 처리하여 디지털 영상 파일을 생성한다. 또한 DSP부(115)는 선택적으로 설정된 압축률에 따라 압축하여 압축된 디지털 영상 파일을 생성한다.
음성 인식부(120)는 마이크(121)로부터 입력되는 음성을 인식하여 텍스트 데이터로 변환한다.
제어부(130)는 도 1에 도시된 데이터 기록 및 재생 장치(100)내의 각 부 사이의 데이터 송수신을 제어한다. 또한, 제어부(130)는 텍스트 데이터를 메타 데이 터로 생성하고, 신호 처리부(110)에서 생성된 영상 파일에 메타 데이터를 부가하여 영상 파일을 생성한다. 제어부(130)는, 텍스트 데이터를 설명 태그로 생성하고, 텍스트 데이터로부터 키워드를 추출하여 추출된 키워드를 키워드 태그로 생성하여 메타 데이터를 생성할 수 있다. 제어부(130)가 메타 데이터를 생성하는 방법은 상기의 메타 데이터가 영상 파일내에 포함될 수 있는 형태이면 여러 가지 방법으로 생성될 수 있다. 또한, 제어부(130)는 사용자 입력 신호를 수신하기 위한 메뉴를 포함하는 화면을 구성하여 표시부(160)에 출력할 수 있다.
DSP부(115)에서 생성되는 디지털 영상 데이터는 정지 영상 데이터의 경우 JPEG, TIFF의 형식의 영상 파일일 수 있고, 동영상 데이터의 경우 MPEG 형식의 영상 파일일 수 있다. 이들 영상 파일은 영상 데이터를 저장하는 영역 외에, 영상 데이터에 대한 각종 정보를 저장하는 영역을 포함한다.
영상 데이터에 대한 각종 정보를 저장하는 영역을 헤더 영역이라고 한다. 예를 들어, JPEG 영상 파일의 경우에는 헤더 영역에 EXIF(EXchangeable Image Format) 데이터를 포함하고 있다. EXIF 데이터는 카메라의 제조사, 기기 모델, 노출 시간, 조리개 수치, 셔터 스피드, 렌즈 구경, 플래쉬의 사용여부, 초점 거리와 같은 영상에 대한 정보를 포함한다.
본 발명의 일 실시예에 따르면, 제어부(130)는 음성 인식에 의해 생성된 설명 태그 및 키워드 태그를 메타 데이터로서 EXIF 데이터에 부가하여 메타 데이터가 부가된 영상 파일을 생성할 수 있다. 이와 같이 생성된 영상 파일은 저장부(140)에 저장된다.
한편, 제어부(130)는 설명 태그 및 키워드 태그를 영상 파일에 부가할 때, 설명 태그 및 키워드 태그 각각에 대한 식별자와 함께 부가하여, 설명 태그 및 키워드 태그가 영상 파일에서 쉽게 구별되어 해석될 수 있도록 구성할 수 있다. 또는, 제어부(130)는 설명 태그 및 키워드 태그를 헤더 영역의 특정 위치에 배치하여, 본 발명의 일 실시예에 따라 생성된 영상 파일을 재생할 때, 상기의 특정 위치의 설명 태그 또는 키워드 태그를 판독함으로써 메타 데이터가 판독되도록 할 수 있다. 따라서, 본 발명에 따라 생성된 영상 파일을 판독하여 재생할 수 있는 장치는, 메타 데이터 즉, 설명 태그 또는 키워드 태그를 검색 키워드로서 이용하여 영상 파일을 검색하거나 분류할 수 있다. 또한, 인터넷과 같은 네트워크상에서 영상 파일을 업로드하면, 다수의 사람들이 영상 파일에 포함된 메타 데이터를 이용하여 공통되는 메타 데이터를 가지는 영상 파일을 검색할 수 있게 된다.
사용자 입력 장치(150)는 키 버튼을 포함하는 키 패드, 표시부(160)에 제공되는 메뉴를 선택하기 위한 선택 레버, 터치 스크린 등으로 구성될 수 있으며, 사용자 입력 신호를 수신하여 제어부(130)에 전달한다. 제어부(130)는 사용자 입력 신호에 의해 요구되는 동작을 수행한다. 예를 들어, 제어부(130)는 영상 촬영을 요청하는 사용자 입력 신호에 기초하여 신호 처리부(110)를 제어하여 영상을 촬영이 촬영되도록 제어하여 영상 파일을 생성할 수 있다. 또한, 사용자 입력 장치(150)로부터 메타 데이터의 생성을 요청하는 사용자 입력 신호가 수신되는 경우에만, 제어부(130)가 본 발명의 일 실시예에 따라 메타 데이터를 생성하여 메타 데이터를 포함하는 영상 파일이 생성되도록 할 수 있다.
한편, 제어부(130)는 텍스트 데이터에 기초한 이름을 가지는 폴더를 생성할 수 있다. 제어부(130)는 사용자 입력 장치(150)로부터 텍스트 데이터에 기초한 이름을 가지는 폴더를 생성을 요청하는 사용자 입력 신호가 수신되되는 경우에만, 텍스트 데이터에 기초한 이름을 가지는 폴더를 생성할 수도 있다. 그런 다음, 제어부(130)는 사용자 입력 신호가 수신된 이후에 생성되는 영상 파일을 텍스트 데이터에 기초한 이름을 가지는 폴더에 저장할 수 있다.
표시부(160)는 제어부(130)의 제어에 따라 영상 파일에 포함된 영상 데이터만을 표시하거나 영상 데이터를 메타 데이터와 함께 표시할 수 있다. 예를 들어, 사용자 입력 장치(150)로부터 저장부(140)에 저장된 영상 파일을 표시할 것을 요청하는 사용자 입력 신호가 수신되면, 제어부(130)는 표시부(160)에 영상 파일에 포함된 영상 데이터와 함께 메타 데이터를 표시하도록 제어할 수 있다.
한편, 사용자가 촬영한 영상 파일을 표시부(160)를 이용하여 리뷰하고 있는 동안, 즉, 표시부(160)에서 영상 파일이 표시되고 있는 동안에, 음성 인식부(120)로 새로 입력된 음성이 텍스트 데이터로 변환되면, 제어부(130)는 텍스트 데이터를 메타 데이터로 생성하고, 생성되는 메타 데이터를 영상 파일에 이미 포함되어 있는 메타 데이터와 비교할 수 있다. 이 때, 제어부(130)는 생성되는 메타 데이터가 영상 파일에 포함되어 있는 메타 데이터와 다른 경우, 생성되는 메타 데이터를 영상 파일의 메타 데이터에 부가한다. 이와 같은 방식으로 영상 파일에 메타 데이터가 이미 저장되어 있는 경우에도, 다른 메타 데이터를 부가하여 메타 데이터를 수정할 수 있다. 또한, 사용자 입력 장치(150)로부터의 사용자 입력 신호에 따라 메타 데 이터를 수정할 수도 있다.
오디오 출력부(170)는 오디오 데이터를 출력한다. 표시부(160)에 영상 파일이 표시되고 있는 동안, 제어부(130) 영상 파일에 포함된 메타 데이터를 오디오 신호로로 변환하여 오디오 출력부(170)로 출력할 수 있다. 이와 같이, 제어부(130)는 문자 음성 변환(Text to Speech) 동작을 수행하여, 사용자는 영상 파일을 리뷰하면서 메타 데이터를 오디오로 들을 수 있다.
도 2는 본 발명의 일 실시예에 따른 음성 인식을 이용하여 변환된 텍스트 데이터에 기초하여 생성된 폴더의 이름 및 영상 파일에 포함되는 메타 데이터를 나타내는 도면이다.
도 2에 도시된 바와 같이, 사용자 입력 장치(150)로부터 음성 인식에 의해 생성된 텍스트 데이터를 이용하여 영상 파일이 저장될 폴더의 이름을 생성할 것을 요청하는 사용자 입력 신호가 수신되고, 마이크(121)를 통해 "길동이의 생일 잔치"라는 음성이 입력되었다고 가정한다. 그러면, "길동이의 생일 잔치"라는 음성은 음성 인식부(120)에서 텍스트 데이터로 변환되고, 제어부(130)의 제어에 따라 "길동이의 생일 잔치"라는 이름을 가지는 폴더가 저장부(140)에 생성될 수 있다. 또는, 도 2에 도시된 바와 같이 폴더 이름이 폴더 생성 날짜를 포함하여 "20060312_길동이의 생일잔치"가 되도록 생성될 수 있다.
한편, 사용자가 길동이의 생일 잔치의 한 장면을 찍은 영상 파일을 리뷰하고 있는 도중에, 마이크(121)를 통해 "길동이가 생일잔치를 하고 있다"라는 음성이 입력되었다고 가정한다. 그러면, "길동이가 생일잔치를 하고 있다"라는 음성은 음성 인식부(120)에서 텍스트 데이터로 변환되고, 제어부(130)는 "길동이가 생일잔치를 하고 있다"는 텍스트 데이터를 설명 태그로 생성하고, 설명 태그를 영상 파일에 메타 데이터로서 부가한다. 텍스트 데이터는 설명 태그로 생성될 때, "길동이의 생일 잔치"와 같이 변형되어 생성될 수 있다. 또는, 제어부(130)는 "길동이가 생일잔치를 하고 있다"는 텍스트 데이터에서 명사 중심의 키워드를 추출하여 "길동이, 생일잔치"라는 키워드 태그를 영상 파일에 메타 데이터로서 부가할 수 있다. 파일 명은 도 2에 도시된 바와 같이 DSC0001.jpg와 같이 미리 설정된 방식에 따라 생성될 수 있다.
이와 같이, 음성 인식에 의해 변환된 텍스트 데이터를 이용하여 영상 파일에 포함될 메타 데이터를 생성할 수 있으므로, 영상의 촬영한 직후 영상을 리뷰하는 동안 촬영 장소, 촬영된 인물과 같은 영상 파일에 대하여 신뢰성있는 메타 데이터를 부가할 수 있다. 또한, 음성 인식에 의해 변환된 텍스트 데이터를 이용하여 영상 파일이 저장될 폴더의 이름을 생성함으로써, 영상 촬영시점에서 영상 파일을 분류할 수 있다.
도 3은 본 발명의 일 실시예에 따른 메타 데이터를 생성하는 데이터 기록 방법을 나타내는 흐름도이다.
단계 S 310에서, 신호 처리부(110)는 영상을 촬영하고 촬영된 영상을 처리하여 생성된 영상 데이터를 포함하는 영상 파일을 생성한다. 단계 S 320에서 음성 인식부(120)는 음성을 인식하여 텍스트 데이터로 변환한다.
단계 S 330에서, 제어부(130)는 텍스트 데이터를 메타 데이터로 생성한다. 이 때, 텍스트 데이터를 설명 태그로 생성된다. 또한, 텍스트 데이터로부터 키워드가 추출되고, 추출된 키워드가 키워드 태그로 생성될 수 있다.
단계 S 340에서 제어부(130)는 영상 파일에 메타 데이터를 부가하여 메타 데이터를 포함하는 영상 파일을 생성한다. 예를 들어, 단계 S 330에서 생성된 설명 태그 및/또는 키워드 태그는 각각 식별자로 구별되어 영상 파일의 메타 데이터로 부가되어 메타 데이터를 포함하는 영상 파일이 생성될 수 있다. 생성된 영상 파일은 저장부(140)에 저장된다.
도 4는 본 발명의 다른 실시예에 따른 메타 데이터를 생성하는 데이터 기록 방법을 나타내는 흐름도이다.
단계 S 410에서 사용자 입력 장치(150)로 폴더의 생성을 요청하는 사용자 입력 신호가 수신된다. 단계 S 420에서, 제어부(130)는 사용자 입력 신호에 따라. 음성 인식부(120)에 의해서 음성 인식에 의해 생성된 텍스트 데이터에 기초한 이름을 가지는 폴더를 생성한다. 한편, 텍스트 데이터에 기초한 이름을 가지는 폴더가 이미 있는 경우에는 사용자에게 동일한 이름을 가지는 폴더가 있음을 알리는 메시지가 제공될 수 있다.
단계 S 430에서, 제어부(130)는 신호 처리부(110)를 제어하여 영상을 촬영하여 영상 파일을 생성한다. 이 때, 단계 420에서 생성된 폴더의 이름에 기초하여 메타 데이터가 생성되어 영상 파일에 포함될 수도 있다. 단계 S 440에서, 영상 파일을 단계 S 420에서 생성된 폴더에 저장한다.
도 4에 도시된 메타 데이터를 포함하는 영상 파일을 생성하는 데이터 기록 방법은 도 3에 도시된 메타 데이터를 포함하는 영상 파일을 생성하는 데이터 기록 방법과 결합하여 수행될 수 있다. 예를 들어, 도 3에 도시된 방법이 수행된 다음 순차적으로 수행될 수 있다. 또한, 단계 S 410과 같이 사용자 입력 신호가 수신되지 않더라도, 사용자가 영상 파일을 리뷰하고 있지 않은 동안 음성을 데이터 기록 및 재생 장치로 입력할 때에는 상기의 음성에 기초한 폴더명을 생성하기를 원한다고 간주되어 단계 S 420 내지 단계 S 440가 수행될 수 있다.
도 5는 본 발명의 일 실시예에 따른 메타 데이터를 포함하는 영상 파일을 기록 및 재생하는 방법을 나타내는 흐름도이다.
단계 S 510에서 영상 파일의 표시를 요청하는 사용자 입력 신호가 수신되면, 단계 S 520에서 제어부(130)는 저장부(140)에 저장되어 있던 영상 파일을 판독하여 표시부(160)에 표시한다. 영상 파일에 메타 데이터가 포함된 경우에는, 메타 데이터가 영상 데이터와 함께 표시되도록 영상 파일이 표시될 수 있다. 이와 같이 영상 파일이 표시되고 있는 동안, 영상 파일에 포함된 메타 데이터를 오디오 신호로 변환하여 출력할 수도 있다.
단계 S 530에서 음성 인식부(120)로 음성이 입력되면, 단계 S540에서 음성 인식부(120)는 입력되는 음성을 텍스트 데이터로 변환하고, 제어부(130)는 텍스트 데이터를 메타 데이터로 생성한다. 단계 S 530 이전에 사용자 입력 장치(150)로부터 표시되고 있는 영상 파일에 대한 메타 데이터 생성을 요청하는 사용자 입력 신호가 수신되는지를 더 판단한 다음 단계 S 530으로 진행할 수도 있다.
단계 S 550에서 제어부(130)는 영상 파일에 메타 데이터가 포함되어 있는지 확인한다.
단계 S 550에서 표시되고 있는 영상 파일이 메타 데이터가 포함되지 않은 영상 파일인 경우에는, 단계 570로 진행하여, 생성되는 메타 데이터를 영상 파일의 메타 데이터에 부가하여 메타 데이터를 포함하는 영상 파일을 생성하여 저장한다.
단계 S 550에서 영상 파일에 메타 데이터가 포함되어 있는 경우에는 단계 S560에서 입력된 음성으로부터 변환된 텍스트 데이터로부터 생성되는 메타 데이터를 영상 파일에 포함되어 있는 메타 데이터와 비교하여 생성되는 메타 데이터가 영상 파일에 포함된 메타 데이터와 동일한지 확인한다.
단계 S 560에서 생성되는 메타 데이터가 영상 파일에 포함되어 있는 메타 데이터와 동일하지 않은 경우, 예를 들어 생성되는 메타 데이터 중 키워드 태그가, 이미 영상 파일에 포함되어 있던 키워드 태그와 중복되지 않는 경우에는, 단계 S 570에서 생성되는 메타 데이터를 영상 파일의 메타 데이터에 부가하여 메타 데이터를 포함하는 영상 파일을 생성하여 저장한다.
본 발명에 따른 방법은 컴퓨터로 읽을 수 있는 기록 매체에 컴퓨터가 읽을 수 있는 코드로서 구현될 수 있다. 상기의 프로그램을 구현하는 코드들 및 코드 세그먼트들은 당해 분야의 컴퓨터 프로그래머에 의하여 용이하게 추론될 수 있다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록 장치를 포함한다. 컴퓨터가 읽을 수 있는 기록 매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광 디스크 등이 있으며, 또한 캐리어 웨이브(예를 들어, 인터넷을 통한 전송)의 형태로 구현되는 것을 포함한다. 또한, 컴퓨터가 읽을 수 있는 기록 매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산 방식으로 컴퓨터가 읽을 수 있는 코드로 저장되고 실행될 수 있다.
이상의 설명은 본 발명의 일 실시예에 불과할 뿐, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자는 본 발명의 본질적 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현할 수 있을 것이다. 따라서, 본 발명의 범위는 전술한 실시예에 한정되지 않고 특허 청구범위에 기재된 내용과 동등한 범위 내에 있는 다양한 실시 형태가 포함되도록 해석되어야 할 것이다.
본 발명에 따르면, 영상을 기록하는 시점에서 영상 콘텐츠 기록 장치를 이용하여 영상 콘텐츠에 대한 관리 정보로서 메타 데이터를 생성할 수 있으므로 영상 콘텐츠에 대한 신뢰성있는 메타 데이터를 생성할 수 있다.
또한, 영상을 촬영하여 기록하기 전에, 음성 인식에 따라 생성된 텍스트 데이터에 기초하여 생성되는 이름을 가지는 폴더에 영상 파일을 저장할 수 있다. 따라서, 촬영 시점에서 영상 파일을 분류하여 저장할 수 있다.
또한, 본 발명에 따르면 영상 파일에 메타 데이터가 포함되므로, 본 발명에 따라 생성된 영상 파일을 판독할 수 있는 장치는 영상 파일에 포함된 메타 데이터를 판독하여, 메타 데이터를 검색 키워드로 이용할 수 있다.

Claims (18)

  1. 영상을 촬영하고 촬영된 영상을 영상 데이터로 생성하여 상기 영상 데이터를 포함하는 영상 파일을 생성하는 신호 처리부;
    음성을 인식하여 텍스트 데이터로 변환하는 음성 인식부; 및
    상기 텍스트 데이터를 메타 데이터로 생성하고, 상기 영상 파일에 상기 메타 데이터를 부가하여 메타 데이터를 포함하는 영상 파일을 생성하는 제어부를 포함하는 것을 특징으로 하는 데이터 기록 및 재생 장치.
  2. 제1항에 있어서,
    상기 제어부는, 상기 텍스트 데이터를 설명 태그로 생성하고, 상기 텍스트 데이터로부터 키워드를 추출하여 추출된 키워드를 키워드 태그로 생성하여 상기 메타 데이터를 생성하는 것을 특징으로 하는 데이터 기록 및 재생 장치.
  3. 제1항에 있어서,
    상기 생성된 영상 파일을 저장하는 저장부를 더 포함하는 것을 특징으로 하는 데이터 기록 및 재생 장치.
  4. 제3항에 있어서,
    상기 제어부는 상기 텍스트 데이터에 기초한 이름을 가지는 폴더를 생성하는 것을 특징으로 하는 데이터 기록 및 재생 장치.
  5. 제4항에 있어서,
    상기 제어부는 상기 영상 파일을 상기 텍스트 데이터에 기초한 이름을 가지는 폴더에 저장하는 것을 특징으로 하는 데이터 기록 및 재생 장치.
  6. 제1항에 있어서,
    상기 영상 파일에 포함된 영상 데이터를 표시하거나 또는 상기 영상 데이터와 함께 상기 메타 데이터를 표시하는 표시부를 더 포함하는 것을 특징으로 하는 데이터 기록 및 재생 장치.
  7. 제6항에 있어서,
    상기 표시부에서 상기 영상 파일이 표시되고 있는 동안에, 상기 음성 인식부에 의해 새로 입력된 음성이 텍스트 데이터로 변환되면,
    상기 제어부는 상기 변환된 텍스트 데이터로부터 메타 데이터를 생성하고, 상기 생성되는 메타 데이터를 상기 영상 파일에 포함되어 있는 메타 데이터와 비교하고, 상기 생성되는 메타 데이터가 상기 영상 파일에 포함되어 있는 메타 데이터와 다른 경우, 상기 생성되는 메타 데이터를 상기 영상 파일의 메타 데이터에 부가하는 것을 특징으로 하는 데이터 기록 및 재생 장치.
  8. 제6항에 있어서,
    상기 표시부에 영상 데이터가 표시되고 있지 않은 동안에, 상기 음성 인식부에 의해 입력된 음성이 텍스트 데이터로 변환되면, 상기 제어부는 상기 영상 파일을 상기 텍스트 데이터에 기초한 이름을 가지는 폴더를 생성하는 것을 특징으로 하는 데이터 기록 및 재생 장치.
  9. 제6항에 있어서,
    오디오 데이터를 출력하는 오디오 출력부를 더 포함하고,
    상기 표시부에 상기 영상 파일이 표시되고 있는 동안, 상기 제어부는 상기 표시되고 있는 영상 파일에 포함된 상기 메타 데이터를 오디오 신호로 변환하여 상기 오디오 출력부로 출력하는 것을 특징으로 하는 데이터 기록 및 재생 장치.
  10. 영상을 촬영하고 촬영된 영상을 영상 데이터로 생성하여 상기 영상 데이터를 포함하는 영상 파일을 생성하는 단계;
    음성을 인식하여 텍스트 데이터로 변환하는 단계;
    상기 텍스트 데이터를 메타 데이터로 생성하는 단계; 및
    상기 영상 파일에 상기 메타 데이터를 부가하여 상기 메타 데이터를 포함하는 영상 파일을 생성하는 단계를 포함하는 것을 특징으로 하는 데이터 기록 및 재생 방법.
  11. 제10항에 있어서, 상기 텍스트 데이터를 메타 데이터로 생성하는 단계는,
    상기 텍스트 데이터로부터 키워드를 추출하는 단계; 및
    상기 텍스트 데이터를 설명 태그로 생성하고, 상기 추출된 키워드를 키워드 태그로 생성하여 상기 메타 데이터를 생성하는 단계를 포함하는 것을 특징으로 하는 데이터 기록 및 재생 방법.
  12. 제10항에 있어서,
    상기 생성된 영상 파일을 저장하는 단계를 더 포함하는 것을 특징으로 하는 데이터 기록 및 재생 방법.
  13. 제10항에 있어서,
    상기 텍스트 데이터에 기초한 이름을 가지는 폴더를 생성하는 단계를 포함하는 것을 특징으로 하는 데이터 기록 및 재생 방법.
  14. 제13항에 있어서,
    상기 영상 파일을 상기 텍스트 데이터에 기초한 이름을 가지는 폴더에 저장하는 단계를 더 포함하는 것을 특징으로 하는 데이터 기록 및 재생 방법.
  15. 제10항에 있어서,
    상기 영상 파일에 포함된 영상 데이터와 함께 상기 메타 데이터를 표시하는 단계를 더 포함하는 것을 특징으로 하는 데이터 기록 및 재생 방법.
  16. 제10항에 있어서,
    상기 영상 파일에 포함된 영상 데이터를 표시하는 단계;
    새로 입력된 음성을 텍스트 데이터로 변환하고, 상기 변환된 텍스트 데이터를 메타 데이터로 생성하는 단계; 및
    상기 생성되는 메타 데이터를 상기 영상 파일에 포함되어 있는 메타 데이터와 비교하는 단계; 및
    상기 생성되는 메타 데이터가 상기 영상 파일에 포함되어 있는 메타 데이터와 동일하지 않은 경우, 상기 생성되는 메타 데이터를 상기 영상 파일의 메타 데이터에 부가하는 단계를 더 포함하는 것을 특징으로 하는 데이터 기록 및 재생 방법.
  17. 제10항에 있어서,
    상기 영상 파일에 포함된 영상 데이터를 표시하는 단계; 및
    상기 영상 파일에 포함된 상기 메타 데이터를 오디오 신호로 변환하여 출력하는 단계를 더 포함하는 것을 특징으로 하는 데이터 기록 및 재생 방법.
  18. 제10항 또는 제17항 중 어느 한 항에 기재된 방법을 구현하기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
KR1020060063487A 2006-07-06 2006-07-06 메타 데이터를 생성하는 데이터 기록 및 재생 장치 및 방법 KR100856407B1 (ko)

Priority Applications (4)

Application Number Priority Date Filing Date Title
KR1020060063487A KR100856407B1 (ko) 2006-07-06 2006-07-06 메타 데이터를 생성하는 데이터 기록 및 재생 장치 및 방법
US11/650,539 US7831598B2 (en) 2006-07-06 2007-01-08 Data recording and reproducing apparatus and method of generating metadata
EP07101296A EP1876596A3 (en) 2006-07-06 2007-01-29 Recording and reproducing data
CN2007100069295A CN101101779B (zh) 2006-07-06 2007-01-30 数据记录和再现设备以及产生元数据的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020060063487A KR100856407B1 (ko) 2006-07-06 2006-07-06 메타 데이터를 생성하는 데이터 기록 및 재생 장치 및 방법

Publications (2)

Publication Number Publication Date
KR20080004772A true KR20080004772A (ko) 2008-01-10
KR100856407B1 KR100856407B1 (ko) 2008-09-04

Family

ID=38473061

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020060063487A KR100856407B1 (ko) 2006-07-06 2006-07-06 메타 데이터를 생성하는 데이터 기록 및 재생 장치 및 방법

Country Status (4)

Country Link
US (1) US7831598B2 (ko)
EP (1) EP1876596A3 (ko)
KR (1) KR100856407B1 (ko)
CN (1) CN101101779B (ko)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009142420A3 (en) * 2008-05-19 2010-02-25 Samsung Electronics Co., Ltd. Apparatus and method for creating and displaying media file
KR101400619B1 (ko) * 2007-11-07 2014-05-26 엘지전자 주식회사 사진 관리 방법 및 장치
KR101449862B1 (ko) * 2013-07-02 2014-10-08 주식회사 엘지유플러스 촬영 영상을 음성 인식된 정보와 매칭시켜 저장하기 위한 촬영 장치, 그 제어방법 및, 기록 매체
KR101532294B1 (ko) * 2008-12-18 2015-07-01 삼성전자주식회사 자동 태깅 장치 및 방법
KR20150092390A (ko) * 2014-02-03 2015-08-13 주식회사 엠앤엘솔루션 음성기반 이미지 파일 태깅장치 및 그를 이용한 클라우드 서비스 기반 이미지 파일 검색방법

Families Citing this family (50)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6996251B2 (en) 2002-09-30 2006-02-07 Myport Technologies, Inc. Forensic communication apparatus and method
US10721066B2 (en) 2002-09-30 2020-07-21 Myport Ip, Inc. Method for voice assistant, location tagging, multi-media capture, transmission, speech to text conversion, photo/video image/object recognition, creation of searchable metatags/contextual tags, storage and search retrieval
US7778438B2 (en) 2002-09-30 2010-08-17 Myport Technologies, Inc. Method for multi-media recognition, data conversion, creation of metatags, storage and search retrieval
US20080222273A1 (en) * 2007-03-07 2008-09-11 Microsoft Corporation Adaptive rendering of web pages on mobile devices using imaging technology
US9075808B2 (en) * 2007-03-29 2015-07-07 Sony Corporation Digital photograph content information service
US20090041428A1 (en) * 2007-08-07 2009-02-12 Jacoby Keith A Recording audio metadata for captured images
US8069173B2 (en) * 2007-11-12 2011-11-29 Canon Kabushiki Kaisha Information processing apparatus and method of controlling the same, information processing method, and computer program
US20090150158A1 (en) * 2007-12-06 2009-06-11 Becker Craig H Portable Networked Picting Device
GB2459308A (en) * 2008-04-18 2009-10-21 Univ Montfort Creating a metadata enriched digital media file
KR20100000336A (ko) * 2008-06-24 2010-01-06 삼성전자주식회사 컨텐츠 감상 경험을 기록/재생하는 멀티미디어 콘텐츠 처리방법 및 장치
ATE548975T1 (de) * 2008-07-11 2012-03-15 Alcatel Lucent Anwendungsserver zur unterdrückung von umgebungsgeräuschen in einem auskultationssignal und zur aufzeichnung von kommentaren während der auskultation eines patienten mit einem elektronischen stethoskop
US20100198876A1 (en) * 2009-02-02 2010-08-05 Honeywell International, Inc. Apparatus and method of embedding meta-data in a captured image
US9213776B1 (en) 2009-07-17 2015-12-15 Open Invention Network, Llc Method and system for searching network resources to locate content
US8935204B2 (en) 2009-08-14 2015-01-13 Aframe Media Services Limited Metadata tagging of moving and still image content
GB2472650A (en) * 2009-08-14 2011-02-16 All In The Technology Ltd Metadata tagging of moving and still image content
JP4930564B2 (ja) * 2009-09-24 2012-05-16 カシオ計算機株式会社 画像表示装置及び方法並びにプログラム
CN102103620B (zh) * 2009-12-18 2014-11-05 技嘉科技股份有限公司 搜寻文件方法及其人机接口装置
EP2360905A1 (en) 2009-12-30 2011-08-24 Research In Motion Limited Naming digital images using voice input
US8558919B2 (en) * 2009-12-30 2013-10-15 Blackberry Limited Filing digital images using voice input
US9645996B1 (en) * 2010-03-25 2017-05-09 Open Invention Network Llc Method and device for automatically generating a tag from a conversation in a social networking website
KR101710626B1 (ko) * 2010-11-04 2017-02-27 삼성전자주식회사 디지털 촬영 장치 및 이의 제어 방법
US8462231B2 (en) * 2011-03-14 2013-06-11 Mark E. Nusbaum Digital camera with real-time picture identification functionality
US20130120594A1 (en) * 2011-11-15 2013-05-16 David A. Krula Enhancement of digital image files
US20130294746A1 (en) * 2012-05-01 2013-11-07 Wochit, Inc. System and method of generating multimedia content
US9524751B2 (en) 2012-05-01 2016-12-20 Wochit, Inc. Semi-automatic generation of multimedia content
US9396758B2 (en) 2012-05-01 2016-07-19 Wochit, Inc. Semi-automatic generation of multimedia content
KR101977072B1 (ko) * 2012-05-07 2019-05-10 엘지전자 주식회사 음성 파일과 관련된 텍스트의 표시 방법 및 이를 구현한 전자기기
US8768693B2 (en) * 2012-05-31 2014-07-01 Yahoo! Inc. Automatic tag extraction from audio annotated photos
CN102945277A (zh) * 2012-11-09 2013-02-27 华为技术有限公司 图像文件检索的方法和装置
US20140181143A1 (en) * 2012-12-26 2014-06-26 Huawei Technologies Co., Ltd. File presentation method and apparatus
US9280972B2 (en) * 2013-05-10 2016-03-08 Microsoft Technology Licensing, Llc Speech to text conversion
US20150066925A1 (en) * 2013-08-27 2015-03-05 Qualcomm Incorporated Method and Apparatus for Classifying Data Items Based on Sound Tags
RU2608873C2 (ru) * 2014-02-14 2017-01-25 Общество С Ограниченной Ответственностью "Яндекс" Способ связывания метаданных цифрового контента с цифровым контентом (варианты), электронное устройство (варианты), машиночитаемый носитель (варианты)
US9553904B2 (en) 2014-03-16 2017-01-24 Wochit, Inc. Automatic pre-processing of moderation tasks for moderator-assisted generation of video clips
CN105159902A (zh) * 2014-04-04 2015-12-16 卡姆芬德公司 基于优先级的图像处理方法
CN105096950A (zh) * 2014-05-22 2015-11-25 中兴通讯股份有限公司 一种文件命名方法、装置及终端
CN104092482B (zh) * 2014-06-27 2017-04-19 宇龙计算机通信科技(深圳)有限公司 一种数据处理方法、装置和终端
KR102252072B1 (ko) * 2014-10-14 2021-05-14 삼성전자주식회사 음성 태그를 이용한 이미지 관리 방법 및 그 장치
CN104268292B (zh) * 2014-10-23 2018-03-16 广州智索信息科技有限公司 画像系统的标签词库更新方法
CN104580888B (zh) * 2014-12-17 2018-09-04 广东欧珀移动通信有限公司 一种图像处理方法及终端
US9659219B2 (en) 2015-02-18 2017-05-23 Wochit Inc. Computer-aided video production triggered by media availability
US20160323483A1 (en) * 2015-04-28 2016-11-03 Invent.ly LLC Automatically generating notes and annotating multimedia content specific to a video production
US20170039192A1 (en) * 2015-08-05 2017-02-09 International Business Machines Corporation Language generation from flow diagrams
US10318641B2 (en) * 2015-08-05 2019-06-11 International Business Machines Corporation Language generation from flow diagrams
US10484454B2 (en) * 2015-09-16 2019-11-19 Blackberry Limited Electronic device and method of providing digital photograph information
CN105654532A (zh) * 2015-12-24 2016-06-08 Tcl集团股份有限公司 一种照片拍摄及处理方法及系统
CN107368602A (zh) * 2017-07-27 2017-11-21 上海传英信息技术有限公司 一种用于智能设备的照片存储方法和照片存储装置
US11256764B2 (en) * 2018-05-03 2022-02-22 EMC IP Holding Company LLC Managing content searches in computing environments
CN112905825B (zh) * 2019-12-04 2023-03-21 博泰车联网科技(上海)股份有限公司 用于信息处理的方法、设备和计算机存储介质
CN112559779A (zh) * 2020-12-24 2021-03-26 北京百度网讯科技有限公司 图片管理方法、装置、设备以及存储介质

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6031526A (en) * 1996-08-08 2000-02-29 Apollo Camera, Llc Voice controlled medical text and image reporting system
KR19990054504A (ko) 1997-12-26 1999-07-15 유무성 음성 인식이 가능한 카메라 및 그 제어 방법
US7053938B1 (en) * 1999-10-07 2006-05-30 Intel Corporation Speech-to-text captioning for digital cameras and associated methods
GB2359918A (en) * 2000-03-01 2001-09-05 Sony Uk Ltd Audio and/or video generation apparatus having a metadata generator
US6499016B1 (en) * 2000-02-28 2002-12-24 Flashpoint Technology, Inc. Automatically storing and presenting digital images using a speech-based command language
JP4240867B2 (ja) 2001-09-28 2009-03-18 富士フイルム株式会社 電子アルバム編集装置
EP1313327A1 (en) 2001-11-14 2003-05-21 Deutsche Thomson-Brandt Gmbh Digital video recorder and methods for digital recording
JP2003345379A (ja) * 2002-03-20 2003-12-03 Japan Science & Technology Corp 音声映像変換装置及び方法、音声映像変換プログラム
US20030204399A1 (en) * 2002-04-25 2003-10-30 Wolf Peter P. Key word and key phrase based speech recognizer for information retrieval systems
US7260257B2 (en) 2002-06-19 2007-08-21 Microsoft Corp. System and method for whiteboard and audio capture
CN1663249A (zh) 2002-06-24 2005-08-31 松下电器产业株式会社 元数据生成装置、其生成方法以及检索装置
EP1378911A1 (en) * 2002-07-02 2004-01-07 RAI RADIOTELEVISIONE ITALIANA (S.p.A.) Metadata generator device for identifying and indexing of audiovisual material in a video camera
EP1522029A2 (en) 2002-07-09 2005-04-13 Koninklijke Philips Electronics N.V. Method and apparatus for classification of a data object in a database
US6907397B2 (en) * 2002-09-16 2005-06-14 Matsushita Electric Industrial Co., Ltd. System and method of media file access and retrieval using speech recognition
US6888569B2 (en) 2002-10-02 2005-05-03 C3 Development, Llc Method and apparatus for transmitting a digital picture with textual material
KR100770637B1 (ko) 2002-12-12 2007-10-29 후지필름 가부시키가이샤 디지털 카메라
GB2399983A (en) * 2003-03-24 2004-09-29 Canon Kk Picture storage and retrieval system for telecommunication system
US7324943B2 (en) * 2003-10-02 2008-01-29 Matsushita Electric Industrial Co., Ltd. Voice tagging, voice annotation, and speech recognition for portable devices with optional post processing
US20070127888A1 (en) 2003-10-16 2007-06-07 Daisuke Hayashi Audio and video recording and reproducing apparatus, audio and video recording method, and audio and video reproducing method
JP4429081B2 (ja) 2004-06-01 2010-03-10 キヤノン株式会社 情報処理装置及び情報処理方法
CN1790535A (zh) 2004-12-16 2006-06-21 凌阳科技股份有限公司 具语言学习机功能的dvd播放机
JP4396567B2 (ja) 2005-04-15 2010-01-13 ソニー株式会社 素材記録装置および素材記録方法
US7634407B2 (en) * 2005-05-20 2009-12-15 Microsoft Corporation Method and apparatus for indexing speech
US7567904B2 (en) * 2005-10-17 2009-07-28 Kent Layher Mobile listing system
US20070174326A1 (en) * 2006-01-24 2007-07-26 Microsoft Corporation Application of metadata to digital media
KR100760301B1 (ko) * 2006-02-23 2007-09-19 삼성전자주식회사 부분 검색어 추출을 통한 미디어 파일 검색 방법 및 장치
US20070236583A1 (en) * 2006-04-07 2007-10-11 Siemens Communications, Inc. Automated creation of filenames for digital image files using speech-to-text conversion

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101400619B1 (ko) * 2007-11-07 2014-05-26 엘지전자 주식회사 사진 관리 방법 및 장치
WO2009142420A3 (en) * 2008-05-19 2010-02-25 Samsung Electronics Co., Ltd. Apparatus and method for creating and displaying media file
US8749616B2 (en) 2008-05-19 2014-06-10 Samsung Electronics Co., Ltd. Apparatus and method for creating and displaying media file
KR101532294B1 (ko) * 2008-12-18 2015-07-01 삼성전자주식회사 자동 태깅 장치 및 방법
KR101449862B1 (ko) * 2013-07-02 2014-10-08 주식회사 엘지유플러스 촬영 영상을 음성 인식된 정보와 매칭시켜 저장하기 위한 촬영 장치, 그 제어방법 및, 기록 매체
KR20150092390A (ko) * 2014-02-03 2015-08-13 주식회사 엠앤엘솔루션 음성기반 이미지 파일 태깅장치 및 그를 이용한 클라우드 서비스 기반 이미지 파일 검색방법

Also Published As

Publication number Publication date
EP1876596A3 (en) 2009-04-15
KR100856407B1 (ko) 2008-09-04
CN101101779A (zh) 2008-01-09
CN101101779B (zh) 2013-01-16
US7831598B2 (en) 2010-11-09
US20080033983A1 (en) 2008-02-07
EP1876596A2 (en) 2008-01-09

Similar Documents

Publication Publication Date Title
KR100856407B1 (ko) 메타 데이터를 생성하는 데이터 기록 및 재생 장치 및 방법
JP4341656B2 (ja) コンテンツ管理装置、ウェブサーバ、ネットワークシステム、コンテンツ管理方法、コンテンツ情報管理方法およびプログラム
US8462231B2 (en) Digital camera with real-time picture identification functionality
CN101542477A (zh) 使用语音-文本转换自动生成数字图像文件的文件名
JP2005276187A (ja) 画像識別方法および端末装置
US6903767B2 (en) Method and apparatus for initiating data capture in a digital camera by text recognition
US8301995B2 (en) Labeling and sorting items of digital data by use of attached annotations
CN104580888A (zh) 一种图像处理方法及终端
US9973649B2 (en) Photographing apparatus, photographing system, photographing method, and recording medium recording photographing control program
KR100770637B1 (ko) 디지털 카메라
CN104298694A (zh) 一种照片信息添加方法、装置及移动终端
CN102918586B (zh) 用于图像数据记录和再现的设备及其方法
JP2017021672A (ja) 検索装置
KR101643609B1 (ko) 멀티미디어 컨텐츠와 연동된 이미지를 생성하고 재생할 수 있는 디지털 영상 처리 장치 및 그 제어 방법
JP2003204506A (ja) 画像入力装置
JP4006034B2 (ja) 撮像装置
JP2007049245A (ja) 音声入力機能付撮影装置
JP2019135609A (ja) 文字入力支援システム、文字入力支援制御装置、文字入力支援プログラム
US11954402B1 (en) Talk story system and apparatus
JP2003333470A (ja) デジタルカメラのデータ管理方法
KR20230008687A (ko) 스마트폰에서 사진 자동 레이블링 및 녹음 장치 및 방법
JP2006133433A (ja) 音声/文字変換システムならびに携帯型端末装置および変換サーバならびにそれらの制御方法
JP4947046B2 (ja) コンテンツ管理装置、コンテンツ管理方法、および、当該方法をコンピュータに実行させるためのプログラム、並びに、ネットワークシステム
JP2014216904A (ja) 撮像装置、画像再生装置、データ記録方法、画像再生方法及びプログラム
JP2007065897A (ja) 撮像装置及びその制御方法

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20120730

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20130730

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20140730

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20150730

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20160728

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20170728

Year of fee payment: 10