WO2011049413A2 - Multimedia content processing method and apparatus - Google Patents

Multimedia content processing method and apparatus Download PDF

Info

Publication number
WO2011049413A2
WO2011049413A2 PCT/KR2010/007324 KR2010007324W WO2011049413A2 WO 2011049413 A2 WO2011049413 A2 WO 2011049413A2 KR 2010007324 W KR2010007324 W KR 2010007324W WO 2011049413 A2 WO2011049413 A2 WO 2011049413A2
Authority
WO
WIPO (PCT)
Prior art keywords
identification information
multimedia content
type
type identification
media
Prior art date
Application number
PCT/KR2010/007324
Other languages
French (fr)
Korean (ko)
Other versions
WO2011049413A3 (en
Inventor
장의선
김현규
Original Assignee
한양대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한양대학교 산학협력단 filed Critical 한양대학교 산학협력단
Publication of WO2011049413A2 publication Critical patent/WO2011049413A2/en
Publication of WO2011049413A3 publication Critical patent/WO2011049413A3/en

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/75Media network packet handling
    • H04L65/762Media network packet handling at the source 
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/031Electronic editing of digitised analogue information signals, e.g. audio or video signals
    • G11B27/034Electronic editing of digitised analogue information signals, e.g. audio or video signals on discs

Definitions

  • the present invention relates to a technique for processing multimedia content, and more particularly, to a method of encoding or decoding multimedia content and providing the same to an application.
  • the ISO / IEC 23006 standard (MPEG Extensible Middleware, MXM) is a standard for defining intermediary devices to enable faster implementation of a variety of multimedia-based applications.
  • the MXM standard is a technology that provides a number of multimedia processing engines and makes it easy to encode or decode various multimedia contents in an application by calling an API (application-programming interface) included in the engine. This makes MXM easier and faster to implement the various multimedia applications that exist in the multimedia value chain.
  • the multimedia processing engine defined by the MXM standard provides a module that performs a plurality of encodings and decodings.
  • the process of identifying the multimedia content to be encoded or decoded and calling an API appropriate for the identified multimedia content can be performed by the application. It should be done. Accordingly, the creator of an application had to directly implement a process of identifying multimedia content and selecting an API to be used in the application.
  • An object of the present invention is to provide a multimedia content processing apparatus having a media frame engine capable of identifying multimedia content.
  • the identification information storage unit for storing the type identification information for identifying the type of one or more multimedia content with reference to the type identification information to identify the type of multimedia content received from the application, the multimedia content
  • a multimedia content processing apparatus including a media identification unit for calling a specified API (Application Programming Interface) and a media processing unit for providing one or more APIs for processing the multimedia content.
  • the media identification unit extracts type identification information from the multimedia content according to any one or more designated parsing methods, and selects a type corresponding to the same type identification information as the type identification information among one or more designated type identification information. Can be identified by type.
  • the media identification unit may call an API corresponding to the same type identification information as the type identification information.
  • the media identification unit re-extracts the type identification information from the multimedia content according to a parsing method other than the parsing method previously performed among one or more designated parsing methods. Can be.
  • the media identification unit When the type identification information equal to the type identification information indicates a container bitstream, the media identification unit extracts one or more element bitstreams from the multimedia content, identifies each type of the element bitstream, The API may be called according to the type of each element bitstream.
  • a method for processing multimedia content in a multimedia content processing apparatus comprising: receiving multimedia content from an application, identifying the type of the multimedia content; Programming interface), encoding or decoding the multimedia content through the API, generating output data, and transmitting the output data to the application.
  • the identifying of the type of the multimedia content may include extracting type identification information from the multimedia content according to any one or more designated parsing methods, and determining whether the type identification information is the same as any of the specified type identification information. It may include.
  • Calling an API designated according to the type of the multimedia content may call an API corresponding to the same type identification information as the type identification information when any one of the type identification information and the type identification information is the same. have.
  • the identifying of the type of the multimedia content may further include reselecting a parsing method other than the parsing method previously performed among one or more designated parsing methods when the same type identification information as the type identification information does not exist. After the step of reselecting the parsing method, the process from the step of extracting the type identification information may be performed again.
  • the type identification information equal to the type identification information indicates a container bitstream, further comprising extracting one or more element bitstreams from the multimedia content, wherein each step after extracting the element bitstream Extracting the type identification information for the element bitstream or transmitting the output data to the application may be performed.
  • FIG. 1 is a diagram schematically illustrating a configuration of a multimedia content processing apparatus according to the MXM standard.
  • FIG. 2 is a view for explaining a process according to the multimedia content transmission between the multimedia content processing apparatus according to the MXM standard.
  • FIG. 3 is a block diagram schematically illustrating a configuration of a media framework engine included in a multimedia content processing apparatus according to an embodiment of the present invention.
  • FIG. 4 is a diagram illustrating a process of determining a type of multimedia content by using the type identification information stored in the identification information storage unit in the media identification unit of the multimedia content processing apparatus according to an embodiment of the present invention.
  • FIG. 5 is a block diagram schematically illustrating a configuration of a media framework engine included in a multimedia content processing device according to an embodiment of the present invention.
  • FIG. 6 is a flowchart illustrating a process of a multimedia content processing apparatus processing multimedia content.
  • first and second may be used to describe various components, but the components should not be limited by the terms. The terms are used only for the purpose of distinguishing one component from another.
  • FIG. 1 is a diagram schematically illustrating a configuration of a multimedia content processing apparatus according to the MXM standard.
  • a multimedia content processing apparatus includes a processor 101, a memory 102, and an operating system 103.
  • the multimedia content processing apparatus includes a multimedia content engine 105 (Orchestrator Engine, MPEG21 File Engine, Digital Item Engine, REL Engine, IPMP Engine, Security Engine, Content Metadata Engine, Media Framework) according to the MXM standard. Engine, Content Search Engine, etc.) may be installed, and the API included in the engine for content may be provided according to a call of the application 110 that is resident on the memory 102 and executed by the processor 101.
  • an application receives a bitstream encoded according to the MPEG-4 VIDEO standard from a user and calls an API included in the Media Framework Engine to decode the bitstream.
  • the application generates and plays the video data obtained by decoding the bitstream using the called API.
  • the process of decoding and playing the above-described bitstream is performed by an application, and the API for decoding the bitstream is determined according to the application.
  • FIG. 2 is a diagram for describing a process of transmitting multimedia content between multimedia content processing apparatuses according to the MXM standard.
  • the first multimedia content processing device 210 having the above-described configuration with reference to FIG. 1 may be configured according to an encoding of video data or an arbitrary standard through the multimedia content engine 215 defined in the MXM standard by the first application 213.
  • the decoding of the encoded bitstream may be performed.
  • the second multimedia content processing device 220 may perform encoding of the video data through the multimedia content engine 225 defined in the MXM standard or decoding the bitstream encoded according to any standard by the second application 223. Can be.
  • the first multimedia content processing device and the second multimedia content processing device may be different types of platforms, and thus, each operating system 216 and 226 may be different operating systems.
  • the multimedia contents processing apparatuses can perform encoding and decoding using multimedia technology related standard technology of the same method even if the devices of different platforms are used.
  • the device may prevent the encoding and decoding schemes of the bitstream such that the decoding cannot be performed are not matched.
  • FIG. 3 is a block diagram schematically illustrating a configuration of a media framework engine included in a multimedia content processing apparatus according to an embodiment of the present invention
  • FIG. 4 is a media identification unit of the multimedia content processing apparatus according to an embodiment of the present invention. Is a diagram illustrating a process of determining the type of multimedia content by using the type identification information stored in the identification information storage unit.
  • the media framework engine 300 includes a media identification unit 310 and a media processing unit 330.
  • the media identification unit 310 provides an API (hereinafter, referred to as an application call function) that is called from the application 110.
  • the media identifier 310 receives the multimedia content from the application 110 through an application call function.
  • the media identification unit 310 analyzes the header of the multimedia content to identify the type of the multimedia content.
  • the identification information storage unit 320 may identify identification information (hereinafter referred to as type identification information) for identifying the type of multimedia content according to a standard that may be processed by the media processing unit 330, and a bitstream of a type corresponding to each type identification information. Stores identification information (hereinafter referred to as interface identification information) of an API for processing. In this case, the identification information storage unit 320 may further store information indicating syntax parsing rules for extracting type identification information from multimedia content other than the identification information (hereinafter referred to as syntax information).
  • syntax information information indicating syntax parsing rules for extracting type identification information from multimedia content other than the identification information
  • the media identification unit 310 identifies the type of multimedia content by referring to the type identification information stored in the identification information storage unit 320. For example, referring to FIG. 4, the media identification unit 310 may extract arbitrary syntax information from the identification information storage unit 320. The media identification unit 310 may extract data (hereinafter referred to as type identification information) for identifying the type of the multimedia content by comparing the type identification information with the multimedia content according to the syntax information. That is, if the multimedia content is a bitstream encoded according to the MPEG4 standard, and the syntax information indicates a syntax parsing rule for extracting the first 32 bits of the multimedia content, the media identifier 310 identifies the type of the first 32 bits from the multimedia content. Extract information ("00 00 01 B0").
  • the media identification unit 310 checks whether the same type identification information 410 as the type identification information 405 is stored in the identification information storage unit 320.
  • the media identification unit 310 confirms that the extracted type identification information is the same as the type identification information corresponding to MPEG-4, and identifies the interface identification information corresponding to the type identification information (ie, decoding the MPEG-4 bitstream. Interface identification information corresponding to the API) is extracted from the identification information storage unit 320.
  • the media identification unit 310 transmits the multimedia content to the media processing unit 330 through an API corresponding to the interface identification information.
  • the media identifier 310 extracts data from the bitstream according to the syntax information.
  • the identification information storage unit 320 may store a plurality of syntax information.
  • the media identifier 310 may sequentially extract one of the plurality of syntax information. Accordingly, the media identification unit 310 extracts the data according to any one of the plurality of syntax information and identifies the type until it confirms that the same type identification information as the data extracted according to the syntax information is stored in the identification information storage unit 320.
  • the process of checking the information can be repeated. For example, there is a standard in which data other than the first 32 bits is used as the type identification information.
  • the media identification unit 310 When the media identification unit 310 fails to check the type of the multimedia content according to the syntax information extracting the first 32 bits of the multimedia content, the media identification unit 310 stores the data in the multimedia content according to the syntax information stored in the identification information storage unit 320.
  • the extracted and extracted data may be used to identify the type of multimedia content.
  • the media processor 330 provides an API required in the process of encoding or decoding the multimedia content.
  • the API provided by the media processing unit 330 may be an API for encoding and decoding of a standard as shown in Table 1 below.
  • the API provided by the media processing unit 330 may additionally provide other APIs in addition to APIs for encoding and decoding of the following standard.
  • the media processor 330 encodes or decodes the multimedia content by performing the above-described API.
  • the media processor 330 transmits data (hereinafter, referred to as output data) obtained by encoding or decoding multimedia content to the media identifier 310 through the API.
  • the media identification unit 310 transmits output data received from the media processing unit 330 to the application 110.
  • the multimedia content may be data in a format according to one standard as described above, but may be a container bitstream in which bitstreams according to each standard are merged.
  • the container bitstream may include an element bitstream for each standard, such as a standard for encoding video data and a standard for encoding audio data. Accordingly, in order to decode the container bitstream, it is necessary to extract each element bitstream from the container bitstream.
  • the following container bitstream is assumed to include a video element bitstream for video data and an audio element bitstream for audio data.
  • FIG. 5 is a block diagram schematically illustrating a configuration of a media framework engine included in a multimedia content processing device according to an embodiment of the present invention.
  • the media identifier 310 receives a container bitstream from the application 110 through an identification function.
  • the media identification unit 310 extracts the type identification information from the container bitstream by using the syntax information stored in the identification information storage unit 320 and confirms the same type identification information as the type identification information.
  • the media identification unit 310 confirms that the same type identification information as the type identification information indicates the container bitstream.
  • the media identifier 310 extracts an element bitstream (video element bitstream and audio element bitstream) included in the container bitstream.
  • the media identification unit 310 extracts the type identification information for each of the video element bitstream and the audio element bitstream to confirm the same type identification information, and identifies the interface identification information corresponding to each type identification information. ).
  • the media identifier 310 transmits each element bitstream to the API corresponding to the extracted interface identification information. That is, when the type identification information corresponding to the video element bitstream indicates the MPEG-4 VISUAL standard, the media identifier 310 transmits the video element bitstream to the API 510 of the MPEG-4 VISUAL standard. In addition, when the type identification information corresponding to the audio element bitstream indicates the MPEG AUDIO standard, the media identification unit 310 transmits the audio element bitstream to the API 520 of the MPEG AUDIO standard.
  • the media function 220 decodes each of the video element bitstream and the audio element bitstream received by each API 510 or 520 and transmits the video data and the audio data to the media identifier 310.
  • the media identifier 310 transmits the video data and the audio data to the application 110.
  • the multimedia content processing apparatus may store, in advance, type identification information corresponding to various standards and interface identification information corresponding to each type identification information.
  • the multimedia content processing apparatus receives multimedia content from an application.
  • the multimedia content processing apparatus may extract the type identification information by parsing the multimedia content according to the previously stored syntax information.
  • the multimedia content processing apparatus determines whether the same type identification information as the type identification information exists among the previously stored type identification information.
  • the multimedia content processing apparatus selects the next syntax information and performs a process from operation 620 using the selected syntax information.
  • the multimedia content processing apparatus transmits the multimedia content to the API according to the interface identification information corresponding to the type identification information in step 650.
  • the multimedia content processing apparatus generates an output data by performing a process of encoding or decoding the multimedia content received through the API.
  • the output data may be a bitstream in which the raw data is encoded when the multimedia content is raw data such as an original video.
  • the output data may be raw data calculated by decoding the multimedia content when the multimedia content is bitstream encoded according to an arbitrary standard.
  • the multimedia content processing apparatus transmits the output data to the application.

Abstract

Disclosed is a multimedia content processing device for one or more types of multimedia content, which identifies the types of identification information in a storage unit which stores identification information, and the types of multimedia content received from applications which reference different types of identification information. The media processing apparatus comprises a media identification unit which summons a specified API (Application Programming Interface) depending on type of media content, and at least one API to handle the summoned multimedia content.

Description

멀티미디어 컨텐츠 처리 방법 및 장치Method and apparatus for processing multimedia content
본 발명은 멀티미디어 컨텐츠를 처리하는 기술에 관련된 것으로, 보다 자세하게는 멀티미디어 컨텐츠를 인코딩 또는 디코딩하여 어플리케이션으로 제공하는 방법에 관한 것이다.The present invention relates to a technique for processing multimedia content, and more particularly, to a method of encoding or decoding multimedia content and providing the same to an application.
ISO/IEC 23006 표준 (MPEG Extensible Middleware, MXM)은 멀티미디어에 기반한 다양한 어플리케이션을 보다 신속하게 구현할 수 있도록 하기 위한 중개 장치를 정의하기 위한 표준이다.The ISO / IEC 23006 standard (MPEG Extensible Middleware, MXM) is a standard for defining intermediary devices to enable faster implementation of a variety of multimedia-based applications.
MXM 표준은 다수의 멀티미디어 처리 용 엔진을 제공하여 엔진에 포함된 API (application-programming interface) 를 호출하여 어플리케이션에서 다양한 멀티미디어 컨텐츠의 인코딩 또는 디코딩 과정을 손쉽게 수행할 수 있도록 하는 기술이다. 이로서 MXM은 멀티미디어의 가치 사슬 (value chain) 상에 존재하는 다양한 멀티미디어 어플리케이션의 구현을 보다 손쉽고 신속하게 가능하도록 지원한다.The MXM standard is a technology that provides a number of multimedia processing engines and makes it easy to encode or decode various multimedia contents in an application by calling an API (application-programming interface) included in the engine. This makes MXM easier and faster to implement the various multimedia applications that exist in the multimedia value chain.
하지만 MXM 표준에서 정의하는 멀티미디어 처리 용 엔진에서는 다수의 인코딩 및 디코딩을 수행하는 모듈을 제공할 뿐, 실제 인코딩 또는 디코딩될 멀티미디어 컨텐츠를 식별하고, 식별된 멀티미디어 컨텐츠에 적합한 API를 호출하는 과정은 어플리케이션이 수행하여야 하였다. 이에 따라 어플리케이션의 제작자는 멀티미디어 컨텐츠의 식별 및 어플리케이션에서 사용할 API를 선택하는 과정을 직접 구현하여야 하였다. However, the multimedia processing engine defined by the MXM standard provides a module that performs a plurality of encodings and decodings. The process of identifying the multimedia content to be encoded or decoded and calling an API appropriate for the identified multimedia content can be performed by the application. It should be done. Accordingly, the creator of an application had to directly implement a process of identifying multimedia content and selecting an API to be used in the application.
본 발명은 멀티미디어 컨텐츠를 식별할 수 있는 미디어 프레임 엔진을 구비한 멀티미디어 컨텐츠 처리 장치를 제공하고자 한다.An object of the present invention is to provide a multimedia content processing apparatus having a media frame engine capable of identifying multimedia content.
본 발명의 일 측면에 따르면, 하나 이상의 멀티미디어 컨텐츠의 유형을 식별하도록 하는 유형 식별 정보를 저장하는 식별 정보 저장부 상기 유형 식별 정보를 참조하여 어플리케이션으로부터 수신한 멀티미디어 컨텐츠의 유형을 식별하고, 상기 멀티미디어 컨텐츠의 유형에 따라 지정된API(Application Programming Interface)를 호출하는 미디어 식별부 및 상기 멀티미디어 컨텐츠를 처리하는 하나 이상의 API를 제공하는 미디어 처리부를 포함하는 멀티미디어 컨텐츠 처리 장치가 제공된다.According to an aspect of the present invention, the identification information storage unit for storing the type identification information for identifying the type of one or more multimedia content with reference to the type identification information to identify the type of multimedia content received from the application, the multimedia content There is provided a multimedia content processing apparatus including a media identification unit for calling a specified API (Application Programming Interface) and a media processing unit for providing one or more APIs for processing the multimedia content.
상기 미디어 식별부는 상기 멀티미디어 컨텐츠로부터 하나 이상의 지정된 파싱 방법 중 어느 하나에 따라 유형 확인 정보를 추출하고, 하나 이상의 지정된 유형 식별 정보 중 상기 유형 확인 정보와 동일한 유형 식별 정보에 상응하는 유형을 상기 멀티미디어 컨텐츠의 유형으로 식별할 수 있다.The media identification unit extracts type identification information from the multimedia content according to any one or more designated parsing methods, and selects a type corresponding to the same type identification information as the type identification information among one or more designated type identification information. Can be identified by type.
상기 미디어 식별부는 상기 유형 확인 정보와 상기 유형 식별 정보 중 어느 하나가 동일한 경우, 상기 유형 확인 정보와 동일한 상기 유형 식별 정보에 상응하는 API를 호출할 수 있다.When one of the type identification information and the type identification information is the same, the media identification unit may call an API corresponding to the same type identification information as the type identification information.
상기 미디어 식별부는 상기 유형 확인 정보와 동일한 상기 유형 식별 정보가 존재하지 않는 경우, 하나 이상의 지정된 파싱 방법 중 이전 수행한 상기 파싱 방법 이외의 파싱 방법에 따라 상기 멀티미디어 컨텐츠로부터 상기 유형 확인 정보를 다시 추출할 수 있다.If the same type identification information as the type identification information does not exist, the media identification unit re-extracts the type identification information from the multimedia content according to a parsing method other than the parsing method previously performed among one or more designated parsing methods. Can be.
상기 미디어 식별부는 상기 유형 확인 정보와 동일한 상기 유형 식별 정보가 컨테이너 비트스트림(Container Bitstream)을 나타내는경우, 상기 멀티미디어 컨텐츠로부터 하나 이상의 요소 비트스트림을 추출하고, 각 상기 요소 비트스트림의 유형을 식별하고, 각 상기 요소 비트스트림의 유형에 따라 상기 API를 호출할 수 있다.When the type identification information equal to the type identification information indicates a container bitstream, the media identification unit extracts one or more element bitstreams from the multimedia content, identifies each type of the element bitstream, The API may be called according to the type of each element bitstream.
본 발명의 다른 측면에 따르면, 멀티미디어 컨텐츠 처리 장치가 멀티미디어 컨텐츠를 처리하는 방법에 있어서, 어플리케이션으로부터 멀티미디어 컨텐츠를 수신하는 단계 상기 멀티미디어 컨텐츠의 유형을 식별하는 단계 상기 멀티미디어 컨텐츠의 유형에 따라 지정된 API(Application Programming Interface)를 호출하는 단계 및 상기 API를 통해 상기 멀티미디어 컨텐츠를 인코딩 또는 디코딩하여 출력 데이터를 생성하는 단계 및 상기 출력 데이터를 상기 어플리케이션으로 전송하는 단계를 포함하는 멀티미디어 컨텐츠 처리 방법이 제공된다.According to another aspect of the present invention, a method for processing multimedia content in a multimedia content processing apparatus, the method comprising: receiving multimedia content from an application, identifying the type of the multimedia content; Programming interface), encoding or decoding the multimedia content through the API, generating output data, and transmitting the output data to the application.
상기 멀티미디어 컨텐츠의 유형을 식별하는 단계는 상기 멀티미디어 컨텐츠로부터 하나 이상의 지정된 파싱 방법 중 어느 하나에 따라 유형 확인 정보를 추출하는 단계 및 상기 유형 확인 정보가 지정된 유형 식별 정보 중 어느 하나와 동일한지 판단하는 단계를 포함할 수 있다.The identifying of the type of the multimedia content may include extracting type identification information from the multimedia content according to any one or more designated parsing methods, and determining whether the type identification information is the same as any of the specified type identification information. It may include.
상기 멀티미디어 컨텐츠의 유형에 따라 지정된 API를 호출하는 단계는 상기 유형 확인 정보와 상기 유형 식별 정보 중 어느 하나가 동일한 경우, 상기 유형 확인 정보와 동일한 상기 유형 식별 정보에 상응하는 API를 호출하는 단계일 수 있다.Calling an API designated according to the type of the multimedia content may call an API corresponding to the same type identification information as the type identification information when any one of the type identification information and the type identification information is the same. have.
상기 멀티미디어 컨텐츠의 유형을 식별하는 단계는 상기 유형 확인 정보와 동일한 상기 유형 식별 정보가 존재하지 않는 경우, 하나 이상의 지정된 파싱 방법 중 이전 수행한 상기 파싱 방법 이외의 파싱 방법을 재선정하는 단계를 더 포함하되, 상기 파싱 방법을 재선정하는 단계 이후, 상기 유형 확인 정보를 추출하는 단계부터의 과정을 다시 수행될 수 있다.The identifying of the type of the multimedia content may further include reselecting a parsing method other than the parsing method previously performed among one or more designated parsing methods when the same type identification information as the type identification information does not exist. After the step of reselecting the parsing method, the process from the step of extracting the type identification information may be performed again.
상기 유형 확인 정보와 동일한 상기 유형 식별 정보가 컨테이너 비트스트림(Container Bitstream)을 나타내는경우, 상기 멀티미디어 컨텐츠로부터 하나 이상의 요소 비트스트림을 추출하는 단계를 더 포함하되, 상기 요소 비트스트림을 추출하는 단계 이후 각 상기 요소 비트스트림에 대해 상기 유형 확인 정보를 추출하는 단계 내지 상기 출력 데이터를 상기 어플리케이션으로 전송하는 단계가 수행될 수 있다.If the type identification information equal to the type identification information indicates a container bitstream, further comprising extracting one or more element bitstreams from the multimedia content, wherein each step after extracting the element bitstream Extracting the type identification information for the element bitstream or transmitting the output data to the application may be performed.
도 1은 MXM 표준에 따른 멀티미디어 컨텐츠 처리 장치의 구성을 개략적으로 나타낸 도면.1 is a diagram schematically illustrating a configuration of a multimedia content processing apparatus according to the MXM standard.
도 2는 MXM 표준에 따른 멀티미디어 컨텐츠 처리 장치간의 멀티미디어 컨텐츠 전송에 따른 과정을 설명하기 위한 도면.2 is a view for explaining a process according to the multimedia content transmission between the multimedia content processing apparatus according to the MXM standard.
도 3은 본 발명의 실시예에 따른 멀티미디어 컨텐츠 처리 장치에 구비된미디어 프레임워크 엔진의 구성을 개략적으로 예시한 블록도.3 is a block diagram schematically illustrating a configuration of a media framework engine included in a multimedia content processing apparatus according to an embodiment of the present invention.
도 4는 본 발명의 실시예에 따른 멀티미디어 컨텐츠 처리 장치의 미디어 식별부에서 식별 정보 저장부에 저장된 유형 식별 정보를 이용하여 멀티미디어 컨텐츠의 유형을 판단하는 과정을 예시한 도면.4 is a diagram illustrating a process of determining a type of multimedia content by using the type identification information stored in the identification information storage unit in the media identification unit of the multimedia content processing apparatus according to an embodiment of the present invention.
도 5는 본 발명의 실시예에 따른 멀티미디어 컨텐츠 처리 장치에 구비된미디어 프레임워크 엔진의 구성을 개략적으로 예시한 블록도.5 is a block diagram schematically illustrating a configuration of a media framework engine included in a multimedia content processing device according to an embodiment of the present invention.
도 6은 멀티미디어 컨텐츠 처리 장치가 멀티미디어 컨텐츠를 처리하는 과정을 예시한 순서도.6 is a flowchart illustrating a process of a multimedia content processing apparatus processing multimedia content.
본 발명은 다양한 변환을 가할 수 있고 여러 가지 실시예를 가질 수 있는바, 특정 실시예들을 도면에 예시하고 상세한 설명에 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변환, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 본 발명을 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다.As the invention allows for various changes and numerous embodiments, particular embodiments will be illustrated in the drawings and described in detail in the written description. However, this is not intended to limit the present invention to specific embodiments, it should be understood to include all transformations, equivalents, and substitutes included in the spirit and scope of the present invention. In the following description of the present invention, if it is determined that the detailed description of the related known technology may obscure the gist of the present invention, the detailed description thereof will be omitted.
제1, 제2 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. Terms such as first and second may be used to describe various components, but the components should not be limited by the terms. The terms are used only for the purpose of distinguishing one component from another.
본 출원에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.The terminology used herein is for the purpose of describing particular example embodiments only and is not intended to be limiting of the present invention. Singular expressions include plural expressions unless the context clearly indicates otherwise. In this application, the terms "comprise" or "have" are intended to indicate that there is a feature, number, step, operation, component, part, or combination thereof described in the specification, and one or more other features. It is to be understood that the present invention does not exclude the possibility of the presence or the addition of numbers, steps, operations, components, components, or a combination thereof.
이하, 본 발명의 실시예를 첨부한 도면들을 참조하여 상세히 설명하기로 한다. Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings.
도 1은 MXM 표준에 따른 멀티미디어 컨텐츠 처리 장치의 구성을 개략적으로 나타낸 도면이다.1 is a diagram schematically illustrating a configuration of a multimedia content processing apparatus according to the MXM standard.
도 1을 참조하면, 멀티미디어 컨텐츠 처리 장치는 프로세서(101), 메모리(102), 운영 체제(103)를 포함한다. 멀티미디어 컨텐츠 처리 장치는 구비된 운영 체제(103)에 MXM 표준에 따른 멀티미디어 컨텐츠 엔진(105)(Orchestrator Engine, MPEG21 File Engine, Digital Item Engine, REL Engine, IPMP Engine, Security Engine, Content Metadata Engine, Media Framework Engine 및 Content Search Engine 등)를 설치할 수 있고, 메모리(102) 상에 상주하여 프로세서(101)에 의해 수행되는 어플리케이션(110)의 호출에 따라 컨텐츠 용 엔진에 포함된 API를 제공할 수 있다. 예를 들어, 어플리케이션은 사용자로부터 MPEG-4 VIDEO 표준에 따라 인코딩된 비트스트림을 수신받고, 해당 비트스트림을 디코딩하기 위해 Media Framework Engine에 포함된 API를 호출한다. 어플리케이션은 호출한 API를 이용하여 비트스트림을 디코딩한 동영상 데이터를 생성하여 재생한다. 상술한 비트스트림을 디코딩하여 재생하는 과정은 어플리케이션에서 수행하며, 비트스트림을 디코딩하기 위한 API는 어플리케이션에 따라 결정된다. Referring to FIG. 1, a multimedia content processing apparatus includes a processor 101, a memory 102, and an operating system 103. The multimedia content processing apparatus includes a multimedia content engine 105 (Orchestrator Engine, MPEG21 File Engine, Digital Item Engine, REL Engine, IPMP Engine, Security Engine, Content Metadata Engine, Media Framework) according to the MXM standard. Engine, Content Search Engine, etc.) may be installed, and the API included in the engine for content may be provided according to a call of the application 110 that is resident on the memory 102 and executed by the processor 101. For example, an application receives a bitstream encoded according to the MPEG-4 VIDEO standard from a user and calls an API included in the Media Framework Engine to decode the bitstream. The application generates and plays the video data obtained by decoding the bitstream using the called API. The process of decoding and playing the above-described bitstream is performed by an application, and the API for decoding the bitstream is determined according to the application.
도 2는 MXM 표준에 따른 멀티미디어 컨텐츠 처리 장치간의 멀티미디어 컨텐츠 전송에 따른 과정을 설명하기 위한 도면이다.FIG. 2 is a diagram for describing a process of transmitting multimedia content between multimedia content processing apparatuses according to the MXM standard.
도 1을 참조하여 상술한 구성의 제1 멀티미디어 컨텐츠 처리 장치(210)는 제1 어플리케이션(213)에 의해 MXM 표준에 정의된 멀티미디어 컨텐츠 엔진(215)을 통한 동영상 데이터의 인코딩 또는 임의의 표준에 따라 인코딩된 비트스트림의 디코딩을 수행할 수 있다. 제2 멀티미디어 컨텐츠 처리 장치(220)는 제2 어플리케이션(223)에 의해 MXM 표준에 정의된 멀티미디어 컨텐츠 엔진(225)을 통한 동영상 데이터의 인코딩 또는 임의의 표준에 따라 인코딩된 비트스트림의 디코딩을 수행할 수 있다. 이 때, 제1 멀티미디어 컨텐츠 처리 장치와 제2 멀티미디어 컨텐츠 처리 장치는 서로 다른 종류의 플랫폼일 수 있으며, 이에 따라 각 운영 체제(216, 226)는 서로 다른 운영 체제일 수 있다.The first multimedia content processing device 210 having the above-described configuration with reference to FIG. 1 may be configured according to an encoding of video data or an arbitrary standard through the multimedia content engine 215 defined in the MXM standard by the first application 213. The decoding of the encoded bitstream may be performed. The second multimedia content processing device 220 may perform encoding of the video data through the multimedia content engine 225 defined in the MXM standard or decoding the bitstream encoded according to any standard by the second application 223. Can be. In this case, the first multimedia content processing device and the second multimedia content processing device may be different types of platforms, and thus, each operating system 216 and 226 may be different operating systems.
따라서, 상술한 MXM 표준에 따른 멀티미디어 컨텐츠 처리 장치들은 서로 다른 플랫폼의 장치더라도 동일한 방식의 멀티미디어 컨텐츠 관련 표준 기술을 이용하여 인코딩 및 디코딩을 수행할 수 있으며, 이로 인해 멀티미디어 컨텐츠를 디코딩하는 측의 컨텐츠 처리 장치가 디코딩 수행이 불가해지는 등의 비트스트림의 인코딩 및 디코딩 방식이 매칭되지 않는 것을 방지할 수 있다.Accordingly, the multimedia contents processing apparatuses according to the above-mentioned MXM standard can perform encoding and decoding using multimedia technology related standard technology of the same method even if the devices of different platforms are used. The device may prevent the encoding and decoding schemes of the bitstream such that the decoding cannot be performed are not matched.
도 3은 본 발명의 실시예에 따른 멀티미디어 컨텐츠 처리 장치에 구비된미디어 프레임워크 엔진의 구성을 개략적으로 예시한 블록도이고, 도 4는 본 발명의 실시예에 따른 멀티미디어 컨텐츠 처리 장치의 미디어 식별부에서 식별 정보 저장부에 저장된 유형 식별 정보를 이용하여 멀티미디어 컨텐츠의 유형을 판단하는 과정을 예시한 도면이다. 3 is a block diagram schematically illustrating a configuration of a media framework engine included in a multimedia content processing apparatus according to an embodiment of the present invention, and FIG. 4 is a media identification unit of the multimedia content processing apparatus according to an embodiment of the present invention. Is a diagram illustrating a process of determining the type of multimedia content by using the type identification information stored in the identification information storage unit.
미디어 프레임워크 엔진(300)은 미디어 식별부(310) 및 미디어 처리부(330)를 포함한다.The media framework engine 300 includes a media identification unit 310 and a media processing unit 330.
미디어 식별부(310)는 어플리케이션(110)으로부터 호출되는 API(이하 어플케이션 호출 함수라 지칭)를 제공한다. 미디어 식별부(310)는 어플리케이션 호출 함수를 통해 어플리케이션(110)으로부터 멀티미디어 컨텐츠를 수신한다. 미디어 식별부(310)는 멀티미디어 컨텐츠의 헤더를 분석하여 멀디미디어 컨텐츠의 유형을 식별한다. The media identification unit 310 provides an API (hereinafter, referred to as an application call function) that is called from the application 110. The media identifier 310 receives the multimedia content from the application 110 through an application call function. The media identification unit 310 analyzes the header of the multimedia content to identify the type of the multimedia content.
식별 정보 저장부(320)는 미디어 처리부(330)에서 처리 가능한 표준에 따른 멀티미디어 컨텐츠의 유형을 식별할 수 있는 식별 정보(이하 유형 식별 정보라 지칭) 및 각 유형 식별 정보에 따른 유형의 비트스트림을 처리하기 위한 API의 식별 정보(이하 인터페이스 식별 정보라 지칭)를 저장한다. 이 때, 식별 정보 저장부(320)는 식별 정보 이외 멀티미디어 컨텐츠에서 유형 식별 정보를 추출하기 위한 신택스 파싱(Syntax Parsing) 규칙을 나타내는 정보(이하 신택스 정보라 지칭)를 추가로 저장할 수 있다.The identification information storage unit 320 may identify identification information (hereinafter referred to as type identification information) for identifying the type of multimedia content according to a standard that may be processed by the media processing unit 330, and a bitstream of a type corresponding to each type identification information. Stores identification information (hereinafter referred to as interface identification information) of an API for processing. In this case, the identification information storage unit 320 may further store information indicating syntax parsing rules for extracting type identification information from multimedia content other than the identification information (hereinafter referred to as syntax information).
미디어 식별부(310)는 식별 정보 저장부(320)에 저장된 유형 식별 정보를 참조하여 멀티미디어 컨텐츠의 유형을 식별한다. 도 4를 참조하여 예를 들면, 미디어 식별부(310)는 식별 정보 저장부(320)로부터 임의의 신택스 정보를 추출할 수 있다. 미디어 식별부(310)는 신택스 정보에 따라 멀티미디어 컨텐츠로부터 유형 식별 정보와 비교되어 멀티미디어 컨텐츠의 유형을 식별할 수 있는 데이터(이하 유형 확인 정보라 지칭)를 추출할 수 있다. 즉, 멀티미디어 컨텐츠가 MPEG4 표준에 따라 인코딩된 비트스트림이고, 신택스 정보가 멀티미디어 컨텐츠의 첫 32비트를 추출하는 신택스 파싱 규칙을 나타내는 경우, 미디어 식별부(310)는 멀티미디어 컨텐츠로부터 첫 32비트의 유형 확인 정보("00 00 01 B0")를 추출한다. 미디어 식별부(310)는 유형 확인 정보(405)와 동일한 유형 식별 정보(410)가 식별 정보 저장부(320)에 저장되어 있는지 확인한다. 미디어 식별부(310)는 추출한 유형 확인 정보가 MPEG-4에 상응하는 유형 식별 정보와 동일함을 확인하고, 해당 유형 식별 정보에 상응하는 인터페이스 식별 정보(즉, MPEG-4 비트스트림을 디코딩하기 위한 API에 상응하는 인터페이스 식별 정보)를 식별 정보 저장부(320)로부터 추출한다. 미디어 식별부(310)는 인터페이스 식별 정보에 상응하는 API를 통해 미디어 처리부(330)로 멀티미디어 컨텐츠를 전송한다. The media identification unit 310 identifies the type of multimedia content by referring to the type identification information stored in the identification information storage unit 320. For example, referring to FIG. 4, the media identification unit 310 may extract arbitrary syntax information from the identification information storage unit 320. The media identification unit 310 may extract data (hereinafter referred to as type identification information) for identifying the type of the multimedia content by comparing the type identification information with the multimedia content according to the syntax information. That is, if the multimedia content is a bitstream encoded according to the MPEG4 standard, and the syntax information indicates a syntax parsing rule for extracting the first 32 bits of the multimedia content, the media identifier 310 identifies the type of the first 32 bits from the multimedia content. Extract information ("00 00 01 B0"). The media identification unit 310 checks whether the same type identification information 410 as the type identification information 405 is stored in the identification information storage unit 320. The media identification unit 310 confirms that the extracted type identification information is the same as the type identification information corresponding to MPEG-4, and identifies the interface identification information corresponding to the type identification information (ie, decoding the MPEG-4 bitstream. Interface identification information corresponding to the API) is extracted from the identification information storage unit 320. The media identification unit 310 transmits the multimedia content to the media processing unit 330 through an API corresponding to the interface identification information.
상술한 바와 같이 미디어 식별부(310)는 신택스 정보에 따라 비트스트림으로부터 데이터를 추출한다. 이 때, 식별 정보 저장부(320)는 복수의 신택스 정보를 저장할 수 있다. 미디어 식별부(310)는 복수의 신택스 정보 중 하나씩을 순차적으로 추출할 수 있다. 이에 따라 미디어 식별부(310)는 신택스 정보에 따라 추출한 데이터와 동일한 유형 식별 정보가 식별 정보 저장부(320)에 저장된 것을 확인할 때까지, 복수의 신택스 정보 중 어느 하나에 따라 데이터를 추출하여 유형 식별 정보를 확인하는 과정을 반복 수행할 수 있다. 예를 들어, MPEG-4 표준과 같이 비트스트림의 첫 32비트가 유형 식별 정보가 되는 표준 이외, 첫 32비트 이외의 데이터가 유형 식별 정보로 이용되는 표준도 존재한다. 미디어 식별부(310)는 우선 멀티미디어 컨텐츠의 첫 32비트를 추출하는 신택스 정보에 따라 멀티미디어 컨텐츠의 유형 확인에 실패하는 경우, 식별 정보 저장부(320)에 저장된 다음 신택스 정보에 따라 멀티미디어 컨텐츠에서 데이터를 추출하고, 추출한 데이터를 이용하여 멀티미디어 컨텐츠의 유형을 확인할 수 있다.As described above, the media identifier 310 extracts data from the bitstream according to the syntax information. In this case, the identification information storage unit 320 may store a plurality of syntax information. The media identifier 310 may sequentially extract one of the plurality of syntax information. Accordingly, the media identification unit 310 extracts the data according to any one of the plurality of syntax information and identifies the type until it confirms that the same type identification information as the data extracted according to the syntax information is stored in the identification information storage unit 320. The process of checking the information can be repeated. For example, there is a standard in which data other than the first 32 bits is used as the type identification information. When the media identification unit 310 fails to check the type of the multimedia content according to the syntax information extracting the first 32 bits of the multimedia content, the media identification unit 310 stores the data in the multimedia content according to the syntax information stored in the identification information storage unit 320. The extracted and extracted data may be used to identify the type of multimedia content.
미디어 처리부(330)는 멀티미디어 컨텐츠를 인코딩 또는 디코딩하는 과정에서 필요한 API를 제공한다. 이 때, 미디어 처리부(330)에서 제공하는 API는 하기의 표 1과 같은 표준의 인코딩 및 디코딩을 위한 API일 수 있다. 이 때, 미디어 처리부(330)가 제공하는API는 하기의 같은 표준의 인코딩 및 디코딩을 위한 API 이외에 다른 API를 추가로 제공할 수 있음은 자명하다.The media processor 330 provides an API required in the process of encoding or decoding the multimedia content. In this case, the API provided by the media processing unit 330 may be an API for encoding and decoding of a standard as shown in Table 1 below. At this time, it is apparent that the API provided by the media processing unit 330 may additionally provide other APIs in addition to APIs for encoding and decoding of the following standard.
표 1
Standard Profile or Technology
MPEG-1 Audio layer II
MPEG-1 Audio layer III
MPEG-4 AAC
MPEG-4 HE-AAC
MPEG-1 Video
MPEG-2 Video Main Profile
MPEG-4 Visual Simple Profile
Advanced Simple Profile
MPEG-4 AVC
Codec Configuration Representation
Video tool library
MPEG-1 Systems
MPEG-2 Systems Transport Stream
Program Stream
MPEG-4 M4Mux
ISO Base Media File Format
Geometry
Appearance
Texture
BBA Animation
FAMC Animation
LASeR Core
BIFS
Table 1
Standard Profile or Technology
MPEG-1 Audio layer II
MPEG-1 Audio layer III
MPEG-4 AAC
MPEG-4 HE-AAC
MPEG-1 Video
MPEG-2 Video Main profile
MPEG-4 Visual Simple Profile
Advanced Simple Profile
MPEG-4 AVC
Codec Configuration Representation
Video tool library
MPEG-1 Systems
MPEG-2 Systems Transport stream
Program Stream
MPEG-4 M4Mux
ISO Base Media File Format
Geometry
Appearance
Texture
BBA Animation
FAMC Animation
LASeR Core
BIFS
미디어 처리부(330)는 상술한 API를 수행하여 멀티미디어 컨텐츠를 인코딩 또는 디코딩한다. 미디어 처리부(330)는 멀티미디어 컨텐츠를 인코딩 또는 디코딩한 데이터(이하 출력 데이터라 지칭)를 API를 통해 미디어 식별부(310)로 전송한다.The media processor 330 encodes or decodes the multimedia content by performing the above-described API. The media processor 330 transmits data (hereinafter, referred to as output data) obtained by encoding or decoding multimedia content to the media identifier 310 through the API.
미디어 식별부(310)는 미디어 처리부(330)로부터 수신한 출력 데이터를 어플리케이션(110)으로 전송한다. The media identification unit 310 transmits output data received from the media processing unit 330 to the application 110.
지금까지 멀티미디어 컨텐츠 처리 장치에 의해 하나의 표준에 따른 멀티미디어 컨텐츠를 인코딩 또는 디코딩하는 과정을 설명하였다.Up to now, a process of encoding or decoding multimedia content according to a standard by a multimedia content processing apparatus has been described.
멀티미디어 컨텐츠는 상술한 바와 같은 하나의 표준에 따른 형식의 데이터일 수 있지만, 각 표준에 따른 비트스트림이 병합된 컨테이너 비트스트림(Container Bitstream)일 수 있다. 컨테이너 비트스트림은 비디오 데이터를 인코딩하는 표준, 오디오 데이터를 인코딩하는 표준 등의 각 표준에 대한 요소 비트스트림(Element Bitstream)을 포함할 수 있다. 이에 따라 컨테이너 비트스트림을 디코딩하기 위해서는 각 요소 비트스트림을 컨테이너 비트스트림으로부터 추출하는 과정이 필요하다.The multimedia content may be data in a format according to one standard as described above, but may be a container bitstream in which bitstreams according to each standard are merged. The container bitstream may include an element bitstream for each standard, such as a standard for encoding video data and a standard for encoding audio data. Accordingly, in order to decode the container bitstream, it is necessary to extract each element bitstream from the container bitstream.
이하 도 5를 참조하여 멀티미디어 컨텐츠 처리 장치가 컨테이너 비트스트림을 처리하는 과정을 설명하도록 한다. 이하 컨테이너 비트스트림은 비디오 데이터에 대한 비디오 요소 비트스트림과 오디오 데이터에 대한 오디오 요소 비트스트림을 포함하는 것으로 가정하도록 한다.Hereinafter, a process of processing a container bitstream by the multimedia content processing apparatus will be described with reference to FIG. 5. The following container bitstream is assumed to include a video element bitstream for video data and an audio element bitstream for audio data.
도 5는 본 발명의 실시예에 따른 멀티미디어 컨텐츠 처리 장치에 구비된미디어 프레임워크 엔진의 구성을 개략적으로 예시한 블록도이다.5 is a block diagram schematically illustrating a configuration of a media framework engine included in a multimedia content processing device according to an embodiment of the present invention.
미디어 식별부(310)는 어플리케이션(110)으로부터 컨테이너 비트스트림을 식별 함수를 통해 수신한다. 미디어 식별부(310)는 식별 정보 저장부(320)에 저장된 신택스 정보를 이용하여 컨테이너 비트스트림로부터 유형 확인 정보를 추출하고, 유형 확인 정보와 동일한 유형 식별 정보를 확인한다. 미디어 식별부(310)는 유형 확인 정보와 동일한 유형 식별 정보가 컨테이너 비트스트림을 나타내는 것을 확인한다. 미디어 식별부(310)는 컨테이너 비트스트림이 포함하는 요소 비트스트림(비디오 요소 비트스트림 및 오디오 요소 비트스트림)을 추출한다. 미디어 식별부(310)는 비디오 요소 비트스트림 및 오디오 요소 비트스트림 각각에 대해서 유형 확인 정보를 추출하여 동일한 유형 식별 정보를 확인하고, 각 유형 식별 정보에 상응하는 인터페이스 식별 정보를 식별 정보 저장부(320)로부터 추출한다. 미디어 식별부(310)는 추출한 인터페이스 식별 정보에 상응하는 API로 각각의 요소 비트스트림을 전송한다. 즉, 비디오 요소 비트스트림에 상응하는 유형 식별 정보가 MPEG-4 VISUAL 표준을 나타내는 경우, 미디어 식별부(310)는 비디오 요소 비트스트림을 MPEG-4 VISUAL 표준의 API(510)로 전송한다. 또한 오디오 요소 비트스트림에 상응하는 유형 식별 정보가 MPEG AUDIO 표준을 나타내는 경우, 미디어 식별부(310)는 오디오 요소 비트스트림을 MPEG AUDIO 표준의 API(520)로 전송한다. 미디어 기능부(220)는 각 API(510, 520)로 수신된 비디오 요소 비트스트림 및 오디오 요소 비트스트림 각각을 디코딩하여 비디오 데이터 및 오디오 데이터를 미디어 식별부(310)로 전송한다. 미디어 식별부(310)는 비디오 데이터 및 오디오 데이터를 어플리케이션(110)으로 전송한다.The media identifier 310 receives a container bitstream from the application 110 through an identification function. The media identification unit 310 extracts the type identification information from the container bitstream by using the syntax information stored in the identification information storage unit 320 and confirms the same type identification information as the type identification information. The media identification unit 310 confirms that the same type identification information as the type identification information indicates the container bitstream. The media identifier 310 extracts an element bitstream (video element bitstream and audio element bitstream) included in the container bitstream. The media identification unit 310 extracts the type identification information for each of the video element bitstream and the audio element bitstream to confirm the same type identification information, and identifies the interface identification information corresponding to each type identification information. ). The media identifier 310 transmits each element bitstream to the API corresponding to the extracted interface identification information. That is, when the type identification information corresponding to the video element bitstream indicates the MPEG-4 VISUAL standard, the media identifier 310 transmits the video element bitstream to the API 510 of the MPEG-4 VISUAL standard. In addition, when the type identification information corresponding to the audio element bitstream indicates the MPEG AUDIO standard, the media identification unit 310 transmits the audio element bitstream to the API 520 of the MPEG AUDIO standard. The media function 220 decodes each of the video element bitstream and the audio element bitstream received by each API 510 or 520 and transmits the video data and the audio data to the media identifier 310. The media identifier 310 transmits the video data and the audio data to the application 110.
도 6은 멀티미디어 컨텐츠 처리 장치가 멀티미디어 컨텐츠를 처리하는 과정을 예시한 순서도이다. 이 때, 도 1 내지 도 5를 참조하여 상술한 바와 같이 멀티미디어 컨텐츠 처리 장치에는 각종 표준에 상응하는 유형 식별 정보, 각 유형 식별 정보에 상응하는 인터페이스 식별 정보가 미리 저장될 수 있다. 6 is a flowchart illustrating a process of processing a multimedia content by the multimedia content processing device. In this case, as described above with reference to FIGS. 1 to 5, the multimedia content processing apparatus may store, in advance, type identification information corresponding to various standards and interface identification information corresponding to each type identification information.
도 6을 참조하면, 단계 610에서 멀티미디어 컨텐츠 처리 장치는 어플리케이션으로부터 멀티미디어 컨텐츠를 수신한다.Referring to FIG. 6, in operation 610, the multimedia content processing apparatus receives multimedia content from an application.
단계 620에서 멀티미디어 컨텐츠 처리 장치는 미리 저장된 신택스 정보에 따라 멀티미디어 컨텐츠를 파싱하여 유형 확인 정보를 추출할 수 있다. In operation 620, the multimedia content processing apparatus may extract the type identification information by parsing the multimedia content according to the previously stored syntax information.
단계 630에서 멀티미디어 컨텐츠 처리 장치는 미리 저장된 유형 식별 정보 중 유형 확인 정보와 동일한 유형 식별 정보가 존재하는지 판단한다.In operation 630, the multimedia content processing apparatus determines whether the same type identification information as the type identification information exists among the previously stored type identification information.
단계 630에서 유형 확인 정보와 동일한 유형 식별 정보가 존재하지 않는경우, 단계 640에서 멀티미디어 컨텐츠 처리 장치는 다음 신택스 정보를 선정하고, 선정된 신택스 정보를 이용하여 단계 620부터의 과정을 수행한다.If the same type identification information as the type identification information does not exist in operation 630, in operation 640, the multimedia content processing apparatus selects the next syntax information and performs a process from operation 620 using the selected syntax information.
단계 630에서 유형 확인 정보와 동일한 유형 식별 정보가 존재하는 경우, 단계 650에서 멀티미디어 컨텐츠 처리 장치는 해당 유형 식별 정보에 상응하는 인터페이스 식별 정보에 따른 API로 멀티미디어 컨텐츠를 전송한다.If the same type identification information as the type identification information exists in step 630, the multimedia content processing apparatus transmits the multimedia content to the API according to the interface identification information corresponding to the type identification information in step 650.
단계 660에서 멀티미디어 컨텐츠 처리 장치는 API를 통해 수신한 멀티미디어 컨텐츠를 인코딩 또는 디코딩하는 과정을 수행하여 출력 데이터를 생성한다. 이 때, 출력 데이터는 멀티미디어 컨텐츠가 원본 동영상 등의 로우(RAW) 데이터인 경우, 로우 데이터를 인코딩한 비트스트림일 수 있다. 또한 출력 데이터는 멀디미디어 컨텐츠가 임의의 표준에 따라 인코딩된 비트트스림인 경우, 이를 디코딩하여 산출된 로우 데이터일 수 있다.In operation 660, the multimedia content processing apparatus generates an output data by performing a process of encoding or decoding the multimedia content received through the API. In this case, the output data may be a bitstream in which the raw data is encoded when the multimedia content is raw data such as an original video. The output data may be raw data calculated by decoding the multimedia content when the multimedia content is bitstream encoded according to an arbitrary standard.
단계 670에서 멀디미디어 컨텐츠 처리 장치는 출력 데이터를 어플리케이션으로 전송한다.In operation 670, the multimedia content processing apparatus transmits the output data to the application.
이제까지 본 발명에 대하여 그 실시예를 중심으로 살펴보았다. 전술한 실시 예 외의 많은 실시 예들이 본 발명의 특허청구범위 내에 존재한다. 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시 예는 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.So far I looked at the center of the present invention with respect to the embodiment. Many embodiments other than the above-described embodiments are within the claims of the present invention. Those skilled in the art will appreciate that the present invention can be implemented in a modified form without departing from the essential features of the present invention. Therefore, the disclosed embodiments should be considered in descriptive sense only and not for purposes of limitation. The scope of the present invention is shown in the claims rather than the foregoing description, and all differences within the scope will be construed as being included in the present invention.
본 발명에 따르면, 멀티미디어 컨텐츠를 자동으로 식별하여 처리할 수 있는 이점이 있다.According to the present invention, there is an advantage that can automatically identify and process multimedia content.

Claims (10)

  1. 하나 이상의 멀티미디어 컨텐츠의 유형을 식별하도록 하는 유형 식별 정보를 저장하는 식별 정보 저장부Identification information storage unit for storing the type identification information to identify the type of one or more multimedia content
    상기 유형 식별 정보를 참조하여 어플리케이션으로부터 수신한 멀티미디어 컨텐츠의 유형을 식별하고, 상기 멀티미디어 컨텐츠의 유형에 따라 지정된API(Application Programming Interface)를 호출하는 미디어 식별부 및A media identification unit for identifying a type of multimedia content received from an application with reference to the type identification information and calling an API (Application Programming Interface) designated according to the type of the multimedia content;
    상기 멀티미디어 컨텐츠를 처리하는 하나 이상의 API를 제공하는 미디어 처리부를 포함하는 멀티미디어 컨텐츠 처리 장치.And a media processing unit for providing one or more APIs for processing the multimedia contents.
  2. 제1 항에 있어서,According to claim 1,
    상기 미디어 식별부는The media identification unit
    상기 멀티미디어 컨텐츠로부터 하나 이상의 지정된 파싱 방법 중 어느 하나에 따라 유형 확인 정보를 추출하고, Extracting type identification information from the multimedia content according to any one or more specified parsing methods,
    하나 이상의 지정된 유형 식별 정보 중 상기 유형 확인 정보와 동일한 유형 식별 정보에 상응하는 유형을 상기 멀티미디어 컨텐츠의 유형으로 식별하는 것을 특징으로 하는 멀티미디어 컨텐츠 처리 장치.And identifying a type corresponding to the same type identification information as the type identification information among one or more designated type identification information as the type of the multimedia content.
  3. 제2 항에 있어서,The method of claim 2,
    상기 미디어 식별부는The media identification unit
    상기 유형 확인 정보와 상기 유형 식별 정보 중 어느 하나가 동일한 경우, 상기 유형 확인 정보와 동일한 상기 유형 식별 정보에 상응하는 API를 호출하는 것을 특징으로 하는 멀티미디어 컨텐츠 처리 장치.And when one of the type identification information and the type identification information is the same, calling the API corresponding to the same type identification information as the type identification information.
  4. 제2 항에 있어서,The method of claim 2,
    상기 미디어 식별부는The media identification unit
    상기 유형 확인 정보와 동일한 상기 유형 식별 정보가 존재하지 않는 경우, 하나 이상의 지정된 파싱 방법 중 이전 수행한 상기 파싱 방법 이외의 파싱 방법에 따라 상기 멀티미디어 컨텐츠로부터 상기 유형 확인 정보를 다시 추출하는 것을 특징으로 하는 멀티미디어 컨텐츠 처리 장치.If the same type identification information as the type identification information does not exist, the type identification information is re-extracted from the multimedia content according to a parsing method other than the parsing method previously performed among one or more designated parsing methods. Multimedia content processing device.
  5. 제1 항에 있어서,According to claim 1,
    상기 미디어 식별부는 상기 유형 확인 정보와 동일한 상기 유형 식별 정보가 컨테이너 비트스트림(Container Bitstream)을 나타내는경우, 상기 멀티미디어 컨텐츠로부터 하나 이상의 요소 비트스트림을 추출하고,The media identification unit extracts one or more element bitstreams from the multimedia content when the type identification information identical to the type identification information indicates a container bitstream.
    각 상기 요소 비트스트림의 유형을 식별하고,Identify the type of each said element bitstream,
    각 상기 요소 비트스트림의 유형에 따라 상기 API를 호출하는 것을 특징으로 하는 멀티미디어 컨텐츠 처리 장치.And calling the API according to the type of each element bitstream.
  6. 멀티미디어 컨텐츠 처리 장치가 멀티미디어 컨텐츠를 처리하는 방법에 있어서,In the multimedia content processing apparatus for processing multimedia content,
    어플리케이션으로부터 멀티미디어 컨텐츠를 수신하는 단계Receiving multimedia content from an application
    상기 멀티미디어 컨텐츠의 유형을 식별하는 단계Identifying the type of multimedia content
    상기 멀티미디어 컨텐츠의 유형에 따라 지정된 API(Application Programming Interface)를 호출하는 단계 및Calling an application programming interface (API) designated according to the type of the multimedia content;
    상기 API를 통해 상기 멀티미디어 컨텐츠를 인코딩 또는 디코딩하여 출력 데이터를 생성하는 단계 및Generating output data by encoding or decoding the multimedia content through the API; and
    상기 출력 데이터를 상기 어플리케이션으로 전송하는 단계를 포함하는 멀티미디어 컨텐츠 처리 방법.And transmitting the output data to the application.
  7. 제6 항에 있어서,The method of claim 6,
    상기 멀티미디어 컨텐츠의 유형을 식별하는 단계는Identifying the type of multimedia content
    상기 멀티미디어 컨텐츠로부터 하나 이상의 지정된 파싱 방법 중 어느 하나에 따라 유형 확인 정보를 추출하는 단계 및Extracting type identification information from the multimedia content according to any one or more designated parsing methods;
    상기 유형 확인 정보가 지정된 유형 식별 정보 중 어느 하나와 동일한지 판단하는 단계를 포함하는 멀티미디어 컨텐츠 처리 방법.And determining whether the type identification information is the same as any of the specified type identification information.
  8. 제7 항에 있어서,The method of claim 7, wherein
    상기 멀티미디어 컨텐츠의 유형에 따라 지정된 API를 호출하는 단계는Calling the specified API according to the type of the multimedia content
    상기 유형 확인 정보와 상기 유형 식별 정보 중 어느 하나가 동일한 경우, 상기 유형 확인 정보와 동일한 상기 유형 식별 정보에 상응하는 API를 호출하는 단계인 것을 특징으로 하는 멀티미디어 컨텐츠 처리 방법.And if one of the type identification information and the type identification information is the same, calling an API corresponding to the same type identification information as the type identification information.
  9. 제7 항에 있어서,The method of claim 7, wherein
    상기 멀티미디어 컨텐츠의 유형을 식별하는 단계는Identifying the type of multimedia content
    상기 유형 확인 정보와 동일한 상기 유형 식별 정보가 존재하지 않는 경우, 하나 이상의 지정된 파싱 방법 중 이전 수행한 상기 파싱 방법 이외의 파싱 방법을 재선정하는 단계를 더 포함하되,Re-selecting a parsing method other than the parsing method previously performed, among the one or more designated parsing methods, when the same type identification information as the type identification information does not exist;
    상기 파싱 방법을 재선정하는 단계 이후, 상기 유형 확인 정보를 추출하는 단계부터의 과정을 다시 수행되는 것을 특징으로 하는 멀티미디어 컨텐츠 처리 방법.And after the reselecting of the parsing method, the process from the step of extracting the type identification information is performed again.
  10. 제7 항에 있어서,The method of claim 7, wherein
    상기 유형 확인 정보와 동일한 상기 유형 식별 정보가 컨테이너 비트스트림(Container Bitstream)을 나타내는경우, 상기 멀티미디어 컨텐츠로부터 하나 이상의 요소 비트스트림을 추출하는 단계를 더 포함하되,If the type identification information identical to the type identification information indicates a container bitstream, extracting one or more element bitstreams from the multimedia content;
    상기 요소 비트스트림을 추출하는단계 이후 각 상기 요소 비트스트림에 대해 상기 유형확인 정보를 추출하는 단계 내지 상기 출력 데이터를 상기 어플리케이션으로 전송하는 단계가 수행되는 것을 특징으로 하는 멀티미디어 컨텐츠 처리 방법.Extracting the type identification information for each of the element bitstreams and transmitting the output data to the application after extracting the element bitstream.
PCT/KR2010/007324 2009-10-23 2010-10-25 Multimedia content processing method and apparatus WO2011049413A2 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR10-2009-0101447 2009-10-23
KR20090101447 2009-10-23

Publications (2)

Publication Number Publication Date
WO2011049413A2 true WO2011049413A2 (en) 2011-04-28
WO2011049413A3 WO2011049413A3 (en) 2011-10-27

Family

ID=43900857

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2010/007324 WO2011049413A2 (en) 2009-10-23 2010-10-25 Multimedia content processing method and apparatus

Country Status (2)

Country Link
KR (1) KR101182851B1 (en)
WO (1) WO2011049413A2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101260185B1 (en) * 2011-09-22 2013-05-06 주식회사 엘지씨엔에스 Smart settop box and operating method for providing smart service and digital television service using default media player included in single operating systme

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020007357A1 (en) * 1997-10-27 2002-01-17 Sun Microsystems, Inc. Method and apparatus for providing plug-in media decoders
KR20040053783A (en) * 2003-11-27 2004-06-24 웨이비사운드(주) Apparatus and method for playing multimedia file
KR20040082512A (en) * 2003-03-19 2004-09-30 주식회사 케이티프리텔 System and method of download form multimedia service in mobile communication network
KR20050041603A (en) * 2003-10-31 2005-05-04 박병강 Method for producing oudio contents having video data and system for decoding the same
US6934694B2 (en) * 2001-06-21 2005-08-23 Kevin Wade Jamieson Collection content classifier

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020007357A1 (en) * 1997-10-27 2002-01-17 Sun Microsystems, Inc. Method and apparatus for providing plug-in media decoders
US6934694B2 (en) * 2001-06-21 2005-08-23 Kevin Wade Jamieson Collection content classifier
KR20040082512A (en) * 2003-03-19 2004-09-30 주식회사 케이티프리텔 System and method of download form multimedia service in mobile communication network
KR20050041603A (en) * 2003-10-31 2005-05-04 박병강 Method for producing oudio contents having video data and system for decoding the same
KR20040053783A (en) * 2003-11-27 2004-06-24 웨이비사운드(주) Apparatus and method for playing multimedia file

Also Published As

Publication number Publication date
WO2011049413A3 (en) 2011-10-27
KR20110044726A (en) 2011-04-29
KR101182851B1 (en) 2012-09-14

Similar Documents

Publication Publication Date Title
CN101416519B (en) Methods and apparatus for use in a multi-view video coding system
US9036930B2 (en) Image signal decoding apparatus and image signal decoding method
WO2011034380A2 (en) Method and apparatus for encoding and decoding image based on skip mode
EP2204044B1 (en) Multimedia coding and decoding with additional information capability
CN102244783B (en) Method and system for data processing
KR20180058765A (en) Signaling of high dynamic range and wide color gamut content in transport streams
US10979784B1 (en) Track format for carriage of event messages
MX2022011424A (en) Use of subpicture information in video coding.
US11245899B2 (en) Method and system for single loop multilayer coding with subpicture partitioning
CN101800892B (en) Method and device for identifying multimedia code stream
CN101268697B (en) Encoder and decoder
KR20090006014A (en) Method and apparatus for signaling and decoding avs1-p2 bitstreams of different versions
WO2011049413A2 (en) Multimedia content processing method and apparatus
WO2014084613A9 (en) Method for encoding and decoding image using depth information, and device and image system using same
US9083972B2 (en) Encoder and decoder
WO2011087216A2 (en) Method and apparatus for processing multimedia contents
US20110116554A1 (en) Method and apparatus for encoding and decoding
TW202131682A (en) Video coding in relation to subpictures
US8462855B2 (en) Method and apparatus for stream parsing and picture location
US20100278273A1 (en) Device and method for encoding/decoding video data
CN109246434B (en) Video encoding method, video decoding method and electronic equipment
WO2021137633A2 (en) Drm content parallel packaging device, drm content parallel packaging system comprising same, and drm content parallel packaging method
US20230224557A1 (en) Auxiliary mpds for mpeg dash to support prerolls, midrolls and endrolls with stacking properties
WO2015167311A1 (en) Video processing device and method
WO2011078470A2 (en) Apparatus and method for producing/regenerating contents including mpeg-2 transport streams using screen description

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 10825238

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 10825238

Country of ref document: EP

Kind code of ref document: A2