KR20230128749A - Method for providing user interface for producing commerce video and apparatus for using the same - Google Patents

Method for providing user interface for producing commerce video and apparatus for using the same Download PDF

Info

Publication number
KR20230128749A
KR20230128749A KR1020220026017A KR20220026017A KR20230128749A KR 20230128749 A KR20230128749 A KR 20230128749A KR 1020220026017 A KR1020220026017 A KR 1020220026017A KR 20220026017 A KR20220026017 A KR 20220026017A KR 20230128749 A KR20230128749 A KR 20230128749A
Authority
KR
South Korea
Prior art keywords
video
commerce
image
tags
providing
Prior art date
Application number
KR1020220026017A
Other languages
Korean (ko)
Inventor
임상훈
Original Assignee
주식회사 컨비니
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 컨비니 filed Critical 주식회사 컨비니
Priority to KR1020220026017A priority Critical patent/KR20230128749A/en
Publication of KR20230128749A publication Critical patent/KR20230128749A/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/117Tagging; Marking up; Designating a block; Setting of attributes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/85Assembly of content; Generation of multimedia applications
    • H04N21/854Content authoring

Abstract

본 발명은, 커머스 영상을 제작하기 위한 사용자 인터페이스 제공 방법으로서, 상품과 관련된 영상 및 상기 영상과 동기화된 지문에 대응되는 복수의 태그를 획득하는 단계, 상기 복수의 태그 중 어느 하나의 태그를 선택 가능한 영역 및 선택된 태그에 의해 구분되는 분할 영상을 배치하는 영역이 포함된 영상 편집 인터페이스를 제공하는 단계 및 상기 복수의 태그 중 사용자에 의해 선택된 태그를 기준으로 분할 영상을 조합하여 상기 상품에 대한 복수의 커머스 영상을 생성하는 단계를 포함하도록 구성된다. The present invention is a method of providing a user interface for producing a commerce video, comprising the steps of acquiring a plurality of tags corresponding to a video related to a product and a fingerprint synchronized with the video, and selecting any one of the plurality of tags. Providing an image editing interface including a region for arranging divided images divided by regions and selected tags, and combining the divided images based on a tag selected by a user from among the plurality of tags to provide a plurality of commerce services for the product. It is configured to include the step of generating an image.

Description

커머스 영상을 제작하기 위한 사용자 인터페이스 제공 방법 및 이를 이용하는 장치{METHOD FOR PROVIDING USER INTERFACE FOR PRODUCING COMMERCE VIDEO AND APPARATUS FOR USING THE SAME}Method for providing user interface for producing commerce video and device using the same

본 발명은 커머스 영상을 제작하기 위한 사용자 인터페이스 제공 방법 및 이를 이용하는 장치에 관한 것이다. The present invention relates to a method for providing a user interface for producing a commerce video and an apparatus using the same.

SNS 플랫폼의 확대에 따라, TV가 아닌 온라인 환경이 새로운 마케팅 공간으로 크게 주목받으면서, 커머스 영상의 적절한 길이에 대한 논의가 이루어지고 있다. 커머스 영상은 텍스트와 그림으로 이루어진 배너 광고와는 다르게 시간 개념이 들어가기 때문에, 커머스 영상은 사용자들이 커머스 영상을 끝까지 감상할 수 있도록 수 분 이내로 제작되고 있다. With the expansion of SNS platforms, the online environment, rather than TV, is attracting great attention as a new marketing space, and discussions are being made about the appropriate length of commerce videos. Unlike banner advertisements, which consist of text and pictures, commerce videos contain the concept of time, so commerce videos are produced within a few minutes so that users can watch them to the end.

이러한 커머스 영상은 기획, 촬영 및 편집에 이르는 모든 과정이 서로 다른 전문가들의 협업으로 생성되는데, 여러 상품을 판매하는 사업자의 경우, 모든 상품에 대한 커머스 영상을 생성하기 위해 많은 시간과 비용이 소모되는 문제가 있다. These commerce videos are created through the collaboration of different experts in all processes from planning, filming, and editing. In the case of businesses selling multiple products, a lot of time and money are consumed to create commerce videos for all products. there is

또한, SNS 플랫폼에 배포되는 짧은 시간 단위의 커머스 영상은 즉각적인 사용자 호응도를 얻을 수 있는데, 만약 커머스 영상에 대한 사용자 호응도가 기대에 미치지 못할 경우, 새로운 커머스 영상을 즉각 생성하기에 한계가 있다. In addition, a short-time commerce video distributed on an SNS platform can obtain an immediate user response, but if the user's response to the commerce video does not meet expectations, there is a limit to immediately creating a new commerce video.

발명의 배경이 되는 기술은 본 발명에 대한 이해를 보다 용이하게 하기 위해 작성되었다. 발명의 배경이 되는 기술에 기재된 사항들이 선행기술로 존재한다고 인정하는 것으로 이해되어서는 안 된다.The background description of the invention has been prepared to facilitate understanding of the present invention. It should not be construed as an admission that matters described in the background art of the invention exist as prior art.

이에, 상품과 관련된 하나의 촬영 영상을 이용하여 다양한 스토리를 가지는 커머스 영상을 생성할 수 있는 방법이 요구된다. Accordingly, there is a need for a method capable of generating commerce images having various stories using one captured image related to a product.

그 결과, 본 발명의 발명자들은 영상에 매칭된 복수의 태그를 이용하여 하나의 영상을 다양한 구성으로 조합할 수 있는 방법 및 이를 수행할 수 있는 장치를 개발하고자 하였다. As a result, the inventors of the present invention tried to develop a method and a device capable of combining one image in various configurations using a plurality of tags matched to the image.

특히, 본 발명의 발명자들은 영상과 동기화된 지문에서 태그 가능한 단어 또는 문구를 추출함으로써, 영상과 관련된 태그를 자동으로 매칭할 수 있도록 방법 및 장치를 구성하였다. In particular, the inventors of the present invention configured a method and apparatus to automatically match a tag related to an image by extracting taggable words or phrases from a fingerprint synchronized with the image.

본 발명의 과제들은 이상에서 언급한 과제들로 제한되지 않으며, 언급되지 않은 또 다른 과제들은 아래의 기재로부터 당업자에게 명확하게 이해될 수 있을 것이다.The tasks of the present invention are not limited to the tasks mentioned above, and other tasks not mentioned will be clearly understood by those skilled in the art from the following description.

전술한 바와 같은 과제를 해결하기 위하여 본 발명의 일 실시예에 따른 문제 채점을 위한 사용자 인터페이스 제공 방법이 제공된다. 상기 방법은, 객관식 또는 주관식 문제 및 상기 문제에 대한 답안이 포함된 이미지를 획득하는 단계, 상기 문제가 포함된 문제집을 결정하는 단계, 상기 문제집을 기초로 상기 이미지에서 한 쌍의 문제 및 답안에 해당하는 영역을 구분하는 단계 및 구분된 영역 별로 상기 객관식 문제에 대한 답안 채점 결과 또는 상기 주관식 문제에 대한 답안 체크 항목을 포함하는 채점 인터페이스를 제공하는 단계를 포함하도록 구성된다. In order to solve the above problems, a method for providing a user interface for problem scoring according to an embodiment of the present invention is provided. The method includes acquiring an image including multiple choice or short-answer questions and an answer to the problem, determining a problem book including the problem, and corresponding to a pair of problems and answers in the image based on the problem book and providing a scoring interface including an answer scoring result for the multiple-choice question or an answer check item for the subjective question for each divided area.

본 발명의 특징에 따르면, 상기 복수의 커머스 영상을 생성하는 단계는, 상기 사용자에 의해 선택된 태그의 순서를 변경하여, 동일한 태그를 기초로 하는 복수의 커머스 영상을 생성하는 단계일 수 있다. According to a feature of the present invention, the generating of the plurality of commerce videos may include generating a plurality of commerce videos based on the same tag by changing the order of tags selected by the user.

본 발명의 다른 특징에 따르면, 상기 커머스 영상은, 상기 분할 영상과 동기화된 분할 지문을 포함하도록 구성될 수 있다.According to another feature of the present invention, the commerce image may be configured to include a split fingerprint synchronized with the split image.

본 발명의 또 다른 특징에 따르면, 상기 영상 편집 인터페이스를 제공하는 단계는, 상기 사용자에 의해 선택된 태그의 종류에 따라 상기 상품과 관련된 추가 영상을 획득하는 단계를 더 포함하고, 상기 영상 편집 인터페이스는, 상기 분할 영상이 배치되는 제1 영상 레이어와 상기 상품과 관련된 추가 영상이 배치되는 제2 영상 레이어가 인접 배치되도록 구성될 수 있다. According to another feature of the present invention, the providing of the video editing interface further includes obtaining an additional video related to the product according to a type of tag selected by the user, and the video editing interface includes: A first image layer on which the divided image is disposed and a second image layer on which an additional image related to the product is disposed may be disposed adjacent to each other.

본 발명의 또 다른 특징에 따르면, 상기 영상 편집 인터페이스를 제공하는 단계는, 상기 제1 영상 레이어 또는 상기 제2 영상 레이어 중 상기 커머스 영상에 삽입될 영상 레이어를 선택받는 단계를 더 포함할 수 있다. According to another feature of the present invention, the providing of the video editing interface may further include receiving a selection of an video layer to be inserted into the commerce video from among the first video layer and the second video layer.

본 발명의 또 다른 특징에 따르면, 상기 영상 편집 인터페이스는, 상기 제1 영상 레이어 또는 상기 제2 영상 레이어 상에 상기 상품의 유형 별 가이드 정보를 더 포함하도록 구성될 수 있다. According to another feature of the present invention, the video editing interface may be configured to further include guide information for each product type on the first video layer or the second video layer.

본 발명의 또 다른 특징에 따르면, 상기 가이드 정보는, 상기 커머스 영상의 타임라인에 표시되며, 상기 영상 편집 인터페이스를 제공하는 단계는, 상기 타임라인의 일 지점을 선택함에 따라, 상기 상품과 관련된 이미지 또는 영상을 제공하는 단계를 더 포함할 수 있다. According to another feature of the present invention, the guide information is displayed on the timeline of the commerce video, and the providing of the video editing interface includes an image related to the product as a point of the timeline is selected. Alternatively, the method may further include providing an image.

본 발명의 또 다른 특징에 따르면, 상기 복수의 태그를 획득하는 단계는, 상기 지문을 구성하는 문장 단위 또는 단어 단위의 텍스트를 기초로 상기 영상의 타임라인에 결합 가능한 태그를 결정하는 단계를 더 포함할 수 있다. According to another feature of the present invention, the acquiring of the plurality of tags further includes determining tags that can be combined with the timeline of the image based on text in sentence units or word units constituting the fingerprint. can do.

본 발명의 또 다른 특징에 따르면, 상기 복수의 태그를 획득하는 단계 이후에, 기 저장된 태그 그룹 별 매출 데이터를 토대로 상기 복수의 태그 중 커머스 영상을 생성 가능한 태그를 조합하여 제공하는 단계를 더 포함할 수 있다. According to another feature of the present invention, after the step of acquiring the plurality of tags, the step of combining and providing a tag capable of generating a commerce image among the plurality of tags based on pre-stored sales data for each tag group may be further included. can

본 발명의 또 다른 특징에 따르면, 상기 영상 편집 인터페이스는, 상기 복수의 태그 또는 상기 분할 영상의 길이에 따라 필터링된 분할 영상 목록을 제공하도록 구성된 영역을 포함할 수 있다. According to another feature of the present invention, the video editing interface may include an area configured to provide a list of divided images filtered according to the lengths of the plurality of tags or the divided images.

본 발명의 또 다른 특징에 따르면, 상기 영상 편집 인터페이스를 제공하는 단계는, 상기 분할 지문의 키워드에 대응되는 오디오 데이터를 검출하는 단계와 검출된 오디오 데이터의 적어도 일부를 텍스트 데이터로 변환하고, 변환된 텍스트 데이터를 상기 분할 영상에 배치하는 단계를 더 포함할 수 있다. According to another feature of the present invention, the providing of the video editing interface includes the steps of detecting audio data corresponding to the keywords of the divided fingerprint, converting at least a part of the detected audio data into text data, and converting the converted audio data into text data. The method may further include arranging text data on the divided image.

전술한 바와 같은 과제를 해결하기 위하여 본 발명의 다른 실시예에 따른 커머스 영상 제작 장치가 제공된다. 상기 장치는, 통신 인터페이스, 메모리, 상기 통신 인터페이스, 상기 메모리와 동작 가능하게 연결된 프로세서를 포함하고, 상기 프로세서는, 상품과 관련된 영상 및 상기 영상과 동기화된 지문에 대응되는 복수의 태그를 획득하고, 상기 복수의 태그 중 어느 하나의 태그를 선택 가능한 영역 및 선택된 태그에 의해 구분되는 분할 영상을 배치하는 영역이 포함된 영상 편집 인터페이스를 제공하고, 상기 복수의 태그 중 사용자에 의해 선택된 태그를 기준으로 분할 영상을 조합하여 상기 상품에 대한 복수의 커머스 영상을 생성하도록 구성된다. In order to solve the above problems, a commerce video production device according to another embodiment of the present invention is provided. The device includes a communication interface, a memory, and a processor operatively connected to the communication interface and the memory, wherein the processor obtains an image associated with a product and a plurality of tags corresponding to a fingerprint synchronized with the image; An image editing interface including an area where any one of the plurality of tags can be selected and an area in which a divided video divided by the selected tag is arranged is provided, and the video is divided based on a tag selected by a user from among the plurality of tags. It is configured to generate a plurality of commerce images for the product by combining the images.

기타 실시예의 구체적인 사항들은 상세한 설명 및 도면들에 포함되어 있다.Other embodiment specifics are included in the detailed description and drawings.

본 발명은 하나의 촬영 영상에서 다양한 스토리 구성으로 조합된 복수 개의 커머스 영상을 생성할 수 있다. 특히, 본 발명은 영상에 매칭 가능한 태그 조합과 태그 조합 따른 사용자 호응도를 토대로 상품 홍보에 적합한 커머스 영상을 생성할 수 있다. In the present invention, a plurality of commerce images combined in various story configurations can be generated from one captured image. In particular, according to the present invention, a commerce video suitable for product promotion can be generated based on a tag combination that can be matched with an image and a user's response according to the tag combination.

또한, 본 발명은 영상과 동기화된 지문을 이용하여 커머스 영상에 삽입될 문구를 자동 배치할 수 있을 뿐만 아니라, 커머스 영상에 삽입될 적절한 오디오 데이터를 제공할 수 있다. In addition, according to the present invention, phrases to be inserted into a commerce image can be automatically arranged using a fingerprint synchronized with the image, and appropriate audio data to be inserted into the commerce image can be provided.

또한, 본 발명은 커머스 영상에 필요한 각종 요소(태그, 영상 자막, 영상 오디오) 등이 미리 지정되어 있거나, 영상과 동기화된 지문을 토대로 제공될 수 있어, 새로운 영상을 제작하기 위해 필요한 시간 및 비용을 최소화할 수 있다. 일 예로, 본 발명은 영상과 동기화된 지문에서 태그 가능한 단어 또는 문구를 추출하여, 영상과 관련된 수 많은 태그를 자동으로 매칭할 수 있다. In addition, in the present invention, various elements (tags, video subtitles, video audio) necessary for commerce video can be pre-specified or provided based on a fingerprint synchronized with the video, thereby reducing the time and cost required to produce a new video. can be minimized. For example, the present invention extracts taggable words or phrases from a fingerprint synchronized with an image, and automatically matches numerous tags related to the image.

본 발명에 따른 효과는 이상에서 예시된 내용에 의해 제한되지 않으며, 더욱 다양한 효과들이 본 발명 내에 포함되어 있다.Effects according to the present invention are not limited by the contents exemplified above, and more various effects are included in the present invention.

도 1은 본 발명의 일 실시예에 따른 커머스 영상 제작 방법의 개요를 설명하기 위한 개략도이다.
도 2는 본 발명의 일 실시예에 따른 커머스 영상 제작 장치의 구성을 나타낸 블록도이다.
도 3은 본 발명의 일 실시예에 따른 커머스 영상을 제작하기 위한 사용자 인터페이스 제공 방법에 대한 순서도이다.
도 4 및 도 5는 본 발명의 일 실시예에 따른 커머스 영상을 생성할 수 있는 사용자 인터페이스 화면을 설명하기 위한 개략도이다.
도 6은 도 3에 도시된 S120 단계를 구체화한 순서도이다.
도 7은 본 발명의 일 실시예에 따른 커머스 영상 제작 방법을 통해 생성된 커머스 영상을 예시적으로 나타낸 개략도이다.
1 is a schematic diagram for explaining the outline of a commerce video production method according to an embodiment of the present invention.
2 is a block diagram showing the configuration of a commerce video production device according to an embodiment of the present invention.
3 is a flowchart of a user interface providing method for producing a commerce video according to an embodiment of the present invention.
4 and 5 are schematic views illustrating a user interface screen capable of generating a commerce video according to an embodiment of the present invention.
6 is a flowchart embodying step S120 shown in FIG. 3 .
7 is a schematic diagram exemplarily illustrating a commerce video generated through a method for producing a commerce video according to an embodiment of the present invention.

본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나, 본 발명은 이하에서 개시되는 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 것이며, 단지 본 실시예들은 본 발명의 개시가 완전하도록 하며, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다. 도면의 설명과 관련하여, 유사한 구성요소에 대해서는 유사한 참조부호가 사용될 수 있다.Advantages and features of the present invention, and methods of achieving them, will become clear with reference to the detailed description of the following embodiments taken in conjunction with the accompanying drawings. However, the present invention is not limited to the embodiments disclosed below and will be implemented in various forms different from each other, only these embodiments make the disclosure of the present invention complete, and common knowledge in the art to which the present invention pertains. It is provided to completely inform the person who has the scope of the invention, and the present invention is only defined by the scope of the claims. In connection with the description of the drawings, like reference numerals may be used for like elements.

본 문서에서, "가진다," "가질 수 있다," "포함한다," 또는 "포함할 수 있다" 등의 표현은 해당 특징(예: 수치, 기능, 동작, 또는 부품 등의 구성요소)의 존재를 가리키며, 추가적인 특징의 존재를 배제하지 않는다.In this document, expressions such as "has," "may have," "includes," or "may include" indicate the existence of a corresponding feature (eg, numerical value, function, operation, or component such as a part). , which does not preclude the existence of additional features.

본 문서에서, "A 또는 B," "A 또는/및 B 중 적어도 하나," 또는 "A 또는/및 B 중 하나 또는 그 이상" 등의 표현은 함께 나열된 항목들의 모든 가능한 조합을 포함할 수 있다. 예를 들면, "A 또는 B," "A 및 B 중 적어도 하나," 또는 "A 또는 B 중 적어도 하나"는, (1) 적어도 하나의 A를 포함, (2) 적어도 하나의 B를 포함, 또는(3) 적어도 하나의 A 및 적어도 하나의 B 모두를 포함하는 경우를 모두 지칭할 수 있다.In this document, expressions such as “A or B,” “at least one of A and/and B,” or “one or more of A or/and B” may include all possible combinations of the items listed together. . For example, “A or B,” “at least one of A and B,” or “at least one of A or B” (1) includes at least one A, (2) includes at least one B, Or (3) may refer to all cases including at least one A and at least one B.

본 문서에서 사용된 "제1," "제2," "첫째," 또는 "둘째," 등의 표현들은 다양한 구성요소들을, 순서 및/또는 중요도에 상관없이 수식할 수 있고, 한 구성요소를 다른 구성요소와 구분하기 위해 사용될 뿐 해당 구성요소들을 한정하지 않는다. 예를 들면, 제1 사용자 기기와 제2 사용자 기기는, 순서 또는 중요도와 무관하게, 서로 다른 사용자 기기를 나타낼 수 있다. 예를 들면, 본 문서에 기재된 권리범위를 벗어나지 않으면서 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 바꾸어 명명될 수 있다.Expressions such as “first,” “second,” “first,” or “second,” used in this document may modify various elements, regardless of order and/or importance, and refer to one element as It is used only to distinguish it from other components and does not limit the corresponding components. For example, a first user device and a second user device may represent different user devices regardless of order or importance. For example, without departing from the scope of rights described in this document, a first element may be named a second element, and similarly, the second element may also be renamed to the first element.

어떤 구성요소(예: 제1 구성요소)가 다른 구성요소(예: 제2 구성요소)에 "(기능적으로 또는 통신적으로) 연결되어((operatively or communicatively) coupled with/to)" 있다거나 "접속되어(connected to)" 있다고 언급된 때에는, 상기 어떤 구성요소가 상기 다른 구성요소에 직접적으로 연결되거나, 다른 구성요소(예: 제3 구성요소)를 통하여 연결될 수 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소(예: 제1 구성요소)가 다른 구성요소(예: 제2 구성요소)에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 상기 어떤 구성요소와 상기 다른 구성요소 사이에 다른 구성요소(예: 제3 구성요소)가 존재하지 않는 것으로 이해될 수 있다.A component (e.g., a first component) is "(operatively or communicatively) coupled with/to" another component (e.g., a second component); When referred to as "connected to", it should be understood that the certain component may be directly connected to the other component or connected through another component (eg, a third component). On the other hand, when an element (eg, a first element) is referred to as being “directly connected” or “directly connected” to another element (eg, a second element), the element and the above It may be understood that other components (eg, third components) do not exist between the other components.

본 문서에서 사용된 표현 "~하도록 구성된(또는 설정된)(configured to)"은 상황에 따라, 예를 들면, "~에 적합한(suitable for)," "~하는 능력을 가지는(having the capacity to)," "~하도록 설계된(designed to)," "~하도록 변경된(adapted to)," "~하도록 만들어진(made to)," 또는 "~ 를 할 수 있는(capable of)"과 바꾸어 사용될 수 있다. 용어 "~하도록 구성된(또는 설정된)"은 하드웨어적으로 "특별히 설계된(specifically designed to)" 것만을 반드시 의미하지 않을 수 있다. 대신, 어떤 상황에서는, "~하도록 구성된 장치"라는 표현은, 그 장치가 다른 장치 또는 부품들과 함께 "~할 수 있는" 것을 의미할 수 있다. 예를 들면, 문구 "A, B, 및 C를 수행하도록 구성된(또는 설정된)프로세서"는 해당 동작을 수행하기 위한 전용 프로세서(예: 임베디드 프로세서), 또는 메모리 장치에 저장된 하나 이상의 소프트웨어 프로그램들을 실행함으로써, 해당 동작들을 수행할 수 있는 범용 프로세서(generic-purpose processor)(예: CPU 또는 application processor)를 의미할 수 있다.As used in this document, the expression "configured to" means "suitable for," "having the capacity to," depending on the circumstances. ," "designed to," "adapted to," "made to," or "capable of." The term "configured (or set) to" may not necessarily mean only "specifically designed to" hardware. Instead, in some contexts, the phrase "device configured to" may mean that the device is "capable of" in conjunction with other devices or components. For example, the phrase "a processor configured (or configured) to perform A, B, and C" may include a dedicated processor (e.g., embedded processor) to perform those operations, or by executing one or more software programs stored in a memory device. , may mean a general-purpose processor (eg, CPU or application processor) capable of performing corresponding operations.

본 문서에서 사용된 용어들은 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 다른 실시예의 범위를 한정하려는 의도가 아닐 수 있다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함할 수 있다. 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 용어들은 본 문서에 기재된 기술분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가질 수 있다. 본 문서에 사용된 용어들 중 일반적인 사전에 정의된 용어들은, 관련 기술의 문맥상 가지는 의미와 동일 또는 유사한 의미로 해석될 수 있으며, 본 문서에서 명백하게 정의되지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다. 경우에 따라서, 본 문서에서 정의된 용어일지라도 본 문서의 실시예들을 배제하도록 해석될 수 없다.Terms used in this document are only used to describe a specific embodiment, and may not be intended to limit the scope of other embodiments. Singular expressions may include plural expressions unless the context clearly dictates otherwise. Terms used herein, including technical or scientific terms, may have the same meaning as commonly understood by a person of ordinary skill in the art described in this document. Among the terms used in this document, terms defined in a general dictionary may be interpreted as having the same or similar meaning as the meaning in the context of the related art, and unless explicitly defined in this document, an ideal or excessively formal meaning. not be interpreted as In some cases, even terms defined in this document cannot be interpreted to exclude the embodiments of this document.

본 발명의 여러 실시예들의 각각 특징들이 부분적으로 또는 전체적으로 서로 결합 또는 조합 가능하며, 당업자가 충분히 이해할 수 있듯이 기술적으로 다양한 연동 및 구동이 가능하며, 각 실시예들이 서로에 대하여 독립적으로 실시 가능할 수도 있고 연관 관계로 함께 실시 가능할 수도 있다.Each feature of the various embodiments of the present invention can be partially or entirely combined or combined with each other, and as those skilled in the art can fully understand, various interlocking and driving operations are possible, and each embodiment can be implemented independently of each other. It may be possible to implement together in an association relationship.

본 명세서의 해석의 명확함을 위해, 이하에서는 본 명세서에서 사용되는 용어들을 정의하기로 한다.For clarity of interpretation of this specification, terms used in this specification will be defined below.

도 1은 본 발명의 일 실시예에 따른 커머스 영상 제작 방법의 개요를 설명하기 위한 개략도이다.1 is a schematic diagram for explaining the outline of a commerce video production method according to an embodiment of the present invention.

도 1을 참조하면, 본 발명의 일 실시예에 따른 커머스 영상 제작 방법은 상품을 판매하는 판매자의 인터뷰 영상과 인터뷰 대본(지문)을 이용하여 복수의 커머스 영상을 생성할 수 있다. Referring to FIG. 1 , the method for producing a commerce video according to an embodiment of the present invention may generate a plurality of commerce videos using an interview video of a seller selling a product and an interview script (fingerprint).

본 발명에서 커머스 영상을 제작하기 위해 사용되는 영상은 질문과 대답으로 구성되며, 질문을 받는 사람(판매자)만이 촬영된 영상일 수 있다. 예를 들어, 영상 속에서 질문은 오디오 또는 텍스트로 제공되고, 이에 대한 답변은 비디오 및 텍스트로 제공될 수 있다. In the present invention, the video used to produce the commerce video consists of questions and answers, and may be a video in which only the person (the seller) who receives the question is filmed. For example, in a video, a question may be provided as audio or text, and an answer may be provided as video or text.

다만, 이 외에도, 커머스 영상을 제작하기 위해 사용되는 영상은 질문을 하는 사람(영상 제작자)과 질문을 받는 사람(판매자) 모두가 촬영된 영상일 수도 있으며, 지정된 지문에 따라 판매자가 제품을 두고 소개하는 영상일 수도 있다. However, in addition to this, the video used to produce the commerce video may be a video of both the person asking the question (video producer) and the person receiving the question (seller), and the seller introduces the product according to the designated fingerprint. It may be a video of

아울러, 인터뷰 대본(지문)은 인터뷰 영상에 포함된 판매자의 답변과 대응되며, 인터뷰 영상의 타임라인과 매칭되어 저장될 수 있다. In addition, the interview script (fingerprint) corresponds to the seller's answers included in the interview video, and may be matched with the timeline of the interview video and stored.

커머스 영상 제작 장치(100)는 인터뷰 영상, 대본(지문) 및 태그 더미를 획득할 수 있으며, 이를 토대로 커머스 영상을 생성할 수 있다. 여기서, 태그 더미는 판매자의 대답에서 커머스 영상을 제작하기 위해 사용되는 스토리 키워드인 것으로 이해될 수 있다. 예를 들어, 태그 더미는 시작, 역사, 노하우, 실패, 성공, 기업 철학, 원산지, 평양 냉면, 갈비 등과 같은 단어로 구성되거나, 롱런비결, 함께가는것과 같은 둘 이상의 단어가 모인 구로 구성될 수 있다. The commerce video production device 100 may obtain an interview video, a script (fingerprint), and a pile of tags, and may generate a commerce video based on them. Here, the tag dummy may be understood as a story keyword used to create a commerce video in the seller's answer. For example, a pile of tags may consist of words such as start, history, know-how, failure, success, corporate philosophy, country of origin, Pyongyang naengmyeon, galbi, etc., or a phrase of two or more words such as long run secret, going together. .

커머스 영상 제작 장치(100)는 태그 더미에서 적어도 둘 이상의 태그를 커머스 영상 제작용으로 선택할 수 있으며, 선택된 태그에 매칭되는 분할 영상을 조합하여 하나의 복수의 커머스 영상을 생성할 수 있다. 여기서, 분할 영상이란 전체 인터뷰 영상 중 선택된 태그가 매칭되어 있는 일부 구간의 영상을 의미한다. 예를 들어, 태그 더미 중 A, B, C 태그를 선택한다면, 커머스 영상 제작 장치(100)는 인터뷰 영상 중 A 태그와 대응되는 제n 분할 영상(21분 30초~21분 45초), B 태그와 대응되는 제m 구간 분할 영상(7분 28초~7분 38초), C 태그와 대응되는 제l 분할 영상(33분 3초~33분 40초)을 서로 다른 순서로 조합하여 총 6개의 커머스 영상을 생성할 수 있다. 이 때, 분할 영상은 짧게는 5초 길게는 15초로 구성되며, 6개의 커머스 영상은 각각 (①(②③④⑤⑥순서로 조합된 커머스 영상일 수 있다. The commerce video production device 100 may select at least two or more tags from the tag pile for commerce video production, and may generate a plurality of commerce videos by combining split images matching the selected tags. Here, the split video means an image of a part of the entire interview video in which the selected tag is matched. For example, if tags A, B, and C are selected from the pile of tags, the commerce video production device 100 selects the n-th split video (21 minutes 30 seconds to 21 minutes 45 seconds) corresponding to the A tag in the interview video, B A total of 6 videos are obtained by combining the mth division video corresponding to the tag (7 minutes 28 seconds to 7 minutes 38 seconds) and the 1th division video corresponding to the C tag (33 minutes 3 seconds to 33 minutes 40 seconds) in different order. Two commerce videos can be created. At this time, the split video is composed of 5 seconds at the shortest and 15 seconds at the longest, and the six commerce images may be commerce images combined in the order of (①(②③④⑤⑥).

커머스 영상 제작 장치(100)는 사용자가 태그를 선택하고, 필요에 따라 영상을 재배치할 수 있는 인터페이스가 실행되는 디바이스로, PC, 태블릿 PC, 스마트 폰 등의 전자 장치를 포함할 수 있다. 커머스 영상 제작 장치(100)는 커머스 영상 생성을 위한 어플리케이션이 설치되어 실행되거나, 커머스 영상 제작 서버(미도시)가 제공하는 웹 페이지에 접속할 수 있으며, 어플리케이션 또는 웹 페이지를 통해 인터뷰 영상을 기초로 하는 커머스 영상을 생성할 수 있다. The commerce video production apparatus 100 is a device on which an interface through which a user selects a tag and rearranges an image as needed is executed, and may include an electronic device such as a PC, tablet PC, and smart phone. The commerce video production device 100 may have an application for generating a commerce video installed and executed, or may access a web page provided by a commerce video production server (not shown), and through the application or web page, based on the interview video You can create a commerce video.

이와 같이, 커머스 영상 제작 장치(100)는 인터뷰 영상에 태깅된 다양한 태그들을 조합하여 복수의 커머스 영상을 생성할 수 있으며, 사용자는 직관적인 스토리 키워드(태그)를 이용하여 원하는 의도에 맞게 손쉽게 커머스 영상을 생성할 수 있다. In this way, the commerce video production device 100 can generate a plurality of commerce videos by combining various tags tagged in the interview video, and the user can easily use the intuitive story keywords (tags) to suit the desired intention. can create

도 2는 본 발명의 일 실시예에 따른 커머스 영상 제작 장치의 구성을 나타낸 블록도이다.2 is a block diagram showing the configuration of a commerce video production device according to an embodiment of the present invention.

도 2를 참조하면, 커머스 영상 제작 장치(100)는 메모리 인터페이스(110), 하나 이상의 프로세서(120) 및 주변 인터페이스(130)를 포함할 수 있다. 커머스 영상 제작 장치(100) 내의 다양한 컴포넌트들은 하나 이상의 통신 버스 또는 신호 라인에 의해 연결될 수 있다.Referring to FIG. 2 , the commerce video production device 100 may include a memory interface 110 , one or more processors 120 and a peripheral interface 130 . Various components in the commerce video production device 100 may be connected by one or more communication buses or signal lines.

메모리 인터페이스(110)는 메모리(150)에 연결되어 프로세서(120)로 다양한 데이터를 전할 수 있다. 여기서, 메모리(150)는 플래시 메모리 타입, 하드디스크 타입, 멀티미디어 카드 마이크로 타입, 카드 타입의 메모리(예를 들어 SD 또는 XD 메모리 등), 램, SRAM, 롬, EEPROM, PROM, 네트워크 저장 스토리지, 클라우드, 블록체인 데이터베이스 중 적어도 하나의 타입의 저장매체를 포함할 수 있다.The memory interface 110 may be connected to the memory 150 and transfer various data to the processor 120 . Here, the memory 150 is a flash memory type, a hard disk type, a multimedia card micro type, a card type memory (eg SD or XD memory, etc.), RAM, SRAM, ROM, EEPROM, PROM, network storage storage, cloud , It may include at least one type of storage medium among blockchain databases.

다양한 실시예에서, 메모리(150)는 운영 체제(151), 통신 모듈(152), 그래픽 사용자 인터페이스 모듈(GUI)(153), 센서 처리 모듈(154), 전화 모듈(155) 및 애플리케이션 모듈(156) 중 적어도 하나 이상을 저장할 수 있다. 구체적으로, 운영 체제(151)는 기본 시스템 서비스를 처리하기 위한 명령어 및 하드웨어 작업들을 수행하기 위한 명령어를 포함할 수 있다. 통신 모듈(152)은 다른 하나 이상의 디바이스, 컴퓨터 및 서버 중 적어도 하나와 통신할 수 있다. 그래픽 사용자 인터페이스 모듈(GUI)(153)은 그래픽 사용자 인터페이스를 처리할 수 있다. 센서 처리 모듈(154)은 센서 관련 기능(예를 들어, 하나 이상의 마이크(192)를 통해 수신된 음성 입력을 처리함)을 처리할 수 있다. 전화 모듈(155)은 전화 관련 기능을 처리할 수 있다. 애플리케이션 모듈(156)은 사용자 애플리케이션의 다양한 기능들, 예컨대 전자 메시징, 웹 브라우징, 미디어 처리, 탐색, 이미징, 기타 프로세스 기능을 수행할 수 있다. 아울러, 커머스 영상 제작 장치(100)는 메모리(150)에 어느 한 종류의 서비스와 연관된 하나 이상의 소프트웨어 애플리케이션(156-1, 156-2)(예. 커머스 영상 제작 어플리케이션)을 저장할 수 있다.In various embodiments, memory 150 includes operating system 151 , communication module 152 , graphical user interface module (GUI) 153 , sensor processing module 154 , telephony module 155 , and application module 156 . ) At least one or more of them may be stored. Specifically, the operating system 151 may include instructions for processing basic system services and instructions for performing hardware tasks. The communication module 152 may communicate with at least one of one or more other devices, computers, and servers. A graphical user interface module (GUI) 153 may process a graphical user interface. Sensor processing module 154 may process sensor-related functions (eg, process voice input received through one or more microphones 192 ). The phone module 155 may process phone-related functions. The application module 156 may perform various functions of a user application, such as electronic messaging, web browsing, media processing, navigation, imaging, and other processing functions. In addition, the commerce video production device 100 may store one or more software applications 156 - 1 and 156 - 2 (eg, a commerce video production application) associated with a certain type of service in the memory 150 .

다양한 실시예에서, 메모리(150)는 디지털 어시스턴트 클라이언트 모듈(157)(이하, DA 클라이언트 모듈)을 저장할 수 있으며, 그에 따라 디지털 어시스턴트의 클라이언트 측의 기능을 수행하기 위한 명령어 및 다양한 사용자 데이터(158)(예. 사용자 맞춤형 어휘 데이터, 선호도 데이터, 사용자의 전자 주소록 등과 같은 기타 데이터)를 저장할 수 있다. In various embodiments, the memory 150 may store a digital assistant client module 157 (hereinafter referred to as a DA client module), thereby storing instructions and various user data 158 for performing client-side functions of the digital assistant. (eg user-customized vocabulary data, preference data, other data such as the user's electronic address book, etc.).

다양한 실시예에서, 메모리(150)는 사용자에게 제공되는 영상 편집 인터페이스의 구성을 저장할 수 있으며, 커머스 영상을 제작하기 위해 필요한 태그 더미를 저장할 수 있다. 또한, 메모리(150)는 커머스 영상에 사용되는 카테고리 별 태그 더미, 태그와 결합된 지문, 커머스 영상에 삽입된 오디오 데이터, 텍스트 데이터 등을 저장할 수 있다. 여기서, 태그 더미를 구분하는 카테고리는 상품의 유형(식품, 물품, 서비스, 티켓 등), 상품의 색상 등 직관적인 항목이거나, 지역, 사업자 경영 등과 같은 추상적인 항목을 포함할 수 있다. 또한, 메모리(150)는 판매자가 판매하는 상품 목록, 판매자의 식별 정보, 커머스 영상에 사용된 태그 그룹과 태그 그룹을 통한 매출 데이터를 저장할 수 있으며, 여기서의 매출 데이터는 커머스 영상의 제공 시점을 기준으로 집계되는 주문량, 검색량 등을 포함할 수 있다. In various embodiments, the memory 150 may store a configuration of an image editing interface provided to a user and may store a pile of tags required to produce a commerce video. In addition, the memory 150 may store a pile of tags for each category used in commerce images, fingerprints combined with tags, audio data inserted into commerce images, text data, and the like. Here, the category for classifying the tag stack may include intuitive items such as product type (food, product, service, ticket, etc.) and product color, or may include abstract items such as region and business management. In addition, the memory 150 may store a list of products sold by the seller, identification information of the seller, a tag group used in the commerce video, and sales data through the tag group, wherein the sales data is based on the time of providing the commerce video. It may include order volume, search volume, etc., which are counted as .

한편, DA 클라이언트 모듈(157)은 커머스 영상 제작 장치(100)에 구비된 다양한 사용자 인터페이스(예. I/O 서브시스템(140))를 통해 사용자의 음성 입력, 텍스트 입력, 터치 입력 및/또는 제스처 입력을 획득할 수 있다. On the other hand, the DA client module 157 provides voice input, text input, touch input, and/or gestures of the user through various user interfaces (eg, the I/O subsystem 140) provided in the commerce video production device 100. input can be obtained.

또한, DA 클라이언트 모듈(157)은 시청각적, 촉각적 형태의 데이터를 출력할 수 있다. 예를 들어, DA 클라이언트 모듈(157)은 음성, 소리, 알림, 텍스트 메시지, 메뉴, 그래픽, 비디오, 애니메이션 및 진동 중 적어도 둘 하나 이상의 조합으로 이루어진 데이터를 출력할 수 있다. 아울러, DA 클라이언트 모듈(157)은 통신 서브시스템(180)을 이용하여 디지털 어시스턴트 서버(미도시)와 통신할 수 있다.In addition, the DA client module 157 may output audio-visual and tactile data. For example, the DA client module 157 may output data consisting of a combination of at least two of voice, sound, notification, text message, menu, graphic, video, animation, and vibration. In addition, the DA client module 157 may communicate with a digital assistant server (not shown) using the communication subsystem 180 .

다양한 실시예에서, DA 클라이언트 모듈(157)은 사용자 입력과 연관된 상황(context)을 구성하기 위하여 다양한 센서, 서브시스템 및 주변 디바이스로부터 커머스 영상 제작 장치(100)의 주변 환경에 대한 추가 정보를 수집할 수 있다. 예를 들어, DA 클라이언트 모듈(157)은 사용자 입력과 함께 상황 정보를 디지털 어시스턴트 서버에 제공하여 사용자의 의도를 추론할 수 있다. 여기서, 사용자 입력에 동반될 수 있는 상황 정보는 센서 정보, 예를 들어, 광(lighting), 주변 소음, 주변 온도, 주변 환경의 이미지, 비디오 등을 포함할 수 있다. 다른 예를 들어, 상황 정보는 커머스 영상 제작 장치(100)의 물리적 상태(예. 디바이스 배향, 디바이스 위치, 디바이스 온도, 전력 레벨, 속도, 가속도, 모션 패턴, 셀룰러 신호 강도 등)을 포함할 수 있다. 또 다른 예를 들어, 상황 정보는 커머스 영상 제작 장치(100)의 소프트웨어 상태에 관련된 정보(예. 커머스 영상 제작 장치(100)에서 실행 중인 프로세스, 설치된 프로그램, 과거 및 현재 네트워크 활동성, 백그라운드 서비스, 오류 로그, 리소스 사용 등)를 포함할 수 있다. In various embodiments, the DA client module 157 may collect additional information about the surrounding environment of the commerce video production apparatus 100 from various sensors, subsystems, and peripheral devices in order to configure a context associated with a user input. can For example, the DA client module 157 may infer the user's intention by providing context information together with the user's input to the digital assistant server. Here, the situational information that may accompany the user input may include sensor information, eg, lighting, ambient noise, ambient temperature, image of the surrounding environment, video, and the like. For another example, the context information may include the physical state (eg, device orientation, device location, device temperature, power level, speed, acceleration, motion pattern, cellular signal strength, etc.) of the commerce video production apparatus 100. . For another example, the situation information is information related to the software state of the commerce video production device 100 (eg, processes running in the commerce video production device 100, installed programs, past and present network activity, background services, errors). logs, resource usage, etc.).

다양한 실시예에서, 메모리(150)는 추가 또는 삭제된 명령어를 포함할 수 있으며, 커머스 영상 제작 장치(100)도 도 2에 도시된 구성 외에 추가 구성을 포함하거나, 일부 구성을 제외할 수도 있다. In various embodiments, the memory 150 may include added or deleted commands, and the commerce video production apparatus 100 may include additional components other than the configuration shown in FIG. 2 or may exclude some components.

프로세서(120)는 커머스 영상 제작 장치(100)의 전반적인 동작을 제어할 수 있으며, 메모리(150)에 저장된 어플리케이션 또는 프로그램을 구동하여 커머스 영상 제작 및 편집 인터페이스를 구현하기 위한 다양한 명령들을 수행할 수 있다. The processor 120 may control the overall operation of the commerce video production device 100, and may execute various commands to implement a commerce video production and editing interface by driving an application or program stored in the memory 150. .

프로세서(120)는 CPU(Central Processing Unit)나 AP(Application Processor)와 같은 연산 장치에 해당할 수 있다. 또한, 프로세서(120)는 NPU(Neural Processing Unit)과 같은 다양한 연산 장치가 통합된 SoC(System on Chip)와 같은 통합 칩(Integrated Chip (IC))의 형태로 구현될 수 있다. The processor 120 may correspond to an arithmetic device such as a central processing unit (CPU) or an application processor (AP). In addition, the processor 120 may be implemented in the form of an integrated chip (IC) such as a System on Chip (SoC) in which various computing devices such as a Neural Processing Unit (NPU) are integrated.

다양한 실시예에서, 프로세서(120)는 상품과 관련된 영상 및 영상과 동기화된 지문을 이용하여 상품을 홍보하기 위한 커머스 영상을 생성할 수 있으며, 이하 도 3 내지 도 7을 참조하여 설명하도록 한다. In various embodiments, the processor 120 may generate a commerce image for promoting a product using an image related to the product and a fingerprint synchronized with the image, which will be described below with reference to FIGS. 3 to 7 .

도 3은 본 발명의 일 실시예에 따른 커머스 영상을 제작하기 위한 사용자 인터페이스 제공 방법에 대한 순서도이고, 도 4 및 도 5는 본 발명의 일 실시예에 따른 커머스 영상을 생성할 수 있는 사용자 인터페이스 화면을 설명하기 위한 개략도이다.3 is a flowchart of a user interface providing method for producing a commerce video according to an embodiment of the present invention, and FIGS. 4 and 5 are user interface screens capable of generating a commerce video according to an embodiment of the present invention. It is a schematic diagram to explain.

먼저, 도 3을 참조하면, 프로세서(120)는 상품과 관련된 영상 및 영상과 동기화된 지문에 대응되는 복수의 태그를 획득할 수 있다(S110). 여기서, 상품과 관련된 영상이란 상품을 판매하는 판매자의 인터뷰 영상일 수 있으며, 지문은 인터뷰에서 판매자의 대답과 대응될 수 있다. 또한, 복수의 태그는 영상 또는 지문의 타임라인에 매칭되며, 커머스 영상을 제작하기 위해 사용되는 스토리 키워드가 될 수 있다. 예를 들어, 태그 더미는 맛집, 체인점, 결혼, 낙지 등과 같은 단어로 구성되거나, 개발비법, 함께하는직원 등과 같은 둘 이상의 단어가 모인 구로 구성될 수 있다. 아울러, 태그는 문장 단위 또는 문단 단위로 결합될 수 있으며, 태그를 통해 분할되는 분할 영상는 예를 들어, 5초~15초 길이로 구성될 수 있다. First, referring to FIG. 3 , the processor 120 may obtain a plurality of tags corresponding to an image related to a product and a fingerprint synchronized with the image (S110). Here, the image related to the product may be an interview image of a seller who sells the product, and the fingerprint may correspond to the seller's answer in the interview. In addition, a plurality of tags are matched with the timeline of a video or fingerprint, and may be a story keyword used to produce a commerce video. For example, the tag pile may consist of words such as restaurant, chain store, marriage, octopus, etc., or may consist of phrases of two or more words such as development secret, employee together, and the like. In addition, tags may be combined in units of sentences or paragraphs, and divided images divided through tags may have a length of, for example, 5 seconds to 15 seconds.

본 발명에서 프로세서(120)는 사용자가 제공한 지문 및 복수의 태그를 그대로 사용할 수도 있지만, 상품과 관련된 영상을 토대로 지문을 획득하거나, 영상 및 지문에 복수의 태그를 직접 결합할 수 있다. In the present invention, the processor 120 may use a fingerprint and a plurality of tags provided by the user as they are, but may acquire a fingerprint based on an image related to a product or directly combine a plurality of tags with an image and a fingerprint.

다양한 실시예에서, 프로세서(120)는 상품과 관련된 영상의 오디오 데이터를 텍스트 데이터로 변환하는 음성 인식(Speech-to-text, STT) 모델을 통해 질문에 대한 판매자의 답변을 텍스트 데이터로 획득할 수 있다. 이와 같이, 획득된 텍스트 데이터는 영상과 동기화된 지문인 것으로 이해될 수 있다. In various embodiments, the processor 120 may obtain the seller's answer to the question as text data through a speech-to-text (STT) model that converts audio data of an image related to a product into text data. there is. In this way, the obtained text data may be understood as a fingerprint synchronized with an image.

다양한 실시예에서, 프로세서(120)는 지문을 구성하는 문장 단위 또는 단어 단위의 텍스트를 기초로 영상의 타임라인에 결합 가능한 태그를 결정할 수 있다. 여기서, 영상의 타임라인에 태그를 결합한다는 것은 지문을 구성하는 문장 또는 텍스트가 제공되는 시점의 타임 스탬프를 태그에 기록하는 것으로 이해될 수 있다. In various embodiments, the processor 120 may determine a tag that can be combined with a timeline of an image based on text in units of sentences or words constituting the fingerprint. Here, combining a tag with a timeline of an image may be understood as recording a time stamp of a time point at which a sentence or text constituting a fingerprint is provided in the tag.

구체적으로, 프로세서(120)는 하나의 문장에서 의미를 가지는 단어를 추출할 수 있으며, 추출된 단어와 메모리(150)에 기 저장된 태그 더미와의 유사도를 계산하여, 유사도가 소정 값 이상인 단어를 태그 가능한 단어로 결정할 수 있다. 다만, 여기서 메모리(150)에 기 저장된 태그 더미가 많을 경우, 유사도 연산을 위한 많은 시간이 소요되기 때문에, 프로세서(120)는 상품의 유형에 따라 단어와 단어 간에 유사도를 계산하기 위한 태그 더미를 한정할 수 있다. 예를 들어, 프로세서(120)는 메모리(150)에 카테고리 별로 저장된 태그 더미에서 상품 및 상품을 판매하는 판매자의 식별 정보에 따라 카테고리를 한정할 수 있다. 일 예로, 상품의 유형이 식품일 경우, 카테고리를 단어 식자재, 원산지 등과 연관된 카테고리로 한정할 수 있으며, 상품의 유형이 물품일 경우, 카테고리를 원자재, 소재 등과 연관된 카테고리로 한정할 수 있으며, 상품을 판매하는 판매자의 판매 경력이 10년 이상일 경우, 태그 더미를 경영과 관련된 카테고리로 한정할 수 있다. Specifically, the processor 120 may extract a word having a meaning from one sentence, calculate a similarity between the extracted word and a pile of tags previously stored in the memory 150, and tag a word having a similarity of a predetermined value or more. It can be determined by possible words. However, if there are many tag piles pre-stored in the memory 150, since it takes a lot of time to calculate the similarity, the processor 120 limits the tag piles for calculating the similarity between words according to the type of product. can do. For example, the processor 120 may define a category according to identification information of a product and a seller selling the product in a tag dummy stored for each category in the memory 150 . For example, if the type of product is food, the category may be limited to categories related to words, food materials, country of origin, etc., and if the type of product is goods, the category may be limited to categories related to raw materials, materials, etc. If the seller has more than 10 years of sales experience, the tag pile can be limited to categories related to management.

또한, 프로세서(120)는 메모리(150)에 기 저장된 태그와 결합된 지문을 이용하여, 문장 또는 문단 단위의 지문에서 결합 가능한 태그가 존재하는지를 결정할 수 있다. 구체적으로, 프로세서(120)는 지문을 구성하는 하나의 문장과 태그와 결합된 지문(복수의 문장) 간의 유사도를 계산하여, 유사도가 소정 값 이상인 문장에 해당 태그를 결합할 수 있다. 아울러, 문장 단위에서도 마찬가지로, 프로세서(120)는 메모리(150)에 카테고리 별로 저장된 태그 더미에서 상품 및 상품을 판매하는 판매자의 식별 정보에 따라 카테고리를 한정한 뒤, 문장 유사도 계산을 수행할 수 있다. Also, the processor 120 may determine whether a tag that can be combined exists in the fingerprint of a sentence or paragraph unit by using a fingerprint combined with a tag pre-stored in the memory 150 . Specifically, the processor 120 may calculate a similarity between one sentence constituting a fingerprint and fingerprints (a plurality of sentences) combined with a tag, and combine the corresponding tag with a sentence having a similarity equal to or greater than a predetermined value. In addition, similarly in a sentence unit, the processor 120 may perform a sentence similarity calculation after defining a category according to identification information of a product and a seller selling the product in a pile of tags stored for each category in the memory 150.

이와 같이, 프로세서(120)는 지문을 토대로 영상의 타임라인에 결합 가능한 태그를 결정할 수 있어, 긴 인터뷰 영상의 문장 또는 문단에 사용자가 일일이 태그를 직접 결합하는 작업 과정을 생략 또는 단축시킬 수 있다. In this way, the processor 120 can determine tags that can be combined with the timeline of the video based on the fingerprints, so that the user can omit or shorten the work process of directly combining tags with the sentences or paragraphs of the long interview video.

다양한 실시예에서, 프로세서(120)는 기 저장된 태그 그룹 별 매출 데이터를 토대로 복수의 태그 중 커머스 영상을 생성 가능한 태그를 조합하여 제공할 수 있다. 구체적으로, 프로세서(120)는 커머스 영상을 생성하기 위해 복수의 태그 중 일부의 태그를 선택 받게 되는데, 이 과정에서 태그들을 추천할 수 있다. 프로세서(120)는 메모리(150)에 기 저장된 태그 그룹을 통한 매출 데이터를 토대로 S110 단계에서 획득된 복수의 태그에서 선택 가능한 태그 그룹을 조합하여 제공할 수 있으며, 이와 함께 커머스 영상의 제공 시점을 기준으로 집계되는 주문량, 검색량 등의 매출 데이터를 제공할 수도 있다. In various embodiments, the processor 120 may combine and provide tags capable of generating a commerce image among a plurality of tags based on pre-stored sales data for each tag group. Specifically, the processor 120 receives a selection of some tags from among a plurality of tags to generate a commerce video, and may recommend tags in this process. The processor 120 may combine and provide selectable tag groups from a plurality of tags acquired in step S110 based on sales data through tag groups pre-stored in the memory 150, and also based on the time of providing the commerce video. It is also possible to provide sales data such as order volume and search volume, which are counted as .

S110 단계 이후, 프로세서(120)는 복수의 태그 중 어느 하나의 태그를 선택 가능한 영역 및 선택된 태그에 의해 구분되는 분할 영상을 배치하는 영역이 포함된 영상 편집 인터페이스를 제공할 수 있다(S120). 프로세서(120)는 생성할 커머스 영상의 길이에 따라, 선택 가능한 태그의 개수를 지정할 수 있다. 예를 들어, 1분 단위의 커머스 영상의 경우, 사용자가 선택 가능한 태그의 개수는 3개일 수 있다. After step S110, the processor 120 may provide an image editing interface including an area in which one of a plurality of tags can be selected and an area in which divided images divided by the selected tag are arranged (S120). The processor 120 may designate the number of selectable tags according to the length of the commerce video to be generated. For example, in the case of a 1-minute commerce video, the number of tags that can be selected by the user may be three.

관련하여, 도 4를 참조하면, 프로세서(120)는 다음과 같이 태그 및 분할 영상이 배치되는 영상 편집 인터페이스(11)를 제공할 수 있다. 구체적으로, 영상 편집 인터페이스(11)는 태그를 선택 가능한 영역(12)과 태그에 결합된 분할 지문이 배치되는 영역(13), 커머스 영상이 배치되는 영역(14) 및 커머스 영상의 타임 라인이 배치되는 영역(15)을 포함할 수 있다. In this regard, referring to FIG. 4 , the processor 120 may provide an image editing interface 11 in which tags and divided images are arranged as follows. Specifically, in the video editing interface 11, an area 12 where a tag can be selected, an area 13 where a split fingerprint combined with the tag is arranged, an area 14 where a commerce video is arranged, and a timeline of the commerce video are arranged. It may include a region 15 to be.

아울러, 커머스 영상은 두 개의 영상 레이어의 혼합으로 이루어질 수 있다. 구체적으로, 영상 편집 인터페이스(11)는 S110 단계에서 획득된 영상 중 태그에 의해 분할된 분할 영상이 배치되는 제1 영상 레이어(14-1)와 상품과 관련된 추가 영상이 배치되는 제2 영상 레이어(14-2)가 인접 배치되도록 구성될 수 있다. In addition, the commerce image may be composed of a mixture of two image layers. Specifically, the image editing interface 11 includes a first image layer 14-1 in which divided images divided by tags among the images obtained in step S110 are disposed, and a second image layer in which additional images related to products are disposed ( 14-2) may be configured to be adjacently arranged.

즉, 프로세서(120)는 커머스 영상을 인터뷰 영상만을 이용하여 생성하는 것이 아니라, 인터뷰 영상 사이에 상품과 관련된 추가 영상을 삽입할 수도 있다. 이를 위해, 프로세서(120)는 사용자에 의해 선택된 태그의 종류에 따라 상품과 관련된 추가 영상을 획득할 수 있다. 여기서, 상품과 관련된 추가 영상은 상품의 완제품, 재료 등의 이미지, 영상일 수 있다. That is, the processor 120 may insert additional images related to products between the interview images, instead of generating the commerce images using only the interview images. To this end, the processor 120 may obtain an additional image related to the product according to the type of tag selected by the user. Here, the additional image related to the product may be an image or video of a finished product or material of the product.

이를 통해, 사용자가 영상 편집 인터페이스(11)를 통해 “#시작”이라는 태그(12')를 선택할 경우, 제1 영상 레이어(14-1)에 태그(12')와 대응되는 분할 영상과 분할 영상에 동기화된 분할 지문(13')이 함께 표시될 수 있다. Through this, when the user selects the tag 12' of “#start” through the video editing interface 11, the split image corresponding to the tag 12' in the first image layer 14-1 and the split image The split fingerprint 13' synchronized with may be displayed together.

또한, 사용자가 영상 편집 인터페이스(11)를 통해 “#낙지요리”라는 태그(12”를 선택할 경우, 제1 영상 레이어(14-1)의 다음 구간에 태그(12”와 대응되는 분할 영상 및 분할 지문이 표시되고, 해당 구간과 대응되는 제2 영상 레이어(14-2)의 일 구간에 태그(12”를 통해 획득된 추가 영상이 표시될 수 있다. In addition, when the user selects the tag 12 of “# octopus dish” through the video editing interface 11, the segmented image and segmentation corresponding to the tag 12 in the next section of the first image layer 14-1 A fingerprint is displayed, and an additional image acquired through the tag 12” may be displayed in a section of the second image layer 14-2 corresponding to the corresponding section.

사용자가 선택한 태그를 통해 제1, 제2 영상 레이어(14-1)(14-2) 각각에 서로 다른 영상이 표시될 경우, 프로세서(120)는 제1 영상 레이어 또는 제2 영상 레이어 중 커머스 영상에 삽입될 영상 레이어를 선택 받을 수 있다. When different images are displayed on each of the first and second image layers 14-1 and 14-2 through a tag selected by the user, the processor 120 selects a commerce image from among the first and second image layers. An image layer to be inserted into can be selected.

이와 같이, 프로세서(120)는 추가 영상의 검색하고, 이를 영상 레이어에 배치시킴으로써, 사용자로 하여금 다양한 구성의 커머스 영상을 제작할 수 있도록 도움을 줄 수 있다. In this way, the processor 120 may assist the user to create commerce videos of various configurations by searching for additional videos and arranging them in the video layer.

이 외에도, 프로세서(120)는 상품의 유형에 따라 커머스 영상이 배치되는 영역(14) 상에 커머스 영상 제작을 위한 가이드 정보를 제공할 수 있다. 구체적으로, 프로세서(120)는 제1 영상 레이어(14-1) 또는 제2 영상 레이어(14-2)에 상품의 유형 별 가이드 정보를 제공할 수 있다. 여기서, 상품의 유형은 식품, 물품, 서비스, 티켓 등으로 구분될 수 있다. 사용자가 영상 편집 인터페이스(11)를 통해 제1 영상 레이어(14-1) 또는 제2 영상 레이어(14-2)의 일 영역에 표시된 아이콘(16)을 선택할 경우, 상품의 유형 별로 초반, 중반, 후반에 삽입되어야 하는 영상(예. 식품의 경우 시식 영상, 서비스의 경우 서비스 이용 공간에 대한 영상) 목록 및 유사 영상 목록을 제공할 수 있다. In addition to this, the processor 120 may provide guide information for producing a commerce video on the area 14 where the commerce video is arranged according to the product type. Specifically, the processor 120 may provide guide information for each product type to the first image layer 14-1 or the second image layer 14-2. Here, the type of product may be classified into food, article, service, ticket, and the like. When the user selects the icon 16 displayed in one area of the first image layer 14-1 or the second image layer 14-2 through the image editing interface 11, the first, middle, A list of images to be inserted in the second half (eg, tasting videos in case of food, images about service space in case of service) and a list of similar images can be provided.

다양한 실시예에서, 가이드 정보는 커머스 영상의 타임라인(15)에 표시될 수도 있으며, 사용자가 영상 편집 인터페이스(11)를 통해 일 지점을 선택함에 따라, 프로세서(120)는 상품과 관련된 이미지 또는 영상을 제공할 수 있다. In various embodiments, the guide information may be displayed on the timeline 15 of the commerce video, and as the user selects a point through the video editing interface 11, the processor 120 displays an image or video related to the product. can provide.

한편, 복수의 태그 중 사용자가 어느 하나의 태그를 선택할 수 있도록, 프로세서(120)는 영상 편집 인터페이스를 통해 사용자에게 영상을 필터링하여 제공할 수 있다.Meanwhile, the processor 120 may filter and provide an image to the user through an image editing interface so that the user can select any one tag among a plurality of tags.

관련하여, 도 5를 참조하면, 프로세서(120)는 다음과 같이 인터뷰 영상을 확인할 수 있는 영상 편집 인터페이스를 제공할 수 있다. 구체적으로, 영상 편집 인터페이스는 인터뷰 영상을 표시하는 영역(17)과 재생되는 인터뷰 영상과 동기화된 지문을 표시하는 영역(18) 그리고 영상 및 지문에 대응되는 복수의 태그를 선택 가능한 영역(19)을 포함할 수 있다. In relation to this, referring to FIG. 5 , the processor 120 may provide a video editing interface for checking an interview video as follows. Specifically, the video editing interface includes an area 17 displaying an interview video, an area 18 displaying a fingerprint synchronized with the reproduced interview video, and an area 19 capable of selecting a plurality of tags corresponding to the video and fingerprint. can include

아울러, 영상 편집 인터페이스는 복수의 태그 또는 분할 영상의 길이에 따라 필터링된 분할 영상 목록을 제공하도록 구성된 영역(20)을 더 포함할 수 있다. 예를 들어, 사용자가 영상 편집 인터페이스를 통해 “#인물”, “길이-3분”을 선택할 경우, 프로세서(120)는 해당 조건에 부합하는 분할 영상을 제공할 수 있다. In addition, the video editing interface may further include an area 20 configured to provide a list of divided images filtered according to a plurality of tags or lengths of the divided images. For example, when the user selects "# person" and "length - 3 minutes" through the video editing interface, the processor 120 may provide divided videos meeting the conditions.

다양한 실시예에서, 프로세서(120)는 상품과 관련된 영상을 토대로 커머스 영상을 생성하면서, 영상 내에 새로운 오디오 데이터를 삽입할 수 있다. In various embodiments, the processor 120 may insert new audio data into the image while generating the commerce image based on the image related to the product.

관련하여, 도 6은 도 3에 도시된 S120 단계를 구체화한 순서도이다. In relation to this, FIG. 6 is a flowchart embodying step S120 shown in FIG. 3 .

도 6을 참조하면, 프로세서(120)는 사용자가 선택한 태그가 미리 저장된 태그 그룹에 존재하는지 확인할 수 있다(S120-1). 여기서, 미리 저장된 태그 그룹은 커머스 영상에 사용된 태그 그룹을 의미하며, 프로세서(120)는 사용자가 선택한 태그 중 소정 개수 이상의 태그가 미리 저장된 어느 하나의 태그 그룹에 존재하는지 확인할 수 있다. Referring to FIG. 6 , the processor 120 may check whether a tag selected by the user exists in a pre-stored tag group (S120-1). Here, the pre-stored tag group refers to a tag group used in a commerce video, and the processor 120 may check whether a predetermined number or more of tags selected by the user exist in any pre-stored tag group.

만약, 사용자가 선택한 태그가 미리 저장된 태그 그룹에 존재하는 경우, 프로세서(120)는 영상 편집 인터페이스를 통해 태그 그룹에 매칭된 복수의 오디오 데이터를 제공할 수 있다(S120-2, 예). 예를 들어, 영상 편집 인터페이스는 오디오 데이터가 배치되는 오디오 레이어(미도시)가 커머스 영상이 배치되는 영역(14)과 인접 배치되도록 구성될 수 있다. 그에 따라, 사용자가 영상 편집 인터페이스를 통해 태그를 결정하고, 오디오 레이어의 일 구간을 선택할 경우, 미리 저장된 태그 그룹에 매칭된 복수의 오디오 데이터 목록을 제공할 수 있다. If the tag selected by the user exists in a pre-stored tag group, the processor 120 may provide a plurality of pieces of audio data matched to the tag group through the video editing interface (S120-2, Yes). For example, the video editing interface may be configured so that an audio layer (not shown) in which audio data is disposed is disposed adjacent to the region 14 in which commerce video is disposed. Accordingly, when a user determines a tag through the video editing interface and selects a section of an audio layer, a plurality of audio data lists matched with previously stored tag groups may be provided.

이와 반대로, 사용자가 선택한 태그가 미리 저장된 태그 그룹에 존재하지 않는 경우, 프로세서(120)는 태그와 대응되는 분할 지문에서 키워드를 추출할 수 있다(S120-3, 아니오). 여기서, 키워드는 분할 지문의 내용을 강조할 수 있는 강조 키워드로 의성어, 의태어, 고유 명사 등을 포함할 수 있다. Conversely, if the tag selected by the user does not exist in the pre-stored tag group, the processor 120 may extract a keyword from the divided fingerprint corresponding to the tag (S120-3, No). Here, the keyword is an emphasis keyword capable of emphasizing the content of the divided fingerprint and may include onomatopoeia, mimetic words, proper nouns, and the like.

프로세서(120)는 키워드를 기초로 커머스 영상에 삽입 가능한 오디오 데이터를 검출할 수 있다(S120-4). 이 후, 프로세서(120)는 오디오 데이터의 적어도 일부를 텍스트 데이터로 변환하고, 변환된 텍스트 데이터를 분할 영상에 배치하여(S120-5), 사용자에게 해당 영상에 삽입 가능한 오디오 데이터를 추천할 수 있다. The processor 120 may detect audio data that can be inserted into the commerce video based on the keyword (S120-4). Thereafter, the processor 120 converts at least a portion of the audio data into text data, and arranges the converted text data in the divided image (S120-5) to recommend audio data that can be inserted into the corresponding image to the user. .

S120 단계 이후, 프로세서(120)는 복수의 태그 중 사용자에 의해 선택된 태그를 기준으로 분할 영상을 조합하여 상품에 대한 복수의 커머스 영상을 생성할 수 있다. 예를 들어, 프로세서(120)는 사용자에 의해 선택된 태그가 3개인 경우, 3개의 순서를 조합하여 동일한 태그를 기초로 하는 총 6개의 커머스 영상을 생성할 수 있다. After step S120, the processor 120 may generate a plurality of commerce images for products by combining the divided images based on the tag selected by the user from among the plurality of tags. For example, when the number of tags selected by the user is 3, the processor 120 may generate a total of 6 commerce images based on the same tag by combining the 3 sequences.

관련하여, 도 7은 본 발명의 일 실시예에 따른 커머스 영상 제작 방법을 통해 생성된 커머스 영상을 예시적으로 나타낸 개략도이다. In relation to this, FIG. 7 is a schematic diagram exemplarily illustrating a commerce video generated through a commerce video production method according to an embodiment of the present invention.

도 7의 (a), (b), (c)를 참조하면, 프로세서(120)는 사용자가 선택한 “#실패”, “가치”, “기업철학”에 대한 3가지 태그를 서로 다른 순서로 조합(21)(22)(23)할 수 있으며, 이를 통해 생성된 커머스 영상(21')(22')(23')은 동일한 재생 시간이라 하더라도 서로 다른 시점의 영상을 표시할 수 있다. 또한, 커머스 영상 상에는 분할 영상과 동기화된 분할 지문(21”””이 표시될 수 있다. Referring to (a), (b) and (c) of FIG. 7 , the processor 120 combines three tags for “#failure”, “value”, and “corporate philosophy” selected by the user in different order. (21) (22) (23) can be performed, and the commerce images (21') (22') (23') generated through this can display images from different viewpoints even at the same playback time. Also, a split fingerprint 21 ””” synchronized with the split image may be displayed on the commerce image.

이와 같이, 사용자는 프로세서(120)가 제공한 영상 편집 인터페이스에서 몇 개의 태그를 선택하는 동작만으로 복수의 커머스 영상을 획득할 수 있어, 사용자 호응도를 토대로 상품 홍보에 적합한 커머스 영상을 생성할 수 있다. In this way, the user can acquire a plurality of commerce images only by selecting a few tags in the image editing interface provided by the processor 120, and based on the user's response, commerce images suitable for product promotion can be generated.

또한, 프로세서(120)는 영상 편집 인터페이스를 통해 영상의 구성부터 오디오 데이터 삽입까지의 일련의 과정에 필요한 데이터를 제공함으로써, 태그를 선택하는 과정 및 이외의 선택 과정에서 사용자의 빠른 의사 결정에 도움을 줄 수 있다. In addition, the processor 120 provides data necessary for a series of processes from video composition to audio data insertion through the video editing interface, thereby helping the user to make quick decisions in the tag selection process and other selection processes. can give

다시 도 2를 참조하면, 주변 인터페이스(130)는 다양한 센서, 서브 시스템 및 주변 디바이스와 연결되어, 커머스 영상 제작 장치(100)가 다양한 기능을 수행할 수 있도록 데이터를 제공해 줄 수 있다. 여기서, 커머스 영상 제작 장치(100)가 어떠한 기능을 수행한다는 것은 프로세서(120)에 의해 수행되는 것으로 이해될 수 있다. Referring back to FIG. 2 , the peripheral interface 130 may be connected to various sensors, subsystems, and peripheral devices to provide data so that the commerce video production apparatus 100 can perform various functions. Here, it can be understood that the commerce video production device 100 performs a certain function as being performed by the processor 120 .

주변 인터페이스(130)는 모션 센서(160), 조명 센서(광 센서)(161) 및 근접 센서(162)로부터 데이터를 제공받을 수 있으며, 이를 통해, 커머스 영상 제작 장치(100)는 배향, 광, 및 근접 감지 기능 등을 수행할 수 있다. 다른 예를 들어, 주변 인터페이스(130)는 기타 센서들(163)(포지셔닝 시스템-GPS 수신기, 온도 센서, 생체인식 센서)로부터 데이터를 제공받을 수 있으며, 이를 통해 커머스 영상 제작 장치(100)가 기타 센서들(163)과 관련된 기능들을 수행할 수 있다.The peripheral interface 130 may receive data from the motion sensor 160, the illumination sensor (light sensor) 161, and the proximity sensor 162, and through this, the commerce video production apparatus 100 may receive orientation, light, and a proximity sensing function. As another example, the peripheral interface 130 may receive data from other sensors 163 (positioning system-GPS receiver, temperature sensor, biometric sensor), through which the commerce video production device 100 may receive other data. Functions related to the sensors 163 may be performed.

다양한 실시예에서, 커머스 영상 제작 장치(100)는 주변 인터페이스(130)와 연결된 카메라 서브시스템(170) 및 이와 연결된 광학 센서(171)를 포함할 수 있으며, 이를 통해 커머스 영상 제작 장치(100)는 사진 촬영 및 비디오 클립 녹화 등의 다양한 촬영 기능을 수행할 수 있다. In various embodiments, the commerce video production device 100 may include a camera subsystem 170 connected to the peripheral interface 130 and an optical sensor 171 connected thereto, through which the commerce video production device 100 Various shooting functions such as taking pictures and recording video clips can be performed.

다양한 실시예에서, 커머스 영상 제작 장치(100)는 주변 인터페이스(130)와 연결된 통신 서브 시스템(180)을 포함할 수 있다. 통신 서브 시스템(180)은 하나 이상의 유/무선 네트워크로 구성되며, 다양한 통신 포트, 무선 주파수 송수신기, 광학 송수신기를 포함할 수 있다.In various embodiments, the commerce video production device 100 may include a communication subsystem 180 connected to the peripheral interface 130 . The communication subsystem 180 is composed of one or more wired/wireless networks, and may include various communication ports, radio frequency transceivers, and optical transceivers.

다양한 실시예에서, 커머스 영상 제작 장치(100)는 주변 인터페이스(130)와 연결된 오디오 서브 시스템(190)을 포함하며, 이러한 오디오 서브 시스템(190)은 하나 이상의 스피커(191) 및 하나 이상의 마이크(192)를 포함함으로써, 커머스 영상 제작 장치(100)는 음성 작동형 기능, 예컨대 음성 인식, 음성 복제, 디지털 녹음, 및 전화 기능 등을 수행할 수 있다.In various embodiments, the commerce video production device 100 includes an audio subsystem 190 connected to the peripheral interface 130, and the audio subsystem 190 includes one or more speakers 191 and one or more microphones 192. ), the commerce video production device 100 can perform voice-actuated functions, such as voice recognition, voice duplication, digital recording, and telephone functions.

다양한 실시예에서, 커머스 영상 제작 장치(100)는 주변 인터페이스(130)와 연결된 I/O 서브시스템(140)을 포함할 수 있다. 예를 들어, I/O 서브시스템(140)은 터치 스크린 제어기(141)를 통해 커머스 영상 제작 장치(100)에 포함된 터치 스크린(143)을 제어할 수 있다. In various embodiments, the commerce video production device 100 may include an I/O subsystem 140 connected to the peripheral interface 130 . For example, the I/O subsystem 140 may control the touch screen 143 included in the commerce video production device 100 through the touch screen controller 141 .

예를 들어, 터치 스크린 제어기(141)는 정전용량형, 저항형, 적외형, 표면 탄성파 기술, 근접 센서 어레이 등과 같은 복수의 터치 감지 기술 중 어느 하나의 기술을 사용하여 사용자의 접촉 및 움직임 또는 접촉 및 움직임의 중단을 검출할 수 있다. 다른 예를 들어, I/O 서브시스템(140)은 기타 입력 제어기(들)(142)를 통해 커머스 영상 제작 장치(100)에 포함된 기타 입력/제어 디바이스(144)를 제어할 수 있다. 일 예로서, 기타 입력 제어기(들)(142)은 하나 이상의 버튼, 로커 스위치(rocker switches), 썸 휠(thumb-wheel), 적외선 포트, USB 포트 및 스타일러스 등과 같은 포인터 디바이스를 제어할 수 있다.For example, the touch screen controller 141 uses any one of a plurality of touch sensing technologies such as capacitive, resistive, infrared, surface acoustic wave technology, proximity sensor array, and the like to provide a user's touch and motion or touch. and cessation of movement. For another example, the I/O subsystem 140 may control other input/control devices 144 included in the commerce video production apparatus 100 through other input controller(s) 142 . As an example, other input controller(s) 142 may control one or more buttons, rocker switches, thumb-wheels, infrared ports, USB ports, and pointer devices such as styluses and the like.

지금까지 본 발명의 일 실시예에 따른 커머스 영상 제작 장치(100)에 대하여 설명하였다. 본 발명에 따르면, 하나의 촬영 영상에서 다양한 스토리 구성으로 조합된 복수 개의 커머스 영상을 생성할 수 있다. 특히, 본 발명은 영상에 매칭 가능한 태그 조합과 태그 조합 따른 사용자 호응도를 토대로 상품 홍보에 적합한 커머스 영상을 생성할 수 있다. So far, the commerce video production apparatus 100 according to an embodiment of the present invention has been described. According to the present invention, a plurality of commerce images combined in various story configurations can be generated from one captured image. In particular, according to the present invention, a commerce video suitable for product promotion can be generated based on a tag combination that can be matched with an image and a user's response according to the tag combination.

이상 첨부된 도면을 참조하여 본 발명의 일 실시예들을 더욱 상세하게 설명하였으나, 본 발명은 반드시 이러한 실시예로 국한되는 것은 아니고, 본 발명의 기술사상을 벗어나지 않는 범위 내에서 다양하게 변형 실시될 수 있다. 따라서, 본 발명에 개시된 실시예들은 본 발명의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시예에 의하여 본 발명의 기술 사상의 범위가 한정되는 것은 아니다. 그러므로, 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 본 발명의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 발명의 권리범위에 포함되는 것으로 해석되어야 할 것이다.Although one embodiment of the present invention has been described in more detail with reference to the accompanying drawings, the present invention is not necessarily limited to these embodiments, and may be variously modified and implemented without departing from the technical spirit of the present invention. there is. Therefore, the embodiments disclosed in the present invention are not intended to limit the technical idea of the present invention, but to explain, and the scope of the technical idea of the present invention is not limited by these embodiments. Therefore, it should be understood that the embodiments described above are illustrative in all respects and not restrictive. The protection scope of the present invention should be construed according to the claims below, and all technical ideas within the equivalent range should be construed as being included in the scope of the present invention.

100: 커머스 영상 제작 장치
110: 메모리 인터페이스 120: 프로세서
130: 주변 인터페이스 140: I/O 서브 시스템
141: 터치 스크린 제어기 142: 기타 입력 제어기
143: 터치 스크린
144: 기타 입력 제어 디바이스
150: 메모리 151: 운영 체제
152: 통신 모듈 153: GUI 모듈
154: 센서 처리 모듈 155: 전화 모듈
156: 애플리케이션 모듈
156-1, 156-2: 애플리케이션
157: 디지털 어시스턴트 클라이언트 모듈
158: 사용자 데이터
160: 모션 센서 161: 조명 센서
162: 근접 센서 163: 기타 센서
170: 카메라 서브 시스템 171: 광학 센서
180: 통신 서브 시스템
190: 오디오 서브 시스템
191: 스피커 192: 마이크
100: commerce video production device
110: memory interface 120: processor
130 Peripheral Interface 140 I/O Subsystem
141: touch screen controller 142: other input controller
143: touch screen
144: other input control devices
150: memory 151: operating system
152: communication module 153: GUI module
154: sensor processing module 155: phone module
156: application module
156-1, 156-2: application
157: digital assistant client module
158: user data
160: motion sensor 161: light sensor
162 Proximity sensor 163 Other sensors
170: camera subsystem 171: optical sensor
180: communication subsystem
190: audio subsystem
191: speaker 192: microphone

Claims (12)

상품과 관련된 영상 및 상기 영상과 동기화된 지문에 대응되는 복수의 태그를 획득하는 단계;
상기 복수의 태그 중 어느 하나의 태그를 선택 가능한 영역 및 선택된 태그에 의해 구분되는 분할 영상을 배치하는 영역이 포함된 영상 편집 인터페이스를 제공하는 단계; 및
상기 복수의 태그 중 사용자에 의해 선택된 태그를 기준으로 분할 영상을 조합하여 상기 상품에 대한 복수의 커머스 영상을 생성하는 단계; 를 포함하는 커머스 영상을 제작하기 위한 사용자 인터페이스 제공 방법.
obtaining a plurality of tags corresponding to an image related to a product and a fingerprint synchronized with the image;
providing an image editing interface including an area in which one of the plurality of tags can be selected and an area in which divided images divided by the selected tag are arranged; and
generating a plurality of commerce images for the product by combining divided images based on a tag selected by a user from among the plurality of tags; A user interface providing method for producing a commerce video comprising a.
제1항에 있어서,
상기 복수의 커머스 영상을 생성하는 단계는,
상기 사용자에 의해 선택된 태그의 순서를 변경하여, 동일한 태그를 기초로 하는 복수의 커머스 영상을 생성하는 단계인, 커머스 영상을 제작하기 위한 사용자 인터페이스 제공 방법.
According to claim 1,
Generating the plurality of commerce images,
The method of providing a user interface for producing a commerce video, the step of changing the order of tags selected by the user and generating a plurality of commerce videos based on the same tag.
제2항에 있어서,
상기 커머스 영상은,
상기 분할 영상과 동기화된 분할 지문을 포함하도록 구성되는, 커머스 영상을 제작하기 위한 사용자 인터페이스 제공 방법.
According to claim 2,
The commerce video,
A method of providing a user interface for producing a commerce image, configured to include a split fingerprint synchronized with the split image.
제1항에 있어서,
상기 영상 편집 인터페이스를 제공하는 단계는,
상기 사용자에 의해 선택된 태그의 종류에 따라 상기 상품과 관련된 추가 영상을 획득하는 단계, 를 더 포함하고,
상기 영상 편집 인터페이스는,
상기 분할 영상이 배치되는 제1 영상 레이어와 상기 상품과 관련된 추가 영상이 배치되는 제2 영상 레이어가 인접 배치되도록 구성되는, 커머스 영상을 제작하기 위한 사용자 인터페이스 제공 방법.
According to claim 1,
The step of providing the video editing interface,
Acquiring an additional image related to the product according to the type of tag selected by the user;
The video editing interface,
A method for providing a user interface for producing a commerce image, wherein a first image layer on which the divided image is disposed and a second image layer on which an additional image related to the product is disposed are disposed adjacent to each other.
제4항에 있어서,
상기 영상 편집 인터페이스를 제공하는 단계는,
상기 제1 영상 레이어 또는 상기 제2 영상 레이어 중 상기 커머스 영상에 삽입될 영상 레이어를 선택받는 단계, 를 더 포함하는 커머스 영상을 제작하기 위한 사용자 인터페이스 제공 방법.
According to claim 4,
The step of providing the video editing interface,
The method of providing a user interface for producing a commerce video, further comprising receiving a selection of an video layer to be inserted into the commerce video from among the first video layer and the second video layer.
제5항에 있어서,
상기 영상 편집 인터페이스는,
상기 제1 영상 레이어 또는 상기 제2 영상 레이어 상에 상기 상품의 유형 별 가이드 정보를 더 포함하도록 구성된, 커머스 영상을 제작하기 위한 사용자 인터페이스 제공 방법.
According to claim 5,
The video editing interface,
The method of providing a user interface for producing a commerce image, configured to further include guide information for each type of product on the first image layer or the second image layer.
제6항에 있어서,
상기 가이드 정보는,
상기 커머스 영상의 타임라인에 표시되며,
상기 영상 편집 인터페이스를 제공하는 단계는,
상기 타임라인의 일 지점을 선택함에 따라, 상기 상품과 관련된 이미지 또는 영상을 제공하는 단계, 를 더 포함하는 커머스 영상을 제작하기 위한 사용자 인터페이스 제공 방법.
According to claim 6,
The guide information,
It is displayed on the timeline of the commerce video,
The step of providing the video editing interface,
A method of providing a user interface for producing a commerce video, further comprising: providing an image or video related to the product when a point on the timeline is selected.
제1항에 있어서,
상기 복수의 태그를 획득하는 단계는,
상기 지문을 구성하는 문장 단위 또는 단어 단위의 텍스트를 기초로 상기 영상의 타임라인에 결합 가능한 태그를 결정하는 단계, 를 더 포함하는 커머스 영상을 제작하기 위한 사용자 인터페이스 제공 방법.
According to claim 1,
Obtaining the plurality of tags,
The method of providing a user interface for producing a commerce video, further comprising determining a tag that can be combined with the timeline of the video based on text in units of sentences or words constituting the fingerprint.
제1항에 있어서,
상기 복수의 태그를 획득하는 단계 이후에,
기 저장된 태그 그룹 별 매출 데이터를 토대로 상기 복수의 태그 중 커머스 영상을 생성 가능한 태그를 조합하여 제공하는 단계, 를 더 포함하는 커머스 영상을 제작하기 위한 사용자 인터페이스 제공 방법.
According to claim 1,
After acquiring the plurality of tags,
The method of providing a user interface for producing a commerce video, further comprising combining and providing tags capable of generating a commerce video among the plurality of tags based on pre-stored sales data for each tag group.
제1항에 있어서,
상기 영상 편집 인터페이스는,
상기 복수의 태그 또는 상기 분할 영상의 길이에 따라 필터링된 분할 영상 목록을 제공하도록 구성된 영역을 포함하는, 커머스 영상을 제작하기 위한 사용자 인터페이스 제공 방법.
According to claim 1,
The video editing interface,
A method of providing a user interface for producing a commerce video comprising a region configured to provide a list of divided images filtered according to the plurality of tags or the length of the divided image.
제3항에 있어서,
상기 영상 편집 인터페이스를 제공하는 단계는,
상기 분할 지문의 키워드에 대응되는 오디오 데이터를 검출하는 단계, 와
검출된 오디오 데이터의 적어도 일부를 텍스트 데이터로 변환하고, 변환된 텍스트 데이터를 상기 분할 영상에 배치하는 단계, 를 더 포함하는 문제 채점을 위한 사용자 인터페이스 제공 방법.
According to claim 3,
The step of providing the video editing interface,
detecting audio data corresponding to the keyword of the divided fingerprint; and
The method of providing a user interface for problem scoring, further comprising converting at least a part of the detected audio data into text data and arranging the converted text data in the divided image.
통신 인터페이스;
메모리;
상기 통신 인터페이스, 상기 메모리와 동작 가능하게 연결된 프로세서; 를 포함하고,
상기 프로세서는,
상품과 관련된 영상 및 상기 영상과 동기화된 지문에 대응되는 복수의 태그를 획득하고, 상기 복수의 태그 중 어느 하나의 태그를 선택 가능한 영역 및 선택된 태그에 의해 구분되는 분할 영상을 배치하는 영역이 포함된 영상 편집 인터페이스를 제공하고, 상기 복수의 태그 중 사용자에 의해 선택된 태그를 기준으로 분할 영상을 조합하여 상기 상품에 대한 복수의 커머스 영상을 생성하도록 구성되는, 커머스 영상 제작 장치.
communication interface;
Memory;
a processor operatively connected to the communication interface and the memory; including,
the processor,
A plurality of tags corresponding to an image related to a product and a fingerprint synchronized with the image are acquired, and an area in which any one tag among the plurality of tags can be selected and an area in which divided images divided by the selected tag are arranged are included. A commerce video production device configured to provide an image editing interface and generate a plurality of commerce images for the product by combining divided images based on a tag selected by a user from among the plurality of tags.
KR1020220026017A 2022-02-28 2022-02-28 Method for providing user interface for producing commerce video and apparatus for using the same KR20230128749A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020220026017A KR20230128749A (en) 2022-02-28 2022-02-28 Method for providing user interface for producing commerce video and apparatus for using the same

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020220026017A KR20230128749A (en) 2022-02-28 2022-02-28 Method for providing user interface for producing commerce video and apparatus for using the same

Publications (1)

Publication Number Publication Date
KR20230128749A true KR20230128749A (en) 2023-09-05

Family

ID=87973472

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020220026017A KR20230128749A (en) 2022-02-28 2022-02-28 Method for providing user interface for producing commerce video and apparatus for using the same

Country Status (1)

Country Link
KR (1) KR20230128749A (en)

Similar Documents

Publication Publication Date Title
CN107430858B (en) Communicating metadata identifying a current speaker
Morris Curation by code: Infomediaries and the data mining of taste
KR102295935B1 (en) Digital personal assistant interaction with impersonations and rich multimedia in responses
US20160041981A1 (en) Enhanced cascaded object-related content provision system and method
US9613268B2 (en) Processing of images during assessment of suitability of books for conversion to audio format
US20140161356A1 (en) Multimedia message from text based images including emoticons and acronyms
US20140164507A1 (en) Media content portions recommended
US20140204119A1 (en) Generating augmented reality exemplars
US20140164506A1 (en) Multimedia message having portions of networked media content
US20130076788A1 (en) Apparatus, method and software products for dynamic content management
KR20180107147A (en) Multi-variable search user interface
Thorén et al. The hipster’s dilemma: What is analogue or digital in the post-digital society?
US20140163957A1 (en) Multimedia message having portions of media content based on interpretive meaning
US20150169747A1 (en) Systems and methods for automatically suggesting media accompaniments based on identified media content
CN111818370B (en) Information recommendation method and device, electronic equipment and computer-readable storage medium
US20140164371A1 (en) Extraction of media portions in association with correlated input
US9589296B1 (en) Managing information for items referenced in media content
US20130178961A1 (en) Facilitating personal audio productions
US20140161423A1 (en) Message composition of media portions in association with image content
US20210255759A1 (en) Indication of content linked to text
CN112287168A (en) Method and apparatus for generating video
US20140163956A1 (en) Message composition of media portions in association with correlated text
AU2022306844A1 (en) Content genome generation and management system in a multi-modal artificial intelligence system for media assets
US20130339849A1 (en) Digital content preparation and presentation
CN113168354B (en) System and method for selecting and providing available actions to a user from one or more computer applications