KR20210157458A - 영상 컨텐츠에 대한 합성음 실시간 생성에 기반한 컨텐츠 편집 지원 방법 및 시스템 - Google Patents
영상 컨텐츠에 대한 합성음 실시간 생성에 기반한 컨텐츠 편집 지원 방법 및 시스템 Download PDFInfo
- Publication number
- KR20210157458A KR20210157458A KR1020210182754A KR20210182754A KR20210157458A KR 20210157458 A KR20210157458 A KR 20210157458A KR 1020210182754 A KR1020210182754 A KR 1020210182754A KR 20210182754 A KR20210182754 A KR 20210182754A KR 20210157458 A KR20210157458 A KR 20210157458A
- Authority
- KR
- South Korea
- Prior art keywords
- voice
- content
- content editing
- timeline
- editing tool
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 55
- 230000000694 effects Effects 0.000 claims description 48
- 238000004590 computer program Methods 0.000 claims description 10
- 239000000284 extract Substances 0.000 claims description 7
- 230000006870 function Effects 0.000 description 110
- 238000010586 diagram Methods 0.000 description 20
- 238000004891 communication Methods 0.000 description 11
- 230000008451 emotion Effects 0.000 description 10
- 238000012545 processing Methods 0.000 description 10
- 238000006243 chemical reaction Methods 0.000 description 7
- 238000012905 input function Methods 0.000 description 7
- 230000008859 change Effects 0.000 description 6
- 230000008569 process Effects 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 230000002349 favourable effect Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Tourism & Hospitality (AREA)
- Health & Medical Sciences (AREA)
- General Business, Economics & Management (AREA)
- Economics (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Marketing (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Television Signal Processing For Recording (AREA)
Abstract
Description
도 2는 본 발명의 일실시예에 따른 컴퓨터 장치의 예를 도시한 블록도이다.
도 3은 본 발명의 일실시예에 따른 컨텐츠 편집 지원 환경의 예를 도시한 도면이다.
도 4는 본 발명의 일실시예에 따른 컨텐츠 편집 툴의 화면 예를 도시한 도면이다.
도 5는 본 발명의 일실시예에 있어서, 효과음 편집 기능의 예를 도시한 도면이다.
도 6은 본 발명의 일실시예에 있어서, 음성 편집 기능의 예를 도시한 도면이다.
도 7은 본 발명의 일실시예에 있어서, 음성 목록을 편집하는 기능의 예를 도시한 도면이다.
도 8은 본 발명의 일실시예에 있어서, 음성 타입을 편집하는 기능의 예를 도시한 도면이다.
도 9는 본 발명의 일실시예에 있어서, 사용자 자신의 음성 타입을 생성하는 기능의 예를 도시한 도면이다.
도 10은 본 발명의 일실시예에 따른 컨텐츠 편집 지원 방법의 예를 도시한 흐름도이다.
도 11은 본 발명의 일실시예에 있어서, 타임 인디케이터가 지시하는 시점에 대한 정보를 제공하는 예를 도시한 도면이다.
Claims (13)
- 적어도 하나의 프로세서를 포함하는 컴퓨터 장치의 컨텐츠 편집 지원 방법에 있어서,
상기 적어도 하나의 프로세서에 의해, 컨텐츠 편집 툴을 통해 선택된 영상 컨텐츠가 포함하는 프레임들로부터 복수의 스냅샷을 추출하는 단계;
상기 적어도 하나의 프로세서에 의해, 상기 컨텐츠 편집 툴을 통해 상기 추출된 복수의 스냅샷을 상기 영상 컨텐츠에 대한 타임라인을 가시적으로 표현하기 위한 영역에 상기 타임라인에 따라 표시하는 단계;
상기 적어도 하나의 프로세서에 의해, 상기 컨텐츠 편집 툴을 통해 입력되는 텍스트를 음성으로 변환하는 단계; 및
상기 적어도 하나의 프로세서에 의해, 상기 컨텐츠 편집 툴에서 상기 타임라인을 가시적으로 표현하기 위한 영역의 상기 타임라인에 대해 선택된 시점에 상기 변환된 음성을 추가하는 단계
를 포함하는 것을 특징으로 하는 컨텐츠 편집 지원 방법. - 제1항에 있어서,
상기 적어도 하나의 프로세서에 의해, 상기 추가된 음성에 대한 복사 또는 잘라내기 기능을 제공하는 단계; 및
상기 적어도 하나의 프로세서에 의해, 상기 컨텐츠 편집 툴에서 상기 타임라인에 대해 선택된 시점에 상기 기능을 통해 복사 또는 잘라내기된 음성을 추가하는 단계
를 더 포함하는 컨텐츠 편집 지원 방법. - 제1항에 있어서,
상기 추가된 음성에 대응하는 텍스트의 내용 중 적어도 일부의 내용이 상기 컨텐츠 편집 툴에서 상기 타임라인에 대해 선택된 시점과 연계하여 표시되는 것을 특징으로 하는 컨텐츠 편집 지원 방법. - 제3항에 있어서,
상기 적어도 일부의 내용이 표시된 영역에 대한 사용자의 입력에 따라 상기 추가된 음성에 대응하는 텍스트의 내용, 상기 추가된 음성에 대응하는 음성 타입 및 상기 추가된 음성의 시작 시간 중 적어도 하나를 편집하기 위한 기능이 제공되는 것을 특징으로 하는 컨텐츠 편집 지원 방법. - 제1항에 있어서,
상기 적어도 하나의 프로세서에 의해, 상기 컨텐츠 편집 툴을 통해 제공된 복수의 효과음 중 적어도 하나의 효과음을 선택받는 단계; 및
상기 적어도 하나의 프로세서에 의해, 상기 컨텐츠 편집 툴에서 상기 타임라인에 대해 선택된 시점에 상기 선택된 효과음을 추가하는 단계
를 더 포함하는 컨텐츠 편집 지원 방법. - 제5항에 있어서,
상기 추가된 효과음에 대한 정보가 상기 컨텐츠 편집 툴에서 상기 타임라인에 대해 선택된 시점과 연계하여 표시되고,
상기 정보가 표시된 영역에 대한 사용자의 입력에 따라 상기 추가된 효과음의 종류 및 시작 시간 중 적어도 하나를 편집하기 위한 기능이 제공되는 것을 특징으로 하는 컨텐츠 편집 지원 방법. - 제1항에 있어서,
상기 변환하는 단계는,
상기 컨텐츠 편집 툴을 통해 입력되는 텍스트 및 상기 컨텐츠 편집 툴을 통해 선택된 음성 타입에 기반하여 상기 입력된 텍스트를 상기 선택된 음성 타입의 음성으로 변환하는 것을 특징으로 하는 컨텐츠 편집 지원 방법. - 제1항에 있어서,
상기 변환하는 단계는,
상기 타임라인에 대해 선택된 시점을 기준으로 타임라인에서 상기 변환된 음성을 추가 가능한 구간의 길이를 확인하는 단계; 및
상기 확인된 구간의 길이에 따라 상기 입력되는 텍스트의 길이를 제한하거나 또는 상기 변환된 음성의 발화 속도를 조절하는 단계
를 포함하는 것을 특징으로 하는 컨텐츠 편집 지원 방법. - 제1항에 있어서,
상기 변환된 음성을 추가하는 단계는,
상기 영상 컨텐츠에서 상기 타임라인에 대해 선택된 시점에 대한 화자의 음성을 제거한 후, 상기 변환된 음성을 추가하는 것을 특징으로 하는 컨텐츠 편집 지원 방법. - 제1항에 있어서,
상기 적어도 하나의 프로세서에 의해, 상기 타임라인상에서 타임 인디케이터가 지시하는 시점에 대응하는 썸네일 및 상기 타임 인디케이터가 지시하는 시점에 대응하는 음절 단위의 음성에 대한 텍스트 정보 중 적어도 하나를 제공하는 단계
를 더 포함하는 컨텐츠 편집 지원 방법. - 컴퓨터 장치와 결합되어 제1항 내지 제10항 중 어느 한 항의 방법을 컴퓨터 장치에 실행시키기 위해 컴퓨터 판독 가능한 기록매체에 저장된 컴퓨터 프로그램.
- 제1항 내지 제10항 중 어느 한 항의 방법을 컴퓨터 장치에 실행시키기 위한 컴퓨터 프로그램이 기록되어 있는 컴퓨터 판독 가능한 기록매체.
- 컴퓨터에서 판독 가능한 명령을 실행하도록 구현되는 적어도 하나의 프로세서
를 포함하고,
상기 적어도 하나의 프로세서에 의해,
컨텐츠 편집 툴을 통해 선택된 영상 컨텐츠가 포함하는 프레임들로부터 복수의 스냅샷을 추출하고,
상기 컨텐츠 편집 툴을 통해 상기 추출된 복수의 스냅샷을 상기 영상 컨텐츠에 대한 타임라인을 가시적으로 표현하기 위한 영역에 상기 타임라인에 따라 표시하고,
상기 컨텐츠 편집 툴을 통해 입력되는 텍스트를 음성으로 변환하고,
상기 컨텐츠 편집 툴에서 상기 타임라인을 가시적으로 표현하기 위한 영역의 상기 타임라인에 대해 선택된 시점에 상기 변환된 음성을 추가하는 것
을 특징으로 하는 컴퓨터 장치.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR20190134240 | 2019-10-28 | ||
KR1020190134240 | 2019-10-28 | ||
KR1020190164647A KR102353797B1 (ko) | 2019-10-28 | 2019-12-11 | 영상 컨텐츠에 대한 합성음 실시간 생성에 기반한 컨텐츠 편집 지원 방법 및 시스템 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020190164647A Division KR102353797B1 (ko) | 2019-10-28 | 2019-12-11 | 영상 컨텐츠에 대한 합성음 실시간 생성에 기반한 컨텐츠 편집 지원 방법 및 시스템 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20210157458A true KR20210157458A (ko) | 2021-12-28 |
KR102488623B1 KR102488623B1 (ko) | 2023-01-17 |
Family
ID=75638422
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020210182754A KR102488623B1 (ko) | 2019-10-28 | 2021-12-20 | 영상 컨텐츠에 대한 합성음 실시간 생성에 기반한 컨텐츠 편집 지원 방법 및 시스템 |
Country Status (2)
Country | Link |
---|---|
JP (2) | JP7128222B2 (ko) |
KR (1) | KR102488623B1 (ko) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007243750A (ja) * | 2006-03-10 | 2007-09-20 | Casio Comput Co Ltd | 動画処理装置及びそのプログラム |
JP2018078402A (ja) * | 2016-11-08 | 2018-05-17 | 株式会社シフトワン | コンテンツ制作装置、及び音声付コンテンツ制作システム |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100572683B1 (ko) * | 2003-09-30 | 2006-04-19 | 주식회사유진로보틱스 | 지능형 로봇의 컨텐츠 제작용 저작툴 및 이를 이용한지능형 로봇의 컨텐츠 제작 방법 |
CN101379549B (zh) | 2006-02-08 | 2011-11-23 | 日本电气株式会社 | 声音合成装置、声音合成方法 |
KR20070098362A (ko) * | 2006-03-31 | 2007-10-05 | (주)엔브이엘소프트 | 배경 음악을 동영상에 합성시키는 음성 합성 장치 및 방법 |
JP5482042B2 (ja) | 2009-09-10 | 2014-04-23 | 富士通株式会社 | 合成音声テキスト入力装置及びプログラム |
FR2980941A1 (fr) | 2011-09-29 | 2013-04-05 | France Telecom | Procede et dispositif de modification d'un message vocal compose |
WO2014002716A1 (ja) | 2012-06-26 | 2014-01-03 | ソニー株式会社 | 情報処理装置と情報処理方法およびプログラム |
-
2020
- 2020-02-17 JP JP2020024004A patent/JP7128222B2/ja active Active
-
2021
- 2021-12-20 KR KR1020210182754A patent/KR102488623B1/ko active IP Right Grant
-
2022
- 2022-08-18 JP JP2022130579A patent/JP7562610B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007243750A (ja) * | 2006-03-10 | 2007-09-20 | Casio Comput Co Ltd | 動画処理装置及びそのプログラム |
JP2018078402A (ja) * | 2016-11-08 | 2018-05-17 | 株式会社シフトワン | コンテンツ制作装置、及び音声付コンテンツ制作システム |
Also Published As
Publication number | Publication date |
---|---|
JP2022163217A (ja) | 2022-10-25 |
JP7562610B2 (ja) | 2024-10-07 |
JP2021067922A (ja) | 2021-04-30 |
KR102488623B1 (ko) | 2023-01-17 |
JP7128222B2 (ja) | 2022-08-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10140314B2 (en) | Previews for contextual searches | |
US10031921B2 (en) | Methods and systems for storage of media item metadata | |
KR102347398B1 (ko) | 터치스크린 상에 표시되는 조치 가능한 콘텐츠 | |
US20170325007A1 (en) | Methods and systems for providing audiovisual media items | |
US10169374B2 (en) | Image searches using image frame context | |
US20140164900A1 (en) | Appending content with annotation | |
KR102353797B1 (ko) | 영상 컨텐츠에 대한 합성음 실시간 생성에 기반한 컨텐츠 편집 지원 방법 및 시스템 | |
CN107517323A (zh) | 一种信息分享方法、装置及存储介质 | |
CN114023301A (zh) | 音频编辑方法、电子设备及存储介质 | |
WO2020216310A1 (zh) | 用于生成应用的方法、终端设备和计算机可读介质 | |
EP3400569A1 (en) | Generating video content items using object assets | |
US11119727B1 (en) | Digital tutorial generation system | |
US20170004859A1 (en) | User created textbook | |
KR102755555B1 (ko) | 앱 사용 패턴과 대화 분석을 통한 앱 기능 바로가기 추천 방법 및 장치 | |
JP7277635B2 (ja) | イメージに対する音声合成に基づいて映像コンテンツを生成する方法およびシステム | |
KR102488623B1 (ko) | 영상 컨텐츠에 대한 합성음 실시간 생성에 기반한 컨텐츠 편집 지원 방법 및 시스템 | |
US20140297285A1 (en) | Automatic page content reading-aloud method and device thereof | |
CN115981769A (zh) | 页面显示方法、装置、设备、计算机可读存储介质及产品 | |
CN113360127B (zh) | 音频播放方法以及电子设备 | |
CN113301436A (zh) | 播放控制方法、装置及计算机可读存储介质 | |
CN113626722A (zh) | 舆论引导方法、装置、设备及计算机可读存储介质 | |
KR102446300B1 (ko) | 음성 기록을 위한 음성 인식률을 향상시키는 방법, 시스템, 및 컴퓨터 판독가능한 기록 매체 | |
CN112216275B (zh) | 一种语音信息的处理方法、装置及电子设备 | |
KR102487672B1 (ko) | 분석 대상에 대한 고객의 니즈를 분석하는 방법 및 장치 | |
KR102427213B1 (ko) | 음성 파일에 대한 텍스트 변환 기록과 메모를 함께 관리하는 방법, 시스템, 및 컴퓨터 판독가능한 기록 매체 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A107 | Divisional application of patent | ||
PA0107 | Divisional application |
Comment text: Divisional Application of Patent Patent event date: 20211220 Patent event code: PA01071R01D Filing date: 20191211 Application number text: 1020190164647 |
|
PA0201 | Request for examination | ||
PG1501 | Laying open of application | ||
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20220331 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20221226 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20230110 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20230111 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration |