KR20220155012A - 실물화상기 및 이를 이용한 콘텐츠 제작 방법 - Google Patents

실물화상기 및 이를 이용한 콘텐츠 제작 방법 Download PDF

Info

Publication number
KR20220155012A
KR20220155012A KR1020210062717A KR20210062717A KR20220155012A KR 20220155012 A KR20220155012 A KR 20220155012A KR 1020210062717 A KR1020210062717 A KR 1020210062717A KR 20210062717 A KR20210062717 A KR 20210062717A KR 20220155012 A KR20220155012 A KR 20220155012A
Authority
KR
South Korea
Prior art keywords
content
image
voice recognition
presenter
recognition engine
Prior art date
Application number
KR1020210062717A
Other languages
English (en)
Other versions
KR102523829B1 (ko
Inventor
김성원
Original Assignee
(주)오맥스
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주)오맥스 filed Critical (주)오맥스
Priority to KR1020210062717A priority Critical patent/KR102523829B1/ko
Publication of KR20220155012A publication Critical patent/KR20220155012A/ko
Application granted granted Critical
Publication of KR102523829B1 publication Critical patent/KR102523829B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G03PHOTOGRAPHY; CINEMATOGRAPHY; ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ELECTROGRAPHY; HOLOGRAPHY
    • G03BAPPARATUS OR ARRANGEMENTS FOR TAKING PHOTOGRAPHS OR FOR PROJECTING OR VIEWING THEM; APPARATUS OR ARRANGEMENTS EMPLOYING ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ACCESSORIES THEREFOR
    • G03B21/00Projectors or projection-type viewers; Accessories therefor
    • G03B21/06Projectors or projection-type viewers; Accessories therefor affording only episcopic projection
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/4104Peripherals receiving signals from specially adapted client devices
    • H04N21/4122Peripherals receiving signals from specially adapted client devices additional display device, e.g. video projector
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/4302Content synchronisation processes, e.g. decoder synchronisation
    • H04N21/4307Synchronising the rendering of multiple content streams or additional data on devices, e.g. synchronisation of audio on a mobile phone with the video output on the TV screen
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/85Assembly of content; Generation of multimedia applications
    • H04N21/854Content authoring

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Computer Security & Cryptography (AREA)
  • General Physics & Mathematics (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Television Signal Processing For Recording (AREA)

Abstract

본 발명은 실물화상기 및 이를 이용한 콘텐츠 제작 방법으로서, 특히, 카메라를 통해 촬영된 실물을 화상으로 변환하고, 음성인식엔진에서 인식한 음성을 문자로 변환하며, 상기한 화상과 문자를 동기화하여 디스플레이에 실시간 표시할 수 있고, 상기한 화상과 문자를 이용하여 쉽게 콘텐츠를 제작할 수 있는 실물화상기 및 이를 이용한 콘텐츠 제작 방법에 관한 것이다.

Description

실물화상기 및 이를 이용한 콘텐츠 제작 방법{VISUAL PRESENTER AND METHOD FOR PRODUCING CONTENTS USING THE SAME}
본 발명은 실물화상기 및 이를 이용한 콘텐츠 제작 방법으로서, 특히, 카메라를 통해 촬영된 실물을 화상으로 변환하는 실물화상기 및 이를 이용한 콘텐츠 제작 방법에 관한 것이다.
회의, 교육, 발표 등에서 주로 사용되는 실물화상기는 구비된 카메라를 통해, 촬영 대상 실물을 촬영하고 화상으로 변환하여 모니터 또는 프로젝터 등의 디스플레이에 표시한다.
이러한 실물화상기로는 한국등록특허 제10-1512407호(이하, '특허문헌 1'이라 한다)에 기재된 것이 공지되어 있다.
특허문헌 1의 경우, 영상촬영부, 제1회전암, 제2회전암, 수평회전부, 본체, 위치유지가이드부로 구성된다.
특허문헌 1은 본체와 제2회전암 사이에 회전가능하게 연결되는 수평회전부를 구비함으로써, 제2회전암이 어느방향으로도 회전가능하게 되어 촬영매체가 본체를 중심으로 어느 평면에 있더라도 촬영할 수 있고, 제2회전암 내부에 위치유지가이드부를 구비함으로써, 소정 위치에서 제2회전암을 정지시킬 수 있다.
최근 실물화상기는 강의실, 회의실 등에서 실물화상기의 카메라를 통해 촬영된 화상을 디스플레이로 표시하고 강사 또는 발표자가 화상을 청중에게 보여주면서 설명하거나, 화상을 확대하여 청중에게 보여주며 이를 설명하는 용도로 사용된다.
그러나, 종래의 실물화상기는 단순히 화상을 디스플레이로 표시하거나, 확대된 화상을 보여주는 기능을 하므로, 화상에 관련된 강사 또는 발표자의 설명에 대한 내용은 강사 또는 발표자가 별도로 문서화된 자료를 준비하거나, 청중이 따로 필기해야 하는 번거로움이 있다.
또한, 강사 또는 발표자가 설명하는 화상에 대한 내용을 모두 문서화된 자료로 만들거나, 별도로 필기하기에는 한계가 있으므로, 청중은 녹음기 등과 같은 필기를 위한 추가적인 수단을 준비하여 내용을 기록해야 한다는 문제점이 있다.
또한, 디스플레이에는 실물화상기가 촬영한 화상만이 표시되므로, 표시된 화상을 보면서 필기를 할 경우, 청중은 들은 내용을 필기하는 것에 집중력이 분산되어 강의 또는 회의에 대한 집중도가 떨어질 수 있다.
또한, 강의 또는 회의에 청각 장애를 가진 사람이 참석할 수 있다. 이 경우, 강사 또는 발표자가 별도의 문서화된 자료를 준비하지 않고 종래의 실물화상기를 이용해 구두로 설명하는 방식의 강의 또는 회의를 진행한다면, 별도의 속기사를 섭외해야 한다는 번거로움이 있고, 속기사가 미섭외될 경우, 청각 장애를 가진 사람은 강의 또는 회의에 참석하기 어렵다는 문제점이 있다.
또한, 강사 또는 발표자는 강의나 회의를 준비하기 위해 실물화상기와 화상을 표시할 디스플레이 뿐만 아니라, 강의 또는 회의에서 설명할 화상에 대한 문서화된 자료까지 별도로 준비해야 하므로, 시간이 많이 소요되어 강의 또는 회의 준비가 비효율적으로 이루어질 수 있다는 문제점이 있다.
한국등록특허 제10-1512407호
본 발명은 전술한 문제를 해결하기 위해 안출된 것으로, 실물화상기에 음성을 문자로 변환할 수 있는 음성인식엔진을 구비하여, 실물화상기가 촬영하는 실물과, 음성인식엔진이 변환한 문자를 동기화하여 시각적으로 실시간 표시할 수 있고, 이를 저장하여 쉽고 빠르게 콘텐츠화할 수 있는 실물화상기 및 이를 이용한 콘텐츠 제작 방법을 제공하는 것을 목적으로 한다.
본 발명의 일 특징에 따른 실물화상기는 카메라를 구비하여 실물을 화상으로 변환하고, 음성인식엔진을 구비하여 음성을 문자로 변환하며, 변환된 화상 및 문자를 실시간으로 저장하거나 외부로 전송하는 것을 특징으로 한다.
또한, 상기 음성인식엔진에서 변환된 문자와, 상기 카메라에서 촬영된 화상으로 콘텐츠를 제작하는 콘텐츠 제작부;를 포함하는 것을 특징으로 한다.
또한, 상기 콘텐츠 제작부는 상기 음성인식엔진에서 변환된 문자와, 상기 카메라에서 촬영된 화상을 실시간으로 동기화하는 동기화부를 포함하는 것을 특징으로 한다.
또한, 상기 콘텐츠 제작부에서 제작된 콘텐츠를 디스플레이부에 실시간으로 전송하는 통신부;를 더 포함하는 것을 특징으로 한다.
또한, 카메라 및 음성인식엔진은 좌대에 결합된 지지암의 단부에 구비되는 것을 특징으로 한다.
또한, 상기 음성인식엔진은 1인의 음성만을 필터링하여 문자로 변환하는 것을 특징으로 한다.
또한, 상기 음성인식엔진은 다수의 음성을 개별화하여 각각 문자로 변환하는 것을 특징으로 한다.
또한, 상기 화상은 정지화상인 것을 특징으로 한다.
또한, 상기 화상은 동화상인 것을 특징으로 한다.
본 발명의 다른 특징에 따른 실물화상기를 이용한 콘텐츠 제작 방법은 음성인식엔진이 음성인식부를 통해 인식된 음성을 추출하여 실시간으로 문자로 변환하는 문자변환단계; 상기 문자변환단계에서 변환된 문자와 카메라에서 촬영된 화상을 동기화하여 콘텐츠로 제작하는 콘텐츠 제작단계;를 포함하는 것을 특징으로 한다.
또한, 상기 콘텐츠를 편집하는 콘텐츠 편집단계;를 포함하는 것을 특징으로 한다.
이상에서 살펴본 바와 같은 본 발명의 실물화상기 및 이를 이용한 콘텐츠 제작 방법에 따르면 다음과 같은 효과가 있다.
본 발명은 실물화상기에 음성인식엔진을 구비함으로써, 본 발명의 실물화상기를 이용하는 강의 또는 회의 등에서, 실물화상기로 촬영된 화상과 함께 사용자의 음성을 문자로 변환하여 실시간으로 디스플레이부에 표시할 수 있다.
이로 인해, 강사 또는 발표자와 같은 사용자가 별도로 시각적 보조 자료를 준비할 필요가 없으므로, 강의 또는 회의 등을 위한 사전 준비 작업 시간을 단축할 수 있고, 강의 또는 회의 등에 보충이 필요한 부분을 보강하는 등 사전 준비 시간을 효율적으로 활용할 수 있다.
또한, 본 발명은 촬영된 화상과 변환된 문자를 실시간으로 디스플레이부에 표시할 수 있으므로, 강의 또는 회의 등에 참석하는 청중 중 청각 장애를 가진 사람이 있을 경우, 속기사를 섭외할 필요없이 본 발명이 시각적 보조 기능을 할 수 있으므로, 편리함을 제공할 수 있다.
또한, 본 발명은 사용자의 음성이 변환된 문자와, 화상을 이용하여 강의 또는 회의 등에서 설명한 내용으로 즉시 콘텐츠를 제작할 수 있으므로, 미리 제작된 콘텐츠에 오류가 있을 경우, 본 발명을 이용하여 제작된 콘텐츠로 바로 대체가 가능하여 강의 또는 회의 등을 차질없이 진행할 수 있는 효과가 있다.
도 1은 본 발명의 바람직한 실시 예에 따른 실물화상기의 사시도.
도 2는 본 발명의 바람직한 실시 예에 따른 실물화상기를 이용한 강의 모습을 예시적으로 구현한 도.
도 3은 본 발명의 바람직한 실시 예에 따른 실물화상기의 구성 블럭도.
도 4는 본 발명의 바람직한 실시 예에 따른 실물화상기를 이용한 콘텐츠 제작 방법의 순서도.
도 5는 본 발명의 바람직한 실시 예에 따른 실물화상기를 이용하여 변환된 문자와 촬영된 화상이 실시간으로 동기화되어 디스플레이부에 표시된 형태를 예시적으로 도시한 도.
도 6은 본 발명의 바람직한 실시 예에 따른 실물화상기를 이용한 콘텐츠 제작 방법에서 콘텐츠 편집단계를 예시적으로 도시한 도.
본 발명의 바람직한 실시 예에 따른 실물화상기 및 이를 이용한 콘텐츠 제작 방법에 대해 설명하기에 앞서, 이하에서 언급되는 '화상'은 정지화상과 동화상을 통칭하여 의미하거나, 문장의 의미에 따라 정지화상과 동화상 각각을 의미할 수 있고, 촬영된 화상의 캡쳐 전 상태를 의미하거나, 캡쳐 후 상태를 의미할 수 있다.
또한, 이하에서 언급되는 '콘텐츠'는 종이 문서, 전자 문서 등의 문서화된 형태를 포함하여 의미할 수 있고, 종이 문서 또는 전자 문서 각각을 의미할 수 있다.
이하, 도면을 참조하여 본 발명의 바람직한 실시 예에 따른 실물화상기 및 이를 이용한 콘텐츠 제작 방법에 대해 설명한다.
도 1은 본 발명의 바람직한 실시 예에 따른 실물화상기의 사시도이고, 도 1은 본 발명의 바람직한 실시 예에 따른 실물화상기의 사시도이고, 도 2는 본 발명의 바람직한 실시 예에 따른 실물화상기를 이용한 강의 모습을 예시적으로 구현한 도이고, 도 3은 본 발명의 바람직한 실시 예에 따른 실물화상기의 구성 블럭도이고, 도 4는 본 발명의 바람직한 실시 예에 따른 실물화상기를 이용한 콘텐츠 제작 방법의 순서도이고, 도 5는 본 발명의 바람직한 실시 예에 따른 실물화상기를 이용하여 변환된 문자와 촬영된 화상이 실시간으로 동기화되어 디스플레이부에 표시된 형태를 예시적으로 도시한 도이고, 도 6은 본 발명의 바람직한 실시 예에 따른 실물화상기를 이용한 콘텐츠 제작 방법에서 콘텐츠 편집단계를 예시적으로 도시한 도이다.
도 1 및 도 2에 도시된 바와 같이, 본 발명의 실물화상기(1)는 조작스위치부(21)가 구비된 좌대(20)와, 좌대(20)에 굴절 가능하게 결합된 지지암(10)과, 좌대(20)에 결합된 지지암(10)의 단부에 구비된 카메라(40) 및 음성인식엔진(30), 콘텐츠 제작부(50), 통신부(60)를 포함하여 구성된다.
본 발명의 실물화상기(1)는 카메라(40)를 구비하여 실물(R)을 화상(I)으로 변환하고, 변환된 화상(I) 및 문자(T)를 실시간으로 저장하거나 외부로 전송할 수 있다.
좌대(20)는 지지암(10)과, 지지암(10)의 단부에 구비된 카메라(40) 및 음성인식 엔진을 지지하는 역할을 한다. 좌대(20)는 사용자(P)가 실물화상기(1)를 조작할 수 있도록 각종의 버튼으로 구성된 조작스위치부(21)를 구비할 수 있고, 디스플레이부(D)와 연결을 위한 출력 단자를 구비할 수 있다.
지지암(10)은 좌대(20)에 굴절 가능하게 결합되고, 좌대(20)와 결합되는 측의 반대측 단부에 카메라(40) 및 음성인식엔진(30)을 구비할 수 있다.
카메라(40)는 실물(R)을 촬영하기 위한 것으로, 지지암(10)의 단부에 구비될 수 있다. 카메라(40)는 촬영된 실물(R)을 화상(I)으로 변환하여 준다.
카메라(40)가 변환하는 화상(I)은 정지화상일 수 있다. 카메라(40)는 촬영된 실물(R)을 정지화상으로 변환할 경우, 실물화상기(1)의 적합한 위치에 내장된 캡쳐 기능으로 촬영된 실물(R)을 정지화상으로 변환할 수 있다. 캡쳐 기능은 실물화상기(1)에 별도로 내장될 수 있고, 카메라(40)에 기능을 부여할 수도 있다.
정지화상으로 변환된 실물(R)은 후술할 콘텐츠 제작부(50)의 동기화부에 의해 음성인식엔진(30)에서 변환된 문자(T)와 함께 동기화 되어 디스플레이부(D)에 실시간 표시될 수 있고, 콘텐츠 제작부(50)의 저장부에 저장되어 콘텐츠 제작에 이용될 수 있다.
또한, 카메라(40)가 변환하는 화상(I)은 동화상일 수 있다. 이 경우, 실물화상기(1)는 적합한 위치에 촬영하는 실물(R)의 움직임을 녹화할 수 있는 별도의 기능을 내장할 수 있고, 카메라(40)에 기능을 부여할 수도 있다. 변환된 동화상은 후술할 콘텐츠 제작부(50)의 저장부에 저장되어 전자 문서 형태의 콘텐츠 제작에 용이하게 이용될 수 있다.
음성인식엔진(30)은 마이크와 같은 음성인식부를 포함하여 구성될 수 있고, 이를 통해 음성을 전기신호로 변환하여 인식하고, 인식된 음성을 문자(T)로 변환할 수 있다.
음성인식엔진(30)은 카메라(40)와 같이 좌대(20)에 결합된 지지암(10)의 단부에 구비되는 것이 바람직할 수 있다.
도 2에 도시된 바와 같이, 본 발명의 실물화상기(1)를 이용하여 강의 또는 회의 등을 진행할 경우, 강사 또는 발표자(이하, 사용자(P)라 한다)가 실물화상기(1)의 카메라(40)와 근접한 위치에서 실물(R)을 보거나 만지면서 설명할 확률이 높기 때문에, 음성인식엔진(30)이 사용자(P)의 음성을 선명하게 인식하여 인식된 음성을 정확하게 문자(T)로 변환하기 위해서는 실물(R)을 촬영하는 카메라(40)와 같은 위치인 지지암(10)의 단부에 구비되는 것이 바람직할 수 있다.
음성인식엔진(30)은 음성인식부를 통해 인식된 음성 중 1인의 음성만을 필터링하여 문자(T)로 변환할 수 있다. 이 경우, 음성인식엔진(30)는 주변 소음 제거부를 포함하여 구성될 수 있고, 주변 소음 제거부를 통해 주변 소음을 제거하여 1인의 음성만을 필터링할 수 있다.
이와 같은 음성인식엔진(30)은 주변 소음을 제거하고 사용자(P)의 음성만을 필터링하여 문자(T)로 변환할 수 있으므로, 후술할 콘텐츠 제작부(50)에서 본 발명의 실물화상기(1)를 사용하는 사용자(P)의 음성만을 변환한 문자(T)와 촬영된 화상(I)으로 종이문서 또는 전자 문서 등과 같은 형태의 콘텐츠를 제작할 경우, 사용자(P) 음성 중심의 콘텐츠 제작을 용이하게 할 수 있게 한다.
또한, 음성인식엔진(30)은 다수의 음성을 개별화하여 각각 문자(T)로 변환할 수 있다.
예컨대, 실물화상기(1)를 이용하여 강의 또는 회의를 진행할 경우, 강사 또는 발표자와 같은 사용자(P)의 설명 내용 뿐만 아니라, 사용자(P)의 설명에 대한 질의응답 과정이 있을 수 있다. 이 경우, 음성인식엔진(30)은 음성인식부를 통해 다수의 음성에 대한 음성신호를 전기신호로 변환하고, 이를 개별화하여 각각 문자(T)로 변환할 수 있으므로, 강의 또는 회의 도중 다수에 의해 이루어지는 질의응답 음성을 음성별로 개별화하여 각각 문자(T)로 변환할 수 있다.
음성인식엔진(30)의 이와 같은 기능은 후술할 콘텐츠 제작부(50)가 카메라(40)를 통해 촬영된 화상(I)과 음성인식엔진(30)을 통해 변환된 문자(T)를 이용하여 콘텐츠를 제작할 경우, 강의 또는 회의 내용 뿐만 아니라 이에 관련한 주요한 질의응답도 포함된 다양한 내용을 담은 콘텐츠를 제작할 수 있게 할 수 있다.
콘텐츠 제작부(50)는 음성인식엔진(30)에서 변환된 문자(T)와, 카메라(40)에서 촬영된 화상(I)으로 콘텐츠를 제작할 수 있다.
콘텐츠 제작부(50)에는 저장부가 포함될 수 있고, 저장부는 음성인식엔진(30)에서 변환된 문자(T)와, 카메라(40)에서 촬영된 화상(I)을 저장할 수 있다. 이로 인해, 콘텐츠 제작부(50)는 음성인식엔진(30)에서 변환된 문자(T)와, 카메라(40)에서 촬영된 화상(I)을 이용하여 용이하게 콘텐츠로 제작할 수 있다.
콘텐츠는 교과서와 같은 종이 문서나, 전자 파일 형태의 전자 문서 등을 의미할 수 있으나, 이에 한정된 것은 아니다.
본 발명의 실물화상기(1)는 콘텐츠 제작부(50)로 인해, 강의 또는 회의 등에서 사용자(P)가 별도의 문서화된 자료를 준비하지 않아도 변환된 문자(T)와, 촬영된 화상(I)을 이용하여 즉시 콘텐츠 제작을 가능하게 할 수 있다.
또한, 콘텐츠 제작부(50)는 음성인식엔진(30)에서 변환된 문자(T)와, 카메라(40)에서 촬영된 화상(I)을 실시간으로 동기화하는 동기화부를 포함할 수 있다.
도 5를 참조하여 설명하면, 동기화부에서 실시간 동기화된 변환된 문자(T)와, 촬영된 화상(I)은 도 5와 같은 형태로 디스플레이부(D)에 표시될 수 있다.
본 발명에서는 동기화부로 인해 변환된 문자(T)와, 촬영된 화상(I)이 한장의 페이지 형태로 도 5와 같이 동기화되는 것으로 도시하였지만, 이는 한정된 것이 아니다.
본 발명의 실물화상기(1)는 이와 같은 콘텐츠 제작부(50)의 동기화부로 인해, 변환 문자(T)와, 촬영된 화상(I)의 실시간 동기화가 가능하여 디스플레이부(D)에 실시간으로 동기화된 형태를 표시할 수 있다.
이로 인해, 강사 또는 발표자와 같은 사용자(P)는 사전에 별도의 PPT(Power point)자료 등과 같은 시각적 보조 자료의 번거로운 준비 작업을 생략할 수 있어, 보충이 필요한 부분을 추가 준비하는 등 사전 준비 작업 시간을 효율적으로 사용할 수 있게 된다.
또한, 갑작스럽게 청각 장애를 가진 사람을 포함한 강의 또는 회의를 진행해야 할 경우, 속기사를 섭외할 필요가 없으므로, 어려운 환경에서도 강의 또는 회의 등을 매끄럽게 진행할 수 있다.
통신부(60)는 콘텐츠 제작부(50)에서 제작된 콘텐츠를 디스플레이부(D)에 실시간으로 전송할 수 있다. 이로 인해, 전술한 동기화부에서 동기화된 변환 문자(T)와, 촬영 화상(I)이 실시간으로 디스플레이부(D)에 용이하게 전송될 수 있다.
또한, 콘텐츠 제작부(50)에서 제작된 콘텐츠도 통신부(60)를 통해 디스플레이부(D)에 전송될 수 있다.
이하, 본 발명의 바람직한 실시 예에 따른 실물화상기(1)를 이용한 콘텐츠 제작 방법에 대해 설명한다.
본 발명의 바람직한 실시 예에 따른 실물화상기(1)를 이용한 콘텐츠 제작 방법은 음성인식엔진(30)에서 인식된 음성을 문자(T)로 변환하는 문자변환단계(S100), 변환된 문자(T)와, 카메라를 통해 촬영된 화상(I)을 동기화하여 콘텐츠로 제작하는 콘텐츠 제작단계(S200), 콘텐츠를 편집하는 콘텐츠 편집단계(S300)로 구성될 수 있다.
이와 같은 본 발명의 바람직한 실시 예에 따른 실물화상기(1)를 이용한 콘텐츠 제작 방법은 실물화상기(1)와 유선 또는 무선으로 연결되는 시스템에 의해 수행될 수 있고, PC 등에 설치되는 프로그램으로 구현될 수 있다.
본 발명의 실물화상기(1)를 이용한 콘텐츠 제작 방법은 문자변환단계(S100)와, 콘텐츠 제작단계(S200)가 실물화상기(1)에서 수행되고, 통신부(60)에 의해 상기한 시스템으로 전송되어 콘텐츠 편집단계(S300)가 수행되는 것과 같이, 특정 단계는 실물화상기에서 수행되고, 특정 단계는 시스템에서 수행될 수 있다. 또한, 실물화상기(1)를 이용한 콘텐츠 제작 방법을 수행하는 시스템은 문자변환단계(S100), 콘텐츠 제작단계(S200), 콘텐츠 편집단계(S300)와 같은 모든 단계를 순차적으로 수행할 수 있고, 상황에 따라 일부 단계 및 과정의 순서가 변동되어 수행될 수 있다.
문자변환단계(S100)에서는 음성인식엔진(30)이 음성인식부를 통해 인식된 음성을 추출하여 실시간으로 문자(T)로 변환하는 과정이 수행된다.
문자변환단계(S100)에서 변환된 문자(T)는 카메라(40)에서 촬영된 화상(I)과 동기화되어 콘텐츠로 제작하는 과정인 콘텐츠 제작단계(S200)가 수행된다.
이 경우, 시스템은 콘텐츠로 제작단계(S200) 이전에 동기화된 변환 문자(T)와, 촬영된 화상(I)이 디스플레이부(D)로 전송되는 과정을 수행할 수 있다.
동기화된 콘텐츠는 콘텐츠를 편집하는 콘텐츠 편집단계(S300)가 수행되어 종이 문서 또는 전자 문서 등과 같은 문서화된 형태로 콘텐츠 제작이 완료될 수 있다.
시스템은 제작이 완료된 콘텐츠를 디스플레이부(D)로 전송하여 표시하는 과정을 수행할 수 있다.
도 4에 도시된 바와 같이, 본 발명의 바람직한 실시 예에 따른 실물화상기(1)를 이용한 콘텐츠 제작 방법은 다음과 같이 수행될 수 있다.
실물화상기(1)에 구비된 음성인식엔진(30)의 작동 상태가 ON상태가 되면, 음성인식엔진(30)은 음성인식부를 통해 인식된 음성을 문자(T)로 변환하는 문자변환단계(S100)를 수행한다.
문자변환단계(S100)는 1인의 음성만을 필터링하여 문자(T)로 변환하거나, 다수의 음성을 개별화하여 각각 문자(T)를 변환하는 등 사전 설정에 따라 적합하게 음성을 문자(T)로 변환할 수 있다.
문자변환단계(S100)가 수행되고 나면, 카메라(40)를 통해 촬영된 화상(I)의 캡쳐 과정이 수행될 수 있다. 이 경우, 본 발명에서는 화상(I) 캡쳐 과정을 문자변환단계(S100) 이후에 도시하였지만, 화상(I) 캡쳐 과정은 문자변환단계(S100) 이전에 수행되거나, 문자변환단계(S100)와 동시에 수행되어도 무방하다.
카메라(40)를 통해 화상(I)이 캡쳐되면, 시스템은 촬영된 화상(I)의 캡쳐가 정지화상인지 동화상인지 판단하는 과정이 수행될 수 있다.
캡쳐된 화상(I)이 정지화상일 경우, 시스템은 문자변환단계(S100)에서 변환된 문자(T)와 정지화상을 동기화하는 과정을 수행할 수 있다.
캡쳐된 화상(I)이 정지화상이 아닐 경우, 시스템은 동화상으로 판단되는 캡쳐되는 화상(I)과 변환된 문자(T)를 동기화하는 과정을 수행할 수 있다.
시스템은 캡쳐된 화상(I)이 정지화상 또는 동화상이 아닐 경우, 촬영된 화상(I)의 캡쳐 기능에 에러가 발생한 것으로 판단하여 다시 화상(I)을 캡쳐하는 과정으로 돌아가 캡쳐 기능을 정상적으로 수행할 수 있다.
시스템은 화상(I) 캡쳐 기능을 사용하지 않을 경우, 변환된 문자(T)만으로 콘텐츠 제작단계(S200) 및 콘텐츠 편집단계(S300)를 수행할 수 있다.
도 4에 도시되지 않았지만, 시스템은 화상(I)과 문자(T)를 동기화하여 디스플레이부(D)에 실시간 표시할 수 있다. 또한, 캡쳐된 화상(I)이 없을 경우, 변환된 문자(T)만을 디스플레이부(D)에 실시간 표시할 수 있다.
문자변환단계(S100)에서부터 촬영된 화상(I)이 캡쳐되는 과정을 거쳐, 화상(I)과 문자(T)가 동기화되는 과정은 음성인식엔진(30)의 작동 상태가 OFF상태가 되기 전까지 반복적으로 수행될 수 있다.
이 경우, 시스템에서 반복적으로 수행되는 과정은 문자변환단계(S100)에서부터, 화상(I) 캡쳐 과정, 화상(I) 및 문자(T) 동기화 과정까지 수행되고 난 뒤, 다시 문자변환단계(S100)로 돌아가는 과정을 의미할 수 있다.
음성인식엔진(30)의 작동 상태가 OFF상태가 되면, 시스템은 동기화된 화상(I)과 문자(T)를 콘텐츠로 제작하여 콘텐츠화 하는 콘텐츠 제작단계(S200)를 수행할 수 있다.
콘텐츠 제작단계(S200)에서 콘텐츠로 제작되는 화상(I)과 문자(T)는 도 5에 도시된 바와 같이, 한장의 페이지 형태로 화상(I)과 문자(T)가 동기화되어 디스플레이부(D)에 표시되는 형태와 같을 수 있다.
콘텐츠 제작단계(S200)에서는 음성인식엔진(30)에서 변환한 문자(T)와, 카메라(40)를 통해 촬영된 화상(I)을 이용하여 콘텐츠가 제작되므로, 오탈자 수정이나, 캡쳐된 화상 외에 다른 정지화상 또는 동화상 삽입 등의 편집이 필요한 일종의 초안와 같은 형태의 콘텐츠가 제작될 수 있다.
따라서, 시스템은 콘텐츠를 수정하는 콘텐츠 편집단계(S300)를 수행할 수 있다.
도 6에 도시된 바와 같이, 콘텐츠 제작단계에서 제작된 콘텐츠 초안에 캡쳐된 화상(I)과 다른 화상을 삽입하여 콘텐츠를 편집하는 과정이 수행될 수 있다.
도 5에 도시된 형태가 디스플레이부(D)에 한장의 페이지 형태로 실시간 표시된 콘텐츠 초안이라고 한다면, 도 6에 도시된 형태는 콘텐츠 편집단계(S300)에서 순차적으로 편집을 대기하는 여러장의 콘텐츠 초안일 수 있다.
이와 같은 문자변환단계(S100), 콘텐츠 제작단계(S200) 및 콘텐츠 편집단계(S300)까지 수행한 후, 실물화상기(1)를 이용한 콘텐츠 제작 방법의 수행이 완료될 수 있다.
본 발명은 실물화상기(1)에 음성인식엔진(30)을 구비함으로써, 본 발명의 실물화상기(1)를 이용하는 강의 또는 회의 등에서, 실물화상기(1)로 촬영된 화상(I)과 함께 사용자(P)의 음성을 문자(T)로 변환하여 실시간으로 디스플레이부(D)에 표시할 수 있다.
이로 인해, 강사 또는 발표자와 같은 사용자(P)가 별도로 시각적 보조 자료를 준비할 필요가 없으므로, 강의 또는 회의 등을 위한 사전 준비 작업 시간을 단축할 수 있고, 강의 또는 회의 등에 보충이 필요한 부분을 보강하는 등 사전 준비 시간을 효율적으로 활용할 수 있다.
또한, 본 발명은 촬영된 화상(I)과 변환된 문자(T)를 실시간으로 디스플레이부(D)에 표시할 수 있으므로, 강의 또는 회의 등에 참석하는 청중 중 청각 장애를 가진 사람이 있을 경우, 속기사를 섭외할 필요없이 본 발명이 시각적 보조 기능을 할 수 있으므로, 편리함을 제공할 수 있다.
또한, 본 발명은 사용자(P)의 음성이 변환된 문자(T)와, 화상(I)을 이용하여 강의 또는 회의 등에서 설명한 내용으로 즉시 콘텐츠를 제작할 수 있으므로, 미리 제작된 콘텐츠에 오류가 있을 경우, 본 발명을 이용하여 제작된 콘텐츠로 바로 대체가 가능하여 강의 또는 회의 등을 차질없이 진행할 수 있는 효과가 있다.
전술한 바와 같이, 본 발명의 바람직한 실시 예를 참조하여 설명하였지만, 해당 기술분야의 통상의 기술자는 하기의 특허 청구범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 또는 변형하여 실시할 수 있다.
1: 실물화상기 10: 지지암
20: 좌대 21: 조작스위치
30: 음성인식엔진 40: 카메라
50: 콘텐츠 제작부 60: 통신부
R: 실물 D: 디스플레이부
P: 사용자 I: 화상
T: 문자
S100: 문자변환단계 S200: 콘텐츠 제작단계
S300: 콘텐츠 편집단계

Claims (11)

  1. 카메라를 구비하여 실물을 화상으로 변환하고, 음성인식엔진을 구비하여 음성을 문자로 변환하며, 변환된 화상 및 문자를 실시간으로 저장하거나 외부로 전송하는 것을 특징으로 하는 실물화상기.
  2. 제1항에 있어서,
    상기 음성인식엔진에서 변환된 문자와, 상기 카메라에서 촬영된 화상으로 콘텐츠를 제작하는 콘텐츠 제작부;를 포함하는 것을 특징으로 하는 실물화상기.
  3. 제2항에 있어서,
    상기 콘텐츠 제작부는 상기 음성인식엔진에서 변환된 문자와, 상기 카메라에서 촬영된 화상을 실시간으로 동기화하는 동기화부를 포함하는 것을 특징으로 하는 실물화상기.
  4. 제2항에 있어서,
    상기 콘텐츠 제작부에서 제작된 콘텐츠를 디스플레이부에 실시간으로 전송하는 통신부;를 더 포함하는 것을 특징으로 하는 실물화상기.
  5. 제1항에 있어서,
    상기 카메라 및 음성인식엔진은 좌대에 결합된 지지암의 단부에 구비되는 것을 특징으로 하는 실물화상기.
  6. 제1항에 있어서,
    상기 음성인식엔진은 1인의 음성만을 필터링하여 문자로 변환하는 것을 특징으로 하는 실물화상기.
  7. 제1항에 있어서,
    상기 음성인식엔진은 다수의 음성을 개별화하여 각각 문자로 변환하는 것을 특징으로 하는 실물화상기.
  8. 제1항에 있어서,
    상기 화상은 정지화상인 것을 특징으로 하는 실물화상기.
  9. 제1항에 있어서,
    상기 화상은 동화상인 것을 특징으로 하는 실물화상기.
  10. 음성인식엔진이 음성인식부를 통해 인식된 음성을 추출하여 실시간으로 문자로 변환하는 문자변환단계;
    상기 문자변환단계에서 변환된 문자와 카메라에서 촬영된 화상을 동기화하여 콘텐츠로 제작하는 콘텐츠 제작단계;를 포함하는 것을 특징으로 하는 실물화상기를 이용한 콘텐츠 제작 방법.
  11. 제10항에 있어서,
    상기 콘텐츠를 편집하는 콘텐츠 편집단계;를 포함하는 것을 특징으로 하는 실물화상기를 이용한 콘텐츠 제작 방법.
KR1020210062717A 2021-05-14 2021-05-14 실물화상기 및 이를 이용한 콘텐츠 제작 방법 KR102523829B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020210062717A KR102523829B1 (ko) 2021-05-14 2021-05-14 실물화상기 및 이를 이용한 콘텐츠 제작 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020210062717A KR102523829B1 (ko) 2021-05-14 2021-05-14 실물화상기 및 이를 이용한 콘텐츠 제작 방법

Publications (2)

Publication Number Publication Date
KR20220155012A true KR20220155012A (ko) 2022-11-22
KR102523829B1 KR102523829B1 (ko) 2023-04-20

Family

ID=84236525

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210062717A KR102523829B1 (ko) 2021-05-14 2021-05-14 실물화상기 및 이를 이용한 콘텐츠 제작 방법

Country Status (1)

Country Link
KR (1) KR102523829B1 (ko)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101240166B1 (ko) * 2012-09-05 2013-03-18 유환아이텍(주) 무선 usb 기반의 카메라 탈착형 실물화상기, 그리고 무선 usb 기반의 카메라 탈착형 실물화상기를 이용한 실시간 영상 전송 방법
KR20130130396A (ko) * 2012-05-22 2013-12-02 주식회사 성우모바일 교육매체 제작방법 및 교육매체 시스템
KR101512407B1 (ko) 2014-11-21 2015-04-16 주식회사 이베스트 실물화상기
KR20160144104A (ko) * 2015-06-08 2016-12-16 김경태 음성인식 기반의 학습용 단말, 음성인식 기반의 학습 시스템
KR102196199B1 (ko) * 2017-12-05 2020-12-30 라이브픽쳐스(주) 음성인식 기반의 사진 공유 방법, 장치 및 시스템

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20130130396A (ko) * 2012-05-22 2013-12-02 주식회사 성우모바일 교육매체 제작방법 및 교육매체 시스템
KR101240166B1 (ko) * 2012-09-05 2013-03-18 유환아이텍(주) 무선 usb 기반의 카메라 탈착형 실물화상기, 그리고 무선 usb 기반의 카메라 탈착형 실물화상기를 이용한 실시간 영상 전송 방법
KR101512407B1 (ko) 2014-11-21 2015-04-16 주식회사 이베스트 실물화상기
KR20160144104A (ko) * 2015-06-08 2016-12-16 김경태 음성인식 기반의 학습용 단말, 음성인식 기반의 학습 시스템
KR102196199B1 (ko) * 2017-12-05 2020-12-30 라이브픽쳐스(주) 음성인식 기반의 사진 공유 방법, 장치 및 시스템

Also Published As

Publication number Publication date
KR102523829B1 (ko) 2023-04-20

Similar Documents

Publication Publication Date Title
JP6433073B2 (ja) オーディノイズリダクション回路、該オーディノイズリダクション回路を用いたスマートターミナル及び授業方法
CN101180877B (zh) 远程分发系统及远程分发方法
KR101270780B1 (ko) 가상 강의실 강의 방법 및 장치
van Es et al. Making the most of teacher self-captured video
KR101351085B1 (ko) 실물화상기
KR20130142458A (ko) 강의자가 강의 중에 강의 화면을 구성할 수 있는 가상 강의실 강의 장치
CN110401810A (zh) 虚拟画面的处理方法、装置、系统、电子设备及存储介质
JP2022020703A (ja) 手書き装置および音声・手書き通信システム
CN111179650A (zh) 一种纸写板书和讲解自动文档化的讲台系统
KR102523829B1 (ko) 실물화상기 및 이를 이용한 콘텐츠 제작 방법
Budkov et al. Event-driven content management system for smart meeting room
JP6810515B2 (ja) 手書き情報処理装置
CN210402777U (zh) 一种虚拟现实教学设备
Mitsuhara et al. Video ethnography: A guide
JP7361612B2 (ja) 情報処理方法、情報処理装置、およびプログラム
JP2006229592A (ja) コンテンツ作成装置、画像/音声出力装置および制御プログラム
US20220101743A1 (en) Studio Arrangement and Playing Devices Whereby Online Students Worldwide Can Learn Mathematics from an Outstanding Teacher by Watching Videos Showing the Teachers Face Body Language and Clearly Legible Writing
JP2003333561A (ja) モニタ画面表示方法、端末装置及びテレビ会議システム
EP4156147B1 (en) System, device, and method for improving visual and/or auditory tracking of a presentation given by a presenter
JP4179082B2 (ja) ビジュアル情報の記録方法及び記録装置
US20240073369A1 (en) Personal meeting notes assistant and methods of its use
WO2017183127A1 (ja) 表示装置、出力装置、および情報表示方法
CN113794824B (zh) 室内可视化文档智能交互式采集方法、装置、系统及介质
Holt et al. Building a multimodal corpus to study the development of techno-semio-pedagogical competence across different videoconferencing settings and languages
CN109862311B (zh) 视频内容的实时制作方法

Legal Events

Date Code Title Description
E90F Notification of reason for final refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant