KR101849229B1 - CCTV video monitoring system using voice recognition - Google Patents
CCTV video monitoring system using voice recognition Download PDFInfo
- Publication number
- KR101849229B1 KR101849229B1 KR1020170108230A KR20170108230A KR101849229B1 KR 101849229 B1 KR101849229 B1 KR 101849229B1 KR 1020170108230 A KR1020170108230 A KR 1020170108230A KR 20170108230 A KR20170108230 A KR 20170108230A KR 101849229 B1 KR101849229 B1 KR 101849229B1
- Authority
- KR
- South Korea
- Prior art keywords
- voice
- screen control
- command code
- video surveillance
- administrator
- Prior art date
Links
- 238000012544 monitoring process Methods 0.000 title abstract 3
- 238000012806 monitoring device Methods 0.000 claims abstract description 7
- 238000000605 extraction Methods 0.000 claims description 14
- 238000006243 chemical reaction Methods 0.000 claims description 10
- 238000004891 communication Methods 0.000 claims description 9
- 239000000284 extract Substances 0.000 claims description 6
- 238000000034 method Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 9
- 230000005540 biological transmission Effects 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 230000000994 depressogenic effect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000005855 radiation Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/18—Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast
- H04N7/181—Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast for receiving images from a plurality of remote sources
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/41—Structure of client; Structure of client peripherals
- H04N21/422—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
- H04N21/42203—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS] sound input device, e.g. microphone
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/41—Structure of client; Structure of client peripherals
- H04N21/422—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
- H04N21/42204—User interfaces specially adapted for controlling a client device through a remote control device; Remote control devices therefor
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Closed-Circuit Television Systems (AREA)
Abstract
Description
본 발명은 영상 감시 시스템으로서, 음성인식을 통한 지능형 영상 감시 시스템에 관한 것이다.The present invention relates to a video surveillance system, and to an intelligent video surveillance system through voice recognition.
일반적으로 CCTV 영상감시기기는 설치된 카메라들로부터 전송되는 촬영 영상들을 카메라별로 구분하여 처리하고, 기록 관리하는 장치, 영상을 디스플레이하는 모니터 및 키보드장치 등을 포함하여 구성된다.Generally, a CCTV video surveillance apparatus includes a device for processing and managing records of images taken from installed cameras by camera, a monitor and a keyboard device for displaying images, and the like.
이러한 구성에 의하면, 해당 영상감시기기는 관리지역에 설치된 카메라들 각각에서 촬영되는 영상들을 시스템으로 전송하여 분석, 저장 관리되며, 모니터에 분할하여 디스플레이되도록 하거나 특정 카메라의 영상이 디스플레이되도록 조작할 수 있다.According to this configuration, the video surveillance apparatus can transmit the images taken by each of the cameras installed in the management area to the system for analysis, storage management, division into the monitor, or operation for displaying images of the specific camera .
위와 같은 구성은 직접 관리자가 영상감시기기에 연결된 키보드, 마우스 등을 이용하여 카메라의 고유번호를 입력하거나 클릭하여 실시간 화면 또는 저장되어있는 영상화면을 조작 또는 디스플레이되도록 할 수 있도록 되어 있지만, 직접 관리자 이외의 관리자에게는 접근성, 조작성이 좋지 않아 활용성이 떨어지는 문제점이 있다.In the above configuration, the administrator can input or click the unique number of the camera using a keyboard, a mouse, etc. connected to the video surveillance device so as to operate or display the live screen or the stored video screen. However, There is a problem that accessibility and operability of the manager of the server are poor and the usability is poor.
또한, 긴급상황 발생시 해당지역 카메라의 고유번호를 직접 관리자만이 키보드장치를 이용하여 입력하여 모니터의 화면을 전환시킬 수 있으므로, 긴급상황 발생시 즉각적인 상황판단 및 그에 따른 즉각적인 대처가 어려운 문제점이 있다.In addition, when an emergency occurs, only the administrator directly inputs the unique number of the local camera by using the keyboard device to switch the screen of the monitor. Therefore, it is difficult to promptly determine the situation in the event of an emergency and to cope with it promptly.
본 발명의 기술적 과제는 음성인식을 통하여 화면 제어할 수 있는 지능형 영상 감시 시스템을 제공하는데 있다.An object of the present invention is to provide an intelligent video surveillance system capable of controlling a screen through voice recognition.
본 발명의 실시 형태는 영상감시기기를 원격 제어하는 리모컨으로서, 사용자의 음성을 인식하여 인식된 음성을 음성 파일로 변환하여 영상감시기기로 전송하는 음성인식 리모컨; 및 상기 음성인식 리모컨으로부터 수신되는 음성 파일을 판독하여 음성 명령 코드를 생성하며, 판독된 음성 명령 코드에 따른 화면 제어를 수행하는 영상감시기기;를 포함할 수 있다.An embodiment of the present invention is a remote control for remotely controlling a video surveillance apparatus, comprising: a voice recognition remote controller for recognizing a user's voice, converting the recognized voice into an audio file, and transmitting the voice file to the video surveillance device; And an image monitoring device for reading a voice file received from the voice recognition remote controller to generate a voice command code and performing screen control according to the voice command code read.
상기 영상감시기기는, CCTV 영상이 표시되는 디스플레이부; 상기 음성인식리모컨과 무선 통신하여 음성 파일을 수신하는 무선 통신부; 상기 음성인식리모컨으로부터 수신된 음성 파일을 판독하여 음성 명령 코드를 생성하는 음성 명령 코드 생성부; 및 CCTV 영상을 상기 디스플레이부를 통해 재생하며, 상기 음성 명령 코드에 따른 디스플레이부의 화면 제어를 수행하는 제어부;를 포함할 수 있다.The video surveillance apparatus includes: a display unit displaying a CCTV image; A wireless communication unit for wirelessly communicating with the voice recognition remote control to receive an audio file; A voice command code generating unit for reading a voice file received from the voice recognition remote controller and generating a voice command code; And a control unit for reproducing the CCTV image through the display unit and performing screen control of the display unit according to the voice command code.
상기 음성 명령 코드 생성부는, 명령 단어별로 음성 명령 코드가 할당되어 저장된 음성 명령 코드 DB; 상기 음성인식리모컨으로부터 수신된 음성 파일을 텍스트로 변환하는 STT 변환 모듈; 및 상기 STT 변환 모듈에서 변환된 텍스트에 매칭되는 명령 단어에 할당된 음성 명령 코드를 추출하는 음성 명령 코드 추출 모듈;을 포함할 수 있다.The voice command code generation unit may include: a voice command code DB in which a voice command code is assigned and stored for each command word; An STT conversion module for converting the voice file received from the voice recognition remote controller into text; And a voice command code extraction module for extracting a voice command code assigned to a command word matched with the converted text in the STT conversion module.
상기 영상감시기기는, 관리자별로 화면 제어 권한을 할당하여, 관리자의 화면 제어 권한의 범위 내에서만 화면 제어가 이루어지도록 함을 특징으로 할 수 있다.The video surveillance apparatus allocates a screen control right for each administrator so that the screen control is performed only within the range of the screen control right of the administrator.
상기 영상감시기기는, 관리자 아이디별로 화면 제어 권한이 각각 다르게 할당된 화면 제어 권한 DB; 관리자 아이디별로 발음 특성이 저장된 발음 특성 DB; 상기 음성인식리모컨으로부터 수신된 음성 파일의 발음 특성을 추출하는 발음 특성 추출부; 및 추출된 발음 특성에 할당된 관리자 아이디를 추출하는 관리자 아이디 추출부;을 포함하며, 상기 제어부는, 추출된 관리자 아이디의 화면 제어 권한을 상기 화면 제어 권한 DB로부터 추출하여, 관리자 아이디의 화면 제어 권한의 범위 내에서만 화면 제어가 이루어지도록 할 수 있다.Wherein the video surveillance apparatus comprises: a screen control authority DB to which screen control privileges are assigned differently for each administrator ID; A pronunciation characteristic DB storing pronunciation characteristics for each administrator ID; A pronunciation characteristic extraction unit for extracting a pronunciation characteristic of a voice file received from the voice recognition remote controller; And an administrator ID extraction unit for extracting an administrator ID assigned to the extracted pronunciation characteristic, wherein the control unit extracts screen control right of the extracted administrator ID from the screen control right DB, So that the screen can be controlled only within the range of.
상기 음성인식 리모컨은, 음성 입력 요청받는 음성 입력 버튼;을 포함하며, 상기 음성 입력 버튼이 눌리어진채로 입력되는 음성을 음성 파일로 변환하여 상기 영상감시기기로 전송할 수 있다.The voice recognition remote controller includes a voice input button to which a voice input is requested. The voice inputted through the voice input button is converted into a voice file and transmitted to the video monitor.
상기 음성인식 리모컨은, 비상 상황임을 입력받는 비상 버튼;을 포함하며, 상기 비상 버튼과 음성 입력 버튼이 동시에 눌리어진채로 입력되는 경우, 음성 파일과 함께 비상 상태 알림 메시지를 상기 영상감시기기로 전송하며, 상기 제어부는, 상기 비상 상태 알림 메시지를 수신하는 경우, 음성 파일로부터 파악된 음성 명령 코드가 음성 파일 판독된 관리자의 화면 제어 권한의 범위를 넘어서는 경우라 하더라도, 파악된 음성 명령 코드에 따르는 화면 제어가 이루어지도록 함을 특징으로 할 수 있다.And an emergency button for inputting an emergency state when the emergency button and the voice input button are simultaneously pressed, transmits an emergency state notification message together with the voice file to the video surveillance device Even if the voice command code recognized from the voice file exceeds the range of the screen control authority of the administrator who has read the voice file, So that control can be performed.
본 발명의 실시 형태에 따르면 음성인식을 통하여 화면 제어함으로써, 영상 감시를 효율적으로 할 수 있다. 또한 본 발명의 실시 형태에 따르면 화면 제어 권한을 부여하고, 비상 상태에서 화면 제어 권한을 해제할 수 있다.According to the embodiment of the present invention, video surveillance can be efficiently performed by controlling the screen through voice recognition. According to the embodiment of the present invention, the screen control authority can be granted and the screen control authority can be released in the emergency state.
도 1은 본 발명의 실시예에 따른 음성인식을 통한 지능형 영상 감시 시스템의 구성도.
도 2는 본 발명의 실시예에 따른 영상감시기기의 구성 블록도.
도 3은 본 발명의 실시예에 따른 음성 명령 코드 생성부의 구성 블록도.
도 4는 본 발명의 실시예에 따른 화면 제어 권한 테이블표의 예시 그림.
도 5는 본 발명의 실시예에 따른 관리자별 화면 제어 권한에 따른 화면 제어되는 예시 그림.
도 6은 본 발명의 실시예에 따른 음성인식 리모컨의 사시도.
도 7은 본 발명의 실시예에 따른 비상 버튼의 눌림 여부에 따른 화면 제어 예시 그림.
도 8은 본 발명의 실시예에 따라 VoIP 기능이 추가된 시스템 구성도.1 is a block diagram of an intelligent video surveillance system using speech recognition according to an embodiment of the present invention;
2 is a block diagram of a configuration of a video surveillance apparatus according to an embodiment of the present invention;
3 is a configuration block diagram of a voice command code generation unit according to an embodiment of the present invention;
FIG. 4 illustrates an example of a screen control authority table according to an embodiment of the present invention. FIG.
FIG. 5 is a diagram illustrating an example of screen control according to an administrator's screen control authority according to an embodiment of the present invention. FIG.
6 is a perspective view of a voice recognition remote controller according to an embodiment of the present invention;
FIG. 7 is an exemplary screen control according to whether an emergency button is depressed according to an embodiment of the present invention. FIG.
8 is a system configuration diagram to which a VoIP function is added according to an embodiment of the present invention;
이하, 본 발명의 장점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나 본 발명은, 이하에서 개시되는 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 것이며, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것으로, 본 발명은 청구항의 범주에 의해 정의될 뿐이다. 또한, 본 발명을 설명함에 있어 관련된 공지 기술 등이 본 발명의 요지를 흐리게 할 수 있다고 판단되는 경우 그에 관한 자세한 설명은 생략하기로 한다.BRIEF DESCRIPTION OF THE DRAWINGS The advantages and features of the present invention, and how to achieve them, will be apparent from the following detailed description of embodiments thereof taken in conjunction with the accompanying drawings. The present invention may, however, be embodied in many different forms and should not be construed as being limited to the exemplary embodiments set forth herein. Rather, these embodiments are provided so that this disclosure will be thorough and complete and will fully convey the concept of the invention to those skilled in the art. And the present invention is only defined by the scope of the claims. In the following description, well-known functions or constructions are not described in detail since they would obscure the invention in unnecessary detail.
도 1은 본 발명의 실시예에 따른 음성인식을 통한 지능형 영상 감시 시스템의 구성도이다.1 is a block diagram of an intelligent video surveillance system using speech recognition according to an embodiment of the present invention.
본 발명은 음성인식을 통한 지능형 영상 감시 시스템에 관한 것으로서, CCTV영상을 저장 및 재생하는 영상감시기기(NVR,DVR)에 무선음성인식수신제어유닛이 설치되고, 무선음성송신유닛이 설치된 스마트기기를 통해 음성을 시스템명령어로 변환하여 영상감시기기를 조작하는 시스템이며, 영상 검색, 재생,PTZ제어, 화면 확대 축소와 같은 명령을 실행하게 함으로서 간단히 영상감시기기(200)를 조작한다.The present invention relates to an intelligent video surveillance system using voice recognition, in which a wireless voice recognition reception control unit is installed in a video surveillance device (NVR, DVR) for storing and reproducing a CCTV image, and a smart device equipped with a wireless voice transmission unit And controls the
이를 위하여, 본 발명의 음성인식을 통한 지능형 영상 감시 시스템은, 음성인식 리모컨(100), 영상감시기기(200)를 포함할 수 있다.To this end, the intelligent video surveillance system using speech recognition according to the present invention may include a voice recognition
음성인식 리모컨(100)은, 영상감시기기(200)를 원격 제어하는 리모컨으로서 사각면체, 육각면체, 원형체, 기둥체 등의 다양한 하우징 형태를 가질 수 있다. 음성인식 리모컨(100)은, 사용자의 음성을 인식하여 인식된 음성을 음성 파일로 변환하여 영상감시기기(200)로 전송한다. The voice recognition
이를 위해 음성인식 리모컨(100)은 음성 입력을 요청받는 음성 입력 버튼(110)과, 입력되는 음성을 인식하는 마이크(120)와, 인식된 음성을 음성 파일로 변환하여 영상감시기기(200)로 무선 전송하는 음성 파일 전송 모듈(미도시)을 포함할 수 있다.To this end, the voice recognition
예를 들어, 관리자가 음성 입력 버튼(110)을 누른채로 마이크(120)를 향해 음성 명령을 발음하게 되면, 마이크(120)를 통해 입력되는 관리자의 음성 명령은, 음성 파일로 변환되어 영상감시기기(200)로 무선 전송된다. 이때 무선 전송은, 적외선 통신(Infrared Radiation), 블루투스(Bluetooth), 홈 RF(Radio Frequency) 및 무선 랜(Wireless LAN)과 같은 무선 통신 방식이 사용될 수 있다. For example, when the manager sounds a voice command toward the
영상감시기기(200)는 각 구역의 CCTV 영상을 실시간으로 표시하는 기기로서, 실시간 CCTV 영상뿐만 아니라 이전에 기록된 CCTV 영상도 복원 재생할 수 있다. 본 발명의 영상감시기기(200)는, 음성인식 리모컨(100)으로부터 수신되는 음성 파일을 판독하여 음성 명령 코드를 생성하며, 판독된 음성 명령 코드에 따른 화면 제어를 수행한다.The
따라서 본 발명은 디스플레이된 화면상태에서 실시간 영상 검색, 재생 등의 명령을 수행하며, 날짜별 영상 검색, 시간별 영상 검색, 특정 카메라 디스플레이 확대 등의 다양한 음성명령을 통하여 보다 간편하게 시스템을 운영할 수 있다. 이하 도 2 내지 도 5와 함께 영상감시기기(200)에 대하여 상술하기로 한다.Therefore, the present invention performs commands such as real-time image search and playback in the displayed screen state, and can easily operate the system through various voice commands such as date-based image search, time-based image search, and specific camera display enlargement. Hereinafter, the
도 2는 본 발명의 실시예에 따른 영상감시기기의 구성 블록도이며, 도 3은 본 발명의 실시예에 따른 음성 명령 코드 생성부의 구성 블록도이며, 도 4는 본 발명의 실시예에 따른 화면 제어 권한 테이블표의 예시 그림이며, 도 5는 본 발명의 실시예에 따른 관리자별 화면 제어 권한에 따른 화면 제어되는 예시 그림이다.FIG. 2 is a block diagram of a video surveillance apparatus according to an embodiment of the present invention. FIG. 3 is a block diagram of a voice command code generating unit according to an embodiment of the present invention. FIG. 5 is a diagram illustrating an example of screen control according to an administrator's screen control authority according to an embodiment of the present invention. FIG.
영상감시기기(200)는 도 2에 도시한 바와 같이, 디스플레이부(220), 무선 통신부(230), 음성 명령 코드 생성부(240), 및 제어부(210)를 포함할 수 있다. 또한 화면 제어 권한 DB(250), 발음 특성 DB(260), 발음 특성 추출부(270), 및 관리자 아이디 추출부(280)를 더 포함할 수 있다.The
디스플레이부(220)는, CCTV 영상이 표시되는 화면이다. 이러한 디스플레이부(220)는, 터치스크린패널의 단일 형태로 구현될 수 있다. 터치스크린패널은, 입력과 표시를 동시에 수행할 수 있는 터치 스크린 화면을 제공하여 단말기의 전면에 마련되어 작업 화면을 표시하는 표시창으로서, 관리자와의 소통을 위한 그래픽 유저 인터페이스(GUI;Graphic User Interface)를 표시한다.The
무선 통신부(230)는, 음성인식리모컨과 무선 통신하여 음성 파일을 수신하는데, 적외선 통신(Infrared Radiation), 블루투스(Bluetooth), 홈 RF(Radio Frequency) 및 무선 랜(Wireless LAN)과 같은 무선 통신 방식이 사용될 수 있다.The
음성 명령 코드 생성부(240)는, 음성인식리모컨으로부터 수신된 음성 파일을 판독하여 음성 명령 코드를 생성한다. 이를 위해 음성 명령 코드 생성부(240)는 도 3에 도시한 바와 같이 음성 명령 코드 DB(241), STT 변환 모듈(242), 및 음성 명령 코드 추출 모듈(243)을 포함할 수 있다.The voice command
음성 명령 코드 DB(241)는, 명령 단어별로 음성 명령 코드가 할당되어 저장된 데이터베이스이다. 예를 들어, '재생'의 명령 단어에는 'Ox0001a'의 음성 명령 코드가 할당되며, '날짜별 검색'의 명령 단어에는 'Ox0002a'의 음성 명령 코드가 할당될 수 있다.The voice command code DB 241 is a database in which a voice command code is assigned and stored for each command word. For example, a voice command code of 'Ox0001a' may be assigned to a command word of 'playback', and a voice command code of 'Ox0002a' may be allocated to a command word of 'search by date'.
참고로, 이러한 데이터베이스는, 하드디스크 드라이브(Hard Disk Drive), SSD 드라이브(Solid State Drive), 플래시메모리(Flash Memory), CF카드(Compact Flash Card), SD카드(Secure Digital Card), SM카드(Smart Media Card), MMC 카드(Multi-Media Card) 또는 메모리 스틱(Memory Stick) 등 정보의 입출력이 가능한 모듈로서 장치의 내부에 구비되어 있을 수도 있고, 별도의 장치에 구비되어 있을 수도 있다.For reference, these databases include hard disk drives, solid state drives (SSD), flash memory, CF cards, SD cards (Secure Digital cards), SM cards A SmartMedia card, an MMC card (Multi-Media Card), a Memory Stick, or the like, which may be provided in the device or may be provided in a separate device.
STT 변환 모듈(242)은, 음성인식리모컨으로부터 수신된 음성 파일을 텍스트로 변환하는 모듈이다. 알려진 바와 같이, STT(Speech To Text) 변환은 음성 파일을 실시간으로 텍스트로 변환하는 알고리즘 기술로서, 이러한 공지된 STT 변환을 통하여 텍스트로 변환한다.The
음성 명령 코드 추출 모듈(243)은, STT 변환 모듈(242)에서 변환된 텍스트에 매칭되는 명령 단어에 할당된 음성 명령 코드를 추출하는 모듈이다. 예를 들어, STT 변환 모듈(242)에서 변환된 텍스트가 '날짜별 검색'이라는 명령 단어인 경우, 이에 할당된 'Ox0002a'의 음성 명령 코드가 추출된다.The voice command
제어부(210)는, CCTV 영상을 디스플레이부(220)를 통해 재생하며, 음성 명령 코드에 따른 디스플레이부(220)의 화면 제어를 수행한다. 예를 들어, 'Ox0002a'의 음성 명령 코드가 추출되는 경우, '날짜별 검색'할 수 있는 검색 화면창을 디스플레이부(220)에 표시한다.The
한편, 영상감시기기(200)를 담당하는 관리자가 여러 명 있을 수 있는데, 각 관리자에게 동일한 화면 제어 권한을 부여할 수 있지만, 도 4에 도시한 바와 같이 각 관리자별로 서로 다른 화면 제어 권한을 부여할 수 있다.On the other hand, there may be a plurality of administrators responsible for the
이러한 화면 제어 권한이 부여되도록 하는 경우, 영상감시기기(200)는, 관리자별로 화면 제어 권한을 할당하여, 관리자의 화면 제어 권한의 범위 내에서만 화면 제어가 이루어지도록 한다.When the screen control authority is to be granted, the
이를 위하여 본 발명의 영상감시기기(200)는, 화면 제어 권한 DB(250), 발음 특성 DB(260), 발음 특성 추출부(270), 및 관리자 아이디 추출부(280)를 포함할 수 있다.To this end, the
화면 제어 권한 DB(250)는, 관리자 아이디별로 화면 제어 권한이 각각 다르게 할당된 데이터베이스이다. 즉, 도 4에 도시한 바와 같이 관리자별로 각각 다른 화면 제어 권한이 부여되어 할당될 수 있다.The screen
발음 특성 DB(260)는, 관리자 아이디별로 발음 특성이 저장된 데이터베이스이다. 이러한 발음 특성은, 음성 주파수대역 등이 해당될 수 있다. 예를 들어, 제1관리자 아이디를 가지는 관리자는 음성 제1주파수 대역을 가지나, 제2관리자 아이디를 가지는 관리자는 음성 제2주파수 대역을 가지는 경우, 서로 다른 발음 특성으로 구별될 수 있다. 이러한 발음 특성은, 음성 주파수대역뿐만 아니라, 하이톤, 저음, 사투리 등의 다양한 발음 특성이 해당될 수 있다.The
발음 특성 추출부(270)는, 음성인식리모컨으로부터 수신된 음성 파일의 발음 특성을 추출한다. 음성 인식을 통하여 발음 특성을 추출하는 것이다.The pronunciation
관리자 아이디 추출부(280)는, 추출된 발음 특성에 할당된 관리자 아이디를 추출한다. 예를 들어, 추출된 발음 특성이 음성 제2주파수 대역인 경우 제2관리자 아이디를 음성 명령의 주인공으로서 추출할 수 있다.The administrator
제어부(210)는, 추출된 관리자 아이디의 화면 제어 권한을 상기 화면 제어 권한 DB(250)로부터 추출하여, 관리자 아이디의 화면 제어 권한의 범위 내에서만 화면 제어가 이루어지도록 한다.The
예를 들어, 도 5에 도시한 바와 같이 제1관리자는 모든 권한을 가지고, 제2관리자는 일부 권한만 주어졌을 때, 동일한 음성 명령이라 할지라도 제2관리자의 화면 제어 권한은 제한을 받게 된다.For example, as shown in FIG. 5, the first administrator has all rights, and when the second administrator is given only a partial authority, the second administrator's screen control authority is limited even though the same voice command is given.
한편, 이와 같이 각 관리자별로 화면 제어 권한이 다르게 할당되어 있을 경우, 비상 사태 발생시에는 문제가 발생할 수 있다. 예를 들어, 모든 권한을 가진 관리자가 해외 출장으로 부재중이거나 하는 경우 문제가 발생할 수 있다. 이러한 점을 고려하여 비상 사태에는 모든 관리자에게 모든 권한을 부여하는 방안을 제시한다. 이하 도 6 및 도 7과 함께 상술한다.On the other hand, if screen control rights are assigned differently for each manager, a problem may arise when an emergency occurs. For example, a problem may arise if an administrator with full authority is absent from overseas trips. Taking this into consideration, we propose to grant all the authorities to all managers in an emergency. This will be described below with reference to Figs. 6 and 7.
도 6은 본 발명의 실시예에 따른 음성인식 리모컨의 사시도이며, 도 7은 본 발명의 실시예에 따른 비상 버튼의 눌림 여부에 따른 화면 제어 예시 그림이며, 도 8은 본 발명의 실시예에 따라 VoIP 기능이 추가된 시스템 구성도이다.FIG. 6 is a perspective view of a voice recognition remote control according to an embodiment of the present invention, FIG. 7 is a view illustrating an example of screen control according to whether or not an emergency button is pressed according to an embodiment of the present invention, VoIP function is added.
음성인식 리모컨(100)은, 도 6에 도시한 바와 같이 음성 입력 요청받는 음성 입력 버튼(110) 이외에도, 비상 상황임을 입력받는 비상 버튼(130)을 더 구비한다. 따라서 비상 버튼(130)과 음성 입력 버튼(110)이 동시에 눌리어진 채로 입력되는 경우, 음성인식 리모컨(100)은, 음성 파일과 함께 비상 상태 알림 메시지를 영상감시기기(200)로 전송한다.As shown in FIG. 6, the voice recognition
영상감시기기(200)의 제어부(210)는, 비상 상태 알림 메시지를 수신하는 경우, 음성 파일로부터 파악된 음성 명령 코드가 음성 파일 판독된 관리자의 화면 제어 권한의 범위를 넘어서는 경우라 하더라도, 파악된 음성 명령 코드에 따르는 화면 제어가 이루어지도록 한다.Even when the voice command code identified from the voice file exceeds the range of the screen control authority of the administrator who has read the voice file in the case of receiving the emergency status notification message, So that screen control according to the voice command code is performed.
예를 들어, 제4관리자는 A, B구역 CCTV는 열람 가능하지만, C구역 CCTV는 열람할 수 없는 권한을 가지고 있다고 가정한다.For example, the fourth manager assumes that CCTVs in areas A and B can be viewed, but CCTV in section C has unauthorized access.
이럴 경우, 도 7(a)에 도시한 바와 같이 제4관리자가 음성 입력 버튼(110)만 누른채로 'C구역 재생'의 음성을 입력하더라도 C구역 CCTV 영상이 재생되지 않도록 한다. 그러나 도 7(b)에 도시한 바와 같이 제3관리자가 음성 입력 버튼(110)과 비상 버튼(130)을 동시에 누른채로 'B구역 재생'의 음성을 입력하는 경우 B구역 CCTV 영상이 재생되도록 한다.In this case, as shown in FIG. 7 (a), even if the fourth manager inputs a voice of 'C zone playback' while holding only the
다만, 누구나 불법적으로 비상 버튼(130)을 활용할 우려가 있기 때문에, 이러한 비상 버튼(130)을 누른 이력을 기록해놓도록 한다. 이를 위하여 영상감시기기(200)는 이러한 비상 버튼(130)을 누른 관리자 아이디와, 화면 제어 내용을 기록해놓아 추후 내부 감사시에 열람할 수 있도록 한다.However, since there is a possibility that anyone uses the
한편, 본 발명은, VoIP 기능이 추가될 수 있다. 알려진 바와 같이 인터넷 전화(VoIP;Voice over Internet Protocol)는 IP 주소를 사용하는 네트워크를 통해 음성을 디지털 패킷(데이터 전송의 최소 단위)으로 변환하고 전송하는 기술이다.On the other hand, the present invention can add a VoIP function. As is known, Voice over Internet Protocol (VoIP) is a technology that converts voice to a digital packet (the minimum unit of data transmission) over a network using an IP address and transmits it.
이에 본 발명은, VOIP의 기능을 추가하여 양방향 음성 통신이 가능하도록 한다. 따라서 도 8에 도시한 바와 같이 통합관제센터내 음성인식 지능형 영상감시기기에서 해당하는 카메라 또는 비상벨을 호출하고(ex. 100번 카메라 호출), 호출한 해당 개소에 설치되어 있는 음성 송출입이 가능한 카메라 또는 비상벨과 양방향으로 음성통화를 실행할 수 있다. 현재는 수동(인터폰 형식)으로 현장에서 사용자가 버튼을 누를시 통합관제센터와 통화가 연결되나, 통합관제센터에서 해당 개소를 클릭하여 방송을 할 수 있는 양방향 음성통화 가 가능하게 된다.Accordingly, the present invention adds a function of VOIP to enable bi-directional voice communication. Therefore, as shown in FIG. 8, the voice recognition intelligent video surveillance device in the integrated control center calls the corresponding camera or emergency bell (ex: camera 100), and the voice installed in the corresponding place You can make voice calls in both directions with the camera or emergency bell. At present, when a user presses a button in the field manually (interphone format), a call is connected to the integrated control center, but a two-way voice call is possible so that the integrated control center can click the corresponding point to broadcast.
이를 위하여, 카메라 및 비상벨등 외부 기기의 알람신호가 영상감시기기로 전달되었을때, 영상감시기기의 모니터 화면에 영상 팝업이 실행되고, 동시에 VoIP를 통환 음성통화가 활성화되어, 해당 장소에 실시간 안내방송을 진행할 수 있다. 이때, 방송은 양방향 음성 통화로 이루어진다.For this purpose, when an alarm signal of an external device such as a camera and an emergency bell is transmitted to the video monitoring device, a video popup is executed on the monitor screen of the video monitoring device, and at the same time, a voice call is activated, The broadcast can proceed. At this time, the broadcast is made by two-way voice communication.
상술한 본 발명의 설명에서의 실시예는 여러가지 실시가능한 예중에서 당업자의 이해를 돕기 위하여 가장 바람직한 예를 선정하여 제시한 것으로, 이 발명의 기술적 사상이 반드시 이 실시예만 의해서 한정되거나 제한되는 것은 아니고, 본 발명의 기술적 사상을 벗어나지 않는 범위내에서 다양한 변화와 변경 및 균등한 타의 실시예가 가능한 것이다.The embodiments of the present invention described above are selected and presented in order to assist those of ordinary skill in the art from among various possible examples. The technical idea of the present invention is not necessarily limited to or limited to these embodiments Various changes, modifications, and other equivalent embodiments are possible without departing from the spirit of the present invention.
100:음성인식 리모컨
110:음성 입력 버튼
120:마이크
130:비상 버튼
200:영상 감시 기기100: Voice recognition remote control
110: Voice input button
120: microphone
130: emergency button
200: Video surveillance equipment
Claims (7)
상기 음성인식 리모컨으로부터 수신되는 음성 파일을 판독하여 음성 명령 코드를 생성하며, 판독된 음성 명령 코드에 따른 화면 제어를 수행하는 영상감시기기;
를 포함하고,
상기 음성인식 리모컨은,
비상 상황임을 입력받는 비상 버튼;을 포함하며, 상기 비상 버튼과 음성 입력 버튼이 동시에 눌리어진채로 입력되는 경우, 상기 음성인식 리모컨은 음성 파일과 함께 비상 상태 알림 메시지를 상기 영상감시기기로 전송하는 음성인식을 통한 지능형 영상 감시 시스템.
A remote control for remotely controlling a video surveillance apparatus, comprising: a voice recognition unit for recognizing a voice of a user and converting the recognized voice into an audio file and transmitting the voice file to the video surveillance apparatus, And a voice recognition module for converting the voice input from the voice input button to an audio file and transmitting the converted voice file to the video monitoring device, ; And
A video surveillance apparatus for reading a voice file received from the voice recognition remote controller to generate a voice command code and performing screen control according to the voice command code read;
Lt; / RTI >
The voice recognition remote control comprises:
Wherein the voice recognition remote controller transmits an emergency state notification message together with a voice file to the video surveillance device when the emergency button and the voice input button are simultaneously pressed and inputted, Intelligent video surveillance system using speech recognition.
CCTV 영상이 표시되는 디스플레이부;
상기 음성인식리모컨과 무선 통신하여 음성 파일을 수신하는 무선 통신부;
상기 음성인식리모컨으로부터 수신된 음성 파일을 판독하여 음성 명령 코드를 생성하는 음성 명령 코드 생성부; 및
CCTV 영상을 상기 디스플레이부를 통해 재생하며, 상기 음성 명령 코드에 따른 디스플레이부의 화면 제어를 수행하는 제어부;
를 포함하는 음성인식을 통한 지능형 영상 감시 시스템.
The video surveillance apparatus according to claim 1,
A display unit for displaying a CCTV image;
A wireless communication unit for wirelessly communicating with the voice recognition remote control to receive an audio file;
A voice command code generating unit for reading a voice file received from the voice recognition remote controller and generating a voice command code; And
A control unit for reproducing the CCTV image through the display unit and performing screen control of the display unit according to the voice command code;
And an intelligent video surveillance system using speech recognition.
명령 단어별로 음성 명령 코드가 할당되어 저장된 음성 명령 코드 DB;
상기 음성인식리모컨으로부터 수신된 음성 파일을 텍스트로 변환하는 STT 변환 모듈; 및
상기 STT 변환 모듈에서 변환된 텍스트에 매칭되는 명령 단어에 할당된 음성 명령 코드를 추출하는 음성 명령 코드 추출 모듈;
을 포함하는 음성인식을 통한 지능형 영상 감시 시스템.
The voice command code generation system according to claim 2,
A voice command code DB in which voice command codes are allocated and stored by command words;
An STT conversion module for converting the voice file received from the voice recognition remote controller into text; And
A voice command code extraction module for extracting a voice command code assigned to a command word matched with the converted text in the STT conversion module;
And an intelligent video surveillance system using speech recognition.
관리자별로 화면 제어 권한을 할당하여, 관리자의 화면 제어 권한의 범위 내에서만 화면 제어가 이루어지도록 함을 특징으로 하는 음성인식을 통한 지능형 영상 감시 시스템.
The video surveillance apparatus according to claim 2,
The screen control authority is assigned to each manager so that the screen control is performed only within the scope of the screen control authority of the administrator.
관리자 아이디별로 화면 제어 권한이 각각 다르게 할당된 화면 제어 권한 DB;
관리자 아이디별로 발음 특성이 저장된 발음 특성 DB;
상기 음성인식리모컨으로부터 수신된 음성 파일의 발음 특성을 추출하는 발음 특성 추출부; 및
추출된 발음 특성에 할당된 관리자 아이디를 추출하는 관리자 아이디 추출부;을 포함하며,
상기 제어부는, 추출된 관리자 아이디의 화면 제어 권한을 상기 화면 제어 권한 DB로부터 추출하여, 관리자 아이디의 화면 제어 권한의 범위 내에서만 화면 제어가 이루어지도록 함을 특징으로 하는 음성인식을 통한 지능형 영상 감시 시스템.
The video surveillance apparatus according to claim 4,
A screen control authority DB to which screen control authority is assigned differently for each administrator ID;
A pronunciation characteristic DB storing pronunciation characteristics for each administrator ID;
A pronunciation characteristic extraction unit for extracting a pronunciation characteristic of a voice file received from the voice recognition remote controller; And
And an administrator ID extraction unit for extracting an administrator ID assigned to the extracted pronunciation characteristic,
Wherein the control unit extracts the screen control right of the extracted administrator ID from the screen control right DB so that screen control is performed only within a screen control right of the administrator ID. .
상기 제어부는,
상기 비상 상태 알림 메시지를 수신하는 경우, 음성 파일로부터 파악된 음성 명령 코드가 음성 파일 판독된 관리자의 화면 제어 권한의 범위를 넘어서는 경우라 하더라도, 파악된 음성 명령 코드에 따르는 화면 제어가 이루어지도록 함을 특징으로 하는 음성인식을 통한 지능형 영상 감시 시스템.The method of claim 2,
Wherein,
Even if the voice command code recognized from the voice file exceeds the range of the screen control authority of the administrator who has read the voice file, the screen control according to the identified voice command code is performed Intelligent video surveillance system with voice recognition.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020170108230A KR101849229B1 (en) | 2017-08-25 | 2017-08-25 | CCTV video monitoring system using voice recognition |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020170108230A KR101849229B1 (en) | 2017-08-25 | 2017-08-25 | CCTV video monitoring system using voice recognition |
Publications (1)
Publication Number | Publication Date |
---|---|
KR101849229B1 true KR101849229B1 (en) | 2018-05-24 |
Family
ID=62296768
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020170108230A KR101849229B1 (en) | 2017-08-25 | 2017-08-25 | CCTV video monitoring system using voice recognition |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101849229B1 (en) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110931001A (en) * | 2019-09-05 | 2020-03-27 | 新华通讯社 | Anti-noise audio transmission device facing voice recognition |
KR20200060057A (en) * | 2018-11-22 | 2020-05-29 | 미래정보기술 주식회사 | A intelligent multi-purpose remote video management control system based on artificial intelligence |
KR20210001677A (en) | 2019-06-28 | 2021-01-06 | 주식회사 오성전자 | Voice search applied remote control and how to support it |
KR20210042463A (en) | 2019-10-10 | 2021-04-20 | 주식회사 오성전자 | Motion Detection Remote Control with Sensor |
KR102567496B1 (en) * | 2022-11-04 | 2023-08-16 | 안희석 | Control system including neural network that learns visual objects |
-
2017
- 2017-08-25 KR KR1020170108230A patent/KR101849229B1/en active IP Right Grant
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20200060057A (en) * | 2018-11-22 | 2020-05-29 | 미래정보기술 주식회사 | A intelligent multi-purpose remote video management control system based on artificial intelligence |
KR102169682B1 (en) | 2018-11-22 | 2020-10-23 | 미래정보기술 주식회사 | A intelligent multi-purpose remote video management control system based on artificial intelligence |
KR20210001677A (en) | 2019-06-28 | 2021-01-06 | 주식회사 오성전자 | Voice search applied remote control and how to support it |
CN110931001A (en) * | 2019-09-05 | 2020-03-27 | 新华通讯社 | Anti-noise audio transmission device facing voice recognition |
CN110931001B (en) * | 2019-09-05 | 2022-05-17 | 新华通讯社 | Anti-noise audio transmission device facing voice recognition |
KR20210042463A (en) | 2019-10-10 | 2021-04-20 | 주식회사 오성전자 | Motion Detection Remote Control with Sensor |
KR102567496B1 (en) * | 2022-11-04 | 2023-08-16 | 안희석 | Control system including neural network that learns visual objects |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101849229B1 (en) | CCTV video monitoring system using voice recognition | |
JP6902136B2 (en) | System control methods, systems, and programs | |
US20220084160A1 (en) | Picture display device, and setting modification method and setting modification program therefor | |
EP1301040B1 (en) | Electronic digital door opener | |
US20080055423A1 (en) | System and method of security monitoring | |
US20100268929A1 (en) | Electronic device and setting method thereof | |
US20220172700A1 (en) | Audio privacy protection for surveillance systems | |
US20140104429A1 (en) | Correctional facility access and security apparatus, systems, and methods | |
JP2007323285A (en) | Electronic device, network connection system, connection method and program | |
US20080100747A1 (en) | Voice-controlled TV set | |
CN107483993B (en) | Voice input method of television, television and computer readable storage medium | |
CN109040692A (en) | A kind of intelligence perpetual calendar monitoring security system | |
KR20200060057A (en) | A intelligent multi-purpose remote video management control system based on artificial intelligence | |
KR101209515B1 (en) | Multi-channel embedded monitoring system for high definition network camera | |
US20150256798A1 (en) | Image monitoring system and control method thereof | |
KR20120031781A (en) | System for remotely controlling camera using mobile phone | |
KR20010064587A (en) | Security radio relay system and control method therefor | |
JP2021105998A (en) | Video display device | |
KR20200056962A (en) | Electronic pen system for controlling tv in conjunction with artificial intelligence speaker | |
CN112653815A (en) | Image capturing apparatus, system, method, and computer-readable storage medium | |
KR20090001627A (en) | Public system for interactive contents | |
CN111901675B (en) | Multimedia data playing method and device, computer equipment and storage medium | |
KR102206235B1 (en) | Network Camera Dashboard Apparatus | |
KR102112931B1 (en) | System for tv control | |
JP4956118B2 (en) | Videophone device, communication system and communication method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |