KR100700693B1 - Method for zooming image of television by sound recognition - Google Patents

Method for zooming image of television by sound recognition Download PDF

Info

Publication number
KR100700693B1
KR100700693B1 KR1020040102631A KR20040102631A KR100700693B1 KR 100700693 B1 KR100700693 B1 KR 100700693B1 KR 1020040102631 A KR1020040102631 A KR 1020040102631A KR 20040102631 A KR20040102631 A KR 20040102631A KR 100700693 B1 KR100700693 B1 KR 100700693B1
Authority
KR
South Korea
Prior art keywords
voice
screen
speaker
enlarged
zoom function
Prior art date
Application number
KR1020040102631A
Other languages
Korean (ko)
Other versions
KR20060063454A (en
Inventor
홍성준
Original Assignee
주식회사 대우일렉트로닉스
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 대우일렉트로닉스 filed Critical 주식회사 대우일렉트로닉스
Priority to KR1020040102631A priority Critical patent/KR100700693B1/en
Publication of KR20060063454A publication Critical patent/KR20060063454A/en
Application granted granted Critical
Publication of KR100700693B1 publication Critical patent/KR100700693B1/en

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/485End-user interface for client configuration
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/226Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
    • G10L2015/227Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of the speaker; Human-factor methodology

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Television Receiver Circuits (AREA)

Abstract

본 발명은 음성인식을 통한 텔레비전의 화면크기 조절방법에 관한 것으로서, 방송화면에서 화자의 음성을 미리 저장한 후 해당 화자의 음성이 입력될 경우 음성과 함께 저장된 화자의 확대화면을 통해 영상화면에서 화자를 찾아 화자를 중심으로 화면크기를 자동으로 확대함으로써 이야기하는 화자가 누구인지 용이하게 식별할 수 있는 이점이 있다. The present invention relates to a method for adjusting a screen size of a television through voice recognition, and when a speaker's voice is input in advance in a broadcast screen and the speaker's voice is input, the speaker is displayed on the video screen through an enlarged screen of the speaker stored with the voice. There is an advantage that can easily identify who is talking by automatically expanding the screen size around the speaker.

음성인식, 화자, 화면확대, 화면크기, 줌기능Voice recognition, speaker, screen magnification, screen size, zoom function

Description

음성인식을 통한 텔레비전의 화면크기 조절방법{METHOD FOR ZOOMING IMAGE OF TELEVISION BY SOUND RECOGNITION} How to adjust screen size of TV through voice recognition {METHOD FOR ZOOMING IMAGE OF TELEVISION BY SOUND RECOGNITION}             

도 1은 현재 사용되는 일반적인 디지털 텔레비전 수상기의 구성을 나타낸 블록구성도이다.1 is a block diagram showing the configuration of a general digital television receiver currently used.

도 2는 본 발명에 의한 텔레비전의 화면크기 조절방법이 적용되는 장치를 나타낸 블록구성도이다. 2 is a block diagram showing a device to which the method for adjusting the screen size of a television according to the present invention is applied.

도 3은 본 발명에 의한 텔레비전의 화면크기 조절방법을 설명하기 위한 흐름도이다. 3 is a flowchart illustrating a method for adjusting the screen size of a television according to the present invention.

- 도면의 주요부분에 대한 부호의 설명 -   -Explanation of symbols for the main parts of the drawings-

1 : 안테나 2 : 튜너1: antenna 2: tuner

3 : IF 증폭부 4 : P/S분리부3: IF amplification unit 4: P / S separation unit

5 : 음성검파부 6 : 영상검파부5: voice detector 6: image detector

7 : 리모콘 장치 8 : 수신부7: remote control unit 8: receiving unit

9, 100 : 마이크로프로세서 10 : 음성처리부9, 100: microprocessor 10: voice processing unit

11 : 음성증폭부 12 : 스피커11: voice amplifier 12: speaker

13 : 아날로그/디지털 변환기(A/D 변환기)13: analog / digital converter (A / D converter)

14 : 영상정보관리부 15 : 영상정보저장부14: image information management unit 15: image information storage unit

16 : 디지털영상조정부 17 : 영상처리부16: digital image adjusting unit 17: image processing unit

18 : 디지털/아날로그 변환기(D/A 변환기)18: Digital / Analog Converter (D / A Converter)

19 : CRT구동부 20 : CRT19: CRT drive unit 20: CRT

21 : 비교음성 저장부 22 : 확대화면 저장부21: comparison voice storage unit 22: enlarged screen storage unit

23 : 줌기능 제어부23: zoom function control

본 발명은 음성인식을 통한 텔레비전의 화면크기 조절방법에 관한 것으로서, 보다 상세하게는 방송화면에서 화자(話者)의 음성을 미리 저장한 후 해당 화자의 음성이 입력될 경우 화자를 중심으로 화면크기를 확대하여 이야기하는 화자가 누구인지 식별이 용이하도록 한 음성인식을 통한 텔레비전의 화면크기 조절방법에 관한 것이다. The present invention relates to a method for adjusting the screen size of a television through voice recognition, and more particularly, a screen size centering on the speaker when the speaker's voice is input after storing the speaker's voice in advance on a broadcast screen. The present invention relates to a method for adjusting the screen size of a television through voice recognition, which facilitates identification of who is talking to the speaker.

컴퓨터산업을 시작으로 정보통신산업에까지 확산된 정보의 디지털화는 최근 들어 텔레비전 방송신호에까지 그 범위가 확산되었다. 텔레비전 방송신호의 디지털화는 컴퓨터, 통신분야의 기술과 융합되는 새로운 패러다임이 구현되는 양방향 멀티미디어시대를 실현할 것이다.The digitalization of information spread from the computer industry to the information and communication industry has recently been extended to television broadcast signals. Digitization of television broadcast signals will realize a two-way multimedia era in which a new paradigm that is fused with technology in the computer and communication fields is realized.

디지털 방송은 유럽의 DVB(Digital Video Broadcasting)규격과 미국 FCC의 ATV(Advanced TV)규격을 중심으로 진행되고 있다. 미국이 차세대 TV 방식으로 결정한 ATSC규격을 준수한 것으로 기존의 아날로그 TV를 상징하는 NTSC 규격을 대체하는 것이다.Digital broadcasting is centered around the European Digital Video Broadcasting (DVB) standard and the ATV (Advanced TV) standard of the US FCC. It complies with the ATSC standard that the United States decided as the next generation TV method, replacing the NTSC standard that symbolizes the existing analog TV.

디지털 텔레비전과 기존의 아날로그 텔레비전과의 차이점을 화질, 음질, 화면비 및 기타로 분리하여 살펴보면 다음과 같다. The difference between digital television and traditional analog television is divided into picture quality, sound quality, aspect ratio and others as follows.

먼저, 화질면에 있어서, 가로 주사선 525개를 사용하는 아날로그 TV는 시청화질을 결정하는 수평해상도가 330선 정도인 반면, 고선명(HD)급 디지털 TV는 수평해상도가 700선 정도에 달하기 때문에 아날로그 TV의 화질보다 2배 이상 선명하다.First, in terms of image quality, an analog TV using 525 horizontal scanning lines has a horizontal resolution of about 330 lines that determines viewing quality, whereas a high definition (HD) digital TV has a horizontal resolution of about 700 lines. It is more than twice as clear as the TV.

음질면에 있어서, 기존의 아날로그 TV는 2채널의 스테레오 음향 정도를 제공하는데 불과하지만, AC3 기술을 사용하는 디지털 TV는 극장에서 즐길 수 있는 5.1채널의 입체음향을 제공한다.In terms of sound quality, conventional analog TVs provide only two channels of stereo sound, while digital TVs using AC3 technology provide 5.1 channels of stereo sound that can be enjoyed in theaters.

화면비율에 있어서도 기존의 아날로그 TV의 화면비가 4 대 3인 반면, 디지털 TV는 극장화면과 동일하게 화면비가 16 대 9인 광폭화면을 기본으로 하고 있다.In terms of the aspect ratio, the conventional analog TV has an aspect ratio of 4 to 3, whereas digital TVs have a wide aspect ratio of 16 to 9, similar to a theater screen.

디지털 TV를 아날로그 TV와 구분 짓는 것은 화질과 음질면에서의 획기적인 변화뿐만이 아니다. 디지털 TV는 PC는 물론 디지털방식으로 신호를 처리하는 디지털 다기능 디스크(DVD)플레이어, 디지털 캠코더, 디지털 VCR 등과 IEEE 1394 인터페이스 기술을 통해 구현되는 직렬 인터페이스로 데이터 호환이 가능하다.What distinguishes digital TV from analog TV is not only a dramatic change in picture quality and sound quality. Digital TVs are data compatible with serial interfaces implemented via IEEE 1394 interface technology, such as digital versatile disc (DVD) players, digital camcorders, and digital VCRs that process digital signals as well as PCs.

그러므로 방송신호의 디지털화는 압축기법을 활용한 미디어의 확산으로 통신, 컴퓨터, 방송의 융합화가 가속화될 것이며, 복합기능을 갖는 단일 미디어로서 국제화 및 다채널화 될 것이다. 무엇보다도 방송신호에 디지털 시스템을 도입하는 것은 아날로그에서 구현할 수 없었던 다양한 데이터 서비스를 제공할 수 있다. 또한 방송신호의 디지털화는 TV 영상신호의 수직귀선기간에 정보를 다중화해 전송하거나 별도의 채널을 이용하여 텔레비전이나, 컴퓨터보유자를 위한 문자정보, 영상정보, 상품정보, 방송프로그램에 관한 정보(일명 전자프로그램 가이드(EPG ; Electronic Program Guide)) 등의 멀티미디어 정보를 제공하는 새로운 미디어 서비스인 데이터 방송을 구현할 수 있다.Therefore, digitalization of broadcast signal will accelerate the convergence of communication, computer, and broadcasting due to the spread of media using the compressor method, and will be internationalized and multi-channel as a single media with complex functions. Above all, introducing a digital system to a broadcast signal can provide various data services that could not be realized in analog. In addition, the digitization of the broadcast signal may be performed by multiplexing and transmitting information in the vertical retrace period of the TV video signal or by using a separate channel, such as character information, image information, product information, and broadcast program information for a television or computer owner (aka electronic). Data broadcasting, which is a new media service providing multimedia information such as an electronic program guide (EPG), may be implemented.

한편, 디지털 텔레비전에서는 디지털방식으로 영상화면을 처리하기 때문에 영상화면의 정지화면이나 줌(zoom)기능이 적용되고 있는 경우도 있다. On the other hand, since digital television processes a video screen in a digital manner, a still picture and a zoom function of the video screen may be applied.

도 1은 현재 사용되는 일반적인 디지털 텔레비전 수상기의 구성을 나타낸 블록구성도이다.1 is a block diagram showing the configuration of a general digital television receiver currently used.

여기에 도시된 바와 같이 안테나(1)를 통해 수신된 방송신호로부터 소정의 중간주파수신호를 생성 출력하는 튜너(2)와, 튜너(2)를 통해 출력되는 중간주파수신호를 증폭하는 IF 증폭부(3)와, IF 증폭부(3)에서 출력되는 방송중간주파수신호로부터 영상중간주파수신호(PIF)와 음성중간주파수신호(SIF)를 분리하는 예컨대 표면탄성파 필터 등의 P/S분리부(4)로 이루어진다. As shown here, the tuner 2 generates and outputs a predetermined intermediate frequency signal from the broadcast signal received through the antenna 1, and the IF amplifier unit amplifies the intermediate frequency signal output through the tuner 2 ( 3) and a P / S separation unit 4 which separates the video intermediate frequency signal PIF and the audio intermediate frequency signal SIF from the broadcasting intermediate frequency signal output from the IF amplifier 3, for example, a surface acoustic wave filter. Is made of.

그리고, P/S 분리부(4)에서 출력되는 음성중간주파수신호로부터 음성신호를 검파하는 음성검파부(5)와, 음성검파부(5)로부터 출력되는 음성신호에 대해 상기 마이크로프로세서(9)로부터의 제어신호에 따라 베이스(Bass), 트레블(Treble), 볼륨(Volume)등의 음성처리를 실행하는 음성처리부(10)와, 음성처리부(10)에서 처리 된 음성신호를 증폭하여 스피커(12)로 출력하는 음성증폭부(11)로 이루어진다. Then, the microprocessor 9 for the voice detector 5 for detecting the voice signal from the voice intermediate frequency signal output from the P / S separation unit 4, and the voice signal output from the voice detector 5 According to the control signal from the voice processing unit 10 for performing voice processing such as bass, treble, volume, etc., and the amplified voice signal processed by the voice processing unit 10, the speaker 12 It consists of a voice amplifier 11 for outputting.

또한, P/S 분리부(4)에서 출력되는 영상중간주파수신호로부터 영상신호를 검파하는 영상검파부(6)와, 영상검파부(6)에서 출력되는 아날로그 영상신호를 디지털 영상신호로 변환하여 출력하는 아날로그/디지털 변환기(13)와, 디지털 영상신호를 저장하기 위한 영상정보저장부(15)와, 아날로그/디지털 변환기(13)로부터 출력되는 디지털 영상신호에 대하여 마이크로프로세서(9)의 제어신호를 근거로 영상정보저장부(15)에 일정단위로 순차적으로 저장하기 위한 영상정보관리부(14)와, 마이크로프로세서(9)의 제어신호에 따라 상기 영상정보관리부(14)를 통해 출력되는 디지털 영상신호 또는 영상정보저장부(15)에 저장되어 있는 영상신호에 대하여 예컨대, 정지화면기능 또는 줌기능을 처리하는 디지털영상조정부(16)와, 디지털영상조정부(16)로부터 출력되는 디지털 영상신호에 대해 마이크로프로세서(9)로부터의 제어신호에 따라 칼라(Color), 틴트(Tint), 브라이트니스(Brightness)등을 처리하여 대응되는 R(Red), G(Green), B(Blue) 및 휘도(-Y)신호를 생성하여 출력하는 영상처리부(17)와, 영상처리부(17)에서 출력되는 디지털 영상신호를 아날로그 영상신호로 변환하여 출력하는 디지털/아날로그 변환기(18), 디지털/아날로그 변환기(18))에서 출력되는 색조신호(R, G, B) 및 휘도(-Y)신호를 근거로 CRT(20)를 구동하는 CRT구동부(19)로 이루어진다. Also, the video detector 6 detects a video signal from the video intermediate frequency signal output from the P / S separation unit 4, and converts the analog video signal output from the video detector 6 into a digital video signal. The control signal of the microprocessor 9 for the analog-to-digital converter 13 to output, the video information storage 15 for storing the digital video signal, and the digital video signal output from the analog-to-digital converter 13. The digital image output through the image information management unit 14 and the image information management unit 14 for sequentially storing the image information storage unit 15 in a predetermined unit based on the control signal of the microprocessor 9 A digital image adjusting unit 16 for processing a still image function or a zooming function with respect to a video signal stored in the signal or the image information storing unit 15, and a digital output from the digital image adjusting unit 16. Color, Tint, Brightness, etc. are processed according to the control signal from the microprocessor 9 with respect to the full image signal and corresponding R (Red), G (Green), B (Blue) ) And an image processor 17 for generating and outputting a luminance (-Y) signal, a digital / analog converter 18 for converting a digital image signal output from the image processor 17 into an analog image signal, and outputting the analog image signal. The CRT driver 19 drives the CRT 20 based on the color tone signals R, G, and B and the luminance (-Y) signal output from the analog converter 18.

한편, 텔레비전 수상기 전반적인 동작실행을 원격적으로 명령하기 위한 리모콘장치(7)와, 리모콘장치(7)로부터 출력되는 적외선 신호를 전기적인 코드신호로 변환하여 출력하는 수신부(8)와, 텔레비전 수상기 전체를 제어하는 마이크로프로세 서(9)로 이루어진다. On the other hand, the remote control device 7 for remotely instructing the overall operation of the television receiver, the receiving unit 8 for converting and outputting an infrared signal output from the remote control device 7 into an electric code signal, and the entire television receiver. It consists of a microprocessor (9) for controlling.

이와 같이 구성된 디지털 텔레비전은 안테나(1)를 통해 수신된 방송신호 중에서 영상신호는 디지털신호로 변환되어 영상처리 된 후 다시 아날로그신호로 변환되어 CRT(20)로 출력되게 된다. 이때, 사용자로부터 줌 기능이 선택되면 마이크로프로세서(9)는 디지털영상조정부(16)를 제어하여 수신 영상신호에 대하여 줌기능을 실행하도록 제어하게 된다. In the digital television configured as described above, a video signal of the broadcast signal received through the antenna 1 is converted into a digital signal, image processed, and then converted into an analog signal and output to the CRT 20. At this time, when the zoom function is selected by the user, the microprocessor 9 controls the digital image adjusting unit 16 to execute the zoom function on the received image signal.

또 다른 방법으로써 화면크기를 조정하기 위해서 영상화면의 편향상태를 가변하도록 수평/수직편향코일의 수평/수직편향을 조정하기 위한 수평/수직편향조정데이터를 메모리에 저장하고 소정의 영상구간에 대해서 메모리에 저장된 수평/수직편향조정데이터에 의해 수평/수직편향상태를 가변하여 화면의 크기를 조정하는 방법이 사용되기도 하고 있다. As another method, the horizontal / vertical deflection adjustment data for adjusting the horizontal / vertical deflection of the horizontal / vertical deflection coil to change the deflection state of the image screen to adjust the screen size is stored in the memory and the memory for a predetermined image section. The method of adjusting the size of the screen by varying the horizontal / vertical deflection state by the horizontal / vertical deflection adjustment data stored in the is also used.

이와 같이 사용자가 텔레비전을 시청하는 중 자신이 원하는 영상화면을 크게 보고 싶을 경우 줌기능을 선택하게 되면 영상화면의 크기를 조절하여 해당 영상을 자세히 시청할 수 있도록 한다. In this way, if the user wants to watch a video screen of his / her own desire while watching television, selecting a zoom function allows the user to watch the video in detail by adjusting the size of the video screen.

그러나, 영상화면의 크기를 조절하는 줌기능은 텔레비전을 시청하는 중 사용자가 원하는 영상화면에서 줌기능을 선택했을 경우에만 동작하기 때문에 줌기능을 효율적으로 사용할 수 없는 문제점이 있었다. However, since the zoom function for adjusting the size of the video screen operates only when the user selects the zoom function on the desired video screen while watching television, the zoom function cannot be efficiently used.

또한, 여러 사람이 모여 이야기하는 프로그램의 경우 화자가 누구인지 파악하기 위해서는 현재의 영상화면을 자세히 관찰하여 화자의 입모양을 판단하여 찾을 수 있으나 이는 많은 주의를 필요로 하는 문제점이 있으며, 화면 줌기능을 사용하 고자 할 경우에는 영상화면을 확대한 후 화자를 찾기 위해 줌영역을 이동시켜 가면서 화자를 찾아야 하는 문제점이 있었다. In addition, in the case of a program where several people gather and talk, in order to find out who is the speaker, the current video screen can be observed in detail to determine the shape of the speaker's mouth, but this requires a lot of attention. If you want to use the problem, you need to find the speaker while moving the zoom area to find the speaker after the image screen is enlarged.

본 발명은 상기와 같은 문제점을 해결하기 위해 창작된 것으로서, 본 발명의 목적은 방송화면에서 화자의 음성을 미리 저장한 후 해당 화자의 음성이 입력될 경우 화자를 중심으로 화면크기를 확대하여 이야기하는 화자가 누구인지 식별이 용이하도록 한 음성인식을 통한 텔레비전의 화면크기 조절방법을 제공함에 있다.
The present invention was created to solve the above problems, and an object of the present invention is to store the speaker's voice in advance on a broadcast screen and then expand the screen size around the speaker when the speaker's voice is input. The present invention provides a method for adjusting the screen size of a television through voice recognition for easy identification of who the speaker is.

상기와 같은 목적을 실현하기 위한 본 발명은 자동 줌기능을 동작시키기 위한 비교음성을 추출하여 저장하는 단계와, 추출된 비교음성에 대해 확대하고자 하는 확대화면을 선택하여 저장하는 단계와, 자동 줌기능 작동시 입력되는 음성신호와 저장된 비교음성을 비교하는 단계와, 비교한 결과 비교음성과 음성신호가 동일인으로 판단될 경우 저장된 확대화면과 입력된 영상화면을 비교하여 확대영역을 설정하는 단계와, 설정된 확대영역을 소정비율로 줌기능을 동작시키는 단계로 이루어진 것을 특징으로 한다. The present invention for realizing the above object comprises the steps of extracting and storing the comparison voice for operating the automatic zoom function, selecting and storing the enlarged screen to be enlarged with respect to the extracted comparison voice, and the automatic zoom function Comparing the input voice signal and the stored comparison voice during operation; and if the comparison voice and the voice signal are determined to be the same, comparing the stored enlarged screen with the input video screen and setting an enlarged area; And operating the zoom function in the enlarged area at a predetermined ratio.

본 발명에서 확대하고자 하는 확대화면은 비교음성의 화자(話者)인 것을 특징으로 한다. The enlarged screen to be enlarged in the present invention is characterized in that the speaker of the comparison voice.

본 발명에서 줌기능은 음성신호가 다른 사람으로 바뀔 경우 해제되어 복귀되 는 것을 특징으로 한다. In the present invention, the zoom function is characterized in that when the voice signal is changed to another person is released to return.

이와 같이 이루어진 본 발명은 사용자가 자동 줌기능이 동작되도록 화자의 비교음성과 확대하기 위한 화자의 확대화면을 저장한 후 입력되는 음성신호를 비교음성과 비교하여 설정된 화자와 동일인일 경우 줌기능을 동작시켜 저장된 화자의 확대화면을 입력되는 영상화면과 비교하여 확대영역을 설정하고 입력되는 영상화면에서 확대영역을 소정비율로 확대하여 디스플레이 하도록 한다. According to the present invention made as described above, the user operates the zoom function when the user compares the input voice signal with the compared voice after storing the comparison voice of the speaker and the enlarged screen of the speaker to enlarge the auto zoom function. By setting the enlarged area by comparing the enlarged screen of the stored speaker with the input video screen, the enlarged area of the input video screen is enlarged and displayed at a predetermined ratio.

이하, 본 발명의 바람직한 실시예를 첨부된 도면을 참조하여 설명한다. 또한 본 실시예는 본 발명의 권리범위를 한정하는 것은 아니고, 단지 예시로 제시된 것이며 종래 구성과 동일한 부분은 동일한 부호 및 명칭을 사용한다. Hereinafter, exemplary embodiments of the present invention will be described with reference to the accompanying drawings. In addition, the present embodiment is not intended to limit the scope of the present invention, but is presented by way of example only and the same parts as in the conventional configuration using the same reference numerals and names.

도 2는 본 발명에 의한 음성인식을 통한 텔레비전의 화면크기 조절방법이 적용되는 장치를 나타낸 블록구성도이다. 2 is a block diagram showing an apparatus to which the method for adjusting the screen size of a television through voice recognition according to the present invention is applied.

여기에 도시된 바와 같이 줌기능을 갖는 텔레비전에서 음성신호를 검파하는 음성검파부(5)로부터 출력되는 음성신호에서 추출된 비교음성을 저장하기 위한 비교음성 저장부(21)와, 추출된 비교음성의 주인공인 화자를 찾기 위한 화자의 확대화면을 영상정보 저장부(15)에서 선택하여 저장하기 위한 확대화면 저장부(22)와, 사용자의 선택에 따라 음성신호에서 화자의 비교음성을 선택하여 비교음성 저장부(21)에 저장하도록 제어하고 화자의 확대화면을 선택하여 확대화면 저장부(22)에 저장하도록 제어할 뿐만 아니라 입력되는 음성신호와 비교음성 저장부(21)에 저장된 비교음성간에 서로 비교하여 동일인 여부를 판단하고 확대화면 저 장부(22)에 저장된 확대화면과 입력되는 영상화면을 비교하여 확대영역을 설정하여 줌기능을 동작시키는 줌기능 제어부(23)를 더 포함하여 이루어진다. As shown here, a comparative voice storage unit 21 for storing the comparative voice extracted from the voice signal output from the voice detector 5 for detecting the voice signal in a television having a zoom function, and the extracted comparative voice. The enlarged screen storage unit 22 for selecting and storing the speaker's enlarged screen for finding the speaker, which is the main character of the speaker, and the comparison voice of the speaker is selected from the audio signal according to the user's selection. It controls not only to store in the voice storage unit 21, but also to control to select the enlarged screen of the speaker to be stored in the enlarged screen storage unit 22, as well as between the input voice signal and the comparison voice stored in the comparison voice storage unit 21 The zoom function control to determine whether the comparison is the same and to operate the zoom function by setting the magnification area by comparing the magnified screen stored in the magnified screen storage unit 22 with the input video screen. Achieved by further comprising: a 23.

따라서, 사용자가 줌기능을 동작시키기 위한 이벤트로 화자의 비교음성과 확대화면을 비교음성 저장부(21)와 확대화면 저장부(22)에 저장한 후 입력되는 음성신호에서 저장된 비교음성과 동일인의 화자 음성이 입력될 경우 입력되는 영상화면에서 저장된 확대화면을 비교하여 확대영역을 설정한 후 마이크로 프로세서(9)로 줌기능을 동작시키기 위한 제어신호를 출력하게 되면 일반적으로 줌기능을 갖는 텔레비전에서 줌기능을 설정할 때와 동일한 방법으로 화면의 확대크기 및 확대영역에 따라 마이크로프로세서(9)에 줌기능을 동작시키게 됨으로써 미리 설정된 음성의 화자가 나올 경우 해당 화자를 확대하여 볼 수 있게 된다. Therefore, the user stores the comparison voice and the enlarged screen of the speaker in the comparison voice storage 21 and the enlarged screen storage 22 as an event for operating the zoom function. When the speaker's voice is input, the user can compare the stored magnification screen from the input video screen, set the magnification area, and then output a control signal for operating the zoom function with the microprocessor 9. In the same manner as when setting the function, the zoom function is operated on the microprocessor 9 according to the magnification size and the magnification area of the screen, so that the speaker of the preset voice can be enlarged and viewed.

또한, 사용자가 비교음성과 확대화면을 선택할 경우 해당 영상에 대한 저장동작은 마이크로프로세서(9)에서 전달된 제어신호에 의해 줌기능 제어부(23)에서 비교음성 저장부(21)와 확대화면 저장부(22)에 저장할 수 있도록 제어하게 된다. In addition, when the user selects the comparison voice and the enlarged image, the storing operation for the corresponding image is performed by the control function 23 from the zoom function control unit 23 by the control signal transmitted from the microprocessor 9 and the enlarged screen storage unit. Control to store in (22).

이를 구체적으로 도 3에 도시된 본 발명에 의한 음성인식을 통한 텔레비전의 화면크기 조절방법을 설명하기 위한 흐름도를 참조하여 설명하면 다음과 같다. This will be described in detail with reference to a flowchart for explaining a method for adjusting a screen size of a television through voice recognition according to the present invention shown in FIG. 3.

먼저, 사용자가 자동 줌기능을 동작시키기 위한 화자(話者)의 비교음성을 선택하고 이를 비교음성 저장부(21)에 저장한다(S10). First, a user selects a comparison voice of a speaker for operating the auto zoom function and stores it in the comparison voice storage 21 (S10).

그런다음 해당 화자를 찾아 확대하고자 하는 확대영역을 설정하기 위한 기준 확대화면을 선택하고 이를 확대화면 저장부(22)에 저장한다(S12). Then, the user selects the reference enlarged screen for setting the enlarged area to find the speaker and stores it in the enlarged screen storage 22 (S12).

즉, 확대화면은 화자를 가리키는 화면으로써 전체 영상화면에서 화자의 위치를 찾기 위한 비교영상이다. That is, the enlarged screen is a screen indicating the speaker and is a comparative image for finding the speaker's position on the entire video screen.

이후 사용자가 자동으로 줌기능을 작동시키도록 설정을 하게 되면(S14) 줌기능 제어부(23)에서 입력되는 음성신호를 비교음성 저장부(21)에 저장된 비교음성과 비교하게 된다(S16). Thereafter, when the user sets to automatically operate the zoom function (S14), the voice signal input from the zoom function control unit 23 is compared with the comparison voice stored in the comparison voice storage unit 21 (S16).

이때 비교음성 저장부(21)에 저장된 비교음성이 여러 사람인 경우 각각 비교하게 된다. At this time, the comparison voices stored in the comparison voice storage unit 21 are compared with each other.

이렇게 비교음성과 입력되는 음성신호를 비교하여 현재 화자가 비교음성과 동일인인가를 판단하게 된다(S18). The comparison voice is compared with the input voice signal to determine whether the current speaker is the same as the comparison voice (S18).

이때 동일인이 아닌 경우에는 이전에 확면크기 확대되어 있을 경우에는 화면복귀를 시킨 후 계속해서 자동 줌기능이 작동되는지 판단하면서 입력되는 음성신호와 비교음성을 비교하게 된다(S26). At this time, if the same person is not enlarged, if the magnification is enlarged in the past, the screen is restored and then the automatic zoom function is judged to be operated while comparing the input voice signal with the comparison voice (S26).

그런데, 입력된 음성신호가 비교음성과 동일인인 경우에는 비교음성과 동일 화자의 확대화면을 확대화면 저장부(22)로부터 읽어와 현재 입력된 영상화면과 확대화면을 서로 비교해서 영상화면에서 확대화면이 존재하는 위치를 찾게 된다(S20). However, if the input voice signal is the same as the comparison voice, the enlarged screen of the comparison voice and the same speaker is read from the enlarged screen storage unit 22, and the currently input video screen and the enlarged screen are compared with each other, and the enlarged screen on the video screen. This position is found (S20).

이때 영상화면에서 확대화면의 존재여부 및 위치는 확률적으로 비교하게 된다. At this time, the presence and position of the enlarged screen in the video screen are compared probabilistically.

이렇게 찾은 확대화면의 위치에 따라 확대영역을 설정하고(S22), 설정된 확대영역을 일정한 확대크기로 확대할 수 있도록 줌기능을 설정하기 위한 제어신호를 마이크로프로세서(9)로 출력함에 따라 선택된 확대영역을 확대하게 된다(S24). The enlarged area is set according to the position of the enlarged screen thus found (S22), and the control signal for setting the zoom function is output to the microprocessor 9 so as to enlarge the set enlarged area to a predetermined enlarged size. To enlarge (S24).

이후 음성이 바뀌어 다른 사람으로 화자가 바뀔 경우에는 줌상태를 해제하고 화면을 원상태로 복귀시킨 후 다른 화자의 음성을 비교하게 된다(S26). After the voice is changed and the speaker is changed to another person, the zoom state is released, the screen is returned to its original state, and the voices of the other speakers are compared (S26).

이와 같이 화면 줌기능은 디지털 영상화면을 디지털 방식에 의해 확대할 수도 있을 뿐만 아니라 수평/수직편향코일의 수평/수직편향을 조정하기 위한 수평/수직편향조정데이터에 의해 수평/수직편향상태를 가변하여 화면의 크기를 조절할 수도 있다.In this way, the screen zoom function can not only enlarge the digital image screen by digital method but also change the horizontal / vertical deflection state by the horizontal / vertical deflection adjustment data for adjusting the horizontal / vertical deflection of the horizontal / vertical deflection coil. You can also resize the screen.

상기한 바와 같이 본 발명은 방송화면에서 화자의 음성을 미리 저장한 후 해당 화자의 음성이 입력될 경우 음성과 함께 저장된 화자의 확대화면을 통해 영상화면에서 화자를 찾아 화자를 중심으로 화면크기를 자동으로 확대함으로써 이야기하는 화자가 누구인지 용이하게 식별할 수 있는 이점이 있다. As described above, according to the present invention, if the speaker's voice is pre-stored on the broadcast screen and the speaker's voice is input, the present invention automatically finds the speaker on the video screen through the enlarged screen of the speaker stored with the voice and automatically adjusts the screen size. By enlarging it, it is possible to easily identify who is talking.

Claims (3)

자동 줌기능을 동작시키기 위한 비교음성을 추출하여 저장하는 단계와, Extracting and storing the comparison voice for operating the auto zoom function; 상기에서 추출된 비교음성에 대해 확대하고자 하는 확대화면을 선택하여 저장하는 단계와, Selecting and storing an enlarged screen to be enlarged with respect to the extracted comparative voice; 자동 줌기능 작동시 입력되는 음성신호와 저장된 비교음성을 비교하는 단계와, Comparing the input voice signal with the stored comparison voice during the auto zoom function; 상기에서 비교한 결과 비교음성과 음성신호가 동일인으로 판단될 경우 저장된 확대화면과 입력된 영상화면을 비교하여 확대영역을 설정하는 단계와, Setting a magnified area by comparing the stored magnified screen with the input video screen when it is determined that the comparison voice and the audio signal are the same; 상기에서 설정된 확대영역을 소정비율로 줌기능을 동작시키는 단계Operating a zoom function at a predetermined ratio with respect to the enlarged area 로 이루어진 것을 특징으로 하는 음성인식을 통한 텔레비전의 화면크기 조절방법. Method of adjusting the screen size of the television through the voice recognition, characterized in that consisting of. 제 1항에 있어서, 상기에서 확대하고자 하는 확대화면은 비교음성의 화자(話者)인 것을 특징으로 하는 음성인식을 통한 텔레비전의 화면크기 조절방법. The method of claim 1, wherein the enlarged screen to be enlarged is a speaker of a comparative voice. 제 1항에 있어서, 상기 줌기능은 음성신호가 다른 사람으로 바뀔 경우 해제되어 복귀되는 것을 특징으로 하는 음성인식을 통한 텔레비전의 화면크기 조절방법. The method of claim 1, wherein the zoom function is released when the voice signal is changed to another person and returned.
KR1020040102631A 2004-12-07 2004-12-07 Method for zooming image of television by sound recognition KR100700693B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020040102631A KR100700693B1 (en) 2004-12-07 2004-12-07 Method for zooming image of television by sound recognition

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020040102631A KR100700693B1 (en) 2004-12-07 2004-12-07 Method for zooming image of television by sound recognition

Publications (2)

Publication Number Publication Date
KR20060063454A KR20060063454A (en) 2006-06-12
KR100700693B1 true KR100700693B1 (en) 2007-03-27

Family

ID=37159445

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020040102631A KR100700693B1 (en) 2004-12-07 2004-12-07 Method for zooming image of television by sound recognition

Country Status (1)

Country Link
KR (1) KR100700693B1 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101626159B1 (en) * 2009-11-25 2016-05-31 엘지전자 주식회사 User adaptive display device and method thereof

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR19980026645A (en) * 1996-10-10 1998-07-15 김광호 Video Conferencing System and Camera Control Method
KR19980029620A (en) * 1996-10-26 1998-07-25 배순훈 TV specific screen magnification device using zoom function and its method

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR19980026645A (en) * 1996-10-10 1998-07-15 김광호 Video Conferencing System and Camera Control Method
KR19980029620A (en) * 1996-10-26 1998-07-25 배순훈 TV specific screen magnification device using zoom function and its method

Also Published As

Publication number Publication date
KR20060063454A (en) 2006-06-12

Similar Documents

Publication Publication Date Title
KR100425319B1 (en) Channel selecting method for digital television
US7903101B2 (en) Display device and method with optimal external input setting capability
KR100700693B1 (en) Method for zooming image of television by sound recognition
CN1306800C (en) Method and apparatus for controlling a video signal processing apparatus
KR100731533B1 (en) Method for auto setting video and audio mode of digital television
KR100598948B1 (en) Method for zooming image of television
KR100627895B1 (en) Apparatus for adjusting size and zoom of sub image in television and method thereof
KR20050120038A (en) Apparatus for zooming image of television and method thereof
KR101002844B1 (en) Method for controlling output-level of speaker automatically in digital television system and thereof system
KR100598956B1 (en) Apparatus for controlling continuity still display of television
KR100708375B1 (en) Method for processing digital image of digital television
KR19990019261A (en) Menu selection method on television receiver
KR20080001364A (en) Apparatus for adjusting sound effect of television and method thereof
KR20100072681A (en) Apparatus and method for image displaying in image display device
JP2008035046A (en) Video output system
KR100722449B1 (en) Method for processing image of television
KR100307595B1 (en) Method for processing display when aspect rate between broadcasting signal and receiver is different and apparatus therefor
KR0169305B1 (en) Automatic conversion apparatus and controlling method for subpicture position in followed at the present time
KR100218102B1 (en) Channel exclusive method of a multi-video displayer
KR100242113B1 (en) Korean character deleting device of tv set
KR20000003817A (en) Method for displaying viewable class according to plural viewers in television receiver with viewing restriction function
KR20070111283A (en) Method for processing digital image of digital television
KR19990019259A (en) How to navigate channels on television
KR101295304B1 (en) Apparatus and method for recording an audio signal selection of display device
KR20070120818A (en) Channel structuring method for digital television

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20120313

Year of fee payment: 6

LAPS Lapse due to unpaid annual fee