KR950035447A - 음성 분석 자동화를 이용하는 비디오 신호 처리 시스템 및 그 방법 - Google Patents

음성 분석 자동화를 이용하는 비디오 신호 처리 시스템 및 그 방법 Download PDF

Info

Publication number
KR950035447A
KR950035447A KR1019950005198A KR19950005198A KR950035447A KR 950035447 A KR950035447 A KR 950035447A KR 1019950005198 A KR1019950005198 A KR 1019950005198A KR 19950005198 A KR19950005198 A KR 19950005198A KR 950035447 A KR950035447 A KR 950035447A
Authority
KR
South Korea
Prior art keywords
speaker
frame rate
video signal
frame
frames
Prior art date
Application number
KR1019950005198A
Other languages
English (en)
Inventor
첸 츄한
Original Assignee
비.케이.디니콜라
에이티 앤드 티 코포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 비.케이.디니콜라, 에이티 앤드 티 코포레이션 filed Critical 비.케이.디니콜라
Publication of KR950035447A publication Critical patent/KR950035447A/ko

Links

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/434Disassembling of a multiplex stream, e.g. demultiplexing audio and video streams, extraction of additional data from a video stream; Remultiplexing of multiplex streams; Extraction or processing of SI; Disassembling of packetised elementary stream
    • H04N21/4341Demultiplexing of audio and video streams
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0356Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for synchronising with other signals, e.g. video signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/57Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for processing of video signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/587Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal sub-sampling or interpolation, e.g. decimation or subsequent interpolation of pictures in a video sequence
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • H04N21/4394Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs
    • H04N21/44008Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs
    • H04N21/4402Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
    • H04N21/440281Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display by altering the temporal resolution, e.g. by frame skipping
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/06Transformation of speech into a non-audible representation, e.g. speech visualisation or speech processing for tactile aids
    • G10L21/10Transforming into visible information
    • G10L2021/105Synthesis of the lips movements from speech, e.g. for talking heads
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/20Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding

Abstract

화자의 영상 프레임 속도를 증가시키는 방법은 화자의 발음을 나타내는 오디오 신호 및 결합된 비디오 신호를 모니터링하는 단계를 포함한다. 오디오 신호는 재구성되는 1 이상의 필드 또는 프레임에 대응하며, 오디오 신호의 각 부분은 안면 특성 정보에 결합된다. 안면 정보는 화자의 입 위치를 실제로 예측할 수 있는 음소 또는 다른 음성-기초 수준에서 도출된 위치 정보 및 입 형성을 포함한다. 영상의 필드 또는 프레임은 현존 프레임에서 추출된 영상 특성을 이용함과 동시에 검출된 음소에 결합된 안면 특성 정보를 이용하여 재구성된다.

Description

음성 분석 자동화를 이용하는 비디오 신호 처리 시스템 및 그 방법
본 내용은 요부공개 건이므로 전문내용을 수록하지 않았음
제1도는 본 발명의 음성 결합된 비디오 프레임 시퀀스 보간 처리의 실시예의 여러 단계를 도시한 플로우챠트, 제2도는 본 발명에 따른 음성 결합된 비디오 프레임 시퀀스 보간의 한 응용을 나타내는 비디오판 장치의 여러 구성요소를 도시한 블록도.

Claims (18)

  1. 제1프레임 속도를 가지며 화자의 영상 시퀀스(image sequence)를 나타내는 수신된 비디오신호의 프레임 속도를 증가시키는 장치에 있어서, 적어도 소정의 검출되는 음성 세그먼트는 수신된 비디오 신호에 의해 표현되지 않은 영상 시퀀스의 영상에 대응하는 것으로, 화자의 발음에 의한 상기 음성 세그먼트를 검출하도록 영상 시퀀스에 일시적으로 대응하는 오디오 신호를 모니터링하는 수단과:저장된 파라메트릭 입 형성 데이타에 검출된 음성 세그먼트를 결합하는 수단 및 상기 모니터링 수단 및 상기 결합 수단에 응답하며, 화자의 영상을 나타내는 적어도 하나의 음향 합성된 프레임을 발생함과 동시에 수신된 비디오신호의 인접 프레임들간에 상기 적어도 하나의 음향 합성된 프레임을 삽입하여, 상기 제1프레임 속도보다 높은 프레임 속도를 갖는 비디오 신호를 제공하게 되는 프레임 발생수단을 구비하는 것을 특징으로 하는 프레임 속도 증가 장치.
  2. 제1항에 있어서, 상기 검출된 각각의 음성 세그먼트는 상기 파라메트릭 입형성 데이타에 의해 표현되는 각각의 입 형성에 대응하는 것을 특징으로 프레임 속도 증가 장치.
  3. 제1항에 있어서, 상기 검출된 각각의 음성 세그먼트가 음소(phoneme)인 것을 특징으로 하는 프레임 속도 증가 장치.
  4. 제1항에 있어서, 상기 검출된 각각의 음성 세그먼트가 동음이의어(homophene)인 것을 특징으로 하는 프레임 속도 증가 장치.
  5. 제2항에 있어서, 상기 화자의 각각의 입 형성은 바이스미(viseme)인 것을 특징으로 하는 프레임 속도 증가 장치.
  6. 제2항에 있어서, 상기 결합 수단은 예정된 음성 세그먼트를 발음하는 일반적인 화자의 입 모양을 나타내는 입 형성 파라미터의 저장 테이블을 갖고 있는 메모리를 포함하는 것을 특징으로 프레임 속도 증가 장치.
  7. 제1항에 있어서, 상기 모니터링 수단에 의해 검출되는 음성 세그먼트와 같이 상기 수신된 비디오 신호의 프레임들로부터 입 형성 파라미터를 추출하기 위한, 상기 모니터링 수단에 응답하는 특성 추출 수단(feature extraction means)을 구비하는데, 각각의 저장된 입 형성 파라미터는 예정된 음성 세그먼트를 발음하는 화자의 입 모양을 나타내는 것을 특징으로 하는 프레임 속도 증가 장치.
  8. 제1항에 있어서, 상기 프레임 발생 수단은 수신된 비디오 신호의 인접 프레임들 간의 삽입용 복수 프레임을 음향 합성하도록 작동하는 것을 특징으로 하는 프레임 속도 증가 장치.
  9. 제1항에 있어서, 상기 결합 수단은 회자의 턱, 혀 및 치아중 적어도 하나의 기억된 형태로 화자가 발음하여 검출된 음성 세그먼트를 결합하도록 작동하는 것을 특징으로 하는 프레임 속도 증가 장치.
  10. 제1프레임 속도를 가지며 화자의 영상 시퀀스를 나타내는 수신된 비디오신호의 프레임 속도를 증가시키는 방법에 있어서, 적어도 소정의 검출되는 음성 세그먼트는 수신된 비디오 신호에 의해 표현되지 않은 영상 신퀀스의 영상에 대응하는 것으로, 화자의 발음에 의한 상기 음성 세그먼트를 검출하도록 영상 시퀀스에 일시적으로 대응하는 오디오 신호를 모니터하는 단계와:저장된 파라메트릭 입 형성 데이타에 검출된 음성 세그먼트를 결합하는 단계와:상기 결합 단계시 식별되는 파라메트릭 입 형성 데이타 및 수신된 비디오 신호의 적어도 1프레임에서, 화자의 영상을 나타내는 프레임을 음향 합성하는 (synthesizing)단계 및 상기 제1프레임 속도보다 높은 프레임 속도를 갖는 제2 비디오신호를 얻기 위해, 상기 음향 합성 단계시에 얻을 수 있는 프레임을 수신된 비디오신호의 인접 프레임들 사이에 삽입하는 단계를 포함하는 것을 특징으로 하는 프레임 속도 증가 방법.
  11. 제10항에 있어서, 복수의 프레임이 상기 음향 합성 단계시 순차적으로 음향 합성되는데, 상기 음향 합성된 프레임들은 상기 발음 형성 동안 화자의 영상을 나타내는 것을 특징으로 하는 프레임 속도 증가 방법.
  12. 제10항에 있어서, 상기 검출된 각각의 음성 세그먼트가 음소인 것을 특징으로 하는 프레임 속도 증가 방법.
  13. 제10항에 있어서, 상기 검출된 각각의 음성 세그먼트가 동음이의어인 것을 특징으로 하는 프레임 속도 증가 방법.
  14. 제10항에 있어서, 상기 결합 단계는 예정된 음성세그먼트를 발음하는 일반적인 화자의 입 모양을 나타내는 입 형성 파라미터를 갖는 파라메트릭 안면 특성 데이타의 저장 테이블을 어드레싱하는 단계를 포함하는 것을 특징으로 하는 프레임 속도 증가 방법.
  15. 디지탈 오디오 및 비디오 데이타 신호를 송신 및 수신하기 위한 비디오원격 회의 장치에 있어서, 화자의 발음에 일시적으로 대응하며 화자의 영상 시퀀스를 나타내는 매우 낮은 프레임 속도의 비디오 및 오디오 신호를 수신하는 수단과:낮은 프레임 속도의 비디오 신호로 표현되지 않는 시퀀스 영상에 일시적으로 대응하는 오디요신호부 및 화자의 영상을 표현하는 프레임을 음향 합성하기 위한 적어도 1프레임을 나타내는 비디오 신호부에 응답하는 프레임 발생 수단과:저장된 안면 특성 정보에 상기 오디오 신호의 각 부분을 결합하는 수단과:높은 프레임 속도 시퀀스를 형성하기 위해 상기 낮은 프레임 속도 비디오신호의 연속 수신된 프레임 사이에 상기 발생수단에 의해 음향 합성된 프레임을 삽입하는 수단 및 상기 높은 프레임 속도 시퀀스를 디스플레이하는 수단을 구비하는 것을 특징으로 하는 비디오 원격 회의 장치.
  16. 제1항에 있어서, 상기 제1프레임 속도는 초당 10프레임 이하인 것을 특징으로 하는 프레임 속도 증가 장치.
  17. 제10항에 있어서, 상기 제1프레임 속도는 초당 10프레임 이하인 것을 특징으로 하는 프레임 속도 증가 방법.
  18. 제1항에 있어서, 수신된 비디오 신호에 응답하며, 복수의 프레임으로부터 파라메트릭 입 형성 데이타를 추출하는 특성 추출 수단을 추가로 구비하는 것을 특징으로 하는 프레임 속도 증가 장치.
    ※ 참고사항 : 최초출원 내용에 의하여 공개하는 것임.
KR1019950005198A 1994-03-18 1995-03-14 음성 분석 자동화를 이용하는 비디오 신호 처리 시스템 및 그 방법 KR950035447A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US08/210,529 US6330023B1 (en) 1994-03-18 1994-03-18 Video signal processing systems and methods utilizing automated speech analysis
US210,529 1994-03-18

Publications (1)

Publication Number Publication Date
KR950035447A true KR950035447A (ko) 1995-12-30

Family

ID=22783263

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019950005198A KR950035447A (ko) 1994-03-18 1995-03-14 음성 분석 자동화를 이용하는 비디오 신호 처리 시스템 및 그 방법

Country Status (5)

Country Link
US (1) US6330023B1 (ko)
EP (1) EP0673170A3 (ko)
JP (1) JPH089372A (ko)
KR (1) KR950035447A (ko)
CA (1) CA2143483A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100880480B1 (ko) * 2002-02-21 2009-01-28 엘지전자 주식회사 디지털 오디오 신호의 실시간 음악/음성 식별 방법 및시스템

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6707484B1 (en) * 1994-07-28 2004-03-16 Semiconductor Energy Laboratory Co., Ltd. Information processing system
US5880788A (en) * 1996-03-25 1999-03-09 Interval Research Corporation Automated synchronization of video image sequences to new soundtracks
EP0893923A1 (en) * 1997-07-23 1999-01-27 Texas Instruments France Video communication system
IT1314671B1 (it) * 1998-10-07 2002-12-31 Cselt Centro Studi Lab Telecom Procedimento e apparecchiatura per l'animazione di un modellosintetizzato di volto umano pilotata da un segnale audio.
CN1271573C (zh) * 1999-06-24 2006-08-23 皇家菲利浦电子有限公司 后期同步信息流
US6594629B1 (en) * 1999-08-06 2003-07-15 International Business Machines Corporation Methods and apparatus for audio-visual speech detection and recognition
US6633844B1 (en) * 1999-12-02 2003-10-14 International Business Machines Corporation Late integration in audio-visual continuous speech recognition
US6766299B1 (en) 1999-12-20 2004-07-20 Thrillionaire Productions, Inc. Speech-controlled animation system
EP1143735A1 (en) * 2000-03-01 2001-10-10 Texas Instruments Incorporated Telescopic reconstruction of facial features from a speech pattern
US20040114731A1 (en) * 2000-12-22 2004-06-17 Gillett Benjamin James Communication system
US6614466B2 (en) 2001-02-22 2003-09-02 Texas Instruments Incorporated Telescopic reconstruction of facial features from a speech pattern
US20030058932A1 (en) * 2001-09-24 2003-03-27 Koninklijke Philips Electronics N.V. Viseme based video coding
US7130446B2 (en) * 2001-12-03 2006-10-31 Microsoft Corporation Automatic detection and tracking of multiple individuals using multiple cues
US7257538B2 (en) * 2002-10-07 2007-08-14 Intel Corporation Generating animation from visual and audio input
JP3848319B2 (ja) * 2003-11-11 2006-11-22 キヤノン株式会社 情報処理方法及び情報処理装置
US20080228497A1 (en) * 2005-07-11 2008-09-18 Koninklijke Philips Electronics, N.V. Method For Communication and Communication Device
WO2007007257A1 (en) * 2005-07-13 2007-01-18 Koninklijke Philips Electronics N.V. Processing method and device with video temporal up-conversion
JP5233986B2 (ja) * 2007-03-12 2013-07-10 富士通株式会社 音声波形補間装置および方法
US8224652B2 (en) * 2008-09-26 2012-07-17 Microsoft Corporation Speech and text driven HMM-based body animation synthesis
US8878773B1 (en) 2010-05-24 2014-11-04 Amazon Technologies, Inc. Determining relative motion as input
US8600732B2 (en) * 2010-11-08 2013-12-03 Sling Media Pvt Ltd Translating programming content to match received voice command language
WO2013091677A1 (en) * 2011-12-20 2013-06-27 Squarehead Technology As Speech recognition method and system
US9094576B1 (en) * 2013-03-12 2015-07-28 Amazon Technologies, Inc. Rendered audiovisual communication
CN105282621A (zh) * 2014-07-22 2016-01-27 中兴通讯股份有限公司 一种语音消息可视化服务的实现方法及装置
CN109522799A (zh) * 2018-10-16 2019-03-26 深圳壹账通智能科技有限公司 信息提示方法、装置、计算机设备和存储介质
CN110856014B (zh) * 2019-11-05 2023-03-07 北京奇艺世纪科技有限公司 动态图像生成方法、装置、电子设备及存储介质
CN111553300B (zh) * 2020-05-08 2022-03-11 北京工商大学 一种面向三维点云视频的多时域分辨率唇语行为检测方法
CN113128399B (zh) * 2021-04-19 2022-05-17 重庆大学 用于情感识别的语音图像关键帧提取方法

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4260229A (en) * 1978-01-23 1981-04-07 Bloomstein Richard W Creating visual images of lip movements
US4975960A (en) 1985-06-03 1990-12-04 Petajan Eric D Electronic facial tracking and detection system and method and apparatus for automated speech recognition
GB8528143D0 (en) 1985-11-14 1985-12-18 British Telecomm Image encoding & synthesis
JPS62274962A (ja) * 1986-05-23 1987-11-28 Nec Corp 画像電話システム
US4884972A (en) 1986-11-26 1989-12-05 Bright Star Technology, Inc. Speech synchronized animation
IL86095A0 (ko) * 1987-09-30 1988-09-30 Lilly Co Eli
JPS6490188A (en) * 1987-10-01 1989-04-06 Nissan Chemical Ind Ltd Pyridinecarboxylic acid ester and selective herbicide
JP2644789B2 (ja) * 1987-12-18 1997-08-25 富士通株式会社 画像伝送方式
JP2667455B2 (ja) * 1988-07-27 1997-10-27 富士通株式会社 顔動画像合成システム
JPH02196585A (ja) * 1989-01-26 1990-08-03 Ricoh Co Ltd 音声信号通信装置
JP2518683B2 (ja) * 1989-03-08 1996-07-24 国際電信電話株式会社 画像合成方法及びその装置
JP3023961B2 (ja) * 1989-10-04 2000-03-21 三菱電機株式会社 符号化器及び復号化器
JPH03270390A (ja) * 1990-03-19 1991-12-02 Fujitsu Ltd 擬似動画tv電話
GB9019829D0 (en) * 1990-09-11 1990-10-24 British Telecomm Speech analysis and image synthesis
EP0595895B1 (en) * 1991-07-23 1997-12-29 BRITISH TELECOMMUNICATIONS public limited company Method and device for frame interpolation of a moving image
JPH05153851A (ja) * 1991-11-30 1993-06-22 Shimizu Shiyokubutsuen:Kk コケの栽培方法
WO1994000951A1 (en) * 1992-06-29 1994-01-06 British Telecommunications Public Limited Company Coding and decoding video signals
US5426460A (en) * 1993-12-17 1995-06-20 At&T Corp. Virtual multimedia service for mass market connectivity
EP1092217B1 (en) * 1998-06-29 2005-09-14 Honeywell Inc. Method of and system for detecting and rendering of graphic elements

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100880480B1 (ko) * 2002-02-21 2009-01-28 엘지전자 주식회사 디지털 오디오 신호의 실시간 음악/음성 식별 방법 및시스템

Also Published As

Publication number Publication date
CA2143483A1 (en) 1995-09-19
US6330023B1 (en) 2001-12-11
JPH089372A (ja) 1996-01-12
EP0673170A2 (en) 1995-09-20
EP0673170A3 (en) 1996-06-26

Similar Documents

Publication Publication Date Title
KR950035447A (ko) 음성 분석 자동화를 이용하는 비디오 신호 처리 시스템 및 그 방법
US5884267A (en) Automated speech alignment for image synthesis
JP2518683B2 (ja) 画像合成方法及びその装置
JP2002328695A (ja) テキストからパーソナライズ化音声を生成する方法
JP2003529861A5 (ko)
JP6716300B2 (ja) 議事録生成装置、及び議事録生成プログラム
JP2003186379A (ja) 音声可視化処理のためのプログラム、音声可視化図形表示と音声及び動画像の再生処理のためのプログラム、及び訓練結果表示のためのプログラム、並びに発声発話訓練装置及びコンピュータ・システム
KR950034155A (ko) 시청각매체의 음향재녹음시스템 및 재녹음방법
JP4599606B2 (ja) 頭部動作自動生成のための頭部動作学習装置及び頭部動作合成装置並びにコンピュータプログラム
JP2002108382A (ja) リップシンクを行うアニメーション方法および装置
JP3059022B2 (ja) 動画像表示装置
JPH0756494A (ja) 発音訓練装置
JP2023006218A (ja) 音声変換装置、音声変換方法、プログラム、および記録媒体
JP3730764B2 (ja) 話速/画速同時変換装置
KR100359988B1 (ko) 실시간 화속 변환 장치
JP4381108B2 (ja) 話速変換装置における時報処理装置
JPH04240900A (ja) 音声変換装置
JP2709198B2 (ja) 音声合成方法
JP2945047B2 (ja) 文字放送受信装置
JP3766534B2 (ja) 視覚的に聴覚を補助するシステムおよび方法並びに視覚的に聴覚を補助するための制御プログラムを記録した記録媒体
JP2006162760A (ja) 語学学習装置
JP3410387B2 (ja) 音声素片作成装置、音声合成装置、音声素片作成方法、音声合成方法及び記録媒体
JPS62102294A (ja) 音声符号化方式
JPS60195584A (ja) 発声訓練装置
JP3830200B2 (ja) 人物画像合成装置

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid