KR950035447A - 음성 분석 자동화를 이용하는 비디오 신호 처리 시스템 및 그 방법 - Google Patents
음성 분석 자동화를 이용하는 비디오 신호 처리 시스템 및 그 방법 Download PDFInfo
- Publication number
- KR950035447A KR950035447A KR1019950005198A KR19950005198A KR950035447A KR 950035447 A KR950035447 A KR 950035447A KR 1019950005198 A KR1019950005198 A KR 1019950005198A KR 19950005198 A KR19950005198 A KR 19950005198A KR 950035447 A KR950035447 A KR 950035447A
- Authority
- KR
- South Korea
- Prior art keywords
- speaker
- frame rate
- video signal
- frame
- frames
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 10
- 230000005236 sound signal Effects 0.000 claims abstract 8
- 238000012544 monitoring process Methods 0.000 claims abstract 6
- 230000001815 facial effect Effects 0.000 claims abstract 4
- 230000015572 biosynthetic process Effects 0.000 claims 6
- 230000003179 granulation Effects 0.000 claims 4
- 238000005469 granulation Methods 0.000 claims 4
- 238000007493 shaping process Methods 0.000 claims 3
- 238000003786 synthesis reaction Methods 0.000 claims 3
- 238000000605 extraction Methods 0.000 claims 1
- 238000003780 insertion Methods 0.000 claims 1
- 230000037431 insertion Effects 0.000 claims 1
- 230000002194 synthesizing effect Effects 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/434—Disassembling of a multiplex stream, e.g. demultiplexing audio and video streams, extraction of additional data from a video stream; Remultiplexing of multiplex streams; Extraction or processing of SI; Disassembling of packetised elementary stream
- H04N21/4341—Demultiplexing of audio and video streams
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0356—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for synchronising with other signals, e.g. video signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/57—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for processing of video signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/132—Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/587—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal sub-sampling or interpolation, e.g. decimation or subsequent interpolation of pictures in a video sequence
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/439—Processing of audio elementary streams
- H04N21/4394—Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/44—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs
- H04N21/44008—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/44—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs
- H04N21/4402—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
- H04N21/440281—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display by altering the temporal resolution, e.g. by frame skipping
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/06—Transformation of speech into a non-audible representation, e.g. speech visualisation or speech processing for tactile aids
- G10L21/10—Transforming into visible information
- G10L2021/105—Synthesis of the lips movements from speech, e.g. for talking heads
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/20—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding
Abstract
화자의 영상 프레임 속도를 증가시키는 방법은 화자의 발음을 나타내는 오디오 신호 및 결합된 비디오 신호를 모니터링하는 단계를 포함한다. 오디오 신호는 재구성되는 1 이상의 필드 또는 프레임에 대응하며, 오디오 신호의 각 부분은 안면 특성 정보에 결합된다. 안면 정보는 화자의 입 위치를 실제로 예측할 수 있는 음소 또는 다른 음성-기초 수준에서 도출된 위치 정보 및 입 형성을 포함한다. 영상의 필드 또는 프레임은 현존 프레임에서 추출된 영상 특성을 이용함과 동시에 검출된 음소에 결합된 안면 특성 정보를 이용하여 재구성된다.
Description
본 내용은 요부공개 건이므로 전문내용을 수록하지 않았음
제1도는 본 발명의 음성 결합된 비디오 프레임 시퀀스 보간 처리의 실시예의 여러 단계를 도시한 플로우챠트, 제2도는 본 발명에 따른 음성 결합된 비디오 프레임 시퀀스 보간의 한 응용을 나타내는 비디오판 장치의 여러 구성요소를 도시한 블록도.
Claims (18)
- 제1프레임 속도를 가지며 화자의 영상 시퀀스(image sequence)를 나타내는 수신된 비디오신호의 프레임 속도를 증가시키는 장치에 있어서, 적어도 소정의 검출되는 음성 세그먼트는 수신된 비디오 신호에 의해 표현되지 않은 영상 시퀀스의 영상에 대응하는 것으로, 화자의 발음에 의한 상기 음성 세그먼트를 검출하도록 영상 시퀀스에 일시적으로 대응하는 오디오 신호를 모니터링하는 수단과:저장된 파라메트릭 입 형성 데이타에 검출된 음성 세그먼트를 결합하는 수단 및 상기 모니터링 수단 및 상기 결합 수단에 응답하며, 화자의 영상을 나타내는 적어도 하나의 음향 합성된 프레임을 발생함과 동시에 수신된 비디오신호의 인접 프레임들간에 상기 적어도 하나의 음향 합성된 프레임을 삽입하여, 상기 제1프레임 속도보다 높은 프레임 속도를 갖는 비디오 신호를 제공하게 되는 프레임 발생수단을 구비하는 것을 특징으로 하는 프레임 속도 증가 장치.
- 제1항에 있어서, 상기 검출된 각각의 음성 세그먼트는 상기 파라메트릭 입형성 데이타에 의해 표현되는 각각의 입 형성에 대응하는 것을 특징으로 프레임 속도 증가 장치.
- 제1항에 있어서, 상기 검출된 각각의 음성 세그먼트가 음소(phoneme)인 것을 특징으로 하는 프레임 속도 증가 장치.
- 제1항에 있어서, 상기 검출된 각각의 음성 세그먼트가 동음이의어(homophene)인 것을 특징으로 하는 프레임 속도 증가 장치.
- 제2항에 있어서, 상기 화자의 각각의 입 형성은 바이스미(viseme)인 것을 특징으로 하는 프레임 속도 증가 장치.
- 제2항에 있어서, 상기 결합 수단은 예정된 음성 세그먼트를 발음하는 일반적인 화자의 입 모양을 나타내는 입 형성 파라미터의 저장 테이블을 갖고 있는 메모리를 포함하는 것을 특징으로 프레임 속도 증가 장치.
- 제1항에 있어서, 상기 모니터링 수단에 의해 검출되는 음성 세그먼트와 같이 상기 수신된 비디오 신호의 프레임들로부터 입 형성 파라미터를 추출하기 위한, 상기 모니터링 수단에 응답하는 특성 추출 수단(feature extraction means)을 구비하는데, 각각의 저장된 입 형성 파라미터는 예정된 음성 세그먼트를 발음하는 화자의 입 모양을 나타내는 것을 특징으로 하는 프레임 속도 증가 장치.
- 제1항에 있어서, 상기 프레임 발생 수단은 수신된 비디오 신호의 인접 프레임들 간의 삽입용 복수 프레임을 음향 합성하도록 작동하는 것을 특징으로 하는 프레임 속도 증가 장치.
- 제1항에 있어서, 상기 결합 수단은 회자의 턱, 혀 및 치아중 적어도 하나의 기억된 형태로 화자가 발음하여 검출된 음성 세그먼트를 결합하도록 작동하는 것을 특징으로 하는 프레임 속도 증가 장치.
- 제1프레임 속도를 가지며 화자의 영상 시퀀스를 나타내는 수신된 비디오신호의 프레임 속도를 증가시키는 방법에 있어서, 적어도 소정의 검출되는 음성 세그먼트는 수신된 비디오 신호에 의해 표현되지 않은 영상 신퀀스의 영상에 대응하는 것으로, 화자의 발음에 의한 상기 음성 세그먼트를 검출하도록 영상 시퀀스에 일시적으로 대응하는 오디오 신호를 모니터하는 단계와:저장된 파라메트릭 입 형성 데이타에 검출된 음성 세그먼트를 결합하는 단계와:상기 결합 단계시 식별되는 파라메트릭 입 형성 데이타 및 수신된 비디오 신호의 적어도 1프레임에서, 화자의 영상을 나타내는 프레임을 음향 합성하는 (synthesizing)단계 및 상기 제1프레임 속도보다 높은 프레임 속도를 갖는 제2 비디오신호를 얻기 위해, 상기 음향 합성 단계시에 얻을 수 있는 프레임을 수신된 비디오신호의 인접 프레임들 사이에 삽입하는 단계를 포함하는 것을 특징으로 하는 프레임 속도 증가 방법.
- 제10항에 있어서, 복수의 프레임이 상기 음향 합성 단계시 순차적으로 음향 합성되는데, 상기 음향 합성된 프레임들은 상기 발음 형성 동안 화자의 영상을 나타내는 것을 특징으로 하는 프레임 속도 증가 방법.
- 제10항에 있어서, 상기 검출된 각각의 음성 세그먼트가 음소인 것을 특징으로 하는 프레임 속도 증가 방법.
- 제10항에 있어서, 상기 검출된 각각의 음성 세그먼트가 동음이의어인 것을 특징으로 하는 프레임 속도 증가 방법.
- 제10항에 있어서, 상기 결합 단계는 예정된 음성세그먼트를 발음하는 일반적인 화자의 입 모양을 나타내는 입 형성 파라미터를 갖는 파라메트릭 안면 특성 데이타의 저장 테이블을 어드레싱하는 단계를 포함하는 것을 특징으로 하는 프레임 속도 증가 방법.
- 디지탈 오디오 및 비디오 데이타 신호를 송신 및 수신하기 위한 비디오원격 회의 장치에 있어서, 화자의 발음에 일시적으로 대응하며 화자의 영상 시퀀스를 나타내는 매우 낮은 프레임 속도의 비디오 및 오디오 신호를 수신하는 수단과:낮은 프레임 속도의 비디오 신호로 표현되지 않는 시퀀스 영상에 일시적으로 대응하는 오디요신호부 및 화자의 영상을 표현하는 프레임을 음향 합성하기 위한 적어도 1프레임을 나타내는 비디오 신호부에 응답하는 프레임 발생 수단과:저장된 안면 특성 정보에 상기 오디오 신호의 각 부분을 결합하는 수단과:높은 프레임 속도 시퀀스를 형성하기 위해 상기 낮은 프레임 속도 비디오신호의 연속 수신된 프레임 사이에 상기 발생수단에 의해 음향 합성된 프레임을 삽입하는 수단 및 상기 높은 프레임 속도 시퀀스를 디스플레이하는 수단을 구비하는 것을 특징으로 하는 비디오 원격 회의 장치.
- 제1항에 있어서, 상기 제1프레임 속도는 초당 10프레임 이하인 것을 특징으로 하는 프레임 속도 증가 장치.
- 제10항에 있어서, 상기 제1프레임 속도는 초당 10프레임 이하인 것을 특징으로 하는 프레임 속도 증가 방법.
- 제1항에 있어서, 수신된 비디오 신호에 응답하며, 복수의 프레임으로부터 파라메트릭 입 형성 데이타를 추출하는 특성 추출 수단을 추가로 구비하는 것을 특징으로 하는 프레임 속도 증가 장치.※ 참고사항 : 최초출원 내용에 의하여 공개하는 것임.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US08/210,529 US6330023B1 (en) | 1994-03-18 | 1994-03-18 | Video signal processing systems and methods utilizing automated speech analysis |
US210,529 | 1994-03-18 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR950035447A true KR950035447A (ko) | 1995-12-30 |
Family
ID=22783263
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1019950005198A KR950035447A (ko) | 1994-03-18 | 1995-03-14 | 음성 분석 자동화를 이용하는 비디오 신호 처리 시스템 및 그 방법 |
Country Status (5)
Country | Link |
---|---|
US (1) | US6330023B1 (ko) |
EP (1) | EP0673170A3 (ko) |
JP (1) | JPH089372A (ko) |
KR (1) | KR950035447A (ko) |
CA (1) | CA2143483A1 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100880480B1 (ko) * | 2002-02-21 | 2009-01-28 | 엘지전자 주식회사 | 디지털 오디오 신호의 실시간 음악/음성 식별 방법 및시스템 |
Families Citing this family (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6707484B1 (en) * | 1994-07-28 | 2004-03-16 | Semiconductor Energy Laboratory Co., Ltd. | Information processing system |
US5880788A (en) * | 1996-03-25 | 1999-03-09 | Interval Research Corporation | Automated synchronization of video image sequences to new soundtracks |
EP0893923A1 (en) * | 1997-07-23 | 1999-01-27 | Texas Instruments France | Video communication system |
IT1314671B1 (it) * | 1998-10-07 | 2002-12-31 | Cselt Centro Studi Lab Telecom | Procedimento e apparecchiatura per l'animazione di un modellosintetizzato di volto umano pilotata da un segnale audio. |
CN1271573C (zh) * | 1999-06-24 | 2006-08-23 | 皇家菲利浦电子有限公司 | 后期同步信息流 |
US6594629B1 (en) * | 1999-08-06 | 2003-07-15 | International Business Machines Corporation | Methods and apparatus for audio-visual speech detection and recognition |
US6633844B1 (en) * | 1999-12-02 | 2003-10-14 | International Business Machines Corporation | Late integration in audio-visual continuous speech recognition |
US6766299B1 (en) | 1999-12-20 | 2004-07-20 | Thrillionaire Productions, Inc. | Speech-controlled animation system |
EP1143735A1 (en) * | 2000-03-01 | 2001-10-10 | Texas Instruments Incorporated | Telescopic reconstruction of facial features from a speech pattern |
US20040114731A1 (en) * | 2000-12-22 | 2004-06-17 | Gillett Benjamin James | Communication system |
US6614466B2 (en) | 2001-02-22 | 2003-09-02 | Texas Instruments Incorporated | Telescopic reconstruction of facial features from a speech pattern |
US20030058932A1 (en) * | 2001-09-24 | 2003-03-27 | Koninklijke Philips Electronics N.V. | Viseme based video coding |
US7130446B2 (en) * | 2001-12-03 | 2006-10-31 | Microsoft Corporation | Automatic detection and tracking of multiple individuals using multiple cues |
US7257538B2 (en) * | 2002-10-07 | 2007-08-14 | Intel Corporation | Generating animation from visual and audio input |
JP3848319B2 (ja) * | 2003-11-11 | 2006-11-22 | キヤノン株式会社 | 情報処理方法及び情報処理装置 |
US20080228497A1 (en) * | 2005-07-11 | 2008-09-18 | Koninklijke Philips Electronics, N.V. | Method For Communication and Communication Device |
WO2007007257A1 (en) * | 2005-07-13 | 2007-01-18 | Koninklijke Philips Electronics N.V. | Processing method and device with video temporal up-conversion |
JP5233986B2 (ja) * | 2007-03-12 | 2013-07-10 | 富士通株式会社 | 音声波形補間装置および方法 |
US8224652B2 (en) * | 2008-09-26 | 2012-07-17 | Microsoft Corporation | Speech and text driven HMM-based body animation synthesis |
US8878773B1 (en) | 2010-05-24 | 2014-11-04 | Amazon Technologies, Inc. | Determining relative motion as input |
US8600732B2 (en) * | 2010-11-08 | 2013-12-03 | Sling Media Pvt Ltd | Translating programming content to match received voice command language |
WO2013091677A1 (en) * | 2011-12-20 | 2013-06-27 | Squarehead Technology As | Speech recognition method and system |
US9094576B1 (en) * | 2013-03-12 | 2015-07-28 | Amazon Technologies, Inc. | Rendered audiovisual communication |
CN105282621A (zh) * | 2014-07-22 | 2016-01-27 | 中兴通讯股份有限公司 | 一种语音消息可视化服务的实现方法及装置 |
CN109522799A (zh) * | 2018-10-16 | 2019-03-26 | 深圳壹账通智能科技有限公司 | 信息提示方法、装置、计算机设备和存储介质 |
CN110856014B (zh) * | 2019-11-05 | 2023-03-07 | 北京奇艺世纪科技有限公司 | 动态图像生成方法、装置、电子设备及存储介质 |
CN111553300B (zh) * | 2020-05-08 | 2022-03-11 | 北京工商大学 | 一种面向三维点云视频的多时域分辨率唇语行为检测方法 |
CN113128399B (zh) * | 2021-04-19 | 2022-05-17 | 重庆大学 | 用于情感识别的语音图像关键帧提取方法 |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4260229A (en) * | 1978-01-23 | 1981-04-07 | Bloomstein Richard W | Creating visual images of lip movements |
US4975960A (en) | 1985-06-03 | 1990-12-04 | Petajan Eric D | Electronic facial tracking and detection system and method and apparatus for automated speech recognition |
GB8528143D0 (en) | 1985-11-14 | 1985-12-18 | British Telecomm | Image encoding & synthesis |
JPS62274962A (ja) * | 1986-05-23 | 1987-11-28 | Nec Corp | 画像電話システム |
US4884972A (en) | 1986-11-26 | 1989-12-05 | Bright Star Technology, Inc. | Speech synchronized animation |
IL86095A0 (ko) * | 1987-09-30 | 1988-09-30 | Lilly Co Eli | |
JPS6490188A (en) * | 1987-10-01 | 1989-04-06 | Nissan Chemical Ind Ltd | Pyridinecarboxylic acid ester and selective herbicide |
JP2644789B2 (ja) * | 1987-12-18 | 1997-08-25 | 富士通株式会社 | 画像伝送方式 |
JP2667455B2 (ja) * | 1988-07-27 | 1997-10-27 | 富士通株式会社 | 顔動画像合成システム |
JPH02196585A (ja) * | 1989-01-26 | 1990-08-03 | Ricoh Co Ltd | 音声信号通信装置 |
JP2518683B2 (ja) * | 1989-03-08 | 1996-07-24 | 国際電信電話株式会社 | 画像合成方法及びその装置 |
JP3023961B2 (ja) * | 1989-10-04 | 2000-03-21 | 三菱電機株式会社 | 符号化器及び復号化器 |
JPH03270390A (ja) * | 1990-03-19 | 1991-12-02 | Fujitsu Ltd | 擬似動画tv電話 |
GB9019829D0 (en) * | 1990-09-11 | 1990-10-24 | British Telecomm | Speech analysis and image synthesis |
EP0595895B1 (en) * | 1991-07-23 | 1997-12-29 | BRITISH TELECOMMUNICATIONS public limited company | Method and device for frame interpolation of a moving image |
JPH05153851A (ja) * | 1991-11-30 | 1993-06-22 | Shimizu Shiyokubutsuen:Kk | コケの栽培方法 |
WO1994000951A1 (en) * | 1992-06-29 | 1994-01-06 | British Telecommunications Public Limited Company | Coding and decoding video signals |
US5426460A (en) * | 1993-12-17 | 1995-06-20 | At&T Corp. | Virtual multimedia service for mass market connectivity |
EP1092217B1 (en) * | 1998-06-29 | 2005-09-14 | Honeywell Inc. | Method of and system for detecting and rendering of graphic elements |
-
1994
- 1994-03-18 US US08/210,529 patent/US6330023B1/en not_active Expired - Fee Related
-
1995
- 1995-02-27 CA CA002143483A patent/CA2143483A1/en not_active Abandoned
- 1995-03-08 EP EP95301496A patent/EP0673170A3/en not_active Withdrawn
- 1995-03-14 KR KR1019950005198A patent/KR950035447A/ko not_active Application Discontinuation
- 1995-03-17 JP JP7084490A patent/JPH089372A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100880480B1 (ko) * | 2002-02-21 | 2009-01-28 | 엘지전자 주식회사 | 디지털 오디오 신호의 실시간 음악/음성 식별 방법 및시스템 |
Also Published As
Publication number | Publication date |
---|---|
CA2143483A1 (en) | 1995-09-19 |
US6330023B1 (en) | 2001-12-11 |
JPH089372A (ja) | 1996-01-12 |
EP0673170A2 (en) | 1995-09-20 |
EP0673170A3 (en) | 1996-06-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR950035447A (ko) | 음성 분석 자동화를 이용하는 비디오 신호 처리 시스템 및 그 방법 | |
US5884267A (en) | Automated speech alignment for image synthesis | |
JP2518683B2 (ja) | 画像合成方法及びその装置 | |
JP2002328695A (ja) | テキストからパーソナライズ化音声を生成する方法 | |
JP2003529861A5 (ko) | ||
JP6716300B2 (ja) | 議事録生成装置、及び議事録生成プログラム | |
JP2003186379A (ja) | 音声可視化処理のためのプログラム、音声可視化図形表示と音声及び動画像の再生処理のためのプログラム、及び訓練結果表示のためのプログラム、並びに発声発話訓練装置及びコンピュータ・システム | |
KR950034155A (ko) | 시청각매체의 음향재녹음시스템 및 재녹음방법 | |
JP4599606B2 (ja) | 頭部動作自動生成のための頭部動作学習装置及び頭部動作合成装置並びにコンピュータプログラム | |
JP2002108382A (ja) | リップシンクを行うアニメーション方法および装置 | |
JP3059022B2 (ja) | 動画像表示装置 | |
JPH0756494A (ja) | 発音訓練装置 | |
JP2023006218A (ja) | 音声変換装置、音声変換方法、プログラム、および記録媒体 | |
JP3730764B2 (ja) | 話速/画速同時変換装置 | |
KR100359988B1 (ko) | 실시간 화속 변환 장치 | |
JP4381108B2 (ja) | 話速変換装置における時報処理装置 | |
JPH04240900A (ja) | 音声変換装置 | |
JP2709198B2 (ja) | 音声合成方法 | |
JP2945047B2 (ja) | 文字放送受信装置 | |
JP3766534B2 (ja) | 視覚的に聴覚を補助するシステムおよび方法並びに視覚的に聴覚を補助するための制御プログラムを記録した記録媒体 | |
JP2006162760A (ja) | 語学学習装置 | |
JP3410387B2 (ja) | 音声素片作成装置、音声合成装置、音声素片作成方法、音声合成方法及び記録媒体 | |
JPS62102294A (ja) | 音声符号化方式 | |
JPS60195584A (ja) | 発声訓練装置 | |
JP3830200B2 (ja) | 人物画像合成装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
WITN | Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid |