JP2005241997A - 音声解析装置、音声解析方法及び音声解析プログラム - Google Patents
音声解析装置、音声解析方法及び音声解析プログラム Download PDFInfo
- Publication number
- JP2005241997A JP2005241997A JP2004051998A JP2004051998A JP2005241997A JP 2005241997 A JP2005241997 A JP 2005241997A JP 2004051998 A JP2004051998 A JP 2004051998A JP 2004051998 A JP2004051998 A JP 2004051998A JP 2005241997 A JP2005241997 A JP 2005241997A
- Authority
- JP
- Japan
- Prior art keywords
- degree
- change
- frequency component
- correlation
- component data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 52
- 238000000034 method Methods 0.000 title claims abstract description 26
- 230000005236 sound signal Effects 0.000 claims description 83
- 238000004364 calculation method Methods 0.000 claims description 12
- 230000001131 transforming effect Effects 0.000 claims description 4
- 238000012545 processing Methods 0.000 abstract description 13
- 238000010586 diagram Methods 0.000 description 15
- 238000000605 extraction Methods 0.000 description 11
- 238000000354 decomposition reaction Methods 0.000 description 9
- 238000006243 chemical reaction Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 4
- 238000012935 Averaging Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 239000002131 composite material Substances 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/04—Segmentation; Word boundary detection
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
- G10L2015/025—Phonemes, fenemes or fenones being the recognition units
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Processing Or Creating Images (AREA)
Abstract
【解決手段】 入力される音声から音素の区切りを検出する、コンピュータで実行可能な音声解析方法であって、前記入力される音声信号において時刻を定めるステップと、前記時刻から所定長の時間範囲に含まれる音声信号を取り出すステップと、前記取り出した音声信号を周波数成分データに分解するステップを繰り返し、複数の前記所定長の時間範囲に含まれる音声信号から、複数の前記周波数成分データを求め、互いに隣接する前記所定長の時間範囲に含まれる前記音声信号に対応する前記周波数成分データにより複数の相関度を求め、その複数の相関度の変化度が前後に隣接する2つの前記変化度より大きい前記変化度を持つ時間範囲を求め、その時間範囲に基づき、前記入力される音声信号を複数に区切ることを特徴とする音声解析方法。
【選択図】 図3
Description
このように音素を抽出するための区間をセグメントと呼ぶ。特許文献2のアニメーション画像生成装置においては、複合正弦波モデル(CSM)等に基づくフォルマント分析を行い、母音を特徴付けるフォルマント情報に基づき音素が抽出される。
図1において音声解析部1以外の機能ブロックは、アニメーションを表示させるためのアニメーション表示部である。
Claims (14)
- 入力される音声から音素の区切りを検出する、コンピュータで実行可能な音声解析方法であって、
前記入力される音声信号において時刻を定める第1のステップと、
前記時刻から所定長の時間範囲に含まれる音声信号を取り出す第2のステップと、
前記取り出した音声信号を周波数成分データに分解する第3のステップとを有し、
所定時間毎に前記第1、第2、及び第3のステップをn回(nは6以上の自然数)繰り返して、n個の前記所定長の時間範囲に含まれる音声信号から取り出されたn個の前記周波数成分データを求め、
互いに隣接する前記所定長の時間範囲に含まれる前記音声信号に対応するi(iは1以上(n−1)以下の自然数)番目の前記周波数成分データと(i+1)番目の前記周波数成分データによりi番目の相関度を求めることで、n個の前記周波数成分データから、(n−1)個の前記相関度を求め、
k(kは1以上(n−2)以下の自然数)番目の前記相関度と前記(k+1)番目の前記相関度によりk番目の変化度を求めることで、(n−1)個の前記相関度から、(n−2)個の前記変化度を求め、
1番目から(n−2)番目までの(n−2)個の前記変化度のうち、前後に隣接する2つの前記変化度より大きい前記変化度を持つ番号、即ち、mを2から(n−3)まで1ずつ変化させたとき、m番目の前記変化度が、(m−1)番目の前記変化度より大きく、かつ、(m+1)番目の前記変化度より大きいという条件を満たす前記mを求め、
前記前後に隣接する2つの前記変化度より大きい前記変化度を持つ番号に基づき前記所定長の時間範囲を特定し、
前記特定された時間範囲に基づき、前記入力される音声信号を複数に区切ることを特徴とする音声解析方法。 - 請求項1において、
更に、区切られた音声信号の区間毎に特徴量を算出し、
前記音素毎の基準データと前記特徴量を比較して、前記区間の前記音素を特定することを特徴とする音声解析方法。 - 請求項1において、
前記所定時間は、互いに重複部分が出るようにずらして取られることを特徴とする音声解析方法。 - 請求項1において、
前記相関度は、同一周波数成分に対応する振幅同士の積を総和した値であることを特徴とする音声解析方法。 - 請求項1において、
前記周波数成分データは、前記取り出した音声信号の周波数成分をフーリエ変換により求められることを特徴とする音声解析方法。 - 請求項2において、
前記特徴量は、前記区切られた音声信号の区間に含まれる前記音声信号をフーリエ変換して得られる周波数成分毎の振幅に応じて決定されることを特徴とする音声解析方法。 - 入力される音声から音素の区切りに対応して画像を表示する、コンピュータで実行可能なアニメーション画像生成方法であって、
前記入力される音声信号において時刻を定める第1のステップと、
前記時刻から所定長の時間範囲に含まれる音声信号を取り出す第2のステップと、
前記取り出した音声信号を周波数成分データに分解する第3のステップとを有し、
所定時間毎に前記第1、第2、及び第3のステップをn回(nは6以上の自然数)繰り返して、n個の前記所定長の時間範囲に含まれる音声信号から取り出されたn個の前記周波数成分データを求め、
互いに隣接する前記所定長の時間範囲に含まれる前記音声信号に対応するi(iは1以上(n−1)以下の自然数)番目の前記周波数成分データと(i+1)番目の前記周波数成分データによりi番目の相関度を求めることで、n個の前記周波数成分データから、(n−1)個の前記相関度を求め、
k(kは1以上(n−2)以下の自然数)番目の前記相関度と前記(k+1)番目の前記相関度によりk番目の変化度を求めることで、(n−1)個の前記相関度から、(n−2)個の前記変化度を求め、
1番目から(n−2)番目までの(n−2)個の前記変化度のうち、前後に隣接する2つの前記変化度より大きい前記変化度を持つ番号、即ち、mを2から(n−3)まで1ずつ変化させたとき、m番目の前記変化度が、(m−1)番目の前記変化度より大きく、かつ、(m+1)番目の前記変化度より大きいという条件を満たす前記mを求め、
前記前後に隣接する2つの前記変化度より大きい前記変化度を持つ番号に基づき前記所定長の時間範囲を特定し、
前記特定された時間範囲に基づき、前記入力される音声信号を複数に区切り、
区切られた音声信号の区間毎に特徴量を算出し、
前記音素毎の基準データと前記特徴量を比較して、前記区間の前記音素を特定し、
前記区間の前記音素に対応する画像を前記区間に合わせて切り替えて表示することを特徴とするアニメーション画像生成方法。 - 入力される音声から音素の区切りを検出する、CPUを備えるコンピュータで実行可能な音声解析プログラムであって、
前記入力される音声信号において時刻を定める第1のステップと、
前記時刻から所定長の時間範囲に含まれる音声信号を取り出す第2のステップと、
前記取り出した音声信号を周波数成分データに分解する第3のステップとを有し、
前記CPUに、所定時間毎に前記第1、第2、及び第3のステップをn回(nは6以上の自然数)繰り返して、n個の前記所定長の時間範囲に含まれる音声信号から取り出されたn個の前記周波数成分データを求めさせ、
前記CPUに、互いに隣接する前記所定長の時間範囲に含まれる前記音声信号に対応するi(iは1以上(n−1)以下の自然数)番目の前記周波数成分データと(i+1)番目の前記周波数成分データによりi番目の相関度を求めることで、n個の前記周波数成分データから、(n−1)個の前記相関度を求めさせ、
前記CPUに、k(kは1以上(n−2)以下の自然数)番目の前記相関度と前記(k+1)番目の前記相関度によりk番目の変化度を求めることで、(n−1)個の前記相関度から、(n−2)個の前記変化度を求めさせ、
前記CPUに、1番目から(n−2)番目までの(n−2)個の前記変化度のうち、前後に隣接する2つの前記変化度より大きい前記変化度を持つ番号、即ち、mを2から(n−3)まで1ずつ変化させたとき、m番目の前記変化度が、(m−1)番目の前記変化度より大きく、かつ、(m+1)番目の前記変化度より大きいという条件を満たす前記mを求めさせ、
前記CPUに、前記前後に隣接する2つの前記変化度より大きい前記変化度を持つ番号に基づき前記所定長の時間範囲を特定させ、
前記CPUに、前記特定された時間範囲に基づき、前記入力される音声信号を複数に区切らせることを特徴とする音声解析プログラム。 - 請求項8において、
更に、前記CPUに、区切られた音声信号の区間毎に特徴量を算出させ、
前記CPUに、前記音素毎の基準データと前記特徴量を比較して、前記区間の前記音素を特定させることを特徴とする音声解析プログラム。 - 請求項9において、
前記所定時間は、互いに重複部分が出るようにずらして取られ、
前記相関度は、同一周波数成分に対応する振幅同士の積を総和した値であり、
前記周波数成分データは、前記取り出した音声信号の周波数成分をフーリエ変換により求められ、
前記特徴量は、前記区切られた音声信号の区間に含まれる前記音声信号をフーリエ変換して得られる周波数成分毎の振幅に応じて決定されることを特徴とする音声解析プログラム。 - 入力される音声から音素の区切りに対応して画像を表示する、CPUを備えたコンピュータで実行可能なアニメーション画像生成プログラムであって、
前記入力される音声信号において時刻を定める第1のステップと、
前記時刻から所定長の時間範囲に含まれる音声信号を取り出す第2のステップと、
前記取り出した音声信号を周波数成分データに分解する第3のステップとを有し、
前記CPUに、所定時間毎に前記第1、第2、及び第3のステップをn回(nは6以上の自然数)繰り返して、n個の前記所定長の時間範囲に含まれる音声信号から取り出されたn個の前記周波数成分データを求めさせ、
前記CPUに、互いに隣接する前記所定長の時間範囲に含まれる前記音声信号に対応するi(iは1以上(n−1)以下の自然数)番目の前記周波数成分データと(i+1)番目の前記周波数成分データによりi番目の相関度を求めることで、n個の前記周波数成分データから、(n−1)個の前記相関度を求めさせ、
前記CPUに、k(kは1以上(n−2)以下の自然数)番目の前記相関度と前記(k+1)番目の前記相関度によりk番目の変化度を求めることで、(n−1)個の前記相関度から、(n−2)個の前記変化度を求めさせ、
前記CPUに、1番目から(n−2)番目までの(n−2)個の前記変化度のうち、前後に隣接する2つの前記変化度より大きい前記変化度を持つ番号、即ち、mを2から(n−3)まで1ずつ変化させたとき、m番目の前記変化度が、(m−1)番目の前記変化度より大きく、かつ、(m+1)番目の前記変化度より大きいという条件を満たす前記mを求めさせ、
前記CPUに、前記前後に隣接する2つの前記変化度より大きい前記変化度を持つ番号に基づき前記所定長の時間範囲を特定させ、
前記CPUに、前記特定された時間範囲に基づき、前記入力される音声信号を複数に区切らせ、
前記CPUに、区切られた音声信号の区間毎に特徴量を算出させ、
前記CPUに、前記音素毎の基準データと前記特徴量を比較して、前記区間の前記音素を特定させ、
前記CPUに、前記区間の前記音素に対応する画像を前記区間に合わせて切り替えて表示させることを特徴とするアニメーション画像生成プログラム。 - 請求項8乃至12のいずれかに記載のプログラムを格納した記憶媒体。
- 入力される音声信号において時刻を定め、前記時刻から所定長の時間範囲に含まれる音声信号を取り出し、前記取り出した音声信号を周波数成分データに分解することを所定時間毎にn回(nは6以上の自然数)繰り返して、n個の前記所定長の時間範囲に含まれる音声信号から取り出されたn個の前記周波数成分データを求める周波数分解部と、
互いに隣接する前記所定長の時間範囲に含まれる前記音声信号に対応するi(iは1以上(n−1)以下の自然数)番目の前記周波数成分データと(i+1)番目の前記周波数成分データによりi番目の相関度を求めることで、n個の前記周波数成分データから、(n−1)個の前記相関度を求め、k(kは1以上(n−2)以下の自然数)番目の前記相関度と前記(k+1)番目の前記相関度によりk番目の変化度を求めることで、(n−1)個の前記相関度から、(n−2)個の前記変化度を求める変化度算出部と、
1番目から(n−2)番目までの(n−2)個の前記変化度のうち、前後に隣接する2つの前記変化度より大きい前記変化度を持つ番号、即ち、mを2から(n−3)まで1ずつ変化させたとき、m番目の前記変化度が、(m−1)番目の前記変化度より大きく、かつ、(m+1)番目の前記変化度より大きいという条件を満たす前記mを求め、前記前後に隣接する2つの前記変化度より大きい前記変化度を持つ番号に基づき前記所定長の時間範囲を特定し、前記特定された時間範囲に基づき、前記入力される音声信号を複数に区切るセグメント決定部とを有することを特徴とする音声解析装置。 - 入力される音声信号において時刻を定め、前記時刻から所定長の時間範囲に含まれる音声信号を取り出し、前記取り出した音声信号を周波数成分データに分解することを所定時間毎にn回(nは6以上の自然数)繰り返して、n個の前記所定長の時間範囲に含まれる音声信号から取り出されたn個の前記周波数成分データを求める周波数分解部と、
互いに隣接する前記所定長の時間範囲に含まれる前記音声信号に対応するi(iは1以上(n−1)以下の自然数)番目の前記周波数成分データと(i+1)番目の前記周波数成分データによりi番目の相関度を求めることで、n個の前記周波数成分データから、(n−1)個の前記相関度を求め、k(kは1以上(n−2)以下の自然数)番目の前記相関度と前記(k+1)番目の前記相関度によりk番目の変化度を求めることで、(n−1)個の前記相関度から、(n−2)個の前記変化度を求める変化度算出部と、
1番目から(n−2)番目までの(n−2)個の前記変化度のうち、前後に隣接する2つの前記変化度より大きい前記変化度を持つ番号、即ち、mを2から(n−3)まで1ずつ変化させたとき、m番目の前記変化度が、(m−1)番目の前記変化度より大きく、かつ、(m+1)番目の前記変化度より大きいという条件を満たす前記mを求め、前記前後に隣接する2つの前記変化度より大きい前記変化度を持つ番号に基づき前記所定長の時間範囲を特定し、前記特定された時間範囲に基づき、前記入力される音声信号を複数に区切るセグメント決定部と、
区切られた音声信号の区間毎に特徴量を算出し、前記音素毎の基準データと前記特徴量を比較して、前記区間の前記音素を特定する音素抽出部と、
前記区間の前記音素に対応する画像を前記区間に合わせて切り替えて表示するアニメーション表示部を有することを特徴とするアニメーション画像生成装置。
Priority Applications (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004051998A JP4792703B2 (ja) | 2004-02-26 | 2004-02-26 | 音声解析装置、音声解析方法及び音声解析プログラム |
US11/060,754 US7680660B2 (en) | 2004-02-26 | 2005-02-18 | Voice analysis device, voice analysis method and voice analysis program |
ES05250981T ES2284133T3 (es) | 2004-02-26 | 2005-02-22 | Segmentacion del habla. |
EP05250981A EP1569201B1 (en) | 2004-02-26 | 2005-02-22 | Speech segmentation |
DE602005000896T DE602005000896T2 (de) | 2004-02-26 | 2005-02-22 | Sprachsegmentierung |
CNB2005100510306A CN1319042C (zh) | 2004-02-26 | 2005-02-25 | 语音分析设备和语音分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004051998A JP4792703B2 (ja) | 2004-02-26 | 2004-02-26 | 音声解析装置、音声解析方法及び音声解析プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005241997A true JP2005241997A (ja) | 2005-09-08 |
JP4792703B2 JP4792703B2 (ja) | 2011-10-12 |
Family
ID=34747518
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004051998A Expired - Lifetime JP4792703B2 (ja) | 2004-02-26 | 2004-02-26 | 音声解析装置、音声解析方法及び音声解析プログラム |
Country Status (6)
Country | Link |
---|---|
US (1) | US7680660B2 (ja) |
EP (1) | EP1569201B1 (ja) |
JP (1) | JP4792703B2 (ja) |
CN (1) | CN1319042C (ja) |
DE (1) | DE602005000896T2 (ja) |
ES (1) | ES2284133T3 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2445718C1 (ru) * | 2010-08-31 | 2012-03-20 | Государственное образовательное учреждение высшего профессионального образования Академия Федеральной службы охраны Российской Федерации (Академия ФСО России) | Способ выделения сегментов обработки речи на основе анализа корреляционных зависимостей в речевом сигнале |
JP2019205645A (ja) * | 2018-05-29 | 2019-12-05 | 株式会社コロプラ | ゲームプログラム、キャラクタ制御プログラム、方法、および情報処理装置 |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5119700B2 (ja) * | 2007-03-20 | 2013-01-16 | 富士通株式会社 | 韻律修正装置、韻律修正方法、および、韻律修正プログラム |
EP2259610B1 (en) * | 2009-06-02 | 2012-08-08 | Vodafone Holding GmbH | Registering a mobile device in a mobile communication network |
US20110143768A1 (en) * | 2009-12-14 | 2011-06-16 | Lane Sean L | Methods and apparatus related to region-specific mobile device and infrastructure detection, analysis and display |
US20120089392A1 (en) * | 2010-10-07 | 2012-04-12 | Microsoft Corporation | Speech recognition user interface |
US10264990B2 (en) * | 2012-10-26 | 2019-04-23 | The Regents Of The University Of California | Methods of decoding speech from brain activity data and devices for practicing the same |
US9302393B1 (en) * | 2014-04-15 | 2016-04-05 | Alan Rosen | Intelligent auditory humanoid robot and computerized verbalization system programmed to perform auditory and verbal artificial intelligence processes |
US10002543B2 (en) * | 2014-11-04 | 2018-06-19 | Knotbird LLC | System and methods for transforming language into interactive elements |
US10057681B2 (en) | 2016-08-01 | 2018-08-21 | Bose Corporation | Entertainment audio processing |
TWI606390B (zh) * | 2016-09-23 | 2017-11-21 | 元鼎音訊股份有限公司 | 可自動調整聲音輸出之方法及電子裝置 |
JP6337362B1 (ja) * | 2017-11-02 | 2018-06-06 | パナソニックIpマネジメント株式会社 | 認知機能評価装置、及び、認知機能評価システム |
CN108170710A (zh) * | 2017-11-28 | 2018-06-15 | 苏州市东皓计算机系统工程有限公司 | 一种计算机声音识别系统 |
CN108538308B (zh) * | 2018-01-09 | 2020-09-29 | 网易(杭州)网络有限公司 | 基于语音的口型和/或表情模拟方法及装置 |
CN109087629A (zh) * | 2018-08-24 | 2018-12-25 | 苏州玩友时代科技股份有限公司 | 一种基于语音识别的口型动画实现方法及装置 |
CN113112993B (zh) * | 2020-01-10 | 2024-04-02 | 阿里巴巴集团控股有限公司 | 一种音频信息处理方法、装置、电子设备以及存储介质 |
CN111540344B (zh) * | 2020-04-21 | 2022-01-21 | 北京字节跳动网络技术有限公司 | 声学网络模型训练方法、装置及电子设备 |
CN116129926B (zh) * | 2023-04-19 | 2023-06-09 | 北京北信源软件股份有限公司 | 智能设备自然语言交互信息处理方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6136798A (ja) * | 1984-07-30 | 1986-02-21 | 松下電器産業株式会社 | 音声セグメンテ−シヨン法 |
JPS6250800A (ja) * | 1985-08-30 | 1987-03-05 | 株式会社日立製作所 | 音声認識装置 |
JPH04111181A (ja) * | 1990-08-31 | 1992-04-13 | Personal Joho Kankyo Kyokai | 動画像の変化点検出方法 |
JPH04263298A (ja) * | 1991-02-16 | 1992-09-18 | Nippon Sheet Glass Co Ltd | 音声認識装置 |
JP2000100072A (ja) * | 1998-09-24 | 2000-04-07 | Sony Corp | 情報信号処理方法及び装置 |
JP2000324499A (ja) * | 1999-05-14 | 2000-11-24 | Fujitsu Ltd | 画像処理装置及びシーンチェンジ検出方法 |
JP2002108382A (ja) * | 2000-09-27 | 2002-04-10 | Sony Corp | リップシンクを行うアニメーション方法および装置 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS58148443A (ja) | 1982-03-01 | 1983-09-03 | Seiko Epson Corp | 半導体集積回路装置 |
JPS61100956A (ja) | 1984-10-22 | 1986-05-19 | Nec Corp | モノブリツド集積回路 |
NL8500377A (nl) | 1985-02-12 | 1986-09-01 | Philips Nv | Werkwijze en inrichting voor het segmenteren van spraak. |
US5689618A (en) * | 1991-02-19 | 1997-11-18 | Bright Star Technology, Inc. | Advanced tools for speech synchronized animation |
JP3269162B2 (ja) | 1992-03-23 | 2002-03-25 | 日本電気株式会社 | エレクトロルミネッセンス表示パネル駆動回路 |
JPH0632007A (ja) | 1992-07-15 | 1994-02-08 | Sony Corp | リボンカートリッジ |
US5878396A (en) * | 1993-01-21 | 1999-03-02 | Apple Computer, Inc. | Method and apparatus for synthetic speech in facial animation |
US5657426A (en) * | 1994-06-10 | 1997-08-12 | Digital Equipment Corporation | Method and apparatus for producing audio-visual synthetic speech |
JP3081108B2 (ja) | 1994-08-11 | 2000-08-28 | 株式会社トレンディ | 話者分類処理装置及び方法 |
CA2281746A1 (en) * | 1997-03-25 | 1998-10-01 | Robert William Series | Speech analysis system |
JP2002215180A (ja) | 2001-01-17 | 2002-07-31 | Digital Media Lab Inc | 通信装置 |
JP2003233389A (ja) | 2002-02-12 | 2003-08-22 | Yamaha Corp | アニメーション画像生成装置、及び同装置を内蔵した携帯電話、並びにアニメーション画像生成方法 |
-
2004
- 2004-02-26 JP JP2004051998A patent/JP4792703B2/ja not_active Expired - Lifetime
-
2005
- 2005-02-18 US US11/060,754 patent/US7680660B2/en not_active Expired - Fee Related
- 2005-02-22 ES ES05250981T patent/ES2284133T3/es active Active
- 2005-02-22 DE DE602005000896T patent/DE602005000896T2/de active Active
- 2005-02-22 EP EP05250981A patent/EP1569201B1/en not_active Expired - Fee Related
- 2005-02-25 CN CNB2005100510306A patent/CN1319042C/zh not_active Expired - Fee Related
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6136798A (ja) * | 1984-07-30 | 1986-02-21 | 松下電器産業株式会社 | 音声セグメンテ−シヨン法 |
JPS6250800A (ja) * | 1985-08-30 | 1987-03-05 | 株式会社日立製作所 | 音声認識装置 |
JPH04111181A (ja) * | 1990-08-31 | 1992-04-13 | Personal Joho Kankyo Kyokai | 動画像の変化点検出方法 |
JPH04263298A (ja) * | 1991-02-16 | 1992-09-18 | Nippon Sheet Glass Co Ltd | 音声認識装置 |
JP2000100072A (ja) * | 1998-09-24 | 2000-04-07 | Sony Corp | 情報信号処理方法及び装置 |
JP2000324499A (ja) * | 1999-05-14 | 2000-11-24 | Fujitsu Ltd | 画像処理装置及びシーンチェンジ検出方法 |
JP2002108382A (ja) * | 2000-09-27 | 2002-04-10 | Sony Corp | リップシンクを行うアニメーション方法および装置 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2445718C1 (ru) * | 2010-08-31 | 2012-03-20 | Государственное образовательное учреждение высшего профессионального образования Академия Федеральной службы охраны Российской Федерации (Академия ФСО России) | Способ выделения сегментов обработки речи на основе анализа корреляционных зависимостей в речевом сигнале |
JP2019205645A (ja) * | 2018-05-29 | 2019-12-05 | 株式会社コロプラ | ゲームプログラム、キャラクタ制御プログラム、方法、および情報処理装置 |
Also Published As
Publication number | Publication date |
---|---|
ES2284133T3 (es) | 2007-11-01 |
EP1569201B1 (en) | 2007-04-18 |
EP1569201A1 (en) | 2005-08-31 |
JP4792703B2 (ja) | 2011-10-12 |
DE602005000896T2 (de) | 2008-01-17 |
US20050192805A1 (en) | 2005-09-01 |
CN1661675A (zh) | 2005-08-31 |
US7680660B2 (en) | 2010-03-16 |
DE602005000896D1 (de) | 2007-05-31 |
CN1319042C (zh) | 2007-05-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7680660B2 (en) | Voice analysis device, voice analysis method and voice analysis program | |
WO2019196306A1 (zh) | 基于语音的口型动画合成装置、方法及可读存储介质 | |
JP5059115B2 (ja) | 音声キーワードの特定方法、装置及び音声識別システム | |
US7636662B2 (en) | System and method for audio-visual content synthesis | |
JP5967838B2 (ja) | 人間型ロボットのジェスチャと音声の同期 | |
CN108538308B (zh) | 基于语音的口型和/或表情模拟方法及装置 | |
CN110808034A (zh) | 语音转换方法、装置、存储介质及电子设备 | |
CN112309365B (zh) | 语音合成模型的训练方法、装置、存储介质以及电子设备 | |
KR102116309B1 (ko) | 가상 캐릭터와 텍스트의 동기화 애니메이션 출력 시스템 | |
CN111145777A (zh) | 一种虚拟形象展示方法、装置、电子设备及存储介质 | |
CN112995736A (zh) | 语音字幕合成方法、装置、计算机设备及存储介质 | |
CN114121006A (zh) | 虚拟角色的形象输出方法、装置、设备以及存储介质 | |
JP2023552854A (ja) | ヒューマンコンピュータインタラクション方法、装置、システム、電子機器、コンピュータ可読媒体及びプログラム | |
JP2015038725A (ja) | 発話アニメーション生成装置、方法、及びプログラム | |
CN114363691A (zh) | 语音字幕合成方法、装置、计算机设备及存储介质 | |
CN112908308A (zh) | 一种音频处理方法、装置、设备及介质 | |
CN112381926A (zh) | 用于生成视频的方法和装置 | |
US20080189105A1 (en) | Apparatus And Method For Automatically Indicating Time in Text File | |
JP3755503B2 (ja) | アニメーション制作システム | |
CN115619897A (zh) | 图像处理方法、装置、电子设备及存储介质 | |
CN115529500A (zh) | 动态影像的生成方法和装置 | |
CN112634861A (zh) | 数据处理方法、装置、电子设备和可读存储介质 | |
CN105989832A (zh) | 一种用于在计算机设备中生成个性化语音的方法和装置 | |
JP6213217B2 (ja) | 音声合成装置及び音声合成用コンピュータプログラム | |
JP2011180368A (ja) | 合成音声修正装置および合成音声修正方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070226 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20091215 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100105 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100305 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100831 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20101026 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110419 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110509 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110628 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110711 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4792703 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140805 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140805 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |