JP5030150B2 - 筋電位信号による音声認識装置 - Google Patents
筋電位信号による音声認識装置 Download PDFInfo
- Publication number
- JP5030150B2 JP5030150B2 JP2007071728A JP2007071728A JP5030150B2 JP 5030150 B2 JP5030150 B2 JP 5030150B2 JP 2007071728 A JP2007071728 A JP 2007071728A JP 2007071728 A JP2007071728 A JP 2007071728A JP 5030150 B2 JP5030150 B2 JP 5030150B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- feature
- speech recognition
- myoelectric
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
(1)作業現場や飛行機の中などの騒音の大きい環境、
(2)公共の場所で大きな声で話せない場面、
(3)咽頭切除などで発声が困難な場合、
などの、明瞭な音声を得ることができない状況では、音声認識は困難である。
松岡,古谷,黒須:"画像処理による読唇の試み−母音口形の識別およびそれに基づく単語認識",計測自動制御学会論文集,22,2,pp.191−198(1986). 呉,田村,光本,河合,黒須,岡崎:"音声・口形特徴量を併用するニューラルネットを用いた母音認識",電子情報通信学会論文誌,J73−D2,8,pp.1309−1314(1990). 寺田,山中,大恵:"口のカラー動画像を用いた音韻認識",電気学会論文誌D,119,1,pp.37−43(1999). 石井,佐藤,西田,景山:"時系列口唇画像を用いた読唇のための特徴抽出と唇の動き解析",電気学会論文誌D,119,4,pp.465−472(1999). 菅原,新地,岸野,小西:"パーソナルコンピュータ上での読唇システムの実時間実現",計測自動制御学会論文集,36,12,pp.1145−1151(2000). 中田,安藤:"色抽出法と固有空間法を用いた読唇処理",電子情報通信学会論文誌,J85−D2,12,pp.1813−1822(2002). 間瀬,ペントランド:"オプティカルフローヲ用いた読唇",電子情報通信学会論文誌,J73−D2,6,pp.796−803(1990). M. Stone, E. P. Davis, A. S. Douglas, M. NessAiver, R. Gullapalli, W. S. Levine and A. Lundberg: "Modeling the motion of the internal tongue from tagged cine−mri images", The Journal of the Acoustical Society of America, 109, 6, pp.2974−2982 (2001). H. Takemoto and K. Honda: "Measurement of temporal changes in vocal tract area function from 3D cine−MRI data", The Journal of the Acoustical Society of America, 119, 2, pp.1037−1049 (2006). Y. S. Akgul, C. Kambhamettu and M. Stone: "Automatic extraction and tracking of the tongue contours", IEEE Transactions on Medical Imaging, 18, 10, pp.1035−1045 (1999). 真鍋,平岩,杉村:"無発声音声認識:筋電信号を用いた声を伴わない日本語5母音の認識",電子情報通信学会論文誌,J88−D2,9,pp.1909−1917(2005). 福田, 藤田, 辻:"EMG信号を利用した代用発声システム",電子情報通信学会論文誌,J88−D2,1,pp.105−112(2005). 西田,栗田:"カーネル学習法とその画像認識への応用",情報処理学会:コンピュータビジョンとイメージメディア,46,SIG15(CVIM12),pp.1−10(2005). 木塚,木竜,増田,佐渡山:"表面筋電図",東京電機大学出版局(2006). 河合,原島:"肉単",エヌ・ティー・エス(2004). C. C. Chang and C. J. Lin: "LIBSVM: a library for support vector machines"(2001).
本発明の実施例の音声認識装置では、日本語5母音(/a/,/i/,/u/,/e/,/o/)を識別の対象としている。約1秒の間隔を空けて、各母音を約200ミリ秒(ms)、5母音連続で発声した時の筋電位信号を基に学習と識別を行う。表面電極の貼り付け位置は、図2に示されているように、5箇所(5チャネル)としている。チャネル1は声帯(Vocal cord)、チャネル2は顎二腹筋(Digastric)、チャネル3は下唇下制筋(Mentalis)、チャネル4は口輪筋(Orbicularis oris)、チャネル5は大頬骨筋(Zygomaticus major)の直上に配置した。発声時によく働く筋を基準に選定し、解剖学的知見に基づき、おおよその位置を同定する(非特許文献15参照)。
本発明の音声認識装置の有効性を評価するために、筋電位信号からの日本語5 母音の識別実験を行った。被験者は、20〜30歳代の男性3名(被験者A,B,C)と女性1名(被験者D)の計4名である。被験者Aについては、予備実験を何度か行っているが、他の被験者については、電極を貼り付けて筋電位を計測する実験は初めてであった。1回の試行で被験者は、約1sの間隔を空けて各母音につき約200ms、5母音を連続で発声し、同様の試行を30回行った。できるだけ自然な発声を心がけ、表情筋の動かし方や口の開け方を強調した発声方法は行わないこととした。この時の筋電位信号と音声信号を、先に説明した方法で計測した。筋電位信号の計測位置は、また、前述したように、表情筋と声帯周辺の直上計5箇所とした。
式(2)のカーネルパラメータγと式(3)のペナルティパラメータCを、訓練データに対する交差確認法に基づいて、被験者ごとに最適な値を決定した。カーネルパラメータγとペナルティパラメータCの探索範囲は、C={21,22,…,213},γ={2−6,2−5,…,26}とした。各被験者の最適な値を表1に示す。すべての被験者でγの値は0.5となり、Cの値は16−256の範囲に収まっている。実際には、極端な値をとらない限り識別率に与える影響は小さいことが確認された。
12 特徴抽出部
13 訓練データ生成部
14 サポートベクトルマシン学習部
15 音声識別部
Claims (4)
- 口唇周辺の複数箇所の筋電位信号を検出し、前記筋電位信号を基に積分筋電位信号を計算する信号計測部と、
各箇所において、前記信号計測部から検出された筋電位信号のFFTケプストラム係数から低次の5項により5次元の周波数特徴と、前記積分筋電位信号からフレーム内の時間平均により1次元の振幅特徴と、を抽出して特徴ベクトルを抽出する特徴抽出部と、
前記特徴抽出部から抽出された特徴ベクトルに、音声信号の零交叉数に基づき、無発声区間を含めてクラスラベルを付与することより訓練データを生成する訓練データ生成部と、
前記訓練データ生成部により生成された訓練データに基づいてサポートベクトルマシンを構成するサポートベクトルマシン学習部と、
前記サポートベクトルマシン学習部により構成されたサポートベクトルマシンによるデータ処理により前記特徴情報から母音音声を識別する音声識別部と
を備えることを特徴とする音声認識装置。 - 請求項1に記載の音声認識装置において、
前記信号計測部は、話者の表情筋および声帯周辺に貼り付けた表面電極を用いて筋電位信号を計測する
ことを特徴とする音声認識装置。 - 請求項1に記載の音声認識装置において、
前記音声識別部は、
複数フレーム分の識別結果で投票を行い、最も多く識別された母音を識別結果として識別する
ことを特徴とする音声認識装置。 - 信号計測部およびデータ処理装置を備え、前記信号計測部により検出した筋電位信号からデータ処理装置により音声認識処理を行う音声認識処理方法であって、
前記信号計測部により検出された口唇周辺の複数箇所の筋電位信号のFFTケプストラム係数から低次の5項により5次元の周波数特徴を抽出し、前記筋電位信号を基に積分筋電位信号を計算してフレーム内の時間平均により1次元の振幅特徴を抽出してから特徴ベクトルを抽出するステップと、抽出された特徴ベクトルに、音声信号の零交叉数に基づき、無発声区間を含めてクラスラベルを付与することにより訓練データを生成するステップと、
生成された訓練データに基づいてサポートベクトルマシンを構成するステップと、
前記構成されたサポートベクトルマシンによるデータ処理により前記特徴情報から母音音声を識別するステップと
を備えることを特徴とする音声認識処理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007071728A JP5030150B2 (ja) | 2007-03-20 | 2007-03-20 | 筋電位信号による音声認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007071728A JP5030150B2 (ja) | 2007-03-20 | 2007-03-20 | 筋電位信号による音声認識装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008233438A JP2008233438A (ja) | 2008-10-02 |
JP5030150B2 true JP5030150B2 (ja) | 2012-09-19 |
Family
ID=39906304
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007071728A Expired - Fee Related JP5030150B2 (ja) | 2007-03-20 | 2007-03-20 | 筋電位信号による音声認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5030150B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101785500B1 (ko) * | 2016-02-15 | 2017-10-16 | 인하대학교산학협력단 | 근육 조합 최적화를 통한 안면근육 표면근전도 신호기반 단모음인식 방법 |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5924724B2 (ja) * | 2011-05-09 | 2016-05-25 | 国立大学法人岩手大学 | 顎口腔運動状態の推定方法及び顎口腔運動状態の推定装置 |
EP3956883A4 (en) | 2019-04-19 | 2022-12-21 | Magic Leap, Inc. | VOICE RECOGNITION ENGINE INPUT IDENTIFICATION |
CN113729738B (zh) * | 2021-09-13 | 2024-04-12 | 武汉科技大学 | 一种多通道肌电特征图像的构建方法 |
CN116372322B (zh) * | 2023-05-09 | 2023-10-03 | 佛山市三乔焊接实业有限公司 | 一种mig焊机的新型双脉冲控制方法 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0612483A (ja) * | 1992-06-26 | 1994-01-21 | Canon Inc | 音声入力方法及び装置 |
JP4827285B2 (ja) * | 2000-09-04 | 2011-11-30 | 東京エレクトロン株式会社 | パターン認識方法、パターン認識装置及び記録媒体 |
JP2003123025A (ja) * | 2001-10-17 | 2003-04-25 | Toshiba Corp | パターン認識装置とパターン認識方法 |
JP3908965B2 (ja) * | 2002-02-28 | 2007-04-25 | 株式会社エヌ・ティ・ティ・ドコモ | 音声認識装置及び音声認識方法 |
JP3892754B2 (ja) * | 2002-05-20 | 2007-03-14 | 株式会社エヌ・ティ・ティ・ドコモ | 測定装置 |
JP4447857B2 (ja) * | 2003-06-20 | 2010-04-07 | 株式会社エヌ・ティ・ティ・ドコモ | 音声検出装置 |
JP4713111B2 (ja) * | 2003-09-19 | 2011-06-29 | 株式会社エヌ・ティ・ティ・ドコモ | 発話区間検出装置、音声認識処理装置、送信システム、信号レベル制御装置、発話区間検出方法 |
JP2005128242A (ja) * | 2003-10-23 | 2005-05-19 | Ntt Docomo Inc | 音声認識装置 |
JP2005128245A (ja) * | 2003-10-23 | 2005-05-19 | Ntt Docomo Inc | 音声認識装置 |
JP4729902B2 (ja) * | 2003-12-12 | 2011-07-20 | 株式会社豊田中央研究所 | 音声対話システム |
US7890323B2 (en) * | 2004-07-28 | 2011-02-15 | The University Of Tokushima | Digital filtering method, digital filtering equipment, digital filtering program, and recording medium and recorded device which are readable on computer |
JP4150795B2 (ja) * | 2005-01-21 | 2008-09-17 | 国立大学法人徳島大学 | 聴覚補助装置、音声信号処理方法、音声処理プログラム及びコンピュータで読み取り可能な記録媒体並びに記録した機器 |
-
2007
- 2007-03-20 JP JP2007071728A patent/JP5030150B2/ja not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101785500B1 (ko) * | 2016-02-15 | 2017-10-16 | 인하대학교산학협력단 | 근육 조합 최적화를 통한 안면근육 표면근전도 신호기반 단모음인식 방법 |
Also Published As
Publication number | Publication date |
---|---|
JP2008233438A (ja) | 2008-10-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Janke et al. | EMG-to-speech: Direct generation of speech from facial electromyographic signals | |
US7680666B2 (en) | Speech recognition system, speech recognition method, speech synthesis system, speech synthesis method, and program product | |
EP2887351A1 (en) | Computer-implemented method, computer system and computer program product for automatic transformation of myoelectric signals into audible speech | |
Simantiraki et al. | Stress detection from speech using spectral slope measurements | |
US20200178883A1 (en) | Method and system for articulation evaluation by fusing acoustic features and articulatory movement features | |
JP5030150B2 (ja) | 筋電位信号による音声認識装置 | |
CN106233379A (zh) | 声音合成设备和用于合成声音的方法 | |
Hahm et al. | Parkinson's condition estimation using speech acoustic and inversely mapped articulatory data | |
CN103705218B (zh) | 构音障碍识别的方法、系统和装置 | |
US12105876B2 (en) | System and method for using gestures and expressions for controlling speech applications | |
Srisuwan et al. | Comparison of feature evaluation criteria for speech recognition based on electromyography | |
Fu et al. | Svoice: Enabling voice communication in silence via acoustic sensing on commodity devices | |
Eray et al. | An application of speech recognition with support vector machines | |
Ali et al. | Intelligent pathological voice detection | |
Ananthakrishnan et al. | Mapping between acoustic and articulatory gestures | |
CN113160366A (zh) | 一种3d人脸动画合成方法及系统 | |
Amami et al. | A robust voice pathology detection system based on the combined bilstm–cnn architecture | |
Lee et al. | An exploratory study of emotional speech production using functional data analysis techniques | |
Cao et al. | Comparing the performance of individual articulatory flesh points for articulation-to-speech synthesis | |
Rathina et al. | Basic analysis on prosodic features in emotional speech | |
JP2004329750A (ja) | 生体信号を利用した人工発声装置及び方法 | |
Kalgaonkar et al. | Recognizing talking faces from acoustic doppler reflections | |
Narayanan | Speech in Affective Computing 12 | |
Belete | College of Natural Sciences | |
Sivaraman et al. | Analysis of coarticulated speech using estimated articulatory trajectories. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090227 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110913 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111111 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120207 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120404 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120619 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120621 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150706 Year of fee payment: 3 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |