JPS5972496A - 単音識別装置 - Google Patents

単音識別装置

Info

Publication number
JPS5972496A
JPS5972496A JP57183411A JP18341182A JPS5972496A JP S5972496 A JPS5972496 A JP S5972496A JP 57183411 A JP57183411 A JP 57183411A JP 18341182 A JP18341182 A JP 18341182A JP S5972496 A JPS5972496 A JP S5972496A
Authority
JP
Japan
Prior art keywords
consonant
acoustic parameter
segment
identification device
major
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP57183411A
Other languages
English (en)
Inventor
博 松浦
恒雄 新田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP57183411A priority Critical patent/JPS5972496A/ja
Priority to US06/541,029 priority patent/US4625287A/en
Priority to DE8383306229T priority patent/DE3372420D1/de
Priority to EP83306229A priority patent/EP0109190B1/en
Publication of JPS5972496A publication Critical patent/JPS5972496A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • G10L2015/027Syllables being the recognition units

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の技術分野〕 本発明は入力音声を高精度に単音識別することのできる
実用性の高い単音識別装置に関する。
〔発明の技術的背景とその問題点〕
情報を音声入力して計算機処理に用いる場合、上記音声
を高精度に認識することが必要である。
そこで入力音声の音響ノ9ラメータ系列を求め、これ全
音節単位にセグメント化して単音認識することが試みら
れている。然し、このようにして単音を認識する場合、
日本語に限っても・一般に101種類もあることから、
これ全同一手段によって認識することが非常に困難であ
る。つまシ、その計算量が膨大である上、認識率の向上
もさほど期待できないことから、その実現は殆んど不可
能である。そこで従来では、先ず母音の識別全行ったの
ち、子音についての細分類処理を行うことが種々研究さ
れている。しかし、このような従来方式にあっては、上
記母音の識別を通常10〜40 m5ecからなる1フ
レ一ム全単位として標準パターンとの類似度計算値を求
めて行っている為、高精度の認識結果が得られないと云
う問題があった。
〔発明の目的〕
本発明はこのような事情を考慮してなされたもので、そ
の目的とするところは、入力音声の単音を個々に高精度
に認識することのできる実用性の高い単音認識装置を提
供することにある。
〔発明の概賛〕
不発8AFi入力音Pを音節単位にセグメント化してな
る音響パラメータ系列の主として母音的特徴を有する部
分を、母音、拗音、撥音等のカテゴリに対して 1cvl 、 1cyvl l IcVNI 、 IC
YVNI 、 IN+に大分類し、またその細分類結果
とを用いて前記入力音7”r音節単位に単音認識するよ
うにしたものである。
〔発明の効果〕
かくして本発明によれば、入力音声がその音節単位毎に 1cvl 、 1cyvl 、 IcVNI 、 Ic
YVNI 、 IN+からなる母音的特徴を有する単音
声要素に大分類され、これが単音認識の要素として用い
られるので高精度な単音認識が可能となる。しかも、こ
の大分類を母音的特徴を有する区間についてだけパター
ンマツチング法によって類似度目算すれは、その大分類
結果は非常に精度の高いものとなり、従って単音認識に
極めて有効に作用する。これ故、実用上絶大なる利点効
果が奏せられる。
〔発明の実施例〕
以下、図面を参照して本発明の一実施例にっき説明する
第1図は実施例装置の概略構成図である。マイクロホン
等を介して入力される音声48号は音声入力部1を介し
て電気信号変換され、特徴抽出部2に導びかれる。この
特徴抽出部2は、例えは16チヤンネルのバンドパスフ
ィルタ群カらなシ、音声の特徴を効果的に表現する音響
パラメータを求めるものである。尚、この音響パラメー
タは、上記バンドパスフィルタ群の出力に限られるもの
ではなく、ケグヌトラム係数や相関分析によって得られ
る種々の・ヤラメータのうちの一部、または複数の組合
せとして与えられるものであっても良い。しかしここで
は、特徴抽出部2は、上記音響パラメータのデータと共
に、全帯域におけるパワー、低域、高域、中高域、中低
域における各々のパワーを求め、これも音響パラメータ
とするものとする。しかしてこのようにして求められた
音響i9ラメータはセグメント化処理部3にて単音節毎
にセグメント化でれる。これによって、単音節の特徴パ
ラメータが抽出されることになる。この単音節の特徴パ
ラメータは、例えば周波数軸方向に16チヤンネル分割
したバンドパスフィルタ群出力全セグメント化し、この
セグメント化芒れた音節を時間軸方向に等間隔に16虞
リサンプルした256次元の音声パターンとして力えら
れる。
この音声パターンについて次のように大分類処理が行わ
れる。即ち大分類処理部4け、辞1・やターン5に予め
登録された標準パターンと前記音声・やターンとを例え
ば複合類49度法や・ぞワー平均値と共分散とを考慮し
た二次識別関数等を用いて照合し、その母音的特徴から
大分類処理を行っている。この大分類カテゴリは、v’
<m音素片、Cを子音素片、y k拗音素片、Nを撥音
累月として IcVI  (V=a 、 i 、u 、e 、o )
lcyvl (V=a、u 、o) IcVNI (V==a、i、u、e、o)IcYVN
I (V=a、u、o ) IN+ として与えられる。尚、上記子音素片Cは日本語の場合
、一般にに、s、t、n、h、m、r、w等として与え
られる。しかして、大分類処理部4では、上記カテゴリ
の子音素片Cを除く母音的特徴を有する部分の音声パタ
ーンを用いて大分類処理を実行する。つ1シ Ivl  (v=a、i、u、e、o)lyvl  (
v==ljl 、 u 、 o :)IVNI  (V
==a、i、u、e、o)IYVNI (V=a 、 
u 、 o )IN+ からなる計17のカテゴリに大分類処理を行う。
但し、母■素片Vと長音累月Nとは必ず切離されて音声
入力されると云う条件が存在するならば lvl  (V=a、1.u、e、o)lyvl  (
v=ll 、 u 、 o )IN+ からなる肘9のカテゴリに大分類処理してもよいことは
云うまでもない。次表はこのように大分類されるカテゴ
リと、各単音の分類カテゴリとを対比して示したもので
ある。
このようにして9カテゴリに大分類がなされると、その
大分類結果と前記セグメント化された音声パターンデー
タが単音分類部6に送られる。この単音分類部6では、
大分類結果として水式れるカテコゞり内において、その
子音特性に注目し、母音へのわたシの途中までを含む子
音素片を時間軸上でリサンプルしてその単音認識を行う
。単音辞書7にはこのような子音特性の標準パターンが
上記各カテゴリ毎に分類して登録されている。従って、
各カテゴリ毎に見れば単音を認識するのに最大14カテ
ゴリについて子音特性のマツチング処理すれば、大分類
カテコIJ内において単音の認識が可能となる。
尚、第2図に示すように前記大分類処理と並行して子音
特性を用いた単音認識処理を行い、この単音認識結果と
大分類結果とを判定部8に導いて、これら全総合的に判
定して最終的な単音認識結果を得るようにしてもよい。
ところで、上述した音節の大分類処理はその子音部分を
除いた母音性特徴の表われた音声パターンのパターンマ
ツチングによって行われ、これによって筒い認識率が得
られるようになっている。即ち、子音部と判定される音
声区間全除去して、大分類処理が行われる。またこのと
き、例えは拗音節の場合、母音部が長くなるとその識別
率の低下を招くことから、母音や撥音部分の長さを制限
して上述した大分類処理が行われる。当然、辞書パター
ン5として登録場れる標準パターンもこのようにして予
め求めておくことは云うまでもない。
即ち今、第3図に示す音声パターン(全パワーの時間的
変化)金側にとると、B2.U、V等のラベルを付して
示されるように、声帯振動が直接税われている区間B2
、無声音区間U1有声音区間Vに分類される。このラベ
ル付けは、例えはセグメント化処理部3よシ与えられる
音声パターンに対して音響パラメータ全判定する等して
大分類処理部4にて行われる。しかして、上記ラベル情
報から、例えば母音性の区間kT8からTP、に示すよ
うに一定長(20フレ一ム分)切出し、これを大分類処
理の対象とツーる。しかして、辞1−4′ターン5に登
録された標準・やターンはカテゴリtについて、(φ<
1> )として力えられ、mの値によって規定される各
辞書パターンが相互に直焚する関係となっている。大分
類処理部4では入力廿声パターンのベクトルfと種類m
の辞書・リーン(、+(4)の各面におけるベクトル成
分との間で、例えば なる複合類似度引算を行い、その計算結果を相互比較し
て大分類結果を得ている。この複合類似度計算法による
マツチング処理のアルゴリズムについては、従来よシ知
られた種々のアルゴリズムを適宜用いれはよい。このよ
うにして大分類処理を行い、その結果全利用して単音認
識する本装置によれば、従来装置に比してその言]算量
全犬幅に削減することができる。それにも増して認識精
度の飛躍的な向上を図カ得、高精度な単音識別が可能と
なる等の実用上絶大なる効果が奏せられる0 尚、本発明は上述した実施例に限定嘔れるものではなく
、その要旨全逸脱しない乾田コでfIk々変形して実施
することができる。
【図面の簡単な説明】
第1図は本発明の一実施例装置の概略構成図1、第2図
は本発明の他の実施例装置の概略構成図1、第3図は入
力音声ノリ一ンとそのラベルを示す図である。 1・・・音声入力部、2・・・特徴抽出部、3・・・セ
フ。 メント化処理部、4・・・大分類処理部、5・・・辞柑
−/’Pターン、6・・・単音分類部、7・・・即音辞
書、8・・・判定部。

Claims (3)

    【特許請求の範囲】
  1. (1)入力音声を電気信号に変換してその音響パラメー
    タ系列を得る手段と、この音響パラメータ系列を音節単
    位にセグメント化する手段と、このセグメント化された
    音節単位毎に上記音響・ぞラメータ系列を標準パターン
    と照合して、■を母音素片、Cを子音素片、Yを拗音素
    片、Nを撥音素片とする IcVI(V=a、i *11.e 、Q)、 1cY
    Vl(V=a、u、o)IcVNI(V=a、i 、u
    、e、o)、 IcYVNI(V=a、u、o)IN+ からなる単音節要素の少なくとも2群以上に大分類する
    手段と、この大分類結果全利用しであるいはこの大分類
    処理と並行して前記特徴パラメータ系列全細分類処理す
    る手段と、これらの大分類および細分類結果に従って前
    記音節単位の単音情報を得る手段とを具備したこと全特
    徴とする単音識別装置。
  2. (2)音響パラメータ系列と標準パターンとの照合は類
    似度計算により行われるものである特許請求の範囲第1
    項記載の単音識別装置。
  3. (3)音響パラメータ系列のセグメント化あるいは大分
    類処理は、■およびNの存在区間を制限して行われるも
    のである特許請求の範囲第1項記載の単音識別装置。
JP57183411A 1982-10-19 1982-10-19 単音識別装置 Pending JPS5972496A (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP57183411A JPS5972496A (ja) 1982-10-19 1982-10-19 単音識別装置
US06/541,029 US4625287A (en) 1982-10-19 1983-10-12 Monosyllable recognition apparatus
DE8383306229T DE3372420D1 (en) 1982-10-19 1983-10-14 Monosyllable recognition apparatus
EP83306229A EP0109190B1 (en) 1982-10-19 1983-10-14 Monosyllable recognition apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57183411A JPS5972496A (ja) 1982-10-19 1982-10-19 単音識別装置

Publications (1)

Publication Number Publication Date
JPS5972496A true JPS5972496A (ja) 1984-04-24

Family

ID=16135306

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57183411A Pending JPS5972496A (ja) 1982-10-19 1982-10-19 単音識別装置

Country Status (4)

Country Link
US (1) US4625287A (ja)
EP (1) EP0109190B1 (ja)
JP (1) JPS5972496A (ja)
DE (1) DE3372420D1 (ja)

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5131043A (en) * 1983-09-05 1992-07-14 Matsushita Electric Industrial Co., Ltd. Method of and apparatus for speech recognition wherein decisions are made based on phonemes
US4991216A (en) * 1983-09-22 1991-02-05 Matsushita Electric Industrial Co., Ltd. Method for speech recognition
JPS60122475A (ja) * 1983-11-15 1985-06-29 Nec Corp パタン認識装置
JPS60181798A (ja) * 1984-02-28 1985-09-17 電子計算機基本技術研究組合 音声認識装置
US4908865A (en) * 1984-12-27 1990-03-13 Texas Instruments Incorporated Speaker independent speech recognition method and system
NL8500377A (nl) * 1985-02-12 1986-09-01 Philips Nv Werkwijze en inrichting voor het segmenteren van spraak.
US4827519A (en) * 1985-09-19 1989-05-02 Ricoh Company, Ltd. Voice recognition system using voice power patterns
JPS6273391A (ja) * 1985-09-27 1987-04-04 Toshiba Corp パタ−ン認識学習装置
JPS62235998A (ja) * 1986-04-05 1987-10-16 シャープ株式会社 音節識別方式
US5129000A (en) * 1986-04-05 1992-07-07 Sharp Kabushiki Kaisha Voice recognition method by analyzing syllables
US4856067A (en) * 1986-08-21 1989-08-08 Oki Electric Industry Co., Ltd. Speech recognition system wherein the consonantal characteristics of input utterances are extracted
JPH0760318B2 (ja) * 1986-09-29 1995-06-28 株式会社東芝 連続音声認識方式
US4998280A (en) * 1986-12-12 1991-03-05 Hitachi, Ltd. Speech recognition apparatus capable of discriminating between similar acoustic features of speech
US4896358A (en) * 1987-03-17 1990-01-23 Itt Corporation Method and apparatus of rejecting false hypotheses in automatic speech recognizer systems
EP0311022B1 (en) * 1987-10-06 1994-03-30 Kabushiki Kaisha Toshiba Speech recognition apparatus and method thereof
JPH01167898A (ja) * 1987-12-04 1989-07-03 Internatl Business Mach Corp <Ibm> 音声認識装置
JP2739945B2 (ja) * 1987-12-24 1998-04-15 株式会社東芝 音声認識方法
JP2745535B2 (ja) * 1988-05-24 1998-04-28 日本電気株式会社 音声認識装置
JPH0225898A (ja) * 1988-07-15 1990-01-29 Toshiba Corp 音声認識装置
JPH02150899A (ja) * 1988-12-02 1990-06-11 Toshiba Corp 音声認識方式
JPH02195400A (ja) * 1989-01-24 1990-08-01 Canon Inc 音声認識装置
US5794194A (en) * 1989-11-28 1998-08-11 Kabushiki Kaisha Toshiba Word spotting in a variable noise level environment
US5369727A (en) * 1991-05-16 1994-11-29 Matsushita Electric Industrial Co., Ltd. Method of speech recognition with correlation of similarities
US5305420A (en) * 1991-09-25 1994-04-19 Nippon Hoso Kyokai Method and apparatus for hearing assistance with speech speed control function
DE10139744A1 (de) * 2001-08-13 2003-01-16 Siemens Ag Verfahren zur Sprachsteuerung und dadurch gesteuerte Vorrichtung
KR101063607B1 (ko) * 2005-10-14 2011-09-07 주식회사 현대오토넷 음성인식을 이용한 명칭 검색 기능을 가지는 네비게이션시스템 및 그 방법
US9286888B1 (en) * 2014-11-13 2016-03-15 Hyundai Motor Company Speech recognition system and speech recognition method
CN108399084B (zh) * 2017-02-08 2021-02-12 中科创达软件股份有限公司 一种应用程序的运行方法及系统
CN112908309A (zh) * 2021-02-06 2021-06-04 漳州立达信光电子科技有限公司 语音识别方法、装置、设备及按摩沙发

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58130396A (ja) * 1982-01-29 1983-08-03 株式会社東芝 音声認識装置

Also Published As

Publication number Publication date
DE3372420D1 (en) 1987-08-13
EP0109190B1 (en) 1987-07-08
EP0109190A1 (en) 1984-05-23
US4625287A (en) 1986-11-25

Similar Documents

Publication Publication Date Title
JPS5972496A (ja) 単音識別装置
EP0128755B1 (en) Apparatus for speech recognition
JPS59121100A (ja) 連続音声認識装置
JPS58108590A (ja) 音声認識装置
Bhattachajee et al. An experimental analysis of speech features for tone speech recognition
JPH03120434A (ja) 音声認識装置
JPH0554678B2 (ja)
JPS60115996A (ja) 音声認識装置
JPS6293000A (ja) 音声認識方法
JPS59219799A (ja) 音声認識装置
JPH01158499A (ja) 定常雑音除去方式
JPS6136798A (ja) 音声セグメンテ−シヨン法
JPS6068396A (ja) 音素分類方法
JPS58195895A (ja) 単語音声認識装置
JPS6286398A (ja) 単語音声認識装置
JPS6136797A (ja) 音声セグメンテ−シヨン法
JPS63148299A (ja) 単語音声認識方法および装置
JPS6069695A (ja) 語頭子音のセグメンテ−ション法
JPS6242200A (ja) 音声認識装置
JPH0114600B2 (ja)
JPH0120440B2 (ja)
JPS5885495A (ja) 音声認識装置
JPS62160499A (ja) 音声認識装置
JPH0458638B2 (ja)
JPS6069694A (ja) 語頭子音のセグメンテ−ション法