JPH01290000A - 音声認識方式 - Google Patents

音声認識方式

Info

Publication number
JPH01290000A
JPH01290000A JP12161688A JP12161688A JPH01290000A JP H01290000 A JPH01290000 A JP H01290000A JP 12161688 A JP12161688 A JP 12161688A JP 12161688 A JP12161688 A JP 12161688A JP H01290000 A JPH01290000 A JP H01290000A
Authority
JP
Japan
Prior art keywords
accent
registered
syllable
voice
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP12161688A
Other languages
English (en)
Inventor
Mitsuhiro Toya
充宏 斗谷
Hiroyuki Iwahashi
岩橋 弘幸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP12161688A priority Critical patent/JPH01290000A/ja
Publication of JPH01290000A publication Critical patent/JPH01290000A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、入力音声を音節単位で認識し、認識した音節
の組きわせから文節候補を選び出す音声認識装置におい
て実施される音声認識方式に関する。
従来の技術 音声MIl識装置は、入力音声を音節毎にセグメント化
し、音節識別部において予め登録された音節標準パター
ンと入力音声とをパターンマツチングして入力音声を構
成する各音節を認識し、 vi、識された音節の組合せ
から得られる複数の文節候補の中から最適な文節候補を
選ぶことによって文章などを作成する。
このような音声認識装置では、文節候補の出力順を設定
するにあたっては、認識音声に含まれるアクセント情報
が考慮される。アクセント情報を考慮することによって
、文節候補の出力順序を効率よく設定することができる
とともに、たとえば同音の自動選択を行うことができる
場合がある。
たとえば、「雨(あめ)」および「飴(あめ)」の2つ
の語句については、キーボードによる入力処理において
は自動選択は不可能である番すれども、アクセントの相
違を識別することができる音声入力装置においては、こ
れら2つの同音語の自動選択を行うことが可能である。
発明が解決しようとする課題 前述した音節標準パターンを登録する際には、予め定め
られた語句に′)いて発声者の音声が音節単位にセグメ
ント化され、各音節毎の音節標準パターンが作成される
。音節標準パターンを作成する際に発声される語句のア
クセントは予め設けられたアクセント辞書に登録されて
おり、このアクセン1〜辞書からの情報に基づいて音声
認識を行うことがてきる。
しかしながら、予め設けられたアクセント辞書は、いわ
ゆる標準語に関するアクセントの情報が登録されており
、このアクセント情報はたとえば大阪地方出身の人のア
クセントとは相違している。
したがって、大阪地方出身の操作者がこの装置を使用す
る場6には、大阪地方のアクセントを有するアクセント
辞書を備えなければ正確な音声認識を行うことは困難で
ある。また、複数の地方にっいてのアクセ〉ト辞書が予
め設けられていた場ぎても、使用する操イヤ者は自分に
適合したアクセント辞書を選択するなとの操作が必要で
ある。
本発明の目的は、音声認識を行うために必要な音声の登
録作業時において、発声者に適きしたアクセントの種類
を選ひ出すことができ、操作性が向上された音声認識方
式を提供することである。
課題を解決するための手段 本発明は、複数の音節から成る意味のある複数の各語句
のアクセンt・を各語句毎に相互に対応して複数種類予
め登録しておき、 予め定める語句を表示し、発声された音声のアクセ〉′
■・を検出し、 その検出されたアクセントと前記予め定める語句に対応
して予め登録されている複数種類のアクセントとを比較
して、一致するアクセントの種類を選び出し、 前記選び出されたアクセントの種類に対応する各語句毎
の登録されているアクセントの種類を用いて音声認識を
することを特徴とする音声認識力式である。
作  用 本発明に従えば、複数の音節から成る意味のある複数の
各語句のアクセントは、各語句毎に相互に対応して複数
種類予め登録されている。音声認識を行うために必要な
音声登録を行う際には、予め定める語句が表示され、こ
の語句について発声された音声のアクセントが検出され
る。この後に、検出されたアクセントと前記予め定める
語句に対応して予め登録されている複数種類のアクセン
トとが比較され、相互に一致するアクセ〉トの種類が選
び出される。
音声認識を行うにあたっては、前記選び出されたアクセ
ントの種類に対応する各語句毎の登録されているアクセ
ント・の種類が用いられる。これによって発声された音
声のアクセントの種類と予め登録されているアクセント
の種類とが一致し、操作者は予め登録されているアクセ
ンl−の種類のうちから自分に適きしたアクセントの種
類を選択する作業から解放され、操作性が向上される。
実施例 第1図は、本発明の一実施例の電気的構成を示すブロツ
ク図である。発声された音声は、マイクロフォン1て電
気的信号に変換され、増幅器2て増幅された後にアナロ
グ7、′デジタル変換器3でデジタル信号に変換されて
音声分析部4に与えられる。音声分析部4では、入力音
声がl 6 rn s e c程度のフレームに分割さ
れ、スペクトル分析が行われる。分析された結果、たと
えば音節区間の抽出に必要な情報や各フレーム毎の基本
周波数(ピッチ)およびスペクトル分析の特徴パターン
などが、8 m s e C程度の間隔で音節区間抽出
部5に与えられる。
音節区間抽出部5では、音声分析部4がらの情報に基づ
いて入力音声を構成する各音節が切り出され、切り出さ
れた音節の特徴パターンと、音節区間の中から母音定常
部のフレームのピッチ情報とが中央制御部6を介してパ
ターン記憶部7の特徴パターン領域8に記憶される。パ
ターン記憶部7は、前述したように入力音声を構成する
各音節の特徴パターンが複数個記憶される特徴パターン
領域8と、音声認識を行うために必要な音節標準パター
ンが複数個記憶された標準パターン領域9とから構成さ
れる。
単音節認識部10ては、前記特徴パターン領域8に記憶
された特徴パターンと標準パターン領域9に記憶された
音節標準パターンとのいわゆるパターンマンチ〉゛り(
比較照な)が行われ、この認識結果が中央制御部6に与
えられる。
中央制御部6には、後述される登録用語句のアクセント
辞書11と後述される認識用のアクセンl−辞書12と
から成るアクセント辞書13と、複数の音節に対する認
識結果が記憶される認識結果記憶部14と、キーボード
15と、後述するような登録単語の表示などを行う表示
装置16と、前記認識結果などを外部装置に転送する際
の制御が行われるインタフェイス部17と、発声者の音
節標準パターンやアクセント情報などが記憶される記憶
部18とがそれぞれ並列に接続される。
次に、発声された音声のアクセント判定の手順について
説明する。日本語では、アクセントの表現が主に音程(
基本周波数(ピッチ)の変化)を主体としている。
先ず最初に、表示部16の表示画面に登、録すべき語句
、たとえは「頭(あたま)」が提示される(第2図参照
)。次に発声者によって発声された音声が分析されて、
音節単位に分割され、各音節毎にその音節区間を代表す
る基本周波数が算出される。たとえば語句「あたま」を
構成する各音節「あ」、「た」、および「ま」において
、たとえば第3図(1)に示されるような基本周波数が
得られる。
各基本周波数は、これ以降の信号処理の便宜のためにそ
の数値の変換が行われる。たとえば、各音節の特徴を表
す値として、ある定数(x< = 12000)を前記
各基本周波数で割った値が用いられる。このように変換
された各音節の特徴を示す変換値Pは、たとえば第3図
〈2)に示される。
前記変換値Pには、次のような補正が行われる。
一般に、複数音節から成る単語をいわば自然発声した場
合には、後ろの音節はどその基本周波数が小さくなる傾
向があり、これを補正するために次の第1式で示される
補正式が用いられる。
PL=P−3ンlN−1)           ・・
・  (1)こうして補正された値PL(以下、特徴値
P1と称する)は、第3図(3)に示されるよでに算出
される。
次に各音節毎の特徴値P1を相互に比較してその音程の
高低が判定される。この判定を行うにあたっては、次の
第1表が参照される。
第  1  表 すなわち、発声された語句を構成する音節のうち、特徴
値P1が最も小さいものく基本周波数が最も大きいもの
)を選び出し、この最小値P1.。
を基準にして他の音節の音程の高低が判定される。
「低い」と判定された音節は、「1」がセットされる。
「高い」と判定された音節は、「2」がセンt〜され、
それ以外の場きは「不定」と判定され、「3」がセット
される。このような判定方法によって、第3図(3)に
示される特徴値を比較すると、第3図(4)に示される
ような判定結果(アクセントパターン)が得られる。
こうして意味のある複数の音節からなる語句のアクセ〉
・ドパターンが決定される。前記登録用アクセン1〜辞
書11には、予め定める語句について設定された複数種
類のアクセントパターンが登録されている。たとえば第
4図に示されるように、「あなま(頭)Jという1つの
単語に関して、標準語のアクセントパターン、大阪地方
のアクセントパターン、および任意の地方のアクセント
パターンの3種類のアクセントパターンが登録されてい
る。また、同一地方のアクセ〉′l・パターンに関して
も、さらに詳細に第1種類のアクセント1および第2種
類のアクセント2が示され登録されている場きもある。
このようなアクセントパターンが登録された登錘用アク
セント辞書11を用いるのは、発声された音声によって
複数の音節のうちから最適なものを選び出す際にアクセ
ン1〜パターンを考慮することによって、文節候補の選
択を効率よく行うことができるからである。また、同音
語についても、アクセントパターンを考慮することによ
って容易に識別することが可能となり、音声認識を確実
に行うことができるからである。
第5[2Iは、動作を説明するためのフローチャートで
ある。
ステップn lでは登録すべき単語が表示され、これを
目視した発声者が登録単語を発声する。発声された音声
はステップrI2で特徴抽出され、ステップn 3でそ
のアクセントパターンが検出される。
ステップr14ては、検出されたアクセン)−パターン
と、登録用アクセンl−辞書11内の該当単語のアクセ
ントパターンとが各音節毎に比較照会される。このとき
音節の音程が「不定」であることを示す「3」に対応し
た音節に関しては、登録用アクセ〉・ト辞書の内容にか
かわらず一致したものとみなす。このようにして比較照
6を行った後に、ステップn 5で該当単語の全音節が
一致した地方についてカウント数をインクリメント・す
る。たとえば大阪地方の第1種類のアクセン)−1と一
致し、その他の地方とは一致しなか−)た場合には、大
阪地方に−)いてのカウント数がインクリメントされる
(第2表参照)。
第  2  表 ステップr+ 6では、登録用アクセント辞書11内の
全ての単語について比較照会が行われたがどうかが判断
され、そうでないときにはステップr11に戻り、こう
してステップr11〜r+ 6を繰返し、登録用アクセ
ント辞書11内の全ての単語についての比較照6が終了
するとステップr+ 7に移る。
なお、各地方に−)いてのカラン■・数は、登録作業開
始以前に全て「0」に設定しである。このような処理は
、登録すべき単語の数だけ行われ、こうしてステップの
7で全ての登録単語に関する比較照会結果に基づいて発
声者のアクセントの判定が行われ、動作を終了する。
アクセントの判定方法としては、たとえば各地方に一致
した単語数を登録単語数て除算することによって、i地
方の適合度数Piを算出し、この1M会度数Piを用い
ることによ−)て実現される。
すなわち、適き度数Piが最も大きく、かつ08以上の
地方を発声者の属するアクセントの種類であると判定す
る。音声認識を行う際には、判定されたアクセントの種
類の辞書を参照して行われる。なお、適な度数Piが0
.8以上の地方が存在しない場きには、その発声者のア
クセントの種類の限定をするのは困難であるとみなし、
アクセント辞書を参照せずに音声認識を行うようにする
このような判定基準によって発声者のアクセントに関す
る情報、たとえば第6図に示されるような表示をするこ
とも可能である。これによって発声音は、自分の属する
アクセントの種即を認識することもできる。
このようにして複数種類のアクセント・辞書のうちから
、発声者の属するアクセント辞書を音声登録の作業中に
自動的に選択することができ、発声者が自分の属するア
クセント辞書を選択する作業を省略することがてきる。
また、記憶部18には発声者の音節標準パターンやアク
セント情報が記憶されるので、−度、音声登録すれば、
これ以降の装置の使用に際しては、登録された音節標準
パターンを読み出すと同時にアクセント情報も読み出す
ことができ、これによって前述したように発声者に適合
したアクセント辞書を自動的に選択することができ、ぞ
の操作性が向上される。
なお、本実施例では、登録用アクセント辞書11に複数
地方のアクセントパターンか登録されているけれども、
たとえば標準語のアクセント情報のみが登録されたアク
セント辞書を用い、前述したような判定基準によ−)て
発声者が標準語に適合するか否かを判定するようにして
もよい。
発明の効果 以上の本発明に従えば、音声認識を行うのに必要な音声
登録を行う際において、発声者にM 自したアクセ〉ト
の種類を自動的に選択することができ、その操作性を向
上することができる。
【図面の簡単な説明】
第1図は本発明の一実施例の電気的構成を示すブロック
図、第2図は登録単語の一表示例を示す図、第3図はア
クセントバター〉・の検出を説明するための図、第4図
は登録用アクセント辞書11の登録内容の一例を示す図
、第5図は動f?を説明するためのフローチャー■・、
第6図は一表示例を示ず図である。 4−・・音声分析部、5・・・音節区間抽出部、6・・
・中央制御部、7−・パターン記憶部、8・・・特徴バ
ター〉・領域、≦)・・・標準パターン領域、10・・
単音節認識部、11・・・登録用アクセ〉゛[・辞書、
12・・・認識用アクセント辞書、13・・・アクセン
ト辞書、14・・・認識結果記憶部、15・・キーボー
ド、16・−・表示装置 ?

Claims (1)

  1. 【特許請求の範囲】 複数の音節から成る意味のある複数の各語句のアクセン
    トを各語句毎に相互に対応して複数種類予め登録してお
    き、 予め定める語句を表示し、発声された音声のアクセント
    を検出し、 その検出されたアクセントと前記予め定める語句に対応
    して予め登録されている複数種類のアクセントとを比較
    して、一致するアクセントの種類を選び出し、 前記選び出されたアクセントの種類に対応する各語句毎
    の登録されているアクセントの種類を用いて音声認識を
    することを特徴とする音声認識方式。
JP12161688A 1988-05-17 1988-05-17 音声認識方式 Pending JPH01290000A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP12161688A JPH01290000A (ja) 1988-05-17 1988-05-17 音声認識方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP12161688A JPH01290000A (ja) 1988-05-17 1988-05-17 音声認識方式

Publications (1)

Publication Number Publication Date
JPH01290000A true JPH01290000A (ja) 1989-11-21

Family

ID=14815663

Family Applications (1)

Application Number Title Priority Date Filing Date
JP12161688A Pending JPH01290000A (ja) 1988-05-17 1988-05-17 音声認識方式

Country Status (1)

Country Link
JP (1) JPH01290000A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100406307B1 (ko) * 2001-08-09 2003-11-19 삼성전자주식회사 음성등록방법 및 음성등록시스템과 이에 기초한음성인식방법 및 음성인식시스템
JP2010032861A (ja) * 2008-07-30 2010-02-12 Morita Mfg Co Ltd 医療用実習装置

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58189694A (ja) * 1982-04-30 1983-11-05 株式会社日立製作所 音声認識装置
JPS58224397A (ja) * 1982-06-23 1983-12-26 富士通株式会社 大語彙単語音声認識用辞書作成装置
JPS5916400A (ja) * 1981-12-02 1984-01-27 フレ−クト・アクチエボラ−グ ラツク中の電気通信機器の冷却装置
JPS5915993A (ja) * 1982-07-19 1984-01-27 株式会社東芝 音声認識装置
JPS6057898A (ja) * 1983-09-09 1985-04-03 電子計算機基本技術研究組合 音声登録方式
JPS6073595A (ja) * 1983-09-29 1985-04-25 富士通株式会社 音声入力装置
JPS6143797A (ja) * 1984-08-08 1986-03-03 富士通株式会社 音声編集出力方式
JPS6288000A (ja) * 1985-10-14 1987-04-22 日本電気株式会社 ピッチパタン生成装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5916400A (ja) * 1981-12-02 1984-01-27 フレ−クト・アクチエボラ−グ ラツク中の電気通信機器の冷却装置
JPS58189694A (ja) * 1982-04-30 1983-11-05 株式会社日立製作所 音声認識装置
JPS58224397A (ja) * 1982-06-23 1983-12-26 富士通株式会社 大語彙単語音声認識用辞書作成装置
JPS5915993A (ja) * 1982-07-19 1984-01-27 株式会社東芝 音声認識装置
JPS6057898A (ja) * 1983-09-09 1985-04-03 電子計算機基本技術研究組合 音声登録方式
JPS6073595A (ja) * 1983-09-29 1985-04-25 富士通株式会社 音声入力装置
JPS6143797A (ja) * 1984-08-08 1986-03-03 富士通株式会社 音声編集出力方式
JPS6288000A (ja) * 1985-10-14 1987-04-22 日本電気株式会社 ピッチパタン生成装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100406307B1 (ko) * 2001-08-09 2003-11-19 삼성전자주식회사 음성등록방법 및 음성등록시스템과 이에 기초한음성인식방법 및 음성인식시스템
JP2010032861A (ja) * 2008-07-30 2010-02-12 Morita Mfg Co Ltd 医療用実習装置

Similar Documents

Publication Publication Date Title
US6839667B2 (en) Method of speech recognition by presenting N-best word candidates
US4769845A (en) Method of recognizing speech using a lip image
JP4867804B2 (ja) 音声認識装置及び会議システム
CN109545184B (zh) 一种基于语音校准的背诵检测方法及电子设备
JP5824829B2 (ja) 音声認識装置、音声認識方法及び音声認識プログラム
US6963834B2 (en) Method of speech recognition using empirically determined word candidates
US8219386B2 (en) Arabic poetry meter identification system and method
JP2955297B2 (ja) 音声認識システム
EP1298645A1 (en) Method for detecting emotions in speech, involving linguistic correlation information
CN115240655A (zh) 一种基于深度学习的中文语音识别系统及方法
JPH06110494A (ja) 発音学習装置
JPH10274996A (ja) 音声認識装置
JPH01290000A (ja) 音声認識方式
JP2010044239A (ja) 音声認識装置およびプログラム
JPS61179499A (ja) テンプレ−ト連鎖モデルを使用するキ−ワ−ド認識方法およびシステム
JPH0338699A (ja) 音声認識装置
JPS645320B2 (ja)
JP2664785B2 (ja) 音声認識装置
JP2007133227A (ja) ニューラルネット学習装置および感情判断装置
JPH03217900A (ja) テキスト音声合成装置
JPH03223799A (ja) 分離しているワード、特に非常に大きい語いの認識方法と装置
JPH0887292A (ja) 単語音声認識装置
JP2005017620A (ja) 言語特定方法、言語特定用プログラム及び言語特定方法を用いた機械翻訳システム
JPH0619497A (ja) 音声認識方法
JPH0816186A (ja) 音声認識装置