JPS6045298A - 単語音声認識装置 - Google Patents

単語音声認識装置

Info

Publication number
JPS6045298A
JPS6045298A JP58152814A JP15281483A JPS6045298A JP S6045298 A JPS6045298 A JP S6045298A JP 58152814 A JP58152814 A JP 58152814A JP 15281483 A JP15281483 A JP 15281483A JP S6045298 A JPS6045298 A JP S6045298A
Authority
JP
Japan
Prior art keywords
word
recognition
speaker
unit
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP58152814A
Other languages
English (en)
Inventor
晋太 木村
裕二 木島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP58152814A priority Critical patent/JPS6045298A/ja
Publication of JPS6045298A publication Critical patent/JPS6045298A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (a)発明の技術分野 本発明は登録式単語音声認識装置と非登録式単語音声認
識装置とに共用することのできる単語音声認識装置に関
する。
(b)従来技術と問題点 音声認識装置は単音節認識装置・単語認識装置および文
章認識装置に大別され、うち単語音声認識装置は1話者
を限定するか否かによって特定話者認識方式と不特定話
者認識力一式とに分類され。
また9話者が発声した単語音声の特徴を予め登録するか
否かによって登録式と非登録式とに分類されるが、これ
まで、登録式特定話者認識方式および非登式型不特定話
者認識方式が実用に供されており、このため、前者は単
に登録式あるいは特定話者方式、また後者は単に非登録
式あるいは不特定話者方式と称されていた。
しかし、登録式単語音声認識装置は認識対象とする単語
音声の特徴をすべて予め登録して置く必要があるので2
語数が多い場合には利用者の負担が大きいという欠点、
また、非登録式単語音声認識装置は多数の単語を認識す
ることが困難であり認識対象語数が少ないという欠点が
あった。
(C)発明の目的 本発明の目的は、特定話者方式と不特定話者方式とに共
用し得ると共に特定話者方式において使用する単語辞書
の登録に要せられる話者の負担を軽減できる単語音声認
識装置を提供することにある。
(d)発明の構成 本発明になる単語音声認識装置は、特定の登録話者また
は不特定の非登録話者が発声する単語音声の特徴を抽出
する特徴抽出部と、単語音声の前記登録話者毎の特徴を
記憶する第一の単語辞書と。
所定の単語音声の前記非登録話者に共通する特徴を予め
記憶する第二の単語辞書と、前記特徴抽出部によって得
られる単語音声の特徴を前記第一の単語辞書の記憶内容
と照合することによってその単語音声に対する認識結果
を得る第一の認識部と。
前記特徴抽出部によって得られる単語音声の特徴を前記
第二の単語辞書の記憶内容と照合することによってその
単語音声に対する認識結果を得る第二の認識部と、前記
第一の認識部によって得られる認識結果と前記第二の認
識部によって得られる認識結果とのいずれかを選択する
選択部と、前記第二の認識部によって得られ前記選択部
によって選択された認識結果が正しい場合にはその単語
音声の特徴を前記第一の単語辞書に登録する登録部とを
備えるものである。
(e)発明の実施例 以下1本発明の要旨を実施例によって具体的に説明する
第1図は本発明−実施例の構成を示すブロック図であり
2図において、1は特定の登録話者または不特定の非登
録話者が発声する単語音声の特徴を抽出する特徴抽出部
、2は単語音声の前記登録話者毎の特徴を記憶する第一
の単語辞書、3は第2図に示すような木構造をなす所定
の単語に対する各単語音声の前記非登録話者に共通する
特徴を予め記憶する第二の単語辞書、4は特徴抽出部1
によって得られる単語音声の特徴を第一の単語辞刊−2
の記憶内容と照合することによってその単語音声に対す
る認識結果を得る第一の認識部、5は特徴抽出部1によ
って得られる単語音声の特徴を第二の単語辞書3の記憶
内容と照合することによってその単語音声に対する認識
結果を得る第二の認識部、6は第一の認識部4によって
得られる認識結果と第二の認識部5によって得られる認
識結果とのいずれかを選択する選択部、7は第二の認識
部5によって得られ選択部6によって選択された認識結
果が正しい場合にはその単語音声の特徴を第一の単語辞
書2に登録する登録部、8は話者が特定話者であるか否
か不特定話者の場合には特定話者として登録するか否か
を指定する指定部。
9は選択部6が選択した認識結果および後記指示部11
による指示内容を表示する表示部、10は表示部9に表
示された認識結果の正否を決定する決定部、11は話者
が特定話者であ゛るか否かに応し話者に発声をめる誘電
等を表示部9を介し指示する指示部である。
第2回はスーパーマーケットにおける販売品目の例を木
構造によって階層的に配ダルたものであり、たとえば、
各階層の倍電数がいずれも10であるとすれば、全部で
1000種類の販売品目を3種類の倍電で指定すること
ができる。
第二の認識部5は非登録式すなわち不特定話者方式によ
る認識をおこなうので、第2図に例示したようなスーパ
ーマーケ・ノドの販売品目を直接その単語音声のみによ
って認識することは非常に困難であるが、このように木
構造によって階層的に配)すし3種類程度の階層の語党
を順序に発声することによって容易に認識できるように
なる。
この単語音声認識装置は、最初は第二の単語辞書3と第
二の認識部5とを用い不特定話者方式として利用し、そ
の間に特定話者用の第一の単語辞書2を生成し、第一の
辞書2が充実したのちに特定話者方式と不特定話者方式
とに共用するものである。
すなわち話者は、まず最初に特定話者として登録するか
否かを決定し、特定話者として登録を希望する場合には
1話者のコード名を指定部8から指定することによって
第一の単語辞書2に新しく個人辞書領域を設定する。ま
た、特定話者としての登録を希望しない場合には、その
旨を指定する。
指示部11は、第二の単語辞書3に記憶する単語の階層
に対応する誘雷を順序に指示し°て表示部9に表示し2
話者に対し最初に売場名を発声させ。
これが認識できたら続いてコーナ名を発声させ。
これが認識できてから最後に品目名を発声させる。
話者が発声した単語音声は第二の認識部5によって認識
され9話者は表示部9に表示された認識結果の正否を決
定し、認識結果が正しくない場合には再度発声し認識を
繰り返し、特定話者として登録を希望する話者の場合に
は、正しい認識結果が得られる都度その単語音声から得
られた特徴を第一の辞書2に設定した個人辞書領域に記
憶する。
このようにして、第一の単語辞書2が充実したのちは、
特定話者が発声した単語音声の特徴は第一の認識部4と
第二の認識部5とによって認識され、第一の認識部4に
よって得られた認識結果の距離値データをX、第二の認
識部5によって得られた認識結果の距離データをyとす
る゛とき2選択部6は β=αx−y(ただしα=1.0〜1.5)を計算し、
βが負のときには第一の認識部4の認識結果を選択し、
βが正のときには第二の認識部5の認識結果を選択して
出力する。
選択部6が選択した認識結果は表示部9に表示され1話
者は表示部9に表示された認識結果の正否を決定し、正
しくない場合には再度発声し前記同様にして認識をやり
直す。
選択部6が第二の認識部5の認識結果を選択し。
この認識結果が正しいと決定されたときにはその都度そ
の単語音声から得られた特徴を第一の単語辞書2に設定
した個人辞書領域に記憶する。
不特定話者が発声した単語音声の特徴は第二の認識部5
によって認識され、前記と同様にして認識結果の正否を
決定し、特定話者として登録を希望する話者の場合には
、その単語音声から得られた特徴を新しく第一の単語辞
書2に設定した個人辞書領域に記憶する。
このため、特定話者方式の単語音声認識に使用する第一
の単語辞書2は記憶内容が−たん充実された後も常に更
新され、したがって特定話者方式として利用する場合の
認8&精度を絶えず向上することができる。
(f)発明の詳細 な説明したように1本発明によれば特定話者方式と不特
定話者方式とに共用できるとともに。
特定話者方式において使用する単語辞書の生成のために
利用者に与える負担を軽減することができる。
【図面の簡単な説明】
第1図は本発明−実施例の構成を示すブロック図、また
第2図は第二の単語辞書の記憶内容の一例である。 図中、1は特徴抽出部、2は第一の単語辞書。 3は第二の単語辞書、4は第一の認識部、5は第二の認
識部、6は選択部、7は登録部である。

Claims (1)

  1. 【特許請求の範囲】 特定の登録話者または不特定の非登録話者が発声する単
    語音声の特徴を抽出する特徴抽出部と。 単語音声の前記登録話者毎の特徴を記憶する第一の単語
    辞書と、所定の単語音声の前記非登録話者に共通する特
    徴を予め記憶する第二の単語辞書と。 前記特徴抽出部によって得られる単語音声の特徴を前記
    第一の単語辞書の記憶内容と照へすることによってその
    単語音声に対する認識結果を得る第一の認識部と、前記
    特徴抽出部によって得られる単語音声の特徴を前記第二
    の単語辞書の記憶内容と照合することによってその単語
    音声に対する認識結果を得る第二の認識部と、前記第一
    の認識部によって得られる認識結果と前記第二の認識部
    によって得られる認識結果とのいずれかを選択する選択
    部と、前記第二の認識部によって得られ前記選択部によ
    って選択された認識結果が正しい場合にはその単語音声
    の特徴を前記第一の単語辞書に登録する登録部とを備え
    ることを特徴とする単語音声認識装置。
JP58152814A 1983-08-22 1983-08-22 単語音声認識装置 Pending JPS6045298A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58152814A JPS6045298A (ja) 1983-08-22 1983-08-22 単語音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58152814A JPS6045298A (ja) 1983-08-22 1983-08-22 単語音声認識装置

Publications (1)

Publication Number Publication Date
JPS6045298A true JPS6045298A (ja) 1985-03-11

Family

ID=15548734

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58152814A Pending JPS6045298A (ja) 1983-08-22 1983-08-22 単語音声認識装置

Country Status (1)

Country Link
JP (1) JPS6045298A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6332596A (ja) * 1986-07-25 1988-02-12 日本電信電話株式会社 音声認識装置
US6446039B1 (en) 1998-09-08 2002-09-03 Seiko Epson Corporation Speech recognition method, speech recognition device, and recording medium on which is recorded a speech recognition processing program
JP2008077099A (ja) * 2001-03-28 2008-04-03 Qualcomm Inc 話し手に暗黙的に順応する技術を用いた音声認識システム

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6332596A (ja) * 1986-07-25 1988-02-12 日本電信電話株式会社 音声認識装置
US6446039B1 (en) 1998-09-08 2002-09-03 Seiko Epson Corporation Speech recognition method, speech recognition device, and recording medium on which is recorded a speech recognition processing program
JP2008077099A (ja) * 2001-03-28 2008-04-03 Qualcomm Inc 話し手に暗黙的に順応する技術を用いた音声認識システム
JP2008203876A (ja) * 2001-03-28 2008-09-04 Qualcomm Inc 話し手に暗黙的に順応する技術を用いた音声認識システム
JP4546512B2 (ja) * 2001-03-28 2010-09-15 クゥアルコム・インコーポレイテッド 話し手に暗黙的に順応する技術を用いた音声認識システム
JP4546555B2 (ja) * 2001-03-28 2010-09-15 クゥアルコム・インコーポレイテッド 話し手に暗黙的に順応する技術を用いた音声認識システム

Similar Documents

Publication Publication Date Title
US6269335B1 (en) Apparatus and methods for identifying homophones among words in a speech recognition system
US6996528B2 (en) Method for efficient, safe and reliable data entry by voice under adverse conditions
TWI554984B (zh) 電子裝置
US20060247932A1 (en) Conversation aid device
JPH0876788A (ja) 音声認識における混同しやすい語の検出方法
JPH0612092A (ja) 音声認識装置およびその動作方法
EP0974141A1 (en) Extensible speech recognition system that provides a user with audio feedback
JP2000348033A (ja) 発話翻訳を実行するための装置及び方法
TW201822190A (zh) 語音辨識系統及其方法、詞彙建立方法與電腦程式產品
US20150081301A1 (en) Biometric password security
JP2004094257A (ja) 音声処理のためのデシジョン・ツリーの質問を生成するための方法および装置
JPS6045298A (ja) 単語音声認識装置
KR100911751B1 (ko) 단어학습장치 및 그 방법
JP3340163B2 (ja) 音声認識装置
JP2005241767A (ja) 音声認識装置
JP2000334180A (ja) 音声出力装置
JP3576511B2 (ja) 音声対話装置
KR20230145684A (ko) 음절 분리를 통한 영어 학습 시스템
JP2001282098A (ja) 外国語学習装置、外国語学習方法および媒体
JP6572969B2 (ja) 音声認識装置、音声認識システム、及び、プログラム
JP2002196789A (ja) 音声対話装置
TW202115713A (zh) 資訊處理裝置、記錄媒體、程式產品以及資訊處理方法
JP2004341293A (ja) 音声を文字データに変換する装置と方法とそのためのプログラムと対話装置
Pulgram Phonetics and sound change
KR100796564B1 (ko) 한글 자음 키워드를 이용한 외국어 문장 학습 방법 및 장치