JP2002215188A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JP2002215188A
JP2002215188A JP2001012760A JP2001012760A JP2002215188A JP 2002215188 A JP2002215188 A JP 2002215188A JP 2001012760 A JP2001012760 A JP 2001012760A JP 2001012760 A JP2001012760 A JP 2001012760A JP 2002215188 A JP2002215188 A JP 2002215188A
Authority
JP
Japan
Prior art keywords
voice
word
likelihood
data
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001012760A
Other languages
English (en)
Inventor
Noritaka Kusumoto
典孝 楠本
Sunako Asayama
砂子 朝山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2001012760A priority Critical patent/JP2002215188A/ja
Publication of JP2002215188A publication Critical patent/JP2002215188A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 操作者が、入力した音声がどの程度類似して
いたのか簡単に判断できるような音声認識装置を提供す
る。 【解決手段】 音声入力部1を介して入力された操作者
の音声を、音声認識部2により認識を行い、第一候補の
単語とその尤度に対応するデータを尤度対応データ格納
部5および単語音声格納部7から出力し、表示部6で画
面表示および音声出力部8で再生を行う。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、入力された音声を
認識する音声認識装置に関するものである。
【0002】
【従来の技術】従来の音声認識装置としては、例えば、
特開平2000−181676号公報に開示される画像
処理装置がある。この画像処理装置は、表示装置に表示
された対話相手オブジェクトの動作を、マイクロフォン
から入力された使用者の単語音声に応答して変化させる
ものである。
【0003】
【発明が解決しようとする課題】しかしながら、上記の
従来の装置では、入力されるべき単語と一致するか否か
のみを判断し表示を行うため、操作者は入力した音声が
どの程度類似していたのか判断できず、もっとも装置に
適した発声を練習することができないという問題点があ
った。
【0004】本発明の目的は、操作者が、入力した音声
がどの程度類似していたのか判断できるような音声認識
装置を提供することである。
【0005】
【課題を解決するための手段】(1)第1の発明 第1の発明に係る音声認識装置は、認識対象単語が登録
されている単語辞書と、音声を入力する音声入力手段
と、音声入力手段により入力された音声と前記単語辞書
に登録されている単語との類似度を示す尤度を計算し、
予め設定した条件に従い第一候補単語とその尤度を出力
する音声認識手段と、尤度に対応付けた点数データを記
憶するデータ格納手段と、音声認識手段により出力され
た尤度に対応する点数データをデータ格納手段から読み
出す出力制御手段と、音声認識手段により出力された第
一候補単語とその尤度と出力制御手段により読み出され
たデータの画面表示を行う表示手段とを備えるものであ
る。
【0006】本発明に係る音声認識装置においては、操
作者音声に対応する音声を認識し、第一候補単語とその
尤度が音声認識手段から出力され、出力された尤度に応
じて点数データが出力制御手段より読み出され、第一候
補単語と読み出された点数データの表示が行われる。し
たがって、操作者が、入力した音声がどの程度類似して
いたのか判断できる。
【0007】(2)第2の発明 第2の発明に係る音声認識装置は、第1の発明に係る音
声認識装置の構成において、データ格納手段は、尤度に
対応付けたテキストデータをさらに記憶することを特徴
とする。
【0008】この場合、操作者が、入力した音声がどの
程度類似していたのか文章内容から判断でき、より具体
的に類似度を判断することができる。
【0009】(3)第3の発明 第3の発明に係る音声認識装置は、第1または第2の発
明に係る音声認識装置の構成において、データ格納手段
は、尤度に対応付けた画像データをさらに記憶すること
を特徴とする。
【0010】この場合、操作者が、入力した音声がどの
程度類似していたのか画像を見て一目で判断でき、より
視覚的に容易に類似度を判断することができる。
【0011】(4)第4の発明 第3の発明に係る音声認識装置は、第1〜第3の発明に
係る音声認識装置の構成において、データ格納手段は、
尤度に対応付けた音声データをさらに記憶し、出力制御
手段により読み出された音声データを再生する音声出力
手段をさらに備えるものである。
【0012】この場合、操作者が、入力した音声がどの
程度類似していたのか音声を聞いて判断でき、より聴覚
的に容易に類似度を判断することができる。
【0013】(5)第5の発明 第5の発明に係る音声認識装置は、第1〜第4の発明に
係る音声認識装置の構成において、単語の音声データを
記憶する単語音声格納手段をさらに備え、音声出力手段
は、音声認識手段により出力された単語データに対応す
る単語音声データを単語音声格納手段からさらに読み出
し、音声出力手段は、音声出力手段により読み出された
単語音声データをさらに再生することを特徴とする。
【0014】この場合、操作者が、第一候補単語がどの
単語だったのか音声を聞いて判断でき、操作者の発声と
同じか否かを聴覚的に容易に判断することができる。
【0015】
【発明の実施の形態】以下、本発明の一実施形態による
音声認識装置について図面を参照しながら説明する。図
1は、本発明の一実施の形態による音声認識装置の構成
を示すブロック図である。
【0016】図1に示す音声認識装置は、音声入力部
1、音声認識部2、単語辞書3、出力制御部4、尤度対
応データ格納部5、表示部6、単語音声格納部7、音声
出力部8を備える。
【0017】音声入力部1は、例えば、マイクロフォン
等により構成され、操作者が発声した音声を音声信号に
変換して音声認識部2へ出力する。音声認識部2は、音
声入力部1から出力された音声信号を用いて単語辞書3
に登録されている単語との類似度を示す尤度を計算し、
予め設定した条件に従って第一候補の単語データとその
尤度を出力制御部4へ出力する。
【0018】出力制御部4は、音声認識部2から出力さ
れた第一候補単語の尤度を尤度対応データ格納部5へ出
力し、さらに音声認識部2から出力された第一候補単語
を単語音声格納部7へ出力する。尤度対応データ格納部
5は、出力制御部4から出力された尤度を用いて対応す
る点数データとテキストデータと画像データと音声デー
タを出力制御部4へ出力する。
【0019】単語音声格納部7は、出力制御部4から出
力された単語を用いて対応する単語音声データを出力制
御部4へ出力する。出力制御部4は、音声認識部2から
出力された第一候補単語と尤度対応データ格納部5から
出力された点数データとテキストデータと画像データを
表示部6へ出力し、さらに尤度対応データ格納部5から
出力された音声データと単語音声格納部7から出力され
た単語音声データをを音声出力部8へ出力する。
【0020】表示部6は、出力制御部4から出力された
点数データとテキストデータと画像データを画面表示す
る。音声出力部8は、例えば、スピーカ等により構成さ
れ、出力制御部4から出力された音声データと単語音声
データを再生する。
【0021】本実施の形態において、単語辞書3が単語
辞書に相当し、音声入力部1が音声入力手段に相当し、
音声認識部2が音声認識手段に相当し、尤度データ格納
部5がデータ格納手段に相当し、出力制御部4が出力制
御手段に相当し、表示部6が表示手段に相当する。ま
た、音声出力部8が音声出力手段に相当し、音声合成部
7が音声合成手段に相当する。
【0022】次に、上記のように構成された音声認識装
置の動作について説明する。図2は、図1に示す音声認
識装置の動作を示すフローチャートである。
【0023】まず、操作者の音声が音声入力部1に入力
されると、入力された音声が音声信号に変換されて音声
認識部2へ出力される。音声認識部2は、入力された音
声信号と単語辞書3に登録されている単語との類似度を
示す尤度を計算し(ステップS1)、予め設定した条件
に従い第一候補の単語とその尤度を出力制御部4へ出力
し(ステップS2)、ステップS3へ移行する。
【0024】単語表示をするかしないか判断し(ステッ
プS3)、単語表示をしない場合、ステップS5へ移行
し、単語表示をする場合、ステップS4へ移行する。
【0025】単語表示をする場合、出力制御部4は、単
語データを表示部6へ出力し、表示部6は単語データを
画面に表示し(ステップS4)、ステップS5へ移行す
る。
【0026】点数表示をするかしないか判断し(ステッ
プS5)、点数表示をしない場合、ステップS7へ移行
し、点数表示をする場合、ステップS6へ移行する。
【0027】点数表示をする場合、出力制御部4は、点
数データを表示部6へ出力し、表示部6は点数データを
画面に表示し(ステップS6)、ステップS7へ移行す
る。
【0028】テキスト表示をするかしないか判断し(ス
テップS7)、テキスト表示をしない場合、ステップS
9へ移行し、テキスト表示をする場合、ステップS8へ
移行する。
【0029】テキスト表示をする場合、出力制御部4
は、テキストデータを表示部6へ出力し、表示部6はテ
キストデータを画面に表示し(ステップS8)、ステッ
プS9へ移行する。
【0030】画像表示をするかしないか判断し(ステッ
プS9)、画像表示をしない場合、ステップS11へ移
行し、画像表示をする場合、ステップS10へ移行す
る。
【0031】画像表示をする場合、出力制御部4は、画
像データを表示部6へ出力し、表示部6は画像データを
画面に表示し(ステップS10)、ステップS11へ移
行する。
【0032】音声再生をするかしないか判断し(ステッ
プS11)、音声再生をしない場合、処理を終了し、音
声再生をする場合、ステップS12へ移行する。
【0033】音声再生をする場合、出力制御部4は、音
声データを音声出力部8へ出力し、音声出力部8は音声
データを再生し(ステップS12)、処理を終了する。
【0034】上記の処理により、本実施の形態では、操
作者の音声が音声入力部1へ入力されると、音声認識部
2によりこの音声が認識され、尤度対応データ格納部5
および単語音声格納部7から読み出された点数データと
テキストデータと画像データと音声データを用いてを用
いて表示部6および音声出力部8により画面表示および
音声再生を行うことができる。この結果、操作者は、入
力した音声がどの程度類似していたのか聴覚的にも視覚
的にも簡単に判断できる。
【0035】次に、図1に示す音声認識装置の動作につ
いてさらに具体例を挙げて詳細に説明する。図3は、図
1の音声認識装置の具体的な構成例の一例を示す概略図
である。
【0036】図3に示す音声認識装置は、音声入力部で
あるマイクロフォン1a、表示部である表示画面6a、
音声出力部であるスピーカー8aにより構成される。
【0037】例えば、操作者が「いっちゃんねる」と発
声すると、マイクロフォン1aには操作者の音声「いっ
ちゅんねる」が入力される。
【0038】図10は、単語辞書3に登録されている単
語の一例を示す図である。ここで、単語辞書3に登録さ
れている単語が図10に示すものである場合、「いっち
ゃんねる」という単語が登録されているので、音声認識
部2は、単語データ「いっちゃんねる」とその尤度、例
えば、尤度「2700」を出力制御部4に出力する。
【0039】図4は、尤度対応データ格納部5に記憶さ
れている尤度に対応付けた点数データとテキストデータ
と画像データと音声データの一例を示す図である。ま
た、図5は、尤度対応データ格納部5に記憶されている
テキストデータの内容の一例を示す図である。
【0040】図6は、尤度対応データ格納部5に記憶さ
れている画像データの内容の一例を示す図である。図7
は、尤度対応データ格納部5に記憶されている音声デー
タの内容の一例を示す図である。また、図8は、単語音
声格納部7に記憶されている単語音声データの一例を示
す図である。
【0041】図9は、出力制御部4に記憶されている表
示画面6aおよびスピーカー8aに出力する項目設定の
一例を示す図である。ここで、出力制御部4に記憶され
ている、表示画面6aおよびスピーカー8aに出力する
項目設定が図9に示すものであり、尤度対応データ格納
部5に記憶されている尤度に対応付けた点数データとテ
キストデータと画像データと音声データが図4に示すも
のであり、尤度対応データ格納部5に記憶されているテ
キストデータの内容が図5に示すものであり、尤度対応
データ格納部5に記憶されている画像データの内容が図
6に示すものであり、尤度対応データ格納部5に記憶さ
れている音声データの内容が図7に示すものであり、単
語音声格納部7に記憶されている、単語音声データが図
8に示すものである場合、出力制御部4は、単語データ
「いっちゃんねる」と点数データ「90」と画像データ
「画像ファイル4」を表示画面6aに出力し表示を行
い、音声データ「音声ファイル4」と単語音声データ
「1CH」をスピーカー8aに出力し再生を行う。
【0042】このように、操作者は、マイクロフォン1
aに入力した音声がどの程度類似していたのか、表示画
面6aを見たりスピーカー8aから再生される音を聞く
ことで、聴覚的にも視覚的にも簡単に判断できる。
【0043】なお、本発明は上記した実施の内容に限定
されるものではない。
【0044】
【発明の効果】本発明によれば、音声認識装置におい
て、操作者が、入力した音声がどの程度類似していたの
か判断することができ、もっとも装置に適した発声を練
習することが可能である。
【図面の簡単な説明】
【図1】本発明の一実施の形態による音声認識装置の構
成を示すブロック図
【図2】図1に示す音声認識装置の動作を示すフローチ
ャート
【図3】図1の音声認識装置の具体的な構成例の一例を
示す概略図
【図4】尤度対応データ格納部5に記憶されている尤度
に対応付けた点数データとテキストデータと画像データ
と音声データの一例を示す図
【図5】尤度対応データ格納部5に記憶されているテキ
ストデータの内容の一例を示す図
【図6】尤度対応データ格納部5に記憶されている画像
データの内容の一例を示す図
【図7】尤度対応データ格納部5に記憶されている音声
データの内容の一例を示す図
【図8】単語音声格納部7に記憶されている単語音声デ
ータの一例を示す図
【図9】出力制御部4に記憶されている表示部6および
音声出力部8に出力する項目設定の一例を示す図
【図10】単語辞書3に登録されている単語の一例を示
す図
【符号の説明】
1 音声入力部 2 音声認識部 3 単語辞書 4 出力制御部 5 尤度対応データ格納部 6 表示部 7 単語音声格納部 8 音声出力部

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 認識対象単語が登録されている単語辞書
    と、音声を入力する音声入力手段と、前記音声入力手段
    により入力された音声と前記単語辞書に登録されている
    単語との類似度を示す尤度を計算し、予め設定した条件
    に従い第一候補単語とその尤度を出力する音声認識手段
    と、尤度に対応付けた点数データを記憶するデータ格納
    手段と、前記音声認識手段により出力された尤度に対応
    する点数データを前記データ格納手段から読み出す出力
    制御手段と、前記音声認識手段により出力された第一候
    補単語とその尤度と前記出力制御手段により読み出され
    たデータの画面表示を行う表示手段とを備えることを特
    徴とする音声認識装置。
  2. 【請求項2】 前記データ格納手段は、尤度に対応付け
    たテキストデータをさらに記憶することを特徴とする請
    求項1記載の音声認識装置。
  3. 【請求項3】 前記データ格納手段は、尤度に対応付け
    た画像データをさらに記憶することを特徴とする請求項
    1または2記載の音声認識装置。
  4. 【請求項4】 前記データ格納手段は、尤度に対応付け
    た音声データをさらに記憶し、前記出力制御手段により
    読み出された音声データを再生する音声出力手段をさら
    に備えることを特徴とする請求項1〜3のいずれかに記
    載の音声認識装置。
  5. 【請求項5】 単語の音声データを記憶する単語音声格
    納手段をさらに備え、前記出力制御手段は、前記音声認
    識手段により出力された単語データに対応する単語音声
    データを前記単語音声格納手段からさらに読み出し、前
    記音声出力手段は、前記出力制御手段により読み出され
    た単語音声データをさらに再生することを特徴とする請
    求項1〜4のいずれかに記載の音声認識装置。
JP2001012760A 2001-01-22 2001-01-22 音声認識装置 Pending JP2002215188A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001012760A JP2002215188A (ja) 2001-01-22 2001-01-22 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001012760A JP2002215188A (ja) 2001-01-22 2001-01-22 音声認識装置

Publications (1)

Publication Number Publication Date
JP2002215188A true JP2002215188A (ja) 2002-07-31

Family

ID=18879718

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001012760A Pending JP2002215188A (ja) 2001-01-22 2001-01-22 音声認識装置

Country Status (1)

Country Link
JP (1) JP2002215188A (ja)

Similar Documents

Publication Publication Date Title
KR101826714B1 (ko) 말하기 학습 기능을 구비한 외국어 학습 시스템 및 외국어 학습 방법
JP3248981B2 (ja) 計算機
JP2007206317A (ja) オーサリング方法、オーサリング装置およびプログラム
JPH10268875A (ja) カラオケ装置
JP6728116B2 (ja) 音声認識装置、音声認識方法およびプログラム
JP2001318592A (ja) 言語学習装置及びその言語分析方法
JPH10326176A (ja) 音声対話制御方法
JP5152588B2 (ja) 声質変化判定装置、声質変化判定方法、声質変化判定プログラム
JP2001022370A (ja) 音声案内装置
JPH07181992A (ja) 文書読上げ装置及び方法
JP2002215188A (ja) 音声認識装置
JPS63149699A (ja) 音声入出力装置
JP2016212374A (ja) 音声出力装置、音声出力方法、およびプログラム
KR100383061B1 (ko) 디지털 오디오와 그의 캡션 데이터를 이용한 학습방법
JP3838193B2 (ja) 文章読み上げ装置、同装置のためのプログラム及び記録媒体
JP2001282096A (ja) 外国語発音評価装置
JP6957069B1 (ja) 学習支援システム
KR20020007450A (ko) 외국어 학습방법 및 학습장치
JP2001067096A (ja) 音声認識結果評価装置および記録媒体
JPH0816089A (ja) 発音比較学習装置
KR101576683B1 (ko) 히스토리 저장모듈을 포함하는 오디오 재생장치 및 재생방법
KR20020048357A (ko) 오디오 플레이어에서의 텍스트/음성 변환 및 자동 음성인식 구현 방법 및 장치
JP4543919B2 (ja) 語学学習装置
JP2002268683A (ja) 情報処理方法及び装置
JP2002222186A (ja) 議事録作成装置及び方法並びにこれに利用される記憶媒体