JPS6219899A - 文章音声認識装置 - Google Patents

文章音声認識装置

Info

Publication number
JPS6219899A
JPS6219899A JP60159018A JP15901885A JPS6219899A JP S6219899 A JPS6219899 A JP S6219899A JP 60159018 A JP60159018 A JP 60159018A JP 15901885 A JP15901885 A JP 15901885A JP S6219899 A JPS6219899 A JP S6219899A
Authority
JP
Japan
Prior art keywords
phoneme
topic
sentence
recognition
phrase
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP60159018A
Other languages
English (en)
Inventor
田中 康宣
入路 友明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP60159018A priority Critical patent/JPS6219899A/ja
Publication of JPS6219899A publication Critical patent/JPS6219899A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、文章単位の音声を認識する文章音声認識装置
に関するものである。
従来の技術 近年、音声認識技術は計算機やワードプロセッサへの入
力手段等、マン・マシンインターフェースとして脚光を
浴びている分野である。しかしながら、これまでに実用
化されている単音節単位、単語単位の音声認識装置では
、人間の通常の発声単位とはほど遠く非常に使いづらい
ものとなっていた。従って、今後音声入力を必要とする
場面が増えるに伴い、人間にとって最も自然である文章
単位の音声認識装置の実用化への期待が高まっ°てきて
いる。
以下、図面を参照しながら上述した従来の文章音声認識
装置の一例について説明する。
第4図は従来の文章音声認識装置の構成を示すブロック
図である。マイクロフォン41から入力された音声信号
は、音韻認識部42で音響処理を施されて音韻列に変換
される。43は音韻辞書部で、認識対象にする自立語・
付属語が音韻表記で格納されている。文節変換部44で
は、音韻認識部42の出力である音韻列と音韻辞書43
に格納されている自立語及び付属語との類似度を求め、
類似度の高い順番に複数個の文節候補を出力する。文解
析部45では文節変換部44で得られた複数個の文節候
補を記憶しておき、必要な1文の入力が終った地点で文
解析処理を行い、最も信鎖度の高い文章認識結果を出力
端に出力する。(例えば、音声研究会資料584−83
) 発明が解決しようとする問題点 人間が普通の速度で発声した音声を正しく音韻列に変換
する音韻認識率は、現在の技術では80%程度である。
従って、文節変換部44で得られる文節候補には、かな
漢字変換で問題になっている同音異義語だけではなく、
音韻認識の誤りから来る多くの誤候補が含まれており、
正解とする文節が必ずしも上位候補にくるとはかぎらな
い。
また文解析部45では、各文節の文節候補の順位の上位
の組合せから解析を進め、文として成立するかどうかを
判定していくので、上記理由によって正しい文節が上位
候補に現れないと、正しい文候補を生成するまでに、膨
大な処理時間を必要とし、また誤認識も増えてくる。
本発明は上記問題点に鑑み、文解析手段の前段階に単語
の意味情報を用いて、正解とすべき文節候補を上位に持
ってくることにより、以後の文解析手段の負担を軽減し
、文章認識時間の減少及び文章認識率の向上をはかるも
のである。
問題点を解決するだめの手段 上記問題点を解決するために本発明の文章音声認識装置
は、音声入力手段と、前記音声入力手段の出力である音
声信号を処理し、音韻列に変換する音韻認識手段と、音
韻表記された自立語及び付属語の音韻辞書を格納してお
く音韻辞書格納手段と、前記音韻認識手段の出力音韻列
と前記音韻表記された自立語及び付属語音韻辞書とを比
較し、両者の類似度の大きい文節候補を出力する文節変
換手段と、自立語をその意味カテゴリーによって分類し
格納しておく意味辞書格納手段と、前文の話題と前記文
節候補との関連度を前記意味辞書を参照して計算し、そ
の関連度と前記文節変換で得られた類似度をもとにして
、前記文節候補の順位を編成しなおす候補再編成部と、
前記編成しなおされた文節候補に言語処理を行い最終的
な文章認識結果を出力する言語処理手段と、正しいと判
定された文から話題を抽出し、次文の話題として前記候
補再編成部へ受けわたす話題抽出手段を備えたものであ
る。
作用 人間は人と対話する際、意識的ではないが一つの共通話
題を想定して話している。同様に人間と計算機との音声
による応答システムを考える場合も、入力する一文一文
が独立していることは少なく、一つの目的(話題)に従
って話される場合が多いと考えられる。したがって、本
発明は上記した構成によって、前文から抽出された話題
を用いて文節候補から話題に関連する候補をその関連度
に応じて上位に引き上げることにより、文解析手段の負
担を軽減し認識時間の削減と認識率の向上が計れる。
実施例 第1図は、本発明の一実施例の文章音声認識装置のブロ
ック図を示したものである。マイクロフォン1から入力
された音声信号は、音韻認識部2で音響処理を施されて
音韻列に変換される。3は自立語・付属語音韻辞書部で
、認識対象にする自立語・付属語が音韻表記で格納され
ている。文節変換部4では、音韻認識部2の出力である
音韻列と自立語・付属語音韻辞書3に格納されている自
立語及び付属語との類似度を求め、類似度の高い順番に
N個の文節候補を出力する。候補再編成部5では、前文
の話題6と文節候補との関連度を計算し、その関連度と
前記文節変換部で得られた類似度をもとにして、文節候
補の順位を並べ変える。
文解析部7では、並べ変えられた文節候補を記憶してお
き、必要な一文の入力が終った地点で文解析処理を行い
、最も信頼度の高い文章候補を文章認識結果として出力
端に出力する。話題抽出部8では、文が正しいと判定さ
れた時、その文を構成する自立語から最も共通する話題
を文の話題として抽出し次の文の候補再編成部5に送る
候補再編成部5の構成を第2図に示す。21は文節変換
部4で得られた文節候補をその類似度と共に一時記憶し
ておく一時バッファであり、類似度の高いものからN個
の文節候補が貯えられている。
開速度計算22は、話題抽出部8から送られてきた前文
の話題23と一時バッファ21の各々の文節候補の関連
度を意味辞書24を参照して計算する。24は、与えら
れたタスク内で、自立語とその上位概念(話題)、さら
には話題とその上位概念(これもまた話題として扱う)
の関係を格納している意味辞書である。前記22におけ
る開速度計算は、例えば24において自立語と話題のそ
れぞれの上位概念を調べてゆき、最初に両者に共通する
話題が現れるまでのステップ数の相として定義される。
類似度の再評価25は一時バッファ21内の類似度と2
2の関連度の両者に基づいて、あらたに文節候補の得点
を計算し、その得点の大きさの順に文節候補を並べ変え
一時バッファ26に格納し、文解析部へ送られる。
話題抽出部の構成を第3図に示す。31は文解析部で得
られた文候補の内圧しいと判断された文である。32は
第2図の意味辞書24と全く同じものである。話題抽出
33は正しい文の゛各文節について、意味辞書32を参
照し、各文節のすべての上位概念(話題)を探索し、そ
の最も共通項の多かった話題を次文の話題として34か
ら候補再編成部35に送る。
発明の効果 本発明は、人間と計算機との音声による応答システムを
考える場合、入力する一文一文が独立していることは少
なく、一つの目的(話題)に従って話される場合が多い
という点に着眼し、前文の話題を用いて文節候補から話
題に関連する候補をその関連度に応じて上位に持って(
ることにより、文解析手段の負担を軽減し認識時間の削
減と認識率の向上を計ることができる。
【図面の簡単な説明】
第1図は、本発明の一実行例における文章音声認識装置
のブロック図、第2図は第1図の候補再編成部の構成図
、第3図は第1図の話題抽出部の構成図、第4図は従来
の文章音声認識装置のブロック図である。 1・・・・・・マイクロフォン、2・・・・・・音韻認
識部、3・・・・・・音韻辞書、4・・・・・・文節変
換部、5・・・・・・候補再編成部、6・・・・・・話
題、7・・・・・・文解析部、8・・・・・・話題抽出
部、22・・・・・・開速度計算、24・・・・・・意
味辞書、25・・・・・・類似度の再評価、31・・・
・・・正しいと判定された文、32・・・・・・意味辞
書、33・・・・・・話題抽出、41・・・・・・マイ
クロフォン、42・・・・・・音韻認識部、43・・・
・・・音韻辞書、44・・・・・・文節変換部、44・
・・・・・文解析部。 代理人の氏名 弁理士 中尾敏男 はか1名第1図

Claims (1)

    【特許請求の範囲】
  1. 音声入力手段と、前記音声入力手段の出力である音声信
    号を処理し、音韻列に変換する音韻認識手段と、音韻表
    記された自立語及び付属語の音韻辞書を格納しておく音
    韻辞書格納手段と、前記音韻認識手段の出力音韻列と前
    記音韻表記された自立語及び付属語音韻辞書とを比較し
    、両者の類似度の大きい文節候補を出力する文節変換手
    段と、自立語をその意味カテゴリーによって分類し格納
    しておく意味辞書格納手段と、前文の話題と前記文節候
    補との関連度を前記意味辞書を参照して計算し、その関
    連度と前記文節変換で得られた類似度をもとにして、前
    記文節候補の順位を編成しなおす候補再編成部と、前記
    編成しなおされた文節候補に言語処理を行い最終的な文
    章認識結果を出力する言語処理手段と、正しいと判定さ
    れた文から話題を抽出し、次文の話題として前記候補再
    編成部へ受けわたす話題抽出手段とを備えたことを特徴
    とする文章音声認識装置。
JP60159018A 1985-07-18 1985-07-18 文章音声認識装置 Pending JPS6219899A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60159018A JPS6219899A (ja) 1985-07-18 1985-07-18 文章音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60159018A JPS6219899A (ja) 1985-07-18 1985-07-18 文章音声認識装置

Publications (1)

Publication Number Publication Date
JPS6219899A true JPS6219899A (ja) 1987-01-28

Family

ID=15684451

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60159018A Pending JPS6219899A (ja) 1985-07-18 1985-07-18 文章音声認識装置

Country Status (1)

Country Link
JP (1) JPS6219899A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01260493A (ja) * 1988-04-12 1989-10-17 Matsushita Electric Ind Co Ltd 音声認識方法
JPH0731891A (ja) * 1993-07-23 1995-02-03 Nakajima Zoki Kk 精米方法及びその装置
JPH08512148A (ja) * 1994-04-18 1996-12-17 ボルト ベラネク アンド ニューマン インク. トピック判別機
JP2007047488A (ja) * 2005-08-10 2007-02-22 Nippon Telegr & Teleph Corp <Ntt> 対話方法、対話装置、対話プログラムおよび記録媒体

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01260493A (ja) * 1988-04-12 1989-10-17 Matsushita Electric Ind Co Ltd 音声認識方法
JPH0731891A (ja) * 1993-07-23 1995-02-03 Nakajima Zoki Kk 精米方法及びその装置
JPH08512148A (ja) * 1994-04-18 1996-12-17 ボルト ベラネク アンド ニューマン インク. トピック判別機
JP2007047488A (ja) * 2005-08-10 2007-02-22 Nippon Telegr & Teleph Corp <Ntt> 対話方法、対話装置、対話プログラムおよび記録媒体
JP4589843B2 (ja) * 2005-08-10 2010-12-01 日本電信電話株式会社 対話方法、対話装置、対話プログラムおよび記録媒体

Similar Documents

Publication Publication Date Title
US6067520A (en) System and method of recognizing continuous mandarin speech utilizing chinese hidden markou models
JP2848458B2 (ja) 言語翻訳システム
US6963832B2 (en) Meaning token dictionary for automatic speech recognition
JPS6219899A (ja) 文章音声認識装置
CN116052655A (zh) 音频处理方法、装置、电子设备和可读存储介质
Abujar et al. A comprehensive text analysis for Bengali TTS using unicode
JP3088364B2 (ja) 音声言語理解装置及び音声言語理解システム
Nga et al. A Survey of Vietnamese Automatic Speech Recognition
JPH0340177A (ja) 音声認識装置
JPS6229796B2 (ja)
Reddy et al. Phoneme-to-grapheme translation of English
US20240096311A1 (en) Method for training machine reading comprehension model, computer-readable recording medium and question answering system
Milon et al. A Comprehensive Dialect Conversion Approach from Chittagonian to Standard Bangla
JP3033132B2 (ja) 言語処理装置
Deshpande et al. Integration of Speech, Image & Text Processing Technologies
JPS62119591A (ja) 文章読上げ装置
Lehečka et al. Improving speech recognition by detecting foreign inclusions and generating pronunciations
JPS59185400A (ja) 単音節音声認識方式
JPS60118895A (ja) 音声入力装置
Silamu et al. HMM-based uyghur continuous speech recognition system
SHIGENAGA et al. Speech recognition of connectedly spoken FORTRAN programs
JPH0695684A (ja) 音声認識システム
JPS61125678A (ja) 辞書検索装置
JPH0222730A (ja) 音声入力による文書作成装置
JPS60118896A (ja) 音声認識装置