JP2002287791A - 専門家システムを用いた音声認識基盤の知能型対話装置及びその方法 - Google Patents

専門家システムを用いた音声認識基盤の知能型対話装置及びその方法

Info

Publication number
JP2002287791A
JP2002287791A JP2001080938A JP2001080938A JP2002287791A JP 2002287791 A JP2002287791 A JP 2002287791A JP 2001080938 A JP2001080938 A JP 2001080938A JP 2001080938 A JP2001080938 A JP 2001080938A JP 2002287791 A JP2002287791 A JP 2002287791A
Authority
JP
Japan
Prior art keywords
data
voice
response
speech recognition
expert system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001080938A
Other languages
English (en)
Inventor
Hoon Kim
フン・キム
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
GLOBAL DATA SYSTEM CO Ltd
Original Assignee
GLOBAL DATA SYSTEM CO Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by GLOBAL DATA SYSTEM CO Ltd filed Critical GLOBAL DATA SYSTEM CO Ltd
Priority to JP2001080938A priority Critical patent/JP2002287791A/ja
Publication of JP2002287791A publication Critical patent/JP2002287791A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【課題】 話者の音声を認識し、適切な状況と既存の資
料とを通じて話者との対話を可能とした専門家システム
を用いた音声認識基盤の知能型対話装置及びその方法を
提供すること。 【解決手段】 本発明は、音声認識のために話者独立型
音声認識(特定人に関係なく殆ど全ての人々の音声を認
識する)技術を適用し、音素基盤の自然語対話ができる
ようにし、しかも特別な学習なしでも単語を自由に追加
することができるようにし、さらに平均1秒内外の応答
時間で最適な対話状態を維持することができるようにす
る。また、音声認識の時、雑音除去技術を付加し、周辺
環境の影響を受けずに対話を行えるようにする。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、専門家システムを
用いた音声認識基盤の知能型対話装置及びその方法に係
り、特に話者の音声を認識し、適切な状況と既存の資料
とを通じて話者との対話を可能とした専門家システムを
用いた音声認識基盤の知能型対話装置及びその方法に関
する。
【0002】
【従来の技術】一般に、既存の音声認識技術は、話者従
属型音声認識(特定人の音声だけを認識する)又は不連
続的単語認識であって、多数の人々はそれを使用できな
く、発音時にも一言ずつ区切って言うべきであるという
不便さがあった。
【0003】また、新しい単語を追加するためには何回
かの学習を必要とし、一回認識してから答えてくれるま
では2〜4秒の遅延時間がかかるという問題があった。
【0004】その他、老若男女、音声の高低、音声トー
ンの変換に敏感に反応し過ぎて正しく認識できないとい
う問題があった。
【0005】また、音声認識後それに対する応答方式
(TTS)においても、一般人はぎこちないイントネー
ション及びトーンのため気まずく感じるなど、全般的に
音声認識技術を製品化することはなかなか難しいことで
あった。
【0006】最近はかかる音声認識の問題点を解決する
ために、話者独立型音声認識(特定人に関係なく音声認
識が可能である)、可変語認識(特別な学習なしでも単
語追加が可能である)、連続音認識(連続的な発音を認
識する)、周辺環境に対する独立的認識等の技術が開発
されている。
【0007】しかし、このように開発される音声認識装
置を適用した製品においても、事前に脚本によって話者
の応答が制限されるという短所がある。即ち、甲を言え
ば乙と答えるという方式となっているので、対話媒体と
してはまだ足りないのである。
【0008】また、一回作成された内容は更新できない
ので、限定された対話内容のため技術の寿命面における
問題点が発生した。
【0009】一方、一般に、専門家システムは、専門家
の知識をコンピューターシステムに記憶し、専門家の判
断手続きと同様にシステムプロセスを進行するよう具現
されたシステムであって、推論手続きを通じて最も理想
的な結果を取り出せるよう構築されたシステムである。
【0010】従来の専門家システムが適用された分野を
調べてみると、医療診断システム、機械故障診断システ
ム、地下鉱物判断システム、気象情報システム等の高難
度の産業に多様に適用されていた。しかしながら、こう
した優秀性にもかかわらず、消費材やサービスの関連分
野への進出は積極的に行われていない。
【0011】
【発明が解決しようとする課題】従って、本発明はかか
る従来の音声認識装置の諸般の問題点と専門家システム
の断片的な適用問題とを解決するために提案されたもの
で、その目的は、話者の音声を認識し、適切な状況と既
存の資料とを通じて話者との対話を可能とした専門家シ
ステムを用いた音声認識基盤の知能型対話装置を提供す
ることにある。
【0012】また、本発明の他の目的は、話者の音声を
認識し、適切な状況と既存の資料とを通じて話者との対
話を可能とした専門家システムを用いた音声認識基盤の
知能型対話方法を提供することにある。
【0013】
【課題を解決するための手段】上記目的を達成するため
に、本発明は、音声認識のために話者独立型音声認識
(特定人に関係なく殆ど全ての人々の音声を認識する)
技術を適用し、音素基盤の自然語対話ができるように
し、しかも特別な学習なしでも単語を自由に追加するこ
とができるようにし、さらに平均1秒内外の応答時間で
最適な対話状態を維持することができるようにする。ま
た、音声認識の時、雑音除去技術を付加し、周辺環境の
影響を受けずに対話を行えるようにする。
【0014】尚、音声認識装置に専門家システムを付加
し、話者の基本資料を記憶している状態においてそれを
基礎として話者の言葉を認識するとともに、専門家シス
テムの知識ベース(Knowledge Base)を活用することに
より、多くのルールを適用し、話者の質問に対して高い
レベルの最も適切な応答を提供できるようにする。
【0015】即ち、自分の周辺環境資料を話者の基本資
料として入力し、話者レベルの思考を可能とする専門家
システムのルールを構成することにより、友達レベルの
対話ができるようにする。
【0016】
【発明の実施の形態】以下、上記のような技術的思想に
係る本発明の好適な実施の形態を添付図に基づいて詳細
に説明する。
【0017】(実施の形態1)図1は、本発明に係る専門
家システムを用いた音声認識基盤の知能型対話装置の構
成を示す図である。
【0018】図1において、参照符号10はユーザの音
声を認識し、その認識された音声に対する応答を合成音
声として送出する音声認識装置を示し、参照符号20は
前記音声認識装置で認識された音素データを、後段の専
門家システムの認識できるデータに変換して前記専門家
システムに伝達し、前記専門家システムから出力される
応答データを前記音声認識装置10に伝達するデータ変
換装置を示す。また、参照符号30は前記データ変換装
置20を介して伝達される音素データに対応する応答を
取り出し、その取り出した応答を前記データ変換装置2
0に伝達する専門家システムを示す。
【0019】ここで、前記音声認識装置10は、ユーザ
の音声を音素単位に分析し、検討された主な質問語を選
択してデータ化する音素基盤音声分析部11と、前記デ
ータ変換装置20から伝達されるデータに該当する音声
データを出力する音声データベース12と、前記音声デ
ータベース12から出力される音声データを合成音声と
してユーザに送出する音声合成部13とから構成され
る。
【0020】また、前記専門家システム30は、入力さ
れた質問内容を分析して分類し、適切なルールに連結さ
せ、ルール適用後選択された応答内容を受けて前記デー
タ変換装置20に伝達する推論エンジン31と、前記推
論エンジン31で設定されるルールに、ワーキングメモ
リ33から引き出したファクト(Fact)を適用して質問
に対する応答を抽出し、その応答を前記推論エンジン3
1に伝達する応答抽出部32と、ユーザとの対話を通し
て取得した複数の基本ファクト及び、ルールに適用する
条件の集合体であるファクトを記憶したワーキングメモ
リ33とから構成される。
【0021】このように構成された本発明に係る専門家
システムを用いた音声認識基盤の知能型対話装置は、ま
ず、ユーザの音声を認識し、その認識された音声に対す
る応答を合成音声として送出する音声認識装置10内の
音素基盤音声分析部11は、ユーザから質問音声が入力
されると、それを音素単位に分析し、その分析結果に応
じて主な質問語を選択してデータ化した後、データ変換
装置20に伝達する。
【0022】前記データ変換装置20は、入力される質
問語の音素データを専門家システム30に適用すること
ができるように、前記質問語の音素データを専門家シス
テム30の認識できるデータに変換して前記専門家シス
テム30に伝達する。
【0023】前記専門家システム30は、前記データ変
換装置20を介して伝達される音素データに対応する応
答を取り出し、その取り出した応答を前記データ変換装
置20に伝達する。
【0024】即ち、専門家システム30内の推論エンジ
ン31は、知識ベース(KnowledgeBase)内のルール(R
ule)とファクト(Fact)を管理するシステムであり、
応答抽出部32でのルール適用の案内にスーパールール
として関与する装置であって、入力された質問内容を分
析して分類し、適切なルールに連結させる。
【0025】これにより、応答抽出部32は、前記推論
エンジン31のルール適用により、予め設定されたルー
ルのうち前記適用されたルールを設定し、その設定され
たルールの条件に該当するファクトをワーキングメモリ
33から引き出した後、前記設定されたルールに適用さ
せ、その結果値をユーザの入力質問語の応答として前記
推論エンジン31に伝達する。ここで、応答抽出部32
は応答誘導ルールの集合体であり、専門家システムの性
能は該ルールの適用に依存している。従って、本発明の
応答抽出部32は、各製品の特色に合わせて、各質問と
応答を各分野の専門家の諮問に基づいて予め作成した
後、それをルールに変更して応答抽出部32に記憶して
おく。
【0026】また、ワーキングメモリ33は、ファクト
を記憶するところであって、ルールに適用する条件の集
合体である。初期にユーザとの対話を通して取得した基
本ファクト(例えば、名前、性格、年、趣味など)もこ
こに記憶し、ルールの条件に合わせて適用されるように
する。
【0027】一方、推論エンジン31は、前記応答抽出
部32で得られる応答を前記データ変換装置20に伝達
し、前記データ変換装置20はその伝達される応答デー
タを音声として出力するように、助詞などを含んで変換
した応答データを音声認識装置10に伝達する。
【0028】前記音声認識装置10内の音声データベー
ス12は、前記データ変換装置20が要求する応答デー
タに該当する音声をデータベースから選択し、この際、
適切な助詞の音声データも共に選択して音声合成部13
に伝達する。
【0029】前記音声合成部13は前記音声データベー
ス12から伝達される複数の音声を合成してユーザの質
問語に対する応答として送出する。ここで、音声合成部
13は音声と音声間の間隔、高低、助詞等を考慮し、ユ
ーザにスムーズに聞こえるように複数の音声を合成して
送出する。
【0030】(実施の形態2)図2は、本発明に係る専門
家システムを用いた音声認識基盤の知能型対話方法を示
す流れ図である。図2のSはステップ(Step)を示す。
【0031】図2に示すように、ユーザ音声の入力を受
ける段階(S1)と、前記入力を受けた音声を音素単位
に分析する段階(S2)と、前記分析した音素データを
専門家システムの認識できるデータに変換する段階(S
3)と、前記変換したデータを認識し、推論による最適
なルールを選択する段階(S4)と、前記選択したルー
ルの条件に合うファクトを前記ルールに適用し、入力さ
れた質問に対する結果を抽出する段階(S5)と、前記
段階で得られた結果を新規ファクトとしてワーキングメ
モリに記憶した後、応答を抽出する段階(S6)と、前
記抽出した応答を音声認識装置の認識できるデータに変
換する段階(S7)と、前記変換したデータに対応する
音声データを抽出する段階(S8)と、前記抽出した音
声データを合成する段階(S9)と、前記合成した音声
をスピーカを介してユーザに出力する段階(S10)と
から構成される。
【0032】このように構成される本発明に係る専門家
システムを用いた音声認識基盤の知能型対話方法は、ま
ず、段階S1でユーザ音声の入力を受け、段階S2で入
力を受けた音声を音素単位に分析して入力された音声を
認識する。
【0033】次いで、段階S3で前記認識した音素デー
タを専門家システムの認識できるデータに変換し、段階
S4で前記変換したデータを認識し、推論による最適な
ルールを選択する。
【0034】その後、段階S5で前記選択したルールの
条件に合うファクトをワーキングメモリから引き出し、
その引き出したファクトを前記選択したルールに適用
し、その結果を抽出する。
【0035】次に、段階S6で前記抽出した結果データ
を新規ファクトとして前記ワーキングメモリに記憶した
後、再度繰り返してルールを適用し、最後の結果を入力
質問に対する応答として抽出する。その後、段階S7で
前記抽出した応答を音声認識装置の認識できるデータに
変換する。
【0036】次いで、段階S8で前記変換したデータに
対応する音声データを音声データベースから抽出し、段
階S9で前記抽出した音声データを合成する。
【0037】その後、段階S10で前記合成した音声を
スピーカを介してユーザに出力する。
【0038】以上説明した本発明は、対話内容の更新が
可能なので、新しい製品への内容更新が可能であり、対
話チップを交替することによって簡単に新システムに変
更することができる。結局、子供用、寂しい老人用、独
身者用、患者用等に製品を区別して適用することがで
き、さらに各システムのルールを変更して異なる対話及
び応答を聞くことができるなどのバージョンの変更がで
きるようになる。
【0039】また、音声認識と専門家システムを用いて
英語教育等に適用することができる。尚、話者の発音を
認識、判断してそのレベルを判別するシステムとして活
用することができる。
【0040】
【発明の効果】以上説明したように、本発明の専門家シ
ステムを用いた音声認識基盤の知能型対話装置及びその
方法によれば、音声認識装置と専門家システムを結合し
てより知能的な対話システムを具現することができるの
で、話者の音声を認識し、適切な状況と既存の資料とを
通じて、話者とのスムーズな対話を可能とするという利
点がある。
【0041】また、便利性と正確性を共に具現すること
ができるので、対話型教育システム、老人福祉次元の対
話システム、医学用治療システム等に適用可能であると
いう利点がある。
【0042】尚、音声認識と専門家システムを用いて英
語教育等に適用することができ、更に話者の発音を認
識、判断してそのレベルを判別するシステムとして活用
することができる。
【図面の簡単な説明】
【図1】 本発明に係る専門家システムを用いた音声認
識基盤の知能型対話装置の構成を示す図である。
【図2】 本発明に係る専門家システムを用いた音声認
識基盤の知能型対話装置の方法を示す流れ図である。
【符号の説明】
10 音声認識装置、20 データ変換装置、30 専
門家システム。
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G10L 15/18 G10L 3/00 537A (71)出願人 501111614 7&8 Floor, Samik Bu ilding, 50 Nonhyun−d ong, Kangnam−gu, Se oul, Korea (72)発明者 フン・キム 大韓民国、ソウル、カンドン−グ、ミョン イル−ドン 257、チュゴン・ハイ−ライ ズ・アパートメント 904−507 Fターム(参考) 5B091 AA15 BA19 CA02 CA12 CA26 CB12 CB32 CC04 5D015 AA05 HH14 LL02 LL06 5D045 AB30

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 対話システムにおいて、 ユーザの音声を認識し、その認識された音声に対する応
    答を合成音声として送出する音声認識装置と、 前記音声認識装置で認識された音素データを、後段の専
    門家システムの認識できるデータに変換して前記専門家
    システムに伝達し、前記専門家システムから出力される
    応答データを前記音声認識装置に伝達するデータ変換装
    置と、 前記データ変換装置を介して伝達される音素データに対
    応する応答を取り出し、その取り出した応答を前記デー
    タ変換装置に伝達する専門家システムとを含んで構成さ
    れることを特徴とする専門家システムを用いた音声認識
    基盤の知能型対話装置。
  2. 【請求項2】 前記音声認識装置は、ユーザの音声を音
    素単位に分析し、検討された主な質問語を選択してデー
    タ化する音素基盤音声分析部と、前記データ変換装置か
    ら伝達されるデータに該当する音声データを出力する音
    声データベースと、前記音声データベースから出力され
    る音声データを合成音声としてユーザに送出する音声合
    成部とから構成されることを特徴とする請求項1記載の
    専門家システムを用いた音声認識基盤の知能型対話装
    置。
  3. 【請求項3】 前記専門家システムは、入力された質問
    内容を分析して分類し、適切なルールに連結させ、ルー
    ル適用後選択された応答内容を受けて前記データ変換装
    置に伝達する推論エンジンと、前記推論エンジンで設定
    されるルールにワーキングメモリから引き出したファク
    ト(Fact)を適用して質問に対する応答を抽出し、その
    応答を前記推論エンジンに伝達する応答抽出部と、ユー
    ザとの対話を通して取得した基本ファクト及び、ルール
    に適用する条件の集合であるファクトを記憶したワーキ
    ングメモリとから構成されることを特徴とする請求項1
    記載の専門家システムを用いた音声認識基盤の知能型対
    話装置。
  4. 【請求項4】 対話装置を用いた対話方法において、ユ
    ーザの音声の入力を受ける段階と、前記入力を受けた音
    声を音素単位に分析する段階と、前記分析した音素デー
    タを専門家システムの認識できるデータに変換する段階
    と、 前記変換したデータを認識し、推論による最適なルール
    を選択する段階と、 前記選択したルールの条件に合うファクトを前記ルール
    に適用してその結果を抽出する段階と、 前記段階で得られた結果を新規ファクトとしてワーキン
    グメモリに記憶した後、ルールを続けて適用し、入力さ
    れた質問に対する応答を抽出する段階と、 前記抽出した応答を音声認識装置の認識できるデータに
    変換する段階と、 前記変換したデータに対応する音声データを抽出する段
    階と、 前記抽出した音声データを合成する段階と、 前記合成した音声をスピーカを介してユーザに出力する
    段階とを含んでなることを特徴とする専門家システムを
    用いた音声認識基盤の知能型対話方法。
JP2001080938A 2001-03-21 2001-03-21 専門家システムを用いた音声認識基盤の知能型対話装置及びその方法 Pending JP2002287791A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001080938A JP2002287791A (ja) 2001-03-21 2001-03-21 専門家システムを用いた音声認識基盤の知能型対話装置及びその方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001080938A JP2002287791A (ja) 2001-03-21 2001-03-21 専門家システムを用いた音声認識基盤の知能型対話装置及びその方法

Publications (1)

Publication Number Publication Date
JP2002287791A true JP2002287791A (ja) 2002-10-04

Family

ID=18937125

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001080938A Pending JP2002287791A (ja) 2001-03-21 2001-03-21 専門家システムを用いた音声認識基盤の知能型対話装置及びその方法

Country Status (1)

Country Link
JP (1) JP2002287791A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010073191A (ja) * 2008-08-20 2010-04-02 Universal Entertainment Corp 顧客対応システム、並びに会話サーバ
CN110473534A (zh) * 2019-07-12 2019-11-19 南京邮电大学 一种基于深度神经网络的老年人看护对话系统

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001022779A (ja) * 1999-07-09 2001-01-26 Nissan Motor Co Ltd 対話型情報検索装置、コンピュータを用いた対話型情報検索方法及び対話型情報検索処理を行うプログラムを記録したコンピュータ読取り可能な媒体

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001022779A (ja) * 1999-07-09 2001-01-26 Nissan Motor Co Ltd 対話型情報検索装置、コンピュータを用いた対話型情報検索方法及び対話型情報検索処理を行うプログラムを記録したコンピュータ読取り可能な媒体

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010073191A (ja) * 2008-08-20 2010-04-02 Universal Entertainment Corp 顧客対応システム、並びに会話サーバ
CN110473534A (zh) * 2019-07-12 2019-11-19 南京邮电大学 一种基于深度神经网络的老年人看护对话系统

Similar Documents

Publication Publication Date Title
US9558734B2 (en) Aging a text-to-speech voice
US9251142B2 (en) Mobile speech-to-speech interpretation system
JP3968133B2 (ja) 音声認識対話処理方法および音声認識対話装置
US20060080098A1 (en) Apparatus and method for speech processing using paralinguistic information in vector form
US11335324B2 (en) Synthesized data augmentation using voice conversion and speech recognition models
US11289082B1 (en) Speech processing output personalization
JP2004037721A (ja) 音声応答システム、音声応答プログラム及びそのための記憶媒体
KR20230084229A (ko) 병렬 타코트론: 비-자동회귀 및 제어 가능한 tts
JP2001166789A (ja) 初頭/末尾の音素類似度ベクトルによる中国語の音声認識方法及びその装置
CN110265008A (zh) 智能回访方法、装置、计算机设备及存储介质
KR20190135853A (ko) 텍스트- 다중 음성 변환 방법 및 시스템
US20010056345A1 (en) Method and system for speech recognition of the alphabet
JP2004163541A (ja) 音声応答装置
Venkatagiri Speech recognition technology applications in communication disorders
KR100369732B1 (ko) 전문가 시스템을 이용한 음성인식 기반의 지능형 대화장치 및 그 방법
US20230146945A1 (en) Method of forming augmented corpus related to articulation disorder, corpus augmenting system, speech recognition platform, and assisting device
CN112423000B (zh) 数据处理方法、装置、设备以及介质
JP2002287791A (ja) 専門家システムを用いた音声認識基盤の知能型対話装置及びその方法
Nasef et al. Stochastic gradient descent analysis for the evaluation of a speaker recognition
Furui Toward the ultimate synthesis/recognition system
Bohac et al. A cross-lingual adaptation approach for rapid development of speech recognizers for learning disabled users
JP2003122395A (ja) 音声認識システム、端末およびプログラム、並びに音声認識方法
Unluturk Speech Command Based Intelligent Control of Multiple Home Devices for Physically Handicapped
CN113763924B (zh) 声学深度学习模型训练方法、语音生成方法及设备
JP2000242295A (ja) 音声認識装置および音声対話装置

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20031118