JPS60173595A - 会話応答装置 - Google Patents

会話応答装置

Info

Publication number
JPS60173595A
JPS60173595A JP59225656A JP22565684A JPS60173595A JP S60173595 A JPS60173595 A JP S60173595A JP 59225656 A JP59225656 A JP 59225656A JP 22565684 A JP22565684 A JP 22565684A JP S60173595 A JPS60173595 A JP S60173595A
Authority
JP
Japan
Prior art keywords
conversation
data
response device
string
conversation response
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP59225656A
Other languages
English (en)
Inventor
ジエフリイ ウイルソン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BAE Systems Electronics Ltd
Original Assignee
Marconi Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Marconi Co Ltd filed Critical Marconi Co Ltd
Publication of JPS60173595A publication Critical patent/JPS60173595A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (1) 発明の技術分野 本発明は、会話応答装置に関するものであり、より詳細
に述べれば、データ処理装置用会話認識装置を提供する
会話応答装置に関するものである。
(2) 従来技術の問題点 特定のユーザーによって会話される文字数字特性を認識
するよう訓練することのできる多種類の会話認識装置が
知られている。
そのような会話認識装置は、特定のプログラム走行を開
始すべく1例えばデータキャラクタストリングのキーボ
ード入力に使用するよう構成された現コンピュータ装置
とは、容易に接続可能になってない。従って、そのよう
な装置を単純な音声人力メツセージに応答させるには。
広範なソフトウェアの変更が必要となる。そのような変
更には、多くの時間と熟練したコンビユータプログラマ
ーによる多大な尽力とが必要とされる。
(3) 発明の目的 本発明の目的は、コンピュータソフトウェアの広範な変
更を必要とせずにコンピュータ装置に音声入力システム
を与えるのに達した会話応答装置を提供することである
(4) 発明の構成 本発明によれば、その動作に際し複数のキーのいずれか
一つを識別するディジタル的に符号化された信号を発生
する型式から成る手動動作可能なキーボード出力と、よ
って発声認識装置を提供するデータ処理装置の入力との
間に挿入する会話応答装置を提供するか、前記装置には
会話されたワードまたはフレーズに関して可聴入力信号
から発生されたディジタル信号をプログラム可能な会話
メツセージデータ記憶装置に保持された。有効ワードま
たはフレーズを特徴づける複数のデータワードと比較し
、もしあれは、どのワードまたはフレーズが発話された
かを判断し、そのように話されたワードまたはフレーズ
が同一であることを確認する信号を変換手段に与える比
較手段を備えてあり、前記変換手段は、前記比較手段か
らのそのような信号に応答して接続されたキーボードの
複数の等価キーS作を特敵づけるデータを第2のプログ
ラム可能なデータ記憶装装置から判断し、かつ前記複数
の等価キー動作を特徴づけるディジタル的に符号化され
たデータ信号のストIJソング信号手段に出力させるよ
うになっている。
本発明による装置は、前記有効ワードの一つの会話スト
リングから成る可聴入力信号に応答して前記会話ストリ
ングの有効ワードの一連の相互依存変換によって前記発
生ストIJソング特徴づける前記データ信号の出力スト
リングが判断されるように構成することができる。会話
ストリングの有効ワード変換の相互依存は、可聴入力に
おける所定の時間幅の無音休止によって少くとも部分的
に判断することができる。また。
更に、会話ストリングの有効ワード変換の相互依存は、
可聴入力における所定のピッチ変化によって少くとも部
分的に判断することができる。
本発明によ゛る装置は、前記データ信号の出力ストリン
グがデータ処理装置から受信された情報によって部分的
に判断されるように構成することができる。
本発明による装置にスイッチング手段を与えて1本発明
による装置が前記スイッチング手段の第1の条件に応答
して上記態様で作動し、かつ前記スイッチング手段の第
2の条件に応答してデータ処理装置およびキーボード間
の直接通信を行なうようにすることもできる。
本発明による装置は、前記スイッチング手段が前記第1
の条件になると本発明による装置によってキャラクタ出
力表示を定めるデータを記憶し、前記スイッチング手段
が前記第2の条件に切り換えられるとデータ処理装置へ
、またはデータ処理装置から、転送された前記データの
正しい記録をキーボードと関連する表示手段に表示させ
るように構成された記憶装置を備えるとともできる。
本発明による会話応答装置を添付の図面を参照しながら
説明するが、以下はほんの一例にすぎないことを理解さ
れたい。
(5)発明の実施例 第1図において、本発明による装置が通常のコンピュー
タ装置1と共に使用されているが。
前記コンピュータ装置には、人間機械インターフェイス
、例えば、可視表示装置兼キーボード2が接続されてい
る。前記可視表示装置2は。
プラグおよびソケットによる接続装置4.4’ を介し
接続線3,6′によって直接接続されて示しであるか、
接続fd5.S’は、離れて位置決めされたコンピュー
タに外部線を介して接続したり、または交換電話回線に
よってそのようにアクセスされつるいずれの遠隔データ
バンクにも接続することができるのが判る。
第2図において、本発明による装置は、接続線5 、5
’ 、マイクロホン6および会話人力制御スイッチ7と
に接続された信号変換装置5から主に構成されている。
信号変換装置5は、モード選択スイッチ装置8を備えて
いるが、前記モード選択スイッチ装置は、以下説明する
如く前記信号変換装置の動作モードを選択するのに用い
られる。前記信号変換装置の簡単な相互接続を可能にす
るため。
可視表示装置2およびコンピュータ装置1のソケット4
′およびプラグ4との各相互接続に対し対応するプラグ
9およびソケット10の構成装置か設けられている。
次に参照する第3図では、信号変換装置5の好適な構成
が図示されているが、そこでは、以下説明するモード選
択か、前記信号変換装置の変換機能から物理的に分離さ
れているので、会話回路コンソール5′を可視表示装置
2に隣接して位置決めすることも可能であり、かつ変換
装置5“をそこから離して位置決めし、データ転送を適
当な相互接続線11によって行なうこともできる。この
場合、モード選択スイッチ装置8゜マイクロホン6およ
び通話人力制御スイッチ7とは、会話回路コンソール5
′に接続されている。
さて、第3図の会話回路コンソール5′と信号変換装置
5′の組み合わせが第2図の信号変換装置5と同じ態様
で機能することを考慮して第4図を参照しながら本発明
による装置の機能について説明してゆく。
前記会話回路コンソール5′にあるモード切り換え装置
8の使用によって、ユーザーは本発明による装置の動作
モードを選択することができる。選択されたモードは、
入力13のマイクロプロセッサ12によって検出され、
前記選択されたモードにより前記マイクロプロセッサは
六つのプログラムの一つに追従する。説明の便宜上1本
発明による装置5の六つの動作モードを。
以下、1)透過、 11)7りa 、 1ll)テキス
ト、1v)訓練。
■)ロードおよびvi)セーブと称す。
ここで、モードスイッチ8は前記会話回路コンソールの
キーボード上の一連のキーでもよいことに注意されたい
。また、マイクロプロセッサ12は、信号変換装置5の
モードを選択する文字数字キャラクタ、および/あるい
は制御キャラクタのストリングを検出するよう構成する
ことができる。後者の場合、マイクロプロセッサ12は
、コンピュータ装置への選択ストリングの転送を抑制す
るようプログラムすることができる。
透過モードでは、マイクロプロセッサ12が電子スイッ
チ装置14にその入力および線15に接続された出力間
の接続を行なわせる。従って可視表示装置2によって接
続線3に出力された信号は、ORゲート16によってコ
ンピュータ装置に接続する接続線3′へと送られる。こ
こで注意したいことは、可視表示装置2がSX信号方式
を用いて作動される場合、すなわち伝送されたキャラク
タが自動的に表示される場合、接続@S上で受信された
キャラクタもスクリーン記憶装置17のラスク走査順に
記憶されることである。但し、この目的は以下に明白と
なる。
機能14および16は、マイクロプロセッサシステムに
組み込むことができるが、必ずしも物理的なスイッチ手
段、またはゲート手段でなくともよい。
可視表示装置2がDX信号方式を用いて作動される場合
、接続線5′を介して戻ってきた信号はスクリーン記憶
装置17で記憶され1通常の態様で表示装置用接続線3
を介して表示装置2に戻される。前記信号モードに拘ら
ず、コンピュータ端末からのデータは、スクリーン記憶
装置17で記憶され、同じ態様で接続線3に伝送される
上記透過モードにおいて、信号変換装置5は。
可視表示装置2およびコンピュータ装置間のデータ転送
に何ら明瞭な影響を及ぼさないことが判る。しかしなが
ら、スクリーン記憶装置17は、常時更新され、他の動
作モードから透過モードへのいずれの転送においても、
マイクロプロセッサ12は、可視表示装置2のスクリー
ンが正しい現データによって書き換えられることを保証
する。
ここで注意することは、透過モードは音声の入力にも用
いられることである。従って、会話人力制御スイッチ7
が作動されると共に信号変換装置5が透過モードになる
と、音声入力からデータ出力への変換か以下説明する態
様で行なわれる。
マクロ、テキストおよび訓練モードは、関連する特定の
コンピュータ装置またはデータバンクに使用する信号変
換装置5をプログラムするのに利用される。これらの三
つの動作の夫々において、マイクロプロセッサ12は、
電子スイッチ装置14によって入力接続線3が接続線1
7を介して前記マイクロプロセッサ12に接続されるよ
うにする。受信されたデータは、接続線5′に出力され
ない。
マクロモードによって、ユーザーは、可視表示装置2の
キーボードを使用して、後で音声入力により選択された
際に、コンピュータに伝送されるべくデータストリング
を入力し、そのようなス) IJソング夫々を送るため
の制約を可能ニスル。例1;l’、[10,0,40,
0,1,0,In2.rORJJ(但し、rORJはキ
ャリッジリターンを表わしており、言わばデフォルトパ
ラメータを定めている)のようなストリングをコンピュ
ータ装置に伝送する必要がある場合、ユーザーはキーボ
ードからこのストリングをマクロモードで入力する。受
信されたストリングは、マイクロプロセッサ12によっ
てデータ記憶装置18で記憶される。
数字文字および/あるいは制御キャラクタのいずれをも
含むことのできるさし当って必要とされるようなストリ
ングの全て、またはそのようなストリングのいずれかが
入力されると、ユーザーによって、テキストモードへと
切り換えられる。
テキストモードにおいて、マイクロプロセッサ12は、
前記ストリングの夫々をデータ記憶装置18から順次可
視表示装置2に伝送させるか、前記可視表示装置によっ
て、ユーザーは。
前記ストリングの夫々を点検し、各ストリングが同一で
あることを確認するのに使用するワードまたはフレーズ
をキーボードから入力することができる。上記の例によ
れば、マイクロプロセッサ12は、前記ストリング[1
0,0,4α0,1.0゜1E6.「CR」」を表示さ
せる。この表示に応答して、ユーザーは「デオルトパラ
メータ」のフレーズでキーを押し、前記ストリングを定
めることができる。
前記パラメータのテキストの定義を完了すると、モード
スイッチ装置8を用いて訓練モードが選択される。この
モードにおいて、マイクロプロセッサ12は可視表示装
置2に先に入力したフレーズの夫々を表示させ、ユーザ
ーは会話人力スイッチ7を作動して前記フレーズをマイ
クロホン6に入力する。マイクロホン6からの入力は、
アナログ/ディジタル変換器19によってディジタルに
変換され、マイクロプロセッサ12によってデータ記憶
装置18の適当なストリングに対して識別装置と共にフ
レーズパラメータ記憶装置20で記憶される。
本発明による装置の新規ユーザーは、訓練モードに切り
換えて、新規マクロス) IJソングたはテキストを再
入力せずに1代わりの対のフレーズパ?メータを与える
こともできるのが判る。
追加のマクロストリングおよび関連するテキストは適当
なモードに切り換えることにより、および新規データス
トリングを入力することにより入力され、現データスト
リングは、関連するテキストまたは訓練入力を変換せず
に変更することができる。
テキストモードでは、マイクロプロセッサ12によって
各テキスト入力が先に記憶された全テキスト入力と比較
され、同一タイトルが二つの異なるデータス) IJソ
ング与えられていないことを保証し、もし与えられてい
る場合は、可視表示装置2に適当なメツセージが送られ
ることに注意されたい。
ロードおよびセーブモードが与えられ、現会話パラメー
タデータおよび/あるいはテキストとストリングデータ
とを信号変換装置5の補助記憶装置(図示せず)、また
は、利用可能ならば、コンピュータ装置の記憶装置のい
ずれかに記憶することもできる。従って1本発明による
装置のユーザーが何人かいる場合、使用完了時に現ユー
ザーか節約モードに切り換えて1例えば「セーブ発声パ
ラメータFred Jまたは「セーブテキストおよび発
声パラメータFred Jを入力し、ロードモードへの
切り換えおよび可視表示装置2のキーボードか「ロード
Fred Jの入力によって後続の終了時限を開始する
際、前記データか呼び出され、ユーザーがただちに発声
入力を開始できるようにすることも可能である。
信号変換装置5をプログラムすると、ユーザーによって
本発明による装置は透過モードに戻され、マイクロプロ
セッサ12かスクリーン記憶装置17に可視表示装置2
の表示(もしあれば)を再構成させる。
さて1発声入力スイッチ7が作動されてフレーズ「デフ
ォルトパラメータ」が話された場色マイクロプロセッサ
12には比較手段が備えられており、アナログ/ディジ
タル変換器19による変換後この入力を記憶装置20に
保持されている会話パラメータと比較する。会話された
フレーズが同一であることが確認できた場合。
マイクロプロセッサ12には変換手段が備えられており
、関連する識別装置を用いてデータ記憶装置18から適
当なデータストIJソング取り出し、前記データを接続
線5′を介してコンピュータ装置またはデータバンクに
伝送する。伝送されたデータストリングも可視表示装置
2に戻される。
会話されたフレーズがマイクロプロセッサ12によって
同一であると確認できない場合、信号変換装置5は、先
にテキストモードで入力されたテキストストリング、ま
たは零ストリングのいずれかを接続線5′によって伝送
するようプログラムすることができる。また、更に、「
無効会話」入力メツセージを可視表示装置2への接続線
3によって伝送することができる。
キャラクタストリングがホストコンピュータから受信し
たキャラクタに関係なく出力されると、ある場合には、
音声命令が承認されるが、スクリーンのフォーマットは
適切に構成されない。よって、キャラクタ出力がホスト
コンピュータからのキャラクタ出力に基づくような装置
が備えられている。適切にフォーマット化されたスクリ
ーンの例は下記の通りである。
プロンプト1型を入力し1次いで、プロンプト2型を待
つ。
マクロストリング出力の次の部分の前でさもなければ入
力テキストがプロンプト前にスクリーンに現われ、ユー
ザーは、満足な画像もキーボード入力に対応する画像も
どちらも見ることができない。
フレーズ入力装置は別として、信号変換装置5は、既知
会話認識装置によって与えられる機能も全て提供しうる
こ吉が判る。従って、ユーザーが1例えばr7J、 r
5J# rIJ# rリターン」を話すと、接続線5′
の出力は「751「CR」」となる。前記信号変換装置
5の会話認識機能は、全て、コンピュータ装置またはデ
ータバンクの再プログラミングを何ら必要とせずに与え
られることに注意されたい。
また、信号変換装#5の機能は、変換装置および市販入
手可能な会話認識装置との組み合わせによって行なわれ
、その機能の幾つかはコンピュータ装置に組み込むこと
ができることも判る。
添付の特許請求の範囲に定められた特徴について、以下
更に詳細に説明する。
添伺の特許請求の範囲に記載した比較手段は。
下記の如く更に詳しく説明することができる。
すなわち1時間間隔をおいて、可聴入力信号スペクトル
の短期ディジタル表示が計算されるが、各表示は、以下
フレームと称す。よって、前記入力は、一つのフレーム
シーケンス I I ・・・・・・fl ・・・・・・fl ・・・・・・f
Nに変換される。但し、各フレームは、その時の可聴入
力信号の短期スペクトルを詳述する。この入力シーケン
ス・・・・・・fl・・・・・・(、I ・・・・・・
(、% ・・・・・・は。
下記形式の有効ワードまたはフレーズの夫々を表わす一
組の「フォーマット(templates) Jと比較
される。すなわち、ワードZ(Wz)は、一つのフレー
ムシーケンス f2−・・・・・・f”NZ として表わされる。
比較手段は、どのシーケンスのワードが前記入力フレー
ムシーケンスを最も適切に説明しているかを判定する。
前記入力フレームを最も適切に説明する前記シーケンス
とは1例えば。
WXW Y・・・WZなどである。J、8.ブリドルお
よびM、D、ブラウン著、1979年11月発行音響学
会秋期会議議事録の「全ワード型使用による接続された
ワードの認識J2528頁を参照されたい。
添付の特許請求の範囲に定めた如く、比較手段によって
変換手段へ信号を与える点を下記に更に詳しく説明する
比較手段からの情報は、同一であると確認されたフォー
マットの夫々に対する下記情報を前記認識処理装置に出
力させる。(ピッチコード)任意。
フォーマットの同一確認、スコア、開始時間。
停止時間、但し後者は、開始時間および時間幅。
または時間幅および停止時間のいずれかとして二者択一
的に符号化することができる。但し。
開始時間および停止時間とは、アルゴリズムによって入
力音声信号には前記の同一であることを確認されたフォ
ーマットが含まれていると判断された時間と、および任
意のピッチコードによって判断された時間に対するピッ
チ輪郭情報が符号化される時間とを言う。
認識情報が出力される時間は不定なので、認識処理装置
は、定められたレートで認識されたフォーマットとして
無音信号を出力し、その結果比較手段は、発声されたフ
レーズの最後に無音に関する情報を受信する。
添付の特許請求の範囲に記載した如く信号手段か一つの
キャラクタストIJソング出力する態様について以下更
に詳しく説明する。
ここで、各型と関連するのは、マクロの定義である。す
なわち、このマクロは、それ自体で他のマクロを呼び出
すことができるが、最も重要なことは、マクロが時間に
よって左右されうろことである。この構成は、以下の点
で非常に重要な装置を提供しつる。すなわち1例えば。
「ワンハンドレッド」と言おうとする場合、しばしばr
IJ rOJ rOJ rキャリッジリターン」を出力
すればよいと思うが、「ワンノ1ンドレツドアンドトウ
エンテイフオー」と言おうとする場合はrIJ r2J
 r4J rキャリッジリターン」を出力すればよいと
思う点である。この装置は。
単一の識別装置を各フォーマットと関連させる既知装置
では実現不可能なので、この場合判ることは。
百と関連する 「100」 二十と関連する 「20」 四と関連する 「4」 と、および「入力」(例えば)と関連する「キャリッジ
リターン」とである。本発明では。
100 204が124を表わしうるばかりでなく。
更に定められたマクロは、全て、プリセット時間内に続
くフォーマットによって抑制される最終ORを含むので
前記ストリングの最後(すなわち。
キーボード上のキャリッジリターンの等価)を表わす追
加ワードの必要がなくなり、従って最後の4が十分な時
間幅の無音に続く場合、キャリッジリターン、またはそ
の他のユーザか定めたキャラクタが出力され、入カス)
 IJソング最後を表わすことができる。
更に、また、前記認識装置はピッチコードを前記処理装
置に送り1次いでピッチ落ちを表わすコードを使用して
、キャリッジリターンを最終ワードに添付すべきである
ことを指示することかできる。
以下、第5図および第6図を参照しながら。
本発明の特徴のより詳細な実施例を説明する。
現在に至るまで会話認識装置は発話されたそのままの言
葉にだけ依存するデータを出力して来た。このために1
22のようなフレーズが発話される場合1問題になる。
ワード「100」に関するテキストか「ワンハンドレッ
ド」であり「20」が「トウニンティ」となっていなけ
れば、該出力データは混乱し、かつ、利用するのか困難
である。
マクロスピーク装置によって1強力な命令セットが存在
して認識されたワードを事後処理し。
次いで有用データを出力する。このデータは、ホストに
対してテキストキャラクタ(制御キャラクタを含む)の
形式、16ビツト出力ポートに対する音声出力メツセー
ジあるいはデータであってよい。
その他の有力な機能も存在して、フロッピディスクから
データをロードし、かつホストからVDUに送られるデ
ータを検討する。
マクロ理論 会話認識装置を外部装置にインタフェースするために(
第5図参照)情報決定がなされなければならない。多く
の用途に対して、必要とされるであろうことのすべては
1発話されたことのそのままの変換である。しかし、外
部装置(照明、モータ等のような)の制御および音声出
力が必要となり得るその他の状態もある。
発話されたことに依存する統語法(シンタックス)なら
びに認識装置の語粟を変える能力もまた非常に強力であ
るが、利用できるマス記憶装置によって語粟の規模を制
限するだけである。
これらの機能を実現するためには、特別のプログラム言
語が必要である。該プログラム区分(セグメント)は、
発話されたことを有用な命令に効果的に拡張するので、
それらはマクロと称される。
102のような観念に対する数値的な出力を発生するた
めに、100,101,102等の各々に対してフォー
マットを特定しなければならないか。
あるいは「ワン」、「ハンドレッド」、「アンド」なら
びに「ツー」をデコードする精巧な先回り制御が必要で
ある(後述の補遺2参照)。
マクロ 下記は、実際に、いかにして、かつ、どのようなデータ
を出力すべきかを知らせるマクロスピーク装置への命令
リストとなっている。一般憾すべでのキャラクタはホス
トコンピュータに直接出力されるが、特定命令に利用さ
れるメタキャラクタも若干ある。
該メタキャラクタはe、&、\および;であるが、セミ
コロンは後続する命令の間に利用される命令区切り符号
であるので、これはユーザーにより限定可能なものとな
っている。
これらのメタキャラクタは、それらlこ続くテキストの
解釈を変えることはできないので、該メタキャラクタを
出力テキストとして直接に利用することはできない。該
メタキャラクタのオペランドか無効である場合、該オペ
ランドちよびメタキャラクタの全体か無視される。
「\」 これは「解釈」キャラクタである。それは。
メタキャラクタがホストに出力されたテキストで利用さ
れることを可能にするためlこ使用される。「\」はど
んな不条理なオペランドも有しておらず、それはただマ
クロスピーク装置が下記のキャラクタと関連するいずれ
の特定の意味をもスイッチオフする。
従って、テキストとして&を出力するために\&か必要
とされる。同様に、他のメタキャラクタとして\Q、\
\および\;が使用されねばならない。
「@」 これは別のマクロからマクロを呼び出すために使用され
る。これによって、若干のフォーマットに共通となって
いるマクロ出力のこれらの区分が1度定義されることだ
けを可能にする。
該使用法は。
@nnrx 例えば、@100r4 inは実行されようとするマクロ番号であって。
Xは該マクロが連続的に実行されるべき回数となってい
る。
用法。
は許容され、そしてマクロnnを1回実行することをデ
フォルトする。
特別の場合。
@nnrO は次のことを予定されている。すなわち、マクロnnを
絶えずあるいは新しいフォーマットが認識されるまで反
復する。
「&」 これは、下記のことがマクロスピーク装置への命令であ
ることを示すために使用される主要キャラクタである。
該命+機能は6つの基本グループlこ分類される。
1)見出し U)並列ポートO/P 111)音声メツセージO/P Iv) 同期 ■)認識装置パラメータ vt) その他 &、n=N 次に来るキャラクタがマクロNを定義&す
 マクロ定義を終結 11)該並列ポートは独自の処理装置を有しており、従
ってマクロは該ポート内に各ビットに対するプログラム
を実際に書込む。この方法でポートはマクロと非同期的
に進行することができ。
従って、認識を延ばしたり、それ以上マクロを処理した
すせずに、それらを絶えず進行させておくことか可能で
ある。
該ポートには16ビツトがある。
マクロによって直接性なわれる命令 &W−N ピッ)Hに対する命+ IJストを書込め。
&、 命令リストを終結せよ &d=HI H2H5H44つの16進数H1・・・H
4で表示される全ビットのためのビットプログラ ムの進行を不動作にせよ。例えば&d −ロ0・05はビット0と2の不動作を意味する。
& e =HI H2H5H44つの16進数で表示さ
れる全ビットのためのビットプログラムの進 ・ □ 行を作動せよ。
&急−HIH2H3H44つの16進数で表示される全
ビットを同期させよ(すなわち、プロ グラムカウンタをその開始にリセット せよ)。
ポートビットプログラム制御 &十 出力チャンネルにオンせよ &−出力チャンネルをオフせよ &t=T Tミリ秒の時間遅延 &5=HIH2H5H4上記参照□ & d =HI H2H51(4上記参照& e −H
I H2H5H4上記参照&W=N 上記参照 &、 上記参照 ソフトウェアによって行なわれる場合、ビットにつき1
つの命令だけが、基本レベルループパスについて実行さ
れる。&W・・・&、は1つの命令とじて分類されるこ
とに注目されたい。
注* : H1H2y+su4は4キヤラクタの16進
数を表わす。
1it) &V=N 音声メツセージNを出方せよlv
) &h=[ストリング、」 特定キャラクタストリン
グかホストから受信される までマクロ内のこの点で停止せ よ(ホストプログラムと同期さ せるために1例えば、タイプア ヘッドが問題となり得るような 場合)。
&h=ON 並列出力チャネルビットNはその命+ I
Jストを実行することを 止めるまでマクロにおけるこの 点で停止せよ。 パ′ &h=V 全音声メツセージが終了するまで停止せよ V) &x=Oテキスト登録簿(ダイレフトリ)を消去
せよ &x=N (N−0)フォーマットNに対するトレーニ
ングテキスト入力を作成 せよ &y=0 統語法登録簿を消去せよ &y−N (N=0)ノードNに対する統語法を作成せ
よ &z−0フォーマット登録簿を消去せよ&z=N (N
−0)フォーマットNを作成せよ&す 終結キャラクタ vi)&x 制御 Xをホストに送信せよ&p−T マ
クロの処理を継続する前に。
認識されたフォーマットのT秒 の休止を検査せよ。T秒あるい はそれ以上の休止が見つからな い場合、マクロを終了せよ(102 の作成その他にとって有用であ る補遺2参照のこと)。
&I=ファイル名 フロッピディスクからファイル「フ
ァイル名」をロード せよ &t=T Tミリ秒の時間遅延 &n−N フォーマットが認識されたノードがNである
かどうかを知るた めに検査せよ。そうである場合 はマクロの処理を継続し、そう でない場合はマクロを終了せよ。
&c=N 次のフォーマット識別をNと比較せよ。それ
がNである場合は マクロを継続せよ、そうでない 場合は終了せよ(該フォーマツ ト終了無声を超過する休止が発 生する場合、偽結果か発生して 該マグロは終了する)。
&f 認識されたフォーマットリスト の次のフォーマットを無視せよ −この次に来るフォーマットが すでに処理されている場合、 &C と共に使用するために。
&i ホストとVDUの間のデータ伝送をRIMせよ一
命◆がス) IJソン グ作成をトリガする場合、&h =「ストリング」と共に利用さ れる。戻ったストIJングを抜か さないようにするために、 &i は該トリガキャラクタの前に送 信されるべきである。
注意:メタキャラクタ命令が使用される場合。
先行の文科圧キャラクタ(デフォルト−;)は省略する
ことができる。
4R話マクロインタフェース マクロスビークは1話者により訓練された装置であるの
で、認識しようとするワードまたはフレーズは定義され
ねばならない。各会話単位はフォーマットとして周知で
ある。マクロ番号は各フォーマットに関連するので、フ
ォーマットが認識される場合、該番号のマクロが実行さ
れる。
補遺1 マクロ機能 \ (文字通りに)解釈せよ @nnrx マクロnnをX回実行せよerln マク
ロnnを1回実行せよ &&&& 見出しをファイルせよ &1箇1 ファイル終了 &す 一般的終結(マクロおよび認識装置パラメータの
) &十 出力チャンネルをオンせよ※ &−出力チャンネルをオフせよ※ &、 ポート命令リストを終結せよ &X キャラクタ制御X &c=N 次のフォーマット認識=Nであればマクロを
継続せよ & d =HI H2H5H4表示された出力ポート命
令リストを不動作にせよ & e =HI H2H5H4表示された出力ポート命
令リストを作動せよ &f 認識されたフォーマットリストにおける次のテン
プレートを無視せ ト &h=「ストリング」 特定ストリングがホストから受
信されるまでマクロを停止 せよ &h=ON 出力チャンネルNが実行を停止するまでマ
クロを停止せよ &h=V 全での音声メツセージが送信されるまでマク
ロを停止せよ &量 ホストのVDUへの伝送を遮断せよ&l−ファイ
ル名 フロッピディスクから「ファイル名」をロードせ
よ &m = N 下記のキャラクタはNを定義する&n=
N フォーマットが認識されたノードがNであればマク
ロを継続せよ。
&p−T T秒以上の休止が現フォーマットと次との間
にあればマクロを継続 せよ &、−HIH2H5H4表示された出力チャンネルを同
期化せよ &t=T T ミ!J秒の時間遅延を設けよ&v=N 
音声メツセージNを出力せよ&w=N 出力ポートピッ
l−Nに対する命令 ゛リストを書込め &X−N N = 0 テキスト登録簿を消去せよ N<〉0 フォーマットN用の練習 テキストを作成せよ &y−N N = 0 統語法登録簿を消去せよN〈〉
0 ノードN用の統語法を作 成せよ &z=N N = Oフォーマット登録簿を消去せよ N<〉0 フォーマットNを作成せ よ 東 ボート命’> IJストにおいてのみ利用可能HI
H2H3H4−4ビツト16進数 補遺2 「102Jデコード 会話 ワン ハンドレッド アンド トウー 第6図参照 発話されたことを判断するために、ワード間の休止(あ
るいはワードの欠落)を利用しなければならない。
第6図では、102と122の間の判断は「アンド」の
段で行なわれねばならず、従って1次のフォーマット命
令の比較&c−Nが必要である。
次のフォーマットがこの現サイクルで処理されているの
で「&f」もまた必要とされる。
例えば。
フォーマット番号 ワード 100 ハンドレッド 50 アンド 20トウニンテイ 2トウー 1 ワン この例では、0.6秒の休止が限界として仮定される マクロ1 1;&p=α6;1をプリントアウトせよ2次;&φ 
いて話者が話すことを止めて も、なお復帰改行する マクロ2 2 ;&p=Q、6 ; マクロ1に同じ;&ナ マクロ20 2;す=0.6;0 20か22かの判断がなされな;
&す ければならない すなわち「トウニンティ」が 「トウー」であるのか「トウ ー」、「ゼロ」であるのか マクロ100 &p=0.6:00 100がディジットの最後の部;
&す 分である場合のみ別のキャラ クタが必要になる マクロ50 @105;@106;&φ マクロ105と106を実
行せよ(各1度づつ) マクロ105 &c=2;02「トウー」が「アンド」の後;&f :
&φ に発話された場合、。2を出力することが必要で
あり、「ト ウー」のフォーマットが関係 しているので、&fが使用され て「トウー」を認識されたフ オーマツトリストから除去す る。
マクロ106 &c=20;&f : @20 :&す 「トウニンテ
ィ」が発話された場合、これを処理す るに必要な判断はマクロ20 の下になされるのでこれが呼 出される。該「トウニンティ」 フォーマット識別はマクロ20 を呼出す前に認識フォーマツ トリスト(RTLI8T)から除去 されねばならないことに注目 せよ。それは、該マクロ20 はこの点で完全に処理されて おり、かつ、それはRTL I 8 Tでより下位に保
持されたデー タを必要とするからである。
これらのマグロは下記の法則を履行する。
one 1 two 2 twenty 20 one hundred 100 two hundred 200 one hundred and one 101on
e hundred and two 102one 
hundred and twenty one 12
1one hundred and twenty t
wo 122two hundred and two
 202two hundred and twent
y 220two hundred and twen
ty one 221第1図は本発明による装置を使用
することのできる通常のコンピュータ装置のブロック図
であり、第2図および第5図は本発明による二つの異な
る別個の発声応答装置の使用に適した第1図のコンピュ
ータ装置の夫々のブロック図であり、第4図は第2図の
発声応答装置を更に詳細に示すブロック図であり、第5
図は本発明による装置を示す別のブロック図であり、か
つ第6図は第5図の装置の特徴を示すフローチャートで
ある。
図中、1は通常のコンピュータ装置、2は可視表示装置
兼キーボード、5.S’は接続線、4.4’はプラグソ
ケット接続装置、5は信号変換装置。
5′は発声回路コンソール、5#は信号変換装置。
6はマイクロホン、7は発声入力制御スイッチ、8はモ
ード選択スイッチ装置、9はプラグ、10はソケット、
12はマイクロプロセッサ% 13は入力、14は電子
スイッチ、16はORゲート、17はスクリーン記憶装
置、18はデータ記憶装置、19はアナログ/ディジタ
ル変換器。
20はフレーズパラメータ記憶装置、を夫々示す。
手 続 補 市 書(方式) 昭和60年 3月13日 特許庁長官 志 賀 学 殴 特願昭59−225656号・ 2 発明の名称 会話応答装置 3 補正をずろ者 事件との関係 特許出願人 名称す・ツーコニ カンパニー リミテッド4代理人 住所 〒100東京都千代田区丸の内2丁目4番1号丸
ノ内ビルヂンゲ 752区 (発送日 昭和60年 2月26日)

Claims (1)

  1. 【特許請求の範囲】 1、 複数のキーのいずれか1つをそれを作動すること
    によって特徴づけるディジタル符号化信号を発生する種
    類の手動で操作可能なキーボード(2)の出力とデータ
    処理装置の入力との間に挿入されて会話認識を行なう会
    話応答装置において。 発話されたワードまたはフレーズに関するオーディオ入
    力信号から発生されたディジタル信号を、あらかじめプ
    ログラム可能な会話メツセージデータ記憶装置■に保持
    し、有効なワードあるいはフレーズを特徴づける複数の
    データワードと比較し、かつもしあれば、該ワードある
    いはフレーズのいずれが発話されたかを判断しさらにそ
    のように発話されたワードあるいはフレーズを識別する
    信号を変換装置に与える比較装置を備え。 前記変換装置は前記比較装置からそのような信号に応答
    して、第2のあらかじめプログラム可能なデータ記憶製
    蓋(ハ)から結合キーボードの複数の同等なキー操作を
    特徴づけるデータを判定しさらに、信号装置に該複数の
    同等なキー操作を特徴づけているディジタル符号化デー
    タ信号のストリングを出力させる。ことを特徴とする前
    記会話応答装置。 2、特許請求の範囲第1項記載の会話応答装置において
    1発話された有効なワードのストIJソングら・成る音
    声入力信号に応答する該発話されたストリングの有効ワ
    ードについての一連の相互依存的変換によって、該発話
    されたストリングを特徴づけるデータ信号の前記出力ス
    トリングを決定することを特徴とする前記会話応答装置
    。 五 特許請求の範囲第2項記載の会話応答装置において
    1発話されたストリングの有効ツー下の変換の相互依存
    性は、音声入力における所定の持続時間を有する無声の
    休止によって少なくとも部分的に決定されることを特徴
    とする前記会話応答装置。 4、 %許請求の範囲第2項あるいは第3項記載の会話
    応答装置において1発話されたストIJソング有効ワー
    ドの変換の相互依存性は、音声入力におけるピッチの変
    化によって少なくとも部分的に決定されることを特徴と
    する前記会話応答装置。 5、 前述の特許請求の範囲のいずれの項に記載の会話
    応答装置において、データ信号の前記出力ストリングは
    、データ処理装置から受信した情報によって部分的に決
    定されることを特徴とする前記会話応答装置。 & 前記特許請求の範囲のいずれの項に記載の会話応答
    装置において、スイッチ装置(7)が設けられており1
    本会話応答装置は該スイッチ装置の第1条件ζこ応答し
    て前述の態様で作動し、かつ、前記スイッチ装置の第2
    条件に応答して。 結合データ操作装置と結合キーボードの間の直接通信を
    可能にすることを特徴とする前記会話応答装置。 2、特許請求の範囲第6項に記載の会話応答装置におい
    て、スイッチ装置(7)が前記第1条件にある場合記憶
    装置0のは本会話応答装置によって出力されたキャラク
    タの表現を定義するデータを記憶するよう構成されてお
    り、よって前記スイッチ装置が前記第2条件にスイッチ
    される場合本会話応答装置は結合キーボードに関連する
    表示装置に、結合データ操作装置へあるいはそれから転
    送されたデータの正確な記録を表示させることを特徴と
    する前記会話応答装置。 8、 前記特許請求の範囲のいずれの項に記載の会話応
    答装置は、変換装置が結合キーボードに関して遠方に位
    置され得るように電気的に相互接続された会話人力装置
    (6′)ならびに変換装置(5“)を備えていることを
    特徴とする前記会話応答装置。 9 前記特許請求の範囲のいずれの項に記載の会話応答
    装置において1選択装置は結合キーボードからの所定の
    文字数字式ストリングおよび/または制御キャラクタに
    応答して、2つのデータ記憶装置かあらかじめプログラ
    ムされ得る本会話応答装置の作動モードを選択すること
    を特徴とする前記会話応答装置。 10、特許請求の範囲第9項記載の会話応答装置におい
    て、前記選択装置はそのように受信されたいずれの選択
    ストIJソング結合コンピュータへの送信をも禁止する
    ように構成されていることを特徴とする前記会話応答装
    置。 11、前記特許請求の範囲のいずれの項ζこ記載の会話
    応答装置において、該装置もまた発話された文字数字式
    キャラクタおよび/または制御ワードに応答して、いず
    れのそのような発話キャラクタを識別するディジタル符
    号化データ信号をも結合データ処理装置に転送すること
    を特徴とする前記会話応答装置。 12、特許請求の範囲第8項記載の会話応答装置におい
    て前記変換装置は結合データ処理装置として動作するこ
    とのできるコンピュータ装置の一部となっていることを
    特徴とする前記会話応答装置。
JP59225656A 1983-10-26 1984-10-26 会話応答装置 Pending JPS60173595A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
GB8328638 1983-10-26
GB8328638 1983-10-26

Publications (1)

Publication Number Publication Date
JPS60173595A true JPS60173595A (ja) 1985-09-06

Family

ID=10550773

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59225656A Pending JPS60173595A (ja) 1983-10-26 1984-10-26 会話応答装置

Country Status (4)

Country Link
JP (1) JPS60173595A (ja)
DE (1) DE3438333A1 (ja)
FR (1) FR2554267B1 (ja)
GB (2) GB8412424D0 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NL8502959A (nl) * 1985-08-26 1987-03-16 Lely Nv C Van Der Electronisch apparaat reagerend op geluid.
CA2088080C (en) * 1992-04-02 1997-10-07 Enrico Luigi Bocchieri Automatic speech recognizer
NZ250812A (en) * 1993-02-27 1996-09-25 Alcatel Australia Voice controlled data memory and input/output card
DE4306199A1 (de) * 1993-02-27 1994-09-01 Sel Alcatel Ag Tragbares Sprachmodul
GB9416463D0 (en) * 1994-08-15 1994-10-05 Farrington Jonathan S Sound control device
KR20020064888A (ko) * 1999-10-22 2002-08-10 액티브스카이 인코포레이티드 객체 지향형 비디오 시스템

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS571012A (en) * 1980-05-26 1982-01-06 Kohoku Seikou Kk Packing method using extensible film
JPS5887597A (ja) * 1981-11-19 1983-05-25 松下電器産業株式会社 カナ文字入力装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4088981A (en) * 1975-11-12 1978-05-09 Citibank N.A. Automated data entry and display system
JPS6042485B2 (ja) * 1980-02-04 1985-09-24 カシオ計算機株式会社 デ−タ入力確認方式
JPS56114041A (en) * 1980-02-12 1981-09-08 Toshiba Corp Producing device of voice input document
JPS58195957A (ja) * 1982-05-11 1983-11-15 Casio Comput Co Ltd 音声によるプログラム実行方式

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS571012A (en) * 1980-05-26 1982-01-06 Kohoku Seikou Kk Packing method using extensible film
JPS5887597A (ja) * 1981-11-19 1983-05-25 松下電器産業株式会社 カナ文字入力装置

Also Published As

Publication number Publication date
FR2554267A1 (fr) 1985-05-03
FR2554267B1 (fr) 1986-08-29
GB8425373D0 (en) 1984-11-14
DE3438333A1 (de) 1985-05-09
GB2149172B (en) 1986-11-26
GB8412424D0 (en) 1984-06-20
GB2149172A (en) 1985-06-05

Similar Documents

Publication Publication Date Title
JP3662780B2 (ja) 自然言語を用いた対話システム
JP4574390B2 (ja) 音声認識方法
US6801897B2 (en) Method of providing concise forms of natural commands
KR101066741B1 (ko) 컴퓨터 시스템과 동적으로 상호작용하기 위한 컴퓨터 구현 방법, 시스템, 및 컴퓨터 판독가능 기록 매체
US7260529B1 (en) Command insertion system and method for voice recognition applications
US4348550A (en) Spoken word controlled automatic dialer
US20020123894A1 (en) Processing speech recognition errors in an embedded speech recognition system
JPS58195957A (ja) 音声によるプログラム実行方式
WO1999063425A1 (fr) Procede et appareil de traitement d'informations et support de fourniture d'informations
USRE32012E (en) Spoken word controlled automatic dialer
JP2000035795A (ja) 音声認識におけるノンインタラクティブ方式のエンロ―ルメント
US6934682B2 (en) Processing speech recognition errors in an embedded speech recognition system
US20080177542A1 (en) Voice Recognition Program
JP2000305924A (ja) 数字キーによる漢字入力方法及びその装置
JPS59176836A (ja) 音声入力デ−タ処理システム
JPS60173595A (ja) 会話応答装置
JP3468572B2 (ja) 対話処理装置
JPH08248987A (ja) 音声認識方法
JP2002156996A (ja) 音声認識装置、認識結果修正方法及び記録媒体
JP2003202890A5 (ja)
KR102574311B1 (ko) 음성 합성 서비스를 제공하는 장치, 단말기 및 방법
JPH064264A (ja) 音声入出力システム
JP7511623B2 (ja) 情報処理装置、情報処理システム、情報処理方法及びプログラム
WO2023139770A1 (ja) 文法作成支援装置、及びコンピュータが読み取り可能な記憶媒体
JP2001042883A (ja) テキスト音声合成装置