JPS6386660A - ワークステーシヨン - Google Patents

ワークステーシヨン

Info

Publication number
JPS6386660A
JPS6386660A JP61230071A JP23007186A JPS6386660A JP S6386660 A JPS6386660 A JP S6386660A JP 61230071 A JP61230071 A JP 61230071A JP 23007186 A JP23007186 A JP 23007186A JP S6386660 A JPS6386660 A JP S6386660A
Authority
JP
Japan
Prior art keywords
information
section
image
data
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61230071A
Other languages
English (en)
Inventor
Norimasa Nomura
典正 野村
Hiroshi Matsuura
博 松浦
Tsuneo Nitta
恒雄 新田
Shigetoshi Saito
成利 斉藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP61230071A priority Critical patent/JPS6386660A/ja
Publication of JPS6386660A publication Critical patent/JPS6386660A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の目的] (産業上の利用分野) 本発明はデータベースに蓄積された情報を電話回線を介
して容易に検索することのできるワークステーションに
関する。
(従来の技術) 情報処理技術の発達にけって、種々の情報処理機能を備
えたワークステーションが開発され、オフィス業務等に
幅広く導入されている。
さてこの種のワークステーショが持っ重認な機能の1つ
に、種々の情報をデータベース化して情報蓄積し、必要
に応じて検索出力する機能がある。
例えば住所録や人事録、スケジュール等をそれぞれのり
レーションとしてデータベースに登録しておき、入力さ
れた検索情報(例えばキーワード)に従って目的とする
情報を速やかに検索抽出することが行われる。
ところで上記データベースの検索は、一般的にはそのワ
ークステーションに設けられた操作部や、通信ネットワ
ークを介して該ワークステーションに接続された情報処
理端末を操作して行われる。
この為、ワークステーションの設置場所や情報処理端末
が設けられている場所でしか上記データベースに蓄積さ
れた情報を検索することができなかった。換言すれば、
例えば情報通信手段として身近な電話を利用して、任意
の場所から簡易にデータベースを検索することができな
い等の問題があった。
(発明が解決しようとする問題点) このように従来にあってはワークステーションの利用範
囲に大きな制約を受けており、データベースに蓄積され
た情報の幅広い有効利用を図る上で問題があった。
本発明はこのような事情を考慮してなされたもので、そ
の目的とするところは、情報通信手段として身近な電話
を有効に利用して任意の場所から容品にデータベースを
検索することを可能とし、しかもデータベースから検索
抽出した情報の確実な伝達を可能とするワークステーシ
ョンを提供することにある。
[発明の構成] (問題点を解決するための手段) 本発明は第1図にその概念を示すように、電話回線を介
して音声入力された検索情報を音声認識し、認識された
検索情報に従って、例えば住所等の情報を求め、その検
索情報(住所)を音声合成して前記電話回線を介して出
力する。そしてこの音声合成されて出力された情報が不
満足なものである場合には、例えば他のメディアを介し
て検索情報の出力が可能であるか否かを判定し、例えば
上記検索情報(住所)に関して地図のイメージデータが
ある場合には、このイメージデータ(地図)をファクシ
ミリにて送信出力するようにしたものである。
つまり音声合成されて出力された情報が不満足な場合に
は、その情報伝達のメディアを代えて、例えばイメージ
として情報出力するようにしたものである。
(作用) 本発明によれば、電話を介して検索情報を入力すること
によってその電話音声が認識処理されてデータベースの
検索が行われる。そしてデータベースから検索抽出され
た情報が音声合成され上記電話を介して出力される。従
って電話と云う身近な情報通信手段を用い、且つ音声に
より簡易にデータベースに対する情報検索を行い得る。
しかもこの合成音声による情報出力が不満足な場合には
、情報出力が可能な他のメディアが調べられ、そのメデ
ィアを介して情報の出力が行われる。
従ってデータベースから検索抽出される情報を、その情
報検索者が理解し易い形態で確実に伝達することか可能
となり、電話回線を介する情報検索の確実化を図ること
が可能となる。
(実施例) 以下、図面を参照して本発明の実施例につき説明する。
第2図は本発明の実施例に係る知的ワークステーション
の概略構成図である。この知的ワークステーションは、
以下の各部を備えて構成される。
バス1 ;以下に説明する各部の間ので必要な情報転送
を行なう為に用いられる。
制御部2 ;マイクロプロセッサを主体として)、構成
され、該知的ワークステーションの各部の動作をそれぞ
れ制御するものである。
イメージ人力装置3 ;カメラやスキャナ、OCR等か
らなり、各種のイメージ情報を人力する。
位置座標入力装置4;タブレットやマウス等からなり、
指定された位置座標情報を人力する。
音声入力部5 ;マイクロフォン等により構成され、音
声情報を入力する。
キーボード部6 ;複数のキーを備え、文字・記号コー
ドや制御コード等を入力する為のものである。
ICカード部7 ;後述するようにICカードが装着さ
れ、該ICカードとの間で必要な情報を入出力するもの
である。
バスコントローラ8 ;バスlを介する各部間の情報転
送を制御する。
音声出力部9 ;スピーカ等からなり、音声情報を出力
する。
ディスプレイ部10.cRTディスプレイや液晶ディス
プレイ等からなり、文字−図形・画像等を表示する。
イメージ出力装置11.FAXやカラープリンタ等から
なり、種々のイメージ情報をプリント出力する。
通信装置12.13;該ワークステーションと電話機、
或いは遠隔地に設置された他のワークステーションや端
末等との情報通信を行なう。
切換え装置14;複数の通信装置を切換え使用する。
タイマ一部15;該ワークステーションに時刻情報や時
間情報を提供する。
暗号化処理部16;種々の情報を暗号化処理する。
音声照合部17;与えられた音声情報が特定の音声であ
るか否かを照合処理する。
イメージ照合部18;与えられたイメージ情報が特定の
イメージであるか否かを照合処理する。
音声認識部19;与えられた音声情報を認識処理する。
音り分析部20;音声入力部5等から入力された音声の
特徴を抽出する等して該音声を分析処理する。
文字認識部21;前記イメージ入力装置3等から入力さ
れた文字・記号パターンを認識処理する。
イメージ認識部23;前記イメージ人力装置3等から人
力された図形イメージ等を認識処理する。
出力形態選択部24;該ワークステーションから出力す
る情報の形態を選択制御する。
作業環境データ収集部25;該ワークステーショの機能
状態や、それによるオフィス内の作業環境等の情報を収
集入力する。
音声合成部26;処理データに従って合成音声を生成す
る。
イメージ合成部27;複数のイメージ情報を合成処理し
たり、処理データに従ってイメージの編集処理を実行す
る。
図形合成処理部28;種々の図形を合成処理したり、処
理データに従って図形の加入・削除等の編集処理を実行
する。
音声の圧縮・伸長部29;音声データを圧縮符号化した
り、圧縮された音声データの復元伸長を行なう。
イメージの圧縮・伸長部30;イメージ・データを圧縮
符号化したり、圧縮されたイメージ・データの復元伸長
を行なう。
信号処理部31:種々の信号情報の符号化圧縮やその復
元伸長、必要な情報の付加等の一連の信号処理を実行す
る。
データベース部32;種々の情報を複数のリレーション
にそれぞれ分類し、データベースとして蓄積する。尚、
このデータベースはコード情報のみならず、イメージや
音声等としても構築される。
本発明に係る知的ワークステーションは、基本的には上
述した各部を備えて構成され、上述した各部がそれぞれ
が持つ機能を宵効に利用して全体的にインテリジェンス
な機能を呈するものとなっている。
次に前述したキーボード部5等のように一般的ではなく
、この知的ワークステーションにおいて特徴的な機能を
呈するICカード部7や暗号化処理部16等について更
に詳しく説明する。
先ずICカードは、例えば第3図に示すように名刺大の
大きさのカード本体Ta内にマイクロプロセッサやメモ
リ回路等の半導体回路を内蔵し、カードの一端部に、上
述した構成の知的ワークステーション本体に接続する為
のインターフェース部7b、および表示窓部7cを設け
て構成される。
尚、表示窓部7cは透明偏光体を埋め込んで形成される
もので、その位置はインターフェース部7bや半導体回
路と乗置しない位置に設定される。またカード本体7a
は、上記表示窓部7cに対応する部分のみが透明であっ
ても良く、またその基板全体が透明なものであっても良
い。
しかしてICカードは、具体的には第4図にその分解斜
視図を示すように、一対のカバー基板7(1゜7e、こ
れらのカバー基板7d、 7eに挾持される埋め込み基
板7「、コアシート材7g1プリント基板7hを一体的
に熱圧着して構成される。
このプリント基板7hの前記インターフェース部7bに
対向する位置には入出力端子7Iが設けられ、また表示
窓部7cに対向する位置には液晶表示装置7jが設けら
れる。更にはプリント基板7hには半導体集積回路7k
が設けられる。またカバー基板ICには前記プリント基
板7hにおける発熱を発散する為の金属箔7mが設けら
れる。
尚、カバー基板7d、 7cや埋め込み基板7r1コア
シート材7gにそれぞれ穿たれた孔部はプリント基板7
hに集積された半導体集積回路7j等にそれぞれ対向す
る位置に設けられたものである。これらの孔部に上記半
導体集積回路7に等を嵌合させて前記カバー基板7d、
 7e、埋め込み基板7r1コアシート材7g、プリン
ト基板7hが積層一体化されてICカードが構成される
。そして入出力端子71は、カバー基板7dに穿たれた
孔部を介して露出し、ワークステーション本体に電気的
に接続されるインターフェース部7bを構成する。
尚、前記液晶表示装置7jは、例えば第5図にプリント
基板7に部の断面構造を示すように、スペーサを介して
設けられた一対のポリエーテルサルフォンフィルム基板
の間に液晶層を挟持し、該フィルム基板の内側面に透明
導電膜をそれぞれ形成すると共に、下面側のフィルム基
板に偏光体や反射体を設けて構成される。このようにポ
リエーテルサルフォンフィルム基板を用いて液晶表示装
置7jを構成すれば、その厚みを0.6p以下゛にする
ことも容易であり、ガラス基板を用いて液晶表示装置を
構成する場合に比較してICカード自体を薄くすること
ができる。
またこのICカードの駆動電源については、前記インタ
ーフェース部7bを介してワークステーション本体側か
ら供給するようにしても良いが、カード内に内蔵するよ
うにしても良い。この場合には、例えば高分子フィルム
を用いたシート状の電池として組込むようにすれば良い
しかして前記半導体集積回路7には、例えば第6図に示
すようにCPU7pやデータメモリであるPROM7q
、E2 PROM7r、およびこれらのメモリに対する
選択部78等を備えて構成される。
PROM7qは消去・書替え不可能な大容ごの不揮発性
メモリであり、前記CPU7pに対する制御プログラム
や、永久記録すべき情報等を格納している。またE2F
ROM7rは書替え可能な小容量の不揮発性メモリであ
り、例えば情報の取引番号や、情報通番等の使用時に更
新される情報が格納される。
これらのメモリは前記選択部7sの制御により選択的に
駆動され、前記CPU7pとの間で情報の入出力を行な
う。CPU71)はこれらのメモリを用いて必要な情報
処理を実行し、またそのインターフェース部から前述し
た端子部7Iを介して知的ワークステーション本体との
間で情報の人出力を行なう。
前記ICカード部7は、このようなICカードを装青し
、該ICカードとの間で情報の人出力を行なうことにな
る。
尚、ICカードは上述した構成に限定されるものでない
ことは勿論のことであり、その構成に応じてICカード
部7が構成されることも云うまでもない。
次に暗号化処理部1Bについて説明する。
暗号化処理部1Bは、例えば第7図に示すように暗号化
部16a1復号化部16b1秘密鍵ファイル部16c、
公開鍵ファイル部16d、そして鍵更新部IGcを備え
て構成される。
そして第8図にその概念を示すように、与えられた通信
原文を暗号鍵に従って暗号化してその暗号通信文を生成
したり、また逆に与えられた暗号通信文を暗号鍵に従っ
て復号してその原文を求める処理を実行する。
秘密鍵ファイル部18cおよび公開鍵ファイル部16 
dはこの暗号・復号化に用いられる鍵を記憶するもので
あり、鍵更新部leeはこれらのファイルされた鍵の更
新を司る。
ここで秘密鍵は、この暗号化処理部16を所々するワー
クステーションのみが知る鍵であり、他のワークステー
ション等に対しては秘密にされる。
これに対して公開鍵は各ワークステーションに設定され
た各秘密鍵とそれぞれ対をなすものであり、他のワーク
ステーションにそれぞれ与えられて公開される。公開鍵
ファイル部1[idは、これらの複数のワークステーシ
ョンがそれぞれ公開した公開鍵を、各ワークステーショ
ンに対応して記憶するものである。
暗号化部leaは第9図に示すように、RSA処理部1
fliiと暗号化種別付加部18jとを備えて構成され
る。そして通信原文を暗号化して情報通信しようとする
とき、その通信相手先のワークステーションが公開した
公開鍵を用いて通信原文を暗号化し、その暗号通信文に
暗号の種別を示す情報を付加して通信情報を作成し、こ
れを通信するものとなっている。尚、暗号の種別の情報
は、例えば“0”で暗号化していないこと、また“1″
で暗号化していることを示す情報や、暗号方式を示す情
報等からなる。
また復号化部113bは、自己ワークステーションが公
開した公開鍵を用いて成るワークステーションが暗号化
して通信してきた暗号通信文を人力し、これを該秘密鍵
に対応した秘密鍵を用いて復号化するものであり、第1
0図に示すように暗号文分割部!6に1暗号種別判定部
18m 、切換え部fen。
1apSRSA処理部16qを備えて構成される。
暗号文分割部16には、前述したフォーマットで通信さ
れてきた通信情報を前述した暗号種別の情報と暗号化通
信文とに分割するものであり、暗号種別判定部161B
は該暗号種別情報からその通信文が暗号化されているか
否かを判別している。そして暗号化されていない場合に
はその通信文を切換え部18n、18pを介して出力し
、暗号化されている場合にはその通信文をR3A処理部
1[iqに導いている。このRSA処理部16qにて前
記秘密鍵を用いて暗号化通信文が復号化処理され、切換
え部16pを介して出力される。
尚、R3A処理部1B1,16qは、例えば第11図に
示すようにブロック分割部18sとべき乗・剰余計算部
let 、およびブロック連結部16uとを備えて構成
される。
ここでブロック分割部16sは与えられた信号系列を一
定の長さのブロックM1に分割するものであり、べき乗
・剰余計算部16tは各ブロックM。
毎に暗号化の鍵kを用いて N  −M   (modn) I なる信号系列Niを求めている。但し、nは固定の値で
ある。この信号系列N1がブロック連結部1[iuを介
して順に連結されて出力される。
暗号化処理にあっては、上記信号系列M1が通信原文で
あり、この通信原文から暗号化された通信文が信号系列
N、とじて求められる。また復号化処理にあってはI−
記信号系列〜1.が暗号化通信文であり、この暗号化通
信文から復号化された通信原文が信号系列N、とじて求
められる。
このような暗号化・復号化を担うakが前述した公開鍵
と秘密鍵であり、これらは対をなして設定される。
従ってワークステーションは、他のワークステーション
から公開された公開鍵に従って通信情報をそれぞれ暗号
化することはできるが、その暗号化された通信文を復号
化し得るのは、その公開鍵と対をなす秘密鍵を知り得る
特定のワークステーションだけとなる。
従って成る情報を暗号化して通信しようとするワークス
テーションは、通信相手先のワークステーションが公開
した公開鍵に従って該通信原文を暗号化して通信する。
そしてその通信情報は、秘密鍵を持つ通信相手先のワー
クステーションのみが復号し得るものとなっている。
尚、他のワークステーションがそれぞれ公開した公開鍵
の全てを公開鍵ファイル16dに格納しておく必要はな
い。例えばシステムに対して別に設けられた公開鍵ファ
イル・メモリに、各ワークスチージョンが公開した公開
鍵を各ワークステーションに対応されてファイルしてお
く。そして情報通信が必要となったとき、その通信相手
先の公開鍵を上記公開鍵ファイル・メモリから読出して
自己のワークステーションの公開鍵ファイル部1Gに格
納するようにしても良い。
以上が暗号化処理部1Bの基本的な構成とその機能であ
る。
次にイメージ照合部18について説明する。
このイメージ照合部18は、前記イメージ人力装置3か
ら人力されたイメージ情報、例えば個人の顔のイメージ
を人力し、その個人同定を行なうものである。
第12図はこのイメージ照合部の概略構成を示すもので
、L8aはイメージ記憶部、tabは正規化回路、18
cは2値化(細線化)回路、18dは特徴データ抽出回
路である。また 18eはイメージデータを記憶したデ
ータ記憶部であり、181’は検索回路、18gは照合
回路、そして 18hは出力部である。
イメージ記憶部18aは前記イメージ入力装置3を介し
て入力されたイメージ情報を記憶し、そのイメージ照合
処理に供するものである。このイメージ記憶部tgaに
記憶されたイメージ情報に対して正規化回路18bは正
規化処理し、また2値化回路18cは2値化処理する。
具体的には、ここでは個人の顔のイメージからその個人
同定を行なうべく、正規化回路18bはその顔の大きさ
を正規化している。°この正規化された顔のイメージに
対して2値化回路18cは、例えばエツジ線分検出、そ
のエツジ線分の細線化処理等を行なって該イメージの2
値画像を求めている。
特徴データ抽出回路18dは、このようにして1F規化
・2値化されたイメージ情報からその特徴データを抽出
するものである。即ち、顔のイメージによる照合、処理
にあっては、例えば第13図に示すように顔の輪郭を1
つの特徴として抽出し、更にそのイメージ中の目、鼻、
口等の特徴を抽出している。具体的には、顔の輪郭的特
徴を分類されたコード情報として、また両眼間の距離1
10の大きさm1目と口との距mn等を数値データとし
てそのイメージの特徴として抽出している。
しかしてデータ記憶部18cには、予め各個人について
求められた顔のイメージの特徴データが、例えば第14
図に示すように登録されている。即ち、各個人毎にその
個人名を識別名として上述した顔のイメージの特徴デー
タが登録され、且つその顔のイメージ・データがポイン
タによって結ばれている。
検索回路181’は前記特徴データ抽出回路ladにて
抽出された特徴データに基いて該データ記憶部18cを
検索している。そしてその検索データは照合回路18g
に与えられ、前記特徴データ抽出回路18dで求められ
た特徴データと照合処理されている。
この照合処理は、例えば特徴データ抽出回路18dで求
められた入力イメージの特徴データをX 1 (iは特
徴の種別)、データ記ta部18aに登録されているイ
メージの特徴データをYlとしたとき D−Σ  IX、−Y、1 なる演算を行い、その演算結果りの値が最も小さいもの
を、その個人として同定することによって行われる。こ
の同定結果が出力部18bを介し、て出力される。
イメージ照合部18は、基本的にはこのようにして人力
イメージを照合処理し、例えば該人力イメージの個人同
定等を行なう。
次に音声認識部19について説明する。
音声認識部19は、例えば第15図に示すように構成さ
れる。音声入力回路19aは、前記音声人力部5から入
力された音声信号、または公衆電話回線を介して前記通
信装置12. Hにて受1λされた音声信号を入力する
もので、この入力音声信号を適当な信号レベルに増幅す
る増幅器や、帯域制限用のバンドパスフィルタおよびA
/D変換器等によって構成される。入力音声はこの音声
入力回路19aにて、例えば30〜3400Hzの周波
数帯域の信号に制限され、12 k Hzのサンプリン
グ周期で12ビットのディジタル信号に量子化される。
音響処理部19bは、例えば専用のハードウェアにより
構成された積和回路からなる。そして基本的には前記音
7!1入力回路19aと同期してバイブライン的に高速
動作する。
ここでの音響処理は、2種のバンドパスフィルタ群によ
り実行される。その1つは16チヤンネルのフィルタバ
ンクで、このフィルタバンクを介して人力音声信号のス
ペクトルの変化が抽出される。
今1つは、同じ帯域を4チヤンネルに分割したグロスフ
ィルタであり、このグロスフィルタを介して人力音声の
音響的特徴が抽出される。
これらの2種類のフィルタ群(フィルタバンクとグロス
フィルタ)は、例えば4次巡回形のディジタルフィルタ
として構成される。そして、例えばlomsOe毎にそ
のフィルタリング出力を求めるものとなっている。尚、
この音響処理部の制御はマイクロプログラム方式にて行
われる。
しかして前処理・認識部19cは、高速プロセッサ19
d 、パターンマッチング処理部19e1単語辞書メモ
リ19r1およびバッファメモリ19gによって構成さ
れる。
バッファメモリ19gは上記音響処理部19bにてフィ
ルタリング処理された音声伝号を人力し、例えば最大1
.8秒分の音声データを蓄積するものとなっている。高
速プロセッサ19dはこのバッファメモリ19gに格納
されたデータに対して、音声区間検出、リサンプリング
、ラベリング、遷移ネットワークによる認識処理、およ
びその総合論理判定処理の実行を行なっている。またこ
の高速プロセッサ19dにより、ホスト計算機との間の
通信や該音声認識部19全体の動作制御が行われる。
この高速プロセッサ19dにて処理された音声データに
ついて、パターンマツチング処理部19cは単語辞書メ
モリ19[’に登録された単語音パjの(型車パターン
データとの間で複合類似瓜計算等のマツチング処理を実
行し、その認識候補を求めている。
例えば認識対象となる音声単語は離散的に発声される。
そこで高速プロセッサ19dは、例えば音響処理の際に
lon+scc毎に計算される人力音声エネルギを用い
て111語音声の入力区間を検出している。
具体的には第16図に示すように、背景雑音レベルと人
力音声レベルとから適応的に計算される閾値E。を用い
、入力音声信号レベルが上記閾値Eoを一定時間以上継
続して越えたとき、該閾値Eoを越えた時点を音生単語
の始端Sとして検出している。その後、上記入力音声信
号のレベルが上記閾値E。を一定時間以上継続して下回
ったとき、該閾値E。を下回った時点を音声単語の終端
Eとして検出している。
ところで音声認識はパターン認識の一種として考え得る
。しかし音声特有のパターン変動や、話者の性別・発声
器官の形状・発声法等に起因する個人差、また話者自身
が発生する雑音や周囲環墳の雑音、更には電話音声の場
合には公衆電話回線を経由したことによるレベル差や雑
音の問題がある。この為、これらを考慮し、−上述した
変動要素を吸収して、如何に精度良く、安定に音声認識
するかが問題となる。
そこでこの前処理・認識部19cではパターンマツチン
グ法と構造解析法とを2段階に組合せ、ハイブリッド構
造マツチング法と称される認識法を採用している。
即ち、上述したように単語音声区間が検出されると、先
ずその音声区間(S、E)を15等分し、その16点を
それぞれリサンプル点とする。そして前述した如く音響
処理された16チヤンネルの音声データ(スペクトル時
系列)から−に記名リサンプル点でのスペクトルを抽出
する。尚、音声データのサンプル点と1−記リサンプル
点との間でずれがある場合には、リサンプル点の最近傍
点のスペクトルを抽出すれば良い。
このリサンプル処理によってtex 18 (=  2
56)次元の音声パターン・ベクトルXを求める。即ち
、第j  (j −1,2,3,〜16)番目のりサン
プル点を「、とするとき、r、での16チヤンネルのス
ベクj                 3トルデー
タを S(、)真(S、S、〜S  、) r J      lrJ、  2rJ、   16r
Jとしてそれぞれ求め、これらのS 、を並べ換えIr
、+ て X−(S    S    −S   −S     
)tIrl、   Ir2.    2rl、    
 16rlBなる音声パターンのベクトルXを求める。
但し、tは行列の転置を示す。
このようにして求められた入力音声パターンベクトルX
と、単語辞書メモリ19f’に予め登録された単語音声
の標準パターンとの類似度が、例えば複合類似度法によ
って計算される。
ここで単語辞書メモリ19f’に予め登録された単語音
声の標準パターンは、その単語カテゴリωkについて、 (ψ  ψ  〜ψLk) 1に′ 2に’ (λ  λ  〜λ ) 1に’  2に’   Lk 但し、 (λ ≧λ ≧〜≧λLk) 1k   2に として準備されている。尚、ψ  λ はカテゴ、に’
  、に りωkに属するパターンベクトルXの分散行列Kにおけ
る固有ベクトルとその固宜値である。このような単語辞
書について、上述した複合類似度S (k)は として計算される。尚、上式においてII X IIは
ベクトルXのノルムである。
このような複合類似度計算が全てのカテゴリについてそ
れぞれ行われ、上位に位置する類似度値と、それを得た
カテゴリ名とが対にして求められる。
このような複合類似度法によるパターンマツチングによ
って、多くのパターン鹿動を救出した認識処理が可能と
なる。しかし類似パターンや雑音が加わったパターンで
は、異なるカテゴリ間でその類似度値の差が小さくなる
ことがある。
そこで前述したようにパターンマツチング法を補うもの
として、以下の構造解析の手法を導入している。この構
造解析は、単語音声を構成する音の違いに着目して認識
処理するもので、音素ラベル系列と音響的特徴系列の2
つの時系列を利用している。
即ち、音素ラベル系列は、入力音声信号から10m5e
c毎に計算される16チヤンネルのスペクトルを用いて
音素辞書との類似度を計算し、一定値以上の類似度を持
つ音素のラベル付けして求める。尚、この音素ラベルは
、例えば5つの母音と鼻音との6種類からなる。この際
、音素辞書は、男声と女声に分けてそれぞれ’f=(i
tしておく方が望ましい。
ここで比較的安定に発音される母音に比べ、子音を音素
として個々にラベル付けすることが困難である。従って
その子音についてはその音響的な特徴をラベル付けし、
これを特徴情報とする。具体的には、音響処理で求めら
れる4チヤンネルのグロスフィルタの出力と音声エネル
ギとから音響的特徴を抽出する。このようにして特徴抽
出されてラベル付けされる音響的特徴は、例えば第17
図にグロスフィルタの出力の特徴と対比して示すように
、無音性、無声性、摩擦性、破裂性、エネルギ・ディッ
プ笠の12種類からなる。
しかして入力音由について求められた音素・音響ラベル
系列は、前記音声区間(S、E)を含む範囲に亙って、
各単語カテゴリ毎に作られた、例えば第18図に示す如
き遷移ネットワークに人力される。
この遷移ネットワークの各ノード毎に、指定された音素
ラベルや音響的特・徴の有無をチェックする。そして無
であればリジェクト、宵であれば次のノードに遷移させ
、その特徴系列が終了した時点で遷移ネットワークのゴ
ールに到達した人力系列を受理し、そのカテゴリを求め
る。尚、系列のチェックの方向は、ネットワーク毎にそ
の正逆を選択可能なものである。
総合判定論理は、前述した如くパターンマツチングによ
って順序付けられた候補カテゴリと、遷移ネットワーク
により求められた認識結果とを総合して、その最終判定
を行なうロジックである。
即ち、この総合判定論理は、パターンマツチングで求め
られた最大類似度を81としたとき、これを所定の閾値
θと比較する。そして(Slくθ)の場合、これを雑音
としてリジェクトする。
また(S1≧θ)の場合には、別の閾値Δθを用いて(
Sl−Δθ)以」−の類似度を持つカテゴリを候補とし
て抽出する。そしてその抽出されたカテゴリの数nが1
つである場合、これを認識結果として抽出する。また複
数のカテゴリが抽出された場合には、前記遷移ネットワ
ークによる解再結果を参照し、遷移ネットワークで受理
されたカテゴリのみを抽出する。そしてその中で最大の
類似度を持つカテゴリを認識結果として求める。
尚、閾値処理によって抽出されたカテゴリの中に、遷移
ネットワークで受理されたものが含まれない場合には、
判定不能とする。
以上のようにして複合類似度法によるパターン認識処理
手続と、遷移ネットワークを用いた認識結果とを統合し
てその人力単語音声の認識が行われる。
第19図はこの音声認識部における単語音声の認識処理
手続きの流れを示すもので、音声区間検出処理の後、リ
サンプル処理してパターンマツチングを行い、同時にラ
ベリング処理して遷移ネットワークによるチェックを行
い、しかる後、これらの各認識結果を統合してその総合
判定論理処理を行なうことが示される。このような処理
が前記高速プロセッサ19dによる処理シーケンスの下
で実行される。
ところで離散的に発声された単語音声ではなく、連続発
声された音由中の単語を認識する場合には次のようにす
れば良い。即ち、この場合には入力音声を種々の部分区
間に分割し、その部分区間毎に単語識別を行なってrl
jl類語度を求めるようにすれば良い。
具体的には、例えば第20図に示すように人力音声区間
における全ての分析フレーム間をそれぞれ部分区間の境
界候補とし、該入力音声区間をiυ数の部分区間に分け
る。この、際、認識対象となる単語の継続時間長につい
ては最大時間長D  とl1dx 最小時間長D 、が設定できるので、その範囲内fll
n の部分区間だけを認識処理対果とすれば良い。
ここで第20図に示す例では、連続発声された音声の単
語数が2個の場合を想定して2つの部分区間を求めてい
る。しかし一般的には人力音声の単語数は不明であるか
ら、2単語からn単語までが単語候補として存在すると
仮定して部分区間をそれぞれ検出すれば良い。そして検
出された各部分区間について単語類似度の計算を行い、
その類似度結果の繋がり関係を相互に比較して最も信頼
性の高い部分区間の境界を求め、その境界によつ゛ て
区切られた部分区間の各Il1語認識結果を求めるよう
にすれば良い。
然し乍ら、このようにして部分区間を求めて用語類似度
計算を行なう場合、部分区間の数が膨大なものとなる為
、処理の高速化が妨げられる。従って実際的には処理の
高速化を考慮して、例えば入力単語数が2〜5単語、1
単語の継続時間長が128〜64011sec、 1回
の発声における単語長の比が2.5以下、フレーム周期
は16m5ec (8isec周期で2個に1個の単語
を取出す)等の制限を加えて部分区間を検出するように
すれは良い。
このようにすれば連続発声された音声中の単語をそれぞ
れ効果的に認識することがnl能となる。
ところでこのような音声認識処理に供される辞書(単語
辞−Pr)の学習は次のようにして行われる。
この学習処理は、■母音パターンおよび子音パターンか
らその特性核を求める処理と、■その特性核に対する同
角゛値と固有ベクトルを求める処理とに大別される。そ
してこの固有値と同角゛ベクトルとを、その固有値の大
きいものから順にN測水める。この処理は一般にKL展
開と称されるものである。
先ず、特性核を求める処理について説明すると、入力音
声パターン(学習パターン)の特性核には、その学習パ
ターンの縦ベクトルをS としたとき、次のようにして
求められる。
ここに、 5−(S    S    −3)L m    ml’  m2’   a+n尚、この学習
パターンS は、子音パターンの場合には64次元の縦
ベクトルとして与えられる。
また母音パターンの場合には16次元の縦ベクトルとし
て与えられる。
しかして特性核には、m個の学習パターンについて、そ
の縦ベクトルS と、この縦ベクトルロ S を転置した横ベクトルS とを掛合わせて作1ff
l 成される行列の各成分を、上記m個の学習パターンに亙
って平均化して求められる。従って特性核の要素数は上
記ベクトルの要素数の2乗となる。
尚、このような処理によってそのカテゴl夕のパターン
分布を反映した特性核Kを得るには、成る程度のほの学
習パターンを必要とする。この為、学習パターン・メモ
リにrめ所定数の学習パターンを蓄積しておくことが必
要となる。
ところが母音の場合には16次元で最低6個のカテゴリ
の学習パターンを準備するだけで良いが、子音の場合に
は +01カテゴリも存在し、しかも64次元のデータ
として求める必要がある。この為、このままでは膨大な
メモリ容量を必要とすることが否めない。
そこで少数の学習パターンによってパターン分布を反映
した特性核Kを得るべく、次のような特性核の更新処理
を行い、逐次計算によってその特性核を次第にパターン
分布を反映した形に改良して行くようにする。
即ち、 K−に’+wSS  1     n なる演算処理を繰返し実行するようにする。但し、Wは
特性核の更新時における重み係数である。この重み係数
Wは正負の値を取り、正ならば特性核行列の入カバター
ンに対する類似度を大きくし、逆に負ならば上記類似度
を小さくする作用を呈する。
またに′はS なる学習パターンを学習する前の特性核
を示しており、Kは学習パターンS の学習によって更
新された特性核を示している。
しかる後、このようにして求められた特性核に対して、
その固有値と固をベクトルを求める処理が行われ、この
固有値と固有ベクトルとに基いて前述した複合類似度計
算に用いられる標準パターンが作成される。
標弗パターンは、上記特性核をKL展開することによっ
て求められるものであり、例えばへき東方によるKL展
開によってその標弗パターンが求められる。
今、特性核Kが固有値λ 、λ2.〜λ を持I   
           n ち、これに対応する固有ベクトルξ 、ξ 、〜ξ を
持つものとする。この場合、その任意ベクトルU は、
上記固有ベクトルξ 、ξ2.〜l ξ の線形結合して ua−Σ αI ξI i−1 として表わされる。このとき、 Kξ・−仙ξi なる関係が成立することから、 一゛°゛゛−Σ α・ λ・  ξ1 +=1 1 1 となる。
ここで ・・・・・・    〉 1 λ   (1λ  1〉
1λ21〉 n [λ、/λ1] > 1   (1−2,3,〜、n)
であるから、Sが十分大きくなると上式の第2項がOに
収束することになる。
故に前述した式を KSu  −a  λ S o    11   ξ1 と石像すことができる。
このことは、(K”+1u)と(K”u)との比が固有
値λ1であることを示している。また(K8u)は固有
ベクトルξ1に比例していることが示される。
ところでこのような理論に基く演算過1■にあっでは、
その演算途中結果が直ぐにスケールアウトするすること
が多い。そこでU を任意の、例えば単位ベクトルとし
、 V     鳳 Ku sol        s u     −(v     )/(b     )s
ol       sol         S+1(
s−0,L2.・・・) なる演算を実行するようにする。ここで(b   )s
ol は、ベクトル(V   )の絶対値が最大の要素でso
l ある。このとき、 =(v   )/(b   ) usol    sol     5o1=(Ku)/
(b   ) s      sol ? −(Kv  )/(b   −b  )s      
sol    s ? S+亀 −(K  、u  )/(b   ・・・・・・b )
o      sol     s となることから、これよりλ 、b  、ξ 。
l   sol   1 ’ solを求めることが可能となる。
このようにしてその絶対値が最大の固有値λ1と固釘ベ
クトルξ とを求めたら、次に同様にしてその絶対値が
次に大きい固有値λ2と固有ベクトルξ2とを求める。
ここで K’  −に−λ1 ξl ξ1 を考えると、 ξ 1ξ1−0(I−2,3,〜、n)より、 K′ ξ −にξ −λ ξ ξ   ξ1一λ ξ 
−λ1 ξ1−0(i−t)に′ ξ −にξ −λ 
ξ、ξ、t ξ。
1    1   1++    1 −仙ξ+      (i≠l) となる。従って−に記に′は、 1λ21〉・・・〉1〜1〉・・・〉1λ。l>0なる
固q値を持つことがわかる。尚、ここではξlは正規化
されているとしている。
このような処理は、前記特性核を K’  −に−λ1ξ・ξ として変換したに′に対して、上述した処理を繰返し実
行することによって達せられる。この処理によって絶対
値の大きい固有値とそれに対応する固有ベクトルが順に
求められ、辞書の学習が行われる。
第21図はこのような計算アルゴリズムに基いて実行さ
れる辞書の学習処理の手続きを示すものである。
次に文字認識部21について説明する。
この文字認識部21は、スキャナ等によって読取られた
文字を認識する第1の文字認識ブロックと、タブレット
等を介してオンライン入力される文字情報を認識する第
2の文字認識プロ・ツクとによって構成される。
二の第1の文字認識ブロックは、例えば第22図に示す
ように、スキャナ等によって読取り入力された画像デー
タを格納する画像メモリ21aと、この画像メモリ21
aに格納された画像データ中から認識対象とする文字が
記載された領域を検出する領域検出部21b、この領域
検出結果に従って前記画像メモリ21aに格納された画
像データ中から認識対象とする文字データを抽出する文
字抽出部21c1そして標準パターン辞書21dに予め
登録された認識対象文字の各標準文字パターンと、上記
文字抽出部21cにて抽出された文字ノくターンとを個
々に照合して文字認識する識別部210とによって構成
される。
この文字認識ブロックは、例えば第23図に示すように
FAX送信原稿用紙211’上の所定の位置に設定され
、送信宛先が記入される文字枠21gに記載された文字
を認識するものである。このような送信宛先が記載され
る原稿用紙21f’は、送信原稿が複数枚からなる場合
、その一番最初(1枚[])の原稿として用いられる。
そしてこの1枚目の原稿の読取り人力された画像データ
が文字認識処理の為に前記画像メモリ21aに蓄積され
る。
領域検出部21bは、予め定められているFAX送信原
稿用紙21rのフォーマット情報から前記文字枠21g
の位置情報を得、認1対象とする文字が記載される領域
を検出するものである。文字抽出部21cはこの領域検
出情報と、その画像情報の射影パターンの情報とを用い
て、例えば第24図に示すように前記文字枠21gに記
載された文字の画像データを個々に抽出している。
識別部21eは、例えば特公昭49−12778号公報
等に開示されるように、抽出された文字画像からその文
字パターンの特徴を抽出し、その抽出した文字パターン
と標準パターン辞書21dに登録された各文字の標章パ
ターンとをパターンマツチングしている。そしてこのパ
ターンマツチングによって照合の取れた標準パターンの
文字カテゴリをその認識結果として求めている。
尚、パターンマツチングの手法は種々変形できることは
云うまでもない。
ところでタブレット等を介してオンライン入力される文
字情報を認識する第2の文字認識ブロックは、例えば第
25図に示すように構成される。
この第2の文字認識ブロックは、タブレット等を介して
オンライン入力される文字の筆記ストロークを示す位置
座標の系列を順次検出する座標検出回路21hを備えて
いる。
この座標検出回路21hにて検出された位置座標の時系
列データは前処理回路211に入力され、前記タブレッ
ト4における検出ご;り等の微小な雑音が除去された後
、座標系列記憶回路21jに順に記憶され、文字認識処
理に供される。尚、この前処理回路21iにて、例えば
1文字分の文字が人力されたとき、その文字の大きさの
正規化処理等が行われる。
また画数検出回路21には、例えば筆記ストロークの途
切れ(位置座標データの時系列の区切り)から、その文
字パターンの筆記ストローク数、つまり画数を検出して
いる。
しかして認識処理部21mは、前記画数の情報に従って
標準特徴パターンメモリ2inに登録された認識対象文
字カテゴリの標準パターンの中から、該当する画数の標
準パターンを選択的に抽出している。そしてこの標準パ
ターンの各ストロークの特徴と座標系列記憶回路21j
に記憶された人力文字パターンのストロークの特徴とを
相互に比較(マツチング処理)でいる。答決定回路21
pはそのマツチング処理結果を判定し、人力文字パター
ンのストロークの特徴に該当するストロークを持つ認識
対象文字カテゴリを、その認識結果とし、て求めている
つまりオンライン入力され、る文字パターンの筆記スト
ロークの特徴に従って、そのストロークの特徴を標準文
字パターンのストロークの特徴とマツチング処理して上
記入力文字パターンを認識するものとなっている。
尚、ストロークの特徴としては、筆記ストロークを折線
近似したときの端点や交点、折点等の位置座標の情報を
用いるようにすれば良い。
以上のような機能を備えた文字認識部21によって、ス
キャナ等を介して読取り入力された文字情報や、タブレ
ット等の位置座標人力装置を介してオンライン人力され
る文字情報がそれぞれ文字認識される。
次に図形認識部22について説明する。
この図形認識部22は、例えば第26図に示すように構
成される。入力部22aは、例えば撮像人力された図形
画像を記憶し、図形認識処理に供する。
輪郭追跡部22bは、例えば線分の追跡方向を第27図
に示すように8方向に分け、入力画像中の図形の輪郭を
追跡したときにその追跡方向がどの向きであるかを順に
求めている。具体的には、例えば第28図に示すように
三角形の図形を右回りに追跡し、その追跡の向きの情報
を、例えばr 1,2.〜2,3,4.〜4.5,7.
〜7」なる方向コードの系列として求めている。
セグメンテーション部22cは、このようにして求めら
れる方向コードの系列から、例えばその曲りの部分等の
特異点を抽出し、この特異点に従って該図形の輪郭を段
数の特徴部分に分割している。
マツチング部22dはこのようにしてセグメンテーショ
ンされた図形輪郭の情報と、辞書メモリ22eに登録さ
れている各種図形の特徴情報とをマツチング処理して入
力図形を認識するものとなっている。
例えば第29図に示す図形が与えられた場合には、その
輪郭追跡によって求められる方向コードの系列から、例
えば相互に隣接する3つの輪郭点(1−1) 、 (i
) 、 (ill)で方向コードの和を順に求め、これ
をその中央の輪郭点iにおける方向コードとして平滑化
処理する。この甲府化処理によってノイズ成分の除去を
行なう。
しかる後、セグメンテーション部22cにて輪郭の特徴
点である端点、つまり曲りが急峻な点を検出し、その端
点を中心としてその輪郭を分割する。
そしてその分割された輪郭部分毎に辞書メモリ22cと
照合し、その認識結果を求める。
以−1の処理によって、第30図に例示するように丸図
形は端点が存在しないこと、三角図形は端点が3つ検出
されること、四角図形は端点が4つ検出されること等か
ら、これらの図形がそれぞれ識別認識される。この際、
上記各端点がそれぞれ凸状であることや、端点を結ぶ輪
郭が直線・曲線である等の情報を図形識別に利用しても
良い。
これに対してイメージ認識部23は次のように構成され
る。
第31図はこのイメージ認識部23の概略構成を示すも
ので、原画画像メモリ23a 、 2値化装置23b1
処理画像メモリ23c1細線化装置23d1そしてコー
ド変換装置23cによって構成される。
画像メモリ23aは与えられた認識対象イメージ画像を
記憶するもので、2値化装置23bはこれを2値化処理
して画像メモリ23cに格納している。
この2値化レベルは、例えば2値化画像をディスプレイ
モニタしながら可変設定される。
しかして細線化装置23dは2値化されたイメージ画像
を細線化処理してそのイメージを線図形化するものであ
る。この細線化処理されたイメージ画像によって前記画
像メモリ23cが古註えられて認識処理に供される。
コード変換装置23cは、例えば第32図に示すように
構成され、先ずセグメント分割部23fにて上記細線化
画像を段数のセグメントに分割している。このセグメン
トの分割は、例えば線図形をその端点や分岐点、交点に
て分割することによって行われる。曲率変換部23gは
このようにして分割された段数のセグメントについて、
それぞれその曲率を求めている。
直線・曲線分割部23h3曲線分割部23i、l1if
折点分割部23j、および変曲点分割部23hは、−1
一連した如く分割された各セグメントを、その曲率の情
報に従って更に分割するもので、これらによって屈折点
や直線と曲線との切替わり点、変曲点、曲線における半
径変化点等がそれぞれ検出される。このようなセグメン
ト分割と特徴点検出によって前記イメージ線図形を構成
する各部の情報がそれぞれ抽出される。
近似情報作成部23nは、これらの分割されたセグメン
トおよびそのセグメント中の特徴点の情報を総合して前
記イメージ図形を表現する情報、例えば各セグメントの
始点および終点の位置座標、およびそのセグメントの種
別を特定するコード情報を得る。
例えば入力イメージ画像が第33図(a)に示す如く与
えられた場合、その入力画像中のイメージ線図形23n
を細線化して抽出し、同図(b)に示すようにセグメン
ト分割する。この例では、円図形と四角図形とが直線に
よって所謂串刺しにされたイメージ線図形23nが入力
されている。しかしてこのイメージ線図形23nは、第
33図(b)に示すようにその交点で分割され、2つの
1円と2つのコの字状図形、および4つの直線にセグメ
ント化される。
曲率変換部23gは、第34図に示すようにセグメント
分割された各セグメントの曲率を求めており、前記直線
・曲線分割部23h1曲線分割部231.屈折点分割部
23j、および変曲点分割部23hはその曲率変化点か
ら各セグメントの特徴点を検出している。具体的には第
34図(a)に示す例では2つの直線の屈折点における
曲率が急峻に増大することから、その曲率の変化から屈
折点を検出することが可能となる。また第34図(b)
に示す例では直線から曲線への変化部分で曲率の変化が
検出されるので、この曲率の変化からその特徴点を検出
することができる。
同様にして第34図(c)(d)に示す例でも、その曲
率の変化点から、そのセグメントにおける特徴点を検出
することが可能となる。
このようにしてイメージ認1部23では、与えられたイ
メージ図形をセグメント化し、各セグメントの特徴点を
検出している。そして該イメージ線図形を段数のセグメ
ントの各種別を示すコード情報とその位;4座標として
近似表現して認識するものとなっている。
さて音声照合部17は次のように構成されている。
この音声照合部17は、音声入力した話者を個人認識(
個人同定)するものであり、例えば第35図に示すよう
に構成される。
即ち、音声入力部17aを介して与えられる音声は、音
韻フィルタ17bおよび個人用フィルタ17cにてそれ
ぞれフィルタリングされ、その音声特徴が抽出される。
音韻フィルタ17bの複数のチャンネルの各帯域は、例
えば第36図(a)に示すように音声周波数帯域を等分
割して設定されている。
このようなフィルタ特性を備えた音韻フィルタ17bに
よって人力音声の音韻特徴を示す特徴パラメータが抽出
される。尚、各チャンネルの帯域幅を、音声周波数帯域
を対数関数的に分割設定したものとしても良い。
これに対して個人用フィルタ17cの複数のチャンネル
の各帯域幅は、第36図(b)に示すように音声周波数
帯域を指数関数的に分割して設定されている。このよう
なフィルタ特性を備えた個人用フィルタ17cによって
、前記人力音声の低域から中域にかけての音声特徴が、
高域側の特徴に比較して多く抽出されるようになってい
る。そしてこれらの各チャンネルのフィルタ出力が個人
照合用の特徴パラメータとして求められている。
しかして単語認識部17dは、前記音韻フィルタ17b
を介して求められた音韻特徴パラメータから、その入力
音声が示す単語を単語辞@17cを参照して認識するも
のである。この単語認識の機能は前述した音声認識部1
9と同様であり、該音声認識部19の機能をそのまま利
用するようにしても良い。
そしてこの+1を語認識結果に従って個人辞N 17r
の個人照合に供される辞書が選択される。この個人辞J
 17f’は、話者照合の対象とする個人が予め発声し
た特定の+1を語の前記個人用フィルタ17cによる分
析結果を、その単語毎に分類して登録したものである。
しかして話者照合部17gは、個人辞書17fから選択
された該当単語の各特徴パラメータと、前記個人用辞書
17cにて求められた入力音声の特徴パラメータとの類
似度を計算し、その類似度値を所定の閾値でそれぞれ弁
別している。そしてそれらの弁別結果を相互に比較して
、例えば類似度値が最も高く、次に高い類似度値との差
が十分にある特徴パラメータを得た個人カテゴリを該入
力音声の発声者であるとして個人同定している。
ここで個人用フィルタ17cの特性について史に詳しく
説明すると、前述したように音韻特徴フィルタ+7bと
は異なる特性に設定されている。この音声の個人性の識
別性について考察してみると、その識別性は、例えば F比−(個人間分散)/(個人内分数)として与えられ
るF比によって評価することができる。
今、音韻フィルタ17bに設定されたフィルタ特性の各
チャンネル出力のF比について検討すると、第37図に
実線で示す指数関数的な傾向を示す。
これ故、従来では専ら高域側の音声特徴情報を利用して
個人照合を行なっている。
しかし音声の高域側の特徴だけを用いるよりも、全周波
数帯域の音声特徴を用いて個人同定が可能であれば、そ
の照合精度が更に向−1−すると考えられる。即ち、全
周波数帯域においてF比の値か1以1−となり、個人間
分散が個人内分数を1−同れば、更に精度の高い個人照
合が可能となる。
そこでここでは、前述したように個人用フィルタtyc
の特性を指数関数的に定め、個人性の特徴が顕著である
高域側については大雑把に特徴抽出し、低域側のチャン
ネル割当て数を増やすことによって該低域側の一音声特
徴を細かく抽出するようにしている。
具体的には各チャンネルのF比の変化が指数関数的な傾
向を示すことから、低域側チャンネルの帯域幅に比較し
て高域側チャンネルの帯域幅を指数関数的に増大させた
フィルタバンクを構成し、これを個人用フィルタ17c
としている。
このように構成されたフィルタ17cの各チャンネル出
力によれば、そのF比は第37図に破線で示すようにな
り、中域でのF比の大幅な向上が認められる。この結果
、高域側の音声特徴のみならず、中域における音声特徴
をも積極的に利用して個人照合を行なうことが可能とな
り、その照合精度の向上を図ることが可能となる。
即ち、この音生照合部17では、入力音用の単語認識に
供する特徴とは別に、フィルタバンクの工夫によりその
個人性が顕著に現われる特徴情報を抽出している。この
結果、入力音声に対する音韻認識とは独立にその話者に
対する個人同定、つまり個人照合を高精度に行なうもの
となっている。
次に音声合成部2Gについて説明する。
音声合成部26は、第38図に示すように判別器26a
、復号器26b、規則パラメータ生成装置26c、およ
び音声合成器26dを備えて構成される。
判別器28aは人力されたコード列が文字列であるか、
或いは音声合成の為の分析パラメータを示す符号列かを
判定するものである。この情報判別は、例えば入力コー
ド列の一番最初に付加された識別情報を判定することに
よって行われる。そして分析パラメータであると判定し
た場合には、その符号列を復号器26bに与え、これを
復号処理してその音韻パラメータと韻律パラメータとを
それぞれ求めている。
また文字列と判定した場合には、その文字列データを規
則合成パラメータ生成装置26cに与え、その音韻パラ
メータと韻律パラメータとの生成に供している。
音声合成器28dは、このようにして復号器26bまた
は規則合成パラメータ生成装置28cにて求められた音
韻パラメータと韻律パラメータとに従い、音源波を声道
近似フィルタを介して処理して合成音声波を生成してい
る。
ここで規則合成パラメータ生成装置28cについて更に
説明すると、該装置28cは第39図に示す如く構成さ
れている。文字列解析部26eは言語辞書26を参照し
て入力文字列中の単語を個々に同定し、その単語につい
てのアクセント情報や単語・文節境界、品詞・活用等の
文法情報を求めている。
そしてこの解析結果に対して音韻規則、および韻律規則
がそれぞれ適用され、その制御情報が生成される。
ここで音韻規則は、解析された単語の読みの情報を与え
ると共に、単語の連接によって生じる連濁や無声化等の
現象を実現し、その音韻記号列を生成するものである。
音声パラメータ生成部28gはこの音韻記号列を入力し
、その音節単位に従ってC■ファイル26hから音節パ
ラメータを順次求めて補間結合している。この音声パラ
メータ生成部26gにて上記音韻記号列から音韻パラメ
ータ系列が生成される。
また韻律規則は、単語・文節境界等の文法情報に従って
発話の境界や息継ぎ位置を決定し、各音の継続時間長や
ポーズ長等を決定するものである。
同時にこの韻律規則により、各単語の基本アクセントを
ベースとし、文節アクセントを考慮した韻律記号列が生
成される。韻律パラメータ生成部261はこの韻律記号
列を入力し、ピッチの時間変化パターンを表わす韻律パ
ラメータ列を生成している。
一方、人力コード列が音声合成の為の分析パラメータを
示す符号列である場合、前記復号器2Bbは次のように
機能している。
即ち、分析パラメータの符号列がCVファイルのケプス
トラム係数を示す場合、その符号列26mは一般に第4
0図に示すようにパラメータP(ピッチ)とC、C、〜
C(ケプストラム係数)o   1    m に対してビット割当てがなされて情報圧縮されている。
そこで復号器28bではパラメータ変換テーブル28n
を用い、上記情報圧縮された分析パラメータを音声合成
器28dに合せたビット数に変換・復号している。例え
ば各パラメータをそれぞれ8ビツトに変換し、音韻パラ
メータ列(ケプストラム係数)とその韻律パラメータ列
(ピッチ)とをそれぞれ求めている。
音声合成器28dは、例えば第41図に示すように有声
音源26qと無声音源(M系列発生器)26rとを備え
、入力される韻律パラメータ列のピッチデータPに従っ
て有声音源波(P≠0)、または無声音源波(P−0)
を選択的に発生している。
この音源波は前置増幅器28sに人力され、前記音韻パ
ラメータのケプストラム係数Cに応じてしベル制御され
て対数振幅近似ディジタルフィルタ26tに入力される
。この対数振幅近似ディジタルフィルタ28tは前記音
韻パラメータのケプストラム係数C、〜Cに従って声道
特性を近似する11M 共振回路を構成し、上記音源波をフィルタリング処理す
るものである。この対数振幅近似ディジタルフィルタ2
8tにて前記音韻パラメータおよび韻律パラメータで示
される音声データが合成出力される。
そして対数振幅近似ディジタルフィルタ28tにて合成
された信号は、D/A変換器28uを介した後、L P
 F 26vを介してフィルタリングされて合成音声信
号(アナログ信号)として出力される。
以上のように構成された音声合成部26にて、入力デー
タ系列からそのデータ系列が示す音声が規則合成されて
出力される。
次にイメージ合成部27について説明する。
イメージ合成部27は、第42図に示すように制御演算
部27a、ディスプレイファイルメモリ27b、イメー
ジ合成回路27c、イメージメモリ27d、そして必要
に応じてディスプレイ27eを備えて構成される。
尚、このディスプレイ27eは、該ワークステーション
についてfX備された前記ディスプレイ部10であって
も良い。
イメージ合成回路27は、専用の制御演算部27aの制
御の下でディスプレイファイル27bに書込まれている
ベクトルや多角形・円弧のパラメータを読出し、それに
よって示される線図形を発生してイメージ・メモリ27
dの指定されたアドレスに書込んでいる。このイメージ
合成回路27のイメージ発生機能によってイメージメモ
リ27d上に指定された線図形イメージが構築される。
そしてこの線図形イメージは、制御演算部27aの制御
の下で前記ディスプレイ27eにて表示されてモニタさ
れる。
またイメージ発生回路27bは、イメージ発生に対する
特殊処理機能と塗潰し処理機能とを備えている。この特
殊処理機能は、例えば複数のイメージ図形の重なりに対
して隠線の消去を行なったり、クリッピング処理を行な
う等の機能からなる。また塗潰し機能は、イメージ図形
の部分領域を指定された色を用いて塗潰す処理からなる
このようなイメージ合成回路27bの機能によって、種
々のイメージ図形が作成され、またその合成処理等が行
われる。
ところで上述した如く発生したイメージ図形と自然画と
の合成は次の2つに大別される。その1つは、例えば風
景写真等の自然画を背景として、その中に演算処理によ
って求められたイメージ画像を埋め込み合成する処理で
あり、他の1つのは制御演算部27aが内部モデルとし
て持っている成る平面イメージ内に自然画を埋め込み合
成する処理からなる。
ここで前者の自然画中にイメージ画像を埋め込み処理す
る場合には、例えば第43図にその概念を例示するよう
に、制御演算部27aが発生する図形中に「透明色」を
示すコードを与えておき、これを自然画に対して重ね合
せて合成することによって達せられる。すると「透明色
」コードが与えられた画像領域は、自然画の情報がその
まま表示されることになり、その他の部分は制御演算部
27aが発生した図形が表示されることになる。この結
果、自然画を背景としたイメージ合成が実現されること
になる。この手法はオーバーレイと称される。
これに対して第44図にその概念を示すように画像メモ
リ内に自然画を書込んでおき、その上(手前)に制御演
算部27aが発生した図形を書込んで行くようにしても
良い。この手法は2バツフア法と称される′ものであり
、前述したオーバーレイ法と共に比較的簡単に実現する
ことができる。
ところで制御演算部27aの内部モデルとして示される
平面内に自然画を嵌め込み合成する後者の場合には、次
のようにして高速処理される。
平面上にある自然画を、3次元空間内の任意の方向を向
いている平面に埋め込む為に必要な座標変換は次式で与
えられる。
CX+C2Y十C3 CX十C5Y+C6 CIX十C8Y十09 CX十C5Y十06 但し、X、Yは表示面での座標であり、U、Vは自然画
での座標である。
この座標変換処理をそのまま実行しようとすると、1画
素を表示する毎に6回の乗算と2回の除算が必要となり
、膨大な計算量と計算処理時間を必要とする。
そこでここでは、次のような中間座標(s、t)を介し
て上述した演算を2回の変換処理に分解して実行するも
のとなっている。この演算処理は、例えばアフィン変換
を利用して高速に実行される。
u−(α S+α t+α )/l    (1)v−
(C7S+α8 t+α9)/1 s−C5X−C4Y            (2)t
−CX+C5Y+C6 即ち、上述した第(1)式を用いて透視変換を行い、そ
の後、第(2)式を用いて2次元アフィン変換を行なっ
て任意の平面への透視変換を高速に行なうものとなって
いる。
ここで、第(1)式の分母は座標tそのものであるから
、従来より知られているアフィン変換回路を若干改良す
るだけでその演算を高速に実行することが容易である。
このようにしてイメージ合成部27では種々のイメージ
合成処理を高速に実行するものとなっている。
次に出力形態選択部24について説明する。
この出力形態選択部24はメディア選択要求信号を受け
て起動され、どのメディアを通じてデータ出力するかを
選択するものである。つまり種々のメディアのうち、ど
のメディアを通じて情報伝送するかを選択するものであ
る。
第45図はこの出力形態選択部24の概略構成間であり
、メディア選択制御部24a、入力メディア判定部24
b、相手メディア判定部24c、メディア変換テーブル
24d、および自己メディア機能テーブル24eを備え
て構成される。また第46図はこの出力形態選択部24
の処理の流れを示すものである。この処理手続きの流れ
に沿って該出力形態選択部24の機能を説明する。
メディア選択要求信号が与えられるとメディア選択制御
部24aは前記制御部2に対してメディア選択動作に必
要な入力′メディア情報の提供を要求する。そして入力
メディア判定部24bに対してメディア情報検出要求と
メディア機能識別要求を発する。
入力メディア判定部24bはメディア検出部24fとメ
ディア識別部24gとによって構成され、上記メディア
選択制御部24aによる情報要求を受けて制御部2から
与えられる人力メディアを検出し、且つその検出メディ
アの機能を識別判定するものとなっている。この入力メ
ディア判定部24bは、例えば入力メディアが音声であ
る場合、そのメディアの機能がA D P CMである
等として識別判定する。
しかる後、メディア選択制御部24aは制御部2に対し
てそのデータ出力の相手先が自己端末(ワークステーシ
ョン内)の他の機能ブロックであるか、或いは通信回線
等を介して接続される別のワークステーションや通信端
末であるかを間合せる。
そして別のワークステーションや通信端末に対してデー
タ出力することが指示されると、メディア選択制御部2
4aは送信相手局に関する識別情報を制御部2に対して
要求する。この要求を受けてデータ出力する相手局に関
する情報が相手メディア判定部24eに入力される。
相手メディア判定部24cは、相手局識別部24h。
相手局メディア識別部24I1機能識別部24jを備え
て構成され、前記メディア選択制御部24aからの識別
情報判定要求を受けて作動する。そして相手局に対する
識別情報から、先ず相手局を識別し、F口手局のメディ
アを識別する。そしてその相手局メディアの機能を識別
する。
具体的には、例えばデータ出力(送信)する相手局が自
動FAXであり、その通信メディアがイメージであって
、その機能がGmタイプである等を識別する。尚、この
相手局の識別は、相手局からそのネゴツエーション(ハ
ンドシェーク)機能を用いて送られてくる情報に基いて
行うよにしても良い。またネゴツエーション機能がない
場合には、そのメディア検出機能を機能識別部24jに
持たせておけば良い。このようにすれば相手側からのメ
ディア情報信号に従ってその機能識別を行なうことが可
能となる。
第47図はこの相手局の識別処理手続きの流れを示すも
のである。この流れに示されるように、例えば通信相手
局が電話か否かを判定し、電話である場合にはFAX信
号が到来するか否かを判定する。
そして相手局が電話であり、FAX信号が到来する場合
には、これを相手機器がFAXであると識別すれば良い
。また電話であると判定され、FAX信号が到来しない
場合には、相手機器は通常の電話であると判定すれば良
い。更に電話でないと判定された場合には、相手機器は
電話以外の他の通信機器であると判定するようにすれば
良い。
このようにして通信相手局のメディアが識別判定される
と、次にメディア選択制御部24aは、例えば第48図
に示すように構成されたメディア変換テーブル24dを
参照して、入力メディア、入力機能、相手機器、相手機
器メディア、相手機器の機能に対応したメディア変換選
択情報を得る。
例えば入力メディアが音声で、その機能がADPCMで
あり、相手機器がGmタイプのFAXである場合、相手
機器のメディアがイメージであること、そして主なメデ
ィア変換機能が(音声)  to  (コード文字) (コード文字)  to  (イメージ)であること等
が求められる。同時にそのその変換機能が、 (ADPCM、音声)  to  (GII[;FAX
)によって実現できることが求められる。この際、従属
的なメディア変換情報が存在すれば、これも同時に求め
られる。
このようにして求められたメディア変換情報が制御部2
に与えられ、前記データ出力の形式が選択的に指定され
る。
尚、データ出力が自己のワークステーション内部に対し
て行われる場合には、メディア選択制御部24aは自己
メディア機能テーブル2.4 eを参照して、データ出
力が可能な出力形式を求める。この情報に従ってメディ
ア選択制御部24aは前記メディア変換テーブル24d
の自己メディア変換テーブルを参照し、同様にしてメデ
ィア変換情報を求め、これを制御部2に与える。
このようにして求められるメディア変換情報に従って、
例えば前述した音声合成部2Bを用いて文字コードの系
列で与えられる文章情報を音声情報に変換してデータ出
力したり、或いは音声認識部19を用いて音声情報を文
字コード系列の情報に変換してデータ出力することにな
る。
次にデータベース部32について説明する。
データベース部32はコードやイメージ、音声等の各種
のデータを整理して格納し、これを種々の応用システム
に供するものである。第49図はこのデータベース部3
2の概略構成を示すもので、コマンドの解析処理等を実
行するインターフェース部32a、データベースの検索
処理等を実行するデータ操作部32b、種々のデータを
格納する記憶媒体としての磁気ディスク装置32cや光
デイスク装置32d、そしてその付加機能部32eとに
よって構成される。
種々のデータは、そのデータの種別に従って複数のりレ
ーションに分類整理され、各リレーション毎にそれぞれ
登録されてデータベースが構築されている。
以下、このデータベース部32を、その論理構造、蓄え
られるデータ、物理構造、および付加機能の4つに分け
て説明する。
論理構造とはこのデータベース部32を応用システム側
から見た場合、種々のデータがどのように蓄積されてい
るかを示すものである。ここではリレーショナル・モデ
ルに従った論理構造として、例えば第50図に示すよう
な表のイメージとしてデータが取扱われるようになって
いる。
表(リレーション)には幾つかの欄(アトリビュート)
が設けられており、これらの各欄に所定の単位のデータ
がそれぞれ格納される。データの単位(タラプル)は、
各欄に格納すべき1組の値として定められる。このよう
なタラプルを格納した任意個数のアトリビュートによっ
て1つのりし−ジョンが構築される。
しかしてこのモデルにあっては、リレーション名を指定
し、その各アトリビュートの値をそれぞれ与えることに
よってデータベースへのデータの格納が行われる。また
データベースの検索は、リレーションおよびアトリビュ
ートを指定し、そこに格納されている値が指定された値
、または別のアトリビュートに格納されている値との間
で所定の条件を満すか否かを判定し、その条件を満すタ
ラプルを抽出することによって行われる。
この検索条件は、それらの値が等しい、等しくない、小
さい、大きい等として与えられる。この際、複数のアト
リビュートについてそれぞれ検索条件を指定し、その条
件判定結果を論理処理(アンドやオア等)して行なうこ
とも可能である。更には、複数のりレーションを指定し
、成るリレーションの成るアトリビュートの値が他のリ
レーションの成るアトリビュートの値に等しい等の条件
により、複数のりレーション中から所定のタラプルを求
めるようなデータベース検索も可能である。
またデータベースからのデータ削除は、基本的には上記
検索と同様に行われるが、タラプルを抽出することに代
えて、そのタラプルを抹消することによって行われる。
更にデータ更新も同様であり、得られたタラプルの指定
されたアトリビュートの値を変更し、これを格納するこ
とによって行われる。
また各リレーションには、各アトリビュート毎にデータ
の読出し、追加、変更が許可された人の情報(人名や担
当者コード)等が記入され、データ保護の対策が;&じ
られている。尚、このデータ保護対策をアトリビュート
毎に行なうことに代えで、リレーション単位で行なうこ
とも可能である。
尚、ここに記載される人の情報は複数であっても良い。
しかして第50図に示すリレーションの例では、文字列
としてそのデータが示されているが、各リレーションに
蓄積されるデータは単なるビット列であっても良い。つ
まりリレーションに蓄積されるデータは文字列は勿論の
こと、イメージ情報や音声情報等であっても良い。
さてこのデータベースに蓄積されるデータは、上述した
第50図に示す「個人スケジュール」のリレーションを
初めとして、例えば第51図に示すような「住所録」 
「個人の仕事とその代行者」「操作履歴」 「人事」 
「会議室」 「会議室予約」「会議」等の種々のりレー
ションからなる。
この例に示されるようにリレーションは、主に個人用と
して用いられるものと、多くの利用者によって共通に利
用されるものとからなる。そして個人用のりレーション
は各個人が使用するワークステーション毎に設けられ、
また共通りレーションは複数の利用者にとって共通なワ
ークステーションに設けられる。
尚、共通のワークステーションとは必ずしもそのハード
ウェアが他のワークステーションと異なることを意味し
ない。また個人用のワークステーションが共通のワーク
ステーションを兼ねても良いことも勿論のことである。
更には共通のワークステーションは1台に限られるもの
ではなく、システムの階層レベルに応じて複数台設けら
れるものであっても良い。要するに、複数のワークステ
ーションから容易に特定することのできるものとして共
通のワークステーションが設定される。
ここで第50図に示した「個人スケジュール」リレーシ
ョンのデータ構造について簡単に説明する。
このリレーションからは、そのリレーション名が「個人
スケジュール」であり、「△△△△」によって作成され
たことが示される。このリレーション作成者「△△△△
」は該リレーションに対して全てのデータ操作が許可さ
れる。
またこのリレーションに付加されたデータ保護機能によ
れば、データの読出しは全員に許可されており、データ
の追加はroooOJと「技術部に所属する者」に対し
てのみ許可されている。尚、この「技術部に所属する者
」は、例えば「人事」のリレーションを参照する等して
求められる。またデータの変更は1人レベル」の値が「
5」以上のものに対してのみ許可されている。この1人
しベルJとは人事リレーションに関するものであり、例
えば(部長;8)(次長;7)(課長;6)(主任;5
)等として役職を表わす。
更にこのリレーションには、「開始時刻」 「終了時刻
」 「種類」 「名称」 「場所」等のアトリビュート
が設定され、そのそれぞれにデータが書込まれるように
なっている。
次にこのデータベース部32における上述した各種のり
レーションを実際に記憶する為の物理構造について説明
する。
情報蓄積部(記憶部)は大量データを蓄積し、その任意
の部分を比較的高速に読み書きすることができ、価格的
にさぼど高価でないものとして前述した磁気ディスク装
置32cや光デイスク装置32gが用いられる。
この情報蓄積部へのデータベースの蓄積は、該情報#積
部の記憶領域を特定の大きさく例えば数キロバイト程度
で、タツブル長や計算機の速度等に応じて定められる)
毎に区切り、各々をページとして管理して行われる。そ
して第52図に示すように、例えば第Oページにページ
管理の情報を、第1ページにリレーション−覧表の情報
を、また第2ページに使用中のページ情報をそれぞれ格
納する。
このリレーションの一覧表によって、データベース中に
おける種々のりレーションの所在が示される。
例えば第9ページおよび第11ページに格納された実デ
ータは、第5ページに格納されたりレーションのアトリ
ビュート(主アトリビュート)に基き、第10ページに
格納されたインデックスページの情報に従ってソートさ
れるようになっている。このインデックスベージの情報
は、アトリビュートの値が幾つから幾つ迄のものがどの
ページに格納されているかを示すものである。
この主アトリビュート以外のアトリビュートによりデー
タ検索する場合には、そのアトリビュートについて第2
0ページのサブ・インデックスを経由して、先ず第21
ページや第22ページに示されるサブデータを得る。こ
のサブデータにはアトリビュートの値と前述した主アト
リビュートの値のみが入っており、ここで求められるア
トリビュートの値を用いて実際のデータが求められる。
尚、例えば画像データや音声データのようにその実デー
タの量が膨大であり、その中の幾つかのビット誤りが問
題とならない場合には、これらの実データを光デイスク
装置32d等の別の安価な情報記憶装置にファイルする
ようにしても良い。この場合には、第9ページや第11
ページ等の実データ用ページには、その旨とその装置で
の実データの格納位置情報を記憶しておくようにすれば
良い。
しかしてこのように構築されたデータベースに対する付
加機能は、例えば不要データの自動廃棄等からなる。こ
の不要データの自動廃棄は、リレーションの付加情報と
して[廃棄;可/不可コを廃棄の方法]等を与えておき
、所定の間隔でリレーション毎の消去コマンドを励作さ
せて行われる。
尚、タラプルの消去は、例えば会議情報についてはその
終了時刻が現在の時刻より前であるか否か等を判定して
行なうことが可能である。従ってこのようなタラプルの
消去については、格別の機能追加は不要である。
また付加機能の他の重要な機能としてデータの保全があ
る。このデータの保全機能は、例えばハードウェアの故
障や停電等に原因してデータが不正(でたらめになった
り失われたりすること)となることを防ぐものである。
具体的にはこのデータの保全機能は、情報の二重化や磁
気テープへの書出し等によって実現される。
このようにデータベース部32では、種々のデータをリ
レーション毎に分類整理し、■つページ単位に管理して
種々の応用システムに供するものとなっている。
次に作業環境データ収集部25について説明する。
この作業環境データ収集部25は、該ワークステーショ
ンに対する過去の操作履歴のデータを収集し、これに基
く操作ガイドを行なうものである。
ここで作業環境データ収集部25には、例えば第53図
に示すように当該情報処理システムが持つ機能に対応す
るコマンドと、他の情報システムが持つ機能に対応する
コマンドとを対応付けるコマンド対応テーブルが設けら
れている。
具体的には当該情報処理システムをA1他の情報処理シ
ステムをB、C,D、・・・とじたとき、システム八に
おけるコマンド“DELETE”に対応する他のシステ
ムのコマンドが DEL”“ERASE” ”REMO
VE’であることが、該コマンド対応テーブルによって
示されるようになっている。
第54図は利用者により人力されたコマンドを解析し、
所定の動作および各種ガイダンスを実行する作業環境デ
ータ収集部25の概略構成を示すものである。
この作業環境データ収集部25では、先ずコマンド入力
部25aから入力されたコマンドをコマンド解析部25
bに与え、コマンド対応テーブル25cを参照して解析
している。具体的には第55図に示す手続きの流れに従
って入力コマンドがコマンド対応テーブル25cに登録
されているかを調べている。即ち、コマンドが入力され
ると、先ずその入力コマンドがシステムAのものである
か否かが調べられる。そして入力コマンドがシステムA
のコマンドであると解析されると、コマンド解析部25
bは該人力コマンドをコマンド実行部25dに与え、そ
のコマンドに基く所定の動作を実行させている。
一方、入力コマンドがシステムAのものでない場合には
、他のシステムのコマンドに該当するか否かが調べられ
、対応付けされているコマンドが存在する場合には、そ
の対応コマンドを画面表示部25eにて表示する。つま
り他のシステム(システムB)で用いられているコマン
ド、例えば“DEL”である場合には、これに対応する
システムAのコマンド”DELETE’を求め、これを
操作ガイダンスとして画面表示部25eに表示すること
になる。
尚、入力コマンドに該当するコマンドがコマンド対応テ
ーブル25cに存在しなかった場合には、画面表示部2
5eにてコマンドエラーメツセージの表示を行なう。
具体的には次のようにしてそのコマンド入力に対する処
理が行われる。今、システムB、Cの操作経験の利用者
が初めてシステムA(当該情報処理システム)を操作す
るものとする。・ここで利用者がコマンドを入力してデ
ータ“ABC″を消去する場合、従来ではシステムAの
取扱い説明書に従ってデータ消去の為の“DELETE
”なるコマンドを探し、これを入力することが必要とな
る。
しかしここでは、その利用者は過去の経験に従って、例
えばシステムCで用いていたデータ消去コマンド”ER
ASE  ABC’を第56図(a)に示すように入力
する。
すると作業環境データ収集部25ではこの入力コマンド
を解析し、前記コマンド対応テーブル25cから入力コ
マンド“ERACE”に対応するシステムAのコマンド
″DELETE“を求め、これをガイドとして表示する
ことになる。この結果、利用者はシステムAを初めて操
作する場合であっても、そのデータ消去のコマンドが “DELETE”であることを知り、そのコマンドをガ
イドに従って入力することにより、そのデータ消去を行
なうことが可能となる。
またファイル名のリストを表示するべく、第56図(b
)に示すようにシステムBにおけるコマンド“DIR”
を入力した場合には、同様にして該システムAにおける
対応コマンド“CATA“が求められ、ガイド表示され
る。この結果、このガイドに従ってコマンド“CATA
”を入力することによって、そのファイル名のリストが
表示される。
このようにこの作業環境データ収集部250機能を活用
することにより、過去の操作経験のあるシステムで用い
られていたコマンドの入力によって、そのシステムにお
ける対応コマンドがガイド表示される。従ってシステム
利用者は、過去に得た知識を最大限に利用してシステム
を操作することが可能となる。そして当該情報処理シス
テムのコマンドを容易に知ることが可能となる。従って
その都度、当該情報処理システムの操作説明書を調べる
等の煩わしさから解放される。故に、システムの操作の
習得に要する時間を大幅に短縮することができる等の効
果が期待できる。
尚、入力コマンドに対応するコマンドを求め、これをガ
イド表示したとき、その合否の判定入力を受けて、その
コマンドを実行するようにしても良い。
即ち、第57図にその手続きの流れを示し、第58図に
その表示例を示すように他のシステムの6消去コマンド
“ERASE″し、これに対応するシステムAの消去コ
マンド“DELETE”が求められたとき、これが正し
いか否かを間合せる。
そして正(Y)なる指示入力があったとき、その入力コ
マンドが“DELETE“を示していると判定し、これ
をコマンド実行部25dに送ってその処理を実行させる
ようにする。
このようにすれば、コマンドの対応関係がガイド指示さ
れると同時に、その入力コマンドに従って所望とする処
理が実行されるので、改めて正しいコマンドを入力し直
す必要がなくなる。つまり入力コマンドの対応コマンド
への自動変換が行われて、その処理が実行されることに
なる。従って、更にその操作性の向上を図ることが可能
となる。
尚、対応コマンドはシステムの種類に応じて何種類存在
しても良いものである。要はコマンド対応テーブル25
cに対応付けてそれぞれ格納しておけば良い。またコマ
ンドは上述した文字列形式に限定されないことも云うま
でもない。
次にこの作業環境データ収集部25におけるシステム習
熟度のデータ収集について説明する。この作業環境デー
タ収集部25の内部に、このシステム習熟度のデータ収
集処理を実行する為のハードウェアとして、外部記憶装
置と制御装置が置かれる。
第59図はシステム習熟度のデータ収集処理を示す流れ
図である。
利用者がその識別コード(ユーザ番号やパスワード等)
を入力すると、作業環境データ収集部25はその識別コ
ードに対応する習熟皮表を外部記憶装置から求め、装置
内部にセットする。この習熟皮表は各利用者がシステム
の様々な利用機能に対してどの程度習熟しているかを格
納したもので、例えば第60図に示す如く構成されてい
る。
即ち、この習熟皮表は各利用機能に対してその利用開度
、最終利用年月日時、ユーザが申告した該機能に対する
習熟クラス、該機能を前回利用した際の習熟度クラス、
更には該機能の複雑度の情報等によって構成されている
ここで複雑度とは該当利用機能が専門知識を要求する程
高くなり、また基本機能より高級機能になる程高くなる
ものである。
しかしてこのような習熟皮表は各利用者毎に設けられ、
外部記憶装置にそれぞれ記憶されている。
尚、システムを初めて利用する利用者に対しては、識別
コードの新規設定によりその利用者に対する習熟皮表が
作成され、外部記憶装置に登録される。
尚、外部記憶装置には、例えば第61図に示すように上
述した習熟皮表に加えて、前記習熟度クラスに対応した
利用機能毎のメツセージが登録されている。このメツセ
ージは習熟度のクラスが低い程、その背景説明を含む判
り易い説明となっている。また習熟度の高いクラスはど
、簡略な説明と専門的な機能の紹介を含んだ高度な内容
となっている。
また習熟度のクラスは、例えば A;初級者クラス B:中級者クラス C;習熟者クラス のように分類設定される。
しかして入力された識別コードに対応した習熟皮表が求
められると、次にその利用機能を利用者に選択させる為
のメニューが表示される。このメニューに対して利用者
は、例えばその利用機能に対応する番号等を人力する。
すると制御装置ではその人力情報が終了信号か利用機能
の選択信号かを判断し、利用機能選択信号の場合には次
のように動作する。
即ち、利用機能選択信号が入力されると、先ずその利用
者に関する前記習熟皮表を参照し、選択された利用機能
に対応する利用開度や最終利用年月日時、申告習熟度ク
ラス等の情報が求められる。
そしてこれらの情報に従って重み付は処理を施し、現在
の習熟度クラスの決定が行われる。
この習熟度クラスの判定は、例えば利用頻度をPl、最
終利用年月日時をT 、現在の利用年月日時をT 1利
用者申告習熟度クラスをX 1前c         
       1回利用習熟度クラスをX2@tA、B
、C1、複雑度をP 1そして判別関数をF としたと
き、C「 F  −KIP、+に2 (To−To)+ K a 
G 1[X t ] +K  G  [X  ]十に5P。
として求められ。但し、上式においてK  、K  。
に3.に4は、実験等によって適切な値に設定さてあり
、Y  、Y  、Y  、Z  、Z  、Z3は、
A、B、Cに対する評価重みである。これらの評価重み
は Y  <Y  <Y  ・  ZlくZ2くZ3なる関
係を有し、実験等によって適切な値に設定される。
ここでG[Xlは、Xl−AのときYlな1す る値を取り、N2−BのときY2なる値を取ることを意
味する。また(T  −T  )は、最終利用Ce 年月日時から現在までの日数を時間換算したものである
しかしてクラス判定は、上述した判別関数Frの値によ
り次のようにして行われる。
F  <N   ・・・Aクラス 「  l N ≦F  <N   ・・・Bクラス1   r  
 2 N2≦F、    ・・・Cクラス 尚、判定閾値N  、N  は実験等に基いて適切に定
められる。
このようにして習熟度クラスが決定されると、その決定
された習熟度クラスに対応し、且つ前述した如く指定さ
れた利用機能に該当するガイドメツセージやエラーメツ
セージを外部記憶装置から求める。
しかる後、今回決定された習熟度クラスと、前記習熟度
表に格納されている前回の習熟度クラスとを比較照合す
る。そして習熟度クラスに変更がある場合には、その習
熟度に変更がある旨を示すメツセージを前記ガイドメツ
セージ等に付加して書込む。
この習熟度クラス変更のメツセージは、例えば第62図
に示すような4種類のメツセージからなる。そしてその
クラス変更の形態に応じて求められ、前記ガイドメツセ
ージ等と共に表示される。
利用者はこのようにして表示される各種メツセージに従
ってその処理操作を行なうことになる。
具体的には作成データをファイルに格納する利用機能に
対して、その利用者が初級者クラス(Aクラス)と判定
されると第63図に示す如きメツセージが表示される。
そしてこのメツセージにも拘らず利用者が情報入力を誤
った場合には、例えば第′64図に示すようなエラーメ
ツセージの表示が行われ、その利用機能に対する操作の
ガイドが行われる。
またその利用者の習熟度が中級者クラス(Bクラス)と
判定された場合には、第65図に示す如きメツセージが
表示される。そしてこのメツセージにも拘らず利用者が
情報入力を誤った場合には、例えば第66図に示すよう
なエラーメツセージの表示が行われ、その利用機能に対
する操作のガイドが行われる。同様にその利用者の習熟
度が習熟者クラス(Cクラス)と判定された場合には、
第67図に示す如きメツセージが表示され、情報人力の
誤りがある場合には、例えば第68図に示すようなエラ
ーメツセージの表示が行われてその利用機能に対する操
作のガイドが行われる。
しかして上述した如く表示したガイドメツセージの空欄
に対してデータ入力が行われると、制御装置は前述した
如く求めている該当利用者の習熟度表の該当利用頻度を
(+1)すると共に、最終利用年月日時および前回利用
習熟クラスの更新を行なう。そして該利用機能の実行を
促すと共に、該当利用機能が終了したものと石做して前
述した利用機能選択の為のメニュー表示動作に戻る。
ここで再び利用機能選択信号が入力されると、上述した
処理を再び繰返して実行することになる。
しかし終了選択信号が入力された場合には、上述した如
く作成・更新した習熟皮表を外部記憶装置の習熟度ファ
イルに、その該当利用者の識別コードと共に書込み、こ
れを保存する。そしての一連の処理手続きを終了する。
このようにして作業環境データ収集部25では、システ
ムの操作に関する習熟度のデータを収集しながら、その
収集されたデータに従ってその操作を適切にガイダンス
するものとなっている。
以上が本ワークステーションの基本的な構成とその機能
である。
次にこのように構成されたワークステーションにおける
電話回線を介したデータベースの検索処理機能について
説明する。
電話回線を介して通信装置12.13に電話着信がある
と、前記音声認識部19および音声合成部26がそれぞ
れ起動される。そして音声合成部26によるメツセージ
データの音声合成出力と、電話回線を介して人力される
音声情報の認識処理が行われる。
しかして電話音声がデータベースの検索を要求すると、
例えば第69図に示すデータベース検索処理手続きが起
動される。そして電話を介するデータベース検索者は、
予め定められた手順に従ってデータベース検索に必要な
情報を順に発声入力する。
このデータベース検索処理では、例えば先ず電話回線を
介して入力される電話音声の、検索目的とするキーワー
ドを認識することから行われる(ステップa)。この電
話音声が示すキーワードの認識によって、例えばその情
報検索目的が住所の情報であることが求められる。この
結果、データベース部32に対して住所録のりレーショ
ンを検索すれば良いことが決定される。
するとこの住所録のりレーションから1的とする住所の
情報を検索抽出するために必要なアトリビュート、ここ
では検索対象とする個人名の情報入力を促すメツセージ
を前記音声合成部26にて生成し、これを前記電話回線
を介して出力する(ステップb)。このメツセージ出力
に応答してデータベース検索者が発声入力する氏名の情
報を前記音声語工部19にて認識し、これを検索情報と
して確定する(ステップC)。そしてこの検索情報に従
って前記データベース部32の住所録のりレーションを
検索し、該小者の住所の情報(地名、地番)を求める(
ステップd)。
このようにしてデータベース部32から目的とする住所
の情報が求められたとき、その検索抽出された情報を音
声合成部2Bに転送し、その文字コード列で示される住
所の情報を音声合成して前記電話回線を介して音声出力
する(ステップe)。
基本的には以上の処理手続きによって電話音声を用いた
データベースの検索処理が実行される。
しかしてここでは上記検索情報の音声合成出力の後、そ
の出力情報が十分理解できたか否かの確認を求めるメツ
セージが、例えば「これでよろしいですか?」等として
音声合成されて出力される(ステップf)。そしてこの
メツセージ出力に対する応答、例えば「はい」 「いい
え」を音声認識し、上述した如くデータベースから検索
抽出されて音声合成されて出力された情報が満足するも
のであったか否かが判定される(ステップg)。
音声合成による情報出力が満足できるものであった場合
には、その時点で電話音声によるデータベース検索処理
手続きを終了する。
一方、デーベースから検索抽出された情報の電話回線を
介した音声合成による出力が不満足であるとの情報が人
力された場合、該情報の他のメディアを介する出力が可
能であるか否かが判定される(ステップh)。具体的に
は、ここでは電話回線を介する情報検索が行われている
ことから、その電話回線を介してファクシミリ通信が可
能であるか否か、換言すれば相手側(データベース検索
者)がファクシミリ端末を備えているか否かが調べられ
る。
そして別のメディアを介して、ここでは電話音声ではな
くファクシミリ(イメージ)として情報出力が可能であ
ると判定されたとき、このメディア(ファクシミリ)を
介して情報出力を行なう。
即ち、先ず前記データベースを検索して前述した如く検
索抽出した情報に関連するイメージ情報が有るか否かが
調べられ、例えばその関連情報として存在する地図のマ
ツプ番号を求める(ステップi)。そしてこのマツプ番
号に従って該当する地図のイメージ情報を前記データベ
ース部32から検索抽出し、このイメージデータを前記
電話回線を介してファクシミリ送信出力する (ステッ
プj)。
尚、ファクシミリによる情報出力が可能であると判定さ
れた場合であっても、検索抽出された情報に関連する地
図等のイメージ情報が存在しない場合には、前記検索抽
出された情報を示す文字コード列を文字パターン化し、
その文字列をファクシミリ通信するようにしても良い。
ところでデータベース検索者がファクシミリ端末を持た
ない場合、つまり他のメディアによる情報出力が不可能
な場合には、前記データベースから検索抽出された情報
を、再度前述した音声合成により出力する(ステップk
)。但し、この場合には、例えば音声合成時の発話速度
を前回よりも遅くし、且つそのポーズ時間を長くする等
して合成音声を聞取り易くなるような工夫を施して情報
出力する。
以上の一連の処理手続きにより、データベースから検索
抽出された情報を、そのデータベース検索者が理解し易
いように情報出力する。
尚、本発明は上述した実施例に限定されるものではない
。ここではデータベースから住所の情報を検索抽出し、
これを音声合成して出力すると共に、更に必要に応じて
地図の情報をファクシミリによりイメージ出力する例に
ついて説明した。しかし電話を介して、例えば売上げ金
額の情報を検索するような場合や、株価の動向を検索す
るような場合には、それらの情報をグラフ化してイメー
ジ出力することも可能である。また文字コードによる情
報出力が可能な場合には、情報検索された文字コードの
列をそのまま出力することも可能である。要するに本発
明はその要旨を逸脱しない範囲で種々変形して実施する
ことが可能である。
[発明の効果コ 以上説明したように本発明によれば、電話を介する音声
によって非常に簡易にデータベースを検索することがで
き、しかも音声合成されて出力される情報が不明瞭な場
合には適宜ファクシミリ等のイメージとして情報の提供
を受けることができる。従って任意の場所から身近な電
話を利用して非常に効果的に、しかも確実にデータベー
スに蓄積された情報を検索抽出することが可能なる。
またその情報を理解し易い形態として受けることが可能
となる等の実用上多大なる効果が奏せられる。
【図面の簡単な説明】
図は本発明の一実施例を示すもので、 第1図は本発明に係るワークステーションにおける電話
によるデータベース検索処理機能の概念を示す図、第2
図はワークステーションの概略構成図、 第3図はワークステーションに付随するICカードの外
観図、第4図はICカードの構造を示す分解斜視図、第
5図はICカードのプリント基板部の構造を示す図、第
6図はICカードの半導体集積回路部の構成を示す図、 第7図はワークステーションにおける暗号化処理部の構
成を示す図、第8図は暗号・復号化の概念を示す図、第
9図は暗号化部の構成図、第10図は復号化部の構成図
、第11図はRSA処理部の構成図、 第12図はワークステーションにおけるイメージ照合部
の構成を示す図、第13図はイメージ処理される顔の例
を示す図、第14図はイメージ・データの構造を示す図
、 第15図はワークステーションにおける音声認識部の構
成を示す図、第16図は入力音声パターンの例を示す図
、第17図は子音の音響的特徴を示す図、第18図は遷
移ネットワークの例を示す図、第19図は音声認識処理
の手続きを示す図、第20図は人力音声に対する部分区
間検出を説明する為の図、第21図は音声認識辞書の学
習処理手続きを示す図1、 第22図はワークステーションにおける文字認工部の第
1の文字認識ブロックの構成を示す図、第23図は認識
対象となる文字が記載されるFAX送信原稿用紙の例を
示す図、第24図は認識対象文字の切出し処理を説明す
る為の図、第25図は文字認識部における第2の文字認
識ブロックの構成を示す図、 第26図はワークステーションにおける図形認識部の構
成を示す図、第27図乃至第30図は図形認識処理を説
明する為の図、 第31図はワークステーションにおけるイメージ認識部
の構成を示す図、第32図はコード変換装置の構成図、
第33図は入力イメージに対する処理例を示す図、第3
4図はセグメントにおける特徴点検出を示す図、 第35図はワークステーションにおける音声照合部の構
成を示す図、第36図はフィルタバンクの帯域分割例を
示す図、第37図はフィルタ特性を示す図、 第38図はワークステーションにおける音声合成部の構
成を示す図、第39図は規則合成パラメータ生成装置の
構成図、第40図は音声パラメータの変換構造を示す図
、第41図は音声合成器の構成図、 第42図はワークステーションにおけるイメージ合成部
の構成を示す図、第43図および第44図はイメージ合
成処理の概念を示す図、第45図はワークステーション
における出力形態選択部の構成を示す図、第46図は出
力形態;g択処理手続きの流れを示す図、第47図は相
手局識別処理手続きの流れを示す図、第48図はメディ
ア変換テーブルの構造を示す図、 第49図はワークステーションにおけるデータベース部
の構成を示す図、第50図はデータベ・−スのデータ構
造を示す図、第51図はりレーションの例を示す図、第
52図はりレーションの構造を示す図、 第53図はコマンド対応テーブルの構造を示す図、第5
4図はワークステーションにおける作業環境データ収集
部の構成を示す図、第55図乃至第58図はコマンド部
の処理を説明する為の図、第59図はシステム習熟度の
データ収集処理の流れを示す図、第60図は習熟度表の
構造を示す図、第61図乃至第68図は作業環境データ
収集部の処理を説明する為の図、 第69図は本ワークステーションにおける電話回線を介
したデータベース検索処理手続きの流れを示す図である
。 ■・・・バス、2・・・制御部、3・・・イメージ入力
装置、4・・・位置入力装置、5・・・音声入力部、6
・・・キーボード部、7・・・ICカード部、8・・・
バスコントローラ、9・・・音声出力装置、10・・・
ディスプレイ部、11・・・イメージ出力装置、12.
13・・・通信装置、14・・・切換え装置、15・・
・タイマ一部、1B・・・暗号化処理部、17・・・音
声照合部、18・・・イメージ照合部、19・・・音声
認識部、20・・・音声分析部、21・・・文字認識部
、22・・・図形認識部、23・・・イメージ認識部、
24・・・出力形態選択部、25・・・作業環境データ
収集部、2B・・・音声合成部、27・・・イメージ合
成部、28・・・図形合成部、29・・・音声の圧縮・
伸長部、30・・・イメージの圧縮争伸長部、31・・
・信号処理部、32・・・データベース部。 出願人代理人 弁理士 鈴江武彦 第1図 第4図 第3図 7h 第5図 第7図 (プ奮号イ乙)+      1(11号化)第8図 第10図 (鍵、k) 第11図 第12図 第13図     第14図 M 19図 第20図 第21図 第26図 第27図    第28図 第29図    第30図 第31図 第32図 (a)             (b)第33図 第34図 第37図   0H 第38図 第39図     第40図 第41図 第42図 第43図 第44図 第46図 第48図 第49図 第50図 第52図 第53図 第54図 第56図 第58図 第59図 第60図 第61図 第63図 第65図 第66図 第67図 第68図

Claims (3)

    【特許請求の範囲】
  1. (1)電話回線を介して入力された音声を認識してデー
    タベースに対する検索情報を求める手段と、この検索情
    報に従って前記データベースを検索する手段と、データ
    ベースから検索抽出された情報を音声合成して前記電話
    回線を介して出力する手段と、この音声合成されて出力
    された情報が理解されたか否かを確認する手段と、上記
    音声合成により出力された情報が理解されないとき、別
    のメディアを介して情報出力が可能であるか否かを判定
    する手段と、別のメディアを介して情報出力が可能なと
    き、そのメディアを介して情報出力する手段とを具備し
    たことを特徴とするワークステーション。
  2. (2)別のメディアは、電話回線を介して通信可能なフ
    ァクシミリ・イメージ・データであって、データベース
    から検索された情報を示す文字画像、または上記情報に
    関連するイメージ画像からなるものである特許請求の範
    囲第1項記載のワークステーション。
  3. (3)音声合成されて出力された情報の理解の判定は、
    その合否を示す電話音声を認識して行われるものである
    特許請求の範囲第1項記載のワークステーション。
JP61230071A 1986-09-30 1986-09-30 ワークステーシヨン Pending JPS6386660A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61230071A JPS6386660A (ja) 1986-09-30 1986-09-30 ワークステーシヨン

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61230071A JPS6386660A (ja) 1986-09-30 1986-09-30 ワークステーシヨン

Publications (1)

Publication Number Publication Date
JPS6386660A true JPS6386660A (ja) 1988-04-18

Family

ID=16902084

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61230071A Pending JPS6386660A (ja) 1986-09-30 1986-09-30 ワークステーシヨン

Country Status (1)

Country Link
JP (1) JPS6386660A (ja)

Similar Documents

Publication Publication Date Title
JP2558682B2 (ja) 知的ワ−クステ−シヨン
US9183367B2 (en) Voice based biometric authentication method and apparatus
JP3848319B2 (ja) 情報処理方法及び情報処理装置
WO2006087799A1 (ja) 音声認証システム
JPS6386655A (ja) メデイア変換方式
JPS63276672A (ja) 知的ワ−クステ−シヨン
JP2582356B2 (ja) フアクシミリ通信方式
JPS6386652A (ja) 電話着呼情報提供システム
JPH06187351A (ja) スケジュール管理装置
JPS6385934A (ja) 知的ワ−クステ−シヨン
JPS6385964A (ja) スケジユ−ル表示方式
JPS6385963A (ja) 会議アレンジ方式
JPS6385968A (ja) スケジユ−ル報知方式
JPS6386648A (ja) 優先電話方式
JPS6385929A (ja) フアイル検索装置
JPS6385979A (ja) ワークステーション
JPS6386947A (ja) ワークステーシヨン
JPS6386660A (ja) ワークステーシヨン
JPS6385931A (ja) 知的ワ−クステ−シヨン
JPS6386662A (ja) Faxメ−ル方式
JPS6386944A (ja) 知的ワ−クステ−シヨン
JPS6386646A (ja) ワ−クステ−シヨン
JPS6386647A (ja) 自動転送電話方式
JPS6385967A (ja) スケジユ−ルプロテクシヨン方式
JPS6386658A (ja) 音声通知装置