JPS6385979A

JPS6385979A - ワークステーション

Info

Publication number: JPS6385979A
Application number: JP23006686A
Authority: JP
Inventors: Masabumi Tamura; 正文田村; Kazuhiro Mori; 和宏森; Seishi Kageyama; 景山　聖之
Original assignee: Toshiba Corp
Current assignee: Toshiba Corp
Priority date: 1986-09-30
Filing date: 1986-09-30
Publication date: 1988-04-16

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】（産業上の利用分野）本発明はワークステーション本体の操作者（オペレータ
）を個人同定して、例えばそのオペレータの熟練度に応
じた作業環境を整えることのできるワークステーション
に関する。

（従来の技術）近時、種々のワークステーションが開発され、オフィス
等に幅広く導入されて各種のオフィス業務に利用されて
いる。そして情報端末を操作してワークステーションを
利用するオペレータも、所定の訓練を受けた熟練者から
初心者まで多様化する傾向にある。

ところでワークステーションのガイダンス機能として、
そのオペレータの熟練度に応じた作業環境を形成するこ
とが考えられている。例えば熟練者に対しては簡略な操
作説明と専門的な機能を紹介する高度な内容のメツセー
ジを提示し、初心者に対しては背景説明を°含む簡易な
内容のメツセージを提示してその操作法をガイダンスし
、ワークステーションを取扱う上での適切な作業環境を
形成することが考えられる。

そこで、例えばワークステーションの利用時にキーボー
ド等を操作してそのオペレータのＩＤ情報等を人力し、
その入力情報からオペレータを識別同定することが考え
られている。しかし、ワークステーションの利用時にそ
の都度、ＩＤ番号等を操作人力する作業が非常に煩わし
いと云う問題があった。また操作ミスによってその入力
情報に誤りが生じ易い等の問題もあった。

（発明が解決しようとする問題点）本発明は、情報端末の操作者を個人同定する為の、例え
ばＩＤ番号の入力操作等が非常に煩わしく、その操作性
の点に問題があることに鑑みてなされたもので、その目
的とするところは、煩わしい情報入力装置を伴うことな
しにその操作者を簡易に個人同定して、例えばその作業
環境を整える為の情報として利用することを可能とする
オペレータ照合機能を備えたワークステーションを提供
することにある。

［発明の構成コ（問題点を解決するための手段）本発明は、第１図にその概略構成を示すように、情報端
末を操作するオペレータの顔のイメージを撮像入力する
イメージ入力装置Ａ、その撮像入力イメージから顔の特
徴を抽出するイメージ認識部Ｂ１この認識抽出された顔
の特徴と、例えばその操作者が携帯するＩＣカードＣか
ら読込み入力される、予め登録された顔の特徴とを比較
照合して上記オペレータを個人照合するイメージ照合部
り、更にはその照合結果を表示するディスプレイＥを具
備して構成される。また必要に応じて上記ＩＣカードＣ
から読取り入力された情報をイメージ圧縮・伸長部Ｆに
て処理し、これを前記ディスプレイＥにて上記照合結果
と同時表示して、それらの確認照合を促すようにしたも
のである。

（作用）本発明によれば情報端末を操作しようとするとき、自動
的にそのオペレータの顔のイメージが撮像入力されてそ
の顔の特徴が抽出され、ＩＣカード等に登録されている
個人の顔の特徴情報と自動的に照合される。そしてこの
照合処理によってオペレータの個人同定が行われるので
、その結果に従って、例えばガイダンス機能を用いてオ
ペレータの熟練度に応じた作業環境を容易に形成するこ
とが可能となる。

故にオペレータは、例えば情報端末の前に立つだけで良
く、個人照合の為の煩わしい処理操作を行なう必要がな
くなる。またワークステーション本体にとっては、個人
性のある顔の特徴から、その個人照合を確実に行なうこ
とが可能となる。

（実施例）以下、図面を参照して本発明の実施例につき説明する。

第２図は本発明の実施例に係る知的ワークステーション
の概略構成図である。この知的ワークステーションは、
以下の各部を備えて構成される。

バスｌ　；以下に説明する各部の間ので必要な情報転送
を行なう為に用いられる。

制御部２　；マイクロプロセッサを主体として構成され
、該知的ワークステーションの各部の動作をそれぞれ制
御するものである。

イメージ入力装置３　；カメラやスキャナ、ＯＣＲ等か
らなり、各種のイメージ情報を入力する。

位置座標入力装置４；タブレットやマウス等からなり、
指定された位置座標情報を入力する。

音声入力部５　；マイクロフォン等により構成され、音
声情報を入力する。

キーボード部６　；複数のキーを備え、文字・記号コー
ドや制御コード等を入力する為のものである。

ＩＣカード部７　；後述するようにＩＣカードが装着さ
れ、該ＩＣカードとの間で必要な情報を人出力するもの
である。

バスコントローラ８　；バスｌを介する各部間の情報転
送を制御する。

音声出力部９　；スピーカ等からなり、音声情報を出力
する。

ディスプレイ部１０；ＣＲＴディスプレイや液晶ディス
プレイ等からなり、文字・図形・画像等を表示する。

イメージ出力装置１１．ＦＡＸやカラープリンタ等から
なり、種々のイメージ情報をプリント出力する。

通信装置１２．　ｔａ；該ワークステーションと電話機
、或いは遠隔地に設置された他のワークステーションや
端末等との情報通信を行なう。

切換え装置１４；複数の通信装置を切換え使用する。

タイマ一部１５；該ワークステーションに時刻情報や時
間情報を提供する。

暗号化処理部１６：種々の情報を暗号化処理する。

音声照合部１７；与えられた音声情報が特定の音声であ
るか否かを照合処理する。

イメージ照合部１８；与えられたイメージ情報が特定の
イメージであるか否かを照合処理する。

音声認識部１９；与えられた音声情報を認識処理する。

音声分析部２０．音声入力部５等から入力された音声の
特徴を抽出する等して該音声を分析処理する。

文字認識部２１；前記イメージ入力装置３等から入力さ
れた文字・記号パターンを認識処理する。

イメージ認識部２３；前記イメージ入力装置３等から入
力された図形イメージ等を認識処理する。

出力形態選択部２４；該ワークステーションから出力す
る情報の形態を選択制御する。

作業環境データ収集部２５；該ワークステーショの機能
状態や、それによるオフィス内の作業環境等の情報を収
集入力する。

音声合成部２Ｂ、処理データに従って合成音声を生成す
る。

イメージ合成部２７；複数のイメージ情報を合成処理し
たり、処理データに従ってイメージの編集処理を実行す
る。

図形合成処理部２８；種々の図形を合成処理したり、処
理データに従って図形の加入・削除等の編集処理を実行
する。

音声の圧縮・伸長部２９；音声データを圧縮符号化した
り、圧縮された音声データの復元伸長を行なう。

イメージの圧縮・伸長部３０；イメージ・データを圧縮
符号化したり、圧縮されたイメージ・データの復元伸長
を行なう。

信号処理部３１；種々の信号情報の符号化圧縮やその復
元伸長、必要な情報の付加等の一連の信号処理を実行す
る。

データベース部３２；種々の情報を複数のりレーション
にそれぞれ分類し、データベースとして蓄積する。尚、
このデータベースはコード情報のみならず、イメージや
音声等としても構築される。

本発明に係る知的ワークステーションは、基本的には上
述した各部を備えて構成され、上述した各部がそれぞれ
が持つ機能を有効に利用して全体的にインテリジェンス
な機能を呈するものとなっている。

次に前述したキーボード部５等のように一般的ではなく
、この知的ワークステーションにおいて特徴的な機能を
呈するＩＣカード部７や暗号化処理部ｌＢ等について更
に詳しく説明する。

先ずＩＣカードは、例えば第３図に示すように名刺大の
大きさのカード本体７ａ内にマイクロプロセッサやメモ
リ回路等の半導体回路を内蔵し、カードの一端部に上述
した構成の知的ワークステーション本体に接続する為の
インターフェース部７ｂ。

および表示窓部７ｃを設けて構成される。

尚、表示窓部７ｃは透明偏光体を埋め込んで形成される
もので、その位置はインターフェース部７１）や半導体
回路と梁受しない位置に設定される。またカード本体７
ａは、上記表示窓部７ｃに対応する部分のみが透明であ
っても良く、またその基板全体が透明なものであっても
良い。

しかしてＩＣカードは、具体的には第４図にその分解斜
視図を示すように、一対のカバー基板７ｄ。

７ｃ、これらのカバー基板７ｄ、　７ｃに挟持される埋
め込み基板７ｒ１コアシ一ト材７ｇ１プリント基板７ｈ
を一体的に熱圧着して構成される。

このプリント基板７ｈの前記インターフェース部７ｂに
対向する位置には入出力端子７１が設けられ、また表示
窓部７ｃに対向する位置には液晶表示装置７ｊが設けら
れる。更にはプリント基板７ｈには半導体集積回路７ｋ
が設けられる。またカバー基板７ｅには前記プリント基
板７ｈにおける発熱を発散する為の金属箔７ｍが設けら
れる。

尚、カバー基板７ｄ、　７ｅや埋め込み基板７ｒ１コア
シート材７ｇにそれぞれ穿たれた孔部はプリント基板７
ｈに集積された半導体集積回路７ｊ等にそれぞれ対向す
る位置に設けられたものである。これらの孔部に上記半
導体集積回路７に等を嵌合させて前記カバー基板７ｄ、
　７ｅ、埋め込み基板Ｈ，ココアート材７ｇ１プリント
基板７ｈが積層一体化されてＩＣカードが構成される。

そして入出力端子７１は、カバー基板７ｄに穿たれた孔
部を介して露出し、ワークステーション本体に電気的に
接続されるインターフェース部７ｂを構成する。

尚、前記液晶表示装置７ｊは、例えば第５図にプリント
基板７に部の断面構造を示すように、スペーサを介して
設けられた一対のポリエーテルサルフォンフィルム基板
の間に液晶層を挟持し、該フィルム基板の内側面に透明
導電膜をそれぞれ形成すると共に、下面側のフィルム基
板に偏光体や反射体を設けて構成される。このようにポ
リエーテルサルフォンフィルム基板を用いて液晶表示装
置７ｊを構成すれば、その厚みをｏ、ｅ、以下にするこ
とも容易であり、ガラス基板を用いて液晶表示装置を構
成する場合に比較してＩＣカード自体を薄くすることが
できる。

またこのＩＣカードの駆動電源については、前記インタ
ーフェース部７ｂを介してワークステージジン本体側か
ら供給するようにしても良いが、カード内に内蔵するよ
うにしても良い。この場合には、例えば高分子フィルム
を用いたシート状の電池として組込むようにすれば良い
。

しかして前記半導体集積回路７には、例えば第６図に示
すようにＣＰＵ７ｐやデータメモリであるＰＲＯＭ７ｑ
、Ｅ２　ＰＲＯＭ７ｒ、およびこれらのメモリに対する
選択部７８等を備えて構成される。

ＰＲＯＭ７ｑは消去・書替え不可能な大容量の不揮発性
メモリであり、前記ＣＰＵ７ｐに対する制御プログラム
や、永久記録すべき情報等を格納している。またＥ２Ｐ
ＲＯＭ７ｒは書替え可能な小容量の不揮発性メモリであ
り、例えば情報の取引番号や、情報取引時に用いられる
番号、およびその使用時に更新される情報が格納される
。

これらのメモリは前記選択部７ｓの制御により選択的に
駆動され、前記ＣＰＵ７ｐとの間で情報の入出力を行な
う。ＣＰＵ７ｐはこれ、らのメモリを用い、　　　て必
要な情報処理を実行し、またそのインターフェース部か
ら前述した端子部７１を介して知的ワークステーション
本体との間で情報の入出力を行なう。

前記ＩＣカード部７は、このようなＩＣカードを装着し
、該ＩＣカードとの間で情報の人出力を行なうことにな
る。

尚、ＩＣカードは上述した構成に限定されるものでない
ことは勿論のことであり、その構成に応じてＩＣカード
部７が構成されることも云うまでもない。

次に暗号化処理部１６について説明する。

暗号化処理部１Ｂは、例えば第７図に示すように暗号化
部ｌｅａ　、復号化部１６ｂ、秘密鍵ファイル部１６Ｃ
１公開鍵ファイル部１６ｄ１そして鍵更新部ｌｅｅを備
えて構成される。

そ、して第８図にその概念を示すように、与えられた通
信原文を暗号鍵に従って暗号化してその暗号通信文を生
成したり、また逆に与えられた暗号通信文を暗号鍵に従
って復号してその原文を求める処理を実行する。

秘密鍵ファイル部ｌｅｅおよび公開鍵ファイル部ｌｅｄ
はこの暗号・復号化に用いられる鍵を記憶するものであ
り、鍵更新部ｌｅｅはこれらのファイルされた鍵の更新
を司る。

ここで秘密鍵は、この暗号化処理部ｌＢを所存するワー
クステーションのみが知る鍵であり、他のワークステー
ション等に対しては秘密にされる。

これに対して公開鍵は各ワークステーションに設定され
た各秘密鍵とそれぞれ対をなすものであり、他のワーク
ステーションにそれぞれ与えられて公開される。公開鍵
ファイル部１６ｄは、これらの複数のワークステーショ
ンがそれぞれ公開した公開鍵を、各ワークステーション
に対応して記憶するものである。

暗号化部ｌｅａは第９図に示すように、ＲＳＡ処理部１
８１と暗号化種別付加部１８ｊとを備えて構成される。

そして通信原文を暗号化して情報通信しようとするとき
、その通信相手先のワークステーションが公開した公開
鍵を用いて通信原文を暗号化し、その暗号通信文に暗号
の種別を示す情報を付加して通信情報を作成し、これを
通信するものとなっている。尚、暗号の種別の情報は、
例えば００″で暗号化していないこと、また“１”で暗
号化していることを示す情報や、暗号方式を示す情報等
からなる。

また復号化部１６ｂは、自己ワークステーションが公開
した公開鍵を用いて成るワークステーションが暗号化し
て通信してきた暗号通信文を入力し、これを該秘密鍵に
対応した秘密鍵を用いて復号化するものであり、第１０
図に示すように暗号文分割部１６に、暗号種別判定部１
６■、切換え部１６ｎ。

ｌａｐ、ＲＳＡ処理部１６ｑを備えて構成される。

暗号文分割部１０には、前述したフォーマットで通信さ
れてきた通信情報を前述した暗号種別の情報と暗号化通
信文とに分割するものであり、暗号種別判定部１ｆｉａ
＋は該暗号種別情報からその通信文が暗号化されている
か否かを判別している。そして暗号化されていない場合
にはその通信文を切換え部１８ｎ、　１８ｐを介して出
力し、暗号化されている場合にはその通信文をＲ３Ａ処
理部１６ｑに導いている。このＲＳＡ処理部１８ｑにて
前記秘密鍵を用いて暗号化通信文が復号化処理され、切
換え部ｔｃｐを介して出力される。

尚、Ｒ３Ａ処理部１Ｂ１．１８ｑは、例えば第１１図に
示すようにブロック分割部１８ｓとべき乗・剰余計算部
１６ｔ１およびブロック連結部１６ｕとを備えて構成さ
れる。

ここでブロック分割部１６ｓは与えられた信号系列を一
定の長さのブロックＭ１に分割するものであり、べき乗
・剰余計算部ｔｅｔは各ブロックＭ。

毎に暗号化の鍵ｋを用いてＮ　　　−Ｍ　　　　　（ａ＋ｏｄｎ）なる信号系列Ｎ
１を求めている。但し、ｎは固定の値である。この信号
系列Ｎ１がブロック連結部１１ｉｕを介して順に連結さ
れて出力される。

暗号化処理にあっては、上記信号系列Ｍ１が通信原文で
あり、この通信原文から暗号化された通信文が信号系列
Ｎ１として求められる。また復号化処理にあっては上記
信号系列Ｍ１が暗号化通信文であり、この暗号化通信文
から復号化された通信原文が信号系列Ｎ、として求めら
れる。

このような暗号化・復号化を担う鍵ｋが前述し−た公開
鍵と秘密鍵であり、これらは対をなして設定される。

従ってワークステーションは、他のワークステーション
から公開された公開鍵に従って通信情報をそれぞれ暗号
化することはできるが、その暗号化された通信文を復号
化し得るのは、その公開鍵と対をなす秘密鍵を知り得る
特定のワークステーションだけとなる。

従って成る情報を暗号化して通信しようとするワークス
テーションは、通信相手先のワークステーションが公開
した公開鍵に従って該通信原文を暗号化して通信する。

そしてその通信情報は、秘密鍵を持つ通信相手先のワー
クステーションのみが復号し得るものとなっている。

尚、他のワークステーションがそれぞれ公開した公開鍵
の全てを公開鍵ファイル１６ｄに格納しておく必要はな
い。例えばシステムに対して別に設けられた公開鍵ファ
イル・メモリに、各ワークステーションが公開した公開
鍵を各ワークステーションに対応されてファイルしてお
く。そして情報通信が必要となったとき、その通信相手
先の公開鍵を上記公開鍵ファイル・メモリから読出して
自己のワークステーションの公開鍵ファイル部１６に格
納するようにしても良い。

以上が暗号化処理部１６の基本的な構成とその機能であ
る。

次に音声認識部１９について説明する。

音声認識部１９は、例えば第１２図に示すように構成さ
れる。音声入力回路１９ａは、前記音声入力部５から入
力された音声信号、または公衆電話回線を介して前記通
信装置１２．１３にて受信された音声信号を入力するも
ので、この入力音声信号を適当な信号レベルに増幅する
増幅器や、帯域制限用のバンドパスフィルタおよびＡ／
Ｄ変換器等によって構成される。入力音声はこの音声入
力回路１９ａにて、例えば３０〜３４００　Ｈｚの周波
数帯域の信号に制限され、１２ＫＨ２のサンプリング周
期で１２ビツトのディジタル信号に量子化される。

音響処理部１９ｂは、例えば専用のハードウェアにより
構成された積和回路からなる。そして基本的には前記音
声入力回路１９ａと同期してパイプライン的に高速動作
する。

ここでの音響処理は、２種のバンドパスフィルタ群によ
り実行される。その１つは１６チヤンネルのフィルタバ
ンクで、このフィルタバンクを介して入力音声信号のス
ペクトルの変化が抽出される。

今１つは、同じ帯域を４チヤンネルに分割したグロスフ
ィルタであり、このグロスフィルタを介して入力音声の
音響的特徴が抽出される。

これらの２種類のフィルタ群（フィルタバンクとグロス
フィルタ）は、例えば４次巡回形のディジタルフィルタ
として構成される。そして、例えば１０ｍ５ｅｃ毎にそ
のフィルタリング出力を求めるものとなっている。尚、
この音響処理部の制御はマイクロプログラム方式にて行
われる。

しかして前処理・認識部１９ｃは、高速プロセッサ１９
ｄ１パターンマツチング処理部１９ｃ　、単語辞書メモ
リ１９ｆ　、およびバッファメモリ１９ｇによって構成
される。

バッファメモリ１９ｇは上記音響処理部１９ｂにてフィ
ルタリング処理された音声信号を人力し、例えば最大１
．８秒分の音声データを蓄積するものとなっている。高
速プロセッサ１９ｄはこのバッファメモリ１９ｇに格納
されたデータに対して、音声区間検出、リサンプリング
、ラベリング、遷移ネットワークによる認識処理、およ
びその総合論理判定処理の実行を行なっている。またこ
の高速プロセッサ１９ｄにより、ホスト計算機との間の
通信や該音声認識部１９全体の動作制御が行われる。

この高速プロセッサ１９ｄにて処理された音声データに
ついて、パターンマツチング処理部１９ｅは単語辞書メ
モリ１９ｆ’に登録された単語音声の標準パターンデー
タとの間で複合類似度計算等のマツチング処理を実行し
、その認識候補を求めている。

例えば認識対象となる音声単語は離散的に発声される。

そこで高速プロセッサ１９ｄは、例えば音響処理の際に
ｌｏｍｓｅｃ毎に計算される入力音声エネルギを用いて
単語音声の入力区間を検出している。

具体的には第１３図に示すように、背景雑音レベルと入
力音声レベルとから適応的に計算される閾値Ｅ。を用い
、人力音声信号レベルが上記閾値Ｅｏを一定時間以上継
続して越えたとき、該閾値Ｅ、を越えた時点を音声単語
の始端Ｓとして検出している。その後、上記入力音声信
号のレベルが上記閾値Ｅ、を一定時間以上継続して下回
ったとき、該閾値Ｅ、を下回った時点を音声１１１語の
終端Ｅとして検出している。

ところで音声認識はパターン認識の一種として考え得る
。しかし音声特有のパターン変動や、話者の性別・発声
器官の形状・発声法等に起因する個人差、また話者自身
が発生する雑音や周囲環境の雑音、更には電話音声の場
合には公衆電話回線を経由したことによるレベル差や雑
音の問題がある。この為、これらを考慮し、上述した変
動要素を吸収して、如何に精度良く、安定に音声認議す
るかか問題となる。

そこでこの前処理・認識部１９ｃではパターンマツチン
グ法と構造解析法とを２段階に組合せ、ハイブリッド構
造マツチング法と称される認識法を採用している。

即ち、−上述したように単語音声区間が検出されると、
先ずその音声区間（Ｓ、Ｅ）を１５等分し、その１６点
をそれぞれリサンプル点とする。そして前述した如く音
響処理された１６チヤンネルの音声データ（スペクトル
時系列）から上記各リサンプル点でのスペクトルを抽出
する。尚、音声データのサンプル点と上記リサンプル点
との間でずれがある場合には、リサンプル点の最近傍点
のスペクトルを抽出すれば良い。

このリサンプル処理によって１６ＸｌＢ（−２５６）次
元の音声パターン・ベクトルＸを求める。即ち、第ｊ　
（ｊ−１，２，３，〜１６）番目のりサンプル点をｒ、
とするとき、ｒ、での１６チヤンネルのスペクコＪトルデータをＳ　　、−（Ｓ　　、　　Ｓ　　、、〜５１６ｒｊ）ｒ
Ｊ　　　　１ｒＪ’　　２ｒＪとしてそれぞれ求め、これらのＳ　、を並べ換えｒＪてＸ−（Ｓ　　　　Ｓ　　　　−Ｓ　　　　−Ｓ　　　　
　）ｔｌｒｌ、　　　ｌｒ２．　　　　２ｒ１．　　　
　１６ｒｌＢなる音声パターンのベクトルＸを求める。

但し、ｔは行列の転置を示す。

このようにして求められた入力音声パターンベクトルＸ
と、単語辞書メモリ１９［’に予め登録された単語音声
の標準パターンとの類似度が、例えば複合類似度法によ
って計算される。

ここで単語辞書メモリ１９「に予め登録された単語音声
の標準パターンは、その単語カテゴリωｋについて、（ψ　、ψ　　〜ψ　）１ｋ　　　２に’　　　Ｌｋ（λ　　λ　　〜λ　）１に’　　２に’　　　Ｌｋ但し、（λ　≧λ　≧〜≧λＬｋ）１ｋ　　　２にとして準備されている。尚、ψ　　λ　はカテゴｉｋ’
　　ｉｋすωｋに属するパターンベクトルＸの共分散行列Ｋにお
ける固有ベクトルとその固有値である。このような単語
辞書について、上述した複合類似度Ｓ　（ｋ）はとして計算される。尚、上式においてＩＩ　Ｘ　ＩＩは
ベクトルＸのノルムである。

このような複合類似度計算が全てのカテゴリについてそ
れぞれ行われ、上位に位置する類似度値と、それを得た
カテゴリ名とが対にして求められる。

このような複合類似度法によるパターンマツチングによ
って、多くのパターン変動を救出した認識処理が可能と
なる。しかし類似パターンや雑音が加わったパターンで
は、異なるカテゴリ間でその類似度値の差が小さくなる
ことがある。

そこで前述したようにパターンマツチング法を補うもの
として、以下の構造解析の手法を導入している。この構
造解析は、単語音声を構成する音の違いに着目して認識
処理するもので、音素ラベル系列と音響的特徴系列の２
つの時系列を利用している。

即ち、音素ラベル系列は、入力音声信号からｌＯ＋ｍ５
ｅｃ毎に計算される１６チヤンネルのスペクトルを用い
て音素辞書との類似度を計算し、一定値以上の類似度を
持つ音素のラベル付けして求める。尚、この音素ラベル
は、例えば５つの母音と鼻音との６種類からなる。この
際、音素辞書は、男声と女声に分けてそれぞれ準備して
おく方が望ましい。

ここで比較的安定に発音されるの母音に比べ、子音を音
素として個々にラベル付けすることが困難である。従っ
てその子音についてはその音響的な特徴をラベル付けし
、これを特徴情報とする。

具体的には、音響処理で求められる４チヤンネルのグロ
スフィルタの出力と音声エネルギとから音響的特徴を抽
出する。このようにして特徴抽出されてラベル付けされ
る音響的特徴は、例えば第１４図にグロスフィルタの出
力の特徴と対比して示すように、無音性、無声性、摩擦
性、破裂性、エネルギ・ディップ等の１２種類からなる
。

しかして入力音声について求められた音素・音響ラベル
系列は、前記音声期間（Ｓ、Ｅ）を含む範囲に亙って、
各単語カテゴリ毎に作られた、例えば第１５図に示す如
き遷移ネットワークに入力される。

この遷移ネットワークの各ノード毎に、指定された音素
ラベルや音響的特徴の有無をチェックする。そして無で
あればリジェクト、有であれば次のノードに遷移させ、
その特徴系列が終了した時点で遷移ネットワークのゴー
ルに到達した人力系列を受理し、そのカテゴリを求める
。尚、系列のチェックの方向は、ネットワーク毎にその
正逆を選択可能なものである。

総合判定論理は、前述した如くパターンマツチングによ
って順序付けられた候補カテゴリと、遷移ネットワーク
により求められた認識結果とを総合して、その最終判定
を行なうロジックである。

即ち、この総合判定論理は、パターンマツチングで求め
られた最大類似度を８１としたとき、これを所定の閾値
θと比較する。そして（Ｓｌくθ）の場合、これを雑音
としてリジェクトする。

また（Ｓｌ≧θ）の場合には、別の閾値Δθを用いて（
Ｓｌ−八〇）以上の類似度を持つカテゴリを候補として
抽出する。そしてその抽出されたカテゴリの数ｎが１つ
である場合、これを認識結果として抽出する。また複数
のカテゴリが抽出された場合には、前記遷移ネットワー
クによる解析結果を参照し、遷移ネットワークで受理さ
れたカテゴリのみを抽出する。そしてその中で最大の類
似度を持つカテゴリを認識結果として求める。

尚、閾値処理によって抽出されたカテゴリの中に、遷移
ネットワークで受理されたものが含まれない場合には、
判定不能とする。

以上のようにして複合類似度法によるパターン認識処理
結果と、遷移ネットワークを用いた認識結果とを統合し
てその入力単語音声の認識が行われる。

第１６図はこの音声認識部における単語音声の認識処理
手続きの流れを示すもので、音声区間検出処理の後、リ
サンプル処理してパターンマツチングを行い、同時にラ
ベリング処理して遷移ネットワークによるチェックを行
い、しかる後、これらの各認識結果を統合してその総合
判定論理処理を行なうことが示される。このような処理
が前記高速プロセッサ１９ｄによる処理シーケンスの下
で実行される。

ところで離散的に発声された単語音声ではなく、連続発
声された音声中の単語を認識する場合には次のようにす
れば良い。即ち、この場合には人力音声を種々の部分区
間に分割し、その部分区間毎に単語識別を行なって単語
類似度を求めるようにすれば良い。

具体的には、例えば第１７図に示すように入力音声区間
における全ての分析フレーム間をそれぞれ部分区間の境
界候補とし、該入力音声区間を複数の部分区間に分ける
。この際、認識対象となる単語の継続時間長については
最大時間長Ｄ　　とｌ１ａｘ最小時間長Ｄ　、が設定できるので、その範囲内の部分
区間だけを認識処理対象とすれば良い。

ここで第１７図に示す例では、連続発声された音声の単
語数が２個の場合を想定して２つの部分区間を求めてい
る。しかし一般的には入力音声の単語数は不明であるか
ら、２単語からｎ単語までが単語候補として存在すると
仮定して部分区間をそれぞれ検出すれば良い。そして検
出された各部分区間について単語類似度の計算を行い、
その類似度結果の繋がり関係を相互に比較して最も信頼
性の高い部分区間の境界を求め、その境界によって区切
られた部分区間の各単語認識結果を求めるようにすれば
良い。

然し乍ら、このようにして部分区間を求めて単語類似度
計算を行なう場合、部分区間の数が膨大なものとなる為
、処理の高速化が妨げられる。従って実際的には処理の
高速化を考慮して、例えば入力単語数が２〜５単語、ｌ
単語の継続時間長が１２８〜８４０　ａ＋ｓｅｃ、　１
回の発声における単語長の比が２．５以下、フレーム周
期は１６ｍ５ｅｃ　（８ｍ５ｅｃ周期で２個に１個の単
語を取出す）等の制限を加えて部分区間を検出するよう
にすれは良い。

このようにすれば連続発声された音声中の単語をそれぞ
れ効果的に認識することが可能となる。

ところでこのような音声認識処理に供される辞書（単語
辞書）の学習は次のようにして行われる。

この学習処理は、■母音パターンおよび子音パターンか
らその特性核を求める処理と、■その特性核に対する固
有値と固有ベクトルを求める処理とに大別される。そし
てこの固有値と固をベクトルとを、その固有値の大きい
ものから順にＮ側木める。この処理は一般にＫＬ展開と
称されるものである。

先ず特性核を求める処理について説明すると、入力音声
パターン（学習パターン）の特性核には、その学習パタ
ーンの縦ベクトルをＳ　としたとき、次のようにして求
められる。

５−（Ｓ　　　　Ｓ　　　　−Ｓ）’ ｍ　　　　ｏｗｌ’　　ｍ２’　　　　ａ＋ｎ尚、この
学習パターンＳ　は、子音パターンの場合には６４次元
の縦ベクトルとして与えられる。

また母音パターンの場合にはＩＢ次元の縦ベクトルとし
て与えられる。

しかして特性核には、ｍ個の学習パターンについて、そ
の縦ベクトルＳ　と、この縦ベクトルＳ　を転置した横
ベクトルＳ　とを掛合わせて作ｌｌｌ１ｌ成される行列の各成分を、上記ｍ個の学習パターンに亙
って平均化して求められる。従って特性核の要素数は上
記ベクトルの要素数の２乗となる。

尚、このような処理によってそのカテゴリのパターン分
布を反映した特性核Ｋを得るには、成る程度の量の学習
パターンを必要とする。この為、学習パターン・メモリ
に予め所定数の学習パターンを蓄積しておくことが必要
となる。

ところが母音の場合には１６次元で最低６個のカテゴリ
の学習パターンを準備するだけで良いが、子音の場合に
はｌｏｔカテゴリも存在し、しかも６４次元のデータと
して求める必要がある。この為、このままでは膨大なメ
モリ容量を必要とすることが否めない。

そこで少数の学習パターンによってパターン分布を反映
した特性核Ｋを得るべく、次のような特性核の更新処理
を行い、逐次計算によってその特性核を次第にパターン
分布を反映した形に改良して行くようにする。

即ち、Ｋ＝に’＋ｗＳ　　　Ｓ　　’ 　　　　ｎなる演算処理を繰返し実行するようにする。但し、Ｗは
特性核の更新時における徂み係数である。この重み係数
Ｗは正負の値を取り、正ならば特性核行列の入カバター
ンに対する類似度を大きくし、逆に負ならば上記類似度
を小さくする作用を呈する。

またに′はＳ　なる学習パターンを学習する前の特性核
を示しており、Ｋは学習パターンＳ　の学習によって更
新された特性核を示している。

しかる後、このようにして求められた特性核に対して、
その固有値と固有ベクトルを求める処理が行われ、この
固有値と固有ベクトルとに基いて前述した複合類似度計
算に用いられる標準パターンが作成される。

標準パターンは、上記特性核をＫＬ展開することによっ
て求められるものであり、例えばべき東方によるＫＬ展
開によってその標準パターンが求められる。

今、特性核Ｋが固有値λ　、λ２．〜λ　を持ｌ　　　
　　　　　　　　　　　ｎち、これに対応する固有ベクトルξ　、ξ２．〜■ ξ　を持つものとする。この場合、その任意ベクトルＵ
　は、上記固有ベクトルξ　、ξ２．〜ξ　の線形結合
してＵ　−Σ　αｉ　ξ１として表わされる。このとき、Ｋξ１″″λｉ　ξｉなる関係が成立することから、 −・・・・・・　−Σ　α　λ、８１＝１　　ｉ　　ｌ　　ξｉとなる。

ここで・・・・・・　　〉１λ　１１λ　　１〉１λ２１〉Ｉ　　　　　　　　　　　　　　　　ｎ［λｌ／λ１１
　＞　１　　　（１−２，３，〜、ｎ）であるから、Ｓ
が十分大きくなると４二式の第２項がＯに収束すること
になる。

故に前述した式をＫｕ　　閣αｌ　λ１　　ξ１と石像すことができる。

ｓｏｌこのことは、（Ｋ　　　ｕ　　）と（Ｋｕ）とｏ　　　
　　　　　　　　　　　　　Ｏの比が固を値λｌである
ことを示している。また（Ｋｓｕ）は固をベクトルξｌ
に比例していることが示される。

ところでこのような理論に基く演算過程にあっては、そ
の演算途中結果が直ぐにスケールアウトするすることが
多い。そこでＵ　を任意の、例えば単位ベクトルとし、ｖｓ−１′″ＫｕＯｕ　　　＝（ｖ　　　）／（ｂ　　　）ｓｏｌ　　　　
ｓｏｌ　　　　　３＋１（ｓｍＯ，１，２，・・・）なる演算を実行するようにする。ここで（ｂ　　　）ｓ
ｏｌは、ベクトル（ｖ　　　）の絶対値が最大の要素でｓｏ
ｌある。このとき、ｕ　　　−（ｖ　　　）／（ｂ　　　）ｓｏｌ　　　　
　ｓｏｌ　　　　　　５ｏ１＝（Ｋｕ　　）／（ｂ　　
　）ｓ　　　　　　５ｏ１＝（Ｋｖ　　）／（ｂ　　　−ｂ　　）ｓ　　　　　　
ｓｏｌ　　　　ｓｓｏｌ＝（Ｋ　　　ｕ）／（ｂ　　　・・・・・・ｂ　）ｏ　
　　　　　　　　　ｓｏｌ　　　　　　　　ｓとなるこ
とから、これよりλ　、ｂ　　、ξ　。

ｌ　　　　　　ｓｏｌ　　　　　　１ｕ８＋１を求めることが可能となる。

このようにしてその絶対値が最大の固有値λ１と固有ベ
クトルξ１とを求めたら、次に同様にしてその絶対値が
次に大きい固有値λ２と固有ベクトルξ２とを求める。

ここで【Ｋ’−に−λ１　ξ１　ξ１を考えると、 ξＩＬξ１−０　　（ｉ−２，３，〜、ｎ）より、Ｋ′　ξ　−にξ　−λ　ξ　ξ　　　ξ１１　　　　
１　　　　Ｉｌｌ ■λｌ　ξｌ　−λ１　ξｌ　冒０　　（１−１）Ｋ′
　ξ　−にξ１−λ１ξ１　ξｉ　　ξ１■ 一λ１　ξｌ　　　　　　　　（１ｑｋｌ）となる。従
って上記に′は、１λ２１〉・・・〉１λ、１＞−・・〉１λｎ　＋＞０
なる固有値を持つことがわかる。尚、ここではξｌは正
規化されているとしている。

このような処理は、前記特性核をＫ′　−に−λｌ　ξ・ξ として変換したに′に対して、上述した処理を繰返し実
行することによって達せられる。この処理によって絶対
値の大きい固有値とそれに対応する固有ベクトルが順に
求められ、辞書の学習が行われる。

ｆ４１８図はこのような計算アルゴリズムに基いて実行
される辞書の学習処理の手続きを示すものである。

次に文字認識部２１について説明する。

この文字認識部２１は、スキャナ等によって読取られた
文字を認識する第１の文字認識ブロックと、タブレット
等を介してオンライン人力される文字情報を認識する第
２の文字認識ブロックとによって１１４成される。

この第１の文字認識ブロックは、例えば第１９図に示す
ように、スキャナ等によって読取り人力された画像デー
タを格納する画像メモリ２１ａと、この画像メモリ２１
ａに格納された画像データ中から認識対象とする文字が
記載された領域を検出する領域検出部２１ｂ、この領域
検出結果に従って前記画像メモリ２１ａに格納された画
像データ中から認識対象とする文字データを抽出する文
字抽出部２１Ｃ１そして標章パターン辞書２１ｄに予め
登録された認識対象文字の各標準文字パターンと、上記
文字抽出部２１ｃにて抽出された文字パターンとを個々
に照合して文字認識する識別部２１ｃとによって構成さ
れる。

この文字認識ブロックは、例えば第２０図に示すように
ＦＡＸ送信原稿用紙２１１’上の所定の位置に設定され
、送信宛先が記入される文字枠２１ｇに記載された文字
を認識するものである。このような送信宛先が記載され
る原稿用紙２１ｒは、送信原稿が複数枚からなる場合、
その一番最初（１枚口）の原稿として用いられる。そし
てこの１枚口の原稿の読取り入力された画像データが文
字認識処理の為に前記画像メモリ２１ａに蓄積される。

領域検出部２１ｂは、予め定められているＦＡＸ送信原
稿用紙２１ｆ’のフォーマット情報から前記文字枠２１
ｇの位置情報を得、認識対象とする文字が記載される領
域を検出するものである。文字抽出部２１ｃはこの領域
検出情報と、その画像情報の射影パターンの情報とを用
いて、例えば第２１図に示すように前記文字枠２１ｇに
記載された文字の画像データを個々に抽出している。

識別部２１ｅは、例えば特公昭４９−１２７７８号公報
等に開示されるように、抽出された文字画像からその文
字パターンの特徴を抽出し、その抽出した文字パターン
と標準パターン辞１２１ｄに登録された各文字の標準パ
ターンとをパターンマツチングしている。そしてこのパ
ターンマツチングによって照合の取れた標準パターンの
文字カテゴリをその認識結果として求めている。

尚、パターンマツチングの手法は種々変形できることは
云うまでもない。

ところでタブレット等を介してオンライン入力される文
字情報を認識する第２の文字認識ブロックは、例えば第
２２図に示すように構成される。

この第２の文字認識ブロックは、タブレット等を介して
オンライン入力される文字の筆記ストロークを示す位置
座標の系列を順次検出する座標検出回路２１ｈを備えて
いる。

この座標検出回路２１ｈにて検出された位置座標の時系
列データは前処理回路２１ｉに人力され、前記タブレッ
ト４における検出誤り等の微小な雑音が除去された後、
座標系列記憶回路２１ｊに順に記憶され、文字認識処理
に供される。尚、この前処理回路２１Ｉにて、例えば１
文字分の文字が入力されたとき、その文字の大きさの正
規化処理等が行われる。

また画数検出回路２１には、例えば筆記ストロークの途
切れ（位置座標データの時系列の区切り）から、その文
字パターンの筆記ストローク数、つまり画数を検出して
いる。

しかして認識処理部２１ｍは、前記画数の情報に従って
標準特徴パターンメモリ２１ｎに登録された認識対象文
字カテゴリの標準パターンの中から、該当する画数の標
準パターンを選択的に抽出している。そしてこの標準パ
ターンの各ストロークの特徴と座標系列記憶回路２１ｊ
に記憶された入力文字パターンのストロークの特徴とを
相互に比較（マツチング処理）でいる。答決定回路２１
ｐはそのマツチング処理結果を判定し、入力文字パター
ンのストロークの特徴に該当するストロークを持つ認識
対象文字カテゴリを、その認識結果として求めている。

つまりオンライン入力される文字パターンの筆記ストロ
ークの特徴に従って、そのストロークの特徴を標準文字
パターンのストロークの特徴とマツチング処理して上記
入力文字パターンを認識するものとなっている。

尚、ストロークの特徴としては、筆記ストロークを折線
近似したときの端点や交点、折点等の位置座標の情報を
用いるようにすれば良い。

以１〕のような機能を備えた文字認識部２１によって、
スキャナ等を介して読取り入力された文字情報や、タブ
レット等の位置座標入力装置を介してオンライン入力さ
れる文字情報がそれぞれ文字認識される。

次に図形認識部２２について説明する。

この図形認識部２２は、例えば第２３図に示すように構
成される。入力部２２ａは、例えば撮像入力された図形
画像を記憶し、図形認識処理に供する。

輪郭追跡部２２ｂは、例えば線分の追跡方向を第２４図
に示すように８方向に分け、入力画像中の図形の輪郭を
追跡したときにその追跡方向がどの向きであるかを順に
求めている。具体的には、例えば第２５図に示すように
三角形の図形を右回りに追跡し、その追跡の向きの情報
を、例えばｒ　１．２．〜２，３．４．〜４，５．７．
〜７」なる方向コードの系列として求めている。

セグメンテーション部２２ｃは、このようにして求めら
れる方向コードの系列から、例えばその曲りの部分等の
特異点を抽出し、この特異点に従って該図形の輪郭を複
数の特徴部分に分割している。

マツチング部２２ｄはこのようにしてセグメンテーショ
ンされた図形輪郭の情報と、辞書メモリ２２ｅに登録さ
れている各種図形の特徴情報とをマツチング処理して入
力図形を認識するものとなっている。

例えば第２６図に示す図形が与えられた場合には、その
輪郭追跡によって求められる方向コードの系列から、例
えば相互に隣接する３つの輪郭点（１−１，１，１＋１
　）で方向コードの和を順に求め、これをその中央の輪
郭点ｉにおける方向コードとして平滑化処理する。この
平滑化処理によってノイズ成分の除去を行なう。

しかる後、セグメンテーション部２２ｃにて輪郭の特徴
点である端点、つまり曲りが急峻な点を検出し、その端
点を中心としてその輪郭を分割する。

そしてその分割された輪郭部分毎に辞書メモリ２２ｅと
照合し、その認識結果を求める。

以上の処理によって、第２７図に例示するように丸図形
は端点が存在しないこと、三角図形は端点が３つ検出さ
れること、四角図形は端点が４つ検出されること等から
、これらの図形がそれぞれ識別認識される。この際、上
記各端点がそれぞれ凸状であることや、端点を結ぶ輪郭
が直線・曲線である等の情報を図形識別に利用しても良
い。

これに対してイメージ認識部２３は次のように構成され
る。

第２８図はこのイメージ認識部２３の概略構成を示すも
ので、原画画像メモリ２３ａ　、２値化装置２３ｂ１処
理画像メモリ２３ｃ１細線化装置２３ｄ１そしてコード
変換装置２３ｃによって構成される。

画像メモリ２３ａは与えられた認識対象イメージ画像を
記憶するもので、２値化装置２３ｂはこれを２値化処理
して画像メモリ２３ｃに格納している。

この２値化レベルは、例えば２値化画像をディスプレイ
モニタしながら可変設定される。

しかして細線化装置２３ｄは２値化されたイメージ画像
を細線化処理してそのイメージを線図形化するものであ
る。この細線化処理されたイメージ画像によって前記画
像メモリ２３ｃが書替えられて認識処理に供される。

コード変換装置２３ｏは、例えば第２９図に示すように
構成され、先ずセグメント分割部２３１’にて上記細線
化画像を複数のセグメントに分割している。このセグメ
ントの分割は、例えば線図形をその端点や分岐点、交点
にて分割することによって行われる。曲率変換部２３ｇ
はこのようにして分割された複数のセグメントについて
、それぞれその曲率を求めている。

直線・曲線分割部２３ｈ１曲線分割部２３Ｉ、屈折点分
割部２３ｊ、および変曲点分割部２３ｈは、上述した如
く分割された各セグメントを、その曲率の情報に従って
更に分割するもので、これらによって屈折点や直線と曲
線との切替わり点、変曲点、曲線における半径変化点等
がそれぞれ検出される。このようなセグメント分割と特
徴点検出によって前記イメージ線図形を構成する各部の
情報がそれぞれ抽出される。

近似情報作成部２３ｍは、これらの分割されたセグメン
トおよびそのセグメント中の特徴点の情報を総合して前
記イメージ図形を表現する情報、例えば各セグメントの
始点および終点の位置座標、およびそのセグメントの種
別を特定するコード情報を得る。

例えば入力イメージ画像が第３０図（ａ）に示す如く与
えられた場合、その入力画像中のイメージ線図形２３ｎ
を細線化して抽出し、同図（ｂ）に示すようにセグメン
ト分割する。この例では、円図形と四角図形とが直線に
よって所謂串刺しにされたイメージ線図形２３ｎが入力
されている。しかしてこのイメージ線図形２３ｎは、第
３０図（ｂ）に示すようにその交点で分割され、２つの
半円と２つのコの字状図形、および４つの直線にセグメ
ント化される。

曲率変換部２３ｇは、第３１図に示すようにセグメント
分割された各セグメントの曲率を求めており、前記直線
・曲線分割部２３ｈ１曲線分割部２３１．屈折点分割部
２３ｊ、および変曲点分割部２３ｈはその曲率変化点か
ら各セグメントの特徴点を検出している。具体的には第
３１図（ａ）に示す例では２つの直線の屈折点における
曲率が急峻に増大することから、その曲率の変化から屈
折点を検出することが可能となる。また第３１図（ｂ）
に示す例では直線から曲線への変化部分で曲率の変化が
検出されるので、この曲率の変化からその特徴点を検出
することができる。

同様にして第３１図（ｃ）（ｄ）に示す例でも、その曲
率の変化点から、そのセグメントにおける特徴点を検出
することが可能となる。

このようにしてイメージ認識部２３では、与えられたイ
メージ図形をセグメント化し、各セグメントの特徴点を
検出している。そして該イメージ線図形を複数のセグメ
ントの各種別を示すコード情報とその位置座標として近
似表現して認識するものとなっている。

さて音声照合部１７は次のように構成されている。

この音声照合部１７は、音声入力した話者を個人認識（
個人同定）するものであり、例えば第３２図に示すよう
に構成される。

即ち、音声人力部１７ａを介して与えられる音声は、音
韻フィルタ１７ｂおよび個人用フィルタ１７ｅにてそれ
ぞれフィルタリングされ、その音声特徴が抽出される。

音韻フィルタ１７ｂの瓜数のチャンネルの各帯域は、例
えば第３３図（ａ）に示すように音声周波数帯域を等分
割して設定されている。

このようなフィルタ特性を備えた音韻フィルタ１７ｂに
よって入力音声の音韻特徴を示す特徴パラメータが抽出
される。尚、各チャンネルの帯域幅を、音声周波数帯域
を対数関数的に分割設定したものとしても良い。

これに対して個人用フィルタ１７ｃの複数のチャンネル
の各帯域幅は、第３３図（ｂ）に示すように音声周波数
帯域を指数関数的に分割して設定されている。このよう
なフィルタ特性を備えた個人用フィルタ１７ｃによって
、前記入力音声の低域から中域にかけての音声特徴が、
高域側の特徴に比較して多く抽出されるようになってい
る。そしてこれらの各チャンネルのフィルタ出力が個人
照合用の特徴パラメータとして求められている。

しかして単語認識部１７ｄは、前記音韻フィルタ１７ｂ
を介して求められた音韻特徴パラメータから、その入力
音声が示す単語を単語辞！Ｆ１７ｅを参照して認識する
ものである。この単語認識の機能は前述した音声認識部
１９と同様であり、該音声認識部１９の機能をそのまま
利用するようにしても良い。

そしてこの単語認識結果に従って個人辞書１７ｆ’の個
人照合に供される辞書が選択される。この個人辞書１７
ｒは、話者照合の対象とする個人が予め発声した特定の
単語の前記個人用フィルタ１７ｃによる分析結果を、そ
の単語毎に分類して登録したものである。

しかして話者照合部１７ｇは、個人辞書１７１’から選
択された該当単語の各特徴パラメータと、前記個人用辞
書１７ｃにて求められた人力音声の特徴パラメータとの
類似度を計算し、その類似度値を所定の閾値でそれぞれ
弁別している。そしてそれらの弁別結果を相互に比較し
て、例えば類似度値が最も高く、次に高い類似度値との
差が十分にある特徴パラメータを得た個人カテゴリを該
入力音声の発声者であるとして個人同定している。

ここで個人用フィルタ１７ｃの特性について更に詳しく
説明すると、前述したように音韻特徴フィルタ１７ｂと
は異なる特性に設定されている。この音声の個人性の識
別性について考察してみると、その識別性は、例えばＦ比−（個人間分散）／（個人内分散）として与えられ
るＦ比によって評価することができる。

今、音韻フィルタ１７ｂに設定されたフィルタ特性の各
チャンネル出力のＦ比について検討すると、第３４図に
実線で示す指数関数的な傾向を示す。

これ故、従来では専ら高域側の音声特徴情報を利用して
個人照合を行なっている。

しかし音声の高域側の特徴だけを用いるよりも、全周波
数帯域の音声特徴を用いて個人同定が可能であれば、そ
の照合精度が更に向上すると考えられる。即ち、全周波
数帯域においてＦ比の値が１以上となり、個人間分散が
個人内分散を上回れば、更に精度の高い個人照合が可能
となる。

そこでここでは、前述したように個人用フィルタ１７ｃ
の特性を指数関数的に定め、個人性の特徴が顕著である
高域側については大雑把に特徴抽出し、低域側のチャン
ネル割当て数を増やすことによって該低域側の音声特徴
を細かく抽出するようにしている。

具体的には各チャンネルのＦ比の変化が指数関数的な傾
向を示すことから、低域側チャンネルの帯域幅に比較し
て高域側チャンネルの帯域幅を指数量数的に増大させた
フィルタバンクを構成し、これを個人用フィルタ１７ｃ
としている。

このように構成されたフィルタ１７ｃの各チャンネル出
力によれば、そのＦ比は第３４図に破線で示すようにな
り、中域でのＦ比の大幅な向上が認められる。この結果
、高域側の音声特徴のみならず、中域における音声特徴
をも積極的に利用して個人照合を行なうことが可能とな
り、その照合精度の向上を図ることが可能となる。

即ち、この音声照合部１７では、入力音声の単語認識に
供する特徴とは別に、フィルタバンクの工夫によりその
個人性が顕著に現われる特徴情報を抽出している。この
結果、入力音声に対する音韻認識とは独立にその話者に
対する個人同定、つまり個人照合を高精度に行なうもの
となっている。

次に音声合成部２Ｂについて説明する。

音声合成部２Ｂは、第３５図に示すように判別器２６ａ
、復号器２８ｂ、規則パラメータ生成装置２６Ｃ６およ
び音声合成器２８ｄを備えて構成される。

判別器２８ａは入力されたコード列が文字列であるか、
或いは音声合成の為の分析パラメータを示す符号列かを
判定するものである。この情報判別は、例えば入力コー
ド列の一番最初に付加された識別情報を判定することに
よって行われる。そして分析パラメータであると判定し
た場合には、その符号列を復号器２６ｂに与え、これを
復号処理してその音韻パラメータと韻律パラメータとを
それぞれ求めている。

また文字列と判定した場合には、その文字列データを規
則合成パラメータ生成装置１ｆｌｃに与え、その音韻パ
ラメータと韻律パラメータとの生成に供している。

音声合成器２６ｄは、このようにして復号器２６ｂまた
は規則合成パラメータ生成装置２８ｃにて求められた音
韻パラメータと韻律パラメータとに従い、音源波を声道
近似フィルタを介して処理して合成音声波を生成してい
る。

ここで規則合成パラメータ生成装置２θＣについて更に
説明すると、該装置２６ｃは第３６図に示す如く構成さ
れている。文字列解析部２８ｅは言語辞書２６を参照し
て入力文字列中の単語を個々に同定し、その単語につい
てのアクセント情報や単語・文節境界、品詞・活用等の
文法情報を求めている。

そしてこの解析結果に対して音韻規則、および韻律規則
がそれぞれ適用され、その制御情報が生成される。

ここで音韻規則は、解析された単語の読みの情報を与え
ると共に、単語の連接によって生じる連濁や無声化等の
現象を実現し、その音韻記号列を生成するものである。

音声パラメータ生成部２８ｇはこの音韻記号列を入力し
、その音節単位に従ってＣｖファイル２８ｈから音節パ
ラメータを順次求めて補間結合している。この音声パラ
メータ生成部２８ｇにて上記音韻記号列から音韻パラメ
ータ系列が生成される。

また韻律規則は、単語・文節境界等の文法情報に従って
発話の境界や息継ぎ位置を決定し、各音の継続時間長や
ポーズ長等を決定するものである。

同時にこの韻律規則により、各単語の基本アクセントを
ベースとし、文節アクセントを考慮した韻律記号列が生
成される。韻律パラメータ生成部２６１はこの韻律記号
列を入力し、ピッチの時間変化パターンを表わす韻律パ
ラメータ列を生成して°いる。

一方、人力コード列が音声合成の為の分析パラメータを
示す符号列である場合、前記復号器２Ｂｂは次のように
機能している。

即ち、分析パラメータの符号列がＣｖファイルのケプス
トラム係数を示す場合、その符号列２６＋ｎは一般に第
３７図に示すようにパラメータＰ（ピッチ）とＣｏ、Ｃ
１，〜Ｃｍ　　（ケプストラム係数）に対してビット割
当てがなされて情報圧縮されている。そこで復号器２６
ｂではパラメータ変換テーブル２８ｎを用い、上記情報
圧縮された分析パラメータを音声合成器２６ｄに合せた
ビット数に変換・復号している。例えば各パラメータを
それぞれ８ビツトに変換し、音韻パラメータ列（ケプス
トラム係数）とその韻律パラメータ列（ピッチ）とをそ
れぞれ求めている。

音声合成器２６ｄは、例えば第３８図に示すように有声
音源２６ｑと無声音源（Ｍ系列発生器）２６ｒとを備え
、入力される韻律パラメータ列のピッチデータＰに従っ
て有声音源波（Ｐ≠０）、または無声音源波（Ｐ−０）
を選択的に発生している。

この音源波は前置増幅器２１３ｓに入力され、前記音韻
パラメータのケプストラム係数Ｃに応じてしベル制御さ
れて対数振幅近似ディジタルフィルタ２６【に入力され
る。この対数振幅近似ディジタルフィルタ２８ｔは前記
音韻パラメータのケプストラム係数Ｃ、〜Ｃに従って声
道特性を近似するｌ共振回路を構成し、上記音源波をフィルタリング処理す
るものである。この対数振幅近似ディジタルフィルタ２
６ｔにて前記音韻パラメータおよび韻律パラメータで示
される音声データが合成出力される。

そして対数振幅近似ディジタルフィルタ２８ｔにて合成
された信号は、Ｄ／Ａ変換器２６ｕを介した後、ＬＰＦ
２０ｖを介してフィルタリングされて合成音声信号（ア
ナログ信号）として出力される。

以上のように構成された音声合成部２Ｂにて、人力デー
タ系列からそのデータ系列が示す音声が規則合成されて
出力される。

次にイメージ合成部２７について説明する。

イメージ合成部２７は、第３９図に示すように制御計算
機２７ａ、ディスプレイファイルメモリ２７ｂ、イメー
ジ合成回路２７ｃ、イメージメモリ２７ｄ、そして必要
に応じてディスプレイ２７ｅを備えて構成される。

尚、このディスプレイ２７ｅは、該ワークステーション
について準備された前記ディスプレイ部ｌＯであっても
良い。

イメージ合成回路２７は、専用の制御計算機２７ａの制
御の下でディスプレイファイル２７ｂに書込まれている
ベクトルや多角形・円弧のパラメータを読出し、それに
よって示される線図形を発生してイメージ・メモリ２７
ｄの指定されたアドレスに書込んでいる。このイメージ
合成回路２７のイメージ発生機能によってイメージメモ
リ２７ｄ上に指定された線図形イメージが構築される。

そしてこの線図形イメージは、制御計算機２７ａの制御
の下で前記ディスプレイ２７ｅにて表示されてモニタさ
れる。

またイメージ発生回路２７ｂは、イメージ発生に対する
特殊処理機能と塗潰し処理機能とを備えている。この特
殊処理機能は、例えば段数のイメージ図形の重なりに対
して隠線の消去を行なったり、クリッピング処理を行な
う等の機能からなる。また塗潰し機能は、イメージ図形
の部分領域を指定された色を用いて塗潰す処理からなる
。

このようなイメージ合成回路２７ｂの機能によって、種
々のイメージ図形が作成され、またその合成処理等が行
われる。

ところで上述した如く発生したイメージ図形と自然画と
の合成は次の２つに大別される。その１つは、例えば風
景写真等の自然画を背景として、その中に計算機処理に
よって求められたイメージ画像を埋め込み合成する処理
であり、他の１つのは計算機が内部モデルとして持って
いる成る平面イメージ内に自然画を埋め込み合成する処
理からなる。

ここで前者の自然画中にイメージ画像を埋め込み処理す
る場合には、例えば第４０図にその概念を例示するよう
に、計算機が発生する図形中に「透明色」を示すコード
を与えておき、これを自然画に対して重ね合せて合成す
ることによって達せられる。すると「透明色」コードが
与えられた画像領域は、自然画の情報がそのまま表示さ
れることになり、その他の部分は計算機が発生した図形
が表示されることになる。この結果、辿然画を背景とし
たイメージ合成が実現されることになる。

この手法はオーバーレイと称される。

これに対して第４１図にその概念を示すように画像メモ
リ内に自然画を書込んでおき、その上（手前）に計算機
が発生した図形を書込んで行くようにしても良い。この
手法は２バツフア法と称されるものであり、前述したオ
ーバーレイ法と共に比較的簡単に実現することができる
。

ところで計算機の内部モデルとして示される平面内に自
然画を嵌め込み合成する後者の場合には、次のようにし
て高速処理される。

平面上にある自然画を、３次元空間内の任意の方向を向
いている平面に埋め込む為に必要な座標変換は次式で与
えられる。

但し、Ｘ、Ｙは表示面での座標であり、ｕ、ｖは自然画
での座標である。

この座標変換処理をそのまま実行しようとすると、１画
素を表示する毎に６回の乗算と２回の除算が必要となり
、膨大な計算量と計算処理時間を必要とする。

そこでここでは、次のような中間座標（ｓ、ｔ）を介し
て上述した演算を２回の変換処理に分解して実行するも
のとなっている。この演算処理は、例えばアフィン変換
を利用して高速に実行される。

Ｕ細（α　Ｓ＋α　ｔ＋α　）／　ｔ　　　　（１）ｖ
−（αｓ　＋　ａ　ａ　ｔ　＋ａ　９）　／　ｔｓ　＝
　ＣＸ　−Ｃ４Ｙ　　　　　　　　　　　（２）ｔ−１
ＩＣＸ十Ｃ５Ｙ＋ＣＢ即ち、上述した第（１）式を用いて透視変換を行い、そ
の後、第（２）式を用いて２次元アフィン変換を行なっ
て任意の平面への透視変換を高速に行なうものとなって
いる。

ここで、第（１）式の分母は座標ｔそのものであるから
、従来より知られているアフィン変換回路を若干改良す
るだけでその演算を高速に実行することが容易である。

このようにしてイメージ合成部２７では種々のイメージ
合成処理を高速に実行するものとなっている。

次に出力形態選択部２４について説明する。

この出力形態選択部２４はメディア選択要求信号を受け
て起動され、どのメディアを通じてデータ出力するかを
選択するものである。つまり種々のメディアのうち、ど
のメディアを通じて情報伝送するかを選択するものであ
る。

第４２図はこの出力形態選択部２４の概略構成図であり
、メディア選択制御部２４ａ、入力メディア判定部２４
ｂ、相手メディア判定部２４Ｃ，メディア変換テーブル
２４ｄ、および自己メディア機能テーブル２４ｅを備え
て構成される。また第４３図はこの出力形態選択部２４
の処理の流れを示すものである。この処理手続きの流れ
に沿って該出力形態選択部２４の機能を説明する。

メディア選択要求信号が与えられるとメディア選択制御
部２４ａは前記制御部２に対してメディア選択動作に必
要な入力メディア情報の提供を要求する。そして入力メ
ディア判定部２４ｂに対してメディア情報検出要求とメ
ディア機能識別要求を発する。

人力メディア判定部２４ｂはメディア検出部２４ｒとメ
ディア識別部２４ｇとによって構成され、上記メディア
選択制御部２４ａによる情報要求を受けて制御部２から
与えられる人力メディアを検出し、且つその検出メディ
アの機能を識別判定するものとなっている。この入力メ
ディア判定部２４ｂは、例えば入力メディアが音声であ
る場合、そのメディアの機能がＡＤＰＣＭである等とし
て識別判定する。

しかる後、メディア選択制御部２４ａは制御部２に対し
てそのデータ出力の相手先が自己端末（ワークステーシ
ョン内）の他の機能ブロックであるか、或いは通信回線
等を介して接続される別のワークステーションや通信端
末であるかを間合せる。

そして別のワークステーションや通信端末に対してデー
タ出力することが指示されると、メディア選択制御部２
４ａは送信相手局に関する識別情報を制御部２に対して
要求する。この要求を受けてデータ出力する相手局に関
する情報が相手メディア判定部２４ｃに入力される。

相手メディア判定部２４ｃは、相手局識別部２４ｈ。

相手局メディア識別部２４１１機能識別部２４ｊを備え
て構成され、前記メディア選択制御部２４ａからの識別
情報判定要求を受けて作動する。そして相手局に対する
識別情報から、先ず相手局を識別し、相手局のメディア
を識別する。そしてその相手局メディアの機能を識別す
る。

具体的には、例えばデータ出力（送信）する相手局が自
動ＦＡＸであり、その通信メディアがイメージであって
、その機能がＧｕｔタイプである等を識別する。尚、こ
の相手局の識別は、相手局からそのネゴツエーション（
ハンドシェーク）機能を用いて送られてくる情報に基い
て行うよにしても良い。またネゴツェーション機能がな
い場合には、そのメディア検出機能を機能識別部２４ｊ
に持たせておけば良い。このようにすれば相手側からの
メディア情報信号に従ってその機能識別を行なうことが
可能となる。

第４４図はこの相手局の識別処理手続きの流れを示すも
のである。この流れに示されるように、例えば通信相手
局が電話か否かを判定し、電話である場合にはＦＡＸ信
号が到来するか否かを判定する。

そして相手局が電話であり、ＦＡＸ信号が到来する場合
には、これを相手機器がＦＡＸであると識別すれば良い
。また電話であると判定され、ＦＡＸ信号が到来しない
場合には、相手機器は通常の電話であると判定すれば良
い。更に電話でないと判定された場合には、相手機器は
電話以外の他の通信機器であると判定するようにすれば
良い。

このようにして通信相手局のメディアが識別判定される
と、次にメディア選択制御部２４ａは、例えば第４５図
に示すように構成されたメディア変換テーブル２４ｄを
参照して、入力メディア、入力機能、相手機器、相手機
器メディア、相手機器の機能に対応したメディア変換選
択情報を得る。

例えば入力メディアが音声で、その機能がＡＤＰＣＭで
あり、相手機器がＧＩＩＩタイプのＦＡＸである場合、
相手機器のメディアがイメージであること、そして主な
メディア変換機能が（音声）ｔｏ（コード文字）（コード文字）　　ｔｏ　　（イメージ）であること等
が求められる。同時にそのその企換機能が、（ＡＤＰＣＭ；音声）　　ｔｏ　　（ＧＩＩ［；ＦＡＸ
）によって実現できることが求められる。この際、従属
的なメディア変換情報が存在すれば、これも同時に求め
られる。

このようにして求められたメディア変換情報が制御部２
に与えられ、前記データ出力の形式が選択的に指定され
る。

尚、データ出力が自己のワークステーション内部に対し
て行われる場合には、メディア選択制御部２４ａは自己
メディア機能テーブル２４ｅを参照して、データ出力が
可能な出力形式を求める。この情報に従ってメディア選
択制御部２４ａは前記メディア変換テーブル２４ｄの自
己メディア変換テーブルを参照し、同様にしてメディア
変換情報を求め、これを制御部２に与える。

このようにして求められるメディア変換情報に従って、
例えば前述した音声合成部２６を用いて文字コードの系
列で与えられる文章情報を音声情報に変換してデータ出
力したり、或いは音声認識部１９を用いて音声情報を文
字コード系列の情報に変換してデータ出力することにな
る。

次にデータベース部３２について説明する。

データベース部３２はコードやイメージ、音声等の各種
のデータを整理して格納し、これを種々の応用システム
に供するものである。第４６図はこのデータベース部３
２の概略構成を示すもので、コマンドの解析処理等を実
行するインターフェース部３２ａ１データベースの検索
処理等を実行するデータ操作部３２ｂ、種々のデータを
格納する記憶媒体としての磁気ディスク装置３２ｃや光
デイスク装置３２ｄ１そしてその付加機能部３２ｅとに
よって構成される。

種々のデータは、そのデータの種別に従って複数のりレ
ーションに分類整理され、各リレーション毎にそれぞれ
登録されてデータベースが構築されている。

以下、このデータベース部３２を、その論理構造、蓄え
られるデータ、物理構造、および付加機能の４つに分け
て説明する。

論理構造とはこのデータベース部３２を応用システム側
から見た場合、種々のデータがどのように蓄積されてい
るかを示すものである。ここではりレーシッナル・モデ
ルに従った論理構造として、例えば第４７図に示すよう
な表のイメージとしてデータが取扱われるようになって
いる。

表（リレーション）には幾つかの欄（アトリビュート）
が設けられており、これらの各欄に所定の単位のデータ
がそれぞれ格納される。データの単位（タラプル）は、
各欄に格納すべき１組の値として定められる。このよう
なタラプルを格納した任意個数のアトリビュートによっ
て１つのりレーションが構築される。

しかしてこのモデルにあっては、リレーション名を指定
し、その各アトリビュートの値をそれぞれ与えることに
よってデータベースへのデータの格納が行われる。また
データベースの検索は、リレーションおよびアトリビュ
ートを指定し、そこに格納されている値が指定された値
、または別のアトリビュートに格納されている値との間
で所定の条件を満すか否かを判定し、その条件を満すタ
ラプルを抽出することによって行われる。

この検索条件は、それらの値が等しい、等しくない、小
さい、大きい等として与えられる。この際、複数のアト
リビュートについてそれぞれ検索条件を指定し、その条
件判定結果を論理処理（アンドやオア等）して行なうこ
とも可能である。更には、複数のりレーションを指定し
、成るリレーションの成るアトリビュートの値が他のリ
レーションの成るアトリビュートの値に等しい等の条件
により、複数のリレーション中から所定のタラプルを求
めるようなデータベース検索も可能である。

またデータベースからのデータ削除は、基本的には上記
検索と同様に行われるが、タラプルを抽出することに代
えて、そのタラプルを抹消することによって行われる。

更にデータ更新も同様であり、得られた。タラプルの指
定されたアトリビュートの値を変更し、これを格納する
ことによって行われる。

また各リレーションには、各アトリビュート毎にデータ
の読出し、追加、変更が許可された人の情報（人名や担
当者コード）等が記入され、データ保護の対策が講じら
れている。尚、このデータ保護対策をアトリビュート毎
に行なうことに代えて、リレーション単位で行なうこと
も可能である。

尚、ここに記載される人の情報は複数であっても良い。

しかして第４７図に示すリレーションの例では、文字列
としてそのデータが示されているが、各リレーションに
蓄積されるデータは単なるビット列であっても良い。つ
まりリレーションに蓄積されるデータは文字列は勿論の
こと、イメージ情報や音声情報等であっても良い。

さてこのデータベースに蓄積されるデータは、上述した
第４７図に示す「個人スケジュール」のりレーションを
初めとして、例えば第４８図に示すようなｒ住所録」　
「個人の仕事とその代行者」「操作履歴」　「人事」　
「会議室」　「会議室予約」「会議ｊ等の種々のりレー
ションからなる。

この例に示されるようにリレーションは、主に個人用と
して用いられるものと、多くの利用者によって共通に利
用されるものとからなる。そして個人用のりレーション
は各個人が使用するワークステーション毎に設けられ、
また共通りレーションは複数の利用者にとって共通なワ
ークステーションに設けられる。

尚、共通のワークステーションとは必ずしもそのハード
ウェアが他のワークステーションと異なることを意味し
ない。また個人用のワークステーションが共通のワーク
ステーションを兼ねても良いことも勿論のことである。

更には共通のワークステーションは１台に限られるもの
ではなく、システムの階層レベルに応じて複数台設けら
れるものであっても良い。要するに、複数のワークステ
ーションから容易に特定することのてきるものとして共
通のワークステーションが設定される。

ここで第４７図に示した「個人スケジュール」リレーシ
ョンのデータ構造について簡単に説明する。

このリレーションからは、そのリレーション名が「個人
スケジュール」であり、「ΔΔ△Δ」によって作成され
たことが示される。このリレーション作成者「△△ΔΔ
」は該リレーションに対して全てのデータ操作が許可さ
れる。

またこのリレーションに付加されたデータ保護機能によ
れば、データの読出しは全員に許可されており、データ
の追加はｒｏｏｏＯＪと「技術部に所属する者」に対し
てのみ許可されている。尚、この「技術部に所属する者
」は、例えば「人事」のりレージジンを参照する等して
求められる。またデータの変更は１人レベル」の値が「
５」以上のものに対してのみ許可されている。この１人
レベル」とは人事リレーションに関するものであり、例
えば（部長；８）（次長；７）（課長；６）（主任；５
）等として役職を表わす。

更にこのリレーションには、「開始時刻」　「終了時刻
」　「種類」　「名称」　ｒ場所」等のアトリビュート
が設定され、そのそれぞれにデータが書込まれるように
なっている。

次にこのデータベース部３２における上述した各種のり
レージジンを実際に記憶する為の物理構造について説明
する。

情報蓄積部（記憶部）は大量データを蓄積し、その任意
の部分を比較的高速に読み書きすることができ、価格的
にさぼど高価でないものとして前述した磁気ディスク装
置３２ｃや光デイスク装置３２ｇが用いられる。

この情報蓄積部へのデータベースの蓄積は、該情報蓄積
部の記憶領域を特定の大きさく例えば数キロバイト程度
で、タラプル長や計算機の速度等に応じて定められる）
毎に区切り、各々をページとして管理して行われる。そ
して第４９図に示すように、例えば第０ページにページ
管理の情報を、第１ページにリレーション−覧表の情報
を、また第２ページに使用中のページ情報をそれぞれ格
納する。

このリレーションの一覧表によって、データベース中に
おける種々のりレージジンの所在が示される。。

例えば第９ページおよび第１１ページに格納された実デ
ータは、第５ページに格納されたりレージジンのアトリ
ビュート（主アトリビュート）に基き、第１０ページに
格納されたインデックスページの情報に従ってソートさ
れるようになっている。このインデックスページの情報
は、アトリビュートの値が幾つから幾つ迄のものがどの
ページに格納されているかを示すものである。

この主アトリビュート以外のアトリビュートによりデー
タ検索する場合には、そのアトリビュートについて第２
０ページのサブ争インデックスを経由して、先ず第２１
ページや第２２ページに示されるサブデータを得る。こ
のサブデータにはアトリビュートの値と前述した主アト
リビュートの値のみが入っており、ここで求められるア
トリビュートの値を用いて実際のデータが求められる。

尚、例えば画像データや音声データのようにその実デー
タの量が膨大であり、その中の幾つかのビット誤りが問
題とならない場合には、これらの実データを光デイスク
装置３２ｄ等の別の安価な情報記憶装置にファイルする
ようにしても良い。この場合には、第９ページや第１１
ページ等の実データ用ページには、その旨とその装置で
の実データの格納位置情報を記憶しておくようにすれば
良い。

しかしてこのように構築されたデータベースに対する付
加機能は、例えば不要データの自動廃棄等からなる。こ
の不要データの０動廃棄は、リレーションの付加情報と
して［廃棄；可／不可コ［廃棄の方法］等を与えておき
、所定の間隔でリレーション毎の消去コマンドを動作さ
せて行われる。

尚、タラプルの消去は、例えば会議情報についてはその
終了時刻が現在の時刻より前であるか否か等を判定して
行なうことが可能である。従ってこのようなタラプルの
消去については、格別の機能追加は不要である。

また付加機能の他の重要な機能としてデータの保全があ
る。このデータの保全機能は、例えばハードウェアの故
障や停電等に原因してデータが不正（でたらめになった
り失われたりすること）となることを防ぐものである。

具体的にはこのデータの保全機能は、情報の二重化や磁
気テープへの書出し等によって実現される。

このようにデータベース部３２では、種々のデータをリ
レーション毎に分類整理し、且つページ単位に管理して
種々の応用システムに供するものとなっている。

次に作業環境データ収集部２５について説明する。

この作業環境データ収集部２５は、該ワークステーショ
ンに対する過去の操作履歴のデータを収集し、これに基
く操作ガイドを行なうものである。

ここで作業環境データ収集部２５には、例えば第５０図
に示すように当該情報処理システムが持つ機能に対応す
るコマンドと、他の情報システムが持つ機能に対応する
コマンドとを対応付けるコマンド対応テーブルが設けら
れている。

具体的には当該情報処理システムをＡ１他の情報処理シ
ステムをＢ、Ｃ，Ｄ、・・・とじたとき、システムＡに
おけるコマンド“ＤＥＬＥＴＥ”に対応する他のシステ
ムのコマンドが　ＤＥＬ””ＥＲＡＳＥ’　　“ＲＥＭ
ＯＶＥ”　であルコとが、該コマンド対応テーブルによ
って示されるようになっている。

第５１図は利用者により入力されたコマンドを解析し、
所定の動作および各種ガイダンスを実行する作業環境デ
ータ収集部２５の概略構成を示すものである。

この作業環境データ収集部２５では、先ずコマンド入力
部２５ａから入力されたコマンドをコマンド解析部２５
ｂに与え、コマンド対応テーブル２５ｃを参照して解析
している。具体的には第５２図に示す手続きの流れに従
って人力コマンドがコマンド対応テーブル２５ｃに登録
されているかを調べている。即ち、コマンドが入力され
ると、先ずその人力コマンドがシステムＡのものである
か否がが調べられる。そして入力コマンドがシステムＡ
のコマンドであると解析されると、コマンド解析部２５
ｂは該入力コマンドをコマンド実行部２５ｄに与え、そ
のコマンドに基く所定の動作を実行させている。

一方、入力コマンドがシステムＡのものでない場合には
、他のシステムのコマンドに該当するが否かが調べられ
、対応付けされているコマンドが存在する場合には、そ
の対応コマンドを画面表示部２５ｅにて表示する。つま
り他のシステム（システムＢ）で用いられているコマン
ド、例えば“ＤＥＬ”である場合には、これに対応する
システムＡのコマンド“ＤＥＬＥＴＥ＠を求め、これを
操作ガイダンスとして画面表示部２５ｅに表示すること
になる。

尚、入力コマンドに該当するコマンドがコマンド対応テ
ーブル２５ｃに存在しなかった場合には、画面表示部２
５ｅにてコマンドエラーメツセージの表示を行なう。

具体的には次のようにしてそのコマンド入力に対する処
理が行われる。今、システムＢ、Ｃの操作経験の利用者
が初めてシステムＡ（当該情報処理システム）を操作す
るものとする。ここで利用者がコマンドを入力してデー
タ“ＡＢＣ”を消去する場合、従来ではシステムＡの取
扱い説明書に従ってデータ消去の為の“ＤＥＬＥＴＥ”
なるコマンドを探し、これを入力することが必要となる
。

しかしここでは、その利用者は過去の経験に従って、例
えばシステムＣで用いていたデータ消去コマンド“ＥＲ
ＡＳＥ　　ＡＢＣ”を第５３図（ａ）に示すように人力
する。

すると作業環境データ収集部２５ではこの入力コマンド
を解析し、前記コマンド対応テーブル２５ｃから入力コ
マンド　°ＥＲＡＣＥ“に対応するシステムＡのコマン
ド　“ＤＥＬＥＴＥ”を求め、これをガイドとして表示
することになる。この結果、利用者はシステムＡを初め
て操作する場合であっても、そのデータ消去のコマンド
が“ＤＥＬＥＴＥ”であることを知り、そのコマンドを
ガイドに従って入力することにより、そのデータ消去を
行なうことが可能となる。

またファイル名のリストを表示するべく、第５３図（ｂ
）に示すようにシステムＢにおけるコマンド“Ｄ　Ｉ　
Ｒ”を人力した場合には、同様にして該システムＡにお
ける対応コマンド”ＣＡＴＡ’が求められ、ガイド表示
される。この結果、このガイドに従ってコマンド“ＣＡ
ＴＡ”を人力することによって、そのファイル名のリス
トが表示される。

このようにこの作業環境データ収集部２５の機能を活用
することにより、過去の操作経験のあるシステムで用い
られていたコマンドの入力によって、そのシステムにお
ける対応コマンドがガイド表示される。従ってシステム
利用者は、過去に得た知識を最大限に利用してシステム
を操作することが可能となる。そして当該情報処理シス
テムのコマンドを容易に知ることが可能となる。従って
その都度、当該情報処理システムの操作説明書を調べる
等の煩わしさから解放される。故に、システムｊ　　　
の操作の習得に要する時間を大幅に短縮することができ
る等の効果が期待できる。

尚、入力コマンドに対応するコマンドを求め、これをガ
イド表示したとき、その合否の判定入力を受けて、その
コマンドを実行するようにしても良い。

即ち、第５４図にその手続きの流れを示し、第５５図に
その表示例を示すように他のシステムの消去コマンド“
ＥＲＡＳＥ’　Ｌ、これに対応するシステムＡの消去コ
マンド“ＤＥＬＥＴＥ”が求められたとき、これが正し
いか否かを間合せる。

そして正（Ｙ）なる指示入力があったとき、その入力コ
マンドが“ＤＥＬＥＴＥ”を示していると判定し、これ
をコマンド実行部２５ｄに送ってその処理を実行させる
ようにする。

このようにすれば、コマンドの対応関係がガイド指示さ
れると同時に、その入力コマンドに従って所望とする処
理が実行されるので、改めて正しいコマンドを入力し直
す必要がなくなる。つまり入力コマンドの対応コマンド
への自動変換が行われて、その処理が実行されることに
なる。従って、更にその操作性の向上を図ることが可能
となる。

尚、対応コマンドはシステムの種類に応じて何種類存在
しても良いものである。要はコマンド対応テーブル２５
ｃに対応付けてそれぞれ格納しておけば良い。またコマ
ンドは上述した文字列形式に限定されないことも云うま
でもない。

次にこの作業環境データ収集部２５におけるシステム習
熟度のデータ収集について説明する。

第５６図はシステム習熟度のデータ収集処理を示す流れ
図である。

利用者がその識別コード（ユーザ番号やパスワード等）
を入力すると、作業環境データ収集部２５はその識別コ
ードに対応する習熟度表を外部記憶装置から求め、装置
内部にセットする。この習熟度表は各利用者がシステム
の様々な利用機能に対してどの程度習熟しているかを格
納したもので、例えば第５７図に示す如く構成されてい
る。

即ち、この習熟度表は各利用機能に対してその利用頻度
、最終利用年月日時、ユーザが申告した゛　該機能に対
する習熟クラス、該機能を前回利用した際の習熟度クラ
ス、更には該機能の複雑度の情報等によって構成されて
いる。

ここで複雑度とは該当利用機能が専門知識を要求する程
高くなり、また基本機能より高級機能になる程高くなる
ものである。

しかしてこのような習熟度表は各利用者毎に設けられ、
外部記憶装置にそれぞれ記憶されている。

尚、システムを初めて利用する利用者に対しては、１別
コードの新規設定によりその利用者に対する習熟度表が
作成され、外部記憶装置に登録される。

尚、外部記憶装置には、例えば第５８図に示すように上
述した習熟度表に加えて、前記習熟度クラスに対応した
利用機能毎のメツセージが登録されている。このメツセ
ージは習熟度のクラスが低い程、その背景説明を含む判
り易い説明となっている。また習熟度の高いクラスはど
、簡略な説明と専門的な機能の紹介を含んだ高度な内容
となっている。

また習熟度のクラスは、例えばＡ；初級者クラスＢ；中級者クラスＣ；習熟者クラスのように分類設定される。

しかして入力された識別コードに対応した習熟度表が求
められると、次にその利用機能を利用者に選択させる為
のメニューが表示される。このメニューに対して利用者
は、例えばその利用機能に対応する番号等を入力する。

すると制御部ではその入力情報が終了信号か利用機能の
選択信号かを判断し、利用機能選択信号の場合には次の
ように動作する。

即ち、利用機能選択信号が人力されると、先ずその利用
者に関する前記習熟度表を参照し、選択された利用機能
に対応する利用頻度や最終利用年月日時、申告習熟度ク
ラス等の情報が求められる。

そしてこれらの情報に従って重み付は処理を施し、現在
の習熟度クラスの決定が行われる。

この習熟度クラスの判定は、例えば利用頻度をＰ　１最
小利用年月日時をＴ　、利用者申告習熟Ｃ度クラスをＸ　１前回利用習熟度クラスをＮ２、複雑度
をＰ　１そして判別関数をＦ　としたとき、ｒＦ　　−に、＋に２　（Ｔｃ−Ｔｅ）「十に３Ｇ１　［Ｘ１］十Ｋ　Ｇ　［Ｘ２］＋に５Ｐ。

として求められ。但し、−Ｌ式においてＫ　　、Ｋ　　
。

Ｋ　　、Ｋ　　は、実験等によって適切な値に設定さＡ
、Ｂ、Ｃに対する評価重みである。これらの評価重みはＹ　くＹ　くＹ　、　ＺｌくＺ２くＺ３なる関係を有し
、実験等によって適切な値に設定される。

ここでＧ［Ｘ］は、Ｘ　ｉ　””　ＡのときＹｌな１する値を取り、Ｘ　　−ＢのときＹ２なる値を取ることを
意味する。また（Ｔ　　−Ｔ　　）は、最終利用ＣＯ年月１時から現在までの日数を時間換算したものである
。

しかしてクラス判定は、上述した判別関数Ｆｒの値によ
り次のようにして行われる。

Ｆ　　＜Ｎ　　　・・・Ａクラス「　　ｌＮ　≦Ｆ　　＜Ｎ　　　・・・Ｂクラス１　　　ｒ　　
　２Ｎ２≦Ｆ、　　　　　・・・Ｃクラス尚、判定閾値Ｎ　　、Ｎ　　は実験等に基いて適切■２に定められる。

このようにして習熟度クラスが決定されると、その決定
された習熟度クラスに対応し、且つ前述した如く指定さ
れた利用機能に該当するガイドメツセージやエラーメツ
セージを外部記憶装置から求める。

しかる後、今回決定された習熟度クラスと、前記習熟度
表に格納されている前回の習熟度クラスとを比較照合す
る。そして習熟度クラスに変更がある場合には、その習
熟度に変更がある旨を示すメツセージを前記ガイドメツ
セージ等に付加して書込む。

この習熟度クラス変更のメツセージは、例えば第５９図
に示すような４８類のメツセージからなる。そしてその
クラス変更の形態に応じて求められ、前記ガイドメツセ
ージ等と共に表示される。

利用者はこのようにして表示される各種メツセージに従
ってその処理操作を行なうことになる。

具体的には作成データをファイルに格納する利用機能に
対して、その利用者が初級者クラス（Ａクラス）と判定
されると第６０図に示す如きメツセージが表示される。

そしてこのメツセージにも拘らず利用者が情報入力を誤
った場合には、例えば第６１図に示すようなエラーメツ
セージの表示が行われ、その利用機能に対する操作のガ
イドが行われる。

またその利用者の習熟度が中級者クラス（Ｂクラス）と
判定された場合には、第６２図に示す如きメツセージが
表示される。そしてこのメツセージにも拘らず利用者が
情報人力を誤った場合には、例えば第６３図に示すよう
なエラーメツセージの表示が行われ、その利用機能に対
する操作のガイドが行われる。同様にその利用者の習熟
度が習熟者クラス（Ｃクラス）と判定された場合には、
第６４図に示す如きメツセージが表示され、情報人力の
誤りがある場合には、例えば′￥Ｓ６５図に示すような
エラーメツセージの表示が行われてその利用機能に対す
る操作のガイドが行われる。

しかして上述した如く表示したガイドメツセージの空欄
に対してデータ入力が行われると、制御部は前述した如
く求めている該当利用者の習熟度表の該当利用頻度を（
＋１）すると共に、最終利用年月０時および前回利用習
熟クラスの更新を行なう。そして該利用機能の実行を促
すと共に、該当利用機能が終了したものとＣ做して前述
した利用機能選択の為のメニュー表示動作に戻る。

ここで再び利用機能選択信号が入力されると、上述した
処理を再び繰返して実行することになる。

しかし終了選択信号が人力された場合には、上述した如
く作成・更新した習熟皮表を外部記憶装置の習熟度ファ
イルに、その該当利用者の識別コードと共に書込み、こ
れを保存する。そしての一連の処理手続きを終了する。

このようにして作業環境データ収集部２５では、システ
ムの操作に関する習熟度のデータを収集しながら、その
収集されたデータに従ってその繰作を適切にガイダンス
するものとなっている。

以上が本ワークステーションの基本的な構成とその機能
である。

次に本発明の特徴とするオペレータの顔のイメージ照合
処理について説明する。

このイメージ照合処理は、例えば利用者が前記キーボー
ド部６等の情報端末を操作して該ワークステーションを
取扱おうとするとき、その操作者（オペレータ）を個人
照合して同定すること等を目的として行われるものであ
る。この個人識別結果に従って、例えば該オペレータの
適否を判定すること等が行われる。またこの個人識別結
果は、前述したガイダンスを行なう場合や、前記データ
ベース部３２に登録された情報を検索する場合にも利用
することができる。

しかしてこのイメージ照合処理を実行するイメージ照合
部１８は、例えば第６６図に示す如く構成される。

即ち、イメージ照合部１８はイメージ記憶部１８ａ。

正規化回路１８ｂ、　２値化（細線化）回路１８ｃ、特
徴データ抽出回路１８ｄ、データ記憶部１８ｅ、検索回
路１８１’。

照合回路１８ｇ、そして出力部１８ｈを具備して構成さ
れる。

イメージ記憶部１８ａは前記イメージ入力装置３を介し
て入力されたイメージ情報、具体的には情報端末を操作
するオペレータの顔のイメージ情報を記憶し、以下に説
明するイメージ照合処理に供するものである。

正規化回路１８ｂはこのイメージ記憶部１８ａに記憶さ
れたイメージ情報を正規化処理しており、２値化回路１
８ｃはこれを２値化処理している。具体的には、ここで
はオペレータの顔のイメージからその個人同定を行なう
べく、正規化回路１８ｂはその顔の大きさを正規化して
いる。この正規化された顔のイメージに対して２値化回
路１８ｃは、例えばエツジ線分検出、そのエツジ線分の
細線化処理等を行なって該イメージの２値画像を求めて
いる。

特徴データ抽出回路１８ｄは、このようにして正規化・
２値化されたイメージ情報からその特徴データを抽出し
ている。即ち、顔のイメージによる照合処理にあっては
、例えば第６７図に示すように顔の輪郭を１つの特徴と
して抽出し、更にそのイメージ中の目、鼻、口等の特徴
をそれぞれ抽出している。具体的には、顔の輪郭的特徴
を分類されたコード情報として、また両眼間の距離ノ、
口の大きさｍ１目と口との距離ｎ等を数値データとして
そのイメージの特徴として抽出している。

一方、データ記憶部１８ｅには、予め各個人について求
められた顔のイメージの特徴データが、例えば第６８図
に示すように登録されている。即ち、各個人毎にその個
人名を識別名として上述した顔のイメージの特徴データ
が登録され、ｎつその顔のイメージ・データがポインタ
によって結ばれている。

尚、このデータ記憶部１８ｅに登録される顔の特徴デー
タについては、ＩＣカード等から読取り入力されるもの
であっても良い。即ち、オペレータが携帯するＩＣカー
ドにその個人の顔の特徴データを個々に登録しておき、
ワークステーションの操作時にそのオペレータが前記Ｉ
Ｃカード部７にセットするＩＣカードから上記特徴デー
タを読取り入力してデータ記憶部１８ｃに格納するよう
にしても良い。

しかして検索回路１１１ｒは前記特徴データ抽出回路１
８ｄにて抽出された特徴データに基いて該データ記憶部
１８ｅを検索している。そしてこのデータ記憶部１８ｅ
から検索抽出された特徴データは照合回路１８ｇに与え
られ、前記特徴データ抽出回路１８ｄで求められた特徴
データとの間で照合処理されている。

この照合処理は、例えば特徴データ抽出回路ｌａｄで求
められた入力イメージの特徴データをＸｌ　（ｉは特徴
の種別）、データ記憶部１８ｅに登録されているイメー
ジの特徴データをＹｌとしたとき、Ｄ脂Σ　ＩＸ、−Ｙ、１ ■ なる演算を行い、その演算結果りの値が最も小さいもの
を、その個人として同定することによって行われる。ま
たデータ記憶部１８ｅに、ＩＣカードから読込み入力さ
れた特定の個人の特徴データしかない場合には、その照
合演算結果りを閾値処理して、オペレータが特定の個人
であるか否かが判定される。この同定結果が出力部１８
ｈを介して出力される。

イメージ照合部１８は、基本的にはこのようにして人力
イメージを照合処理してオペレータを個人識別している
。

一方、出力部１８ｈは撮像入力されてイメージ記憶部１
８ａに格納された顔のイメージをディスプレイ出力して
表示している。またこのとき、前記データ記憶部１８ｃ
に格納された特徴データもディスプレイ出力し、これら
を同時表示している。この結果、オペレータの判断によ
ってディスプレイ表示されたイメージ、および特徴デー
タからその照合を行い得るようになっている。

また適宜前記イメージ圧縮・伸長部３ｏを用いて、Ｌ記
特徴データから顔のイメージを復元し、その照合処理に
供するものとなっている。

このように本ワークステーションでは、その情報端末を
操作するオペレータの顔のイメージを撮像入力してその
オペレータを個人識別し、該ワークステーションの取扱
いの適・不通や、ガイダンス処理を行なう為の情報とし
て利用するものとなっている。

従ってオペレータは、ワークステーションを利用しよう
とする都度、ＩＤ番号等の情報を入力する煩わしい作業
から解放される。そしてその個人照合処理が自動的に行
われることになる。

尚、本発明は上述した実施例に限定されるものではない
。例えばワークステーションの利用対象者の全てについ
て、その顔の特徴情報を予めデータ記憶部１８ｅに登録
しておいても良い。また顔の特徴情報をデータベース部
３２に格納しておくことも可能である。史には抽出する
特徴の沖類やその数、また照合処理のアルゴリズムはそ
の仕様に応じて定めれば良いものである。要するに本発
明はその要旨を逸脱しない範囲で種々変形して実施する
ことができる。

［発明の効果］以上説明したように本発明によれば、ワークステーショ
ンのオペレータの顔のイメージが撮像入力されてその個
人識別が行われるので、情報端末の煩わしい処理操作を
行なうことなしに、例えば該ワークステーションの作業
環境を整えることができる等の効果が奏せられる。また
個人の顔の特徴情報をＩＣカード等に個々に登録してお
くようにすれば、大容量の記憶装置を準備して複数の照
合対象者の顔の特徴情報を記憶しておく必要がない等の
効果が奏せられる。

【図面の簡単な説明】

図は本発明の一実施例を示すもので、第１図は本発明に係るワークステーションにおけるイメ
ージ照合処理を示す機能ブロック図、第２図はワークス
テーションの概略構成図、第３図はワークステーション
に付随するＩＣカードの外観図、第４図はＩＣカードの
構造を示す分解斜視図、第５図はＩＣカードのプリント
基板部の構造を示す図、第６図はＩＣカードの半導体集
積回路部の構成を示す図、第７図はワークステーションにおける暗号化処理部の構
成を示す図、第８図は暗号・復号化の概念を示す図、第
９図は暗号化部の構成図、第１０図は復号化部の構成図
、第１１図はＲＳＡ処理部の構成図、第１２図はワークステーションにおける音声認識部の構
成を示す図、第１３図は入力音声パターンの例を示す図
、第１４図は子音の音響的特徴を示す図、第１５図は遷
移ネットワークの例を示す図、第１６図は音声認識処理
の手続きを示す図、第１７図は入力音声に対する部分区
間検出を説明する為の図、第１８図は音声認識辞書の学
習処理手続きを示す図、第１９図はワークステーションにおける文字認識部の第
１の文字認識ブロックの構成を示す図、第２０図は認識
対象となる文字が記載されるＦＡＸ送信原稿用紙の例を
示す図、Ｔ５２１図は認識対象文字の切出し処理を説明
する為の図、第２２図は文字認識部における第２の文字
認識ブロックの構成を示す図、第２３図はワークステーションにおける図形認識部の構
成を示す図、第２４図乃至第２７図は図形認識処理を説
明する為の図、第２８図はワークステーションにおけるイメージ認識部
の構成を示す図、第２９図はコード変換装置の構成図、
第３０図は入力イメージに対する処理例を示す図、第３
１図はセグメントにおける特徴点検出を示す図、第３２図はワークステーションにおける音声照合部の構
成を示す図、第３３図はフィルタバンクの帯域分割例を
示す図、第３４図はフィルタ特性を示す図、第３５図はワークステーションにおける音声合成部の構
成を示す図、第３６図は規則合成パラメータ生成装置の
構成図、第３７図は音声パラメータの変換構造を示す図
、第３８図は音声合成器の構成図、第３９図はワークステーションにおけるイメージ合成部
の構成を示す図、第４０図および第４１図はイメージ合
成処理の概念を示す図、第４２図はワークステーション
における出力形態選択部の構成を示す図、第４３図は出
力形態選択処理手続きの流れを示す図、第４４図は相手
局識別処理手続きの流れを示す図、第４５図はメディア
変換テーブルの構造を示す図、第４６図はワークステーションにおけるデータベース部
の構成を示す図、第４７図はデータベースのデータ構造
を示す図、第４８図はりレーションの例を示す図、第４
９図はりレーションの構造を示す図、第５０図はコマンド対応テーブルの構造を示す図、第５
１図はワークステーションにおける作業環境データ収集
部の構成を示す図、第５２図乃至第５５図はコマンド部
の処理を説明する為の図、第５６図はシステム習熟度の
データ収集処理の流れを示す図、第５７図は習熟皮表の
構造を示す図、第５８図乃至第６５図は作業環境データ
収集部の処理を説明する為の図、第６６図乃至第６８図は本発明に係るイメージ照合処理
を説明する為の図で、第６６図はワークステーションに
おけるイメージ照合部の構成を示す図、第６７図はイメ
ージ処理される顔の例を示す図、第６８図はイメージ・
データの構造を示す図である。 ■・・・バス、２・・・制御部、３・・・イメージ入力
装置、４・・・位置入力装置、５・・・音声入力部、Ｂ
・・・キーボードｍ、７・・・ＩＣカード部、８・・・
バスコントローラ、９・・・音声出力装置、１０・・・
ディスプレイ部、１１・・・イメージ出力装置、１２．
１３・・・通信装置、１４・・・切換え装置、１５・・
・タイマ一部、１Ｂ・・・暗号化処理部、１７・・・音
声照合部、１８・・・イメージ照合部、１９・・・音声
認識部、２０・・・音声分析部、２１・・・文字認識部
、２２・・・図形認識部、２３・・・イメージ認識部、
２４・・・出力形態選択部、２５・・・作業環境データ
収集部、２Ｂ・・・音声合成部、２７・・・イメージ合
成部、２８・・・図形合成部、２９・・・音声の圧縮・
伸長部、３０・・・イメージの圧縮・伸長部、３１・・
・信号処理部、３２・・・データベース部。出願人代理人　弁理士　鈴江武彦第４図第７図゛　（ゴ１号イ乙）１　　　　　１（ｆ！号イ乙）第８
図第９図第１０図（４１！；ｋ）第１１図第１６図第１８図第２１図第２２図第２３図第２４図　　　　　　第２５図第２６図　　　第２７図第２８図第２９図（ａ）　　　　　　　　　　　　　　（ｂ）第３０図第３１図第３４図　　　０Ｈ第３５図第３６図　　　　　第３７図第３８図第３９図第４０図第４１図第４３図第４５図第４６図第４７図＊　４９図第５０図第５１図第５２図第５３図第５５図第５６図第５７図第５８図第６０図第６２図第６３図第６４図第６５図

Claims

【特許請求の範囲】

（１）端末を操作するオペレータの顔のイメージを撮像
入力する手段と、入力されたイメージ画像から顔の特徴
を抽出する手段と、予め登録されている顔の特徴情報と
上記入力イメージから抽出された顔の特徴とを比較して
前記オペレータを個人照合する手段とを具備したことを
特徴とするワークステーション。
（２）顔の特徴情報は、オペレータが携帯するＩＣカー
ドに登録されているものであって、オペレータの顔のイ
メージの撮像入力時に上記ＩＣカードからワークステー
ション本体に読込み入力されるものである特許請求の範
囲第１項記載のワークステーション。
（３）顔の特徴は、目、眉、鼻、口の大きさ、およびそ
れらの間隔等として抽出されるものである特許請求の範
囲第１項記載のワークステーション。