JPS6386658A - Voice informing equipment - Google Patents
Voice informing equipmentInfo
- Publication number
- JPS6386658A JPS6386658A JP61230056A JP23005686A JPS6386658A JP S6386658 A JPS6386658 A JP S6386658A JP 61230056 A JP61230056 A JP 61230056A JP 23005686 A JP23005686 A JP 23005686A JP S6386658 A JPS6386658 A JP S6386658A
- Authority
- JP
- Japan
- Prior art keywords
- data
- information
- section
- image
- processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000015572 biosynthetic process Effects 0.000 claims description 34
- 238000003786 synthesis reaction Methods 0.000 claims description 34
- 230000005540 biological transmission Effects 0.000 abstract description 8
- 238000012545 processing Methods 0.000 description 114
- 230000006870 function Effects 0.000 description 90
- 238000000034 method Methods 0.000 description 69
- 238000010586 diagram Methods 0.000 description 49
- 238000004891 communication Methods 0.000 description 39
- 230000008569 process Effects 0.000 description 39
- 230000015654 memory Effects 0.000 description 36
- 238000006243 chemical reaction Methods 0.000 description 21
- 238000004364 calculation method Methods 0.000 description 19
- 238000013480 data collection Methods 0.000 description 18
- 239000013598 vector Substances 0.000 description 18
- 238000001514 detection method Methods 0.000 description 16
- 238000012795 verification Methods 0.000 description 16
- 238000004458 analytical method Methods 0.000 description 15
- 239000000758 substrate Substances 0.000 description 15
- 239000000284 extract Substances 0.000 description 12
- 230000010365 information processing Effects 0.000 description 12
- 238000011093 media selection Methods 0.000 description 12
- 230000007704 transition Effects 0.000 description 12
- 230000008859 change Effects 0.000 description 11
- 230000005236 sound signal Effects 0.000 description 9
- 239000002131 composite material Substances 0.000 description 6
- 239000004973 liquid crystal related substance Substances 0.000 description 6
- 239000004065 semiconductor Substances 0.000 description 6
- 230000009466 transformation Effects 0.000 description 6
- 108010076504 Protein Sorting Signals Proteins 0.000 description 5
- 238000013075 data extraction Methods 0.000 description 5
- 238000010606 normalization Methods 0.000 description 5
- 238000001228 spectrum Methods 0.000 description 5
- 235000017399 Caesalpinia tinctoria Nutrition 0.000 description 4
- 241000388430 Tara Species 0.000 description 4
- 230000006835 compression Effects 0.000 description 4
- 238000007906 compression Methods 0.000 description 4
- 238000013500 data storage Methods 0.000 description 4
- 238000012217 deletion Methods 0.000 description 4
- 230000037430 deletion Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 239000000463 material Substances 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 239000000203 mixture Substances 0.000 description 4
- 238000007781 pre-processing Methods 0.000 description 4
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 3
- 238000012952 Resampling Methods 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 230000001815 facial effect Effects 0.000 description 3
- 238000011049 filling Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 239000007787 solid Substances 0.000 description 3
- 238000012916 structural analysis Methods 0.000 description 3
- 230000001755 vocal effect Effects 0.000 description 3
- 239000004695 Polyether sulfone Substances 0.000 description 2
- 238000005452 bending Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000009499 grossing Methods 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 238000003909 pattern recognition Methods 0.000 description 2
- 229920006393 polyether sulfone Polymers 0.000 description 2
- 238000004321 preservation Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 206010002953 Aphonia Diseases 0.000 description 1
- 238000012935 Averaging Methods 0.000 description 1
- 101100282617 Bovine herpesvirus 1.1 (strain Cooper) gC gene Proteins 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000011888 foil Substances 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 239000003292 glue Substances 0.000 description 1
- 238000012905 input function Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 229920006254 polymer film Polymers 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 125000006850 spacer group Chemical group 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 239000004575 stone Substances 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
【発明の詳細な説明】
[発明の目的]
(産業上の利用分野)
本発明は文章情報をコードデータとして保存し、これを
音声合成してその通知先に自動的に送信し得る音声通知
装置に関する。[Detailed Description of the Invention] [Objective of the Invention] (Field of Industrial Application) The present invention provides a voice notification device that can store text information as code data, synthesize it into speech, and automatically send it to the notification destination. Regarding.
(従来の技術)
近時、種々のワークステーションが開発され、その処理
機能も多様化している。また種々の通信回線を介して複
数のワークステーション間やワークステーションと情報
処理端末間で情報通信することが行われている。そこで
ワークステーションが持つ種々の機能を利用して、所謂
オフィスオートメーション化が進められている。(Prior Art) Recently, various workstations have been developed, and their processing functions are diversifying. Furthermore, information is communicated between a plurality of workstations or between a workstation and an information processing terminal via various communication lines. Therefore, so-called office automation is being promoted by utilizing the various functions of workstations.
ところでオフィスワークの重要な仕事の1つとして、種
々のメツセージをその関係者に通知する作業がある。例
えば予め設定された会議の出席者に対して、会議の開催
が迫ったことやその会議に持参する資料名等をそれぞれ
通知することがある。By the way, one of the important tasks in office work is to notify various messages to related parties. For example, attendees of a preset meeting may be notified of the impending meeting and the names of materials to be brought to the meeting.
そして従来、このような会議通知は専ら人手に頼って会
議出席予定者の全てに個々に電話して行イっれている。Conventionally, such meeting notifications have been carried out manually by individually calling all of the people scheduled to attend the meeting.
この為、その通知作業に多大な労力を必要としている。For this reason, the notification work requires a great deal of effort.
そこでこのような処理機能をワークステーションに持た
せ、省力化を図ることが考えられている。Therefore, efforts are being made to provide workstations with such processing functions in order to save labor.
しかし、その通知対象者の全てがワークステーションや
情報処理端末を所有しているとは限らない。However, not all recipients of notification own workstations or information processing terminals.
この為、ワークステーションからメツセージの通知が可
能な対象範囲が限られていた。For this reason, the scope to which messages can be sent from workstations is limited.
(発明が解決しようとする問題点)
本発明は、ワークステーションと通信可能な特別な情報
処理端末を個々に配置することが困難であることに鑑み
てなされたもので、その目的とするところは、一般的に
普及している電話端末をを効に利用して種々のメツセー
ジをワークステーションから音声通知することのできる
音声通知装置を提供することにある。(Problems to be Solved by the Invention) The present invention was made in view of the difficulty in individually arranging special information processing terminals that can communicate with workstations. An object of the present invention is to provide a voice notification device capable of giving voice notifications of various messages from a workstation by effectively utilizing commonly used telephone terminals.
[発明の構成]
(問題点を解決するための手段)
本発明は、第1図にその概略構成を示すように氏名に対
応する電話番号を記述した電話リストや文書データ等を
格納するデータベースA、文章の作成機能や宛先リスト
の作成機能等を備えた制御部B1コードデータを音めデ
ータに変換する音響合成部C1自動ダイヤル機能を備え
た通信装置り等を具備したワークステーションとして実
現されるものであって、
制御部Bにて作成された文章をコードデータとしてデー
タベースAに格納すると共に、送信文書とその送信先を
指定する宛先リストを制御部Bにて作成し、
この宛先リストに記述された宛名を抽出し、データベー
スAに格納された電話リストから1−記宛名に対応する
電話番号を求め、この電話番号に従って自動ダイヤルす
ると共に、前記宛先リストで指定された文書データを抽
出して音声合成し、この音声合成された音声データを前
記自動ダイヤルされた電話端末に送信するようにしたも
のである。[Structure of the Invention] (Means for Solving the Problems) As shown in FIG. 1, the present invention provides a database A that stores a telephone list containing telephone numbers corresponding to names, document data, etc. , a control unit B1 equipped with a text creation function, a destination list creation function, etc.; an acoustic synthesis unit C1 that converts code data into sound data; and a communication device equipped with an automatic dialing function. The text created by control unit B is stored in database A as code data, and at the same time, control unit B creates a destination list that specifies the transmitted document and its destination, and writes the information in this destination list. extracts the specified addressee, finds the telephone number corresponding to the addressee from the telephone list stored in database A, automatically dials according to this telephone number, and extracts the document data specified in the addressee list. Speech synthesis is performed, and the synthesized voice data is transmitted to the telephone terminal that has been automatically dialed.
そして前記宛先リストに、同一文章に対する送信先が複
数記述されている場合には、それらの宛名に対応した電
話番号に順次自動ダイヤルするようにしたものである。If a plurality of destinations for the same text are listed in the destination list, telephone numbers corresponding to those destinations are automatically dialed in sequence.
(作用)
本発明によれば、通知に供する文章をワークステーショ
ンが持つ文章作成機能を用いて簡単に、しかもコードデ
ータとして作成して保存することができる。(Operation) According to the present invention, a text to be provided for notification can be easily created and saved as code data using the text creation function of the workstation.
その−ヒで、作成された宛先リストに従って送信文書を
指定し、且つその送信先を求めてデータベースの電話リ
ストの検索からその送信先電話番号を求め、自動ダイヤ
ルが行われる。そしてその自動ダイヤル先に、前記コー
ドデータで示される文章が合成音声により音声データに
変換されて出力される。しかも宛先リストに記述された
通知先の全てに、上記文書データが自動的に音声通知さ
れる。Then, the user specifies the document to be sent according to the created destination list, searches the telephone list in the database to find the destination telephone number, and performs automatic dialing. Then, the text indicated by the code data is converted into voice data using synthesized speech and output to the automatically dialed destination. Moreover, the document data is automatically notified by voice to all the notification destinations written in the destination list.
従って通知すべきメツセージを簡易に文章作成し、これ
を汎用の電話端末を有効に利用して自動的に音声通知す
ることが可能となる。Therefore, it is possible to easily create a message to be notified and automatically notify it by voice by effectively utilizing a general-purpose telephone terminal.
(実施例) 以下、図面を参照して本発明の実施例につき説明する。(Example) Embodiments of the present invention will be described below with reference to the drawings.
第2図は本発明の実施例に係る知的ワークステーション
の概略構成図である。この知的ワークステーションは、
以下の各部を備えて構成される。FIG. 2 is a schematic diagram of an intelligent workstation according to an embodiment of the present invention. This intelligent workstation
It is composed of the following parts.
バス1 ;以下に説明する各部の間ので必要な情報転送
を行なう為に用いられる。Bus 1: Used to transfer necessary information between each section described below.
制御部2 ;マイクロプロセッサを主体として構成され
、該知的ワークステーションの各部の動作をそれぞれ制
御するものである。Control unit 2: Mainly composed of a microprocessor, it controls the operations of each part of the intelligent workstation.
イメージ人力装置3 ;カメラやスキャナ、OCR等か
らなり、各種のイメージ情報を人力する。Image human-powered device 3: Consists of a camera, scanner, OCR, etc., and manually generates various image information.
位置座標人力装置4 ;タブレットやマウス等からなり
、指定された位置座標情報を人力する。Position coordinate human power device 4: Consists of a tablet, mouse, etc., and manually inputs specified position coordinate information.
音声入力部5 ;マイクロフォン等により構成され、音
声情報を入力する。Audio input unit 5: Consists of a microphone, etc., and inputs audio information.
キーボード部8 ;複数のキーを倫え、文字・記号フー
ドや制御コード等を入力する為のものである。Keyboard section 8: Uses multiple keys to input characters, symbols, control codes, etc.
ICカード部7 ;後述するようにICカードが装置さ
れ、該ICカードとの間で必要な情報を人出力するもの
である。IC card section 7: As described later, an IC card is installed therein, and necessary information is outputted between this IC card and the IC card.
バスコントローラ8 ;バス■を介する各部間の情報転
送を制御する。Bus controller 8: Controls information transfer between each section via bus ①.
音声出力部9 :スピーカ等からなり、音声情報を出力
する。Audio output unit 9: Consists of a speaker, etc., and outputs audio information.
ディスプレイ部10;CRTディスプレイや液晶ディス
プレイ等からなり、文字・図形・画像等を表示する。Display unit 10: Consists of a CRT display, liquid crystal display, etc., and displays characters, figures, images, etc.
イメージ出力ii& II ; F A Xやカラープ
リンタ等からなり、種々のイメージ情報をプリント出力
する。Image output ii ⅈ Consists of FAX, color printer, etc., and prints out various image information.
通信装置12.13.該ワークステーションと電話機、
或いは遠隔地に設置された他のワークステーションや端
末等との情報通信を行なう。Communication device 12.13. the workstation and telephone;
Or, it communicates information with other workstations, terminals, etc. installed in remote locations.
切換え装置14;複数の通信装置を切換え使用する。Switching device 14: Switches and uses a plurality of communication devices.
タイマ一部15.該ワークステーションに時刻情報や時
間情報を提供する。Timer part 15. Provide time information and time information to the workstation.
暗号化処理部16;種々の情報を暗号化処理する。Encryption processing unit 16: Encrypts various information.
音声照合部17.与えられた音声情報が特定の音声であ
るか否かを照合処理する。Voice verification unit 17. Verification processing is performed to determine whether the given voice information is a specific voice.
イメージ照合部18;与えられたイメージ情報が特定の
イメージであるか否かを照合処理する。Image verification unit 18: Performs verification processing to determine whether the given image information is a specific image.
音声認識部19;与えられた音声情報を認識処理する。Speech recognition unit 19: Recognizes and processes given speech information.
音声分析部20;音声人力部5等から入力された音声の
特徴を抽出する等して該音声を分析処理する。Speech analysis unit 20: Analyzes and processes the voice input from the voice human power unit 5 etc. by extracting the characteristics of the voice.
文字認識部21.前記イメージ人力装置3等から人力さ
れた文字・記号パターンを認識処理する。Character recognition section 21. Character/symbol patterns manually input from the image input device 3 or the like are recognized and processed.
イメージ認識部23;前記イメージ人力装置3等から入
力された図形イメージ等を認識処理する。Image recognition unit 23: Recognizes graphic images etc. input from the image human power device 3 and the like.
出力形態選択部24;該ワークステーションから出力す
る情報の形態を選択制御する。Output format selection unit 24: Selects and controls the format of information output from the workstation.
作業環境データ収集部25;該ワークステーショの機能
状態や、それによるオフィス内の作業環境等の情報を収
集人力する。Work environment data collection unit 25: Collects information on the functional status of the workstation and the work environment in the office.
音声合成部26;処理データに従って合成音声を生成す
る。Speech synthesis unit 26; generates synthesized speech according to the processed data.
イメージ合成部27;復数のイメージ情報を合成処理し
たり、処理データに従ってイメージの編集処理を実行す
る。Image composition unit 27: performs composition processing on multiple pieces of image information and executes image editing processing according to processing data.
図形合成処理部28;種々の図形を合成処理したり、処
理データに従って図形の加入・削除等の編集処理を実行
する。Graphic composition processing unit 28: Composes various graphics and executes editing processing such as adding and deleting graphics according to processing data.
音声の圧縮・伸長部29;音声データを圧縮符号化した
り、圧縮された音声データの復元伸長を行なう。Audio compression/expansion unit 29: compresses and encodes audio data, and restores and expands compressed audio data.
イメージの圧縮・伸長部30;イメージ・データを圧縮
符号化したり、圧縮されたイメージ・データの復元伸長
を行なう。Image compression/expansion unit 30; compresses and encodes image data, and restores and expands compressed image data.
信号処理部31:種々の信号情報の符号化圧縮やその復
元伸長、必要な情報の付加等の一連の信号処理を実行す
る。Signal processing unit 31: Executes a series of signal processing such as encoding and compressing various signal information, decompressing and decompressing the same, and adding necessary information.
データベース部32;種々の情報を複数のりレーション
にそれぞれ分類し、データベースとして蓄積する。尚、
このデータベースはコード情報のみならず、イメージや
音声等としても構築される。Database unit 32: Classifies various information into a plurality of relations and stores them as a database. still,
This database is constructed not only as code information but also as images, sounds, etc.
本発明に係る知的ワークステーションは、基本的には上
述した各部を備えて構成され、上述した各部がそれぞれ
が持つ機能を有効に利用して全体的にインテリジェンス
な機能を呈するものとなっている。The intelligent workstation according to the present invention is basically configured with each of the above-mentioned parts, and each of the above-mentioned parts effectively utilizes its respective functions to exhibit an intelligent function as a whole. .
次に前述したキーボード部5等のように一般的ではなく
、この知的ワークステーションにおいて特徴的な機能を
呈するICカード部7や暗号化処理部16等について更
に詳しく説明する。Next, the IC card section 7, encryption processing section 16, etc., which are not common like the aforementioned keyboard section 5, etc., but have characteristic functions in this intelligent workstation, will be explained in more detail.
先ずICカードは、例えば第3図に示すように名刺大の
大きさのカード本体7a内にマイクロプロセッサやメモ
リ回路等の半導体回路を内蔵し、カードの一端部に、に
述した構成の知的ワークステーション本体に接続する為
のインターフェース部7b、および表示窓部7cを設け
て構成される。First, an IC card has a semiconductor circuit such as a microprocessor and a memory circuit built into a card body 7a, which is about the size of a business card, as shown in FIG. It is constructed by providing an interface section 7b for connection to the workstation main body and a display window section 7c.
尚、表示窓部7cは透明偏光体を埋め込んで形成される
もので、その位置はインターフェース部7bや半導体回
路と垂畳しない位置に設定される。またカード本体7a
は、上記表示窓部7cに対応する部分のみが透明であっ
ても良く、またその基板全体が透明なものであっても良
い。The display window section 7c is formed by embedding a transparent polarizer, and its position is set so that it does not overlap with the interface section 7b or the semiconductor circuit. Also, the card body 7a
Only the portion corresponding to the display window 7c may be transparent, or the entire substrate may be transparent.
しかしてICカードは、具体的には第4図にその分解斜
視図を示すように、一対のカバー基板7d。Specifically, as shown in an exploded perspective view of FIG. 4, the IC card has a pair of cover substrates 7d.
7e、これらのカバー基板7d、 7eに挟持される埋
め込み基板7r1コアシ一ト材7g1プリント基板7h
を一体的に熱圧着して構成される。7e, a buried substrate 7r1, a core sheet material 7g1, a printed circuit board 7h, sandwiched between these cover substrates 7d and 7e.
It is constructed by integrally bonding them together by thermocompression.
このプリント基板7hの前記インターフェース部7bに
対向する位置には入出力端子71が設けられ、また表示
窓部7cに対向する位置には液晶表示装置7jが設けら
れる。更にはプリント基板7hには半導体集積回路7k
が設けられる。またカバー基板7eには前記プリント基
板7hにおける発熱を発散する為の金属箔ガが設けられ
る。An input/output terminal 71 is provided on the printed circuit board 7h at a position facing the interface portion 7b, and a liquid crystal display device 7j is provided at a position facing the display window portion 7c. Furthermore, a semiconductor integrated circuit 7k is mounted on the printed circuit board 7h.
is provided. Further, the cover substrate 7e is provided with a metal foil gas for dissipating heat generated in the printed circuit board 7h.
尚、カバー基板7d、 7eや埋め込み基板7f1コア
シート材7gにそれぞれ穿たれた孔部はプリント基板7
hに集積された半導体集積回路7j等にそれぞれ対向す
る位置に設けられたものである。これらの孔部に上記半
導体集積回路7に等を嵌合させて前記カバー基板7d、
7e、埋め込み基板7「、コアシート材7g1プリン
ト基板7hが積層一体化されてICカードが構成される
。そして入出力端子71は、カバー基板7dに穿たれた
孔部を介して露出し、ワークステーション本体に電気的
に接続されるインターフェース部7bを構成する。Note that the holes drilled in the cover substrates 7d and 7e, the embedded substrate 7f1, and the core sheet material 7g are connected to the printed circuit board 7.
The semiconductor integrated circuits 7j and the like integrated in the semiconductor integrated circuits 7j and the like are provided at positions facing each other. The semiconductor integrated circuit 7, etc. are fitted into these holes, and the cover substrate 7d,
7e, an embedded substrate 7'', a core sheet material 7g, and a printed circuit board 7h are laminated and integrated to form an IC card.The input/output terminal 71 is exposed through a hole drilled in the cover substrate 7d, and is inserted into the workpiece. It constitutes an interface section 7b that is electrically connected to the station main body.
尚、前記液晶表示装置7jは、例えば第5図にプリント
基板7に部の断面構造を示すように、スペーサを介して
設けられた一対のポリエーテルサルフォンフィルム基板
の間に液晶層を挟持し、該フィルム基板の内側面に透明
導電膜をそれぞれ形成すると共に、下面側のフィルム基
板に偏光体や反射体を設けて構成される。このようにポ
リエーテルサルフォンフィルム基板を用いて液晶表示装
置7jを構成すれば、その厚みを0.6p以下にするこ
とも容易であり、ガラス基板を用いて液晶表示装置を構
成する場合に比較してICカード自体を薄くすることが
できる。The liquid crystal display device 7j has a liquid crystal layer sandwiched between a pair of polyether sulfone film substrates provided with a spacer in between, as shown in FIG. , a transparent conductive film is formed on the inner surface of the film substrate, and a polarizer or a reflector is provided on the lower film substrate. If the liquid crystal display device 7j is constructed using a polyether sulfone film substrate in this way, it is easy to reduce the thickness to 0.6p or less, compared to the case where the liquid crystal display device is constructed using a glass substrate. This allows the IC card itself to be made thinner.
またこのICカードの駆動電源については、前記インタ
ーフェース部7bを介してワークステーション本体側か
ら供給するようにしても良いが、カード内に内蔵するよ
うにしても良い。この場合には、例えば高分子フィルム
を用いたシート状の電池として組込むようにすれば良い
。Further, the driving power for this IC card may be supplied from the workstation main body via the interface section 7b, or it may be built into the card. In this case, it may be incorporated as a sheet-like battery using, for example, a polymer film.
しかして前記′Jf、4体集積回路7には、例えば第6
図に示すようにCPU7pやデータメモリであるPRO
M7q、E2 PROM7r、およびこれらのメモリに
対する選択部78等を備えて構成される。Therefore, the 4-body integrated circuit 7 has, for example, the sixth
As shown in the figure, the CPU 7p and data memory PRO
It is configured to include an M7q, an E2 PROM7r, a selection section 78 for these memories, and the like.
FROM7Qは消去・書替え不可能な大容量の不揮発性
メモリであり、前記CPU7pに対する制御プログラム
や、永久記録すべき情報等を格納している。またE2P
ROM7rは書替え可能な小容量の不揮発性メモリであ
り、例えば情報の取引番号や、情報通番等の使用時に更
新される情報が格納される。FROM 7Q is a large-capacity nonvolatile memory that cannot be erased or rewritten, and stores control programs for the CPU 7p, information to be permanently recorded, and the like. Also E2P
The ROM 7r is a rewritable, small-capacity nonvolatile memory, and stores information that is updated when used, such as information transaction numbers and information serial numbers.
これらのメモリは前記選択部7sの制御により選択的に
駆動され、前記CPU7pとの間で情報の人出力を行な
う。CPU7pはこれらのメモリを用いて必要な情報処
理を実行し、またそのインターフェース部から前述した
端子部71を介して知的ワークステーション本体との間
で情報の人出力を行なう。These memories are selectively driven under the control of the selection section 7s and output information to and from the CPU 7p. The CPU 7p executes necessary information processing using these memories, and outputs information from its interface section to the intelligent workstation main body via the terminal section 71 mentioned above.
前記ICカード部7は、このようなICカードを装着し
、該ICカードとの間で情報の人出力を行なうことにな
る。The IC card unit 7 is equipped with such an IC card and outputs information to and from the IC card.
尚、ICカードは上述した構成に限定されるものでない
ことは勿論のことであり、その構成に応じてICカード
部7が構成されることも云うまでもない。Incidentally, it goes without saying that the IC card is not limited to the configuration described above, and it goes without saying that the IC card section 7 can be configured depending on the configuration.
次に暗号化処理部16について説明する。Next, the encryption processing section 16 will be explained.
暗号化処理部1Bは、例えば第7図に示すように暗号化
部16a1復号化部16b、秘密鍵ファイル部18c
、公開鍵ファイル部led 、そして鍵更新部LGeを
錨えて構成される。For example, as shown in FIG. 7, the encryption processing unit 1B includes an encryption unit 16a1, a decryption unit 16b, and a private key file unit 18c.
, a public key file section led, and a key update section LGe.
そして第8図にその概念を示すように、与えられた通信
原文を暗号鍵に従って暗号化してその暗号通信文を生成
したり、また逆に与えられた暗号通信文を暗号鍵に従っ
て復号してその原文を求める処理を実行する。As the concept is shown in Figure 8, a given original communication text can be encrypted according to an encryption key to generate the encrypted message, or conversely, a given encrypted communication can be decrypted according to the encryption key to generate the encrypted message. Execute the process to obtain the original text.
秘密惇ファイル部18cおよび公開鍵ファイル部l6d
はこの暗号・復号化に用いられる鍵を記憶するものであ
り、鍵更新部L6eはこれらのファイルされた鍵の更新
を司る。Private file section 18c and public key file section l6d
stores the keys used for this encryption/decryption, and the key update unit L6e is in charge of updating these files.
ここで秘密鍵は、この暗号化処理部16を所自°するワ
ークステーションのみが知る鍵であり、他のワークステ
ーション等に対しては秘密にされる。Here, the private key is a key known only to the workstation that owns the encryption processing section 16, and is kept secret from other workstations.
これに対して公開鍵は各ワークステーションに設定され
た各秘密鍵とそれぞれ対をなすものであり、他のワーク
ステーションにそれぞれ与えられて公開される。公開鍵
ファイル部1[idは、これらの複数のワークステーシ
ョンがそれぞれ公開した公開鍵を、各ワークステーショ
ンに対応して記憶するものである。On the other hand, the public key is paired with each private key set in each workstation, and is given to each other workstation and made public. The public key file section 1 [id stores the public keys published by these plurality of workstations in correspondence with each workstation.
暗号化部leaは第9図に示すように、R3A処理部1
61と暗号化種別付加部18jとを備えて構成される。As shown in FIG. 9, the encryption unit lea is the R3A processing unit 1.
61 and an encryption type adding unit 18j.
そして通信原文を暗号化して情報通信しようとするとき
、その通信相手先のワークステーションが公開した公開
鍵を用いて通信原文を暗号化し、その暗号通信文に暗号
の種別を示す情報を付加して通信情報を作成し、これを
通信するものとなっている。尚、暗号の種別の情報は、
例えば“0”で暗号化していないこと、また“1″で暗
号化していることを示す情報や、暗号方式を示す情報等
からなる。When attempting to encrypt the original communication text and communicate information, the original communication text is encrypted using the public key published by the workstation of the communication partner, and information indicating the type of encryption is added to the encrypted communication text. It creates communication information and communicates it. In addition, the information on the type of encryption is as follows.
For example, it includes information such as "0" indicating that it is not encrypted, "1" indicating that it is encrypted, and information indicating the encryption method.
また復号化部16bは、自己ワークステーションが公開
した公開鍵を用いて成るワークステーションが暗号化し
て通信してきた暗号通信文を人力し、これを該秘密鍵に
対応した秘密鍵を用いて復号化するものであり、第10
図に示すように暗号文分割部18k 、暗号種別判定部
1Bm s切換え部18n。Further, the decryption unit 16b manually receives the encrypted message encrypted and communicated by the workstation using the public key published by the self-workstation, and decrypts it using the private key corresponding to the private key. 10th
As shown in the figure, a ciphertext division section 18k, a cipher type determination section 1Bms switching section 18n.
18pSRSA処理部18qを備えて構成される。It is configured with a 18p SRSA processing section 18q.
暗号文分割部tekは、前述したフォーマットで通信さ
れてきた通信情報を前述した暗号種別の情報と暗号化通
信文とに分割するものであり、暗号種別判定部18mは
該暗号種別情報からその通信文が暗号化されているか否
かを判別している。そして暗号化されていない場合には
その通信文を切換え部IGn、16pを介して出力し、
暗号化されている場合にはその通信文をRSA処理部I
Bqに導いている。このRSA処理部18qにて前記秘
密鍵を用いて暗号化通信文が復号化処理され、切換え部
tcpを介して出力される。The ciphertext division unit tek divides the communication information communicated in the above-mentioned format into the above-mentioned cipher type information and the encrypted message, and the cipher type determination unit 18m divides the communication information from the cipher type information. Determines whether the text is encrypted or not. If the message is not encrypted, the message is output via the switching unit IGn, 16p,
If it is encrypted, the message is sent to RSA processing unit I.
Leading to Bq. The encrypted message is decrypted in the RSA processing unit 18q using the private key, and is output via the switching unit tcp.
尚、R5A処理部1B1.113Qは、例えば第11図
に示すようにブロック分割部16sとべき乗慟剰余計算
部let 、およびブロック連結部16uとを備えて構
成される。The R5A processing unit 1B1.113Q is configured to include a block division unit 16s, a power remainder calculation unit let, and a block connection unit 16u, as shown in FIG. 11, for example.
ここでブロック分割部18sは与えられた信号系列を一
定の長さのブロックM、に分割するものであり、べき乗
・剰余計算部181は各ブロックM。Here, the block division section 18s divides the given signal sequence into blocks M of a constant length, and the exponentiation/remainder calculation section 181 divides each block M.
毎に暗号化の、Ikを用いて
N =M−k(sod n)
1+
なる信号系列N、を求めている。但し、nは固定の値で
ある。この信号系列Nlがブロック連結部16uを介し
て順に連結されて出力される。For each encryption, a signal sequence N of N=M−k(sod n) 1+ is obtained using Ik. However, n is a fixed value. This signal sequence Nl is sequentially connected and outputted via the block connection unit 16u.
暗号化処理にあっては、上記信号系列Miが通信原文で
あり、この通信原文から暗号化された通信文が信号系列
N1として求められる。また復号化処理にあっては上記
信号系列M1が暗号化通信文であり、この暗号化通信文
から復号化された通信原文が信号系列N、として求めら
れる。In the encryption process, the signal series Mi is the original communication text, and the encrypted communication text is obtained from the original communication text as the signal series N1. In the decryption process, the signal sequence M1 is an encrypted message, and the original communication text decrypted from this encrypted message is obtained as a signal sequence N.
このような暗号化・復号化を担う鍵kが前述した公開鍵
と秘密鍵であり、これらは対をなして設定される。The key k responsible for such encryption/decryption is the aforementioned public key and private key, which are set as a pair.
従ってワークステーションは、他のワークステーション
から公開された公開鍵に従って通信情報をそれぞれ暗号
化することはできるが、その暗号化された通信文を復号
化し得るのは、その公開鍵と対をなす秘密鍵を知り得る
特定のワークステーションだけとなる。Therefore, each workstation can encrypt communication information according to a public key made public by another workstation, but the encrypted communication can only be decrypted using the secret paired with the public key. Only certain workstations can know the key.
従って成る情報を暗号化して通信しようとするワークス
テーションは、通信相手先のワークステーションが公開
した公開鍵に従って該通信原文を暗号化して通信する。A workstation that wishes to encrypt and communicate information thus encrypts the original communication text in accordance with a public key made public by the workstation with which it communicates.
そしてその通信情報は、秘密鍵を持つ通信相手先のワー
クステーションのみが復号し得るものとなっている。The communication information can only be decrypted by the communication partner's workstation that has the private key.
尚、他のワークステーションがそれぞれ公開した公開鍵
の全てを公開鍵ファイルledに格納してお(必要はな
い。例えばシステムに対して別に設けられた公開鍵ファ
イル・メモリに、各ワークステーションが公開した公開
鍵を各ワークステーシジンに対応されてファイルしてお
く。そして情報通信が必要となったとき、その通信相手
先の公開鍵を上記公開鍵ファイル・メモリから読出して
自己のワークステーションの公開鍵ファイル部16に格
納するようにしても良い。Note that all the public keys published by other workstations are stored in the public key file led (it is not necessary. For example, each workstation stores the public keys in the public key file memory provided separately for the system. The public key of each workstation is stored in a file corresponding to each workstation.When information communication becomes necessary, the public key of the communication partner is read from the public key file memory and the public key of the own workstation is opened. It may also be stored in the key file section 16.
以上が暗号化処理部16の基本的な構成とその機能であ
る。The above is the basic configuration of the encryption processing section 16 and its functions.
次にイメージ照合部18について説明する。Next, the image matching section 18 will be explained.
このイメージ照合部18は、前記イメージ入力装置3か
ら人力されたイメージ情報、例えば個人の顔のイメージ
を入力し、その個人同定を行なうものである。The image matching unit 18 inputs manually input image information from the image input device 3, for example, an image of an individual's face, and identifies the individual.
第12図はこのイメージ照合部の概略構成を示すもので
、18aはイメージ記憶部、+8bは正規化回路、18
cは2値化(細線化)回路、+8dは特徴データ抽出回
路である。また 18eはイメージデータを記憶したデ
ータ記憶部であり、18rは検索回路、18gは照合回
路、そして 18hは出力部である。FIG. 12 shows a schematic configuration of this image matching section, in which 18a is an image storage section, +8b is a normalization circuit, and 18a is an image storage section;
c is a binarization (thinning) circuit, and +8d is a feature data extraction circuit. Further, 18e is a data storage section storing image data, 18r is a search circuit, 18g is a collation circuit, and 18h is an output section.
イメージ記憶部18aは前記イメージ入力装置3を介し
て入力されたイメージ情報を記憶し、そのイメージ照合
処理に供するものである。このイメージ記憶部18aに
記憶されたイメージ情報に対して正規化回路18bは正
規化処理し、また2値化回路18cは2値化処理する。The image storage section 18a stores image information input through the image input device 3, and performs image verification processing. The normalization circuit 18b performs normalization processing on the image information stored in the image storage section 18a, and the binarization circuit 18c performs binarization processing on the image information.
具体的には、ここでは個人の顔のイメージからその個人
同定を行なうべく、正規化回路18bはその顔の大きさ
を正規化している。この正規化された顔のイメージに対
して2値化回路18cは、例えばエツジ線分検出、その
エツジ線分の細線化処理等を行なって該イメージの2値
画像を求めている。Specifically, here, the normalization circuit 18b normalizes the size of the individual's face in order to identify the individual based on the image of the individual's face. The binarization circuit 18c performs, for example, edge line detection and thinning processing on the normalized face image to obtain a binary image of the image.
特徴データ抽出回路+8dは、このようにして正規化・
2値化されたイメージ情報からその特徴データを抽出す
るものである。即ち、顔のイメージによる照合処理にあ
っては、例えば第13図に示すように顔の輪郭を1つの
特徴として抽出し、更にそのイメージ中の口、鼻、口等
の特徴を抽出している。具体的には、顔の輪郭的特徴を
分類されたコード情報として、また両眼間の距離ノ、口
の大きさm1目と口との距fin等を数値データとして
そのイメージの特徴として抽出している。The feature data extraction circuit +8d performs normalization and
This method extracts feature data from binarized image information. That is, in the matching process using a face image, for example, as shown in FIG. 13, the outline of the face is extracted as one feature, and the features such as the mouth, nose, mouth, etc. in the image are further extracted. . Specifically, the contour features of the face are extracted as classified code information, and the distance between the eyes, the size of the mouth (m1), the distance between the eyes and the mouth (fin), etc. are extracted as numerical data as features of the image. ing.
しかしてデータ記憶部18cには、予め各個人について
求められた顔のイメージの特徴データが、例えば第14
図に示すように登録されている。即ち、各個人毎にその
個人名を識別名として上述した顔のイメージの特徴デー
タが登録され、Rっその顔のイメージ・データがポイン
タによって結ばれている。The data storage unit 18c stores, for example, the 14th facial image feature data obtained for each individual in advance.
It is registered as shown in the figure. That is, the above-mentioned facial image feature data is registered for each individual using the individual's name as an identification name, and R's facial image data are connected by a pointer.
検索回路181’は前記特徴データ抽出回路+8dにて
抽出された特徴データに基いて該データ記憶部18oを
検索している。そしてその検索データは照合回路18g
に与えられ、前記特徴データ抽出回路18dで求められ
た特徴データと照合処理されている。The search circuit 181' searches the data storage section 18o based on the feature data extracted by the feature data extraction circuit +8d. And the search data is collation circuit 18g
, and is compared with the feature data obtained by the feature data extraction circuit 18d.
この照合処理は、例えば特徴データ抽出回路18dで求
められた入力イメージの特徴データをX、(iは特徴の
種別)、データ記憶部18cに登録されているイメージ
の特徴データをY、とじたとき、
D−Σ IX、−Y、1
、 l l
なる演算を行い、その演算結果りの値が最も小さいもの
を、その個人として同定することによって行われる。こ
の同定結果が出力部+8hを介して出力される。This matching process is performed, for example, when the feature data of the input image obtained by the feature data extraction circuit 18d is set as X (i is the type of feature), and the feature data of the image registered in the data storage unit 18c is set as Y. , D-Σ IX, -Y,1, l l , and the one with the smallest value as the result of the calculation is identified as that individual. This identification result is output via the output section +8h.
イメージ照合部18は、基本的にはこのようにして人力
イメージを照合処理し、例えば該入力イメージの個人同
定等を行なう。The image matching unit 18 basically performs matching processing on human images in this manner, and performs, for example, individual identification of the input image.
次に音声認工部19について説明する。Next, the voice recognition section 19 will be explained.
音声認識部19は、例えば第15図に示すように構成さ
れる。音声入力回路19aは、前記音声人力部5から入
力された音声信号、または公衆電話回線を介して前記通
信装置12.13にて受信された音声信号を人力するも
ので、この人力音声信号を適当な信号レベルに増幅する
増幅器や、帯域制限用のバンドパスフィルタおよびA/
D変換器等によって構成される。入力音声はこの音声入
力回路19aにて、例えば30〜3400 Hzの周波
数帯域のイ;号に制限され、12KHzのサンプリング
周期で12ビツトのディジタル信号に二子化される。The speech recognition unit 19 is configured as shown in FIG. 15, for example. The audio input circuit 19a is for manually inputting the audio signal input from the audio input section 5 or the audio signal received by the communication device 12.13 via the public telephone line, and converts this human input audio signal into an appropriate form. Amplifiers that amplify the signal to a certain level, bandpass filters that limit the bandwidth, and A/
It is composed of a D converter and the like. The input voice is limited to a frequency band of, for example, 30 to 3400 Hz by the voice input circuit 19a, and is converted into a 12-bit digital signal at a sampling period of 12 KHz.
音響処理部19bは、例えば専用のハードウエアにより
構成された積和回路からなる。そして基本的には前記音
声入力回路19aと同期してパイプライン的に高速動作
する。The acoustic processing section 19b is composed of, for example, a product-sum circuit constructed from dedicated hardware. Basically, it operates at high speed in a pipeline manner in synchronization with the audio input circuit 19a.
ここでの音響処理は、2種のバンドパスフィルタ群によ
り実行される。その1つは16チヤンネルのフィルタバ
ンクで、このフィルタバンクを介して人力音声信号のス
ペクトルの変化が抽出される。The acoustic processing here is performed by two types of bandpass filter groups. One of them is a 16-channel filter bank, through which changes in the spectrum of the human voice signal are extracted.
今1つは、同じ帯域を4チヤンネルに分割したグロスフ
ィルタであり、このグロスフィルタを介して人力音声の
音響的特徴が抽出される。The other is a gloss filter that divides the same band into four channels, and the acoustic features of human speech are extracted through this gloss filter.
これらの2種類のフィルタ群(フィルタバンクとグロス
フィルタ)は、例えば4次巡回形のディジタルフィルタ
として構成される。そして、例えばl0m5ec毎にそ
のフィルタリング出力を求めるものとなっている。尚、
この音響処理部の制御はマイクロプログラム方式にて行
われる。These two types of filter groups (filter bank and gross filter) are configured, for example, as fourth-order cyclic digital filters. Then, for example, the filtering output is obtained every 10m5ec. still,
Control of this sound processing section is performed using a microprogram method.
しかして前処理・認識部19cは、高速プロセッサ19
d 、パターンマツチング処理部19e、単語辞書メモ
リ19r1およびバッファメモリ19gによって構成さ
れる。Therefore, the preprocessing/recognition unit 19c is a high-speed processor 19.
d, a pattern matching processing section 19e, a word dictionary memory 19r1, and a buffer memory 19g.
バッファメモリ19gは上記音響処理部+9bにてフィ
ルタリング処理された音声信号を入力し、例えば最大1
.8秒分の音声データを蓄積するものとなっている。高
速プロセッサ19dはこのバッファメモリ19gに格納
されたデータに対して、音声区間検出、リサンプリング
、ラベリング、遷移ネットワークによる認識処理、およ
びその総合論理判定処理の実行を行なっている。またこ
の高速プロセッサL9dにより、ホスト計算機との間の
通信や該音声認識部1B全体の動作制御が行われる。The buffer memory 19g inputs the audio signal filtered by the audio processing unit +9b, and for example, a maximum of 1
.. It stores 8 seconds worth of audio data. The high-speed processor 19d performs voice section detection, resampling, labeling, recognition processing using a transition network, and comprehensive logical judgment processing on the data stored in the buffer memory 19g. The high-speed processor L9d also performs communication with the host computer and controls the overall operation of the speech recognition section 1B.
この高速プロセッサ19dにて処理された音声データに
ついて、パターンマツチング処理部19cは単語辞書メ
モリ19「に登録された単語音声の標亭パターンデータ
との間で腹合類似度計算等のマツチング処理を実行し、
その認識候補を求めている。The pattern matching processing unit 19c performs matching processing such as calculating the degree of similarity between the audio data processed by the high-speed processor 19d and the standard pattern data of the word audio registered in the word dictionary memory 19. execute,
We are looking for recognition candidates.
例えば認識対象となる音声単語は離散的に発声される。For example, speech words to be recognized are uttered discretely.
そこで高速プロセッサ19dは、例えば音響処理の際に
10Ilsec毎に計算される入力音声エネルギを用い
て単語−音声の入力区間を検出している。Therefore, the high-speed processor 19d detects a word-speech input section using input voice energy calculated every 10 Ilsec during acoustic processing, for example.
具体的には第16図に示すように、背景雑音レベルと入
力音声レベルとから適応的に計算される閾値E。を用い
、入力音声信号レベルが上記閾値Eoを一定時間以上継
続して越えたとき、譲閾値E、を越えた時点を音声単語
の始端Sとして検出している。その後、上記入力音声信
号のレベルが上記閾値E。を一定時間以上継続して下回
ったとき、該閾値E。を下回った時点を音声単語の終端
Eとして検出している。Specifically, as shown in FIG. 16, the threshold E is adaptively calculated from the background noise level and the input voice level. When the input audio signal level continuously exceeds the threshold value Eo for a certain period of time or more, the time point at which the input audio signal level exceeds the concession threshold value E is detected as the starting point S of the audio word. Thereafter, the level of the input audio signal reaches the threshold E. When the threshold value E continues to be lower than the threshold value E for a certain period of time or more. The point in time when the value falls below is detected as the end E of the spoken word.
ところで音声認識はパターン認識の一種として考え得る
。しかし音声特有のパターン変動や、話者の性別・発声
器官の形状・発声法等に起因する個人差、また話者自身
が発生する雑音や周囲環境の雑音、更には電話音声の場
合には公衆電話回線を経由したことによるレベル差や雑
音の問題がある。この為、これらを考慮し、上述した変
動要素を吸収して、如何に精度良く、安定に音声認識す
るかか問題となる。By the way, speech recognition can be considered as a type of pattern recognition. However, there are variations in the patterns peculiar to speech, individual differences due to the gender of the speaker, the shape of the vocal organs, the method of enunciation, etc., as well as noise generated by the speaker himself or herself, noise from the surrounding environment, and even, in the case of telephone speech, public noise. There are problems with level differences and noise caused by going through a telephone line. Therefore, the problem is how to accurately and stably recognize speech by taking these into account and absorbing the above-mentioned fluctuating factors.
そこでこの前処理・認識部19cではパターンマツチン
グ法と構造解析法とを2段階に組合せ、ハイブリッド構
造マツチング法と称される認識法を採用している。Therefore, the preprocessing/recognition unit 19c employs a recognition method called a hybrid structure matching method, which combines the pattern matching method and the structural analysis method in two stages.
即ち、上述したように単語音声区間が検出されると、先
ずその音声区間(S、E)を15等分し、その16点を
それぞれリサンプル点とする。そして前述した如く音響
処理された16チヤンネルの音声データ(スペクトル時
系列)から上記各リサンプル点でのスペクトルを抽出す
る。尚、音声データのサンプル点と上記リサンプル点と
の間でずれがある場合には、リサンプル点の最近傍点の
スペクトルを抽出すれば良い。That is, when a word speech section is detected as described above, the speech section (S, E) is first divided into 15 equal parts, and each of the 16 points is set as a resample point. Then, the spectrum at each resample point is extracted from the 16 channels of audio data (spectral time series) that have been acoustically processed as described above. Note that if there is a deviation between the sample point of the audio data and the resample point, the spectrum of the nearest point to the resample point may be extracted.
このリサンプル処理によって18X 1B (−256
)次元の音声パターン・ベクトルXを求める。即ち、第
j (j −1,2,3,〜1B)番目のりサンプル
点を「、とするとき、「、での16チヤンネルのスペク
Jコ
トルデータを
S(、)−(S 、S 、〜S 、)r J
lrJ、 2r3.
16r3て
X−(S S −S −S
)tlrl、 lr2. 2r1.
18r16なる音声パターンのベクトルXを求める。By this resampling process, 18X 1B (-256
) dimension speech pattern vector X is determined. That is, when the j-th (j -1, 2, 3, ~1B)-th sample point is , the spectrum J cottle data of 16 channels at ', is S (,) - (S , S , ~ S,)r J
lrJ, 2r3.
16r3 X-(S S -S -S
) tlrl, lr2. 2r1.
Find the vector X of the voice pattern 18r16.
但し、tは行列の転置を示す。However, t indicates the transposition of the matrix.
このようにして求められた入力音声パターンベクトルX
と、単語辞書メモリ19fに予め登録された単語音声の
標準パターンとの類似度が、例えば複合類似度法によっ
て計算される。Input speech pattern vector X obtained in this way
The degree of similarity between this word and a standard pattern of word sounds registered in advance in the word dictionary memory 19f is calculated by, for example, a composite similarity method.
ここで単語辞書メモリ191’に予め登録された単語音
声の標章パターンは、その単語カテゴリωkについて、
(ψ ψ 、〜ψ14.)
1に’ 2k
(λ λ 、〜λ1.k)
1に’ 2に
但し、
(λlk”λ2k”〜2λLk)
として準備されている。尚、ψ λ はカテゴ、に’
、に
りωkに属するパターンベクトルXの分散行列Kにおけ
る固何ベクトルとその固a値である。このような単語辞
書について、上述した複合類似度として計算される。尚
、上式においてII X IIはベクトルXのノルムで
ある。Here, the mark pattern of the word sounds registered in advance in the word dictionary memory 191' is (ψ ψ , ~ψ14.) 1 to' 2k (λ λ , ~λ1.k) 1 to' for the word category ωk. 2, however, it is prepared as (λlk"λ2k"~2λLk). Furthermore, ψ λ is the category, ni'
, and its fixed a value in the dispersion matrix K of the pattern vector X belonging to ωk. For such word dictionaries, the above-mentioned composite similarity is calculated. Note that in the above equation, II X II is the norm of the vector X.
このような複合類似度計算が全てのカテゴリについてそ
れぞれ行われ、上位に位置する類似度値と、それを得た
カテゴリ名とが対にして求められる。Such composite similarity calculations are performed for all categories, and the top similarity value and the resulting category name are determined as a pair.
このような複合類似度法によるパターンマツチングによ
って、多くのパターン変動を救出した認識処理が可能と
なる。しかし類似パターンや’a Fiが加わったパタ
ーンでは、異なるカテゴリ間でその類似度値の差が小さ
くなることがある。Pattern matching using such a composite similarity method enables recognition processing that eliminates many pattern variations. However, for similar patterns or patterns with 'a Fi added, the difference in similarity values between different categories may become small.
そこで前述したようにパターンマツチング法を補うもの
として、以下の構造解析の手法を導入している。この構
造解析は、単語音声を構成する音の違いに着口して認識
処理するもので、音素ラベル系列と音響的特徴系列の2
つの時系列を利用している。Therefore, as mentioned above, the following structural analysis method has been introduced as a supplement to the pattern matching method. This structural analysis focuses on recognition processing based on the differences in the sounds that make up word speech, and consists of a phoneme label series and an acoustic feature series.
It uses two time series.
即ち、音素ラベル系列は、入力音声信号から1゜l5l
e毎に計算される16チヤンネルのスペクトルを用いて
音素辞書との類似度を計算し、一定値以−1−の類似度
を持つ音素のラベル付けして求める。尚、この音素ラベ
ルは、例えば5つの母音と鼻音との6種類からなる。こ
の際、音素辞書は、男声と女声に分けてそれぞれ準備し
ておく方が望ましい。That is, the phoneme label sequence is 1°l5l from the input audio signal.
The degree of similarity with the phoneme dictionary is calculated using the spectrum of 16 channels calculated for each e, and phonemes having a degree of similarity of −1− above a certain value are labeled and determined. Note that this phoneme label consists of six types, for example, five vowels and nasal sounds. At this time, it is preferable to prepare separate phoneme dictionaries for male voices and female voices.
ここで比較的安定に発音される母音に比べ、子音を音素
として個々にラベル付けすることが困難である。従って
その子音についてはその音響的な特徴をラベル付けし、
これを特徴情報とする。具体的には、音響処理で求めら
れる4チヤンネルのグロスフィルタの出力と音声エネル
ギとから音響的特徴を抽出する。このようにして特徴抽
出されてラベル付けされる音響的特徴は、例えば第17
図にグロスフィルタの出力の特徴と対比して示すように
、無音性、無声性、摩擦性、破裂性、エネルギ・ディッ
プ等の12種類からなる。Compared to vowels, which are pronounced relatively stably, it is difficult to label consonants individually as phonemes. Therefore, the consonant is labeled with its acoustic characteristics,
This is taken as characteristic information. Specifically, acoustic features are extracted from the output of a four-channel gross filter and audio energy obtained through acoustic processing. The acoustic features extracted and labeled in this way are, for example, the 17th
As shown in the figure in comparison with the characteristics of the output of the gloss filter, there are 12 types such as silence, voicelessness, friction, rupture, and energy dip.
しかして入力音声について求められた音素・音響ラベル
系列は、前記音声区間(S、E)を含む範囲に亙って、
各単語カテゴリ毎に作られた、例えば第18図に示す如
き遷移ネットワークに入力される。Thus, the phoneme/acoustic label sequence obtained for the input speech is as follows over the range including the speech section (S, E):
The information is input to a transition network created for each word category, as shown in FIG. 18, for example.
この遷移ネットワークの各ノード毎に、指定された音素
ラベルや音響的特徴の有無をチェックする。そして無で
あればリジェクト、育であれば次のノードに遷移させ、
その特徴系列が終了した時点で遷移ネットワークのゴー
ルに到達した入力系列を受理し、そのカテゴリを求める
。尚、系列のチェックの方向は、ネットワーク毎にその
正逆を選択可能なものである。The presence or absence of the specified phoneme label or acoustic feature is checked for each node of this transition network. If there is no, it will be rejected, if it is Iku, it will move to the next node,
When the feature sequence ends, the input sequence that has reached the goal of the transition network is accepted, and its category is determined. Note that the direction of sequence checking can be selected from forward to reverse for each network.
総合判定論理は、前述した如くパターンマツチングによ
って順序付けられた候補カテゴリと、遷移ネットワーク
により求められた認識結果とを総合して、その最終判定
を行なうロジックである。The comprehensive judgment logic is a logic that synthesizes the candidate categories ordered by pattern matching as described above and the recognition results obtained by the transition network, and makes a final judgment.
即ち、この総合判定論理は、パターンマツチングで求め
られた最大類似度を81としたとき、これを所定の閾値
θと比較する。そして(slくθ)の場合、これを雑音
としてリジェクトする。That is, in this comprehensive judgment logic, when the maximum similarity obtained by pattern matching is set to 81, this is compared with a predetermined threshold value θ. In the case of (sl×θ), this is rejected as noise.
また(S1≧θ)の場合には、別の閾値Δθを用いて(
S、−Δθ)以上の類似度を持つカテゴリを候補として
抽出する。そしてその抽出されたカテゴリの数nが1つ
である場合、これを認識結果として抽出する。また複数
のカテゴリが抽出された場合には、前記遷移ネットワー
クによる解析結果を参照し、遷移ネットワークで受理さ
れたカテゴリのみを抽出する。そしてその中で最大の類
似度を持つカテゴリを認識結果として求める。In addition, in the case of (S1≧θ), another threshold value Δθ is used to
Categories with a degree of similarity greater than or equal to S, -Δθ) are extracted as candidates. If the number n of extracted categories is one, this is extracted as the recognition result. Furthermore, when a plurality of categories are extracted, only the categories accepted by the transition network are extracted by referring to the analysis results by the transition network. Then, the category with the greatest degree of similarity is determined as the recognition result.
尚、閾値処理によって抽出されたカテゴリの中に、遷移
ネットワークで受理されたものが含まれない場合には、
判定不能とする。In addition, if the categories extracted by threshold processing do not include those accepted by the transition network,
It is assumed that it is impossible to judge.
以上のようにして複合類似度法によるパターン認識処理
結果と、遷移ネットワークを用いた認工結果とを統合し
てその入力単語音声の認識が行われる。As described above, the pattern recognition processing result using the composite similarity method and the recognition processing result using the transition network are integrated to recognize the input word speech.
第19図はこの音声認識部における単語音声の認識処理
手続きの流れを示すもので、音声区間検出処理の後、リ
サンプル処理してパターンマツチングを行い、同時にラ
ベリング処理して遷移ネットワークによるチェックを行
い、しかる後、これらの各認識結果を統合してその総合
判定論理処理を行なうことが示される。このような処理
が前記高速プロセッサ19dによる処理シーケンスの下
で実行される。Figure 19 shows the flow of the word speech recognition processing procedure in this speech recognition unit. After speech segment detection processing, resampling processing is performed to perform pattern matching, and at the same time, labeling processing is performed to check using a transition network. After that, these recognition results are integrated to perform comprehensive judgment logic processing. Such processing is executed under a processing sequence by the high-speed processor 19d.
ところで離散的に発声された単語音声ではなく、連続発
声された音声中の単語を認識する場合には次のようにす
れば良い。即ち、この場合には入力音声を種々の部分区
間に分割し、その部分区間毎に単語識別を行なって単語
類似度を求めるようにすれば良い。By the way, if you want to recognize words in continuously uttered speech instead of discretely uttered word sounds, the following may be used. That is, in this case, the input speech may be divided into various sub-intervals, and the word similarity may be determined by performing word identification for each sub-interval.
具体的には、例えば第20図に示すように人力音声区間
における全ての分析フレーム間をそれぞれ部分区間の境
界候補とし、該人力音声区間を段数の部分区間に分ける
。この際、認識対象となる単語の継続時間長については
最大時間長D とl1ax
最小時間長D 、が設定できるので、その範囲内ln
の部分区間だけを認識処理対象とすれば良い。Specifically, as shown in FIG. 20, for example, all analysis frames in a human voice section are set as boundary candidates for partial sections, and the human voice section is divided into a number of partial sections. At this time, since the maximum time length D and the minimum time length D can be set for the duration of the word to be recognized, only a partial section ln within the range needs to be targeted for recognition processing.
ここで第20図に示す例では、連続発声された音声の単
語数が2個の場合を想定して2つの部分区間を求めてい
る。しかし一般的には入力音声の単語数は不明であるか
ら、2単語からn単語までが単語候補として存在すると
仮定して部分区間をそれぞれ検出すれば良い。そして検
出された各部分区間について単語類似度の計算を行い、
その類似度結果の繋がり関係を相互に比較して最も信頼
性の高い部分区間の境界を求め、その境界によって区切
られた部分区間の各単語認識結果を求めるようにすれば
良い。In the example shown in FIG. 20, two partial sections are calculated assuming that the number of words in the continuously uttered voice is two. However, since the number of words in the input speech is generally unknown, it is sufficient to assume that 2 to n words exist as word candidates and to detect each partial interval. Then, calculate the word similarity for each detected subinterval,
The connections between the similarity results may be compared with each other to find the most reliable boundary of the sub-interval, and then the word recognition results for each of the sub-intervals separated by the boundary may be obtained.
然し乍ら、このようにして部分区間を求めて単語類似度
計算を行なう場合、部分区間の数が膨大なものとなる為
、処理の高速化が妨げられる。従って実際的には処理の
高速化を考慮して、例えば入力単語数が2〜5単語、1
単語の継続時間長が128〜640 a+sec、 1
回の発声における単語長の比が2.5以下、フレーム周
期は16m5ec (8ssec周期で2個に1個の単
語を取出す)等の制限を加えて部分区間を検出するよう
にすれは良い。However, when calculating word similarity by obtaining subintervals in this manner, the number of subintervals becomes enormous, which hinders speeding up of processing. Therefore, in practice, in consideration of speeding up the processing, for example, the number of input words is 2 to 5 words, 1
Word duration is 128-640 a+sec, 1
It is good practice to detect partial intervals with restrictions such as a word length ratio of utterances of 2.5 or less and a frame period of 16 m5ec (extracting one word out of every two in a period of 8 ssec).
このようにすれば連続発声された音声中の単語をそれぞ
れ効果的に認識することが可能となる。In this way, it becomes possible to effectively recognize each word in continuously uttered speech.
ところでこのような音声認識処理に供される辞書(単語
辞書)の学習は次のようにして行われる。By the way, learning of a dictionary (word dictionary) used for such speech recognition processing is performed as follows.
この学習処理は、■母音パターンおよび子音パターンか
らその特性核を求める処理と、■その特性核に対する固
有値と固をベクトルを求める処理とに大別される。そし
てこの固HFIと固育ベクトルとを、その固有値の大き
いものから順にN測水める。この処理は一般にKL展開
と称されるものである。This learning process is roughly divided into (1) a process for finding the characteristic kernel from the vowel pattern and the consonant pattern, and (2) a process for finding the eigenvalue and solid vector for the characteristic kernel. Then, the solid HFI and the solid growth vector are measured N in order from the one with the largest eigenvalue. This process is generally called KL expansion.
先ず特性核を求める処理について説明すると、入力音声
パターン(学習パターン)の特性核には、その学習パタ
ーンの縦ベクトルをS としたとき、次のようにして求
められる。First, the process of determining the characteristic kernel will be described. The characteristic kernel of an input speech pattern (learning pattern) is determined as follows, where S is the vertical vector of the learning pattern.
ここに、
5−(S S −S)L
II1ml’ m2’ own尚、この学習パ
ターンS は、子音パターンの蹟
場合には64次元の縦ベクトルとして与えられる。Here, 5-(S S -S)L II1ml'm2' own Note that this learning pattern S is given as a 64-dimensional vertical vector in the case of a consonant pattern.
また母音パターンの場合には16次元の縦ベクトルとし
て与えられる。In the case of a vowel pattern, it is given as a 16-dimensional vertical vector.
しかして特性核には、m個の学習パターンについて、そ
の縦ベクトルS と、この縦ベクトルS を転置した横
ベクトルS とを掛合わせて作ll!1
成される行列の各成分を、上記m個の学習パターンに亙
って平均化して求められる。従って特性核の要素数は上
記ベクトルの要素数の2乗となる。Therefore, the characteristic kernel is created by multiplying the vertical vector S of m learning patterns by the horizontal vector S obtained by transposing this vertical vector S! 1 is obtained by averaging each component of the matrix formed over the m learning patterns. Therefore, the number of elements of the characteristic kernel is the square of the number of elements of the vector.
尚、このような処理によってそのカテゴリのパターン分
布を反映した特性核Kを得るには、成る程度の量の学習
パターンを必要とする。この為、学習パターン・メモリ
に予め所定数の学習パターンを蓄積しておくことが必要
となる。Note that in order to obtain the characteristic kernel K that reflects the pattern distribution of the category through such processing, a sufficient amount of learning patterns are required. For this reason, it is necessary to store a predetermined number of learning patterns in the learning pattern memory in advance.
ところが母音の場合には16次元で最低6個のカテゴリ
の学習パターンをIfl(Hするだけで良いが、子音の
場合には101カテゴリも存在し、しかも64次元のデ
ータとして求める必要がある。この為、このままでは膨
大なメモリ8二を必要とすることが否めない。However, in the case of vowels, it is sufficient to use Ifl(H) to learn the learning patterns of at least 6 categories in 16 dimensions, but in the case of consonants, there are 101 categories and it is necessary to obtain the data as 64 dimensions. Therefore, it is undeniable that a huge amount of memory 82 will be required as is.
そこで少数の学習パターンによってパターン分布を反映
した特性核Kを得るべく、次のような特性核の更新処理
を行い、逐次計算によってその特性核を次第にパターン
分布を反映した形に改良して行くようにする。Therefore, in order to obtain a characteristic kernel K that reflects the pattern distribution using a small number of learning patterns, we perform the following process of updating the characteristic kernel, and gradually improve the characteristic kernel to reflect the pattern distribution through sequential calculations. Make it.
即ち、
K−に’+wSS t
n
なる演算処理を繰返し実行するようにする。但し、Wは
特性核の更新時における重み係数である。この重み係数
Wは正負の値を取り、正ならば特性核行列の入カバター
ンに対する類似度を大きくし、逆に負ならば上記類似度
を小さくする作用を星する。That is, the arithmetic process '+wSS t n is repeatedly executed on K-. However, W is a weighting coefficient when updating the characteristic kernel. This weighting coefficient W takes a positive or negative value; if it is positive, it increases the similarity of the characteristic kernel matrix to the input pattern, and if it is negative, it decreases the similarity.
またに′はS なる学習パターンを学習する前の特性核
を示しており、Kは学習パターンS の学習によって更
新された特性核を示している。Further, ′ indicates the characteristic kernel before learning the learning pattern S, and K indicates the characteristic kernel updated by learning the learning pattern S.
しかる後、このようにして求められた特性核に対して、
その固有値と固有ベクトルを求める処理が行われ、この
固有値と固有ベクトルとに基いて前述した複合類似度計
算に用いられる標準パターンが作成される。After that, for the characteristic kernel obtained in this way,
Processing is performed to obtain the eigenvalues and eigenvectors, and a standard pattern used in the composite similarity calculation described above is created based on the eigenvalues and eigenvectors.
標準パターンは、上記特性核をKL展開することによっ
て求められるものであり、例えばべき東方によるKL展
開によってその標準パターンが求められる。The standard pattern is obtained by performing KL expansion on the characteristic kernel, for example, by performing KL expansion using power east.
今、特性核Kが固有値λ 、λ2.〜λ を持n
ち、これに対応する固有ベクトルξ 、ξ2.〜■
ξ を持つものとする。この場合、その任意ベクトルU
は、−1−記固有ベクトルξ 、ξ2.〜ξ の線形
結合して
U 曙 Σ αi ξ1
として表わされる。このとき、
Kξ、−λ1 ξ、 ゛
なる関係が成立することから、
ここで
・・・・・・ 〉1λ 1
!λ 1〉1λ21〉
n
LλI /λ、J > 1 (+−2,3,〜、
n)であるから、Sが十分大きくなると上式の第2項が
Oに収束することになる。Now, the characteristic kernel K has eigenvalues λ, λ2. ~λ, and the corresponding eigenvectors ξ, ξ2. ~ ■ Let us have ξ. In this case, that arbitrary vector U
are −1− eigenvectors ξ, ξ2. The linear combination of ~ξ is expressed as U Σ αi ξ1. At this time, since the relationship Kξ, −λ1 ξ, ゛ holds true, here... 〉1λ 1 ! λ 1〉1λ21〉 n LλI /λ, J > 1 (+-2, 3, ~,
n), the second term in the above equation converges to O when S becomes sufficiently large.
故に前述した式を Ku −αl λ1 ξl と石像すことができる。Therefore, the above formula Ku −αl λ1 ξl It can be made into a stone statue.
sol
このことは、(K u )と(K u )と
OO
の比が固a値λlであることを示している。また(K8
u)は固有ベクトルξlに比例していることが示される
。sol This shows that the ratio of (K u ), (K u ), and OO is a fixed a value λl. Also (K8
u) is shown to be proportional to the eigenvector ξl.
ところでこのような理論に基く演算過)♀にあっでは、
その演算途中結果が直ぐにスケールアウトするすること
が多い。そこでU を任意の、例えば単位ベクトルとし
、
V 厘Ku
sol s
Ll −(V )/(b )sol
sol 5o1(sJ、1,2.・・・)
なる演算を実行するようにする。ここで(b )s
ol
は、ベクトル(v )の絶対値が最大の要素でso
l
ある。このとき、
u =(v )/(b )s
at 戸+l s+1=(Ku
)/(b )
s sat
?
=(Kv )/(b −b )s
sat s?
−(K 、 u )/(b ・・・
・・・b )o sat
sとなることから、これよりλ 、b 、ξ
。By the way, if the calculation based on such a theory is
In many cases, the result of the calculation will scale out immediately. Therefore, let U be any arbitrary, for example, a unit vector, and let V sol s Ll −(V )/(b ) sol
The following calculation is executed: sol 5o1(sJ, 1, 2...). Here (b)s
ol is the element with the largest absolute value of the vector (v) and so
l Yes. At this time, u = (v)/(b)s
at door+l s+1=(Ku
)/(b)s sat? =(Kv)/(b-b)s
sat s? −(K, u)/(b...
...b)o sat
Since s, from this, λ , b , ξ
.
t sat t us+1を求めることが可能となる。t sat t It becomes possible to obtain us+1.
このようにしてその絶対値が最大の固を値λ1と固有ベ
クトルξ1とを求めたら、次に同様にしてその絶対値が
次に大きい固有値λ2と固をベクトルξ2とを求める。After obtaining the eigenvalue λ1 and the eigenvector ξ1 with the largest absolute value in this manner, the eigenvalue λ2 and the eigenvector ξ2 with the next largest absolute value are similarly obtained.
ここで
K′ ″に一λI EI El
を考えると、
ξILξ1= 0 ([−2,3,〜、n)より、
K′ ξ、−にξ1−λ1ξ1ξ1 ξ1−λ1 ξ
1−λ1 ξ、−0(1−1)K′ ξ −にξ1−λ
1ξl El ξ1一 λ ・ ξ ・
(1≠1 )となる。従って上記に′
は、
1λ21〉・・・〉1λ、1>−>1λ、l>0なる固
有値を持つことがわかる。尚、ここではEIは正規化さ
れているとしている。Here, if we consider one λI EI El for K''', then from ξILξ1= 0 ([-2, 3, ~, n), we have ξ1-λ1ξ1ξ1 ξ1-λ1 ξ for K' ξ, -.
1-λ1 ξ, -0(1-1)K' ξ - to ξ1-λ
1ξl El ξ11 λ ・ ξ ・
(1≠1). Therefore, the above
It can be seen that has the following eigenvalues: 1λ21>...>1λ, 1>->1λ, l>0. It is assumed here that EI is normalized.
このような処理は、前記特性核を
K’ −に−λ1ξ0ξ
として変換したに′に対して、上述した処理を繰返し実
行することによって達せられる。この処理によって絶対
値の大きい固有値とそれに対応する固有ベクトルが順に
求められ、辞書の学習が行われる。Such processing is achieved by repeatedly performing the above-mentioned processing on N' which is obtained by converting the characteristic kernel into K' - as -λ1ξ0ξ. Through this processing, eigenvalues with large absolute values and their corresponding eigenvectors are found in order, and dictionary learning is performed.
第21図はこのような計算アルゴリズムに基いて実行さ
れる辞書の学習処理の手続きを示すものである。FIG. 21 shows a dictionary learning process executed based on such a calculation algorithm.
次に文字認識部21について説明する。Next, the character recognition section 21 will be explained.
この文字認識部21は、スキャナ等によって読取られた
文字を認識する第1の文字認識ブロックと、タブレット
等を介してオンライン人力される文字情報を認識する第
2の文字認識ブロックとによって構成される。The character recognition unit 21 is composed of a first character recognition block that recognizes characters read by a scanner or the like, and a second character recognition block that recognizes character information manually input online via a tablet or the like. .
この第1の文字認識ブロックは、例えば第22図に示す
ように、スキャナ等によって読取り入力された画像デー
タを格納する画像メモリ21aと、この画像メモリ21
aに格納された画像データ中から認識対象とする文字が
記載された領域を検出する領域検出部21b 、この領
域検出結果に従って前記画像メモリ21aに格納された
画像データ中から認識対象とする文字データを抽出する
文字抽出部21c 、そして標準パターン辞1!F21
dに予め登録された認識対象文字の各標準文字パターン
と、に記文字抽出部21eにて抽出された文字パターン
とを個々に照合して文字認識する識別部21eとによっ
て構成される。For example, as shown in FIG. 22, this first character recognition block includes an image memory 21a that stores image data read and input by a scanner or the like;
An area detection unit 21b detects an area in which a character to be recognized is written from the image data stored in the image memory 21a, and character data to be recognized from the image data stored in the image memory 21a according to the area detection result. The character extraction unit 21c extracts the standard pattern word 1! F21
The identification section 21e individually compares each standard character pattern of recognition target characters registered in advance in d with the character pattern extracted by the character extraction section 21e, and performs character recognition.
この文字認識ブロックは、例えば第23図に示すように
FAX送信原稿用紙211’上の所定の位置に設定され
、送信宛先が記入される文字枠21gに記載された文字
を認工するものである。このような送信宛先が記載され
る原稿用紙21rは、送信原稿が複数枚からなる場合、
その一番最初(1枚目)の原稿として用いられる。そし
てこの1枚目の原稿の読取り人力された画像データが文
字認識処理の為に前記画像メモリ21aに蓄積される。This character recognition block is set at a predetermined position on the FAX transmission manuscript paper 211' as shown in FIG. 23, for example, and recognizes the characters written in the character frame 21g in which the transmission destination is written. . The manuscript paper 21r on which such a transmission destination is written is used when the transmission manuscript consists of multiple sheets.
It is used as the first manuscript. Image data obtained by manually reading the first document is stored in the image memory 21a for character recognition processing.
領域検出部21bは、Pめ定められているFAX送信原
稿用紙21rのフォーマット情報から前記文字枠21g
の位置情報を得、認識対象とする文字が記載される領域
を検出するものである。文字抽出部21cはこの領域検
出情報と、その画像情報の射影パターンの情報とを用い
て、例えば第24図に示すように前記文字枠21gに記
載された文字の画像データを個々に抽出している。The area detection unit 21b detects the character frame 21g from the format information of the FAX transmission manuscript paper 21r, which is determined by P.
The system obtains position information and detects the area where the character to be recognized is written. The character extraction unit 21c uses this area detection information and the projection pattern information of the image information to individually extract image data of the characters written in the character frame 21g, for example, as shown in FIG. 24. There is.
識別部21eは、例えば特公昭49−12778号公報
等に開示されるように、抽出された文字画像からその文
字パターンの特徴を抽出し、その抽出した文字パターン
と標準パターン辞書21dに登録された各文字の標準パ
ターンとをパターンマツチングしている。そしてこのパ
ターンマツチングによって照合の取れた標準パターンの
文字カテゴリをその認識結果として求めている。As disclosed in, for example, Japanese Patent Publication No. 12778/1983, the identification unit 21e extracts the characteristics of the character pattern from the extracted character image, and identifies the extracted character pattern and the characteristics registered in the standard pattern dictionary 21d. Pattern matching is performed with the standard pattern of each character. Then, through this pattern matching, the character category of the standard pattern that has been successfully matched is determined as the recognition result.
尚、パターンマツチングの手法は種々変形できることは
云うまでもない。It goes without saying that the pattern matching method can be modified in various ways.
ところでタブレット等を介してオンライン入力される文
字情報を認識する第2の文字認識ブロックは、例えば第
25図に示すように構成される。By the way, the second character recognition block that recognizes character information input online via a tablet or the like is configured as shown in FIG. 25, for example.
この第2の文字認識ブロックは、タブレット等を介して
オンライン入力される文字の筆記ストロークを示す位置
座標の系列を順次検出する座標検出回路21hを備えて
いる。This second character recognition block includes a coordinate detection circuit 21h that sequentially detects a series of position coordinates indicating the writing stroke of a character input online via a tablet or the like.
この座標検出回路21hにて検出された位置座標の時系
列データは前処理回路211に入力され、前記タブレッ
ト4における検出誤り等の微小な雑音が除去された後、
座標系列記憶回路21jに順に記憶され、文字認識処理
に供される。尚、この前処理回路21iにて、例えば1
文字分の文字が入力されたとき、その文字の大きさの正
規化処理等が行われる。The time series data of the position coordinates detected by the coordinate detection circuit 21h is input to the preprocessing circuit 211, and after removing small noises such as detection errors in the tablet 4,
The coordinate series storage circuit 21j sequentially stores the coordinates and subjects them to character recognition processing. Incidentally, in this preprocessing circuit 21i, for example, 1
When a number of characters are input, the size of the characters is normalized.
また画数検出回路21には、例えば筆記ストロークの途
切れ(位置座標データの時系列の区切り)から、その文
字パターンの筆記ストローク数、っまり画数を検出して
いる。Further, the stroke number detection circuit 21 detects the number of written strokes, or the total number of strokes, of the character pattern from, for example, breaks in the written strokes (time-series breaks in the position coordinate data).
しかして認識処理部21alは、前記画数の情報に従っ
て標準特徴パターンメモリ2inに登録された認忠対象
文字カテゴリの標準パターンの中から、該当する画数の
標準パターンを選択的に抽出している。そしてこの標準
パターンの各ストロークの特徴と座標系列記憶回路21
jに記憶された人力文字パターンのストロークの特徴と
を相互に比較(マツチング処理)でいる。答決定回路2
1pはそのマツチング処理結果を判定し、入力文字パタ
ーンのストロークの特徴に該当するストロークを持つ認
識対象文字カテゴリを、その認識結果として求めている
。Accordingly, the recognition processing unit 21al selectively extracts the standard pattern with the corresponding number of strokes from among the standard patterns of the recognition target character category registered in the standard feature pattern memory 2in according to the information on the number of strokes. The characteristics of each stroke of this standard pattern and the coordinate series storage circuit 21
The stroke characteristics of the human character patterns stored in j are compared with each other (matching process). Answer decision circuit 2
1p determines the matching processing result, and obtains a recognition target character category having a stroke that corresponds to the stroke characteristics of the input character pattern as the recognition result.
つまりオンライン入力される文字パターンの筆記ストロ
ークの特徴に従って、そのストロークの特徴を標準文字
パターンのストロークの特徴とマツチング処理して上記
入力文字パターンを認識するものとなっている。In other words, the input character pattern is recognized by matching the characteristics of the stroke with the stroke characteristics of the standard character pattern according to the characteristics of the writing stroke of the character pattern input online.
尚、ストロークの特徴としては、筆記ストロークを折線
近似したときの端点や交点、折点等の位置座標の情報を
用いるようにすれば良い。Note that information on positional coordinates of end points, intersection points, break points, etc. when a written stroke is approximated by a broken line may be used as the stroke characteristics.
以上のような機能を備えた文字認識部21によって、ス
キャナ等を介して読取り人力された文字情報や、タブレ
ット等の位置座標人力装置を介してオンライン人力され
る文字情報がそれぞれ文字認識される。The character recognition unit 21 having the above-mentioned functions recognizes character information that is read manually using a scanner or the like, or character information that is manually input online via a position coordinate human-powered device such as a tablet.
次に図形認識部22について説明する。Next, the figure recognition section 22 will be explained.
この図形認識部22は、例えば第26図に示すように構
成される。入力部22aは、例えば撮像入力された図形
画像を記憶し、図形認識処理に供する。This figure recognition section 22 is configured as shown in FIG. 26, for example. The input unit 22a stores, for example, a captured and input graphic image, and subjects it to graphic recognition processing.
輪郭追跡部22bは、例えば線分の追跡方向を第27図
に示すように8方向に分け、入力画像中の図形の輪郭を
追跡したときにその追跡方向がどの向きであるかを順に
求めている。具体的には、例えば第28図に示すように
三角形の図形を右回りに追跡し、その追跡の向きの情報
を、例えばrl、2.〜2,3,4.〜4,5.7.〜
7」なる方向コードの系ダリとして求めている。The contour tracing unit 22b divides the tracing direction of the line segment into eight directions, for example, as shown in FIG. There is. Specifically, for example, as shown in FIG. 28, a triangular figure is tracked clockwise, and information on the tracking direction is stored as, for example, rl, 2. ~2,3,4. ~4,5.7. ~
I am looking for a system of direction codes such as "7".
セグメンテーション部22cは、このようにして求めら
れる方向コードの系列から、例えばその曲りの部分等の
特異点を抽出し、この特異点に従って該図形の輪郭を複
数の特徴部分に分割している。The segmentation unit 22c extracts singular points, such as curved parts, from the sequence of direction codes obtained in this way, and divides the outline of the figure into a plurality of characteristic parts according to the singular points.
マツチング部22dはこのようにしてセグメンテーショ
ンされた図形輪郭の情報と、辞書メモリ22eに登録さ
れている各種図形の特徴情報とをマツチング処理して入
力図形を認識するものとなっている。The matching section 22d recognizes the input figure by matching the information on the figure outline segmented in this way with the characteristic information of various figures registered in the dictionary memory 22e.
例えば第29図に示す図形が与えられた場合には、その
輪郭追跡によって求められる方向コードの系列から、例
えば相互に隣接する3つの輪郭点(1−1)、 (1)
、 (1+1)で方向コードの和を順に求め、これをそ
の中央の輪郭点iにおける方向コードとして・IL滑化
処理する。この弔滑化処理によってノイズ成分の除去を
行なう。For example, when the figure shown in FIG. 29 is given, from the series of direction codes obtained by contour tracing, for example, three mutually adjacent contour points (1-1), (1)
, (1+1), and perform IL smoothing processing using this as the direction code at the central contour point i. This smoothing process removes noise components.
しかる後、セグメンテーション部22cにて輪郭の特徴
点である端点、つまり曲りが急峻な点を検出し、その端
点を中心としてその輪郭を分割する。Thereafter, the segmentation unit 22c detects end points that are characteristic points of the contour, that is, points where the curve is steep, and divides the contour around the end points.
そしてその分割された輪郭部分毎に辞書メモリ22eと
照合し、その認識結果を求める。Then, each divided contour portion is compared with the dictionary memory 22e to obtain the recognition result.
以上の処理によって、第30図に例示するように丸図形
は端点が/j在しないこと、三角図形は端点が3つ検出
されること、四角図形は端点が4つ検出されること等か
ら、これらの図形がそれぞれ識別認識される。この際、
上記各端点がそれぞれ凸状であることや、端点を結ぶ輪
郭が直線・曲線である等の情報を図形識別に利用しても
良い。Through the above processing, as shown in FIG. 30, a round figure has no endpoints, a triangular figure has three endpoints detected, a quadrilateral figure has four endpoints, etc. Each of these figures is identified and recognized. On this occasion,
Information such as that each of the end points is convex or that the contour connecting the end points is a straight line or a curve may be used for figure identification.
これに対してイメージ認識部23は次のように構成され
る。On the other hand, the image recognition section 23 is configured as follows.
第31図はこのイメージ認識部23の概略構成を示すも
ので、原画画像メモリ23a 、 2値化装置23b1
処理画像メモリ23c1細線化装置23d1そしてコー
ド変換装置23eによって構成される。FIG. 31 shows a schematic configuration of this image recognition section 23, which includes an original image memory 23a, a binarization device 23b1
It is composed of a processed image memory 23c, a thinning device 23d1, and a code conversion device 23e.
画像メモリ23aは与えられた認識対象イメージ画像を
記憶するもので、2値化装置23bはこれを2値化処理
して画像メモリ23cに格納している。The image memory 23a stores a given recognition target image, and the binarization device 23b binarizes it and stores it in the image memory 23c.
この2値化レベルは、例えば2値化画像をディスプレイ
モニタしながら可変設定される。This binarization level is variably set, for example, while monitoring the binarized image on a display.
しかして細線化装置23dは2値化されたイメージ画像
を細線化処理してそのイメージを線図形化。The line thinning device 23d then thins the binarized image and converts the image into a line figure.
するものである。この細線化処理されたイメージ画像に
よって前記画像メモリ23cが書替えられて認識処理に
供される。It is something to do. The image memory 23c is rewritten with the thinned image and subjected to recognition processing.
コード変換装置23cは、例えば第32図に示すように
構成され、先ずセグメント分割部231’にて」−2細
線化画像をm数のセグメントに分割している。このセグ
メントの分割は、例えば線図形をその端点や分岐点、交
点にて分割することによって行われる。曲率変換部23
gはこのようにして分割された複数のセグメントについ
て、それぞれその曲率を求めている。The code conversion device 23c is configured, for example, as shown in FIG. 32, and first, a segment division unit 231' divides the "-2 thinned image into m segments. This segment division is performed, for example, by dividing the line figure at its end points, branch points, or intersections. Curvature conversion section 23
g calculates the curvature of each of the multiple segments thus divided.
直線・曲線分割部23h1曲線分割部231.屈折点分
割部23j、および変曲点分割部23hは、上述した如
く分割された各セグメントを、その曲率の情報に従って
更に分割するもので、これらによって屈折点や直線と曲
線との切替わり点、変曲点、曲線における半径変化点等
がそれぞれ検出される。このようなセグメント分割と特
徴点検出によって前記イメージ線図形を構成する各部の
情報がそれぞれ抽出される。Straight line/curve dividing section 23h1 curve dividing section 231. The inflection point dividing section 23j and the inflection point dividing section 23h further divide each segment divided as described above according to the information on the curvature thereof, and by these, the inflection point, the switching point between a straight line and a curved line, Points of inflection, points of radius change in the curve, etc. are detected. Through such segment division and feature point detection, information on each part constituting the image line figure is extracted.
近似情報作成部23mは、これらの分割されたセグメン
トおよびそのセグメント中の特徴点の情報を総合して前
記イメージ図形を表現する情報、例えば各セグメントの
始点および終点の位置座標、およびそのセグメントの種
別を特定するコード情報を得る。The approximate information creation unit 23m synthesizes information on these divided segments and feature points in the segments to express the image figure, such as the position coordinates of the starting point and ending point of each segment, and the type of the segment. Obtain code information that specifies.
例えば人力イメージ画像が第33図(a)に示す如く与
えられた場合、その入力画像中のイメージ線図形23n
を細線化して抽出し、同図(b)に示すようにセグメン
ト分割する。この例では、円図形と四角図形とが直線に
よって所謂串刺しにされたイメージ線図形23nが入力
されている。しかしてこのイメージ線図形23nは、第
33図(b)に示すようにその交点で分割され、2つの
半円と2つのコの字状図形、および4つの直線にセグメ
ント化される。For example, when a human power image is given as shown in FIG. 33(a), the image line figure 23n in the input image is
is thinned and extracted, and divided into segments as shown in FIG. 3(b). In this example, an image line figure 23n in which a circle figure and a square figure are so-called skewered by straight lines is input. As shown in FIG. 33(b), the image line figure 23n of the lever is divided at the intersection, and segmented into two semicircles, two U-shaped figures, and four straight lines.
曲率変換部23gは、第34図に示すようにセグメント
分割された各セグメントの曲率を求めており、前記直線
・曲線分割部23h1曲線分割部231.屈折点分割部
23j、および変曲点分割部23hはその曲率変化点か
ら各セグメントの特徴点を検出している。具体的には第
34図(a)に示す例では2つの直線の屈折点における
曲率が急峻に増大することから、その曲率の変化から屈
折点を検出することが01能となる。また第34図(b
)に示す例では直線から曲線への変化部分で曲率の変化
が検出されるので、この曲率の変化からその特徴点を検
出することができる。The curvature converting section 23g calculates the curvature of each divided segment as shown in FIG. The refraction point dividing section 23j and the inflection point dividing section 23h detect feature points of each segment from the curvature change points. Specifically, in the example shown in FIG. 34(a), since the curvature of the two straight lines at the bending point increases sharply, it is possible to detect the bending point from the change in the curvature. Also, Fig. 34 (b
In the example shown in ), a change in curvature is detected at the transition portion from a straight line to a curve, so the feature point can be detected from this change in curvature.
同様にして第34図(C)(d)に示す例でも、その曲
率の変化点から、そのセグメントにおける特徴点を検出
することが可能となる。Similarly, in the example shown in FIGS. 34(C) and 34(d), it is possible to detect the feature point in the segment from the point of change in curvature.
このようにしてイメージ認識部23では、与えられたイ
メージ図形をセグメント化し、各セグメントの特徴点を
検出している。そして該イメージ線図形を複数のセグメ
ントの各種別を示すコード情報とその位置座標として近
似表現して認識するものとなっている。In this manner, the image recognition unit 23 segments the given image figure and detects the feature points of each segment. Then, the image line figure is approximately expressed and recognized as code information indicating each type of a plurality of segments and their position coordinates.
さて音声照合部17は次のように構成されている。Now, the voice verification section 17 is configured as follows.
この音声照合部17は、音声入力した話者を個人認識(
個人同定)するものであり、例えば第35図に示すよう
に構成される。This voice matching unit 17 performs individual recognition (
For example, it is configured as shown in FIG. 35.
即ち、音声人力部17aを介して与えられる音声は、音
韻フィルタ17bおよび個人用フィルタ17cにてそれ
ぞれフィルタリングされ、その音声特徴が抽出される。That is, the speech given via the human voice section 17a is filtered by the phonetic filter 17b and the personal filter 17c, and the speech characteristics are extracted.
音韻フィルタ17bの複数のチャンネルの各帯域は、例
えば第36図(a)に示すように音声周波数帯域を等分
割して設定されている。Each band of a plurality of channels of the phoneme filter 17b is set by equally dividing the audio frequency band, for example, as shown in FIG. 36(a).
このようなフィルタ特性を備えた音韻フィルタ+7bに
よって人力音声の音韻特徴を示す特徴パラメータが抽出
される。尚、各チャンネルの帯域幅を、音声周波数帯域
を対数関数的に分割設定したものとしても良い。Feature parameters indicating the phoneme characteristics of human speech are extracted by the phoneme filter +7b having such filter characteristics. Note that the bandwidth of each channel may be set by dividing the audio frequency band logarithmically.
これに対して個人用フィルタ17cの複数のチャンネル
の各帯域幅は、第36図(b)に示すように音声周波数
:;シ域を指数関数的に分割して設定されている。この
ようなフィルタ特性を備えた個人用フィルタ17cによ
って、前記人力音声の低域から中域にかけての音声特徴
が、高域側の特徴に比較して多く抽出されるようになっ
ている。そしてこれらの各チャンネルのフィルタ出力が
個人照合用の特徴パラメータとして求められている。On the other hand, the bandwidth of each of the plurality of channels of the personal filter 17c is set by exponentially dividing the audio frequency range, as shown in FIG. 36(b). The personal filter 17c having such filter characteristics allows more voice features from the low to middle range of the human voice to be extracted than the features in the high range. The filter output of each of these channels is obtained as a feature parameter for personal verification.
しかしてIl1語認識部+7dは、前記音韻フィルタ1
7bを介して求められた音韻特徴パラメータから、その
入力音声が示す単語を単語辞書17eを参照して認識す
るものである。この単語認識の機能は前述した音声認識
部19と同様であり、該音パ1認識部19の機能をその
まま利用するようにしても良い。Therefore, the word recognition unit Il1 +7d
The word indicated by the input speech is recognized from the phonetic feature parameters obtained through the phonological feature parameter 7b by referring to the word dictionary 17e. The function of this word recognition is similar to that of the voice recognition section 19 described above, and the function of the sound path 1 recognition section 19 may be used as is.
そしてこの単語認識結果に従って個人辞書171’の個
人照合に供される辞書が選択される。この個人辞i!f
L7rは、話者照合の対象とする個人が予め発声した特
定の単語の前記個人用フィルタ17eによる分析結果を
、そのllj語毎に分類して登録したものである。Then, according to the word recognition result, a dictionary to be used for personal verification from the personal dictionary 171' is selected. This personal resignation i! f
L7r is the result of analysis by the personal filter 17e of a specific word uttered in advance by an individual targeted for speaker verification, classified and registered for each llj word.
しかして話者照合部17gは、個人辞書17rから選択
された該当11語の各特徴パラメータと、前記個人用辞
書17cにて求められた入力音声の特徴パラメータとの
類似度を計算し、その類似度値を所定の閾値でそれぞれ
弁別している。そしてそれらの弁別結果を相互に比較し
て、例えば類似度値が最も高く、次に高い類似度値との
差か十分にある特徴パラメータを得た個人カテゴリを該
入力音声の発声者であるとして個人同定している。The speaker verification unit 17g calculates the degree of similarity between each of the feature parameters of the 11 words selected from the personal dictionary 17r and the feature parameters of the input speech found in the personal dictionary 17c, and The degree values are discriminated using predetermined threshold values. Then, by comparing these discrimination results with each other, for example, the individual category with the highest similarity value and the characteristic parameter with a sufficient difference from the next highest similarity value is determined to be the speaker of the input voice. Personally identified.
ここで個人用フィルタ17cの特性について更に詳しく
説明すると、前述したように音韻特徴フィルタ17bと
は異なる特性に設定されている。この斤岸の個人性の識
別性について考察してみると、その識別性は、例えば
F比−(個人間分散)/(個人内分散)として与えられ
るF比によって評価することができる。Here, the characteristics of the personal filter 17c will be explained in more detail.As mentioned above, the characteristics are set to be different from those of the phoneme feature filter 17b. Considering the distinctiveness of this individuality, the distinctiveness can be evaluated, for example, by the F ratio given as F ratio - (variance between individuals)/(variance within individuals).
今、音韻フィルタ17bに設定されたフィルタ特性の各
チャンネル出力のF比について検討すると、第37図に
実線で示す指数関数的な傾向を示す。Now, when considering the F ratio of each channel output of the filter characteristics set in the phonetic filter 17b, an exponential trend is shown by the solid line in FIG. 37.
これ故、従来では専ら高域側の音声特徴情報を利用して
個人照合を行なっている。For this reason, in the past, individual verification has been performed exclusively using voice feature information on the high frequency side.
しかじ音響の高域側の特徴だけを用いるよりも、全周波
数帯域のR白特徴を用いて個人同定が可能であれば、そ
の照合精度が更に向上すると考えられる。即ち、全周波
数帯域においてF比の値が1以上となり、個人間分散が
個人内分散を上回れば、更に精度の高い個人照合が可能
となる。If it is possible to identify individuals using the R-white features in the entire frequency band rather than using only the high-frequency features of the sound, it is thought that the matching accuracy will be further improved. That is, if the value of the F ratio is 1 or more in all frequency bands and the inter-individual variance exceeds the intra-individual variance, more accurate individual matching becomes possible.
そこでここでは、前述したように個人用フィルタ17e
の特性を指数関数的に定め、個人性の特徴が顕著である
高域側については大雑把に特徴抽出し、低域側のチャン
ネル割当て数を増やすことによって該低域側の音用特徴
を細かく抽出するようにしている。Therefore, here, as mentioned above, the personal filter 17e
Exponentially determines the characteristics of the sound, roughly extracts the characteristics of the high range where individual characteristics are noticeable, and finely extracts the sound characteristics of the low range by increasing the number of channels assigned to the low range. I try to do that.
具体的には各チャンネルのF比の変化か指数関数的な傾
向を示すことから、低域側チャンネルの帯域幅に比較し
て高域側チャンネルの帯域幅を指数関数的に増大させた
フィルタバンクをIg 成L、これを個人用フィルタ1
7cとしている。Specifically, since the F-ratio of each channel shows an exponential trend, it is a filter bank in which the bandwidth of the high-frequency channel is increased exponentially compared to the bandwidth of the low-frequency channel. Ig configuration L, use this as personal filter 1
It is set at 7c.
このように構成されたフィルタ17cの各チャンネル出
力によれば、そのF比は第37図に破線で示すようにな
り、中域でのF比の大幅な向」二か認められる。この結
果、高域側の音声特徴のみならず、中域における音声特
徴をも積極的に利用して個人照合を行なうことが可能と
なり、その照合精度の向上を図ることが可能となる。According to the output of each channel of the filter 17c configured in this manner, the F ratio is as shown by the broken line in FIG. 37, and it can be seen that the F ratio in the middle range has significantly improved. As a result, it becomes possible to carry out individual verification by actively utilizing not only the voice characteristics in the high frequency range but also the voice characteristics in the middle frequency range, and it becomes possible to improve the verification accuracy.
即ち、この音声照合部17では、人力音声の単語認識に
供する特徴とは別に、フィルタバンクの工夫によりその
個人性が顕著に現われる特徴情報を抽出している。この
結果、人力音声に対する音韻認識とは独立にその話者に
対する個人同定、つまり個人照合を高精度に行なうもの
となっている。That is, in addition to the features used for word recognition of human speech, the speech matching section 17 uses a filter bank to extract feature information that makes the individuality of the human speech noticeable. As a result, individual identification of the speaker, that is, individual verification, can be performed with high precision independently of the phoneme recognition of human speech.
次に音声合成部2Bについて説明する。Next, the speech synthesis section 2B will be explained.
音声合成部26は、第38図に示すように判別器28a
、復号器26b、規則パラメータ生成装置28c、およ
び音声合成器28dを備えて構成される。The speech synthesis unit 26 includes a discriminator 28a as shown in FIG.
, a decoder 26b, a rule parameter generation device 28c, and a speech synthesizer 28d.
判別526aは入力されたコード列が文字列であるか、
或いは音声合成の為の分析パラメータを示す符号列かを
判定するものである。この情報判別は、例えば入力コー
ド列の一番最初に付加された識別情報を判定することに
よって行われる。そして分析パラメータであると判定し
た場合には、その符号列を復号器26bに与え、これを
復号処理してその音韻パラメータと韻律パラメータとを
それぞれ求めている。Determination 526a determines whether the input code string is a character string or not.
Alternatively, it is determined whether it is a code string indicating an analysis parameter for speech synthesis. This information discrimination is performed, for example, by determining the identification information added at the beginning of the input code string. When it is determined that the code string is an analysis parameter, the code string is provided to the decoder 26b, and it is decoded to obtain its phonetic parameters and prosodic parameters.
また文字列と判定した場合には、その文字列データを規
則合成パラメータ生成装置26cに与え、その音韻パラ
メータと韻律パラメータとの生成に供している。Further, when it is determined that the character string is a character string, the character string data is provided to the rule synthesis parameter generation device 26c, and is used to generate its phonetic parameters and prosody parameters.
音声合成器28dは、このようにして復号に、426b
または規則合成パラメータ生成装置28 c、にて求め
られた音韻パラメータと韻律パラメータとに従い、音源
波を声道近似フィルタを介して処理して合成音声波を生
成している。The speech synthesizer 28d thus decodes the 426b
Alternatively, a synthesized speech wave is generated by processing the sound source wave via a vocal tract approximation filter according to the phonetic parameters and prosody parameters determined by the rule synthesis parameter generation device 28c.
ここで規則合成パラメータ生成装置28cについて更に
説明すると、該装置28cは第39図に示す如く構成さ
れている。文字列解析部26eは言語辞書26を参照し
て入力文字列中の単語を個々に同定し、その単語につい
てのアクセント情報や単語・文節境界、品詞・活用等の
文法情報を求めている。To further explain the rule synthesis parameter generation device 28c, the device 28c is configured as shown in FIG. 39. The character string analysis unit 26e identifies each word in the input character string with reference to the language dictionary 26, and obtains grammatical information such as accent information, word/clause boundaries, part of speech, and conjugation for the word.
そしてこの解析結果に対して音韻規則、および韻律規則
がそれぞれ適用され、その制御情報が生成される。Then, phonological rules and prosodic rules are applied to the analysis results, and control information thereof is generated.
ここで音韻規則は、解析された単語の読みの情報を与え
ると共に、単語の連接によって生じる連濁や無声化等の
現象を実現し、その音韻記号列を生成するものである。Here, the phonological rules provide information on the pronunciation of the analyzed words, realize phenomena such as rendaku and devoicing that occur due to word concatenation, and generate the phonological symbol strings.
音声パラメータ生成部26gはこの音韻記号列を人力し
、その音節単位に従ってCVファイル28hから音節パ
ラメータを順次求めて補間結合している。この音声パラ
メータ生成部28gにて上記音韻記号列から音韻パラメ
ータ系列が生成される。The speech parameter generation unit 26g manually generates this phoneme symbol string, and sequentially obtains syllable parameters from the CV file 28h in accordance with the syllable unit, and interpolates and combines them. This speech parameter generation section 28g generates a phoneme parameter sequence from the phoneme symbol string.
また韻律規則は、単語・文節境界等の文法情報に従って
発話の境界や息継ぎ位置を決定し、各音の継続時間長や
ポーズ長等を決定するものである。Prosodic rules determine the boundaries of utterances and breath positions according to grammatical information such as word and clause boundaries, and determine the duration of each sound, pause length, etc.
同時にこの韻律規則により、各単語の基本アクセントを
ベースとし、文節アクセントを考慮した韻律記号列が生
成される。韻律パラメータ生成部261はこの韻律記号
列を人力し、ピッチの時間変化パターンを表わす韻神パ
ラメータ列を生成している。At the same time, this prosodic rule generates a prosodic symbol string that is based on the basic accent of each word and takes into account the clause accent. The prosodic parameter generation unit 261 manually processes this prosodic symbol string to generate a prosody parameter string representing a temporal change pattern of pitch.
一方、入力コード列が音声合成の為の分析パラメータを
示す符号列である場合、前記復号器28bは次のように
機能している。On the other hand, when the input code string is a code string indicating analysis parameters for speech synthesis, the decoder 28b functions as follows.
即ち、分析パラメータの符号列がCvファイルのケプス
トラム係数を示す場合、その符号列2B+nは一般に第
40図に示すようにパラメータP(ピッチ)とC、C、
〜C(ケプストラム係数)に対してビット割当てがなさ
れて情報圧縮されている。そこで復号2S;2f3bで
はパラメータ変換テーブル26nを用い、上記情報圧縮
された分析パラメータを音声合成器28dに合せたビッ
ト数に変換・復号している。例えば各パラメータをそれ
ぞれ8ビツトに変換し、音韻パラメータ列(ケプストラ
ム係数)とその韻律パラメータ列(ピッチ)とをそれぞ
れ求めている。That is, when the code string of the analysis parameter indicates the cepstral coefficients of the Cv file, the code string 2B+n generally consists of the parameters P (pitch), C, C,
Bits are assigned to ~C (cepstrum coefficients) and information is compressed. Therefore, in the decoding 2S; 2f3b, the parameter conversion table 26n is used to convert and decode the information-compressed analysis parameters into a bit number matching the speech synthesizer 28d. For example, each parameter is converted to 8 bits, and a phonological parameter sequence (cepstrum coefficient) and its prosodic parameter sequence (pitch) are determined.
音声合成器26dは、例えば第41図に示すように有声
音源28qと無声音源(M系列発生器)26rとを備え
、人力される韻律パラメータ列のピッチデータPに従っ
て有声音源波(P≠0)、または無声音源波(P−0)
を選択的に発生している。The speech synthesizer 26d includes a voiced sound source 28q and an unvoiced sound source (M-sequence generator) 26r, as shown in FIG. , or silent sound source wave (P-0)
are occurring selectively.
この音源波は前置増幅W2B5に入力され、前記音韻パ
ラメータのケプストラム係数Cに応じてしベル制御され
て対数振幅近似ディジタルフィルタ28tに入力される
。この対数振幅近似ディジタルフィルタ26tは前記音
韻パラメータのケプストラム係数C、〜Cに従って声道
特性を近似する m
共振回路を構成し、上記音源波をフィルタリング処理す
るものである。この対数振幅近似ディジタルフィルタ2
8tにて前記音韻パラメータおよび韻律パラメータで示
される音声データが合成出力される。This sound source wave is input to the preamplification W2B5, subjected to signal control according to the cepstrum coefficient C of the phoneme parameter, and input to the logarithmic amplitude approximation digital filter 28t. This logarithmic amplitude approximation digital filter 26t constitutes a resonance circuit that approximates the vocal tract characteristics according to the cepstrum coefficients C, ˜C of the phoneme parameters, and filters the sound source wave. This logarithmic amplitude approximation digital filter 2
At 8t, the speech data indicated by the phonetic parameters and prosody parameters are synthesized and output.
そして対数振幅近似ディジタルフィルタ28Lにて合成
された信号は、D/A変換2if!6uを介した後、L
P F 26vを介してフィルタリングされて合成音
声信号(アナログ信号)として出力される。The signal synthesized by the logarithmic amplitude approximation digital filter 28L is converted into a D/A conversion 2if! After passing through 6u, L
The signal is filtered through the P F 26v and output as a synthesized audio signal (analog signal).
以上のように構成された音声合成部26にて、入力デー
タ系列からそのデータ系列が示す音声が規則合成されて
出力される。In the speech synthesis section 26 configured as described above, the speech indicated by the input data series is synthesized according to the rules and output.
次にイメージ合成部27について説明する。Next, the image composition section 27 will be explained.
イメージ合成部27は、第42図に示すように制御演算
部27a、ディスプレイファイルメモリ27b、イメー
ジ合成回路27c、イメージメモリ27d、そして必要
に応じてディスプレイ27cを備えて構成される。As shown in FIG. 42, the image synthesis section 27 includes a control calculation section 27a, a display file memory 27b, an image synthesis circuit 27c, an image memory 27d, and, if necessary, a display 27c.
尚、このディスプレイ27cは、該ワークステーション
についてQ Qされた前記ディスプレイ部10であって
も良い。Note that this display 27c may be the display unit 10 that has been QQ'ed for the workstation.
イメージ合成回路27は、専用の制御演算部27aの制
御の下でディスプレイファイル27bに書込まれている
ベクトルや多角形・円弧のパラメータを読出し、それに
よって示される線図形を発生してイメージ・メモリ27
dの指定されたアドレスに書込んでいる。このイメージ
合成回路27のイメージ発生機能によってイメージメモ
リ27d上に指定された線図形イメージが構築される。The image synthesis circuit 27 reads parameters of vectors, polygons, and arcs written in the display file 27b under the control of a dedicated control calculation unit 27a, generates line figures indicated by the parameters, and stores them in the image memory. 27
Writing to the specified address of d. The image generation function of the image synthesis circuit 27 constructs a designated line graphic image on the image memory 27d.
そしてこの線図形イメージは、制御演算部27aの制御
の下で前記ディスプレイ27cにて表示されてモニタさ
れる。This line graphic image is displayed and monitored on the display 27c under the control of the control calculation section 27a.
またイメージ発生回路27bは、イメージ発生に対する
特殊処理機能と塗潰し処理機能とを備えている。この特
殊処理機能は、例えばyi数のイメージ図形の重なりに
対して隠線の消去を行なったり、クリッピング処理を行
なう等の機能からなる。また塗潰し機能は、イメージ図
形の部分領域を指定された色を用いて塗潰す処理からな
る。Further, the image generation circuit 27b has a special processing function for image generation and a filling processing function. This special processing function includes, for example, functions such as erasing hidden lines and clipping processing for overlapping yi number of image figures. The filling function consists of filling a partial area of an image figure with a specified color.
このようなイメージ合成回路27bの機能によって、種
々のイメージ図形が作成され、またその合成処理等が行
われる。Through the functions of the image synthesis circuit 27b, various image figures are created and their synthesis processing is performed.
ところで上述した如く発生したイメージ図形と自然画と
の合成は次の2つに大別される。その1つは、例えば風
景写真等の自然画を背景として、その中に演算処理によ
って求められたイメージ画像を埋め込み合成する処理で
あり、他の1つのは制御演算部27aが内部モデルとし
て持っている成る・1兆面イメージ内に自然画を埋め込
み合成する処理からなる。By the way, the synthesis of image figures generated as described above and natural pictures can be roughly divided into the following two types. One is a process of embedding and synthesizing an image obtained through arithmetic processing into a natural picture such as a landscape photograph, and the other is a process of embedding and synthesizing an image obtained by arithmetic processing into a natural picture such as a landscape photograph. It consists of the process of embedding and compositing natural images within a 1 trillion-sided image.
ここで前者の自然画中にイメージ画像を埋め込み処理す
る場合には、例えば第43図にその概念を例示するよう
に、制御演算部27aが発生する図形中に「透明色」を
示すコードを与えておき、これを自然画に対して正ね合
せて合成することによって達せられる。すると「透明色
」コードが与えられた画像領域は、自然画の情報がその
まま表示されることになり、その他の部分は制御演算部
27aが発生した図形が表示されることになる。この結
果、自然画を背景としたイメージ合成が実現されること
になる。この手法はオーバーレイと称される。In the case of embedding an image in the former natural image, for example, as shown in FIG. This can be achieved by aligning this with a natural image and compositing it. Then, in the image area to which the "transparent color" code is given, the information of the natural image will be displayed as is, and in the other areas, the figure generated by the control calculation unit 27a will be displayed. As a result, image synthesis using a natural image as a background is realized. This technique is called overlay.
これに対して第44図にその概念を示すように画像メモ
リ内に自然画を書込んでおき、その上(手前)に制御演
算部27aが発生した図形を書込んで行くようにしても
良い。この手法は2バツフア法と称されるものであり、
前述したオーバーレイ法と共に比較的部11jに実現す
ることかできる。On the other hand, as the concept is shown in FIG. 44, a natural image may be written in the image memory, and a figure generated by the control calculation unit 27a may be written on top of it (in the front). . This method is called the two-buffer method,
It can be implemented in the comparative section 11j together with the above-mentioned overlay method.
ところで制御演算部27aの内部モデルとして示される
平面内に自然画を嵌め込み合成する後者の場合には、次
のようにして高速処理される。By the way, in the latter case, in which a natural image is inserted and synthesized within a plane shown as an internal model of the control calculation unit 27a, high-speed processing is performed as follows.
平面上にある自然画を、3次元空間内の任意の方向を向
いている平面に埋め込む為に必要な座標変換は次式で与
えられる。The coordinate transformation required to embed a natural image on a plane into a plane facing in an arbitrary direction in three-dimensional space is given by the following equation.
CX+C5Y十C8
CX十C5Y十06
但し、X、Yは表示面での座標であり、u、vは自然画
での座標である。CX+C5Y0C8 CX0C5Y106 However, X and Y are the coordinates on the display surface, and u and v are the coordinates on the natural image.
この座標変換処理をそのまま実行しようとすると、1画
素を表示する毎に6回の乗算と2回の除算が必要となり
、膨大な計算量と計算処理時間を必要とする。If this coordinate conversion process were to be executed as is, six multiplications and two divisions would be required each time one pixel is displayed, which would require an enormous amount of calculation and calculation processing time.
そこでここでは、次のような中間座標(s、t)を介し
て上述した演算を2回の変換処理に分解して実行するも
のとなっている。この演算処理は、例えばアフィン変換
を利用して高速に実行される。Therefore, here, the above-mentioned calculation is divided into two conversion processes and executed using the following intermediate coordinates (s, t). This arithmetic processing is executed at high speed using, for example, affine transformation.
u−(α S+α t+α ) / t (1)
■!I+(C7s+α8 t+α9)/1S−C5X−
C4Y (2)t−CX+C5
Y十CB
即ち、上述した第(1)式を用いて透視変換を行い、そ
の後、第(2)式を用いて2次元アフィン変換を行なっ
て任意の平面への透視変換を高速に行なうものとなって
いる。u-(α S+α t+α) / t (1)
■! I+(C7s+α8 t+α9)/1S-C5X-
C4Y (2)t-CX+C5
Y0CB In other words, perspective transformation is performed using equation (1) above, and then two-dimensional affine transformation is performed using equation (2) to perform perspective transformation to an arbitrary plane at high speed. It has become.
ここで、第(1)式の分母は座標tそのものであるから
、従来より知られているアフィン変換回路を若モ改良す
るだけでその演算を高速に実行することが容易である。Here, since the denominator of equation (1) is the coordinate t itself, it is easy to perform the calculation at high speed simply by slightly improving the conventionally known affine transformation circuit.
このようにしてイメージ合成部27では種々のイメージ
合成処理を高速に実行するものとなっている。In this way, the image compositing section 27 executes various image compositing processes at high speed.
次に出力形態選択部24について説明する。Next, the output format selection section 24 will be explained.
この出力形態選択部24はメディア選択要求信号を受け
て起動され、どのメディアを通じてデータ出力するかを
選択するものである。つまり種々のメディアのうち、ど
のメディアを通じて情報伝送するかを選択するものであ
る。The output format selection section 24 is activated upon receiving a media selection request signal, and selects which medium is to be used to output data. In other words, it selects which of various media should be used to transmit information.
第45図はこの出力形態選択部24の概略構成図であり
、メディア選択制御部24a1人力メディア判定部24
b、相手メディア判定部24c、メディア変換テーブル
24d、および自己メディア機能テーブル24cを備え
て構成される。また第46図はこの出力形態選択部24
の処理の流れを示すものである。この処理手続きの流れ
に沿って該出力形態選択部24の機能を説明する。FIG. 45 is a schematic configuration diagram of this output form selection section 24, in which the media selection control section 24a1 manual media determination section 24
b, a partner media determination unit 24c, a media conversion table 24d, and a self-media function table 24c. Also, FIG. 46 shows this output format selection section 24.
This shows the flow of processing. The functions of the output format selection section 24 will be explained along the flow of this processing procedure.
メディア選択要求信号が与えられるとメディア選択制御
部24aは前記制御部2に対してメディア選択動作に必
要な人力メディア情報の提供を要求する。そして入力メ
ディア判定部24bに対してメディア情報検出要求とメ
ディア機能識別要求を発する。When the media selection request signal is given, the media selection control section 24a requests the control section 2 to provide manual media information necessary for the media selection operation. Then, it issues a media information detection request and a media function identification request to the input media determining unit 24b.
入力メディア判定部24bはメディア検出部24f’と
メディア識別部24gとによって構成され、上記メディ
ア選択制御部24aによる情報要求を受けて制御部2か
ら与えられる入力メディアを検出し、且つその検出メデ
ィアの機能を識別判定するものとなっている。この入力
メディア判定部24bは、例えば人力メディアが音声で
ある場合、そのメディアの機能がADPCMである等と
して識別判定する。The input media determining section 24b is composed of a media detecting section 24f' and a media identifying section 24g, and detects the input media given from the control section 2 in response to an information request from the media selection control section 24a, and also detects the input media given from the control section 2. It is used to identify and judge functions. For example, when the human-powered media is audio, the input media determining unit 24b identifies and determines that the function of the media is ADPCM.
しかる後、メディア選択制御部24aは制御部2に対し
てそのデータ出力の相手先が自己端末(ワークステーシ
ョン内)の他の機能ブロックであるか、或いは通信回線
等を介して接続される別のワークステーションや通信端
末であるかを間合せる。Thereafter, the media selection control section 24a informs the control section 2 whether the destination of the data output is another functional block of its own terminal (within the workstation) or another function block connected via a communication line or the like. Determine whether it is a workstation or communication terminal.
そして別のワークステーションや通信端末に対してデー
タ出力することが指示されると、メディア選択制御部2
4aは送信相手局に関する識別情報を制御部2に対して
要求する。この要求を受けてデータ出力する相手局に関
する情報がt目手メディア判定部24cに人力される。When an instruction is given to output data to another workstation or communication terminal, the media selection control unit 2
4a requests the control unit 2 for identification information regarding the destination station. In response to this request, information regarding the partner station that outputs data is manually input to the t-th media determining unit 24c.
相手メディア判定部24cは、相手局識別部24h。The partner media determining section 24c is a partner station identifying section 24h.
相手局メディア識別部2412機能識別部24jを備え
て構成され、前記メディア選択制御部24aからの識別
情報判定要求を受けて作動する。そして相手局に対する
忠別情報から、先ずtI手局を識別し、相手局のメディ
アを識別する。そしてその相手局メディアの機能を識別
する。The partner station media identification unit 2412 is configured to include a function identification unit 24j, and operates upon receiving an identification information determination request from the media selection control unit 24a. Then, first, the tI hand station is identified from the identification information for the partner station, and then the media of the partner station is identified. Then, the function of the partner station's media is identified.
具体的には、例えばデータ出力(送信)する相手局が自
動FAXであり、その通信メディアがイメージであって
、その機能がGIIIタイプである等を識別する。尚、
この相手局の識別は、相手局からそのネゴツエーション
(ハンドシェーク)機能を用いて送られてくる情報に基
いて行うよにしても良い。またネゴツエーション機能が
ない場合には、そのメディア検出機能を機能識別部24
jに持たせておけば良い。このようにすれば相手側から
のメディア情報信号に従ってその機能識別を行なうこと
が可能となる。Specifically, for example, it is identified that the destination station to which data is to be outputted (transmitted) is an automatic FAX, its communication medium is an image, and its function is GIII type. still,
This identification of the partner station may be performed based on information sent from the partner station using its negotiation (handshake) function. In addition, if there is no negotiation function, the media detection function is transferred to the function identification unit 24.
Just let j have it. In this way, it becomes possible to identify the function according to the media information signal from the other party.
第47図はこの相手局の歳別処理手続きの流れを示すも
のである。この流れに示されるように、例えば通信相手
局が電話か否かを判定し、電話である場合にはFAX信
号が到来するか否かを判定する。FIG. 47 shows the flow of the age-based processing procedure of the partner station. As shown in this flow, for example, it is determined whether the communication partner station is a telephone or not, and if it is a telephone, it is determined whether or not a FAX signal arrives.
そして相手局が電話であり、FAX信号が到来する場合
には、これを相手機器がFAXであると識別すれば良い
。また電話であると判定され、FAX信号が到来しない
場合には、相手機器は通常の電話であると判定すれば良
い。史に電話でないと判定された場合には、相手機器は
電話以外の他の通信機器であると判定するようにすれば
良い。If the other party's station is a telephone and a FAX signal arrives, it is sufficient to identify this as the other party's device being a fax machine. Further, if it is determined that the device is a telephone and no FAX signal arrives, it may be determined that the other party's device is a normal telephone. If it is determined that the device is not a telephone, it may be determined that the other party's device is a communication device other than a telephone.
このようにして通信相手局のメディアが識別判定される
と、次にメディア選択制御部24aは、例えば第48図
に示すように構成されたメディア変換テーブル24dを
参照して、入力メディア、入力機能、相手機器、相手機
器メディア、相手機器の機能に対応したメディア変換選
択情報を得る。When the media of the communication partner station is identified in this way, the media selection control unit 24a then refers to the media conversion table 24d configured as shown in FIG. 48, and selects the input media and input function. , obtain media conversion selection information corresponding to the destination device, the destination device media, and the function of the destination device.
例えば入力メディアが音声で、その機能がA D P
CMであり、相手機器がGI[[タイプのFAXである
場合、相手機器のメディアがイメージであること、そし
て主なメディア変換機能が(音声) to (コー
ド文字)
(コード文字)to(イメージ)
であること等が求められる。同時にそのその変換機能が
、
(ADPCM;音声) to (GII[;FAX
)によって実現できることが求められる。この際、従属
的なメディア変換情報が存([すれば、これも同時に求
められる。For example, if the input media is audio, the function is ADP.
If the destination device is a GI type fax, the media of the destination device is an image, and the main media conversion function is (voice) to (code character) (code character) to (image). It is required to be. At the same time, the conversion function is (ADPCM; voice) to (GII[;FAX
) is required. At this time, dependent media conversion information exists ([If so, this is also obtained at the same time.
このようにして求められたメディア変換情報が制御部2
に与えられ、前記データ出力の形式が選択的に指定され
る。The media conversion information obtained in this way is sent to the control unit 2.
and selectively specifying the format of the data output.
尚、データ出力が自己のワークステーション内部に対し
て行われる場合には、メディア選択制御部24aは自己
メディア機能テーブル24eを参照して、データ出力が
可能な出力形式を求める。この情報に従ってメディア選
択制御部24aは前記メディア変換テーブル24dの自
己メディア変換テーブルを参照し、同様にしてメディア
変換情報を求め、これを制御部2に与える。In addition, when data output is to be performed inside the own workstation, the media selection control unit 24a refers to the own media function table 24e to find an output format in which the data can be output. According to this information, the media selection control section 24a refers to its own media conversion table of the media conversion table 24d, similarly obtains media conversion information, and provides this to the control section 2.
このようにして求められるメディア変換情報に従って、
例えば前述した音声合成部26を用いて文字コードの系
列で与えられる文章情報を音声情報に変換してデータ出
力したり、或いは音声認識部19を用いて音声情報を文
字コード系列の情報に変換してデータ出力することにな
る。According to the media conversion information obtained in this way,
For example, the above-mentioned speech synthesis section 26 may be used to convert text information given as a character code series to speech information and output as data, or the speech recognition section 19 may be used to convert speech information to character code series information. The data will be output.
次にデータベース部32について説明する。Next, the database section 32 will be explained.
データベース部32はコードやイメージ、音声等の各種
のデータを整理して格納し、これを種々の応用システム
に供するものである。第49図はこのデータベース部3
2の概略構成を示すもので、コマンドの解析処理等を実
行するインターフェース部32a1データベースの検索
処理等を実行するデータ操作部32b、種々のデータを
格納する記憶媒体としての磁気ディスク装置32cや光
デイスク装置32d1そしてその付加機能部32cとに
よって構成される。The database unit 32 organizes and stores various data such as codes, images, and sounds, and provides this data to various application systems. Figure 49 shows this database section 3.
2, which includes an interface section 32a that executes command analysis processing, a data operation section 32b that executes database search processing, etc., and a magnetic disk device 32c and optical disk as storage media for storing various data. It is composed of a device 32d1 and its additional function section 32c.
種々のデータは、そのデータの種別に従って段数のりレ
ーションに分類整理され、各リレーション毎にそれぞれ
登録されてデータベースが構築されている。Various data are classified and arranged into relations according to the type of data, and a database is constructed by registering each relation.
以下、このデータベース部32を、その論理構造、蓄え
られるデータ、物理構造、および付加機能の4つに分け
て説明する。The database unit 32 will be explained below by dividing it into four parts: its logical structure, stored data, physical structure, and additional functions.
論理構造とはこのデータベース部32を応用システム側
から見た場合、種々のデータがどのように#積されてい
るかを示すものである。ここではリレーショナル・モデ
ルに従った論理構造として、例えば第50図に示すよう
な表のイメージとしてデータが取扱われるようになって
いる。The logical structure indicates how various data are stacked when the database section 32 is viewed from the application system side. Here, data is handled as a logical structure according to the relational model, for example, as a table image as shown in FIG.
表(リレーション)には幾つかの欄(アトリビュート)
が設けられており、これらの各欄に所定のtlt位のデ
ータがそれぞれ格納される。データの111位(タラプ
ル)は、各欄に格納すべき1組の値として定められる。A table (relation) has several columns (attributes)
are provided, and data of a predetermined tlt is stored in each column. The 111th position (Tarapur) of data is determined as a set of values to be stored in each column.
このようなタラプルを格納した任意個数のアトリビュー
トによって1つのりレーションが構築される。One relation is constructed by an arbitrary number of attributes storing such Tara pulls.
しかしてこのモデルにあっては、リレーション名を指定
し、その各アトリビュートの値をそれぞれ与えることに
よってデータベースへのデータの格納が行われる。また
データベースの検索は、すレーションおよびアトリビュ
ートを指定し、そこに格納されている値が指定された値
、またメよ別のアトリビュートに格納されている値との
間で所定の条件を満すか否かを判定し、その条件を満す
タラプルを抽出することによって行われる。However, in this model, data is stored in the database by specifying a relation name and giving values for each of its attributes. In addition, database searches can be performed by specifying attributes and attributes, and checking whether the value stored there satisfies a predetermined condition with the specified value or with a value stored in another attribute. This is done by determining whether the condition is true and extracting Tarapuls that satisfy the condition.
この検索条件は、それらの値が等しい、等しくない、小
さい、大きい等として与えられる。この際、複数のアト
リビュートについてそれぞれ検索条件を指定し、その条
件判定結果を論理処理(アンドやオア等)して行なうこ
とも可能である。更には、複数のりレーションを指定し
、成るリレーションの成るアトリビュートの値が他のリ
レーションの成るアトリビュートの値に等しい等の条件
により、段数のりレーション中から所定のタラプルを求
めるようなデータベース検索も可能である。This search condition is given as the values being equal, unequal, smaller, larger, etc. At this time, it is also possible to specify search conditions for each of a plurality of attributes and perform logical processing (AND, OR, etc.) on the results of the condition determination. Furthermore, by specifying multiple relations and using conditions such as the value of the attribute of one relation being equal to the value of the attribute of another relation, it is also possible to perform a database search to find a predetermined Tara pull from among the number of rows of relations. be.
またデータベースからのデータ削除は、基本的には上記
検索と同様に行われるが、タラプルを抽出することに代
えて、そのタラプルを抹消することによって行われる。Furthermore, data deletion from the database is basically performed in the same manner as the above search, but instead of extracting the data, the data is deleted by deleting the data.
更にデータ更新も同様であり、得られたタラプルの指定
されたアトリビュートの値を変更し、これを格納するこ
とによって行われる。Furthermore, the same applies to data updating, which is performed by changing the value of a specified attribute of the obtained Tara pull and storing it.
また各リレーションには、各アトリビュート毎にデータ
の読出し、追加、変更が許可された人の情報(人名や担
当者コード)等が記入され、データ保護の対策が;14
じられている。尚、このデータ保護対策をアトリビュー
ト毎に行なうことに代えて、リレーション単位で行なう
ことも可能である。In addition, for each relation, information (person name, person in charge code), etc. of the person who is permitted to read, add, or change data for each attribute is entered, and data protection measures are taken;
I'm being teased. Note that instead of taking this data protection measure for each attribute, it is also possible to take this measure for each relation.
尚、ここに記載される人の情報は複数であっても良い。It should be noted that there may be more than one person's information listed here.
しかして第50図に示すリレーションの例では、文字列
としてそのデータが示されているが、各リレーションに
蓄積されるデータは単なるビット列であっても良い。つ
まりリレーションに#積されるデータは文字列は勿論の
こと、イメージ情報や音声情報等であっても良い。In the relation example shown in FIG. 50, the data is shown as a character string, but the data stored in each relation may also be a simple bit string. In other words, the data multiplied by the relation may be not only character strings but also image information, audio information, etc.
さてこのデータベースに蓄積されるデータは、上述した
第50図に示す「個人スケジュール」のリレーションを
初めとして、例えば第51図に示すような「住所録」
「個人の仕事とその代行者」「操作履歴」 「人事」
「会議室」 「会議室予約」「会議」等の種々のりレー
ションからなる。Now, the data accumulated in this database includes the "personal schedule" relation shown in FIG. 50 mentioned above, as well as the "address book" shown in FIG. 51, for example.
“Individual work and its agents” “Operation history” “Human resources”
It consists of various posts such as ``Conference Room'', ``Conference Room Reservation'', and ``Meeting''.
この例に示されるようにリレーションは、主に個人用と
して用いられるものと、多くの利用者によって共通に利
用されるものとからなる。そして個人用のりレーション
は各個人が使用するワークステーション毎に設けられ、
また共通りレーションは複数の利用者にとって共通なワ
ークステーションに設けられる。As shown in this example, relations consist of those that are mainly used for personal use and those that are commonly used by many users. Personal glue rations are set up for each workstation used by each individual.
A common partition is provided at a workstation that is common to multiple users.
尚、共通のワークステーションとは必ずしもそのハード
ウェアが他のワークステーションと異なることを意味し
ない。また個人用のワークステーションが共通のワーク
ステーションを兼ねても良いことも勿論のことである。Note that a common workstation does not necessarily mean that its hardware is different from other workstations. It goes without saying that a personal workstation may also serve as a common workstation.
更には共通のワークステーションは1台に限られるもの
ではなく、システムの階層レベルに応じてff1li台
設けられるものであっても良い。要するに、段数のワー
クステーションから容易に特定することのできるものと
して共通のワークステーションが設定される。Furthermore, the number of common workstations is not limited to one, and ff1li units may be provided depending on the hierarchical level of the system. In short, a common workstation is set as one that can be easily identified from the number of workstations.
ここで第50図に示した「個人スケジュール」リレーシ
ョンのデータ構造について簡単に説明する。Here, the data structure of the "personal schedule" relation shown in FIG. 50 will be briefly explained.
このリレーションからは、そのリレーション名が「個人
スケジュール」であり、「△△△△」によって作成され
たことが示される。このリレーション作成者「Δ△Δ△
」は該リレーションに対して全てのデータ操作が許可さ
れる。This relation indicates that the relation name is "Personal Schedule" and that it was created by "△△△△". This relationship creator “Δ△Δ△
” allows all data operations for the relation.
またこのリレーションに付加されたデータ保護機能によ
れば、データの読出しは全員に許可されており、データ
の追加は「○○○O」と「技術部に所属する者」に対し
てのみ許可されている。尚、この「技術部に所属する者
」は、例えば「人事」のりレーションを参照する等して
求められる。またデータの変更は1人レベル」の値が「
5」以上のものに対してのみ許可されている。この1人
レベル」とは人事リレーションに関するものであり、例
えば(部長;8)(次長;7)(課長;6)(主任;5
)等として役職を表わす。Also, according to the data protection function added to this relation, everyone is allowed to read data, but only "○○○O" and "persons belonging to the engineering department" are allowed to add data. ing. Note that this "person belonging to the technical department" can be found by, for example, referring to the "personnel" relation. Also, the value of ``Data can be changed at the single person level'' is ``
Permitted only for those with 5" or higher. This "one-person level" refers to personnel relations, for example, (Director; 8) (Deputy Manager; 7) (Section Manager; 6) (Chief; 5)
) etc. to represent the position.
更にこのリレーションには、「開始時刻」 「終了時刻
」 「種類」 「名称」 「場所」等のアトリビュート
が設定され、そのそれぞれにデータが書込まれるように
なっている。Furthermore, attributes such as "start time", "end time", "type", "name", and "location" are set for this relation, and data is written to each of them.
次にこのデータベース部32における−1−述した各種
のりレーションを実際に記憶する為の物理構造について
説明する。Next, a description will be given of the physical structure of the database unit 32 for actually storing the various pastes mentioned above.
情報蓄積部(記憶部)は大工データを蓄積し、その任意
の部分を比較的高速に読み書きすることができ、価格的
にさぼど高価でないものとして前述した磁気ディスク装
置32cや光デイスク装置32gが用いられる。The information storage unit (storage unit) stores carpenter data and can read and write any part of it at relatively high speed, and the above-mentioned magnetic disk device 32c and optical disk device 32g are inexpensive. used.
この情報蓄積部へのデータベースの蓄積は、該情報蓄積
部の記憶領域を特定の大きさく例えば数キクバイト程度
で、タラプル長や計算機の速度等に応じて定められる)
毎に区切り、各々をページとして管理して行われる。そ
して第52図に示すように、例えば第Oベージにページ
管理の情報を、第1ページにリレーション−覧表の情報
を、また第2ページに使用中のページ情報をそれぞれ格
納する。The storage of the database in this information storage unit is determined by setting the storage area of the information storage unit to a specific size, for example, several kilobytes, depending on the length of the data pull, the speed of the computer, etc.)
This is done by dividing each page into sections and managing each page as a page. As shown in FIG. 52, for example, page management information is stored in the Oth page, relation list information is stored in the first page, and information on pages in use is stored in the second page.
このリレーションの一覧表によって、データベース中に
おける種々のりレーションの所在が示される。This list of relations indicates the location of various relations in the database.
例えば第9ページおよび第11ページに格納された実デ
ータは、第5ページに格納されたりレーションのアトリ
ビュート (主アトリビュート)に基き、第10ページ
に格納されたインデックスページの情報に従ってソート
されるようになっている。このインデックスページの情
報は、アトリビュートの値が幾つから幾つ迄のものがど
のページに格納されているかを示すものである。For example, the actual data stored on the 9th and 11th pages may be stored on the 5th page or sorted based on the ration attribute (main attribute) and according to the information on the index page stored on the 10th page. It has become. This index page information indicates in which page the number of attribute values is stored.
この主アトリビュート以外のアトリビュートによりデー
タ検索する場合には、そのアトリビュートについて第2
0ページのサブ・インデックスを紅白して、先ず第21
ページや第22ページに示されるサブデータを得る。こ
のサブデータにはアトリビュートの値と前述した主アト
リビュートの値のみが入っており、ここで求められるア
トリビュートの値を用いて実際のデータが求められる。When searching data using an attribute other than this main attribute, a second
Red and white the sub-index of page 0, and first
Obtain the sub-data shown on the page and the 22nd page. This sub-data contains only the attribute values and the above-mentioned main attribute values, and the actual data is determined using the attribute values determined here.
尚、例えば画像データや音声データのようにその実デー
タの量が膨大であり、その中の幾つかのビット誤りが問
題とならない場合には、これらの実データを光デイスク
装置32d等の別の安価な情報記憶装置にファイルする
ようにしても良い。この場合には、第9ページや第11
ページ等の実データ用ページには、その旨とその装置で
の実データの格納位置情報を記憶しておくようにすれば
良い。If the amount of actual data is enormous, such as image data or audio data, and some bit errors in the data are not a problem, these actual data may be stored on another inexpensive device such as the optical disk device 32d. The file may be stored in a suitable information storage device. In this case, the 9th page or the 11th page
The actual data page such as the page may store information to that effect and the storage location information of the actual data in the device.
しかしてこのように構築されたデータベースに対する付
加機能は、例えば不要データの自動廃棄等からなる。こ
の不要データの自動廃棄は、リレーションの付加情報と
して[廃棄;可/不可][廃棄の方法]等を与えておき
、所定の間隔でリレーション毎の消去コマンドを動作さ
せて行われる。However, additional functions for the database constructed in this way include, for example, automatically discarding unnecessary data. This automatic disposal of unnecessary data is performed by giving additional information to the relation, such as [disposal; allowed/disabled] and [discarding method], and by operating an erase command for each relation at predetermined intervals.
尚、タラプルの消去は、例えば会議情報についてはその
終了時刻が現在の時刻より前であるか否か等を判定して
行なうこ゛とが可能である。従ってこのようなタラプル
の消去については、格別の機能追加は不要である。Incidentally, deletion of the table can be performed by determining, for example, whether or not the end time of conference information is before the current time. Therefore, there is no need to add any special functionality to erase such a Tara pull.
また付加機能の他の重要な機能としてデータの保全があ
る。このデータの保全機能は、例えばハードウェアの故
障や停電等に原因してデータが不正(でたらめになった
り失われたりすること)となることを防ぐものである。Another important additional function is data security. This data preservation function prevents data from becoming corrupted (random or lost) due to, for example, hardware failure or power outage.
具体的にはこのデータの保全機能は、情報の二重化や磁
気テープへの書出し等によって実現される。Specifically, this data preservation function is realized by duplicating information, writing to magnetic tape, and the like.
このようにデータベース部32では、種々のデータをリ
レーション毎に分類整理し、且つページ単位に管理して
種々の応用システムに供するものとなっている。In this manner, the database unit 32 classifies and organizes various data for each relation, manages the data on a page-by-page basis, and provides the data to various application systems.
次に作業環境データ収集部25について説明する。Next, the work environment data collection section 25 will be explained.
この作業環境データ収集部25は、該ワークステーショ
ンに対する過去の操作履歴のデータを収集し、これに基
く操作ガイドを行なうものである。The work environment data collection unit 25 collects data on past operation history for the workstation, and provides operation guidance based on this data.
ここで作業環境データ収集部25には、例えば第53図
に示すように当該情報処理システムがtjjつ機能に対
応するコマンドと、他の情報システムが持つ機能に対応
するコマンドとを対応付けるコマンド対応テーブルが設
けられている。Here, the work environment data collection unit 25 has a command correspondence table that associates commands corresponding to the functions of the information processing system with commands corresponding to the functions of other information systems, as shown in FIG. 53, for example. is provided.
具体的には当該情報処理システムをA1他の情報処理シ
ステムをB、C,D、・・・とじたとき、システムAに
おけるコマンド“DELETE”に対応する他のシステ
ムのコマンドが “DEL”“E RA S E’
“RE Fvl OV E ”であることが、該コマン
ド対応テーブルによって示されるようになっている。Specifically, when the information processing system is A1 and the other information processing systems are B, C, D, etc., the commands of the other systems corresponding to the command "DELETE" in system A are "DEL", "E", etc. RA S E'
The command correspondence table indicates that the command is "RE Fvl OV E".
第54図は利用者により入力されたコマンドを解析し、
所定の動作および各種ガイダンスを実行する作業環境デ
ータ収集部25の概略構成を示すものである。Figure 54 analyzes the command input by the user,
This figure shows a schematic configuration of a work environment data collection unit 25 that executes predetermined operations and various guidances.
この作業環境データ収集部25では、先ずコマンド人力
部25aから人力されたコマンドをコマンド解析部25
bに与え、コマンド対応テーブル25cを参照して解析
している。具体的には第55図に示す手続きの流れに従
って入力コマンドがコマンド対応テーブル25cに登録
されているかを調べている。即ち、コマンドが入力され
ると、先ずその入力コマンドがシステムAのものである
か否かが調べられる。そして入力コマンドがシステムA
のコマンドであると解析されると、コマンド解析部25
bは該入力コマンドをコマンド実行部25dに与え、そ
のコマンドに基く所定の動作を実行させている。In this work environment data collection section 25, first, a command input manually from the command human power section 25a is sent to the command analysis section 25.
b and is analyzed with reference to the command correspondence table 25c. Specifically, it is checked whether the input command is registered in the command correspondence table 25c according to the procedure flow shown in FIG. That is, when a command is input, it is first checked whether the input command is from system A or not. And the input command is system A
If the command is analyzed as a command, the command analysis unit 25
b gives the input command to the command execution unit 25d and causes it to execute a predetermined operation based on the command.
一方、入力コマンドがシステムAのものでない場合には
、他のシステムのコマンドに該当するか否かが調べられ
、対応付けされているコマンドが存在する場合には、そ
の対応コマンドを画面表示部250にて表示する。つま
り他のシステム(システムB)で用いられているコマン
ド、例えば“DEL”である場合には、これに対応する
システムAのコマンド°DELETE”を求め、これを
操作ガイダンスとして両面表示部25eに表示すること
になる。On the other hand, if the input command is not from system A, it is checked whether it corresponds to a command from another system, and if there is a command associated with it, the corresponding command is displayed on the screen display section 250. Display at. In other words, if a command used in another system (system B) is, for example, "DEL", the corresponding system A command DELETE is obtained and displayed on the double-sided display section 25e as operation guidance. I will do it.
尚、入力コマンドに該当するコマンドがコマンド対応テ
ーブル25cに存在しなかった場合には、画面表示部2
5eにてコマンドエラーメツセージの表示を行なう。Note that if the command corresponding to the input command does not exist in the command correspondence table 25c, the screen display section 2
A command error message is displayed in step 5e.
具体的には次のようにしてそのコマンド入力に対する処
理が行われる。今、システムB、Cの操作経験の利用者
が初めてシステムA(当該情報処理システム)を操作す
るものとする。ここで利用者がコマンドを人力してデー
タ“ABC”を消去する場合、従来ではシステムAの取
扱い説明書に従ってデータ消去の為の°DELETE”
なるコマンドを探し、これを入力することが必要となる
。Specifically, the command input is processed as follows. Now, assume that a user who has experience operating systems B and C operates system A (the information processing system) for the first time. Here, if the user manually issues a command to delete the data "ABC", conventionally, the command "DELETE" for data deletion is used according to the instruction manual of System A.
You need to find a command and enter it.
しかしここでは、その利用者は過去の経験に従って、例
えばシステムCで用いていたデータ消去コマンド’ER
ASE ABC”を第56図(a)に示すように入力
する。However, in this case, the user can use the data erasure command 'ER' that was used in System C, for example, according to past experience.
ASE ABC" is input as shown in FIG. 56(a).
すると作業環境データ収集部25ではこの入力コマンド
を解析し、前記コマンド対応テーブル25eから人力コ
マンド“ERACE”に対応するシステムAのコマンド
“DELETE”を求め、これをガイドとして表示する
ことになる。この結果、利用者はシステムAを初めて操
作する場合であっても、そのデータ消去のコマンドが
“DELETE”であることを知り、そのコマンドをガ
イドに従って人力することにより、そのデータ消去を行
なうことが可能となる。Then, the work environment data collection unit 25 analyzes this input command, obtains the system A command "DELETE" corresponding to the human command "ERACE" from the command correspondence table 25e, and displays this as a guide. As a result, even when operating System A for the first time, the user knows that the data deletion command is "DELETE" and can manually delete the data by following the guide. It becomes possible.
またファイル名のリストを表示するべく、第56図(b
)に示すようにシステムBにおけるコマンド″DIR”
を入力した場合には、同様にして該システムAにおける
対応コマンド“CATA”が求められ、ガイド表示され
る。この結果、このガイドに従ってコマンド“CATA
”を入力することによって、そのファイル名のリストが
表示される。In addition, in order to display a list of file names,
) command “DIR” in system B as shown in
When inputting ``CATA'', the corresponding command "CATA" in the system A is similarly determined and displayed as a guide. As a result, following this guide the command “CATA
” will display a list of file names.
このようにこの作業環境データ収集部25の機能を活用
することにより、過去の操作経験のあるシステムで用い
られていたコマンドの人力によって、そのシステムにお
ける対応コマンドがガイド表示される。従ってシステム
利用者は、過去に得た知識を最大限に利用してシステム
を操作することが可能となる。そして当該情報処理シス
テムのコマンドを容易に知ることが可能となる。従って
その都度、当該情報処理システムの操作説明書を調べる
等の煩わしさから解放される。故に、システムの操作の
習得に要する時間を大幅に短縮することができる等の効
果が期待できる。By utilizing the functions of the work environment data collection unit 25 in this manner, corresponding commands in the system can be guided and displayed using the manual commands used in the system with which the user has past operating experience. Therefore, the system user can operate the system by making maximum use of the knowledge acquired in the past. Then, it becomes possible to easily know the commands of the information processing system. Therefore, the user is freed from the trouble of checking the operating manual of the information processing system each time. Therefore, effects such as being able to significantly shorten the time required to learn how to operate the system can be expected.
尚、入力コマンドに対応するコマンドを求め、これをガ
イド表示したとき、その合否の判定入力を受けて、その
コマンドを実行するようにしても良い。Incidentally, when a command corresponding to an input command is obtained and displayed as a guide, the command may be executed upon receiving a judgment input of its pass/fail.
即ち、第57図にその手続きの流れを示し、第58図に
その裏方く例を4くずように他のシステムの消去コマン
ド“ERASE”し、これに対応するシステムAの消去
コマンド″DELETE”が求められたとき、これが正
しいか否かを間合せる。That is, Fig. 57 shows the flow of the procedure, and Fig. 58 shows an example behind the scenes, in which the erasing command "ERASE" of another system is executed, and the corresponding erasing command "DELETE" of system A is executed. When asked, decide whether this is correct or not.
そして正(Y)なる指示人力があったとき、その入力コ
マンドが“DELETE”を示していると判定し、これ
をコマンド実行部25dに送ってその処理を実行させる
ようにする。When there is a positive (Y) instruction force, it is determined that the input command indicates "DELETE", and this is sent to the command execution unit 25d to execute the process.
このようにすれば、コマンドの対応関係がガイド指示さ
れると同時に、その入力コマ、ンドに従って所望とする
処理が実行されるので、改めて正しいコマンドを入力し
直す必要がなくなる。つまり入力コマンドの対応コマン
ドへの自動交換が行われて、その処理が実行されること
になる。従って、更にその操作性の向上を図ることが可
能となる。In this way, the command correspondence is guided and at the same time the desired process is executed according to the input command and command, so there is no need to input the correct command again. In other words, the input command is automatically exchanged with the corresponding command, and the process is executed. Therefore, it is possible to further improve the operability.
尚、対応コマンドはシステムの種類に応じて何種類存在
しても良いものである。要はコマンド対応テーブル25
cに対応付けてそれぞれ格納しておけば良い。またコマ
ンドは」二連した文字列形式に限定されないことも云う
までもない。Note that any number of compatible commands may exist depending on the type of system. In short, command correspondence table 25
It is sufficient to store them in association with c. It goes without saying that the command is not limited to the form of a double string of characters.
次にこの作業環境データ収集部25におけるシステム習
熟度のデータ収集について説明する。この作業環境デー
タ収集部25の内部に、このシステム習熟度のデータ収
集処理を実行する為のハードウェアとして、外部記憶装
置と制御装置が置かれる。Next, the collection of system proficiency data by the work environment data collection unit 25 will be explained. Inside the work environment data collection unit 25, an external storage device and a control device are placed as hardware for executing the system proficiency data collection process.
第59図はシステム習熟度のデータ収集処理を示す流れ
図である。FIG. 59 is a flowchart showing the system proficiency data collection process.
利用者がその識別コード(ユーザ番号やパスワード等)
を入力すると、作業環境データ収集部25はその識別コ
ードに対応する習熟皮表を外部記憶装置から求め、装置
内部にセットする。この習熟皮表は各利用者がシステム
の様々な利用機能に対してどの程度習熟しているかを格
納したもので、例えば第60図に示す如く構成されてい
る。When a user enters their identification code (user number, password, etc.)
When inputted, the work environment data collection unit 25 obtains the proficiency skin chart corresponding to the identification code from the external storage device and sets it inside the device. This proficiency table stores the degree of proficiency of each user with respect to various functions of the system, and is structured as shown in FIG. 60, for example.
即ち、この習熟皮表は各利用機能に対してその利用頻度
、最終利用年月日時、ユーザが申告した該機能に対する
習熟クラス、該機能を前回利用した際の習熟度クラス、
更には該機能の次雑度の情報等によって構成されている
。That is, this proficiency chart includes, for each function used, the frequency of use, the date and time of last use, the proficiency class for the function declared by the user, the proficiency class when the function was last used,
Furthermore, it is composed of information such as the degree of complexity of the function.
ここで複雑度とは該当利用機能が専門知識を要求する程
高くなり、また基本機能より高級機能になる程高くなる
ものである。Here, the degree of complexity increases as the function to be used requires specialized knowledge, and as the function becomes more advanced than the basic function.
しかしてこのような習熟皮表は各利用者毎に設けられ、
外部記憶装置にそれぞれ記憶されている。However, such a learning skin table is set up for each user,
Each is stored in an external storage device.
尚、システムを初めて利用する利用者に対しては、識別
コードの新規設定によりその利用者に対する習熟皮表が
作成され、外部記憶装置に登録される。Note that for a user who uses the system for the first time, a learning curve for that user is created by setting a new identification code, and is registered in the external storage device.
尚、外部記憶装置には、例えば第61図に示すように−
I;述した習熟皮表に加えて、前記習熟度クラスに対応
した利用機能毎のメツセージが登録されている。このメ
ツセージは習熟度のクラスが低い稈、その背景説明を含
む判り易い説明となっている。また習熟度の高いクラス
はど、簡略な説明と専門的な機能の紹介を含んだ高度な
内容となっている。Note that the external storage device may contain -
I: In addition to the above-mentioned proficiency table, messages for each function used corresponding to the proficiency class are registered. This message is an easy-to-understand explanation of the culms whose proficiency level is low, including the background explanation. In addition, classes with a high level of proficiency have advanced content that includes simple explanations and introductions to specialized functions.
また習熟度のクラスは、例えば A;初級者クラス B:中級者クラス C;習熟者クラス のように分類設定される。Also, proficiency classes are, for example, A; Beginner class B: Intermediate class C; Expert class The classification is set as follows.
しかして入力された識別コードに対応した習熟皮表が求
められると、次にその利用機能を利用者に選択させる為
のメニューが表示される。このメ二二一に対して利用者
は、例えばその利用機能に対応する番号等を入力する。When the proficiency chart corresponding to the input identification code is obtained, a menu is displayed that allows the user to select the function to be used. In this menu, the user inputs, for example, a number corresponding to the function to be used.
すると制御装置ではその入力情報が終了信号か利用機能
の選択信号かを判断し、利用機能選択信号の場合には次
のように動作する。Then, the control device determines whether the input information is an end signal or a selection signal for a function to be used, and if it is a selection signal for a function to be used, the operation is as follows.
即ち、利用機能選択信号が入力されると、先ずその利用
者に関する前記習熟皮表を参照し、選択された(す用機
能に対応する利用頻度や最終利用年月日時、申告習熟度
クラス等の情報が求められる。That is, when a usage function selection signal is input, first, the proficiency table for the user is referred to, and information such as usage frequency, last usage date and time, declared proficiency class, etc. corresponding to the selected usage function is checked. Information is required.
そしてこれらの情報に従って重み付は処理を施し、現在
の習熟度クラスの決定が行われる。Then, weighting is performed according to this information, and the current proficiency class is determined.
この習熟度クラスの判定は、例えば利用頻度をPI、最
終利用年月日時をT 、現在の利用年月日時をT 1利
用者申告習熟度クラスをX 1前c
1
同利用習熟度クラスをX2目iA、 B、 C1、
ffl雑度をP 1そして判別関数をF としたとき、
r
F −KIP1+に2 (To−To)十に3G1 [
X1コ
十K G [X ]十に5Pc
として求められ。但し、上式においてK 、K 。To determine this proficiency class, for example, the frequency of use is PI, the date and time of last use is T, the current date and time of use is T, the user-reported proficiency class is X, and the previous c
1 Same usage proficiency class as X2 iA, B, C1,
When the ffl miscellaneousness is P 1 and the discriminant function is F,
r F −KIP1+ 2 (To-To) 10 3G1 [
It is calculated as X1 ko 1K G [X] 5Pc. However, in the above formula, K , K .
K 、K は、実験等によって適切な値に設定さテ
アリ、y 、y 、y 、z :z2.z3ハ
、l 2 3 1
A、B、Cに対する評礒重みである。これらの評価重み
は
Y くY くY 、 Z くZ2くZ31 2 3
!
なる関係を自°シ、実験等によって適切な値に設定され
る。K , K are set to appropriate values through experiments, etc., and y , y , y , z :z2. z3c, l 2 3 1 This is the evaluation weight for A, B, and C. These evaluation weights are Y kuY kuY , Z kuZ2kuZ31 2 3
! The relationship is set to an appropriate value by hand, experiment, etc.
ここでG[X]は、X t ”” AのときYlな1す
る値を取り、X −BのときY2なる値を取ることを
意味する。また(T −T ”)は、最終利用C8
年月日時から現在までの口数を時間換算したものである
。Here, G[X] means that when X t "" A, it takes a value of Yl which is 1, and when X - B, it takes a value of Y2. Further, (T − T ”) is the number of units from the last use C8 year, month, date and time to the present converted into time.
しかしてクラス判定は、上述した判別関数F。Therefore, class determination is performed using the above-mentioned discriminant function F.
の値により次のようにして行われる。This is done as follows depending on the value of .
F <N ・・・Aクラス
「 I
N ≦F <N ・・・Bクラスr2
N2≦Fr ・・・Cクラス
尚、判定閾値N 、N は実験等に基いて適切に定
められる。F<N . . . A class I N ≦F <N . . . B class r2 N2 ≦ Fr . . . C class Note that the determination thresholds N and N are appropriately determined based on experiments and the like.
このようにして習熟度クラスが決定されると、その決定
された習熟度クラスに対応し、Rつ前述した如く指定さ
れた利用機能に該当するがイドメツセージやエラーメ”
7セージを外部記憶装置から求める。When the proficiency class is determined in this way, the proficiency class corresponding to the determined proficiency class corresponds to the usage function specified as described above, but the message and error message
7. Retrieve the message from the external storage device.
しかる後、今回決定された習熟度クラスと、前記習熟度
表に格納されている前回の習熟度クラスとを比較照合す
る。そして習熟度クラスに鹿更がある場合には、その習
熟度に変更がある旨を示すメツセージを前記ガイドメツ
セージ等に付加して書込む。Thereafter, the currently determined proficiency class is compared with the previous proficiency class stored in the proficiency table. If the proficiency level class is Kasara, a message indicating that there is a change in the proficiency level is added to the guide message etc. and written.
この習熟度クラス変更のメツセージは、例えば第62図
に示すような4種類のメツセージからなる。そしてその
クラス変更の形態に応じて求められ、前記ガイドメツセ
ージ等と共に表示される。This proficiency class change message consists of four types of messages as shown in FIG. 62, for example. Then, it is determined according to the form of the class change and displayed together with the guide message, etc.
利用者はこのようにして表示される各種メツセージに従
ってその処理操作を行なうことになる。The user performs processing operations according to the various messages displayed in this way.
具体的には作成データをファイルに格納する利用機能に
対して、その利用者が用級者クラス(Aクラス)と判定
されると第63図に示す如きメツセージが表示される。Specifically, for the function used to store created data in a file, if it is determined that the user is in the expert class (A class), a message as shown in FIG. 63 is displayed.
そしてこのメツセージにも拘らず利用者が情報入力を誤
った場合には、例えば第64図に示すようなエラーメツ
セージの表示が行われ、その利用機能に対する操作のガ
イドが行われる。If the user makes a mistake in inputting information in spite of this message, an error message as shown in FIG. 64 is displayed, for example, and guidance on how to use the function is provided.
またその利用者の習熟度が中級者クラス(Bクラス)と
判定された場合には、第65図に示す妬きメツセージが
表示される。そしてこのメツセージにも拘らず利用者が
情報入力を誤った場合には、例えば第66図に示すよう
なエラーメツセージの表示が行われ、その利用機能に対
する操作のガイドが行われる。同様にその利用者の習熟
度が習熟者クラス(Cクラス)と判定された場合には、
第67図に示す如きメツセージが表示され、情報入力の
誤りがある場合には、例えば第68図に示すようなエラ
ーメツセージの表示が行われてその利用機能に対する操
作のガイドが行われる。Further, if the user's proficiency level is determined to be intermediate class (B class), the jealous message shown in FIG. 65 is displayed. If the user makes a mistake in inputting information in spite of this message, an error message as shown in FIG. 66 is displayed, for example, and guidance on how to use the function is provided. Similarly, if the user's proficiency level is determined to be in the expert class (C class),
A message as shown in FIG. 67 is displayed, and if there is an error in the information input, an error message as shown in FIG. 68 is displayed to guide the operation of the function to be used.
しかして上述した如く表示したガイドメツセージの空欄
に対してデータ入力が行われると、制御装置は前述した
如く求めている該当利用者の習熟度表の該当利用頻度を
(+1)すると共に、最終利用年月日時および前回利用
習熟クラスの更新を行なう。そして該利用機能の実行を
促すと共に、該当利用機能が終了したものと石像して前
述した利用機能選択の為のメニュー表示動作に戻る。However, when data is entered into the blank field of the guide message displayed as described above, the control device adds (+1) to the frequency of use of the proficiency table of the desired user as described above, and Update the year, month, date and time as well as the previous usage proficiency class. Then, the user is prompted to execute the function to be used, and, assuming that the function to be used has been completed, the process returns to the menu display operation for selecting the function to be used.
ここで再び利用機能選択信号が人力されると、」二連し
た処理を再び繰返して実行することになる。If the function selection signal to be used is manually input again here, the two consecutive processes will be repeated again.
しかし終了選択信号が人力された場合には、上述した如
く作成・更新した習熟度表を外部記憶装置の習熟度ファ
イルに、その該当利用者の識別コ−ドと共に書込み、こ
れを保存する。そしての一連の処理手続きを終了する。However, when the termination selection signal is input manually, the proficiency table created and updated as described above is written into the proficiency file of the external storage device together with the identification code of the user concerned, and this is saved. Then, the series of processing procedures is completed.
このようにして作業環境データ収集部25では、システ
ムの操作に関する習熟度のデータを収集しながら、その
収集されたデータに従ってその操作を適切にガイダンス
するものとなっている。In this way, the work environment data collection unit 25 collects data on proficiency regarding system operations and provides appropriate guidance for the operations based on the collected data.
以上が本ワークステーションの基本的な構成とその機能
である。The above is the basic configuration of this workstation and its functions.
次に本ワークステーションにおける音声通知機能につい
て説明する。Next, the voice notification function of this workstation will be explained.
この音声通知機能は第69図に示す如き処理機能からな
り、制御部2の処理機能の一部として実現される。即ち
、この音声通知処理で用いられる制御部2の機能は、文
章作成手段2a、宛先リスト作成手段2b、保存手段2
C1検索手段2d、自動ダイヤル手段2e、音声文章出
力手段2r、および検索用のバッファ2g1音声合成用
のバッファ2h、コードバア21からなる。This voice notification function consists of processing functions as shown in FIG. 69, and is realized as a part of the processing functions of the control section 2. That is, the functions of the control unit 2 used in this voice notification process are text creation means 2a, destination list creation means 2b, and storage means 2.
It consists of a C1 search means 2d, an automatic dialing means 2e, an audio text output means 2r, a search buffer 2g1, a speech synthesis buffer 2h, and a code bar 21.
ここで文章作成手段2aは、前記キーボード部6から入
力される文字コードや制御コードに従って文章を作成し
、これをディスプレイ10に表示して会話的にその作成
編集を進める。そして作成した文章のコード列で表現さ
れるデータを保存手段2Cの制御の下で前記データベー
ス部32に格納するものとなっている。また宛先リスト
作成手段2bは、通知すべき文書とその通知先を指定す
る為の宛先リストを作成する為のもので、前記キーボー
ド6からの情報入力とディスプレイ10による入力情報
の表示とによって会話的に宛先リストを作成するものと
なっている。この宛先リストによって前記データベース
部32に格納されている文章中のどの文章を通知するか
、またその通知先がどこであるかが指定される。Here, the text creation means 2a creates a text according to the character code and control code inputted from the keyboard section 6, displays this on the display 10, and proceeds with the creation and editing of the text in a conversational manner. The data expressed by the code string of the created sentence is then stored in the database section 32 under the control of the storage means 2C. The destination list creation means 2b is for creating a destination list for specifying documents to be notified and their notification destinations, and is interactive by inputting information from the keyboard 6 and displaying the input information on the display 10. It is designed to create a destination list. This destination list specifies which text among the texts stored in the database section 32 is to be notified and where the notification destination is.
また検索手段2dは、指定された文章をデータベース部
32から検索抽出したり、また宛先リストに示される宛
先名に従って、それに対応する電話番号をデータベース
のりレーションの1つである電話リストから検索抽出す
るものである。この検索抽出された電話番号によって自
動ダイヤル手段2Cが起動され、前記通信装置12.
Hの自動ダイヤル機構から該当電話端末に対する自動発
呼(自動ダイヤル)が行われる。Further, the search means 2d searches and extracts a specified sentence from the database unit 32, and also searches and extracts a corresponding telephone number from a telephone list, which is one of the database entries, according to the destination name shown in the destination list. It is something. The automatic dialing means 2C is activated based on the searched and extracted telephone number, and the communication device 12.
An automatic call (automatic dial) is made from the automatic dialing mechanism of H to the corresponding telephone terminal.
更に音声文章出力手段2rは前記音声合成部26を起動
し、前記データベース部32から読出された文章(フー
ド列情報)を音声合成するものである。Further, the audio text output means 2r activates the speech synthesis section 26 and synthesizes the text (food string information) read from the database section 32 into speech.
このような処理機能を用いて実行される音声通知機能を
、第70図に示す処理の流れに沿って説明する。The voice notification function executed using such a processing function will be explained along the processing flow shown in FIG. 70.
一般的には、先ずキーボード8等から文字コードや制御
コードを人力して文章作成処理が行われる。この文章作
成は、通常のワードプロセッサの処理機能と同様に、そ
の人力文章データをディスプレイ表示しながら会話的に
実行され、所望とする文章に作成編集される。しかして
文章が作成されると、その作成文章のデータをデータベ
ースに格納してその一連の文章作成処理を終える。尚、
作成された文章データが別の情報処理機器から与えられ
る場合には、これをデータベースに格納してその処理を
終える。Generally, first, text creation processing is performed by manually inputting character codes and control codes from the keyboard 8 or the like. Similar to the processing function of a normal word processor, this text creation is performed interactively while displaying the human text data on a display, and the desired text is created and edited. Once the text is created, the data of the created text is stored in the database and the series of text creation processing is completed. still,
When the created text data is provided from another information processing device, it is stored in the database and the processing is completed.
しかる後、宛先リストの作成が行われる。この宛先リス
トは、例えばリスト作成用の定形のフオームデータをコ
ードバッファ21に書込み、これをディスプレイ表示す
る。そして前記キーボード6等から通知すべき文章を指
定する文章名、およびその通知先(宛先)の情報を上記
文章名に対応付けて人力することによって行われる。こ
の場合、同一の文章名に対して?u bの宛先を設定人
力しても良い。この場合にはこれらの宛先に従って、後
述するように文章の回報が行われることになる。After that, a destination list is created. For this destination list, for example, fixed form data for list creation is written into the code buffer 21 and displayed on the display. This is done by manually inputting a text name specifying the text to be notified from the keyboard 6 or the like, and information on the notification destination (destination) in association with the text name. In this case, for the same sentence name? You may manually set the UB destination. In this case, the text will be circulated according to these destinations as will be described later.
以]−の処理手続きを経て、音声通知の為の4 gが完
了する。4g for voice notification is completed after the following processing procedures are completed.
さて宛先リストの作成が完了すると、先ずそこに記述さ
れた文章名に従って前記データベースから該当する文章
データが読出される。このデータベースから読出された
文章データは、−口8、音声合成用のバッファ2hに格
納される。When the creation of the destination list is completed, first, corresponding text data is read from the database according to the text name written therein. The text data read from this database is stored in the voice synthesis buffer 2h.
しかる後、前記宛先リストに記述された通知先(宛先)
の情報が読出される。複数の宛先が記述されている場合
には、その全てを読出して前記検索用バッファ2rに格
納する。そして前記データベ−ス部32に予め登録され
ている、例えば第71図に示すように氏名とその電話番
号とを対応付けた電話リストを検索して宛先に対応した
電話番号を求める。その後、自動ダイヤル機能を起動し
て1−紀電話番号を自動発信し、該電話番号で特定され
る電話端末を発呼し、通知先との間の音声通話路を形成
する。After that, the notification destination (destination) written in the destination list
information is read out. If multiple destinations are written, all of them are read and stored in the search buffer 2r. Then, the telephone number corresponding to the destination is obtained by searching a telephone list registered in advance in the database section 32, for example, as shown in FIG. 71, in which names are associated with their telephone numbers. Thereafter, the automatic dialing function is activated to automatically dial the primary telephone number, call the telephone terminal specified by the telephone number, and form a voice communication path with the notification destination.
この際、音声合成機能を用いて電話応答者の確認を求め
るメツセージを送信したり、また電話応答行用から話者
認識してその応答者が通知目的とする本人であるとこを
確認するようにしても良い。In this case, a voice synthesis function can be used to send a message requesting confirmation of the person answering the phone, and the person who answered the phone can also be recognized from the answering line to confirm that the person responding is the person for whom the notification is intended. It's okay.
このようにして通知先との間で音声通話路が確立された
時点で、次に前記音声合成部26を起動して前記音声合
成用バッファ2gに格納された文章データを順次音声合
成する。そしてその合成音用を通信装置を介して前記自
動ダイヤルされた通信相手先に電話音声にて通知する。When the voice communication path is established with the notification destination in this way, the voice synthesis section 26 is then activated to sequentially synthesize the text data stored in the voice synthesis buffer 2g. Then, the synthesized voice is notified to the automatically dialed communication partner via the communication device in the form of a telephone voice.
このような宛先リストに記載された宛先に基く0動ダイ
ヤル処理と、文章データの音声合成処理によって、前記
コードデータとして簡易に作成された文章データ(メツ
セージ)の電話を用いた音声による通知が自動的に行わ
れる。そしてこの通知処理は、前記検索用バッファ2「
に格納された複数の宛先の全てについて音声通知が行わ
れる間で、繰返し行われる。かくしてここに、複数の宛
先に対する回報通知が行われることになる。Through the zero motion dialing process based on the destinations listed in the destination list and the voice synthesis process of the text data, the text data (message) simply created as the code data is automatically notified by voice using the telephone. It is carried out according to This notification process is performed in the search buffer 2.
This is repeated while voice notifications are being made for all of the multiple destinations stored in the . In this way, a circular notification is sent to multiple destinations.
[発明の効果]
以上説明したように本発明によれば、通知すべき文章を
コードデータとして保存しておき、これを複数の宛先に
対して自動ダイヤルして、しかも音声データに変換して
回報通知することができる。従って次のような効果を奏
することができる。[Effects of the Invention] As explained above, according to the present invention, text to be notified can be saved as code data, automatically dialed to multiple destinations, converted into voice data, and sent back. Can be notified. Therefore, the following effects can be achieved.
即ち、通知すべき文章の情報をコードデータとして保存
し、これを音声データに変換して出力するので、音声デ
ータを直接保存する場合に比較して小容量のメモリを有
効に利用して文章情報を蓄積することができる。また音
声データに比較してフードデータの編集が容品であるか
ら、通知すべき文章の作成・編集作業を簡易に行なうこ
とができる。In other words, the information on the text to be notified is saved as code data, converted to audio data and output, so compared to the case where audio data is directly saved, the small memory capacity can be used more effectively and text information can be stored. can be accumulated. Furthermore, since food data can be edited more easily than voice data, it is possible to easily create and edit text to be notified.
また上述したようにして音声により文章情報の通知を行
なうので、一般的な電話端末を有効に利用してその通知
処理を行なうことが可能である。Furthermore, since text information is notified by voice as described above, it is possible to carry out the notification process by effectively utilizing a general telephone terminal.
換言すれば、通知処理の為の情報の通知対象者の全てに
ワークステーションや特殊な情報処理端末を設置する必
要がない等の効果が奏せられる。In other words, it is not necessary to install workstations or special information processing terminals for all the persons to whom information is to be notified for notification processing.
故に、例えばオフィスにおける各種の通知業務の自動化
を図り、省力化を図ることが可能となる。Therefore, for example, it is possible to automate various notification tasks in an office and save labor.
図は本発明の一実施例を示すもので、
第1図は本発明に係るワークステーションの特徴的な音
声通知処理機能の概略構成を示す図、第2図はワークス
テーションの概略構成図、第3図はワークステーション
に付随するICカードの外観図、第4図はICカードの
構造を示す分解斜視図、第5図はICカードのプリント
基板部の構造を示す図、第6図はICカードの半導体集
積回路部の構成を示す図、
第7図、はワークステーションにおける暗号化処理部の
構成を示す図、第8図は暗号・復号化の概念を示す図、
第9図は暗号化部の構成図、第10図は復号化部の構成
図、第11図はRSA処理部の構成図、
第12図はワークステーションにおけるイメージ照合部
の構成を示す図、第13図はイメージ処理される顔の例
を示す図、第14図はイメージ・データの構造を示す図
、
第15図はワークステーションにおけるに片認識部の構
成を示す図、第16図は入力音hパターンの例を示す図
、第17図は子音の音響的特徴を示す図、第18図は遷
移ネットワークの例を示す図、第19図は音声認識処理
の手続きを示す図、第20図は入力音声に対する部分区
間検出を説明する為の図、第21図は音声認識辞書の学
習処理手続きを示す図、
第22図はワークステーションにおける文字認識部の第
1の文字認識ブロックの構成を示す図、第23図は認識
対象となる文字が記載されるFAX送信原稿用紙の例を
示す図、第24図は認識対象文字の切出し処理を説明す
る為の図、第25図は文字認識部における第2の文字認
識ブロックの構成を示す図、
第26図はワークステーションにおける図形認識部の構
成をネオ図、第27図乃至第30図は図形認識処理を説
明する為の図、
第31図はワークステーションにおけるイメージ認識部
の構成を示す図、第32図はコード変換¥t装置の+I
′?i成図、第33図は入力イメージに対する処理例を
示す図、第34図はセグメントにおける特徴点検出を示
す図、
第゛35図はワークステーションにおける音り照合部の
構成を示す図、第36図はフィルタバンクの帯域分割例
を示す図、第37図はフィルタ特性を示す図、
第38図はワークステーションにおける音声合成部の構
成を示す図、第39図は規則合成パラメータ生成装置の
構成図、第40図は音声パラメータの変換構造を示す図
、第41図は音声合成器の構成図、
第42図はワークステーションにおけるイメージ合成部
の構成を示す図、第43図および第44図はイメージ合
成処理の概念を示す図、第45図はワークステーション
における出力形態選択部の構成を示す図、第46図は出
力形態選択処理手続きの流れを示す図、第47図は相手
局識別処理手続きの流れを示す図、第48図はメディア
変換テーブルの構造を示す図、
第49図はワークステーションにおけるデータベース部
の構成を示す図、第50図はデータベースのデータ構造
を示す図、第51図はりレーションの例を示す図、第5
2図はりレーションの構造を示す図、
第53図はコマンド対応テーブルの構造を示す図、第5
4図はワークステーションにおける作業環境データ収集
部の構成を示す図、第55図乃至第58図はコマンド部
の処理を説明する為の図、第59図はシステム習熟度の
データ収集処理の流れを示す図、第60図は習熟度表の
構造を示す図、第61図乃至第68図は作業環境データ
収集部の処理を説明する為の図、
第69図は音声通知処理を実行する制御部の構成を示す
図、第70図は音声通知処理の流れを示す図、第71図
は音声通知処理に利用されるデータベースに格納された
電話リストの構成例を示す図である。
1・・・バス、2・・・制御部、3・・・イメージ入力
装置、4・・・位置人力装置、5・・・音声入力部、6
・・・キーボード部、7・・・ICカード部、8・・・
バスコントローラ、9・・・音声出力装置、10・・・
ディスプレイ部、11・・・イメージ出力装置、12.
13・・・通信装置、14・・・切換え装置、15・・
タイマ一部、16・・・暗号化処理部、17・・・音生
照合部、18・・・イメージ照合部、19・・・音声認
慮部、20・・・音用分析部、21文字認、諜部、22
・・・図形認識部、23・・・イメージ認識部、24・
・・出力形態選択部、25・・・作業環境データ収集部
、26・・・音由合成部、27・・・イメージ合成部、
28・・・図形合成部、29・・・音声の圧縮・伸長部
、30・・・イメージの圧縮・伸長部、3I・・・信号
処理部、32・・・データベース部。
出願人代理人 弁理士 鈴江武彦
第1図
第4図
第5図
第6図
第7図
(I4vイt、)l 嘗(fV’j4c)第8
図
第10図
(鑓、k)
m II Ivl
第12図
第13図 第14図
第19図
第21図
第24図
第25図
第26図
第27図 第28図
第29図 第30図
第31図
第32図
(a)(b)
第33図
第34図
第37図 0H
第38図
! 39図 第40図
第41図
第42図
第43図
第44図
第46図
第48図
第49図
第50図
第52図
第53図
第54図
第55図
第56図
第58図
第59図
第60図
第61図
第63図
第65図
第66図
第67図
第68図The figures show one embodiment of the present invention. FIG. 1 is a diagram showing a schematic configuration of a characteristic voice notification processing function of a workstation according to the present invention, FIG. 2 is a schematic configuration diagram of a workstation, and FIG. Figure 3 is an external view of the IC card attached to the workstation, Figure 4 is an exploded perspective view showing the structure of the IC card, Figure 5 is a diagram showing the structure of the printed circuit board of the IC card, and Figure 6 is the IC card. FIG. 7 is a diagram showing the configuration of the encryption processing unit in the workstation; FIG. 8 is a diagram showing the concept of encryption/decryption;
FIG. 9 is a block diagram of the encryption section, FIG. 10 is a block diagram of the decryption section, FIG. 11 is a block diagram of the RSA processing section, FIG. 12 is a diagram showing the structure of the image matching section in the workstation, Figure 13 shows an example of a face being image-processed, Figure 14 shows the structure of image data, Figure 15 shows the configuration of a single recognition unit in a workstation, and Figure 16 shows input sound. Figure 17 is a diagram showing the acoustic characteristics of consonants, Figure 18 is a diagram showing an example of a transition network, Figure 19 is a diagram showing the procedure of speech recognition processing, and Figure 20 is a diagram showing an example of the h pattern. Figure 21 is a diagram for explaining partial interval detection for input speech, Figure 21 is a diagram showing the learning processing procedure of the speech recognition dictionary, and Figure 22 is a diagram showing the configuration of the first character recognition block of the character recognition unit in the workstation. , Fig. 23 is a diagram showing an example of a FAX transmission manuscript paper on which characters to be recognized are written, Fig. 24 is a diagram for explaining the process of cutting out characters to be recognized, and Fig. 25 is a diagram showing an example of a fax transmission manuscript paper on which characters to be recognized are written. Figure 26 is a neo diagram showing the configuration of the figure recognition block in the workstation, Figures 27 to 30 are diagrams for explaining figure recognition processing, and Figure 31 is the workstation. A diagram showing the configuration of the image recognition section in the station, Figure 32 shows the +I of the code conversion unit.
′? Fig. 33 is a diagram showing an example of processing for an input image, Fig. 34 is a diagram showing feature point detection in a segment, Fig. 35 is a diagram showing the configuration of a sound matching section in a workstation, and Fig. 36 is a diagram showing an example of processing for an input image. Figure 37 is a diagram showing an example of band division of a filter bank, Figure 37 is a diagram showing filter characteristics, Figure 38 is a diagram showing the configuration of a speech synthesis section in a workstation, and Figure 39 is a configuration diagram of a rule synthesis parameter generation device. , Fig. 40 is a diagram showing the conversion structure of audio parameters, Fig. 41 is a configuration diagram of the speech synthesizer, Fig. 42 is a diagram showing the configuration of the image synthesis section in the workstation, and Figs. 43 and 44 are images. 45 is a diagram showing the configuration of the output format selection section in the workstation, FIG. 46 is a diagram showing the flow of the output format selection processing procedure, and FIG. 47 is a diagram showing the flow of the output format selection processing procedure. Figure 48 is a diagram showing the structure of the media conversion table, Figure 49 is a diagram showing the configuration of the database section in the workstation, Figure 50 is a diagram showing the data structure of the database, and Figure 51 is a diagram showing the configuration of the database section. Figure 5 showing an example of
Figure 2 shows the structure of the ration, Figure 53 shows the structure of the command correspondence table, and Figure 5 shows the structure of the command correspondence table.
Figure 4 is a diagram showing the configuration of the work environment data collection unit in the workstation, Figures 55 to 58 are diagrams for explaining the processing of the command unit, and Figure 59 is a diagram showing the flow of the system proficiency data collection process. Figure 60 is a diagram showing the structure of the proficiency level table, Figures 61 to 68 are diagrams for explaining the processing of the work environment data collection unit, and Figure 69 is a control unit that executes voice notification processing. FIG. 70 is a diagram showing the flow of voice notification processing, and FIG. 71 is a diagram showing an example of the configuration of a telephone list stored in a database used for voice notification processing. DESCRIPTION OF SYMBOLS 1... Bus, 2... Control unit, 3... Image input device, 4... Position human power device, 5... Voice input unit, 6
...Keyboard part, 7...IC card part, 8...
Bus controller, 9...Audio output device, 10...
Display unit, 11... image output device, 12.
13...Communication device, 14...Switching device, 15...
Timer part, 16... Encryption processing unit, 17... Sound verification unit, 18... Image verification unit, 19... Voice recognition unit, 20... Sound analysis unit, 21 characters Identification, Intelligence Department, 22
...Figure recognition section, 23... Image recognition section, 24.
... Output format selection unit, 25... Working environment data collection unit, 26... Sound source synthesis unit, 27... Image synthesis unit,
28... Graphic synthesis section, 29... Audio compression/expansion section, 30... Image compression/expansion section, 3I... Signal processing section, 32... Database section. Applicant's representative Patent attorney Takehiko Suzue Figure 1 Figure 4 Figure 5 Figure 6 Figure 7
Figure 10 (Sword, k) m II Ivl Figure 12 Figure 13 Figure 14 Figure 19 Figure 21 Figure 24 Figure 25 Figure 26 Figure 27 Figure 28 Figure 29 Figure 30 Figure 31 Figure 32 (a) (b) Figure 33 Figure 34 Figure 37 0H Figure 38! Figure 39 Figure 40 Figure 41 Figure 42 Figure 43 Figure 44 Figure 46 Figure 48 Figure 49 Figure 50 Figure 52 Figure 53 Figure 54 Figure 55 Figure 56 Figure 58 Figure 59 Figure 60 Figure 61 Figure 63 Figure 65 Figure 66 Figure 67 Figure 68
Claims (3)
の送信先を指定する宛先リストを作成する手段と、この
宛先リストに記述された宛名を抽出し、データベースに
格納された電話リストから上記宛名に対応する電話番号
を求める手段と、この電話リストから検索された電話番
号に従って自動ダイヤルする手段と、前記宛先リストで
指定された文書データを抽出して音声合成する手段と、
この音声合成された音声データを前記自動ダイヤルされ
た電話端末に送信する手段とを具備したことを特徴とす
る音声通知装置。(1) A means for storing and storing document data, a means for creating a destination list for specifying the document to be sent and its destination, and a means for extracting the destinations written in this destination list and selecting the above from a telephone list stored in a database. means for obtaining a telephone number corresponding to the addressee; means for automatically dialing according to the telephone number retrieved from the telephone list; means for extracting document data specified in the addressee list and performing speech synthesis;
A voice notification device comprising: means for transmitting the synthesized voice data to the automatically dialed telephone terminal.
て作成され、データベースに保存されたものである特許
請求の範囲第1項記載の音声通知装置。(2) The voice notification device according to claim 1, wherein the document data is created according to input character code information and stored in a database.
宛名にそれぞれ対応した電話番号に対して順次行われる
ものである特許請求の範囲第1項記載の音声通知装置。(3) The audio notification device according to claim 1, wherein automatic dialing is performed sequentially to telephone numbers corresponding to each of a plurality of recipients written in the recipient list.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61230056A JPS6386658A (en) | 1986-09-30 | 1986-09-30 | Voice informing equipment |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61230056A JPS6386658A (en) | 1986-09-30 | 1986-09-30 | Voice informing equipment |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS6386658A true JPS6386658A (en) | 1988-04-18 |
Family
ID=16901866
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP61230056A Pending JPS6386658A (en) | 1986-09-30 | 1986-09-30 | Voice informing equipment |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS6386658A (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02268552A (en) * | 1989-04-11 | 1990-11-02 | Energy Support Corp | Data communication equipment |
JPH02309860A (en) * | 1989-05-25 | 1990-12-25 | Energy Support Corp | Data communication equipment |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS57185535A (en) * | 1981-05-12 | 1982-11-15 | Canon Inc | Character processor |
JPS61157137A (en) * | 1984-12-28 | 1986-07-16 | Foster Denki Kk | Telephone book display system in composite multi-function terminal equipment |
JPS61187451A (en) * | 1985-02-15 | 1986-08-21 | Nippon Telegr & Teleph Corp <Ntt> | Document communication terminal device |
-
1986
- 1986-09-30 JP JP61230056A patent/JPS6386658A/en active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS57185535A (en) * | 1981-05-12 | 1982-11-15 | Canon Inc | Character processor |
JPS61157137A (en) * | 1984-12-28 | 1986-07-16 | Foster Denki Kk | Telephone book display system in composite multi-function terminal equipment |
JPS61187451A (en) * | 1985-02-15 | 1986-08-21 | Nippon Telegr & Teleph Corp <Ntt> | Document communication terminal device |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02268552A (en) * | 1989-04-11 | 1990-11-02 | Energy Support Corp | Data communication equipment |
JPH02309860A (en) * | 1989-05-25 | 1990-12-25 | Energy Support Corp | Data communication equipment |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPS63223965A (en) | Intellectual work station | |
US11580971B2 (en) | Photo album management method, storage medium and electronic device | |
KR20190066537A (en) | Photograph sharing method, apparatus and system based on voice recognition | |
US20230298564A1 (en) | Speech synthesis method and apparatus, device, and storage medium | |
JPS6386655A (en) | Meida converting system | |
JPS63276672A (en) | Intelligent work station | |
CN109817223A (en) | Phoneme marking method and device based on audio fingerprints | |
Thennattil et al. | Phonetic engine for continuous speech in Malayalam | |
JPS6386658A (en) | Voice informing equipment | |
JPS6386652A (en) | Telephone incoming call information offering system | |
JPS6386648A (en) | Preferential telephone system | |
JPS6385964A (en) | Schedule display system | |
JPS6385934A (en) | Intelligent work station | |
JP2582356B2 (en) | Facsimile communication system | |
JPS6385968A (en) | Schedule informing system | |
JPH06187351A (en) | Schedule management system | |
JPS6386947A (en) | Work station | |
JPS6386647A (en) | Automatic call transfer telephone system | |
JPS6385963A (en) | Conference arranging system | |
JPS6386944A (en) | Inteligent work station | |
JPS6386646A (en) | Work station | |
JPS6386662A (en) | Fax male system | |
JPS6385966A (en) | Intelligent work station | |
JPS6385979A (en) | File retrieving device | |
JPS6385929A (en) | File retriever |