JPH04208758A - Image filing device - Google Patents
Image filing deviceInfo
- Publication number
- JPH04208758A JPH04208758A JP2400055A JP40005590A JPH04208758A JP H04208758 A JPH04208758 A JP H04208758A JP 2400055 A JP2400055 A JP 2400055A JP 40005590 A JP40005590 A JP 40005590A JP H04208758 A JPH04208758 A JP H04208758A
- Authority
- JP
- Japan
- Prior art keywords
- section
- image
- voice
- facsimile
- phoneme
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000003287 optical effect Effects 0.000 claims description 17
- 230000015572 biosynthetic process Effects 0.000 abstract description 7
- 238000003786 synthesis reaction Methods 0.000 abstract description 7
- 230000011218 segmentation Effects 0.000 abstract description 5
- 238000000605 extraction Methods 0.000 abstract description 4
- 230000005540 biological transmission Effects 0.000 abstract description 3
- 230000002194 synthesizing effect Effects 0.000 abstract 3
- 238000007726 management method Methods 0.000 description 5
- 238000001514 detection method Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 230000006870 function Effects 0.000 description 2
- 238000013523 data management Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Storing Facsimile Image Data (AREA)
- Processing Or Creating Images (AREA)
Abstract
Description
[0001] [0001]
【産業上の利用分野】本発明は画像ファイリング装置時
;こ光ディスク等の大容量の記録媒体を用いた画像ファ
イノング装置に関するものである。
[0002]BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an image filing apparatus; this invention relates to an image filing apparatus using a large capacity recording medium such as an optical disk. [0002]
【従来の技術】従来の画像ファイリング装置の構成例を
図3に示す。この図において、符号1は画像ファイリン
グ装置全体の動作をコントロールするメインCPU、2
は記録媒体であるハードディスクへの書き込み読み出し
動作を制御するハードディスクコントロール部、3は記
録媒体である光ディスクへの書き込み読み出し動作を制
御する光デイスクコントロール部、4は画像データを格
納するための画像メモリ、5はイメージデータを圧縮、
伸長するイメージ変換部である。また、符号6は画像入
力動作をコントロールするスキャナコントロール部、7
は印字動作をコントロールするプリンタコントロール部
であり、8はイメージデータが展開されるフレームメモ
リ、9はファクシミリ通信に必要な各種動作をコントロ
ールするファクシミリ通信コントロール部である。さら
に符号10はメインCPUIと各動作部との間に接続さ
れ各種コマンドデータや管理データが送られるシステム
バス、11はメインCPUIと各種動作部との間でイメ
ージデータが送受されるイメージバス、12はデータが
格納されるハードディスク、13は光デイスクコントロ
ール部3によって制御される光ディスク、14は画像を
入力するイメージスキャナ、15は画像を印字するプリ
ンタ、16は画像を表示するデイスプレィ装置であるC
RT、17はファクシミリ通信用のデータが送られる公
衆回線、18はメインCPUIに各種コマンド等が入力
されるキーボードである。
[0003]このような画像ファイリング装置において
、登録しようとする画像はイメージスキャナ14にて読
み取られ、−旦画像メモリ4に記憶される。その後イメ
ージ変換部5にて圧縮符号化されて光デイスクコントロ
ール部3の制御のもと光ディスク13に記録される。
一方、この画像を検索するに必要なキーワードや文書名
はキーボード18から入力されハードディスク12、ま
たは光デイスク13上に記録される。この光ディスク1
3に登録されている画像を検索する場合は、キーボード
18から入力されたキーワードや文書名に基づき、メイ
ンCPUIはハードディスク12上のデータベースを構
成するファイルから光デイスク13上の目的の画像のア
ドレスを検索する。そして、このアドレスデータに対応
するイメージデータを、光デイスクコン1へロール部3
の制御下において画像メモリ4に読み出し、イメージ変
換部5で伸長復号化し、フレームメモリ8に転送してC
RT16に表示する。
[0004]2. Description of the Related Art An example of the configuration of a conventional image filing device is shown in FIG. In this figure, reference numeral 1 is a main CPU that controls the operation of the entire image filing device;
3 is a hard disk control unit that controls writing and reading operations to a hard disk that is a recording medium; 3 is an optical disk control unit that controls writing and reading operations to and from an optical disk that is a recording medium; 4 is an image memory for storing image data; 5 compresses image data,
This is an image converter that decompresses. Further, reference numeral 6 denotes a scanner control unit for controlling image input operation;
Reference numeral 8 designates a printer control unit that controls printing operations, 8 a frame memory in which image data is developed, and 9 a facsimile communication control unit that controls various operations necessary for facsimile communication. Further, reference numeral 10 is a system bus connected between the main CPUI and each operation section and through which various command data and management data are sent; 11 is an image bus through which image data is sent and received between the main CPUI and various operation sections; 12 13 is a hard disk in which data is stored; 13 is an optical disk controlled by the optical disk controller 3; 14 is an image scanner for inputting images; 15 is a printer for printing images; and 16 is a display device for displaying images.
RT, 17 is a public line through which data for facsimile communication is sent, and 18 is a keyboard through which various commands are input to the main CPUI. [0003] In such an image filing device, an image to be registered is read by an image scanner 14 and then stored in an image memory 4. The image is then compressed and encoded by the image converter 5 and recorded on the optical disc 13 under the control of the optical disc controller 3. On the other hand, keywords and document names necessary to search for this image are input from the keyboard 18 and recorded on the hard disk 12 or optical disk 13. This optical disc 1
3, the main CPU searches for the address of the desired image on the optical disk 13 from the files that make up the database on the hard disk 12 based on the keywords and document names entered from the keyboard 18. search for. Then, the image data corresponding to this address data is transferred to the optical disk controller 1 by the roll unit 3.
Under the control of C
Display on RT16. [0004]
【発明が解決しようとする課題】しかしながら、このよ
うな従来の画像ファイリング装置にあっては、画像入力
手段としてイメージスキャナ14が使用されているため
、何等かの通信手段を用いなければ遠隔地からの登録は
できなかった。そこで、通信手段としてファクシミリ装
置などが用いられるが、この装置によって通信するとな
ると、−旦ファクシミリ受信装置にてイメージデータを
受信した後、あらためてその画像はイメージスキャナ1
4から読み込み、また検索キーワードや文書名はキーボ
ードから入力しなければならないという不具合があった
。
[00051本発明は前記問題点に鑑みてなされたもの
で、その目的は、遠隔地からの画像の登録を容易に行な
い得るようにした画像ファイリング装置を提供すること
である。
[0006][Problems to be Solved by the Invention] However, in such a conventional image filing device, since the image scanner 14 is used as an image input means, it is difficult to access the image from a remote location without using some kind of communication means. could not be registered. Therefore, a facsimile device or the like is used as a communication means, but when communicating with this device, the image data is first received by the facsimile receiving device, and then the image is transferred to the image scanner 1.
4, and search keywords and document names had to be entered from the keyboard. [00051] The present invention has been made in view of the above-mentioned problems, and an object thereof is to provide an image filing device that can easily register images from a remote location. [0006]
【課題を解決するための手段】本発明は前記目的を達成
するために、画像ファイリング装置に、ファクシミリ受
信手段と、回線からの音声信号を認識する手段と、音声
認識結果をコードデータとして記録する手段とを備えた
ことを要旨とする。
[0007][Means for Solving the Problems] In order to achieve the above object, the present invention includes a facsimile receiving means, a means for recognizing a voice signal from a line, and a means for recording a voice recognition result as code data in an image filing device. The gist is that it has the means. [0007]
【作用】前記構成により、遠隔地から文書を登録する際
に、ファクシミリ受信手段によりイメージデータは自動
的に光ディスクに記録され、またキーワードや文書番号
などの検索情報は、予め電話等の音声認識手段に入力す
ることで登録時に送信側と受信側の操作を切り離すこと
ができる。このため、登録時における受信側の操作を不
要にでき、遠隔地からの登録を容易に行なえる。
[0008][Operation] With the above configuration, when registering a document from a remote location, the image data is automatically recorded on the optical disk by the facsimile receiving means, and search information such as keywords and document numbers can be retrieved in advance by voice recognition means such as a telephone. By entering this, you can separate the operations on the sending and receiving sides during registration. Therefore, no operation is required on the receiving side at the time of registration, and registration can be easily performed from a remote location. [0008]
【実施例】以下、図面を参照しながら本発明の詳細な説
明する。図1は本発明による画像ファイリング装置の一
実施例を示すブロック図である。この図中、符号20は
音声認識用パラメータを抽出するための音響分析部であ
り、この音響分析部20には、例えばフィルターバンク
やLPG分析装置が用いられる。符号21は音声認識パ
ラメータ抽出部であり、パワー成分、母音性成分、子音
性成分、有声音成分、無声音成分などの各種パラメータ
を抽出する機能を持つ。22は音声区間検出部であリ、
語頭、語尾を検出する機能を持つ。23は音素セグメン
テーション部であり、抽出されたパラメータから音素境
界を検出する。符号24は各種パラメータで表された音
素標準パターンが格納される音素標準パターン格納部、
25は標準パターン格納部24に格納された標準パター
ンとの類似度から、各音素セグメントにおける音素を識
別する音素識別部である。符号26は音素記号で表記さ
れた単語辞書、27は単語辞書中の各音素がどのような
音素に識別され易いかを示すコンフユージヨンマトリッ
クス、28は識別された各音素と単語辞書とのマツチン
グをとる単語マツチング部である。また、符号29は遠
隔地の登録操作者に次の入力を促すための音声合成部、
30はファクシミリ受信部、31は受信した信号をイメ
ージデータに復号化する画像復号部、32は復号化した
イメージデータを記録する画像メモリである。33は音
声認識結果をキーワードとして記録するためのデータ管
理部、34はイメージデータとキーワードを記録するた
めの光デイスク装置である。35は公衆回線からの信号
を入力する回線入力部であり、36は公衆回線へ信号を
出力する回線出力部である。
[0009]かかる構成を有する画像ファイリング装置
の動作について説明する。図2は文書登録動作の一実行
例を示すフローチャートである。この図において、まず
回線入力部35が接続されると(ステップ41)、音声
合成部29は相手に対してキーワードの発生を促すため
音声合成信号を回線出力部36に出力する(ステップ4
2)。次に、音響分析部20、パラメータ抽出部21は
ただちに入力音声の分析およびパラメータの抽出を開始
しくステップ43)、その結果から音声区間検出部22
は音声区間を検出しくステップ44)、音素セグメンテ
ーション部23は音素境界を検出し音素区間の音素を識
別する(ステップ45)。次いで、単語マツチング部2
8は、前記識別された音素系列と、単語辞書26との間
でコンフユージヨンマトリックス27を考慮した類似度
計算を行ない、単語認識結果を得る(ステップ46)。
この認識結果は単語マツチング部28からデータベース
管理部33へ転送され文書検索キーワードとしてコード
データの形で記録される(ステップ47)。単語マツチ
ング部28は、前記データベース管理部33に記録され
た文書検索キーワードが必要なキーワード群の最後かど
うかを判断しくス テップ48)、さらに必要ならば音
声合成部29に指示し、次のキーワードの発生を合成音
により促す(ステップ49)。このようにして、必要な
キーワードがすべて入力された後、音声合成部29から
の合成音でファクシミリ送信を依頼する(ステップ50
)。その後、ファクシミリ受信部30はただちに受信状
態に入り、回線からのファクシミリ信号を受信し、画像
復号部31は受信した信号をイメージデータとして復号
化し、画像メモリ32に格納する(ステップ51)。
そして最後に、この画像メモリ32の上のイメージデー
タとデータベース管理部33のデータを光ディスク34
に登録しくステップ52)、登録シーケンスを終了する
。
[00101
【発明の効果]以上説明したように本発明によれば、イ
メージデータはファクシミリ受信手段により、自動的に
光ディスクに記録登録される。このため、改めて、イメ
ージスキャナによって画像を読み取りイメージデータを
入力する必要はない。また、文書名や検索キーワード情
報は、音声認識手段によりコードデータとして登録する
ことができ、送信側の操作と受信側の操作とを切り離す
ことができる。このため登録時に受信側の操作を不要に
することができ、遠隔地からの登録を簡単にすることが
できる。DESCRIPTION OF THE PREFERRED EMBODIMENTS The present invention will be described in detail below with reference to the drawings. FIG. 1 is a block diagram showing an embodiment of an image filing device according to the present invention. In this figure, reference numeral 20 is an acoustic analysis section for extracting speech recognition parameters, and for this acoustic analysis section 20, for example, a filter bank or an LPG analysis device is used. Reference numeral 21 denotes a speech recognition parameter extraction unit, which has a function of extracting various parameters such as a power component, a vowel component, a consonant component, a voiced component, and an unvoiced component. 22 is a voice section detection unit;
It has a function to detect the beginning and end of a word. 23 is a phoneme segmentation unit that detects phoneme boundaries from the extracted parameters. Reference numeral 24 denotes a phoneme standard pattern storage unit in which phoneme standard patterns expressed by various parameters are stored;
25 is a phoneme identification unit that identifies phonemes in each phoneme segment based on the degree of similarity with the standard pattern stored in the standard pattern storage unit 24. Reference numeral 26 is a word dictionary expressed in phoneme symbols, 27 is a conflation matrix showing what kind of phoneme each phoneme in the word dictionary is likely to be identified with, and 28 is a matching between each identified phoneme and the word dictionary. This is a word matching section that takes Further, reference numeral 29 is a voice synthesis unit for prompting a registered operator at a remote location to input the next input;
30 is a facsimile receiving section, 31 is an image decoding section that decodes the received signal into image data, and 32 is an image memory that records the decoded image data. 33 is a data management unit for recording voice recognition results as keywords, and 34 is an optical disk device for recording image data and keywords. 35 is a line input section for inputting signals from the public line, and 36 is a line output section for outputting signals to the public line. [0009] The operation of the image filing device having such a configuration will be explained. FIG. 2 is a flowchart showing an example of the document registration operation. In this figure, first, when the line input section 35 is connected (step 41), the speech synthesis section 29 outputs a speech synthesis signal to the line output section 36 in order to prompt the other party to generate a keyword (step 4).
2). Next, the acoustic analysis section 20 and the parameter extraction section 21 immediately start analyzing the input speech and extracting parameters (step 43), and based on the results, the speech section detection section 22
The phoneme segmentation unit 23 detects a phoneme interval (step 44), and the phoneme segmentation unit 23 detects a phoneme boundary and identifies the phoneme in the phoneme interval (step 45). Next, word matching section 2
Step 8 calculates the degree of similarity between the identified phoneme sequence and the word dictionary 26 in consideration of the confusion matrix 27 to obtain a word recognition result (step 46). This recognition result is transferred from the word matching unit 28 to the database management unit 33 and recorded as a document search keyword in the form of code data (step 47). The word matching unit 28 determines whether the document search keyword recorded in the database management unit 33 is the last of the required keyword group (Step 48), and if necessary, instructs the speech synthesis unit 29 to select the next keyword. The generation of is prompted by a synthesized sound (step 49). After all the necessary keywords have been input in this way, a request for facsimile transmission is made using synthesized speech from the speech synthesis section 29 (step 50).
). Thereafter, the facsimile receiving section 30 immediately enters a receiving state and receives a facsimile signal from the line, and the image decoding section 31 decodes the received signal as image data and stores it in the image memory 32 (step 51). Finally, the image data on the image memory 32 and the data in the database management section 33 are transferred to the optical disk 34.
Step 52), the registration sequence ends. [00101] Effects of the Invention As described above, according to the present invention, image data is automatically recorded and registered on an optical disc by the facsimile receiving means. Therefore, there is no need to read the image using the image scanner and input the image data again. Further, the document name and search keyword information can be registered as code data by voice recognition means, and operations on the sending side and operations on the receiving side can be separated. Therefore, it is possible to eliminate the need for operation on the receiving side at the time of registration, and it is possible to simplify registration from a remote location.
【図1】本発明による画像ファイリング装置の一実施例
を示すブロック図FIG. 1 is a block diagram showing an embodiment of an image filing device according to the present invention.
【図2】前記実施例における文書登録動作の一例を示す
フローチャートFIG. 2 is a flowchart showing an example of document registration operation in the embodiment.
【図3】画像ファイリング装置の一従来例を示すブロッ
ク図[Fig. 3] Block diagram showing a conventional example of an image filing device
20 音響分析部
21 パラメータ抽出部
22 音声区間検出部
23 音素セグメンテーション部
24 音素標準パターン格納部
25 音素識別部
26 単語辞書
27 コンフユージヨンマトリックス
28 単語マツチング部29 音声合成部30 ファク
シミリ送信部31 画像復号部32 画像メモリ33デ
ータベース管理部34 光デイスク装置35 回線入力
部36 回線出力部20 Acoustic analysis section 21 Parameter extraction section 22 Speech interval detection section 23 Phoneme segmentation section 24 Phoneme standard pattern storage section 25 Phoneme identification section 26 Word dictionary 27 Confusion matrix 28 Word matching section 29 Speech synthesis section 30 Facsimile transmission section 31 Image decoding Section 32 Image memory 33 Database management section 34 Optical disk device 35 Line input section 36 Line output section
【図1】[Figure 1]
【図3】[Figure 3]
Claims (3)
段と、このファクシミリ受信手段により受信したデータ
を蓄積するための記録媒体と、回路からの音声信号を入
力する手段と、音声認識手段と、音声認識結果をコード
データとして記録する手段とを有する画像ファイリング
装置。1. A facsimile receiving means for receiving image data, a recording medium for storing data received by the facsimile receiving means, a means for inputting a voice signal from a circuit, a voice recognition means, and a voice recognition device. An image filing device having means for recording results as code data.
検索キーワードに関する事項である請求項1記載の画像
ファイリング装置。2. The image filing device according to claim 1, wherein the information on the voice recognition result is information related to a search keyword for the image data.
の画像ファイリング装置。3. The image filing device according to claim 1, wherein the recording medium is an optical disc.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2400055A JPH04208758A (en) | 1990-12-01 | 1990-12-01 | Image filing device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2400055A JPH04208758A (en) | 1990-12-01 | 1990-12-01 | Image filing device |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH04208758A true JPH04208758A (en) | 1992-07-30 |
Family
ID=18509972
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2400055A Pending JPH04208758A (en) | 1990-12-01 | 1990-12-01 | Image filing device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH04208758A (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0787286A (en) * | 1993-06-30 | 1995-03-31 | Ricoh Co Ltd | Picture forming device |
-
1990
- 1990-12-01 JP JP2400055A patent/JPH04208758A/en active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0787286A (en) * | 1993-06-30 | 1995-03-31 | Ricoh Co Ltd | Picture forming device |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH02204827A (en) | Report generation apparatus and method | |
JPS63223965A (en) | Intellectual work station | |
JPH10274997A (en) | Document reading-aloud device | |
KR950015131A (en) | Information access system and recording medium | |
US20020082841A1 (en) | Method and device for processing of speech information | |
JP2002132287A (en) | Speech recording method and speech recorder as well as memory medium | |
JP2849504B2 (en) | Automatic reading device | |
JPS6386655A (en) | Meida converting system | |
US6212499B1 (en) | Audible language recognition by successive vocabulary reduction | |
JPH04208758A (en) | Image filing device | |
JPH0965176A (en) | Prompter device | |
JPH10274999A (en) | Document reading-aloud device | |
JP2612030B2 (en) | Text-to-speech device | |
JP2000315097A (en) | Electronic equipment, its controlling method and recording medium | |
JPS6386652A (en) | Telephone incoming call information offering system | |
JP2002099294A (en) | Information processor | |
JP2001042883A (en) | Text speech synthesis apparatus | |
JPH05314302A (en) | Automatic reading-out reader | |
JPS6386648A (en) | Preferential telephone system | |
JPH05313684A (en) | Voice reading device | |
JP2003173196A (en) | Method and apparatus for synthesizing voice | |
JPS62113264A (en) | Speech document creating device | |
JPH0535441A (en) | Automatic document preparing device | |
JPH1153163A (en) | Voice message memorandum device | |
JPS6386947A (en) | Work station |