JPH04208758A - Image filing device - Google Patents

Image filing device

Info

Publication number
JPH04208758A
JPH04208758A JP2400055A JP40005590A JPH04208758A JP H04208758 A JPH04208758 A JP H04208758A JP 2400055 A JP2400055 A JP 2400055A JP 40005590 A JP40005590 A JP 40005590A JP H04208758 A JPH04208758 A JP H04208758A
Authority
JP
Japan
Prior art keywords
section
image
voice
facsimile
phoneme
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2400055A
Other languages
Japanese (ja)
Inventor
Kunio Akiba
秋場国夫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2400055A priority Critical patent/JPH04208758A/en
Publication of JPH04208758A publication Critical patent/JPH04208758A/en
Pending legal-status Critical Current

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Storing Facsimile Image Data (AREA)
  • Processing Or Creating Images (AREA)

Abstract

PURPOSE:To facilitate the registration of images from a remote place by providing a facsimile signal receiving means, a means for recognizing the voices from circuit and a means for recording the result of voice recognition as code data in the image filing device. CONSTITUTION:A voice synthesizing section 29 outputs a voice synthesis signal to a circuit output section 36. A sound synthesizing section 20 and a parameter extracting section 21 starts the analysis of input voices and the extraction of parameters. A voice section detecting section 22 detects voice sections from the results thereof. A phoneme segmentation section 23 detects phoneme boundaries and identifies the phonemes of the phoneme sections. A word matching section 28 obtains the results of word recognition. The results of the recognition are recorded in the form of the code data as document retrieval keywords. After all the necessary keywords are inputted, facsimile transmission is requested by the synthesized sounds from the voice synthesizing section 29. A facsimile receiving section 30, thereafter, receives the facsimile signals from the circuits and an image decoding section 31 stores the received signals into an image memory 32.

Description

【発明の詳細な説明】[Detailed description of the invention]

[0001] [0001]

【産業上の利用分野】本発明は画像ファイリング装置時
;こ光ディスク等の大容量の記録媒体を用いた画像ファ
イノング装置に関するものである。 [0002]
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an image filing apparatus; this invention relates to an image filing apparatus using a large capacity recording medium such as an optical disk. [0002]

【従来の技術】従来の画像ファイリング装置の構成例を
図3に示す。この図において、符号1は画像ファイリン
グ装置全体の動作をコントロールするメインCPU、2
は記録媒体であるハードディスクへの書き込み読み出し
動作を制御するハードディスクコントロール部、3は記
録媒体である光ディスクへの書き込み読み出し動作を制
御する光デイスクコントロール部、4は画像データを格
納するための画像メモリ、5はイメージデータを圧縮、
伸長するイメージ変換部である。また、符号6は画像入
力動作をコントロールするスキャナコントロール部、7
は印字動作をコントロールするプリンタコントロール部
であり、8はイメージデータが展開されるフレームメモ
リ、9はファクシミリ通信に必要な各種動作をコントロ
ールするファクシミリ通信コントロール部である。さら
に符号10はメインCPUIと各動作部との間に接続さ
れ各種コマンドデータや管理データが送られるシステム
バス、11はメインCPUIと各種動作部との間でイメ
ージデータが送受されるイメージバス、12はデータが
格納されるハードディスク、13は光デイスクコントロ
ール部3によって制御される光ディスク、14は画像を
入力するイメージスキャナ、15は画像を印字するプリ
ンタ、16は画像を表示するデイスプレィ装置であるC
RT、17はファクシミリ通信用のデータが送られる公
衆回線、18はメインCPUIに各種コマンド等が入力
されるキーボードである。 [0003]このような画像ファイリング装置において
、登録しようとする画像はイメージスキャナ14にて読
み取られ、−旦画像メモリ4に記憶される。その後イメ
ージ変換部5にて圧縮符号化されて光デイスクコントロ
ール部3の制御のもと光ディスク13に記録される。 一方、この画像を検索するに必要なキーワードや文書名
はキーボード18から入力されハードディスク12、ま
たは光デイスク13上に記録される。この光ディスク1
3に登録されている画像を検索する場合は、キーボード
18から入力されたキーワードや文書名に基づき、メイ
ンCPUIはハードディスク12上のデータベースを構
成するファイルから光デイスク13上の目的の画像のア
ドレスを検索する。そして、このアドレスデータに対応
するイメージデータを、光デイスクコン1へロール部3
の制御下において画像メモリ4に読み出し、イメージ変
換部5で伸長復号化し、フレームメモリ8に転送してC
RT16に表示する。 [0004]
2. Description of the Related Art An example of the configuration of a conventional image filing device is shown in FIG. In this figure, reference numeral 1 is a main CPU that controls the operation of the entire image filing device;
3 is a hard disk control unit that controls writing and reading operations to a hard disk that is a recording medium; 3 is an optical disk control unit that controls writing and reading operations to and from an optical disk that is a recording medium; 4 is an image memory for storing image data; 5 compresses image data,
This is an image converter that decompresses. Further, reference numeral 6 denotes a scanner control unit for controlling image input operation;
Reference numeral 8 designates a printer control unit that controls printing operations, 8 a frame memory in which image data is developed, and 9 a facsimile communication control unit that controls various operations necessary for facsimile communication. Further, reference numeral 10 is a system bus connected between the main CPUI and each operation section and through which various command data and management data are sent; 11 is an image bus through which image data is sent and received between the main CPUI and various operation sections; 12 13 is a hard disk in which data is stored; 13 is an optical disk controlled by the optical disk controller 3; 14 is an image scanner for inputting images; 15 is a printer for printing images; and 16 is a display device for displaying images.
RT, 17 is a public line through which data for facsimile communication is sent, and 18 is a keyboard through which various commands are input to the main CPUI. [0003] In such an image filing device, an image to be registered is read by an image scanner 14 and then stored in an image memory 4. The image is then compressed and encoded by the image converter 5 and recorded on the optical disc 13 under the control of the optical disc controller 3. On the other hand, keywords and document names necessary to search for this image are input from the keyboard 18 and recorded on the hard disk 12 or optical disk 13. This optical disc 1
3, the main CPU searches for the address of the desired image on the optical disk 13 from the files that make up the database on the hard disk 12 based on the keywords and document names entered from the keyboard 18. search for. Then, the image data corresponding to this address data is transferred to the optical disk controller 1 by the roll unit 3.
Under the control of C
Display on RT16. [0004]

【発明が解決しようとする課題】しかしながら、このよ
うな従来の画像ファイリング装置にあっては、画像入力
手段としてイメージスキャナ14が使用されているため
、何等かの通信手段を用いなければ遠隔地からの登録は
できなかった。そこで、通信手段としてファクシミリ装
置などが用いられるが、この装置によって通信するとな
ると、−旦ファクシミリ受信装置にてイメージデータを
受信した後、あらためてその画像はイメージスキャナ1
4から読み込み、また検索キーワードや文書名はキーボ
ードから入力しなければならないという不具合があった
。 [00051本発明は前記問題点に鑑みてなされたもの
で、その目的は、遠隔地からの画像の登録を容易に行な
い得るようにした画像ファイリング装置を提供すること
である。 [0006]
[Problems to be Solved by the Invention] However, in such a conventional image filing device, since the image scanner 14 is used as an image input means, it is difficult to access the image from a remote location without using some kind of communication means. could not be registered. Therefore, a facsimile device or the like is used as a communication means, but when communicating with this device, the image data is first received by the facsimile receiving device, and then the image is transferred to the image scanner 1.
4, and search keywords and document names had to be entered from the keyboard. [00051] The present invention has been made in view of the above-mentioned problems, and an object thereof is to provide an image filing device that can easily register images from a remote location. [0006]

【課題を解決するための手段】本発明は前記目的を達成
するために、画像ファイリング装置に、ファクシミリ受
信手段と、回線からの音声信号を認識する手段と、音声
認識結果をコードデータとして記録する手段とを備えた
ことを要旨とする。 [0007]
[Means for Solving the Problems] In order to achieve the above object, the present invention includes a facsimile receiving means, a means for recognizing a voice signal from a line, and a means for recording a voice recognition result as code data in an image filing device. The gist is that it has the means. [0007]

【作用】前記構成により、遠隔地から文書を登録する際
に、ファクシミリ受信手段によりイメージデータは自動
的に光ディスクに記録され、またキーワードや文書番号
などの検索情報は、予め電話等の音声認識手段に入力す
ることで登録時に送信側と受信側の操作を切り離すこと
ができる。このため、登録時における受信側の操作を不
要にでき、遠隔地からの登録を容易に行なえる。 [0008]
[Operation] With the above configuration, when registering a document from a remote location, the image data is automatically recorded on the optical disk by the facsimile receiving means, and search information such as keywords and document numbers can be retrieved in advance by voice recognition means such as a telephone. By entering this, you can separate the operations on the sending and receiving sides during registration. Therefore, no operation is required on the receiving side at the time of registration, and registration can be easily performed from a remote location. [0008]

【実施例】以下、図面を参照しながら本発明の詳細な説
明する。図1は本発明による画像ファイリング装置の一
実施例を示すブロック図である。この図中、符号20は
音声認識用パラメータを抽出するための音響分析部であ
り、この音響分析部20には、例えばフィルターバンク
やLPG分析装置が用いられる。符号21は音声認識パ
ラメータ抽出部であり、パワー成分、母音性成分、子音
性成分、有声音成分、無声音成分などの各種パラメータ
を抽出する機能を持つ。22は音声区間検出部であリ、
語頭、語尾を検出する機能を持つ。23は音素セグメン
テーション部であり、抽出されたパラメータから音素境
界を検出する。符号24は各種パラメータで表された音
素標準パターンが格納される音素標準パターン格納部、
25は標準パターン格納部24に格納された標準パター
ンとの類似度から、各音素セグメントにおける音素を識
別する音素識別部である。符号26は音素記号で表記さ
れた単語辞書、27は単語辞書中の各音素がどのような
音素に識別され易いかを示すコンフユージヨンマトリッ
クス、28は識別された各音素と単語辞書とのマツチン
グをとる単語マツチング部である。また、符号29は遠
隔地の登録操作者に次の入力を促すための音声合成部、
30はファクシミリ受信部、31は受信した信号をイメ
ージデータに復号化する画像復号部、32は復号化した
イメージデータを記録する画像メモリである。33は音
声認識結果をキーワードとして記録するためのデータ管
理部、34はイメージデータとキーワードを記録するた
めの光デイスク装置である。35は公衆回線からの信号
を入力する回線入力部であり、36は公衆回線へ信号を
出力する回線出力部である。 [0009]かかる構成を有する画像ファイリング装置
の動作について説明する。図2は文書登録動作の一実行
例を示すフローチャートである。この図において、まず
回線入力部35が接続されると(ステップ41)、音声
合成部29は相手に対してキーワードの発生を促すため
音声合成信号を回線出力部36に出力する(ステップ4
2)。次に、音響分析部20、パラメータ抽出部21は
ただちに入力音声の分析およびパラメータの抽出を開始
しくステップ43)、その結果から音声区間検出部22
は音声区間を検出しくステップ44)、音素セグメンテ
ーション部23は音素境界を検出し音素区間の音素を識
別する(ステップ45)。次いで、単語マツチング部2
8は、前記識別された音素系列と、単語辞書26との間
でコンフユージヨンマトリックス27を考慮した類似度
計算を行ない、単語認識結果を得る(ステップ46)。 この認識結果は単語マツチング部28からデータベース
管理部33へ転送され文書検索キーワードとしてコード
データの形で記録される(ステップ47)。単語マツチ
ング部28は、前記データベース管理部33に記録され
た文書検索キーワードが必要なキーワード群の最後かど
うかを判断しくス テップ48)、さらに必要ならば音
声合成部29に指示し、次のキーワードの発生を合成音
により促す(ステップ49)。このようにして、必要な
キーワードがすべて入力された後、音声合成部29から
の合成音でファクシミリ送信を依頼する(ステップ50
)。その後、ファクシミリ受信部30はただちに受信状
態に入り、回線からのファクシミリ信号を受信し、画像
復号部31は受信した信号をイメージデータとして復号
化し、画像メモリ32に格納する(ステップ51)。 そして最後に、この画像メモリ32の上のイメージデー
タとデータベース管理部33のデータを光ディスク34
に登録しくステップ52)、登録シーケンスを終了する
。 [00101 【発明の効果]以上説明したように本発明によれば、イ
メージデータはファクシミリ受信手段により、自動的に
光ディスクに記録登録される。このため、改めて、イメ
ージスキャナによって画像を読み取りイメージデータを
入力する必要はない。また、文書名や検索キーワード情
報は、音声認識手段によりコードデータとして登録する
ことができ、送信側の操作と受信側の操作とを切り離す
ことができる。このため登録時に受信側の操作を不要に
することができ、遠隔地からの登録を簡単にすることが
できる。
DESCRIPTION OF THE PREFERRED EMBODIMENTS The present invention will be described in detail below with reference to the drawings. FIG. 1 is a block diagram showing an embodiment of an image filing device according to the present invention. In this figure, reference numeral 20 is an acoustic analysis section for extracting speech recognition parameters, and for this acoustic analysis section 20, for example, a filter bank or an LPG analysis device is used. Reference numeral 21 denotes a speech recognition parameter extraction unit, which has a function of extracting various parameters such as a power component, a vowel component, a consonant component, a voiced component, and an unvoiced component. 22 is a voice section detection unit;
It has a function to detect the beginning and end of a word. 23 is a phoneme segmentation unit that detects phoneme boundaries from the extracted parameters. Reference numeral 24 denotes a phoneme standard pattern storage unit in which phoneme standard patterns expressed by various parameters are stored;
25 is a phoneme identification unit that identifies phonemes in each phoneme segment based on the degree of similarity with the standard pattern stored in the standard pattern storage unit 24. Reference numeral 26 is a word dictionary expressed in phoneme symbols, 27 is a conflation matrix showing what kind of phoneme each phoneme in the word dictionary is likely to be identified with, and 28 is a matching between each identified phoneme and the word dictionary. This is a word matching section that takes Further, reference numeral 29 is a voice synthesis unit for prompting a registered operator at a remote location to input the next input;
30 is a facsimile receiving section, 31 is an image decoding section that decodes the received signal into image data, and 32 is an image memory that records the decoded image data. 33 is a data management unit for recording voice recognition results as keywords, and 34 is an optical disk device for recording image data and keywords. 35 is a line input section for inputting signals from the public line, and 36 is a line output section for outputting signals to the public line. [0009] The operation of the image filing device having such a configuration will be explained. FIG. 2 is a flowchart showing an example of the document registration operation. In this figure, first, when the line input section 35 is connected (step 41), the speech synthesis section 29 outputs a speech synthesis signal to the line output section 36 in order to prompt the other party to generate a keyword (step 4).
2). Next, the acoustic analysis section 20 and the parameter extraction section 21 immediately start analyzing the input speech and extracting parameters (step 43), and based on the results, the speech section detection section 22
The phoneme segmentation unit 23 detects a phoneme interval (step 44), and the phoneme segmentation unit 23 detects a phoneme boundary and identifies the phoneme in the phoneme interval (step 45). Next, word matching section 2
Step 8 calculates the degree of similarity between the identified phoneme sequence and the word dictionary 26 in consideration of the confusion matrix 27 to obtain a word recognition result (step 46). This recognition result is transferred from the word matching unit 28 to the database management unit 33 and recorded as a document search keyword in the form of code data (step 47). The word matching unit 28 determines whether the document search keyword recorded in the database management unit 33 is the last of the required keyword group (Step 48), and if necessary, instructs the speech synthesis unit 29 to select the next keyword. The generation of is prompted by a synthesized sound (step 49). After all the necessary keywords have been input in this way, a request for facsimile transmission is made using synthesized speech from the speech synthesis section 29 (step 50).
). Thereafter, the facsimile receiving section 30 immediately enters a receiving state and receives a facsimile signal from the line, and the image decoding section 31 decodes the received signal as image data and stores it in the image memory 32 (step 51). Finally, the image data on the image memory 32 and the data in the database management section 33 are transferred to the optical disk 34.
Step 52), the registration sequence ends. [00101] Effects of the Invention As described above, according to the present invention, image data is automatically recorded and registered on an optical disc by the facsimile receiving means. Therefore, there is no need to read the image using the image scanner and input the image data again. Further, the document name and search keyword information can be registered as code data by voice recognition means, and operations on the sending side and operations on the receiving side can be separated. Therefore, it is possible to eliminate the need for operation on the receiving side at the time of registration, and it is possible to simplify registration from a remote location.

【図面の簡単な説明】[Brief explanation of the drawing]

【図1】本発明による画像ファイリング装置の一実施例
を示すブロック図
FIG. 1 is a block diagram showing an embodiment of an image filing device according to the present invention.

【図2】前記実施例における文書登録動作の一例を示す
フローチャート
FIG. 2 is a flowchart showing an example of document registration operation in the embodiment.

【図3】画像ファイリング装置の一従来例を示すブロッ
ク図
[Fig. 3] Block diagram showing a conventional example of an image filing device

【符号の説明】[Explanation of symbols]

20 音響分析部 21 パラメータ抽出部 22 音声区間検出部 23 音素セグメンテーション部 24 音素標準パターン格納部 25 音素識別部 26 単語辞書 27 コンフユージヨンマトリックス 28 単語マツチング部29 音声合成部30 ファク
シミリ送信部31 画像復号部32 画像メモリ33デ
ータベース管理部34 光デイスク装置35 回線入力
部36 回線出力部
20 Acoustic analysis section 21 Parameter extraction section 22 Speech interval detection section 23 Phoneme segmentation section 24 Phoneme standard pattern storage section 25 Phoneme identification section 26 Word dictionary 27 Confusion matrix 28 Word matching section 29 Speech synthesis section 30 Facsimile transmission section 31 Image decoding Section 32 Image memory 33 Database management section 34 Optical disk device 35 Line input section 36 Line output section

【図1】[Figure 1]

【図3】[Figure 3]

Claims (3)

【特許請求の範囲】[Claims] 【請求項1】画像データを受信するファクシミリ受信手
段と、このファクシミリ受信手段により受信したデータ
を蓄積するための記録媒体と、回路からの音声信号を入
力する手段と、音声認識手段と、音声認識結果をコード
データとして記録する手段とを有する画像ファイリング
装置。
1. A facsimile receiving means for receiving image data, a recording medium for storing data received by the facsimile receiving means, a means for inputting a voice signal from a circuit, a voice recognition means, and a voice recognition device. An image filing device having means for recording results as code data.
【請求項2】音声認識結果の情報は、前記画像データの
検索キーワードに関する事項である請求項1記載の画像
ファイリング装置。
2. The image filing device according to claim 1, wherein the information on the voice recognition result is information related to a search keyword for the image data.
【請求項3】記録媒体は光ディスクである請求項1記載
の画像ファイリング装置。
3. The image filing device according to claim 1, wherein the recording medium is an optical disc.
JP2400055A 1990-12-01 1990-12-01 Image filing device Pending JPH04208758A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2400055A JPH04208758A (en) 1990-12-01 1990-12-01 Image filing device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2400055A JPH04208758A (en) 1990-12-01 1990-12-01 Image filing device

Publications (1)

Publication Number Publication Date
JPH04208758A true JPH04208758A (en) 1992-07-30

Family

ID=18509972

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2400055A Pending JPH04208758A (en) 1990-12-01 1990-12-01 Image filing device

Country Status (1)

Country Link
JP (1) JPH04208758A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0787286A (en) * 1993-06-30 1995-03-31 Ricoh Co Ltd Picture forming device

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0787286A (en) * 1993-06-30 1995-03-31 Ricoh Co Ltd Picture forming device

Similar Documents

Publication Publication Date Title
JPH02204827A (en) Report generation apparatus and method
JPS63223965A (en) Intellectual work station
JPH10274997A (en) Document reading-aloud device
KR950015131A (en) Information access system and recording medium
US20020082841A1 (en) Method and device for processing of speech information
JP2002132287A (en) Speech recording method and speech recorder as well as memory medium
JP2849504B2 (en) Automatic reading device
JPS6386655A (en) Meida converting system
US6212499B1 (en) Audible language recognition by successive vocabulary reduction
JPH04208758A (en) Image filing device
JPH0965176A (en) Prompter device
JPH10274999A (en) Document reading-aloud device
JP2612030B2 (en) Text-to-speech device
JP2000315097A (en) Electronic equipment, its controlling method and recording medium
JPS6386652A (en) Telephone incoming call information offering system
JP2002099294A (en) Information processor
JP2001042883A (en) Text speech synthesis apparatus
JPH05314302A (en) Automatic reading-out reader
JPS6386648A (en) Preferential telephone system
JPH05313684A (en) Voice reading device
JP2003173196A (en) Method and apparatus for synthesizing voice
JPS62113264A (en) Speech document creating device
JPH0535441A (en) Automatic document preparing device
JPH1153163A (en) Voice message memorandum device
JPS6386947A (en) Work station