JPH04199366A - Picture processor - Google Patents

Picture processor

Info

Publication number
JPH04199366A
JPH04199366A JP2332991A JP33299190A JPH04199366A JP H04199366 A JPH04199366 A JP H04199366A JP 2332991 A JP2332991 A JP 2332991A JP 33299190 A JP33299190 A JP 33299190A JP H04199366 A JPH04199366 A JP H04199366A
Authority
JP
Japan
Prior art keywords
voice
information
title
operator
microphone
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2332991A
Other languages
Japanese (ja)
Inventor
Hideaki Kagawa
香川 英明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2332991A priority Critical patent/JPH04199366A/en
Publication of JPH04199366A publication Critical patent/JPH04199366A/en
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

PURPOSE:To realize operation using the auditory sense of an operator too together with his visual sense by recording and reproducing voice information related to information in question together with picture information. CONSTITUTION:An analog voice like a title, etc., inputted from a microphone 20 is amplified by a microphone amplifier 21, and is converted into a digital voice data by an A/D converter 22, and is inputted to a recording/reproducing control part 23. Here, this voice data is transferred to an optical disk device 8 by the control part 23 and the voice data is recorded together with the corresponding picture data. At the time of retrieval, the operator inputs the title of the document (picture information) desired to retrieve by a voice from the microphone 20, and the digitized voice is sent to a voice recognizing part 24 through the control part 23, and here, it is analyzed, and is converted into a title code for the retrieval. Then, the desired document is searched from the optical disk device 8 on the basis of this title code, and is displayed by a display 12. Thus, the auditory sense of the operator too is used together with his visual sense.

Description

【発明の詳細な説明】 [発明の目的コ (産業上の利用分野) この発明は、音声認識機能を持つ画像処理装置に関し、
特に、光ファイリングシステムにおいて音声情報を画像
情報とともに記録・再生し音声情報で画像情報の検索を
可能にした画像処理装置に関する。
[Detailed Description of the Invention] [Purpose of the Invention (Field of Industrial Application) This invention relates to an image processing device having a voice recognition function,
In particular, the present invention relates to an image processing device that records and reproduces audio information together with image information in an optical filing system, and makes it possible to search for image information using audio information.

(従来の技術) 従来の光ファイリングシステムに利用される画像処理装
置では 記録・再生される情報は文字やビットマツプパ
ターン等の目で判別する視覚情報が主であり、システム
オペレータの聴覚は有効利用されていない。
(Conventional technology) In image processing devices used in conventional optical filing systems, the information recorded and reproduced is mainly visual information that can be discerned by the eye, such as characters and bitmap patterns, and the system operator's sense of hearing cannot be used effectively. It has not been.

(解決しようとする課題) 上記画像処理装置では、 システムオペレータの目の疲
れから、長時間のシステム運用中に、複雑な情報の誤認
識 誤入力が生じやすい、 またキーボードのブライン
ドタッチができない初心者にはタイトル等の所定項目の
入力が煩わしい作業になる。 さらに、 このような装
置は、 目の不自由な人あるいは手に障害のある人には
操作できない。
(Problem to be solved) The above image processing device is prone to erroneous recognition and input of complex information during long system operation due to eye fatigue of system operators, and also to beginners who cannot blindly touch the keyboard. Inputting predetermined items such as title becomes a cumbersome task. Furthermore, such devices cannot be operated by people who are blind or have hand disabilities.

この発明の目的は、画像情報とともにこの情報に関する
音声情報を記録 再生することにより、オペレータの視
覚とともに聴覚も利用して運用可能な画像処理装置を提
供することである。
An object of the present invention is to provide an image processing apparatus that can be operated by using the operator's sense of sight and hearing by recording and reproducing sound information related to this information together with image information.

[発明の構成] (発明の課題を達成するための手段) 上記目的を達成するために、 この発明の画像処理装置
は、画像情報を記録 再生する手段と、前記画像情報に
関連した音声情報をこの画像情報とともに記録・再生す
る手段とを備えている。この装置は、前記音声情報によ
り前記画像情報を検索できるように構成されている。
[Structure of the Invention] (Means for Achieving the Problems of the Invention) In order to achieve the above object, an image processing device of the present invention includes means for recording and reproducing image information, and audio information related to the image information. It also includes means for recording and reproducing the image information. This device is configured to be able to search for the image information using the audio information.

(作用) 上記画像処理装置において、 オペレータは、各画像情
報のタイトル等を入力する際、キーボードからキャラク
タコードを打ち込むとともに、若しくはこのキーボード
打ち込みの代わりに、マイクからタイトル等を音声入力
する。 この音声データは例えばA/D変換され 対応
する画像情報とともに光ディスク等に格納される。
(Function) In the above image processing apparatus, when inputting the title, etc. of each image information, the operator inputs a character code from the keyboard, or instead of inputting the keyboard, inputs the title, etc. by voice from the microphone. This audio data is, for example, A/D converted and stored on an optical disk or the like along with corresponding image information.

後に上記画像情報を検索する場合、オペレータはキーボ
ードから検索情報(タイトル等)を入力する代わりに、
マイクから所望画像のタイトル等を音声入力する。する
と、装置は入力された音声情報に基づいて光ディスクか
ら対応する画像情報を捜し出す、捜し出された画像情報
は、装置のデイスプレィに表示される。 この画像情報
がその内容の説明文(キャラクタコード)を伴っている
場合は、 この説明文がスピーチシンセサイザ等によす
音声情報(デジタルデータ)に変換され、 さらに−の
音声情報がD/A変換されてスピーカから発音される。
If the operator later searches for the above image information, instead of entering the search information (title, etc.) from the keyboard,
The title of the desired image, etc. is input by voice through the microphone. Then, the device searches the optical disc for corresponding image information based on the input audio information, and the searched image information is displayed on the device's display. If this image information is accompanied by an explanatory text (character code), this explanatory text is converted into audio information (digital data) for use by a speech synthesizer, etc., and the - audio information is converted into D/A. is played from the speaker.

以上のようにオペレータの視覚とともに聴覚も利用して
システム運用を図る。
As described above, the system is operated using the operator's sense of sight and hearing.

(実施例) 第1図はこの発明の一実施例に係る画像処理装置のシス
テム構成を示すブロック図である。
(Embodiment) FIG. 1 is a block diagram showing a system configuration of an image processing apparatus according to an embodiment of the present invention.

このシステム構成において、各モジュールはシステムバ
ス1を介して互いに接続されて(する、 これらのモジ
ュールは制御部2内のCPUにより専]御される。
In this system configuration, the modules are connected to each other via a system bus 1 (these modules are exclusively controlled by the CPU in the control section 2).

通常の登録動作は、次のように行なわれる、 まずイメ
ージスキャナ5で読み込んだ画像情報(ビットマツプデ
ータ)がイメージバス3を介してページメモリ6に格納
される。ベージメモ1ノロ番二格納されたイメージデー
タは、 その後、符号イヒ/復号化装置(GODEC)
7により圧縮される。圧縮されたイメージデータはDM
Aインターフェイス4を通して光デイスク装置8(また
(ま磁気ディスク装置9)に記録される。その際、キー
ボード10またはマウス11を利用して入力されたタイ
トル等の情報も、光デイスク装置に同時記録される。
A normal registration operation is performed as follows. First, image information (bitmap data) read by the image scanner 5 is stored in the page memory 6 via the image bus 3. The image data stored in Page Memo 1 Noro No. 2 is then sent to the encoder/decoder (GODEC).
Compressed by 7. Compressed image data is DM
The information is recorded on the optical disk device 8 (or magnetic disk device 9) through the A interface 4. At this time, information such as a title input using the keyboard 10 or mouse 11 is also recorded on the optical disk device at the same time. Ru.

検索時は、例えばキーボード10から探そうとする画像
のタイトルが打ち込まれる。第1図の装置は、打ち込ま
れたタイトルをキーワードして所望の画像情報を光デイ
スク装置8から探す、捜し出された画像情報は、デイス
プレィI2に表示される。
When searching, for example, the title of the image to be searched for is entered from the keyboard 10. The apparatus shown in FIG. 1 uses the entered title as a keyword to search for desired image information from the optical disk device 8, and the searched image information is displayed on the display I2.

この実施例は、画像情報をC0DEC7により圧縮し光
デイスク装置8に記録する際、検索用のタイl、ル等を
キーボードlOから打ち込むだけではなく、 これを音
声で入力する機能を持っている。
In this embodiment, when image information is compressed by the CODEC7 and recorded on the optical disk device 8, it is possible not only to input search tiles, etc. from the keyboard 1O, but also to input them by voice.

(タイトル以外に対応画像の簡単な説明も適宜音声入力
する。) すなわち、マイク20から入力されたタイトル等のアナ
ログ音声は、マイクアンプ21で増幅され、A/D変換
器22でデジタル音声データに変換される。このデジタ
ル音声データは録音・再生制御部23に入力される。制
御部23は入力された音声データを光デイスク装置8へ
転送する。すると光デイスク装置8はこの音声データを
対応する画像情報とともに記録する。
(In addition to the title, a brief explanation of the corresponding image is also input as audio.) In other words, analog audio such as a title input from the microphone 20 is amplified by the microphone amplifier 21, and converted into digital audio data by the A/D converter 22. converted. This digital audio data is input to the recording/playback control section 23. The control unit 23 transfers the input audio data to the optical disk device 8. Then, the optical disk device 8 records this audio data together with the corresponding image information.

検索の際には、オペレータはマイク20から検索したい
文書(画像情報)のタイトルを音声入ノjする。入力さ
れたタイトル音声はA/D変換され、デジタル化された
音声は制御部23を介して音声認m部24へ送られる。
When searching, the operator speaks the title of the document (image information) to be searched through the microphone 20. The input title audio is A/D converted, and the digitized audio is sent to the audio recognition section 24 via the control section 23.

このデジタル音声の中味が音声認識部24で解析され、
検索用のタイトルコードに変換される。音声認識部24
は公知の音声認識技術により構成できる。 このタイト
ルコードに基づいて光デイスク装置8から所望の文書が
捜し出され、それがデイスプレィ12で表示される。
The content of this digital voice is analyzed by the voice recognition unit 24,
Converted to title code for search. Voice recognition section 24
can be constructed using known speech recognition technology. A desired document is retrieved from the optical disk device 8 based on this title code and displayed on the display 12.

このとき、捜し出された文書の登録時に説明文が付加さ
れていたときは、この説明文(例えばAS(、TIコー
ドを用いたローマ字)が制御部23を介して音声合成部
25に送られる1合成部25は、 送られてきたASC
IIコードのローマ字を一般的なスピーチシンセサイズ
アルゴリズムに従って音声データに変換する。変換され
た音声データは制御部23を介してD/A変換器26に
送られ、 ここでアナログ音声信号に変換される。 こ
のアナログ音声信号はパワーアンプ27で適宜増幅され
、スピーカ28に送り込まれる。 オペレータは、 こ
のスピーカから、検索された文書の内容説明を聞き取る
ことができる。
At this time, if an explanatory text was added when the found document was registered, this explanatory text (for example, AS (Roman alphabet using TI code)) is sent to the speech synthesis unit 25 via the control unit 23. 1 synthesis unit 25, the sent ASC
II code Roman letters are converted into audio data according to a general speech synthesis algorithm. The converted audio data is sent to the D/A converter 26 via the control section 23, where it is converted into an analog audio signal. This analog audio signal is appropriately amplified by a power amplifier 27 and sent to a speaker 28. The operator can hear the explanation of the retrieved document through this speaker.

なお、検索された文書が例えば楽器のカタログであると
きは、その説明文にその楽器の音色データを付加してお
くことができる。 この場合、オペレータは、その楽器
についての外設 仕様、価格等の視覚で認知できる情報
以外に、聴覚でしか認知できない音色も知る二とができ
る。
Note that when the retrieved document is, for example, a catalog of musical instruments, the tone data of the musical instrument can be added to the explanatory text. In this case, in addition to information that can be visually perceived about the instrument, such as its external specifications and price, the operator can also learn about tones that can only be perceived aurally.

[発明の効果コ この発明の画像処理装置によれば、オペレータの視覚と
ともに聴覚も利用するため、以下の効果が得られる。
[Effects of the Invention] According to the image processing apparatus of the present invention, the following effects can be obtained because the operator's auditory sense is used as well as the visual sense.

(1)キーボードのブラインドタッチができない初心者
でも楽にタイトル等の所定項目の入力ができる。
(1) Even beginners who cannot touch the keyboard blindly can easily input predetermined items such as titles.

(2)目の不自由な人あるいは手に障害のある人でも、
 口と耳が正常な人ならば操作可能になる。
(2) Even people who are visually impaired or have hand disabilities,
It can be operated by anyone with normal mouth and ears.

(3)聴覚でしか認知できないような情報(音色など)
を、 画像情報とともに扱うことができる。
(3) Information that can only be perceived by hearing (timbre, etc.)
can be handled together with image information.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図はこの発明の一実施例に係る画像処理装置の構成
を示すブロック図である。 1−m−システムバス、2−m−制御部、3−−−イメ
ージバス、4−−−DMAインターフェイス、5−一一
イメージスキャナ、6−−−ページメモリ、7−−−C
0DEC:  8−一〜光ディスク装置、9−−−磁気
ディスク装置、 10−一一キーボード、11−−−マ
ウス:I2−一一デイスプレィ、20−−−マイク、2
1−−−マイクアンプ、22−−A/D変換器、23−
−一録音・再生制御部、24−−一音声認識部、25−
−音声合成部、26−−D/A変換器、27−−−バワ
ーアンブ;28−−−スピーカ 出願人代理人 弁理士 鈴江武彦
FIG. 1 is a block diagram showing the configuration of an image processing apparatus according to an embodiment of the present invention. 1-m-system bus, 2-m-control unit, 3--image bus, 4--DMA interface, 5-11 image scanner, 6--page memory, 7--C
0DEC: 8-1~Optical disk device, 9---Magnetic disk device, 10-11 Keyboard, 11---Mouse: I2-11 Display, 20---Microphone, 2
1---Microphone amplifier, 22--A/D converter, 23-
-1 recording/playback control section, 24--1 voice recognition section, 25-
-Speech synthesis unit, 26--D/A converter, 27--Bower amplifier; 28--Speaker applicant's representative Patent attorney Takehiko Suzue

Claims (1)

【特許請求の範囲】[Claims] 画像情報を記録・再生する手段と、前記画像情報に関連
した音声情報をこの画像情報とともに記録・再生する手
段とを備え、前記音声情報により前記画像情報を検索で
きるように構成したことを特徴とする画像処理装置。
It is characterized by comprising means for recording and reproducing image information, and means for recording and reproducing audio information related to the image information together with the image information, and configured such that the image information can be searched using the audio information. image processing device.
JP2332991A 1990-11-29 1990-11-29 Picture processor Pending JPH04199366A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2332991A JPH04199366A (en) 1990-11-29 1990-11-29 Picture processor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2332991A JPH04199366A (en) 1990-11-29 1990-11-29 Picture processor

Publications (1)

Publication Number Publication Date
JPH04199366A true JPH04199366A (en) 1992-07-20

Family

ID=18261079

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2332991A Pending JPH04199366A (en) 1990-11-29 1990-11-29 Picture processor

Country Status (1)

Country Link
JP (1) JPH04199366A (en)

Similar Documents

Publication Publication Date Title
JP4558308B2 (en) Voice recognition system, data processing apparatus, data processing method thereof, and program
US5960447A (en) Word tagging and editing system for speech recognition
US6321196B1 (en) Phonetic spelling for speech recognition
US6385581B1 (en) System and method of providing emotive background sound to text
US5583965A (en) Methods and apparatus for training and operating voice recognition systems
WO2016060296A1 (en) Apparatus for recording audio information and method for controlling same
JP2849504B2 (en) Automatic reading device
JP2008032825A (en) Speaker display system, speaker display method and speaker display program
JP2897701B2 (en) Sound effect search device
JPH04199366A (en) Picture processor
JP3594359B2 (en) Information retrieval device
JP2555009B2 (en) Audio file device
JP2001215978A (en) Selection system of karaoke music by voice
JPS58154900A (en) Sentence voice converter
JPS6191698A (en) Sentence-voice converter
JPH064598A (en) Information storage retriever
JPS63316267A (en) Data base system
JPH05249995A (en) Multimedia processing device
JPS63261456A (en) Document forming device
JPH05188938A (en) Background musical sound generation device
JPH05151268A (en) Keyword medium converter
JP2002215188A (en) Speech recognition device
KR920014010A (en) Phone with voice recognition and display
JPH02196300A (en) Voice synthesis processor
JP2000322234A (en) Method and device for data preservation and recording medium with data preservation program recorded