JP2002032386A - Method and device for data processing and recording medium recorded with program for performing the method thereon - Google Patents

Method and device for data processing and recording medium recorded with program for performing the method thereon

Info

Publication number
JP2002032386A
JP2002032386A JP2000217515A JP2000217515A JP2002032386A JP 2002032386 A JP2002032386 A JP 2002032386A JP 2000217515 A JP2000217515 A JP 2000217515A JP 2000217515 A JP2000217515 A JP 2000217515A JP 2002032386 A JP2002032386 A JP 2002032386A
Authority
JP
Japan
Prior art keywords
image information
information
image
registered
data processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000217515A
Other languages
Japanese (ja)
Inventor
Wataru Inoue
Keiichi Koike
Hiroyuki Nishi
Shinya Uegaki
渉 井上
恵一 小池
伸哉 植垣
宏之 西
Original Assignee
Nippon Telegr & Teleph Corp <Ntt>
日本電信電話株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegr & Teleph Corp <Ntt>, 日本電信電話株式会社 filed Critical Nippon Telegr & Teleph Corp <Ntt>
Priority to JP2000217515A priority Critical patent/JP2002032386A/en
Publication of JP2002032386A publication Critical patent/JP2002032386A/en
Application status is Pending legal-status Critical

Links

Abstract

PROBLEM TO BE SOLVED: To provide a data processor, which is used in a facsimile information providing system, etc., and can automatically register image information and a term that corresponds to the image information and becomes an object of voice recognition by inputting the image information, including explanation information about the image information to be registered. SOLUTION: This processor is provided with an image-analyzing part 103 for extracting the explanation information from the image information as text information, an image information storing part 106 for storing the image information, a voice recognition term storing part 107 for storing a term to be an object of voice recognition, a voice recognition term registering part 105 for storing the extracted text information in the part 107 and an image registering part 104 for storing the image information to be registered in the part 106.

Description

【発明の詳細な説明】 DETAILED DESCRIPTION OF THE INVENTION

【0001】 [0001]

【発明の属する技術分野】本発明は、画像情報の登録、 The present invention relates to the registration of the image information,
検索、出力を行うデータ処理方法および装置に関する。 Search, a data processing method and apparatus for output.

【0002】 [0002]

【従来の技術】通信網などを介して入力した画像情報を登録し、このように登録されて蓄積された画像情報を要求に応じて出力するシステムあるいはサービスとして、 Register the Related Art Image information input via a communication network, as a system or service that outputs thus be registered in response to a request the stored image information,
各種のものが実用化されている。 Various types of have been put into practical use. そのようなサービスの一つとして、例えば、ファクシミリ(FAX)情報提供サービスがある。 One such service, for example, a facsimile (FAX) information providing service.

【0003】FAX情報提供サービスにおいて、画像情報であるFAX情報(ファクシミリ画情報)を登録する方法として、FAX機器を利用しそのFAX機器からF [0003] In FAX information service, as a method of registering the FAX information is image information (facsimile image information), using the FAX machine from the FAX device F
AX情報提供を行っているシステムに対してFAXを送信することによって登録する方法や、パーソナルコンピュータ(以下、PCとする)を利用しそのPC内のファイルをFAXイメージに変換してFAXモデム経由でF A method of registering by sending a FAX to the system that performed the AX information provided, a personal computer (hereinafter referred to as PC) utilizing via FAX modem converts the files in the PC to the FAX image of F
AX情報提供システムに送信する方法などがある。 And a method of transmitting the AX information providing system.

【0004】また、FAX情報提供システムに登録したFAX情報は、一般には、FAX情報番号を入力することによって取り出せるから、FAX情報提供システムにFAX情報を登録した際には、その登録したFAX情報を指定するためのFAX情報番号も登録しなければならない。 Further, FAX information registered in the FAX information providing system is generally from taken out by entering the FAX information number, upon registering the FAX information to the FAX information providing system, a FAX information registration FAX information number for designating must also be registered. FAX情報番号の登録は、FAX機器からのPB Registration of FAX information number, PB from the FAX equipment
(プッシュボタン)信号による入力、PCからのキー入力等により行われている。 Input by (push button) signal, is performed by key input or the like from your PC.

【0005】さらに、近年では、音声認識技術を使用し、音声を入力することによって、FAX情報提供システムに登録されているFAX情報を指定できるようになってきている。 [0005] Further, in recent years, using speech recognition technology, by inputting a voice, it has come to be designated a FAX information registered in the FAX information providing system. その場合、FAX情報を登録する際に、 In that case, when you register a FAX information,
そのFAX情報と関連付けられる語彙(音声入力されたときに、音声認識によってそのFAX情報への出力要求であると認識するための語彙)をFAX情報提供システムに登録する必要がある。 (When it is speech input, the vocabulary for recognizing that the output request to the FAX information by voice recognition) that FAX information associated is the vocabulary needs to register the FAX information providing system. 従来、この語彙の登録は、P Conventional, registration of this vocabulary is, P
Cからのキー入力等により行われている。 It has been performed by a key input or the like from C.

【0006】 [0006]

【発明が解決しようとする課題】しかしながら、登録したFAX情報を指定する方法として音声認識を利用できるFAX情報提供システムでは、画像情報であるFAX [SUMMARY OF THE INVENTION However, in the FAX information providing system capable of using speech recognition as a method for specifying a FAX information registered is image information FAX
情報自体の登録と、登録したFAX情報を指定するために用いる音声認識の対象となる語彙の登録は、別個に行われる作業であり、FAX情報の提供者にとって負担となっている。 Registration information itself, subject to registration vocabulary speech recognition to be used for specifying the FAX information registered is a work to be performed separately, it has become a burden provider of FAX information.

【0007】本発明は、このような課題を解決するためのものであり、登録する画像情報に関する説明情報が含まれている画像情報を入力することにより、画像情報の登録、および音声認識の対象となる語彙の登録を自動的に行うことのできるデータ処理方法および装置を提供することを目的とする。 [0007] The present invention is intended to solve such problems, by inputting image information that contains descriptive information about the image information to be registered, the subject of the registration image information, and speech recognition and to provide a data processing method and apparatus capable of automatically registering the vocabulary becomes.

【0008】 [0008]

【課題を解決するための手段】本発明のデータ処理方法は、登録する画像情報に関する説明情報が含まれている画像情報から、登録する画像情報に関する説明情報をテキスト情報として抽出し、テキスト情報を登録する画像情報と対応付けて記録する。 Data processing method of the present invention, in order to solve the problems], from the image information contains descriptive information about the image information to be registered, and extracts descriptive information about the image information to be registered as text information, text information in association with the image information to be registered and recorded. これにより、画像情報の登録、およびその画像情報に対応し音声認識の対象となる語彙の登録を行うことを可能とする。 Thus, making it possible to perform registration of the image information, and the registration of the subject to the vocabulary of the corresponding speech recognition on the image information.

【0009】本発明のデータ処理方法においては、入力された音声に対して音声認識を行い、音声認識の結果を検索キーとして記録されている画像情報を検索する段階をさらに含むようにしてもよい。 [0009] In the data processing method of the present invention performs speech recognition on the input speech may further comprise retrieving the image information recorded the result of speech recognition as a search key. これにより、登録した画像情報を音声認識により検索することが可能となる。 Thus, it is possible to search by speech recognition image information registered.

【0010】本発明のデータ処理装置は、登録する画像情報に関する説明情報が含まれている画像情報から、登録する画像情報に関する説明情報をテキスト情報として抽出する画像解析手段と、情報を蓄積する蓄積手段と、 [0010] The data processing apparatus of the present invention, the image information contains descriptive information about the image information to be registered, and stores an image analysis means for extracting descriptive information about the image information to be registered as text information, the information storage and means,
抽出したテキスト情報を音声認識の対象となる語彙として蓄積手段に蓄積する音声認識語彙登録手段と、登録する画像情報を蓄積手段に蓄積する画像登録手段と、を有する。 It has a speech recognition vocabulary registration means for storing the extracted text information in the storage means as a vocabulary to be speech recognition, an image registration means for storing in the storage unit image information to be registered, the. これにより、画像情報の登録、およびその画像情報に対応し音声認識の対象となる語彙の登録を行うことを可能とする。 Thus, making it possible to perform registration of the image information, and the registration of the subject to the vocabulary of the corresponding speech recognition on the image information.

【0011】本発明のデータ処理装置では、入力された音声に対して音声認識を行う音声認識手段と、音声認識の結果を検索キーとして蓄積手段に蓄積されている画像情報を検索する検索手段とをさらに設けてもよい。 [0011] In the data processing apparatus of the present invention, a speech recognition means for performing speech recognition on speech input, and retrieving means for retrieving image information stored in the storage means the result of voice recognition as a search key it may be further provided. これにより、登録した画像情報を音声認識により検索することが可能となる。 Thus, it is possible to search by speech recognition image information registered.

【0012】 [0012]

【発明の実施の形態】次に、本発明の好ましい実施の形態について、図面を参照して説明する。 DESCRIPTION OF THE PREFERRED EMBODIMENTS Next, preferred embodiments of the present invention will be described with reference to the drawings.

【0013】《第1の実施の形態》図1は、本発明の第1の実施の形態のデータ処理装置の構成を示すブロック図である。 [0013] Figure 1 "First Embodiment" is a block diagram showing a configuration of a data processing apparatus according to a first embodiment of the present invention. このデータ処理装置101は、画像情報が入力する画像入力部102と、入力した画像情報を解析する画像解析部103と、入力された画像情報を登録する画像登録部104と、画像情報に関連付けられる語彙を登録する音声認識語彙登録部105と、登録された画像情報を蓄積する画像情報蓄積部106と、音声認識の対象となる登録された語彙を蓄積する音声認識語彙蓄積部107と、音声入力を受け付ける音声入力部108と、 The data processing apparatus 101 includes an image input unit 102 that the image information is input, an image analysis unit 103 for analyzing the image information inputted, an image registration unit 104 for registering the image information input, associated with the image information a speech recognition vocabulary registration unit 105 for registering a vocabulary, and the image information storage unit 106 for storing image information registered, a speech recognition vocabulary storage 107 for storing registered vocabulary subject to speech recognition, speech input a voice input unit 108 that accepts,
入力された音声に対して音声認識を行う音声認識部10 Speech recognition unit 10 for performing speech recognition on the input speech
9と、音声認識された語彙に基づいて、画像情報蓄積部106中の画像情報を検索する画像検索部110と、検索された画像情報を出力する画像出力部111とを備えている。 9, based on the vocabulary which is speech recognition, an image retrieval unit 110 to retrieve the image information in the image information storage unit 106, and an image output unit 111 for outputting the retrieved image information.

【0014】以下、図2に例示する画像情報が画像入力部102に入力した場合について、説明する。 [0014] Hereinafter, the image information shown in FIG. 2 is the case where input to the image input unit 102 will be described. 図2に例示する画像情報では、図示最上段の位置に、「Subj In the image information shown in FIG. 2, in the position shown uppermost, "Subj
ect:」(件名)と記されてその横にこの画像情報の表題にあたる文言(ここでは、「新商品」)が記され、 ect: "(subject) and marked with the title corresponding to the language of the image information next to it (in this case," new product ") is written,
その下(図示、横線より下の部分)にこの画像情報の本体部分が表現されている。 The lower (shown, portion below the horizontal line) the body portion of the image information is expressed.

【0015】図2に示す画像情報が画像入力部102に入力すると、画像解析部103は、入力された画像情報から、画像情報の説明情報をテキスト情報として抽出するとともに、説明情報以外の画像情報、あるいは説明情報を含めた画像情報を、登録する画像情報として抽出する。 [0015] When the image information shown in FIG. 2 is input to the image input unit 102, the image analysis unit 103, the image information input, extracts the description information of the image information as text information, image information other than the description information or image information including description information is extracted as the image information to be registered. テキスト情報として抽出された画像情報の説明情報は、音声認識語彙登録部105に入力され、登録する画像情報は画像情報の説明情報と対応付けられる情報とともに、画像登録部104に入力される。 Description information of the image information extracted as the text information is input to the speech recognition vocabulary registration section 105, the image information to be registered together with the information associated with the description information of the image information is input to the image registration unit 104.

【0016】ここでは、入力された画像情報の上部の「Subject:」以降について文字認識を行い、登録する画像情報の説明情報として「新商品」というテキスト情報を抽出し、この説明情報以外の画像情報を登録する画像情報として抽出するものとする。 [0016] In this case, the upper portion of the image information that has been input, "Subject:" performs character recognition for later, to extract the text information of "new product" as the description information of the image information to be registered, an image other than the description information It shall be extracted as image information for registering information. 図2に示すように画像の最上段に「Subject:」と記されその横にこの画像情報の表題にあたる文言が記されているような書式(フォーマット)は、ファクシミリ文書の書式として一般的なものであるから、画像情報の上部の「S To the top of the image as shown in FIG. 2, "Subject:" title, such as language is written corresponding to the format of the image information next to it labeled (format), the general ones as the format of the facsimile document since it is, the image information of the top "S
ubject:」を検出してその横の文字列の文字認識を行い、それを説明情報とするように、予め画像解析部103を設定しておくことができる。 Ubject: "detect and performs character recognition of the horizontal string, it like the described information, it is possible to set in advance the image analysis unit 103.

【0017】テキスト情報として説明情報が送られて来た音声認識語彙登録部105は、音声認識の対象となる語彙として、その説明情報である「新商品」を音声認識語彙蓄積部107に蓄積する。 [0017] The voice recognition vocabulary registration section 105 of the explanatory information as text information has been sent, as a vocabulary to be the object of speech recognition, to accumulate a "new product", which is its description information to the speech recognition vocabulary storage unit 107 . また、画像登録部104 The image registration unit 104
は、登録する画像情報を、画像情報の説明情報と対応づけられる情報とともに、画像情報蓄積部106に蓄積する。 The image information to be registered, together with the information to be associated with descriptive information of the image information is stored in the image information storage unit 106.

【0018】次に、音声入力部108に「新商品」という音声が入力された場合について、説明する。 [0018] Next, when the voice of "new product" is input to the speech input unit 108, will be explained.

【0019】「新商品」という音声が入力すると、音声認識部109は、入力した音声に対して音声認識を行う。 [0019] When the voice of "new product" is input, the speech recognition unit 109 performs speech recognition on the voice input. この際、音声認識語彙蓄積部107に上述のようにして登録されている語彙が、音声認識の認識候補となる。 At this time, the vocabulary that are registered as described above in the speech recognition vocabulary storage 107, a recognition candidate of the speech recognition. この例では、音声認識語彙蓄積部107に語彙として「新商品」が既に蓄積されているはずなので、「新商品」という音声認識結果が得られる。 In this example, since the supposed "new product" is already stored as vocabulary speech recognition vocabulary storage 107, the speech recognition result of "new product" is obtained. この認識結果は、 This recognition result,
画像検索部110に入力される。 It is input to the image retrieval section 110.

【0020】画像検索部110は、音声認識の結果である「新商品」に対応する画像情報を画像情報蓄積部10 [0020] The image retrieval unit 110, image information storage section 10 of the image information corresponding to the result of speech recognition "new product"
6より検索し、その検索された画像情報(この例では、 Search from 6, the retrieved image information (in this example,
図2に示した画像情報)が、画像出力部111から出力される。 Image information shown in FIG. 2) is output from the image output unit 111.

【0021】《第2の実施の形態》図3に示す本発明の第2の実施の形態のデータ処理装置は、図1に示すデータ処理装置を通信ネットワークへの接続に適合させたものである。 The data processing apparatus of the second embodiment of the present invention shown in "the second embodiment" FIG. 3 is one adapted for connection to a communication network of data processing apparatus shown in FIG. 1 . 図3において、図1と同様の構成要素には、 In Figure 3, the same components as FIG. 1,
図1におけるものと同一の参照符号を付してある。 It is denoted by the same reference numerals as those in FIG.

【0022】図3に示すデータ処理装置151は、図1 The data processing apparatus 151 shown in FIG. 3, FIG. 1
に示すデータ処理装置から画像入力部及び音声入力部を取り除き、その代わりに通信インタフェース(I/F) Removing the image input unit and the audio input unit from the data processing apparatus shown in, but instead to the communication interface (I / F)
部112を設けた構成のものである。 Part 112 is of the provided configuration. 通信インタフェース部112は、回線側からファクシミリ画信号としての画像情報と音声信号を受け取り、回線側に対して検索された画像情報をファクシミリ画信号として送出するものである。 The communication interface unit 112 receives the image information and the audio signal as a facsimile image signal from the line side, in which sends the image information retrieved for the line side as a facsimile image signal. また、データ処理装置151には、上述の通信インタフェース部112を介して、回線制御装置201 Further, the data processing apparatus 151 via the communication interface unit 112 described above, the line control apparatus 201
が接続している。 There has been connected. 回線制御装置201は、内線FAX2 The line control device 201, extension FAX2
02を収容するとともに、アナログ電話回線あるいはI 02 with accommodating the analog telephone line or I
SDNなどの回線網200に接続されている。 It is connected to the network 200, such as SDN. 回線網2 Network 2
00には、外線FAX301が接続されている。 00, the outside line FAX301 are connected. ここで、外線FAX301は、音声通話用の電話機としての機能も備えているものとする。 Here, external FAX301 shall also has a function as a telephone for voice communications.

【0023】次に、このデータ処理装置151の動作について、図4および図5に示すシーケンス図を用いて説明する。 Next, the operation of the data processing apparatus 151 will be described with reference to the sequence diagram shown in FIGS.

【0024】まず、内線FAX202から回線制御装置201を介して、データ処理装置151に対して、登録したい画像情報をファクシミリ送信する(ステップS Firstly, via the line control unit 201 from the extension FAX202, the data processing apparatus 151, the image information to facsimile transmission to be registered (step S
1)。 1). ここでは、図2に示した画像情報がデータ処理装置151にファクシミリ送信されたものとする。 Here, it is assumed that the image information shown in FIG. 2 is facsimile transmitted to the data processing unit 151. するとこの画像情報は、データ処理装置151において、通信インタフェース部112を介して画像解析部103に入力し、画像解析部103は、入力した画像情報から、画像情報の説明情報をテキスト情報として抽出するとともに、説明情報以外の画像情報または説明情報を含めた画像情報を登録する画像情報として抽出する(ステップS Then the image information, the data process unit 151, and input to the image analysis unit 103 via the communication interface unit 112, the image analysis unit 103 extracts from the input image information, the description information of the image information as text information together, it is extracted as the image information to be registered image information including image information or description information other than described information (step S
2)。 2). ここでは第1の実施の形態の場合と同様に、説明情報として「新商品」が抽出される。 Here as in the first embodiment, "new product" is extracted as the explanatory information. 説明情報「新商品」は、音声認識語彙登録部105に入力され、音声認識の対象となる語彙として、音声認識語彙登録部105 Description information "new product" is input to the speech recognition vocabulary registration section 105, as a vocabulary to be the object of speech recognition, voice recognition vocabulary registration section 105
によって、音声認識語彙蓄積部107に蓄積される(ステップS3)。 By and stored in the speech recognition vocabulary storage 107 (step S3). また、登録する画像情報は、画像登録部104に入力され、画像登録部104によって、画像情報蓄積部106に蓄積される(ステップS4)。 The image information to be registered is input to the image registration unit 104, the image registration unit 104, is stored in the image information storage unit 106 (step S4).

【0025】次に、外線FAX301側から画像情報を検索し、検索された画像情報を外線FAX301により出力する場合の処理を説明する。 Next, retrieves image information from an external FAX301 side, for explaining a process performed when the retrieved image information output by the external FAX301.

【0026】まず、外線FAX301から回線制御装置201を介して、データ処理装置151に対して電話をかける。 Firstly, from an external FAX301 via the line control unit 201, make a call to the data processing unit 151. 回線が接続された後、外線FAX301の電話機機能を使用して、「新商品」という音声を入力する(ステップS5)。 After the line is connected, using the phone function of the outside line FAX301, enter the voice of "new product" (step S5).

【0027】この音声は通信インタフェース部112を介して音声認識部109に入力し、音声認識部109 [0027] The audio input to the speech recognition unit 109 through the communication interface unit 112, the voice recognition unit 109
は、この入力された音声に対して音声認識を行う(ステップS6)。 Performs speech recognition on the input speech (step S6). このとき、音声認識語彙蓄積部107に登録されている語彙が音声認識の認識候補となるが、ここでは、第1の実施の形態の場合と同様に「新商品」という音声認識の結果が得られ、この認識結果は画像検索部110に入力される。 At this time, the vocabulary that is registered in the speech recognition vocabulary storage 107 is recognition candidates of the speech recognition, wherein the result of the speech recognition that in the same manner as in the first embodiment "new product" is obtained is, the recognition result is input to the image retrieval section 110.

【0028】画像検索部110は、音声認識の結果である「新商品」を検索キーとして、「新商品」に対応する画像情報を画像情報蓄積部106より検索する(ステップS7)。 The image retrieval unit 110 as a search key "new product" is the result of speech recognition, it searches the image information storing unit 106 the image information corresponding to the "new product" (step S7). ここで、検索キーに対応する画像情報があるかどうかを判断し(ステップS8)、そのような画像情報がない場合には、データ処理装置101は、その旨を音声ガイダンスまたはファクシミリ画情報として外線F Here, it is determined whether there is image information corresponding to the search key (step S8), and if there is no such image information, the data processing apparatus 101, external to that effect as a voice guidance or a facsimile image information F
AX301に対して送信し、処理を終了する(ステップS10)。 Transmitted to AX301, the process ends (step S10). また、ステップS8において、検索キーに対応する画像情報があった場合には、画像出力部111 Further, in step S8, when there is image information corresponding to the search key, the image output unit 111
は、検索された画像情報を外線FAX301に対してファクシミリ送信し(ステップS11)、その後、ステップS10において、データ処理装置101はその処理を終了し、また、外線FAX302は、ファクシミリ送信されてきた画像情報を受信する(ステップS12)。 Images were transmitted by facsimile retrieved image information to the outside line FAX301 (step S11), and then, in step S10, the data processing apparatus 101 terminates its processing, also external FAX302 is that has been faxed receiving information (step S12).

【0029】外線FAX301は、検索キーに対応する画像情報がない旨の音声ガイダンスまたはファクシミリ画情報の受信の後、あるいはステップS11での画像情報の受信の後、処理を終了する(ステップS12)。 The external FAX301, after reception of the voice guidance or the facsimile image information indicating the image information is not corresponding to the search key, or after the reception of the image information in step S11, the process ends (step S12).

【0030】以上の説明では、内線FAX202から画像登録を行うとしたが、外線FAX301からも同様に画像登録が可能であることは言うまでもない。 [0030] In the above description has been to perform the image registration from extension FAX202, it is needless to say can likewise image registration from external FAX301. また、外線FAX301から画像情報の検索を行うとしたが、内線FAX202からも同様に画像情報の検索が可能であることは言うまでもない。 Although the to search for image information from an external FAX301, it goes without saying that can be searched in the image information as well from the extension FAX202.

【0031】以上説明した本発明のデータ処理装置は、 The data processing apparatus of the present invention described above,
それを実現するための計算機プログラムを、サーバコンピュータやパーソナルコンピュータなどの計算機に読み込ませ、そのプログラムを実行させることによっても実現できる。 The computer program for implementing it, to read the computer such as a server computer or a personal computer can also be realized by executing the program. 上述したデータ処理を行うためのプログラムは、磁気テープやCD−ROMなどの記録媒体によって、計算機に読み込まれる。 A program for performing the above-mentioned data processing, by a recording medium such as a magnetic tape, a CD-ROM, or loaded into the computer.

【0032】この計算機は、中央処理装置(CPU) [0032] This computer includes a central processing unit (CPU)
と、プログラムやデータを格納するためのハードディスク装置と、主メモリと、キーボードやマウスなどの入力装置と、CRTなどの表示装置と、磁気テープやCD− When a hard disk drive for storing programs and data, a main memory, an input device such as a keyboard and a mouse, a display device such as a CRT, a magnetic tape or CD-
ROM等の記録媒体を読み取る読み取り装置とから構成されている。 Reading a recording medium such as a ROM is composed of a reader. ハードディスク装置、主メモリ、入力装置、表示装置及び読み取り装置は、いずれも中央処理装置に接続している。 A hard disk drive, a main memory, an input device, a display device and a reading device are both connected to the central processing unit. さらに、図1に示すデータ処理装置を実現する場合には、画像入力部として機能する例えばイメージスキャナなどを中央処理装置に接続するとともに、音声入力部として機能するものとして、マイクロフォンが接続されたアナログ/デジタルコンバータなどが中央処理装置に接続される。 Furthermore, analog to the case of realizing the data processing apparatus shown in FIG. 1, with connected functions as the image input unit for example an image scanner, or the like to the central processing unit, as working as a sound input unit, the microphone is connected / digital converter, etc. are connected to the central processing unit. また、図3に示すデータ処理装置を実現する場合には、通信インタフェース部として機能する通信インタフェースが中央処理装置に接続される。 Also, when realizing the data processing apparatus shown in FIG. 3, a communication interface that functions as a communication interface unit is connected to the central processing unit.

【0033】この計算機は、上述したデータ処理を行うためのプログラムを格納した記録媒体を読み取り装置に装着し、記録媒体からプログラムを読み出してハードディスク装置に格納し、ハードディスク装置に格納されたプログラムを中央処理装置が主メモリ上に展開しつつ実行することにより、上述したデータ処理装置として機能することになる。 [0033] The computer, a recording medium storing a program for performing the above-mentioned data processing is attached to the reader, and stored in the hard disk device reads the program from the recording medium, the center of the program stored in the hard disk drive by the processor device executing while deployed on the main memory, it functions as the above-mentioned data processing apparatus. その際、画像情報蓄積部及び音声認識語彙蓄積部は、ハードディスク装置の記憶領域の一部として設けられることになり、画像解析部、画像登録部、 At that time, the image information storage unit and a voice recognition vocabulary storage will become be provided as part of the storage area of ​​the hard disk device, an image analysis unit, the image registration unit,
音声認識語彙登録部、音声認識部、画像検索部及び画像出力部の各機能は、中央処理装置が実行するプログラムによって実現されることになる。 Speech recognition vocabulary registered unit, the speech recognition unit, the respective functions of the image retrieval unit and the image output unit, so that the central processing unit are realized by a program to be executed.

【0034】 [0034]

【発明の効果】以上説明したように本発明は、登録する画像情報に関する説明情報が含まれている画像情報を入力することにより画像情報の登録とその画像情報に対応し音声認識の対象となる語彙の登録とを自動的に行う構成を採用しているため、容易に画像情報の登録、音声認識語彙の登録、音声認識による蓄積情報の検索または出力を行うことができるという効果がある。 The present invention described above, according to the present invention consists registration image information and the object corresponding to the speech recognition to the image information by inputting image information that contains descriptive information about the image information to be registered since it uses the automatically performed configure registration vocabulary, readily registration of image information, the registration of the voice recognition vocabulary, there is an effect that it is possible to perform the search or an output of the stored information by voice recognition.

【図面の簡単な説明】 BRIEF DESCRIPTION OF THE DRAWINGS

【図1】本発明の第1の実施の形態のデータ処理装置の構成を示すブロック図である。 1 is a block diagram showing a configuration of a data processing apparatus according to a first embodiment of the present invention.

【図2】データ処理装置に入力される画像情報の例である。 Figure 2 is an example of an image information input to the data processing device.

【図3】本発明の第2の実施の形態のデータ処理装置の構成を示すブロック図である。 3 is a block diagram showing a configuration of a data processing apparatus of the second embodiment of the present invention.

【図4】本発明の第2の実施の形態のデータ処理装置での画像情報登録時の動作例を示すシーケンス図である。 4 is a sequence diagram showing an example of the operation when an image information registration in the data processing apparatus of the second embodiment of the present invention.

【図5】本発明の第2の実施の形態のデータ処理装置での画像情報検索時の動作例を示すシーケンス図である。 5 is a sequence diagram showing an operation example of the image information retrieval time of the data processing apparatus of the second embodiment of the present invention.

【符号の説明】 DESCRIPTION OF SYMBOLS

101,151 データ処理装置 102 画像入力部 103 画像解析部 104 画像登録部 105 音声認識語彙登録部 106 画像情報蓄積部 107 音声認識語彙蓄積部 108 音声入力部 109 音声認識部 110 画像検索部 111 画像出力部 112 通信インタフェース部 200 回線網 201 回線制御装置 202 内線FAX 301 外線FAX S1〜S12 ステップ 101,151 data processing apparatus 102 image input unit 103 image analysis unit 104 an image registration unit 105 the speech recognition vocabulary registered unit 106 image information storage unit 107 speech recognition vocabulary storage 108 an audio input unit 109 speech recognition unit 110 the image retrieval section 111 image output part 112 communication interface section 200 line network 201 line control unit 202 extension FAX 301 external FAX S1 to S12 step

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl. 7識別記号 FI テーマコート゛(参考) G10L 15/06 H04N 1/21 15/00 G10L 3/00 521C 15/28 551P H04N 1/21 (72)発明者 小池 恵一 東京都千代田区大手町二丁目3番1号 日 本電信電話株式会社内 (72)発明者 植垣 伸哉 東京都千代田区大手町二丁目3番1号 日 本電信電話株式会社内 Fターム(参考) 5B050 BA06 BA10 BA16 BA20 FA19 GA08 5B075 ND06 ND23 NK02 NK24 NK31 PP07 PP12 PP22 5C073 AB03 AB13 5D015 GG03 KK02 ────────────────────────────────────────────────── ─── of the front page continued (51) Int.Cl. 7 identification mark FI theme Court Bu (reference) G10L 15/06 H04N 1/21 15/00 G10L 3/00 521C 15/28 551P H04N 1/21 (72) inventor Keiichi Koike Otemachi, Chiyoda-ku, tokyo chome third No. 1 Date this telegraph and telephone within Co., Ltd. (72) inventor Uekaki Shinya Otemachi, Chiyoda-ku, tokyo chome third No. 1 Date this telegraph and telephone in the Corporation F-term (reference) 5B050 BA06 BA10 BA16 BA20 FA19 GA08 5B075 ND06 ND23 NK02 NK24 NK31 PP07 PP12 PP22 5C073 AB03 AB13 5D015 GG03 KK02

Claims (6)

    【特許請求の範囲】 [The claims]
  1. 【請求項1】 登録する画像情報に関する説明情報が含まれている画像情報から、前記登録する画像情報に関する前記説明情報をテキスト情報として抽出し、 前記テキスト情報を前記登録する画像情報と対応付けて記録する、 データ処理方法。 From 1. A image information contains descriptive information about the image information to be registered, said descriptive information about the image information to be registered is extracted as a text information, the text information in association with the image information to be the registration record, data processing method.
  2. 【請求項2】 入力された音声に対して音声認識を行い、前記音声認識の結果を検索キーとして記録されている前記画像情報を検索する段階をさらに含む、請求項1 2. A performs speech recognition on the input speech, further comprising the step of retrieving the image information recorded the result of the voice recognition as a search key, according to claim 1
    に記載のデータ処理方法。 Data processing method according to.
  3. 【請求項3】 画像情報を蓄積するデータ処理装置であって、 登録する画像情報に関する説明情報が含まれている画像情報から、前記登録する画像情報に関する前記説明情報をテキスト情報として抽出する画像解析手段と、 情報を蓄積する蓄積手段と、 抽出した前記テキスト情報を音声認識の対象となる語彙として前記蓄積手段に蓄積する音声認識語彙登録手段と、 前記登録する画像情報を前記蓄積手段に蓄積する画像登録手段と、 を有するデータ処理装置。 3. A data processing apparatus for storing image information, image analysis for extracting from the image information that contains descriptive information about the image information to be registered, the description information relating to the image information to be the registered text information means, means for storing the information, a speech recognition vocabulary registration means for storing in said storage means the extracted the text information as a vocabulary to be speech recognition, for storing image information to be the registered in the storage means data processing apparatus having an image registration means.
  4. 【請求項4】 入力された音声に対して音声認識を行う音声認識手段と、 前記音声認識の結果を検索キーとして前記蓄積手段に蓄積されている画像情報を検索する検索手段と、 をさらに有する請求項3に記載のデータ処理装置。 Further comprising a speech recognition unit, a retrieving means for retrieving image information stored in said storing means the result of the voice recognition as a search key, the performing voice recognition on 4. Input speech the data processing apparatus according to claim 3.
  5. 【請求項5】 計算機が読取り可能な記録媒体であって、 前記計算機に、 登録する画像情報に関する説明情報が含まれている画像情報から、前記登録する画像情報に関する前記説明情報をテキスト情報として抽出する段階と、 前記テキスト情報を前記登録する画像情報と対応付けて記録する段階と、 を実行させるプログラムを記録した記録媒体。 5. A computer readable recording medium extraction, the computer, from the image information that contains descriptive information about the image information to be registered, the description information relating to the image information to be the registered text information phase and a recording medium that the text information has been recorded a program for executing the steps of recording in association with the image information to be the registration of.
  6. 【請求項6】 前記プログラムは、前記計算機に、 入力された音声に対して音声認識を行う段階と、 前記音声認識の結果を検索キーとして記録されている前記画像情報を検索する段階とをさらに実行させるものである請求項6に記載の記録媒体。 Wherein said program, said computer further comprising: performing speech recognition on speech input, and a step of retrieving the image information recorded the result of the voice recognition as a search key recording medium according to claim 6 in which to execute.
JP2000217515A 2000-07-18 2000-07-18 Method and device for data processing and recording medium recorded with program for performing the method thereon Pending JP2002032386A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000217515A JP2002032386A (en) 2000-07-18 2000-07-18 Method and device for data processing and recording medium recorded with program for performing the method thereon

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000217515A JP2002032386A (en) 2000-07-18 2000-07-18 Method and device for data processing and recording medium recorded with program for performing the method thereon

Publications (1)

Publication Number Publication Date
JP2002032386A true JP2002032386A (en) 2002-01-31

Family

ID=18712609

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000217515A Pending JP2002032386A (en) 2000-07-18 2000-07-18 Method and device for data processing and recording medium recorded with program for performing the method thereon

Country Status (1)

Country Link
JP (1) JP2002032386A (en)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6990224B2 (en) * 2003-05-15 2006-01-24 Federal Reserve Bank Of Atlanta Method and system for communicating and matching electronic files for financial transactions
JP2009054166A (en) * 2008-09-18 2009-03-12 Kazuhiro Yamamoto Posted data clipping system
JP2011204270A (en) * 2011-06-17 2011-10-13 Kazuhiro Yamamoto Clipping system for printing data
JP2013225329A (en) * 2013-06-21 2013-10-31 Kazuhiro Yamamoto Clipping system of posted data
JP2014197396A (en) * 2014-04-17 2014-10-16 和浩 山本 Clipping system of posted data
JP2015212952A (en) * 2015-05-22 2015-11-26 和浩 山本 Clipping system of posted data
JP2016167280A (en) * 2016-04-07 2016-09-15 和浩 山本 Clipping system of posted data
JP2017201541A (en) * 2017-06-13 2017-11-09 和浩 山本 Clipping system of posted data
JP2018185822A (en) * 2018-06-11 2018-11-22 和浩 山本 Of published data clipping system

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6990224B2 (en) * 2003-05-15 2006-01-24 Federal Reserve Bank Of Atlanta Method and system for communicating and matching electronic files for financial transactions
US7653234B2 (en) 2003-05-15 2010-01-26 Federal Reserve Bank Of Atlanta Method for communicating and matching electronic files for financial transactions
JP2009054166A (en) * 2008-09-18 2009-03-12 Kazuhiro Yamamoto Posted data clipping system
JP2011204270A (en) * 2011-06-17 2011-10-13 Kazuhiro Yamamoto Clipping system for printing data
JP2013225329A (en) * 2013-06-21 2013-10-31 Kazuhiro Yamamoto Clipping system of posted data
JP2014197396A (en) * 2014-04-17 2014-10-16 和浩 山本 Clipping system of posted data
JP2015212952A (en) * 2015-05-22 2015-11-26 和浩 山本 Clipping system of posted data
JP2016167280A (en) * 2016-04-07 2016-09-15 和浩 山本 Clipping system of posted data
JP2017201541A (en) * 2017-06-13 2017-11-09 和浩 山本 Clipping system of posted data
JP2018185822A (en) * 2018-06-11 2018-11-22 和浩 山本 Of published data clipping system

Similar Documents

Publication Publication Date Title
US6823311B2 (en) Data processing system for vocalizing web content
US6366882B1 (en) Apparatus for converting speech to text
JP3920812B2 (en) Communication support device, support method, and support program
CN101101779B (en) Data recording and reproducing apparatus and metadata production method
US6771743B1 (en) Voice processing system, method and computer program product having common source for internet world wide web pages and voice applications
US6192111B1 (en) Abstracting system for multi-media messages
EP1224793B1 (en) Method and apparatus for telephonically accessing and navigating the internet
CN100572083C (en) Printer with hardware and software interfaces for media device
US7486807B2 (en) Image retrieving device, method for adding keywords in image retrieving device, and computer program therefor
CN1617558B (en) Sequential multimodal input
CN1332341C (en) Information processing apparatus and method
DE69829802T2 (en) Speech recognition apparatus for transmitting voice data on a data carrier in text data
US20060161588A1 (en) Electronic image filing method, electronic image filing device and electronic image filing system
CN1029170C (en) Language translation system
US4996707A (en) Text-to-speech converter of a facsimile graphic image
CN1184614C (en) Automatic data route selection by voice command annotation
US20020051262A1 (en) Image capture device with handwritten annotation
US20010043594A1 (en) Information processing apparatus, information processing method and identification code
US6671684B1 (en) Method and apparatus for simultaneous highlighting of a physical version of a document and an electronic version of a document
JP4089148B2 (en) Interpreting service method and interpreting service device
US4650927A (en) Processor-assisted communication system using tone-generating telephones
US7965906B2 (en) Image registration system
JP3611230B2 (en) Information processing method
US20030081145A1 (en) Systems and methods for generating digital images having image meta-data combined with the image data
CN1214612C (en) Speech control input of portable acquisition apparatus

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20050624

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050713

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060111