JP2000293279A - Multimedia data acquisition device and recording medium where program thereof is recorded - Google Patents

Multimedia data acquisition device and recording medium where program thereof is recorded

Info

Publication number
JP2000293279A
JP2000293279A JP9952499A JP9952499A JP2000293279A JP 2000293279 A JP2000293279 A JP 2000293279A JP 9952499 A JP9952499 A JP 9952499A JP 9952499 A JP9952499 A JP 9952499A JP 2000293279 A JP2000293279 A JP 2000293279A
Authority
JP
Japan
Prior art keywords
data
processing unit
voice
audio
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9952499A
Other languages
Japanese (ja)
Inventor
Nobuhiro Muto
伸洋 武藤
Manabu Mogi
学 茂木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP9952499A priority Critical patent/JP2000293279A/en
Publication of JP2000293279A publication Critical patent/JP2000293279A/en
Pending legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To solve operation problems such as the need to manually operate a pointing device, etc., and to improve the operator convenience by controlling a connection between a voice device and a voice data storing process part or a voice recognizing part according to a data process event. SOLUTION: A voice recognizing process part 5 recognizes voice data obtained by a voice acquisition part 3 and sends an event to an event process part 10, etc. The event process part 10 performs a process corresponding to the event, etc., sent from a pointing device part 14 and the voice recognizing process part 5. A voice device connection control process part 6 controls connections on a software-interface between the voice acquisition part 3 and one of a voice data storing process part 4, a stored voice data reproducing process part 9 and the voice recognizing process part 5 through a software interface 106.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、インフラ、生産、
流通あるいは各種サービス関連の保守作業者や屋外作業
者が使用する、映像や音声やデータ入出力などの各種マ
ルチメディア情報機器を用いて作業支援を行うマルチメ
ディアデータ取得装置及びそのプログラムを記録した記
録媒体に関するものである。
TECHNICAL FIELD The present invention relates to infrastructure, production,
Multimedia data acquisition device that uses various multimedia information devices such as video, audio, and data input / output that are used by maintenance workers and outdoor workers related to distribution or various services, and records recording the programs thereof. It is about media.

【0002】[0002]

【従来の技術】インフラ、生産、流通あるいは各種サー
ビス関連の保守作業者や屋外作業者が使用する、映像や
音声やデータ入出力などの各種マルチメディア情報機器
を用いて、作業支援を行うマルチメディアデータ取得に
関する従来の技術として、例えば、特開平9-16365 に記
載されている、カメラや画像処理装置を介して入力され
た画像データ、プロセスコントローラを介して入力され
たプロセスデータに、別途入力して得たテキストデータ
を加えたデータを、スピーカや音声処理装置を介して得
た音声データと同期をとって出力しうる方法などが挙げ
られる。
2. Description of the Related Art Multimedia for supporting work using various multimedia information devices such as video, audio and data input / output used by maintenance workers and outdoor workers related to infrastructure, production, distribution or various services. As a conventional technique related to data acquisition, for example, image data input via a camera or an image processing device, and process data input via a process controller described in JP-A-9-16365 are separately input. And a method of synchronizing and outputting the data to which the text data thus obtained is added with the voice data obtained through a speaker or a voice processing device.

【0003】[0003]

【発明が解決しようとする課題】しかし、このような方
法では、両手がふさがっている作業中であってもデータ
を取得したい場合には、マルチメディアデータ取得装置
のポインティングデバイス等を操作するなど、本来の作
業を一時中断し、マルチメディアデータ取得装置を手動
で動作する必要が生じる場合があり、操作性の点に問題
がある。
However, in such a method, if the user wants to acquire data even while working with both hands occupied, he or she must operate a pointing device or the like of the multimedia data acquiring apparatus. In some cases, it is necessary to temporarily stop the original work and manually operate the multimedia data acquisition device, which poses a problem in operability.

【0004】また、このようなマルチメディアデータ取
得装置に音声認識処理アプリケーションを付加したとし
ても、マルチメディアデータ取得装置にて録音と再生と
が随時行われることから音声デバイスに競合が生じて結
局はマルチメディアデータ取得装置のポインティングデ
バイス等の操作を手動で行わなければならない場合があ
るという、操作上の問題があった。
[0004] Even if a speech recognition processing application is added to such a multimedia data acquisition device, since the recording and reproduction are performed at any time by the multimedia data acquisition device, competition occurs in the audio device, and eventually the contention occurs. There is an operational problem that the pointing device or the like of the multimedia data acquisition device must be manually operated in some cases.

【0005】本発明は、前記従来の課題に鑑み、作業中
の一連のマルチメディアデータ取得等に際して、マルチ
メディアデータ取得装置のポインティングデバイス等の
操作を手動で行う必要があるなどの操作性の問題を解決
し、作業者の利便性を向上することを目的としている。
SUMMARY OF THE INVENTION In view of the above-mentioned conventional problems, the present invention has a problem of operability such as a need to manually operate a pointing device or the like of a multimedia data acquisition apparatus when acquiring a series of multimedia data during operation. And to improve the convenience of the workers.

【0006】[0006]

【課題を解決するための手段】本発明は次の新規な特徴
的手段を採用することによって達成される。すなわち、
計算機システムにおいて、画像取得部と、画像取得部に
より取得された画像データを表示および保存する画像デ
ータ表示保存処理部と、音声取得部と、音声取得部によ
り取得された音声データを保存する音声データ保存処理
部と、音声取得部により取得された音声データを認識処
理し、データ処理イベントを発生する音声認識処理部
と、音声取得部を含む音声デバイスと音声データ保存処
理部との接続または音声認識処理部との接続をデータ処
理イベントに基づき制御処理する音声デバイス接続制御
処理部とをそなえるようにする。
The present invention is achieved by employing the following novel characteristic means. That is,
In a computer system, an image acquisition unit, an image data display storage processing unit that displays and saves image data acquired by the image acquisition unit, an audio acquisition unit, and audio data that saves audio data acquired by the audio acquisition unit. A storage processing unit, a voice recognition processing unit that recognizes voice data acquired by the voice acquisition unit and generates a data processing event, and a connection or voice recognition between a voice device including the voice acquisition unit and the voice data storage processing unit. An audio device connection control processing unit that controls connection with the processing unit based on a data processing event is provided.

【0007】本発明は、前記のような手段を講じたの
で、マルチメディアデータ取得装置に音声認識処理アプ
リケーションを付加したとしても、音声デバイスに競合
が生じて結局はマルチメディアデータ取得装置のポイン
ティングデバイス等の操作を用いなければならない場合
があるという、操作上の問題を解決できる。
According to the present invention, since the above-described means are taken, even if a speech recognition processing application is added to the multimedia data acquisition device, a conflict occurs in the speech device, and eventually the pointing device of the multimedia data acquisition device. It is possible to solve an operational problem that an operation such as the above has to be used in some cases.

【0008】また、保存された画像データと音声データ
との関連付けファイルを作成する関連ファイル作成処理
部を具備するようにして取得したデータに対するその後
の編集処理等が効率化され、操作性が向上できる。
[0008] Further, since a related file creation processing section for creating an association file between the stored image data and audio data is provided, the subsequent editing process and the like for the acquired data can be made more efficient, and the operability can be improved. .

【0009】また、保存された画像データを表示する保
存済み画像データ表示処理部と、対応する保存済み音声
データを再生する保存済み音声データ再生処理部と、音
声デバイスと音声データ保存処理部との接続または保存
済み音声データ再生処理部との接続または音声認識処理
部との接続をデータ処理イベントに基づき制御処理する
音声デバイス接続制御処理部を具備するようにして、操
作上の問題を解決でき、これにより、取得したデータに
対するその後の確認作業等の操作性が向上できる。
A stored image data display processing section for displaying the stored image data, a stored audio data reproduction processing section for reproducing the corresponding stored audio data, an audio device and an audio data storage processing section. By providing an audio device connection control processing unit that controls and processes the connection with the connected or stored audio data reproduction processing unit or the connection with the voice recognition processing unit based on the data processing event, it is possible to solve the operational problem, Thereby, the operability such as the subsequent confirmation work on the acquired data can be improved.

【0010】また、作業者が身体に装着可能な、データ
処理部、ポインティングデバイス、表示部、音声入出力
部、および電源部を有する計算機を使用し、さらには、
ヘルメットや作業着などの作業者が身につけている着衣
などに脱着可能な画像取得部を具備するようにして、屋
外等での作業、両手がマルチメディアデータ取得装置以
外の装置等を操作する必要がある場合等においても操作
性が向上できる。
[0010] In addition, a computer having a data processing unit, a pointing device, a display unit, a voice input / output unit, and a power supply unit, which can be worn by an operator, is used.
It is necessary to provide a detachable image acquisition unit for clothes worn by workers, such as helmets and work clothes, so that they can work outdoors or use both hands to operate devices other than the multimedia data acquisition device. The operability can be improved even in the case where there is any.

【0011】以上のように、作業中の一連のマルチメデ
ィアデータ取得等に際して、手動でのマルチメディアデ
ータ取得装置のポインティングデバイス等の操作の必要
性が生じる場合があるなどという操作性の問題点を解決
でき、操作者の利便性を向上するという従来技術との差
異がある。
As described above, when acquiring a series of multimedia data during a work, there is a problem in operability that a manual operation of a pointing device or the like of the multimedia data acquiring apparatus is sometimes required. There is a difference from the prior art that can solve the problem and improve the convenience for the operator.

【0012】[0012]

【発明の実施の形態】本発明の実施例を図面に基づき説
明する。図1は本発明のマルチメディア取得装置におけ
るメディア取得機能部についての実施例を示す構成図で
ある。
Embodiments of the present invention will be described with reference to the drawings. FIG. 1 is a configuration diagram showing an embodiment of a media acquisition function unit in a multimedia acquisition device of the present invention.

【0013】Aは本発明を適用するコンピュータ。Bは
データ処理部。1は画像取得部であって、ソフトウェア
インタフェース100 を具備する。
A is a computer to which the present invention is applied. B is a data processing unit. Reference numeral 1 denotes an image acquisition unit having a software interface 100.

【0014】2は画像データ表示保存処理部であって、
ソフトウェアインタフェース100 と接続可能なソフトウ
ェアインタフェース101 、ソフトウェアインタフェース
106と接続可能なソフトウェアインタフェース107 、ソ
フトウェアインタフェース112 と接続可能なソフトウェ
アインタフェース111 を具備し、ソフトウェアインタフ
ェース107 に入力されたイベントにより、画像取得部1
により取得された画像データをソフトウェアインタフェ
ース111 を介して表示部12に表示したり、記憶部11に保
存したりする。
Reference numeral 2 denotes an image data display storage processing unit,
Software interface 101 connectable to software interface 100, software interface
A software interface 107 that can be connected to the software interface 106, and a software interface 111 that can be connected to the software interface 112.
Is displayed on the display unit 12 via the software interface 111 or stored in the storage unit 11.

【0015】3は音声取得部であって、音声出力部13と
共有したソフトウェアインタフェース102 を具備する。
Reference numeral 3 denotes a voice acquisition unit, which has a software interface 102 shared with the voice output unit 13.

【0016】4は音声データ保存処理部であって、ソフ
トウェアインタフェース102 と接続可能なソフトウェア
インタフェース103 、ソフトウェアインタフェース106
と接続可能なソフトウェアインタフェース108 を具備
し、ソフトウェアインタフェース108 に入力されたイベ
ントにより、音声取得部3により取得された音声データ
を保存する。またソフトウェアインタフェース108 に入
力されたイベントにより、インタフェース102 と103 と
の接続が制御される。
Reference numeral 4 denotes an audio data storage processing unit, which is a software interface 103 connectable to the software interface 102, a software interface 106
A software interface 108 that can be connected to the software interface 108, and stores the audio data acquired by the audio acquisition unit 3 in response to an event input to the software interface 108. The connection between the interfaces 102 and 103 is controlled by an event input to the software interface 108.

【0017】5は音声認識処理部であって、ソフトウェ
アインタフェース102 と接続可能なソフトウェアインタ
フェース105 、ソフトウェアインタフェース106 と接続
可能なソフトウェアインタフェース110 を具備し、音声
取得部3により取得された音声データを認識処理し、イ
ベント処理部10などにイベントを送信する。また、ソフ
トウェアインタフェース110 に入力されたイベントによ
り、インタフェース102 と105 との接続が制御される。
A voice recognition processing unit 5 includes a software interface 105 connectable to the software interface 102 and a software interface 110 connectable to the software interface 106, and recognizes voice data acquired by the voice acquisition unit 3. Process and transmit the event to the event processing unit 10 and the like. Further, the connection between the interfaces 102 and 105 is controlled by an event input to the software interface 110.

【0018】10はイベント処理部であって、音声デバイ
ス接続制御処理部6、ファイル作成処理部7、保存済み
画像データ表示処理部8およびソフトウェアインタフェ
ース106 を具備し、ポインティングデバイス部14や音声
認識処理部5から送信されたイベント等に応じた処理を
行う。
An event processing unit 10 includes an audio device connection control processing unit 6, a file creation processing unit 7, a stored image data display processing unit 8, and a software interface 106, and has a pointing device unit 14 and a voice recognition processing unit. The processing corresponding to the event or the like transmitted from the unit 5 is performed.

【0019】音声デバイス接続制御処理部6は、ソフト
ウェアインタフェース102 を介しての音声取得部3と音
声データ保存処理部4および保存済み音声データ再生処
理部9および音声認識処理部5とのソフトウェアインタ
フェース上の接続を、データ処理イベントに基づき、ソ
フトウェアインタフェース106 を介して制御処理する。
ファイル作成処理部7は保存された画像データと音声デ
ータとの関連付けファイルを作成する。保存済み画像デ
ータ表示処理部8は保存された画像データを表示する。
The voice device connection control processing unit 6 is provided on a software interface between the voice acquisition unit 3, the voice data storage processing unit 4, the stored voice data reproduction processing unit 9, and the voice recognition processing unit 5 via the software interface 102. Is controlled through the software interface 106 based on the data processing event.
The file creation processing unit 7 creates an association file between the stored image data and audio data. The stored image data display processing unit 8 displays the stored image data.

【0020】9は保存済み音声データ再生処理部であっ
て、ソフトウェアインタフェース102 と接続可能なソフ
トウェアインタフェース104 、ソフトウェアインタフェ
ース106 と接続可能なソフトウェアインタフェース109
を具備し、ソフトウェアインタフェース109 に入力され
たイベントにより、保存済み音声データを再生する。ま
た、ソフトウェアインタフェース109 に入力されたイベ
ントにより、インタフェース102 と104 との接続が制御
される。
Reference numeral 9 denotes a stored audio data reproduction processing unit, which is a software interface 104 connectable to the software interface 102 and a software interface 109 connectable to the software interface 106.
And reproduces the stored audio data in response to an event input to the software interface 109. Further, the connection between the interfaces 102 and 104 is controlled by an event input to the software interface 109.

【0021】11は記憶部、12は表示部である。13は音声
出力部であって、音声取得部3と共有したソフトウェア
インタフェース102 を具備する。
Reference numeral 11 denotes a storage unit, and 12 denotes a display unit. An audio output unit 13 includes a software interface 102 shared with the audio acquisition unit 3.

【0022】14はポインティングデバイス部、15は電源
部である。
Reference numeral 14 denotes a pointing device unit, and 15 denotes a power supply unit.

【0023】立ち上げ後の初期状態または処理をしてい
ない待機状態でのソフトウェアインタフェースの接続状
況は以下の通りである。
The connection state of the software interface in the initial state after startup or in the standby state where no processing is performed is as follows.

【0024】ソフトウェアインタフェース106 は、立ち
上げ時にマルチでソフトウェアインタフェース107,108,
109 及び110 と接続されて、以後、そのままに接続され
ている。
The software interface 106 is a multi software interface 107, 108,
It is connected to 109 and 110 and thereafter connected as it is.

【0025】ソフトウェアインタフェース100 は、立ち
上げ時にソフトウェアインタフェース101 と直接に接続
されて、以後、そのままに接続されている。
The software interface 100 is directly connected to the software interface 101 at the time of start-up, and is thereafter connected as it is.

【0026】ソフトウェアインタフェース112 は、立ち
上げ時にソフトウェアインタフェース111 と直接に接続
されて、以後、そのままに接続されている。
The software interface 112 is directly connected to the software interface 111 at the time of start-up, and is thereafter connected as it is.

【0027】音声取得部と音声出力部とのソフトウェア
インタフェース102 は、立ち上げ時に音声認識処理部へ
のソフトウェアインタフェース105 と接続されて、以
後、音声に対する処理状況に応じて接続先は、ソフトウ
ェアインタフェース103,104 または105 に接続される
が、音声処理が終わり待機状態になると、ソフトウェア
インタフェース105 に接続されていて音声での操作指示
を待つ状態にある。
The software interface 102 between the voice acquisition unit and the voice output unit is connected to the software interface 105 to the voice recognition processing unit at the time of startup, and thereafter, the connection destination is the software interface 103, 104 according to the processing status for voice. Alternatively, when the voice processing is completed and the apparatus enters a standby state, the apparatus is connected to the software interface 105 and is in a state of waiting for an operation instruction by voice.

【0028】なお、デバイス対応のソフトウェアインタ
フェース100,102,112 は、マイクロソフト社から市販さ
れているウインドウズOSにて提供されているインタフ
ェースである。
The device-compatible software interfaces 100, 102, and 112 are interfaces provided by a Windows OS commercially available from Microsoft Corporation.

【0029】画像および音声データの取得は以下の手順
で行われる。マルチメディアデータ取得装置のソフトウ
ェア全体の操作は、ポインティングデバイス部14または
音声認識処理部5より送信されたイベントに基づき操作
される。ここでは、まず、音声認識処理部5が音声取得
部3に対してソフトウェアインタフェース102 とソフト
ウェアインタフェース105 とで接続された状態を例にと
って詳細を説明する。
The acquisition of image and audio data is performed in the following procedure. The operation of the entire software of the multimedia data acquisition apparatus is operated based on an event transmitted from the pointing device unit 14 or the voice recognition processing unit 5. Here, first, details will be described with reference to an example in which the speech recognition processing unit 5 is connected to the speech acquisition unit 3 via the software interface 102 and the software interface 105.

【0030】(手順1)操作者が、マルチメディアデー
タ取得に該当する発声をすると、音声取得部3からソフ
トウェアインタフェース102 とソフトウェアインタフェ
ース105 とを介して取得した音声データを、音声認識処
理部5は処理して、マルチメディア取得の指示と認識し
マルチメディアデータ取得開始イベントをイベント処理
部10に送信する。
(Procedure 1) When the operator speaks to obtain multimedia data, the voice recognition processing unit 5 converts the voice data obtained from the voice obtaining unit 3 through the software interface 102 and the software interface 105 into a voice. After processing, it recognizes it as a multimedia acquisition instruction and transmits a multimedia data acquisition start event to the event processing unit 10.

【0031】(手順2)次に、イベント処理部10は、画
像データ表示保存処理部2にイベントを送信し、画像を
記憶部11に保存させる。その後、音声データの取得を行
うか否かの判断を促す画面を表示した後、音声データ取
得の指示に該当する発声がなされると、音声取得部3か
らの音声データを処理し、音声認識処理部5は音声デー
タ取得の指示と認識し、音声データ取得開始イベントを
イベント処理部10に送信する。
(Procedure 2) Next, the event processing unit 10 transmits an event to the image data display / storage processing unit 2 and causes the storage unit 11 to store the image. Thereafter, after a screen for prompting the user to determine whether or not to acquire the voice data is displayed, when a voice corresponding to the voice data acquisition instruction is made, the voice data from the voice acquisition unit 3 is processed, and the voice recognition processing is performed. The unit 5 recognizes the instruction to acquire audio data, and transmits an audio data acquisition start event to the event processing unit 10.

【0032】(手順3)次に、イベント処理部10内の音
声デバイス接続制御処理部6は、音声認識処理部5に、
ソフトウェアインタフェース102 とソフトウェアインタ
フェース105 との接続を解除させるイベントを音声認識
処理部5に対してソフトウェアインタフェース106 を介
して送信する。
(Procedure 3) Next, the audio device connection control processing unit 6 in the event processing unit 10
An event for disconnecting the software interface 102 and the software interface 105 is transmitted to the voice recognition processing unit 5 via the software interface 106.

【0033】(手順4)次に、イベント処理部10内の音
声デバイス接続制御処理部6は、音声認識処理部5のソ
フトウェアインタフェース102 とソフトウェアインタフ
ェース105 との接続の解除を待った後、音声データ保存
処理部4に対して、ソフトウェアインタフェース102 と
ソフトウェアインタフェース103 との接続を促すイベン
トを、ソフトウェアインタフェース106 を介して送信す
る。このイベントにしたがって、 (手順5)次に、音声データ保存処理部4は音声取得部
3により取得された音声データを、あらかじめ記憶され
た、あるいは設定された時間にしたがって保存する。
(Procedure 4) Next, the audio device connection control processing section 6 in the event processing section 10 waits for the disconnection between the software interface 102 and the software interface 105 of the audio recognition processing section 5 and then stores the audio data. An event for prompting the processing section 4 to connect the software interface 102 and the software interface 103 is transmitted via the software interface 106. According to this event (Procedure 5) Next, the audio data storage processing unit 4 stores the audio data acquired by the audio acquisition unit 3 according to a previously stored or set time.

【0034】(手順6)次に、イベント処理部10内の音
声デバイス接続制御処理部6は、音声データ保存処理部
4がソフトウェアインタフェース102 とソフトウェアイ
ンタフェース103 との接続を解除するのを待った後、音
声認識処理部5に対して、ソフトウェアインタフェース
102 とソフトウェアインタフェース105 との接続を促す
イベントを、ソフトウェアインタフェース106 を介して
送信する。また、このとき、イベント処理部10内のファ
イル作成処理部7は、保存された画像データと音声デー
タとの関連付けファイルを作成する。
(Procedure 6) Next, the audio device connection control processing section 6 in the event processing section 10 waits until the audio data storage processing section 4 releases the connection between the software interface 102 and the software interface 103. Software interface for the voice recognition processing unit 5
An event prompting connection between the software interface 102 and the software interface 105 is transmitted via the software interface 106. At this time, the file creation processing unit 7 in the event processing unit 10 creates an association file between the stored image data and audio data.

【0035】この一連の動作により、作業中の一連のマ
ルチメディアデータ取得に際して、マルチメディアデー
タ取得装置のポインティングデバイス等の操作を手動で
行う必要があるという操作上の問題点を解決できる。
With this series of operations, it is possible to solve the operational problem that it is necessary to manually operate the pointing device and the like of the multimedia data acquisition device when acquiring a series of multimedia data during work.

【0036】また、画像および音声データの表示再生は
以下の手順で行われる。
Display and reproduction of image and audio data are performed in the following procedure.

【0037】(手順7)操作者が、保存済みデータの表
示に該当する発声をすると、音声取得部3からソフトウ
ェアインタフェース102 とソフトウェアインタフェース
105とを介して取得した音声データを処理し、音声認識
処理部5は保存済みデータ表示の指示と認識し保存済み
データ表示開始イベントをイベント処理部10に送信す
る。
(Step 7) When the operator makes an utterance corresponding to the display of the stored data, the voice acquisition unit 3 sends the software interface 102 and the software interface
The voice recognition processing unit 5 processes the voice data acquired through the step 105, and recognizes the stored data display instruction as an instruction, and transmits a stored data display start event to the event processing unit 10.

【0038】(手順8)次に、イベント処理部10内の保
存済み画像データ表示処理部8は、該当するデータを記
憶部11から読み出し表示する。同時に、音声データを再
生するか否かの判断を促す画面を表示し、その時、音声
データ取得の指示に該当する発声がなされると、音声取
得部3からの音声データを処理し、音声認識処理部5は
音声データ再生の指示と認識し音声データ再生開始イベ
ントをイベント処理部10に送信する。
(Procedure 8) Next, the stored image data display processing section 8 in the event processing section 10 reads out the corresponding data from the storage section 11 and displays it. At the same time, a screen for prompting the user to determine whether or not to reproduce the audio data is displayed. At this time, when an utterance corresponding to the instruction to acquire the audio data is made, the audio data from the audio acquisition unit 3 is processed, and the audio recognition processing is performed. The unit 5 recognizes the instruction as a sound data reproduction instruction and transmits a sound data reproduction start event to the event processing unit 10.

【0039】(手順9)次に、イベント処理部10内の音
声デバイス接続制御処理部6は、音声認識処理部5にソ
フトウェアインタフェース102 とソフトウェアインタフ
ェース105 との接続を解除させるイベントを音声認識処
理部5に対してソフトウェアインタフェース106 を介し
て送信する。
(Procedure 9) Next, the audio device connection control processing section 6 in the event processing section 10 sends an event that causes the voice recognition processing section 5 to release the connection between the software interface 102 and the software interface 105. 5 via the software interface 106.

【0040】(手順10)次に、イベント処理部10内の音
声デバイス接続制御処理部6は、音声認識処理部5のソ
フトウェアインタフェース102 とソフトウェアインタフ
ェース105 との接続の解除を待った後、保存済み音声デ
ータ再生処理部9に対して、ソフトウェアインタフェー
ス102 とソフトウェアインタフェース104 との接続を促
すイベントを、ソフトウェアインタフェース106 を介し
て送信する。
(Procedure 10) Next, the audio device connection control processing section 6 in the event processing section 10 waits for the disconnection between the software interface 102 and the software interface 105 of the voice recognition processing section 5, and then stores the stored audio data. An event for prompting the data reproduction processing unit 9 to connect the software interface 102 and the software interface 104 is transmitted via the software interface 106.

【0041】(手順11)次に、このイベントにしたがっ
て、保存済み音声データ再生処理部9は、該当する音声
データを再生する。
(Procedure 11) Next, in accordance with this event, the stored audio data reproduction processing section 9 reproduces the corresponding audio data.

【0042】(手順12)次に、イベント処理部10内の音
声デバイス接続制御処理部6は、ソフトウェアインタフ
ェース102 とソフトウェアインタフェース104 との接続
の解除を待った後、音声認識処理部5に対して、ソフト
ウェアインタフェース102 とソフトウェアインタフェー
ス105 との接続を促すイベントを、ソフトウェアインタ
フェース106 を介して送信する。
(Procedure 12) Next, the audio device connection control processing unit 6 in the event processing unit 10 waits for the disconnection between the software interface 102 and the software interface 104, An event prompting connection between the software interface 102 and the software interface 105 is transmitted via the software interface 106.

【0043】この一連の動作により、作業中の一連のマ
ルチメディアデータの再生に際して、手動でのマルチメ
ディアデータ取得装置のポインティングデバイス等の操
作の必要性が生じる場合があるという操作上の問題点を
解決できる。
By this series of operations, it is necessary to manually operate a pointing device or the like of the multimedia data acquisition apparatus when reproducing a series of multimedia data during operation. Solvable.

【0044】図2は本発明のマルチメディア取得装置を
適用したシステムのハードウェア構成例を示す。本実施
例システムは、通信インフラ構築、製造、物流管理、サ
ービス、医療支援などの分野で活躍するフィールドワー
カへ、マルチメディアとウェアラブルPC(ウェアラブ
ルパソコン)の技術を駆使した快適な作業支援環境を提
供するシステムである。なお本実施例システムは電話回
線保守、故障復旧等の作業を想定して構築したものとし
て示されている。
FIG. 2 shows an example of a hardware configuration of a system to which the multimedia acquisition apparatus of the present invention is applied. The system of this embodiment provides a comfortable work support environment utilizing multimedia and wearable PC (wearable personal computer) technology to field workers who are active in fields such as communication infrastructure construction, manufacturing, logistics management, service, and medical support. System. The system of the present embodiment is shown as being constructed assuming operations such as telephone line maintenance and failure recovery.

【0045】構成機器は、フィールド作業者が身につけ
るウェアラブルPCと作業車に搭載される車載サーバ、
プリンタ、ウェアラブルPCと車載サーバとの間の通信
を担う無線LAN、位置情報を取得するためのGPSか
らなる。
The components include a wearable PC worn by a field worker and an in-vehicle server mounted on a work vehicle.
It comprises a printer, a wireless LAN for communicating between the wearable PC and the in-vehicle server, and a GPS for acquiring position information.

【0046】ウェアラブルPCは、電子化されたマニュ
アルの閲覧、検索等を容易に行うことができ、作業者に
ハンズフリー環境を享受するという特徴を有する。この
特徴ゆえ、飛行機、船舶等の維持整備等、多量の紙媒体
のマニュアルを必要とし、かつ作業効率化のためにハン
ズフリーであることが要求される作業に応用するために
近年研究開発が活発化している。
The wearable PC is characterized in that it is easy to browse and search an electronic manual, and that the operator enjoys a hands-free environment. Due to this feature, research and development has been actively conducted in recent years to apply it to work that requires a large amount of paper-based manuals, such as maintenance of airplanes and ships, and that requires hands-free operation to improve work efficiency. Is becoming

【0047】本実施例システムにおいては、ウェアラブ
ルPCに画像撮影用のCCDカメラ、音声入力用の骨伝
導マイク、CCDカメラと接続されたPCMCIAのビ
デオキャプチャーカード、PCMCIAの無線LAN子
機が装備されている。音声認識技術により骨伝導マイク
を用いてウェアラブルPCに音声でコマンド指令するこ
とが可能であり、入力作業においてキーボードやマウス
といった周辺機器をほとんど必要としない。
In the system of this embodiment, a wearable PC is equipped with a CCD camera for photographing an image, a bone conduction microphone for voice input, a PCMCIA video capture card connected to the CCD camera, and a PCMCIA wireless LAN slave unit. I have. It is possible to give a voice command to a wearable PC using a bone conduction microphone by voice recognition technology, and almost no peripheral devices such as a keyboard and a mouse are required for input work.

【0048】ウェアラブルPCと車載サーバとの間は無
線LANによって情報の送受信が実現されている。車載
サーバには設備データや工事記録、作業マニュアル等の
データベースがあり、GPSによって位置情報を検出し
て設備データとリンクすることにより、現在位置におけ
る付設設備、過去の工事記録といったインフラ保守に必
要な情報を検索可能である。フィールド作業者は音声指
令により無線LANを介してウェアラブルPCにそれら
の情報を受信し、身につけているヘッドマウントディス
プレイで参照可能である。
Information is transmitted and received between the wearable PC and the in-vehicle server via a wireless LAN. The in-vehicle server has a database of equipment data, construction records, work manuals, etc., and by detecting position information by GPS and linking it to the equipment data, it is necessary for infrastructure maintenance such as attached equipment at the current position and past construction records. Information can be searched. The field worker receives the information on the wearable PC via the wireless LAN by voice command, and can refer to the information on the head mounted display worn by the wearer.

【0049】インフラ保守等の屋外作業において作業記
録を行なうことは工事履歴の参照、付帯設備の確認を行
なう上で非常に重要である。本実施例システムでは、上
記のように、作業記録のためにウェアラブルPCにCC
Dカメラを搭載しており、音声指令にて作業現場の画像
を撮影し、ウェアラブルPC上のハードディスク上に画
像ファイルとして記録する。画像取得後、骨伝導マイク
により、撮影した画像に対応した音声メモも同じくウェ
アラブルPC上のハードウェア上に音声メモファイルと
して録音する。
It is very important to record work in outdoor work such as infrastructure maintenance in order to refer to the construction history and check incidental facilities. In the system of the present embodiment, as described above, the CC
The camera is equipped with a D-camera, captures images of the work site by voice commands, and records them as image files on a hard disk on a wearable PC. After the image acquisition, a voice memo corresponding to the captured image is also recorded as a voice memo file on hardware on the wearable PC by the bone conduction microphone.

【0050】取得した画像ファイルおよび音声メモファ
イルには自動的にファイル名が付与される。またこの際
に、どの画像に対してどの音声ファイルが対応するかを
示す画像・音声対応ファイルに画像ファイル名、音声フ
ァイル名が追記される。
File names are automatically given to the acquired image files and audio memo files. At this time, the image file name and the audio file name are added to the image / audio correspondence file indicating which audio file corresponds to which image.

【0051】画像・音声対応ファイルでは対応する画像
データと音声データとのファイル名は1行にペアで書き
出される。取得画像に対して音声データを付与しなかっ
た場合には、音声ファイル名が書かれるべきところに、
存在しない旨の記号が書き出される。
In the image / sound correspondence file, the file names of the corresponding image data and sound data are written out in pairs on one line. If audio data was not added to the acquired image, the audio file name should be written where
A symbol that does not exist is written out.

【0052】各画像ファイル、音声ファイル、および画
像・音声対応ファイルは無線LANを介して車載サーバ
に転送される。ウェアラブルPCから転送されたこれら
のファイルは車載サーバのあるディレクトリに保存され
る。
Each image file, audio file, and image / audio file are transferred to the on-board server via the wireless LAN. These files transferred from the wearable PC are stored in a directory of the vehicle server.

【0053】図1に示した構成は、図2に示すウェアラ
ブルPC内に搭載されている。即ち、ウェアラブルPC
には、図1に示したメディア取得機能部と共に作業支援
情報検索提供機能部が搭載されている。当該作業支援情
報検索提供機能部は、図1には明瞭には示されていない
が図2に関連して記述した構成、即ち電子化されたマニ
ュアルの閲覧、検索等を行ない、作業者にハンズフリー
環境を提供している。
The configuration shown in FIG. 1 is mounted in the wearable PC shown in FIG. That is, a wearable PC
Has a work support information search and provision function unit in addition to the media acquisition function unit shown in FIG. The work support information search and provision function unit performs a configuration, which is not clearly shown in FIG. 1 but is described with reference to FIG. Provides a free environment.

【0054】上記においてマルチメディアデータ取得装
置について説明したが、図1に関連して説明した (i)画
像および音声データの取得についての手順1ないし手順
6、(ii)ならびに画像および音声データの表示再生につ
いての手順7ないし手順12は、データ処理装置が該当す
る処理を実行可能な形で記述したプログラムを、記録媒
体上に格納しておき、それを読み出して利用することが
できる。したがって、本発明はそのようなプログラムを
記録した記録媒体をもその技術的範囲に含むものとす
る。
Although the multimedia data acquiring apparatus has been described above, (i) Procedures 1 to 6 and (ii) for acquiring image and audio data and display of image and audio data described with reference to FIG. In steps 7 to 12 for reproduction, a program in which the data processing device describes the corresponding processing can be stored on a recording medium, and read and used. Therefore, the present invention includes in its technical scope a recording medium on which such a program is recorded.

【0055】[0055]

【発明の効果】以上説明したように本発明によれば、作
業中の一連のマルチメディアデータ取得等に際して、手
動でのマルチメディアデータ取得装置のポインティング
デバイス等の操作を手動で行う必要があるなどという操
作上の問題点を解決でき、操作者の利便性を向上したマ
ルチメディアデータ取得装置が実現される。
As described above, according to the present invention, it is necessary to manually operate the pointing device and the like of the multimedia data acquiring apparatus when acquiring a series of multimedia data during operation. Thus, a multimedia data acquisition device that can solve the above operational problem and improves the convenience of the operator is realized.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明のマルチメディア取得装置におけるメデ
ィア取得機能部についての実施例を示す構成図である。
FIG. 1 is a configuration diagram showing an embodiment of a media acquisition function unit in a multimedia acquisition device of the present invention.

【図2】本発明のマルチメディア取得装置を適用したシ
ステムのハードウェア構成例を示す。
FIG. 2 shows a hardware configuration example of a system to which the multimedia acquisition device of the present invention is applied.

【符号の説明】[Explanation of symbols]

A コンピュータ B データ処理部 1 画像取得部 2 画像データ表示保存処理部 3 音声取得部 4 音声データ保存処理部 5 音声認識処理部 6 音声デバイス接続制御処理部 7 ファイル作成処理部 8 保存済み画像データ表示処理部 9 保存済み音声データ再生処理部 10 イベント処理部 11 記憶部 12 表示部 13 音声出力部 14 ポインティングデバイス部 15 電源部 100,101,102,103,104,105,106,107,108,109,110,112
ソフトウェアインタフェース
A computer B data processing unit 1 image acquisition unit 2 image data display storage processing unit 3 audio acquisition unit 4 audio data storage processing unit 5 audio recognition processing unit 6 audio device connection control processing unit 7 file creation processing unit 8 stored image data display Processing unit 9 Saved audio data reproduction processing unit 10 Event processing unit 11 Storage unit 12 Display unit 13 Audio output unit 14 Pointing device unit 15 Power supply unit 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 112
Software interface

───────────────────────────────────────────────────── フロントページの続き Fターム(参考) 5D015 KK01 5E501 AA30 AC15 AC25 BA05 CA02 CA08 CB20 DA16 EA21 FA13 FA14 FA32  ──────────────────────────────────────────────────続 き Continued on the front page F term (reference) 5D015 KK01 5E501 AA30 AC15 AC25 BA05 CA02 CA08 CB20 DA16 EA21 FA13 FA14 FA32

Claims (6)

【特許請求の範囲】[Claims] 【請求項1】 計算機システムにおいて、 画像取得部と、 画像取得部により取得された画像データを表示および保
存する画像データ表示保存処理部と、 音声取得部と、 音声取得部により取得された音声データを保存する音声
データ保存処理部と、 音声取得部により取得された音声データを認識処理し、
データ処理イベントを発生する音声認識処理部と、 音声取得部を含む音声デバイスと音声データ保存処理部
との接続または音声認識処理部との接続をデータ処理イ
ベントに基づき制御処理する音声デバイス接続制御処理
部と、 を具備することを特徴とするマルチメディアデータ取得
装置。
An image acquisition unit, an image data display / save processing unit that displays and saves image data acquired by the image acquisition unit, an audio acquisition unit, and audio data acquired by the audio acquisition unit in the computer system. A voice data storage processing unit that stores the voice data, and performs a recognition process on the voice data acquired by the voice acquisition unit.
A voice recognition processing unit that generates a data processing event, and a voice device connection control process that controls connection between a voice device including a voice acquisition unit and a voice data storage processing unit or connection with the voice recognition processing unit based on the data processing event A multimedia data acquisition device, comprising:
【請求項2】 請求項1において、 保存された画像データと音声データとの関連付けファイ
ルを作成する関連ファイル作成処理部を具備することを
特徴とするマルチメディアデータ取得装置。
2. The multimedia data acquisition device according to claim 1, further comprising an associated file creation processing unit that creates an association file between the stored image data and audio data.
【請求項3】 請求項1または2において、 保存された画像データを表示する保存済み画像データ表
示処理部と、 対応する保存済み音声データを再生する保存済み音声デ
ータ再生処理部と、 音声デバイスと音声データ保存処理部との接続または保
存済み音声データ再生処理部との接続または音声認識処
理部との接続をデータ処理イベントに基づき制御処理す
る音声デバイス接続制御処理部を具備することを特徴と
するマルチメディアデータ取得装置。
3. A stored image data display processing unit for displaying stored image data, a stored audio data reproduction processing unit for reproducing corresponding stored audio data, and an audio device according to claim 1 or 2. An audio device connection control processing unit that controls and processes the connection with the audio data storage processing unit, the connection with the stored audio data reproduction processing unit, or the connection with the voice recognition processing unit based on the data processing event. Multimedia data acquisition device.
【請求項4】 作業者が身につけて脱着可能なウェアラ
ブルパソコン上に、データ処理部、ポインティングデバ
イス、表示部、音声入出力部および/または画像取得
部、記憶部および電源部を有する計算機を使用すること
を特徴とする請求項1または請求項2または請求項3に
記載のマルチメディアデータ取得装置。
4. A computer having a data processing unit, a pointing device, a display unit, a voice input / output unit and / or an image acquisition unit, a storage unit, and a power supply unit on a wearable personal computer which can be worn and detached by an operator. The multimedia data acquisition device according to claim 1, 2 or 3, wherein
【請求項5】 マルチメディアデータ取得を指示する音
声データを認識し、マルチメディアデータ取得開始イベ
ントをイベント処理部に対して送信する処理ステップ
と、 当該イベントに対応して、音声データの取得を行うか否
かの判断を促す画面を表示させ、音声データ取得の指示
に該当する発声を受信して認識処理部に対して認識させ
て、その結果で音声データ取得開始イベントをイベント
処理部に対して送信する処理ステップと、 音声デバイスからの次いで発せられる音声データの供給
先を切換えさせて、当該音声データを記憶手段に保存す
るようにする処理ステップと、 当該音声データの保存が終了した後に、音声デバイスか
らの音声データの供給先を元の認識処理部側に戻す処理
ステップとを順に、繰返し実行可能にするマルチメディ
アデータ取得プログラムが記録されていることを特徴と
する記録媒体。
5. A processing step of recognizing audio data instructing to acquire multimedia data and transmitting a multimedia data acquisition start event to an event processing unit, and acquiring audio data in response to the event. Display a screen prompting the user to determine whether or not the voice data acquisition instruction is received and recognized by the recognition processing unit. Based on the result, the voice data acquisition start event is transmitted to the event processing unit. A transmitting step; a processing step for switching a supply destination of audio data to be subsequently emitted from the audio device to store the audio data in the storage means; And a processing step of returning the supply destination of the audio data from the device to the original recognition processing unit side in order. A recording medium on which a data acquisition program is recorded.
【請求項6】 マルチメディアデータの表示を指示する
音声データを認識し、保存済みデータ表示開始イベント
をイベント処理部に対して送信する処理ステップと、 該当するデータを記憶部から読み出して表示させ、あわ
せて音声データを再生するか否かの判断を促す画面を表
示させ、音声データ取得の指示に該当する発声を認識処
理部に対して認識させて、その結果で音声データ取得開
始イベントをイベント処理部に対し送信する処理ステッ
プと、 音声デバイスに対して、保存済み音声データを供給する
よう音声データの供給先を切換えさせて、当該保存済み
音声データを音声デバイスにおいて再生させる処理ステ
ップと、 当該保存済み音声データの再生が終了した後に、音声デ
バイスからの音声データの供給先を認識処理部側に戻す
処理ステップとを順に、繰返し実行可能にするマルチメ
ディアデータ取得プログラムが記録されていることを特
徴とする記録媒体。
6. A processing step of recognizing audio data instructing display of multimedia data and transmitting a stored data display start event to an event processing unit, reading the relevant data from a storage unit and displaying the data, At the same time, a screen is displayed that prompts the user to determine whether or not to reproduce the audio data, and the utterance corresponding to the instruction to acquire the audio data is recognized by the recognition processing unit. A processing step of transmitting the stored audio data to the audio device so as to supply the stored audio data to the audio device, and causing the audio device to reproduce the stored audio data. Processing to return the supply destination of the audio data from the audio device to the recognition processing unit after the reproduction of the already processed audio data is completed A multimedia data acquisition program for enabling the steps to be repeatedly executed in order.
JP9952499A 1999-04-07 1999-04-07 Multimedia data acquisition device and recording medium where program thereof is recorded Pending JP2000293279A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9952499A JP2000293279A (en) 1999-04-07 1999-04-07 Multimedia data acquisition device and recording medium where program thereof is recorded

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9952499A JP2000293279A (en) 1999-04-07 1999-04-07 Multimedia data acquisition device and recording medium where program thereof is recorded

Publications (1)

Publication Number Publication Date
JP2000293279A true JP2000293279A (en) 2000-10-20

Family

ID=14249631

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9952499A Pending JP2000293279A (en) 1999-04-07 1999-04-07 Multimedia data acquisition device and recording medium where program thereof is recorded

Country Status (1)

Country Link
JP (1) JP2000293279A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014085752A (en) * 2012-10-22 2014-05-12 Shimizu Corp Facility management system and facility management method

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH086708A (en) * 1994-04-22 1996-01-12 Canon Inc Display device
JPH1153163A (en) * 1997-08-08 1999-02-26 Fujitsu Ltd Voice message memorandum device

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH086708A (en) * 1994-04-22 1996-01-12 Canon Inc Display device
JPH1153163A (en) * 1997-08-08 1999-02-26 Fujitsu Ltd Voice message memorandum device

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014085752A (en) * 2012-10-22 2014-05-12 Shimizu Corp Facility management system and facility management method

Similar Documents

Publication Publication Date Title
US10241592B2 (en) Image projector device
US20040085456A1 (en) Camera with viewfinder for image communication
JP2000200092A (en) Portable type information device, and data input method thereof
US6687453B1 (en) Digital image reproducing apparatus and method
US9437245B2 (en) Video recording apparatus and external terminal
JPWO2008016083A1 (en) Superposition information presentation device and superposition information presentation system
JP2008129713A (en) Method for associating multiple modalities, program therefor, and multi-modal system for associating multiple modalities
US7668457B2 (en) Image archiving apparatus and method of controlling same
JP2009169768A (en) Information processor and program
JP2004227514A (en) Memory unit, presentation data generating device, presentation data generating system, presentation data generating method and presentation method
US20100083153A1 (en) Managing Multimodal Annotations Of An Image
JP2003319908A (en) Medical information radiogram interpretation system using portable medical information photographic apparatus
JP2000293279A (en) Multimedia data acquisition device and recording medium where program thereof is recorded
JP2020047020A (en) Electronic apparatus, voice recognition method, and program
JP2002247539A (en) Network projector device
JP5246592B2 (en) Information processing terminal, information processing method, and information processing program
JPH10307532A (en) Map display device
JP3938892B2 (en) Information exchange system
JP2007096500A (en) Nurse call system
JP2003204506A (en) Image input apparatus
EP4221194A1 (en) Recording information creation system, method for creating recording information, and carrier means
EP4231632A1 (en) Display system, display method, and carrier medium
US11966658B2 (en) System and method for displaying image, image-capturing device, and recording medium
JP2019050444A (en) Interface device for data editing, capture device, image processing device, data editing method, and data editing program
JP2000259750A (en) Device and method for preparing multimedia report

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040527

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040608

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040802

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060124