JP2005175627A - System for taking proceedings - Google Patents
System for taking proceedings Download PDFInfo
- Publication number
- JP2005175627A JP2005175627A JP2003409479A JP2003409479A JP2005175627A JP 2005175627 A JP2005175627 A JP 2005175627A JP 2003409479 A JP2003409479 A JP 2003409479A JP 2003409479 A JP2003409479 A JP 2003409479A JP 2005175627 A JP2005175627 A JP 2005175627A
- Authority
- JP
- Japan
- Prior art keywords
- data
- voice
- image data
- minutes
- digital camera
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004891 communication Methods 0.000 claims description 19
- 238000009826 distribution Methods 0.000 claims description 13
- 238000006243 chemical reaction Methods 0.000 description 19
- 238000003384 imaging method Methods 0.000 description 15
- 238000000034 method Methods 0.000 description 14
- 230000005540 biological transmission Effects 0.000 description 8
- 230000006835 compression Effects 0.000 description 7
- 238000007906 compression Methods 0.000 description 7
- 230000015654 memory Effects 0.000 description 7
- 230000006870 function Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 3
- 239000004973 liquid crystal related substance Substances 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 230000001276 controlling effect Effects 0.000 description 2
- 230000006837 decompression Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 230000008602 contraction Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000000875 corresponding effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000009432 framing Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 230000002250 progressing effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000010183 spectrum analysis Methods 0.000 description 1
- 230000003936 working memory Effects 0.000 description 1
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Character Discrimination (AREA)
- Editing Of Facsimile Originals (AREA)
- Telephonic Communication Services (AREA)
- Television Signal Processing For Recording (AREA)
- Studio Devices (AREA)
Abstract
Description
本発明は、自動的に議事録ファイルを作成する議事録作成システムに関する。 The present invention relates to a minutes creation system that automatically creates a minutes file.
従来、議事録は、会議の参加者がメモを取っておき、会議終了後、メモと会議の内容とを照らし合わせながら作成していた。このため、議事録を作成する参加者は、メモを取ることに専念するあまり、議論に参加することができないという不都合が生じていた。また、会議の内容を思い出しながらメモを整理するという煩雑な作業を伴っていた。 Conventionally, minutes of meetings have been created by participants taking notes, and after the meeting, the notes are checked against the contents of the meeting. For this reason, the participants who create the minutes have been inconvenient because they cannot concentrate on taking notes because they are devoted to taking notes. In addition, it involved a complicated task of organizing notes while remembering the contents of the meeting.
上記のような問題を解決するために、会議の参加者の映像を撮像するカメラと、参加者の発言から参加者の位置情報を特定する音声処理手段と、この位置情報に基づいて、参加者を示す映像のアイコン、および発言内容を示すアイコンからなるノードを発言内容単位で作成し、このノードをパーソナルコンピュータのモニタに表示するように制御する制御手段とを備えた議事進行支援システムが提案されている(特許文献1参照)。 In order to solve the above problems, a camera that captures a video of a participant in a conference, audio processing means for identifying the participant's location information from the participant's remarks, and the participant based on this location information A proposal proceeding support system comprising a control means for creating a node composed of an icon of a video indicating an icon and an icon indicating the content of a speech in units of speech content and controlling the node to be displayed on a monitor of a personal computer has been proposed. (See Patent Document 1).
特許文献1に記載の議事進行支援システムによれば、いつ、誰が、誰に対して、何を発言したかをアイコンベースの簡単なインターフェースで入力することが可能なので、議事録作成の手間を軽減することができる。また、議事の進行状況を一見して把握することが可能となる。さらに、作成された議事録は、離れた地点にいる多くの参加者が共有可能なマルチメディア議事録として利用することができる。 According to the agenda progress support system described in Patent Document 1, it is possible to input what and who has spoken to whom with a simple icon-based interface, thus reducing the trouble of creating minutes. can do. It is also possible to grasp the progress of proceedings at a glance. Furthermore, the created minutes can be used as multimedia minutes that can be shared by many participants at remote locations.
しかしながら、特許文献1に記載の議事進行支援システムには、カメラ、カメラ制御装置、映像切替え装置、マイク、音源推定装置、音声切替え装置、音声認識装置、主制御装置など、非常に多くの装置が必要であり、システム構成が大掛かりなものとなるため、利用可能な場所が限定されるという問題があった。 However, the proceeding support system described in Patent Document 1 includes a large number of devices such as a camera, a camera control device, a video switching device, a microphone, a sound source estimation device, a voice switching device, a voice recognition device, and a main control device. Since it is necessary and the system configuration becomes large, there is a problem that the available places are limited.
本発明は、上記課題を鑑みてなされたものであり、簡単なシステム構成で、場所を選ばずに利用することができる議事録作成システムを提供することを目的とする。 The present invention has been made in view of the above problems, and an object of the present invention is to provide a minutes creation system that can be used without choosing a place with a simple system configuration.
上記目的を達成するために、本発明の議事録作成システムは、会議室に設置された表示機器の表示エリアを撮像して、デジタルの画像データを出力するとともに、会議の参加者の発言を収録して、デジタルの音声データを出力するデジタルカメラと、前記デジタルカメラに接続して、前記画像データおよび音声データを外部に送信する通信装置と、前記通信装置から送信される前記画像データ内の文字を文字認識して、第1のテキストデータに変換する文字認識装置と、前記通信装置から送信される前記音声データを音声認識して、第2のテキストデータに変換する音声認識装置と、前記第1および第2のテキストデータを自動編集して、議事録ファイルを作成する編集装置と、前記議事録ファイルを通信ネットワーク経由で顧客に配信する配信装置とから構成したことを特徴とする。 In order to achieve the above object, the minutes creation system of the present invention images the display area of a display device installed in a conference room, outputs digital image data, and records the comments of participants in the conference A digital camera that outputs digital audio data; a communication device that is connected to the digital camera and transmits the image data and audio data to the outside; and characters in the image data transmitted from the communication device A character recognition device that recognizes the character and converts it into first text data, a speech recognition device that recognizes the speech data transmitted from the communication device and converts it into second text data, and the first An editing apparatus that automatically edits the first and second text data to create a minutes file, and distributes the minutes file to customers via a communication network Characterized by being composed of a communication apparatus.
なお、前記文字認識装置、音声認識装置、編集装置、および配信装置は、前記通信装置に通信ネットワークを介して接続されたサーバ内に設けられていることが好ましい。また、前記デジタルカメラは、前記顧客により音声入力された操作命令を音声認識する音声認識手段と、音声認識した操作命令に応じた処理を実行させるべく各部を制御する制御手段とを備えることが好ましい。さらに、前記議事録ファイルの配信後、予め登録されている前記顧客の銀行口座から、システム利用料を自動的に引き落とす自動決済装置を備えることが好ましい。 The character recognition device, the speech recognition device, the editing device, and the distribution device are preferably provided in a server connected to the communication device via a communication network. The digital camera preferably includes voice recognition means for recognizing an operation command inputted by voice from the customer, and control means for controlling each unit to execute processing according to the operation command recognized by voice. . Furthermore, it is preferable to provide an automatic settlement apparatus that automatically withdraws the system usage fee from the bank account of the customer registered in advance after the delivery of the minutes file.
本発明の議事録作成システムによれば、会議室に設置された表示機器の表示エリアを撮像して、デジタルの画像データを出力するとともに、会議の参加者の発言を収録して、デジタルの音声データを出力するデジタルカメラと、デジタルカメラに接続して、画像データおよび音声データを外部に送信する通信装置と、通信装置から送信される画像データ内の文字を文字認識して、第1のテキストデータに変換する文字認識装置と、通信装置から送信される音声データを音声認識して、第2のテキストデータに変換する音声認識装置と、第1および第2のテキストデータを自動編集して、議事録ファイルを作成する編集装置と、議事録ファイルを通信ネットワーク経由で顧客に配信する配信装置とから構成したので、簡単なシステム構成で、場所を選ばずに利用することができる。また、会議の内容を網羅した議事録を、汎用性のあるデータファイルの形で、会議終了後即座に入手することができる。 According to the minutes creation system of the present invention, the display area of the display device installed in the conference room is imaged, digital image data is output, and the speech of the conference participant is recorded, and the digital audio is recorded. A digital camera that outputs data, a communication device that is connected to the digital camera and transmits image data and audio data to the outside, a character in the image data transmitted from the communication device is recognized, and the first text A character recognition device that converts data, a speech recognition device that recognizes speech data transmitted from the communication device and converts the speech data into second text data, and automatically edits the first and second text data, Since it consists of an editing device that creates the minutes file and a distribution device that distributes the minutes file to the customers via the communication network, It can be utilized to not selected. In addition, the minutes covering the contents of the meeting can be obtained immediately after the meeting in the form of a versatile data file.
図1において、本発明の議事録作成システム2は、デジタルカメラ10、携帯電話11、およびサーバ12から構成される。携帯電話11は、電話回線網13を介してサーバ12に接続している。また、サーバ12は、インターネット14を介して顧客20(図2参照)のパーソナルコンピュータ(PC)15に接続している。
In FIG. 1, the
議事録作成システム2は、デジタルカメラ10で取得した画像データおよび音声データを、携帯電話11を介してサーバ12に送信し、送信された画像データおよび音声データを元に、サーバ12で議事録ファイルを作成して、この議事録ファイルをインターネット14経由で顧客20のPC15に配信するものである。
The
図2は、議事録作成システム2を利用して会議を進行している様子を示している。顧客20は、ホワイトボード21全体が撮影可能な場所にデジタルカメラ10を設置して、デジタルカメラ10に携帯電話11を接続し、PC15をインターネット14に接続する。そして、発表者22がホワイトボード21に書いた会議の内容をデジタルカメラ10で撮影するとともに、顧客20自身や、発表者22、他の参加者23の発言を収録する。
FIG. 2 shows a state in which a meeting is progressing using the
図3および図4において、デジタルカメラ10の前面には、撮像レンズ30、ファインダ対物窓31、およびマイクロホン32が設けられている。また、上面には、レリーズボタン33が設けられ、側面には、メモリカード56(図5参照)が着脱自在に装填されるメモリカードスロット34、およびコネクタ35(例えばUSBコネクタ)が設けられている。さらに、背面には、ファインダ接眼窓36、液晶表示器(LCD)37、および操作部38が設けられている。
3 and 4, an
レリーズボタン33は、2段階押しのスイッチとなっている。ファインダまたはLCD37によるフレーミングの後に、レリーズボタン33を軽く押圧(半押し)すると、CPU43(図5参照)で自動露光調整、自動焦点調整などの各種撮影準備処理が施される。この状態でレリーズボタン33をもう1度強く押圧(全押し)すると、撮影準備処理が施された1画面分の撮像信号が画像データに変換された後、後述する画像処理および圧縮処理が施され、メモリカード56に記録される。
The
デジタルカメラ10では、静止画撮影を行う静止画撮影モード、動画撮影を行う動画撮影モード、撮影した画像をLCD37に表示する再生モード、各種設定を行う設定モード、および静止画撮影とともに、常時マイクロホン32で音声を収録する議事録作成モードが選択可能となっている。
In the
また、デジタルカメラ10は、マイクロホン32を介して、カメラの操作命令を音声で受け付ける音声操作機能を備えている。この音声操作機能で扱われる操作命令には、撮影の指示、モード選択などの基本命令の他に、議事録作成モードで使用される会議開始/終了、音声収録開始/終了、データ送信などがある。
The
デジタルカメラ10の電気的構成を示す図5において、撮像レンズ30および絞り40には、レンズモータ41およびアイリスモータ42が接続されている。これらのモータ41、42はステッピングモータからなり、CPU43に接続されたモータドライバ44、45から送信される駆動パルスにより動作制御され、レリーズボタン33の半押しに伴う撮影準備処理を行う。
In FIG. 5 showing the electrical configuration of the
レンズモータ41は、操作部38に設けられたズーム操作ボタンの操作に連動して、撮像レンズ30のズームレンズをワイド側、あるいはテレ側に移動させ、撮像レンズ30のズーミングを行う。また、被写体距離やズームレンズの変倍に応じて撮像レンズ30のフォーカスレンズを移動させ、撮影条件が最適となるように撮像レンズ30の焦点調整を行う。アイリスモータ42は、絞り40を動作させ、撮像レンズ30の露出調整を行う。
The
撮像レンズ30の背後には、撮像レンズ30を透過した被写体光を光電変換して、撮像信号を出力するCCD46が配置されている。CCD46には、CPU43によって制御される図示しないタイミングジェネレータが接続され、このタイミングジェネレータから入力されるタイミング信号(クロックパルス)により、電子シャッタのシャッタ速度が決定される。
Behind the
CCD46から出力された撮像信号は、相関二重サンプリング回路(CDS)47に入力され、CCD46の各セルの蓄積電荷量に正確に対応したR、G、Bの画像データとして出力される。CDS47から出力された画像データは、増幅器(AMP)48で増幅され、A/D変換器(A/D)49でデジタルの画像データに変換される。
The imaging signal output from the
画像入力コントローラ50は、バス51を介してCPU43に接続され、CPU43の制御命令に応じて、CCD46、CDS47、AMP48、およびA/D49を制御する。A/D49から出力された画像データは、SDRAM52に一旦格納される。この画像データは、LCDドライバ53を介してLCD37に表示される。
The
画像信号処理回路54は、SDRAM52から画像データを読み出して、階調変換、ホワイトバランス補正、γ補正処理などの各種画像処理を施し、この画像データを再度SDRAM52に格納する。
The image
画像信号処理回路54で各種処理を施された画像データは、SDRAM52から図示しないYC変換処理回路に読み出され、輝度信号Yと色差信号Cr、Cbとに変換される。変換された画像データは、図示しない圧縮伸長処理回路により、所定の圧縮形式(例えばJPEG形式)で画像圧縮を施される。圧縮された画像データは、メディアコントローラ55を経由してメモリカード56に記録される。あるいは、外部I/F57、コネクタ35を経由して外部に送信される。
The image data that has been subjected to various processes by the image
CPU43には、前述のレリーズボタン33、操作部38の他に、EEPROM58が接続されている。EEPROM58には、各種制御用のプログラムや設定情報が記録されている。また、音声操作機能を利用する顧客20の操作命令の音声データ(語彙データおよび声紋データ)が予め登録されている。CPU43は、これらの情報をEEPROM58から作業用メモリであるSDRAM52に読み出して、各種処理を実行する。
In addition to the
マイクロホン32には、増幅器(AMP)59が接続されている。マイクロホン32から入力された音声は、増幅器(AMP)59で増幅され、A/D変換器(A/D)60でデジタルの音声データに変換される。A/D60から出力された音声データは、CPU43でノイズ除去などの各種信号処理を施された後、メモリカード56に記録される。また、議事録作成モードでは、語彙変換回路61および声紋変換回路62に送信される。
An amplifier (AMP) 59 is connected to the
語彙変換回路61および声紋変換回路62は、A/D60から出力された音声データに対して、語彙変換および声紋変換をそれぞれ施し、語彙データおよび声紋データを生成する。なお、語彙変換回路61は、後述するサーバ12の音声認識装置92と同様の方式で語彙変換を行う。
The
第1、第2比較回路63、64には、EEPROM58に予め登録されている顧客20の語彙データおよび声紋データが、CPU43を通じてプリセットされる。第1、第2比較回路63、64は、これらのプリセットされたデータと、語彙変換回路61および声紋変換回路62で生成された語彙データおよび声紋データとを比較する。そして、生成されたデータと登録されているデータとが一致した場合に、トリガ信号を出力する。ここで、第1比較回路63は、トリガ信号とともに一致した語彙データをCPU43に送信する。
The vocabulary data and voiceprint data of the
論理回路65は、第1、第2比較回路63、64の出力の論理積をとり、第1、第2比較回路63、64でともにトリガ信号が発生したとき、つまり、語彙データ、声紋データともに、生成されたデータと登録されているデータとが一致したときにのみ、CPU43に割り込み信号を送信する。CPU43は、論理回路65からの割り込み信号を受信して、第1比較回路63から送信された語彙データが表す操作命令に対応した処理をデジタルカメラ10の各部に実行させる。
The
CPU43は、顧客20から会議開始命令が音声入力された場合、携帯電話11および電話回線網13を介して、サーバ12との回線をオープンさせる。音声収録開始/終了命令が入力された場合は、マイクロホン32による音声収録を開始/終了させる。また、データ送信命令が入力された場合は、メモリカード56に記録されている画像データおよび音声データを、携帯電話11を介してサーバ12に送信する。会議終了命令が入力された場合は、画像データおよび音声データをサーバ12に送信した後、サーバ12との回線をクローズさせる。
The
デジタルカメラ10では、携帯電話11および電話回線網13を介して、議事録作成モードでメモリカード56に記録された画像データおよび音声データを、随時一定の間隔でサーバ12に送信する。また、議事録作成モード使用時に、メモリカード56の記録容量が不足した場合には、ビープ音やランプを点灯させるなどして、顧客20に対して事前に警告を発し、サーバ12へのデータ送信、あるいはメモリカード56の交換を促す。
In the
図6に示すように、携帯電話11は、CPU70により各部を統括的に制御される。この携帯電話11は、通信相手の音声や着信メロディを出力する受話スピーカ71と、話し手の音声を集音する送話マイク72と、各種選択キーやダイヤルキーからなる操作部73とを備えている。また、携帯電話11には、液晶表示器(LCD)74、アンテナ75、コネクタ76(例えばUSBコネクタ)、およびメモリ77が設けられている。
As shown in FIG. 6, the
LCD74には、各種設定メニューからなるメニュー画面、着信相手の電話番号やメールアドレス、インターネットサーバからダウンロードした画像などが、LCDドライバ78を介して表示される。アンテナ75は、通信I/F79を介して、他の携帯電話などからの電波信号を受信するとともに、携帯電話11から発信される電波信号を外部に送信する。コネクタ76は、デジタルカメラ10のコネクタ35とUSBケーブルなどで接続され、外部I/F80を介してデータの送受信を行う。メモリ77には、デジタルカメラ10から送信される画像データや音声データが一時的に格納される。
The
図7に示すように、サーバ12は、バッファメモリ90、文字認識装置91、音声認識装置92、編集装置93、配信装置94、および自動決済装置95を備えている。バッファメモリ90は、デジタルカメラ10で取得され、携帯電話11から電話回線網13を介して送信される画像データおよび音声データを一時的に格納し、これらのデータを時系列で並べて分別し、一定の間隔で文字認識装置91および音声認識装置92に送信する。
As shown in FIG. 7, the
文字認識装置91は、文字認識ソフトを備えており、送信された画像データ(ホワイトボード21全体を撮影した画像データ)内の文字を文字認識して、第1のテキストデータに変換する。音声認識装置92は、音声認識ソフトを備えており、送信された音声データ(会議の参加者の発言を収録した音声データ)を音声認識して、第2のテキストデータに変換する。
The
文字認識は、まず、画像データの中から文字が書かれた部分を抜き出すレイアウト解析を行い、これにより抜き出された部分から1文字1文字を切り出していき、この1文字1文字について、その特徴量、例えばエッジ、輪郭、方向寄与度などを抽出し、図示しない認識辞書に予め登録されている標準パターンと比較照合する。そして、マッチした数種の標準パターンを候補として出力し、この候補から前後の文脈などを加味しながら誤認識を訂正して、最終的に残った候補を第1のテキストデータに変換する。 In character recognition, first, layout analysis is performed to extract a portion in which characters are written from image data, and one character is extracted from the extracted portion. A quantity such as an edge, contour, direction contribution, etc. is extracted and compared with a standard pattern registered in advance in a recognition dictionary (not shown). Then, several types of matched standard patterns are output as candidates, and misrecognition is corrected while taking into account the context before and after the candidates, and finally the remaining candidates are converted into first text data.
一方、音声認識は、15〜30ms程度の音声データを1フレームとし、5〜20msずつシフトしながら、高速フーリエ変換や線形予測法によりスペクトル分析を行って、その特徴量を算出する。次に、非線形伸縮パターンマッチングや隠れマルコフモデルを用いて、算出した特徴量と図示しない認識辞書に予め登録されている標準パターンとを比較照合する。そして、マッチした数種の標準パターンを候補として出力し、この候補から前後の文脈などを加味しながら誤認識を訂正して、最終的に残った候補を第2のテキストデータに変換する。なお、音声認識をより高精度に行うために、会議開始前に会議の参加者の音声を、デジタルカメラ10を介して音声認識装置92にサンプリングデータとして予め登録しておき、このサンプリングデータを元に音声認識を行ってもよい。
On the other hand, in speech recognition, speech data of about 15 to 30 ms is set as one frame, and spectrum analysis is performed by fast Fourier transform or linear prediction while shifting by 5 to 20 ms, and the feature amount is calculated. Next, using a non-linear expansion / contraction pattern matching or a hidden Markov model, the calculated feature value is compared with a standard pattern registered in advance in a recognition dictionary (not shown). Then, several types of matched standard patterns are output as candidates, and misrecognition is corrected while taking into consideration the context before and after the candidates, and finally the remaining candidates are converted into second text data. In order to perform voice recognition with higher accuracy, the voices of the participants of the conference are registered in advance as sampling data in the
編集装置93は、文字認識装置91および音声認識装置92で変換された第1、および第2のテキストデータを自動編集して、議事録ファイルを作成する。配信装置94には、顧客20の電子メールアドレスが予め登録されている。この配信装置94は、議事録ファイルのヘッダに作成日時、顧客20の氏名を付記して、これをインターネット14経由で顧客20のPC15に電子メールの形で配信する。
The
自動決済装置95には、顧客20の銀行口座が予め登録されている。この自動決済装置95は、配信装置94による議事録ファイルの配信後、電子決済により、顧客20の銀行口座からシステム利用料を自動的に引き落とす。
In the
次に、上記実施形態による作用について、図8〜10のフローチャートを参照して説明する。まず、図8に示すように、顧客20は、ホワイトボード21全体が撮影可能な場所にデジタルカメラ10を設置し、USBケーブルなどでコネクタ35、76を繋ぎ、デジタルカメラ10に携帯電話11を接続する。また、PC15をインターネット14に接続する。そして、デジタルカメラ10の電源を投入し、議事録作成モードを選択する。
Next, the effect | action by the said embodiment is demonstrated with reference to the flowchart of FIGS. First, as shown in FIG. 8, the
会議の開始とともに、顧客20により会議開始命令がマイクロホン32に音声入力される。マイクロホン32から入力された顧客20の音声は、AMP59で増幅され、A/D60でデジタルの音声データに変換される。
At the start of the conference, the
図9に示すように、デジタルカメラ10では、議事録作成モードの選択に伴って、EEPROM58に予め登録されている顧客20の語彙データおよび声紋データが、CPU43を通じて第1、第2比較回路63、64にプリセットされる。A/D60から出力された音声データは、語彙変換回路61および声紋変換回路62により、語彙変換および声紋変換をそれぞれ施され、語彙データおよび声紋データが生成される。次に、第1、第2比較回路63、64で、プリセットされたデータと、生成された語彙データおよび声紋データとが比較される。そして、生成されたデータと登録されているデータとが一致した場合に、第1、第2比較回路63、64からトリガ信号が出力される。ここで、第1比較回路63からは、トリガ信号とともに一致した語彙データがCPU43に送信される。
As shown in FIG. 9, in the
論理回路65では、第1、第2比較回路63、64の出力の論理積が算出され、第1、第2比較回路63、64でともにトリガ信号が発生したときにのみ、CPU43に割り込み信号が送信される。CPU43では、論理回路65からの割り込み信号を受信して、携帯電話11および電話回線網13を介してサーバ12との回線をオープンさせる。
In the
図8において、回線開通後、顧客20により音声収録開始命令がマイクロホン32に音声入力されると、図9に示す処理と同様の手順で音声認識処理が行われ、マイクロホン32による会議の参加者の発言の収録が開始される。
8, when a voice recording start command is input to the
マイクロホン32で収録された音声は、上記同様にAMP59で増幅され、A/D60でデジタルの音声データに変換される。A/D60から出力された音声データは、CPU43でノイズ除去などの各種信号処理を施された後、メモリカード56に記録される。
The sound recorded by the
デジタルカメラ10の撮像レンズ30、絞り40を介して入射した被写体光は、CCD46により光電変換され、CDS47でサンプリングされる。CDS47から出力された画像データは、AMP48で増幅され、A/D49でデジタルの画像データに変換される。デジタル変換された画像データは、画像入力コントローラ50を介してSDRAM52に順次格納され、LCD37にスルー画像として表示される。
The subject light incident through the
上記の状態で、発表者22がホワイトボード21に書いた会議の内容が1段落したときに、顧客20により撮影命令がマイクロホン32に音声入力されると、図9に示す処理と同様の手順で音声認識処理が行われ、そのときSDRAM52に格納されている画像データ(ホワイトボード21全体を撮影した画像データ)が画像信号処理回路54に読み出され、各種画像処理が施される。
In the state described above, when the content of the conference written by the
画像信号処理回路54で各種処理を施された画像データは、SDRAM52から図示しないYC変換処理回路に読み出され、輝度信号Yと色差信号Cr、Cbとに変換される。変換された画像データは、図示しない圧縮伸長処理回路により、所定の圧縮形式(例えばJPEG形式)で画像圧縮を施される。圧縮された画像データは、メディアコントローラ55を経由してメモリカード56に記録される。
The image data that has been subjected to various processes by the image
メモリカード56に記録された画像データおよび音声データは、携帯電話11から電話回線網13を介して、随時一定の間隔でサーバ12に送信される。メモリカード56の記録容量が不足した場合には、顧客20に対して事前に警告が発せられ、サーバ12へのデータ送信、あるいはメモリカード56の交換が促される。
Image data and audio data recorded in the
顧客20によりデータ送信命令がマイクロホン32に音声入力されると、図9に示す処理と同様の手順で音声認識処理が行われ、メモリカード56に記録されている画像データおよび音声データが、携帯電話11を介してサーバ12に送信される。これら一連の処理は、音声入力された操作命令に応じて、会議が終了するまで繰り返し行われる。
When the
顧客20により会議終了命令がマイクロホン32に音声入力されると、図9に示す処理と同様の手順で音声認識処理が行われ、画像データおよび音声データがサーバ12に送信された後、サーバ12との回線がクローズされる。
When the
図10に示すように、サーバ12側では、まず、顧客20による会議開始命令を受信して、携帯電話11を介してデジタルカメラ10との回線がオープンされる。回線開通後、携帯電話11を介してデジタルカメラ10から送信された画像データおよび音声データは、バッファメモリ90に一時的に格納される。バッファメモリ90では、これらのデータが時系列で並べて分別され、一定の間隔で文字認識装置91および音声認識装置92に送信される。
As shown in FIG. 10, the
デジタルカメラ10から送信された画像データは、文字認識装置91で画像データ内の文字が文字認識され、第1のテキストデータに変換される。一方、音声データは、音声認識装置92で会議の参加者の発言が音声認識され、第2のテキストデータに変換される。会議終了命令が送信された場合は、編集装置93で第1のテキストデータと第2のテキストデータが自動編集され、議事録ファイルが作成される。送信されたデータが上記のいずれでもない場合は、エラー処理が行われる。
In the image data transmitted from the
編集装置93で作成された議事録ファイルは、配信装置94でヘッダに作成日時、顧客20の氏名が付記され、インターネット14経由で顧客20のPC15に電子メールの形で配信される。配信装置94による議事録ファイルの配信後、自動決済装置95により、顧客20の銀行口座からシステム利用料が自動的に引き落とされる。
The minutes file created by the
上記のような構成であると、顧客20はデジタルカメラ10、携帯電話11、およびPC15を用意するだけでよく、電話回線網13に接続可能な環境であれば、どんな場所でも議事録作成システム2を利用することができる。また、音声操作機能を備えたデジタルカメラ10を用いているので、顧客20はハンズフリーで撮影、音声収録、データ送信などを行え、議論に参加することが可能となる。さらに、会議終了後、会議の参加者の各々のPCに議事録ファイルを電子メールにて転送するだけで、容易且つ確実に情報を共有することができる。
With the configuration as described above, the
なお、上記実施形態では、デジタルカメラ10で取得した画像データおよび音声データを携帯電話11を介してサーバ12に送信しているが、モジュラージャックを介して電話回線網13に直接デジタルカメラ10を接続してもよく、顧客20のPC15にデジタルカメラ10を接続して、インターネット14経由でデータ送信を行ってもよい。また、サーバ12内に文字認識装置91、音声認識装置92、編集装置93、および配信装置94を設けているが、これらを独立して設けてもよい。
In the above embodiment, image data and audio data acquired by the
さらに、サーバ12の文字認識装置91、音声認識回路92で変換した第1、第2のテキストデータを、RTF(RichText Format )やHTML(HyperText Markup Language )などの、より汎用性の高いファイル形式で出力してもよい。このようにすると、議事録ファイルの再編集を円滑に行うことができる。
Furthermore, the first and second text data converted by the
2 議事録作成システム
10 デジタルカメラ
11 携帯電話
12 サーバ
13 電話回線網
14 インターネット
15 パーソナルコンピュータ(PC)
20 顧客
21 ホワイトボード
30 撮像レンズ
32 マイクロホン
33 レリーズボタン
35 コネクタ
37 液晶表示器(LCD)
43 CPU
46 CCD
52 SDRAM
54 画像信号処理回路
56 メモリカード
58 EEPROM
61 語彙変換回路
62 声紋変換回路
63、64 第1、第2比較回路
65 論理回路
75 アンテナ
76 コネクタ
77 メモリ
91 文字認識装置
92 音声認識装置
93 編集装置
94 配信装置
95 自動決済装置
2
20 Customer 21
43 CPU
46 CCD
52 SDRAM
54 Image
61
Claims (4)
前記デジタルカメラに接続して、前記画像データおよび音声データを外部に送信する通信装置と、
前記通信装置から送信される前記画像データ内の文字を文字認識して、第1のテキストデータに変換する文字認識装置と、
前記通信装置から送信される前記音声データを音声認識して、第2のテキストデータに変換する音声認識装置と、
前記第1および第2のテキストデータを自動編集して、議事録ファイルを作成する編集装置と、
前記議事録ファイルを通信ネットワーク経由で顧客に配信する配信装置とから構成したことを特徴とする議事録作成システム。 A digital camera that captures the display area of the display device installed in the conference room, outputs digital image data, records the remarks of participants in the conference, and outputs digital audio data;
A communication device connected to the digital camera and transmitting the image data and audio data to the outside;
A character recognition device that recognizes characters in the image data transmitted from the communication device and converts the characters into first text data;
A voice recognition device that recognizes the voice data transmitted from the communication device and converts the voice data into second text data;
An editing device that automatically edits the first and second text data to create a minutes file;
A minutes creation system comprising: a delivery device for delivering the minutes file to a customer via a communication network.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003409479A JP2005175627A (en) | 2003-12-08 | 2003-12-08 | System for taking proceedings |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003409479A JP2005175627A (en) | 2003-12-08 | 2003-12-08 | System for taking proceedings |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005175627A true JP2005175627A (en) | 2005-06-30 |
Family
ID=34730853
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003409479A Pending JP2005175627A (en) | 2003-12-08 | 2003-12-08 | System for taking proceedings |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2005175627A (en) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4787328B2 (en) * | 2005-10-31 | 2011-10-05 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | Method and apparatus for capturing audio during a conference call |
US8494057B2 (en) | 2009-10-30 | 2013-07-23 | Samsung Electronics Co., Ltd. | Video encoding apparatus and method |
JP2013191039A (en) * | 2012-03-14 | 2013-09-26 | Toshiba Corp | Ballot result tabulation system |
JP5450864B1 (en) * | 2013-02-01 | 2014-03-26 | 征治 久保 | Combined system |
JP2016534435A (en) * | 2014-06-26 | 2016-11-04 | シャオミ・インコーポレイテッド | File locking method, file locking device, program, and recording medium |
US9904774B2 (en) | 2014-06-26 | 2018-02-27 | Xiaomi Inc. | Method and device for locking file |
JP2020009459A (en) * | 2016-03-04 | 2020-01-16 | 株式会社リコー | Voice control of interactive whiteboard appliances |
JP2020021288A (en) * | 2018-07-31 | 2020-02-06 | 株式会社リコー | Apparatus, method and system for processing information |
CN112581965A (en) * | 2020-12-11 | 2021-03-30 | 天津讯飞极智科技有限公司 | Transcription method, device, recording pen and storage medium |
KR20210054157A (en) * | 2019-11-05 | 2021-05-13 | 두산중공업 주식회사 | Apparatus and method for producing conference record |
CN113205808A (en) * | 2021-04-27 | 2021-08-03 | 无锡星凝互动科技有限公司 | AI (Artificial intelligence) consultation based cloud computing building method and system |
-
2003
- 2003-12-08 JP JP2003409479A patent/JP2005175627A/en active Pending
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4787328B2 (en) * | 2005-10-31 | 2011-10-05 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | Method and apparatus for capturing audio during a conference call |
US8494057B2 (en) | 2009-10-30 | 2013-07-23 | Samsung Electronics Co., Ltd. | Video encoding apparatus and method |
JP2013191039A (en) * | 2012-03-14 | 2013-09-26 | Toshiba Corp | Ballot result tabulation system |
JP5450864B1 (en) * | 2013-02-01 | 2014-03-26 | 征治 久保 | Combined system |
JP2016534435A (en) * | 2014-06-26 | 2016-11-04 | シャオミ・インコーポレイテッド | File locking method, file locking device, program, and recording medium |
US9904774B2 (en) | 2014-06-26 | 2018-02-27 | Xiaomi Inc. | Method and device for locking file |
JP2020009459A (en) * | 2016-03-04 | 2020-01-16 | 株式会社リコー | Voice control of interactive whiteboard appliances |
JP2020021288A (en) * | 2018-07-31 | 2020-02-06 | 株式会社リコー | Apparatus, method and system for processing information |
KR20210054157A (en) * | 2019-11-05 | 2021-05-13 | 두산중공업 주식회사 | Apparatus and method for producing conference record |
KR102291113B1 (en) * | 2019-11-05 | 2021-08-19 | 두산중공업 주식회사 | Apparatus and method for producing conference record |
CN112581965A (en) * | 2020-12-11 | 2021-03-30 | 天津讯飞极智科技有限公司 | Transcription method, device, recording pen and storage medium |
CN113205808A (en) * | 2021-04-27 | 2021-08-03 | 无锡星凝互动科技有限公司 | AI (Artificial intelligence) consultation based cloud computing building method and system |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102783136B (en) | For taking the imaging device of self-portrait images | |
US6038295A (en) | Apparatus and method for recording, communicating and administering digital images | |
US6721001B1 (en) | Digital camera with voice recognition annotation | |
EP1929368B1 (en) | Image capture method and device also capturing audio | |
CN100535736C (en) | Controlling method of using voice recognition, and digital photographing apparatus using the method | |
US5893037A (en) | Combined electronic/silver-halide image capture system with cellular transmission capability | |
JP4639907B2 (en) | Imaging apparatus, audio recording method, and program | |
JP2010219692A (en) | Image capturing apparatus and camera | |
JP4595704B2 (en) | Image processing apparatus, imaging apparatus, and program | |
JP2005175627A (en) | System for taking proceedings | |
US20040119837A1 (en) | Image pickup apparatus | |
CN103035020A (en) | Mobile terminal and image remarking method thereof | |
JP4639902B2 (en) | Imaging apparatus, audio recording method, and program | |
KR20050113058A (en) | Method and apparatus for compounding taken image in mobile terminal having camera | |
JP2005197867A (en) | System and method for conference progress support and utterance input apparatus | |
JP2019135609A (en) | Character input support system, character input support control device, and character input support program | |
KR20050059759A (en) | Photographing guidance method and apparatus for camera phone | |
CN116472705A (en) | Conference content display method, conference system and conference equipment | |
CN106453905A (en) | Automatic shooting control method and system for mobile terminal based on voice recognition | |
JP2012105234A (en) | Subtitle generation and distribution system, subtitle generation and distribution method, and program | |
JP2000333150A (en) | Video conference system | |
KR100835376B1 (en) | Method and apparatus for recording moving images in mobile telecommunication terminal | |
JP7306168B2 (en) | shooting system | |
JP2019159333A (en) | Character input support system and character input support program | |
JP2006180089A (en) | Digital camera and searching system |