JP2005175627A - System for taking proceedings - Google Patents

System for taking proceedings Download PDF

Info

Publication number
JP2005175627A
JP2005175627A JP2003409479A JP2003409479A JP2005175627A JP 2005175627 A JP2005175627 A JP 2005175627A JP 2003409479 A JP2003409479 A JP 2003409479A JP 2003409479 A JP2003409479 A JP 2003409479A JP 2005175627 A JP2005175627 A JP 2005175627A
Authority
JP
Japan
Prior art keywords
data
voice
image data
minutes
digital camera
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003409479A
Other languages
Japanese (ja)
Inventor
Yoshiro Aoyanagi
好郎 青柳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Holdings Corp
Original Assignee
Fuji Photo Film Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Photo Film Co Ltd filed Critical Fuji Photo Film Co Ltd
Priority to JP2003409479A priority Critical patent/JP2005175627A/en
Publication of JP2005175627A publication Critical patent/JP2005175627A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Character Discrimination (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Telephonic Communication Services (AREA)
  • Television Signal Processing For Recording (AREA)
  • Studio Devices (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a simple system for taking proceedings available at any place. <P>SOLUTION: The system 2 for taking proceedings comprises a digital camera 10 for picking up the image of a white board 21 on which the content of a meeting is written, outputting digital image data, recording the speech of participants at the meeting and delivering digital voice data, a portable telephone 11 for transmitting the image data and the voice data to the outside, and a server 12 comprising a unit 91 for recognizing characters in the image data and converting the characters into first text data, a unit 92 for recognizing voice in the voice data and converting it into second text data, a unit 93 for editing the first and second text data automatically to make a file of proceedings, and a unit 95 for downloading the file of proceedings to the personal computer 15 of a client through the Internet 14. <P>COPYRIGHT: (C)2005,JPO&NCIPI

Description

本発明は、自動的に議事録ファイルを作成する議事録作成システムに関する。   The present invention relates to a minutes creation system that automatically creates a minutes file.

従来、議事録は、会議の参加者がメモを取っておき、会議終了後、メモと会議の内容とを照らし合わせながら作成していた。このため、議事録を作成する参加者は、メモを取ることに専念するあまり、議論に参加することができないという不都合が生じていた。また、会議の内容を思い出しながらメモを整理するという煩雑な作業を伴っていた。   Conventionally, minutes of meetings have been created by participants taking notes, and after the meeting, the notes are checked against the contents of the meeting. For this reason, the participants who create the minutes have been inconvenient because they cannot concentrate on taking notes because they are devoted to taking notes. In addition, it involved a complicated task of organizing notes while remembering the contents of the meeting.

上記のような問題を解決するために、会議の参加者の映像を撮像するカメラと、参加者の発言から参加者の位置情報を特定する音声処理手段と、この位置情報に基づいて、参加者を示す映像のアイコン、および発言内容を示すアイコンからなるノードを発言内容単位で作成し、このノードをパーソナルコンピュータのモニタに表示するように制御する制御手段とを備えた議事進行支援システムが提案されている(特許文献1参照)。   In order to solve the above problems, a camera that captures a video of a participant in a conference, audio processing means for identifying the participant's location information from the participant's remarks, and the participant based on this location information A proposal proceeding support system comprising a control means for creating a node composed of an icon of a video indicating an icon and an icon indicating the content of a speech in units of speech content and controlling the node to be displayed on a monitor of a personal computer has been proposed. (See Patent Document 1).

特許文献1に記載の議事進行支援システムによれば、いつ、誰が、誰に対して、何を発言したかをアイコンベースの簡単なインターフェースで入力することが可能なので、議事録作成の手間を軽減することができる。また、議事の進行状況を一見して把握することが可能となる。さらに、作成された議事録は、離れた地点にいる多くの参加者が共有可能なマルチメディア議事録として利用することができる。   According to the agenda progress support system described in Patent Document 1, it is possible to input what and who has spoken to whom with a simple icon-based interface, thus reducing the trouble of creating minutes. can do. It is also possible to grasp the progress of proceedings at a glance. Furthermore, the created minutes can be used as multimedia minutes that can be shared by many participants at remote locations.

国際公開第96/27988号パンフレットInternational Publication No. 96/27988 Pamphlet

しかしながら、特許文献1に記載の議事進行支援システムには、カメラ、カメラ制御装置、映像切替え装置、マイク、音源推定装置、音声切替え装置、音声認識装置、主制御装置など、非常に多くの装置が必要であり、システム構成が大掛かりなものとなるため、利用可能な場所が限定されるという問題があった。   However, the proceeding support system described in Patent Document 1 includes a large number of devices such as a camera, a camera control device, a video switching device, a microphone, a sound source estimation device, a voice switching device, a voice recognition device, and a main control device. Since it is necessary and the system configuration becomes large, there is a problem that the available places are limited.

本発明は、上記課題を鑑みてなされたものであり、簡単なシステム構成で、場所を選ばずに利用することができる議事録作成システムを提供することを目的とする。   The present invention has been made in view of the above problems, and an object of the present invention is to provide a minutes creation system that can be used without choosing a place with a simple system configuration.

上記目的を達成するために、本発明の議事録作成システムは、会議室に設置された表示機器の表示エリアを撮像して、デジタルの画像データを出力するとともに、会議の参加者の発言を収録して、デジタルの音声データを出力するデジタルカメラと、前記デジタルカメラに接続して、前記画像データおよび音声データを外部に送信する通信装置と、前記通信装置から送信される前記画像データ内の文字を文字認識して、第1のテキストデータに変換する文字認識装置と、前記通信装置から送信される前記音声データを音声認識して、第2のテキストデータに変換する音声認識装置と、前記第1および第2のテキストデータを自動編集して、議事録ファイルを作成する編集装置と、前記議事録ファイルを通信ネットワーク経由で顧客に配信する配信装置とから構成したことを特徴とする。   In order to achieve the above object, the minutes creation system of the present invention images the display area of a display device installed in a conference room, outputs digital image data, and records the comments of participants in the conference A digital camera that outputs digital audio data; a communication device that is connected to the digital camera and transmits the image data and audio data to the outside; and characters in the image data transmitted from the communication device A character recognition device that recognizes the character and converts it into first text data, a speech recognition device that recognizes the speech data transmitted from the communication device and converts it into second text data, and the first An editing apparatus that automatically edits the first and second text data to create a minutes file, and distributes the minutes file to customers via a communication network Characterized by being composed of a communication apparatus.

なお、前記文字認識装置、音声認識装置、編集装置、および配信装置は、前記通信装置に通信ネットワークを介して接続されたサーバ内に設けられていることが好ましい。また、前記デジタルカメラは、前記顧客により音声入力された操作命令を音声認識する音声認識手段と、音声認識した操作命令に応じた処理を実行させるべく各部を制御する制御手段とを備えることが好ましい。さらに、前記議事録ファイルの配信後、予め登録されている前記顧客の銀行口座から、システム利用料を自動的に引き落とす自動決済装置を備えることが好ましい。   The character recognition device, the speech recognition device, the editing device, and the distribution device are preferably provided in a server connected to the communication device via a communication network. The digital camera preferably includes voice recognition means for recognizing an operation command inputted by voice from the customer, and control means for controlling each unit to execute processing according to the operation command recognized by voice. . Furthermore, it is preferable to provide an automatic settlement apparatus that automatically withdraws the system usage fee from the bank account of the customer registered in advance after the delivery of the minutes file.

本発明の議事録作成システムによれば、会議室に設置された表示機器の表示エリアを撮像して、デジタルの画像データを出力するとともに、会議の参加者の発言を収録して、デジタルの音声データを出力するデジタルカメラと、デジタルカメラに接続して、画像データおよび音声データを外部に送信する通信装置と、通信装置から送信される画像データ内の文字を文字認識して、第1のテキストデータに変換する文字認識装置と、通信装置から送信される音声データを音声認識して、第2のテキストデータに変換する音声認識装置と、第1および第2のテキストデータを自動編集して、議事録ファイルを作成する編集装置と、議事録ファイルを通信ネットワーク経由で顧客に配信する配信装置とから構成したので、簡単なシステム構成で、場所を選ばずに利用することができる。また、会議の内容を網羅した議事録を、汎用性のあるデータファイルの形で、会議終了後即座に入手することができる。   According to the minutes creation system of the present invention, the display area of the display device installed in the conference room is imaged, digital image data is output, and the speech of the conference participant is recorded, and the digital audio is recorded. A digital camera that outputs data, a communication device that is connected to the digital camera and transmits image data and audio data to the outside, a character in the image data transmitted from the communication device is recognized, and the first text A character recognition device that converts data, a speech recognition device that recognizes speech data transmitted from the communication device and converts the speech data into second text data, and automatically edits the first and second text data, Since it consists of an editing device that creates the minutes file and a distribution device that distributes the minutes file to the customers via the communication network, It can be utilized to not selected. In addition, the minutes covering the contents of the meeting can be obtained immediately after the meeting in the form of a versatile data file.

図1において、本発明の議事録作成システム2は、デジタルカメラ10、携帯電話11、およびサーバ12から構成される。携帯電話11は、電話回線網13を介してサーバ12に接続している。また、サーバ12は、インターネット14を介して顧客20(図2参照)のパーソナルコンピュータ(PC)15に接続している。   In FIG. 1, the minutes creation system 2 of the present invention includes a digital camera 10, a mobile phone 11, and a server 12. The cellular phone 11 is connected to the server 12 via the telephone line network 13. The server 12 is connected to a personal computer (PC) 15 of the customer 20 (see FIG. 2) via the Internet 14.

議事録作成システム2は、デジタルカメラ10で取得した画像データおよび音声データを、携帯電話11を介してサーバ12に送信し、送信された画像データおよび音声データを元に、サーバ12で議事録ファイルを作成して、この議事録ファイルをインターネット14経由で顧客20のPC15に配信するものである。   The minutes creation system 2 transmits the image data and sound data acquired by the digital camera 10 to the server 12 via the mobile phone 11, and the minutes file is sent by the server 12 based on the transmitted image data and sound data. And the minutes file is distributed to the PC 15 of the customer 20 via the Internet 14.

図2は、議事録作成システム2を利用して会議を進行している様子を示している。顧客20は、ホワイトボード21全体が撮影可能な場所にデジタルカメラ10を設置して、デジタルカメラ10に携帯電話11を接続し、PC15をインターネット14に接続する。そして、発表者22がホワイトボード21に書いた会議の内容をデジタルカメラ10で撮影するとともに、顧客20自身や、発表者22、他の参加者23の発言を収録する。   FIG. 2 shows a state in which a meeting is progressing using the minutes creation system 2. The customer 20 installs the digital camera 10 in a place where the entire whiteboard 21 can be photographed, connects the mobile phone 11 to the digital camera 10, and connects the PC 15 to the Internet 14. Then, the content of the conference written by the presenter 22 on the whiteboard 21 is photographed by the digital camera 10, and the statements of the customer 20, the presenter 22, and other participants 23 are recorded.

図3および図4において、デジタルカメラ10の前面には、撮像レンズ30、ファインダ対物窓31、およびマイクロホン32が設けられている。また、上面には、レリーズボタン33が設けられ、側面には、メモリカード56(図5参照)が着脱自在に装填されるメモリカードスロット34、およびコネクタ35(例えばUSBコネクタ)が設けられている。さらに、背面には、ファインダ接眼窓36、液晶表示器(LCD)37、および操作部38が設けられている。   3 and 4, an imaging lens 30, a viewfinder objective window 31, and a microphone 32 are provided on the front surface of the digital camera 10. A release button 33 is provided on the upper surface, and a memory card slot 34 into which a memory card 56 (see FIG. 5) is detachably loaded and a connector 35 (for example, a USB connector) are provided on the side surface. . Further, a finder eyepiece window 36, a liquid crystal display (LCD) 37, and an operation unit 38 are provided on the back surface.

レリーズボタン33は、2段階押しのスイッチとなっている。ファインダまたはLCD37によるフレーミングの後に、レリーズボタン33を軽く押圧(半押し)すると、CPU43(図5参照)で自動露光調整、自動焦点調整などの各種撮影準備処理が施される。この状態でレリーズボタン33をもう1度強く押圧(全押し)すると、撮影準備処理が施された1画面分の撮像信号が画像データに変換された後、後述する画像処理および圧縮処理が施され、メモリカード56に記録される。   The release button 33 is a two-stage push switch. When the release button 33 is lightly pressed (half-pressed) after framing by the viewfinder or the LCD 37, the CPU 43 (see FIG. 5) performs various photographing preparation processes such as automatic exposure adjustment and automatic focus adjustment. In this state, when the release button 33 is pressed again (fully pressed) once, the imaging signal for one screen subjected to the imaging preparation process is converted into image data, and then image processing and compression processing described later are performed. Recorded in the memory card 56.

デジタルカメラ10では、静止画撮影を行う静止画撮影モード、動画撮影を行う動画撮影モード、撮影した画像をLCD37に表示する再生モード、各種設定を行う設定モード、および静止画撮影とともに、常時マイクロホン32で音声を収録する議事録作成モードが選択可能となっている。   In the digital camera 10, the microphone 32 is always used together with a still image shooting mode for shooting still images, a moving image shooting mode for shooting movies, a playback mode for displaying captured images on the LCD 37, a setting mode for setting various settings, and still image shooting. The minutes creation mode for recording audio can be selected.

また、デジタルカメラ10は、マイクロホン32を介して、カメラの操作命令を音声で受け付ける音声操作機能を備えている。この音声操作機能で扱われる操作命令には、撮影の指示、モード選択などの基本命令の他に、議事録作成モードで使用される会議開始/終了、音声収録開始/終了、データ送信などがある。   The digital camera 10 also has a voice operation function for receiving camera operation commands by voice via the microphone 32. In addition to basic commands such as shooting instructions and mode selection, the operation commands handled by this voice operation function include conference start / end, audio recording start / end, and data transmission used in the minutes creation mode. .

デジタルカメラ10の電気的構成を示す図5において、撮像レンズ30および絞り40には、レンズモータ41およびアイリスモータ42が接続されている。これらのモータ41、42はステッピングモータからなり、CPU43に接続されたモータドライバ44、45から送信される駆動パルスにより動作制御され、レリーズボタン33の半押しに伴う撮影準備処理を行う。   In FIG. 5 showing the electrical configuration of the digital camera 10, a lens motor 41 and an iris motor 42 are connected to the imaging lens 30 and the diaphragm 40. These motors 41 and 42 are stepping motors, which are controlled in operation by drive pulses transmitted from motor drivers 44 and 45 connected to the CPU 43, and perform photographing preparation processing in response to half-pressing of the release button 33.

レンズモータ41は、操作部38に設けられたズーム操作ボタンの操作に連動して、撮像レンズ30のズームレンズをワイド側、あるいはテレ側に移動させ、撮像レンズ30のズーミングを行う。また、被写体距離やズームレンズの変倍に応じて撮像レンズ30のフォーカスレンズを移動させ、撮影条件が最適となるように撮像レンズ30の焦点調整を行う。アイリスモータ42は、絞り40を動作させ、撮像レンズ30の露出調整を行う。   The lens motor 41 performs zooming of the imaging lens 30 by moving the zoom lens of the imaging lens 30 to the wide side or the tele side in conjunction with the operation of the zoom operation button provided on the operation unit 38. Further, the focus lens of the imaging lens 30 is moved in accordance with the subject distance and zoom lens magnification, and the focus of the imaging lens 30 is adjusted so that the shooting conditions are optimized. The iris motor 42 operates the aperture 40 to adjust the exposure of the imaging lens 30.

撮像レンズ30の背後には、撮像レンズ30を透過した被写体光を光電変換して、撮像信号を出力するCCD46が配置されている。CCD46には、CPU43によって制御される図示しないタイミングジェネレータが接続され、このタイミングジェネレータから入力されるタイミング信号(クロックパルス)により、電子シャッタのシャッタ速度が決定される。   Behind the imaging lens 30 is a CCD 46 that photoelectrically converts subject light transmitted through the imaging lens 30 and outputs an imaging signal. A timing generator (not shown) controlled by the CPU 43 is connected to the CCD 46, and the shutter speed of the electronic shutter is determined by a timing signal (clock pulse) input from the timing generator.

CCD46から出力された撮像信号は、相関二重サンプリング回路(CDS)47に入力され、CCD46の各セルの蓄積電荷量に正確に対応したR、G、Bの画像データとして出力される。CDS47から出力された画像データは、増幅器(AMP)48で増幅され、A/D変換器(A/D)49でデジタルの画像データに変換される。   The imaging signal output from the CCD 46 is input to a correlated double sampling circuit (CDS) 47 and output as R, G, and B image data that accurately corresponds to the accumulated charge amount of each cell of the CCD 46. Image data output from the CDS 47 is amplified by an amplifier (AMP) 48 and converted to digital image data by an A / D converter (A / D) 49.

画像入力コントローラ50は、バス51を介してCPU43に接続され、CPU43の制御命令に応じて、CCD46、CDS47、AMP48、およびA/D49を制御する。A/D49から出力された画像データは、SDRAM52に一旦格納される。この画像データは、LCDドライバ53を介してLCD37に表示される。   The image input controller 50 is connected to the CPU 43 via the bus 51, and controls the CCD 46, the CDS 47, the AMP 48, and the A / D 49 in accordance with a control command from the CPU 43. The image data output from the A / D 49 is temporarily stored in the SDRAM 52. This image data is displayed on the LCD 37 via the LCD driver 53.

画像信号処理回路54は、SDRAM52から画像データを読み出して、階調変換、ホワイトバランス補正、γ補正処理などの各種画像処理を施し、この画像データを再度SDRAM52に格納する。   The image signal processing circuit 54 reads the image data from the SDRAM 52, performs various image processing such as gradation conversion, white balance correction, and γ correction processing, and stores the image data in the SDRAM 52 again.

画像信号処理回路54で各種処理を施された画像データは、SDRAM52から図示しないYC変換処理回路に読み出され、輝度信号Yと色差信号Cr、Cbとに変換される。変換された画像データは、図示しない圧縮伸長処理回路により、所定の圧縮形式(例えばJPEG形式)で画像圧縮を施される。圧縮された画像データは、メディアコントローラ55を経由してメモリカード56に記録される。あるいは、外部I/F57、コネクタ35を経由して外部に送信される。   The image data that has been subjected to various processes by the image signal processing circuit 54 is read from the SDRAM 52 to a YC conversion processing circuit (not shown) and converted into a luminance signal Y and color difference signals Cr and Cb. The converted image data is subjected to image compression in a predetermined compression format (for example, JPEG format) by a compression / decompression processing circuit (not shown). The compressed image data is recorded on the memory card 56 via the media controller 55. Alternatively, it is transmitted to the outside via the external I / F 57 and the connector 35.

CPU43には、前述のレリーズボタン33、操作部38の他に、EEPROM58が接続されている。EEPROM58には、各種制御用のプログラムや設定情報が記録されている。また、音声操作機能を利用する顧客20の操作命令の音声データ(語彙データおよび声紋データ)が予め登録されている。CPU43は、これらの情報をEEPROM58から作業用メモリであるSDRAM52に読み出して、各種処理を実行する。   In addition to the release button 33 and the operation unit 38 described above, an EEPROM 58 is connected to the CPU 43. In the EEPROM 58, various control programs and setting information are recorded. In addition, voice data (vocabulary data and voiceprint data) of the operation command of the customer 20 using the voice operation function is registered in advance. The CPU 43 reads these pieces of information from the EEPROM 58 to the SDRAM 52 which is a working memory, and executes various processes.

マイクロホン32には、増幅器(AMP)59が接続されている。マイクロホン32から入力された音声は、増幅器(AMP)59で増幅され、A/D変換器(A/D)60でデジタルの音声データに変換される。A/D60から出力された音声データは、CPU43でノイズ除去などの各種信号処理を施された後、メモリカード56に記録される。また、議事録作成モードでは、語彙変換回路61および声紋変換回路62に送信される。   An amplifier (AMP) 59 is connected to the microphone 32. The sound input from the microphone 32 is amplified by an amplifier (AMP) 59 and converted into digital sound data by an A / D converter (A / D) 60. The audio data output from the A / D 60 is recorded on the memory card 56 after various signal processing such as noise removal is performed by the CPU 43. In the minutes creation mode, the data is transmitted to the vocabulary conversion circuit 61 and the voiceprint conversion circuit 62.

語彙変換回路61および声紋変換回路62は、A/D60から出力された音声データに対して、語彙変換および声紋変換をそれぞれ施し、語彙データおよび声紋データを生成する。なお、語彙変換回路61は、後述するサーバ12の音声認識装置92と同様の方式で語彙変換を行う。   The vocabulary conversion circuit 61 and the voiceprint conversion circuit 62 perform vocabulary conversion and voiceprint conversion on the voice data output from the A / D 60, respectively, and generate vocabulary data and voiceprint data. The vocabulary conversion circuit 61 performs vocabulary conversion in the same manner as a voice recognition device 92 of the server 12 described later.

第1、第2比較回路63、64には、EEPROM58に予め登録されている顧客20の語彙データおよび声紋データが、CPU43を通じてプリセットされる。第1、第2比較回路63、64は、これらのプリセットされたデータと、語彙変換回路61および声紋変換回路62で生成された語彙データおよび声紋データとを比較する。そして、生成されたデータと登録されているデータとが一致した場合に、トリガ信号を出力する。ここで、第1比較回路63は、トリガ信号とともに一致した語彙データをCPU43に送信する。   The vocabulary data and voiceprint data of the customer 20 registered in advance in the EEPROM 58 are preset in the first and second comparison circuits 63 and 64 through the CPU 43. The first and second comparison circuits 63 and 64 compare the preset data with the vocabulary data and the voiceprint data generated by the vocabulary conversion circuit 61 and the voiceprint conversion circuit 62. Then, a trigger signal is output when the generated data matches the registered data. Here, the first comparison circuit 63 transmits the matched vocabulary data to the CPU 43 together with the trigger signal.

論理回路65は、第1、第2比較回路63、64の出力の論理積をとり、第1、第2比較回路63、64でともにトリガ信号が発生したとき、つまり、語彙データ、声紋データともに、生成されたデータと登録されているデータとが一致したときにのみ、CPU43に割り込み信号を送信する。CPU43は、論理回路65からの割り込み信号を受信して、第1比較回路63から送信された語彙データが表す操作命令に対応した処理をデジタルカメラ10の各部に実行させる。   The logic circuit 65 calculates the logical product of the outputs of the first and second comparison circuits 63 and 64, and when both the first and second comparison circuits 63 and 64 generate a trigger signal, that is, both vocabulary data and voiceprint data. An interrupt signal is transmitted to the CPU 43 only when the generated data matches the registered data. The CPU 43 receives the interrupt signal from the logic circuit 65 and causes each part of the digital camera 10 to execute processing corresponding to the operation command represented by the vocabulary data transmitted from the first comparison circuit 63.

CPU43は、顧客20から会議開始命令が音声入力された場合、携帯電話11および電話回線網13を介して、サーバ12との回線をオープンさせる。音声収録開始/終了命令が入力された場合は、マイクロホン32による音声収録を開始/終了させる。また、データ送信命令が入力された場合は、メモリカード56に記録されている画像データおよび音声データを、携帯電話11を介してサーバ12に送信する。会議終了命令が入力された場合は、画像データおよび音声データをサーバ12に送信した後、サーバ12との回線をクローズさせる。   The CPU 43 opens a line with the server 12 via the mobile phone 11 and the telephone line network 13 when a conference start command is inputted by voice from the customer 20. When a voice recording start / end command is input, voice recording by the microphone 32 is started / finished. When a data transmission command is input, the image data and audio data recorded on the memory card 56 are transmitted to the server 12 via the mobile phone 11. When a conference end command is input, the image data and audio data are transmitted to the server 12 and then the line with the server 12 is closed.

デジタルカメラ10では、携帯電話11および電話回線網13を介して、議事録作成モードでメモリカード56に記録された画像データおよび音声データを、随時一定の間隔でサーバ12に送信する。また、議事録作成モード使用時に、メモリカード56の記録容量が不足した場合には、ビープ音やランプを点灯させるなどして、顧客20に対して事前に警告を発し、サーバ12へのデータ送信、あるいはメモリカード56の交換を促す。   In the digital camera 10, image data and audio data recorded on the memory card 56 in the minutes creation mode are transmitted to the server 12 at regular intervals through the mobile phone 11 and the telephone line network 13. Further, when the recording capacity of the memory card 56 is insufficient when the minutes creation mode is used, a warning is issued to the customer 20 in advance by turning on a beep sound or a lamp, and data transmission to the server 12 is performed. Or, it is urged to replace the memory card 56.

図6に示すように、携帯電話11は、CPU70により各部を統括的に制御される。この携帯電話11は、通信相手の音声や着信メロディを出力する受話スピーカ71と、話し手の音声を集音する送話マイク72と、各種選択キーやダイヤルキーからなる操作部73とを備えている。また、携帯電話11には、液晶表示器(LCD)74、アンテナ75、コネクタ76(例えばUSBコネクタ)、およびメモリ77が設けられている。   As shown in FIG. 6, the mobile phone 11 is controlled centrally by the CPU 70. The mobile phone 11 includes a reception speaker 71 that outputs a communication partner's voice and a ringing melody, a transmission microphone 72 that collects a speaker's voice, and an operation unit 73 including various selection keys and dial keys. . The mobile phone 11 is provided with a liquid crystal display (LCD) 74, an antenna 75, a connector 76 (for example, a USB connector), and a memory 77.

LCD74には、各種設定メニューからなるメニュー画面、着信相手の電話番号やメールアドレス、インターネットサーバからダウンロードした画像などが、LCDドライバ78を介して表示される。アンテナ75は、通信I/F79を介して、他の携帯電話などからの電波信号を受信するとともに、携帯電話11から発信される電波信号を外部に送信する。コネクタ76は、デジタルカメラ10のコネクタ35とUSBケーブルなどで接続され、外部I/F80を介してデータの送受信を行う。メモリ77には、デジタルカメラ10から送信される画像データや音声データが一時的に格納される。   The LCD 74 displays a menu screen including various setting menus, a telephone number or mail address of the called party, an image downloaded from the Internet server, and the like via the LCD driver 78. The antenna 75 receives a radio signal from another mobile phone or the like via the communication I / F 79 and transmits a radio signal transmitted from the mobile phone 11 to the outside. The connector 76 is connected to the connector 35 of the digital camera 10 via a USB cable or the like, and transmits / receives data via the external I / F 80. The memory 77 temporarily stores image data and audio data transmitted from the digital camera 10.

図7に示すように、サーバ12は、バッファメモリ90、文字認識装置91、音声認識装置92、編集装置93、配信装置94、および自動決済装置95を備えている。バッファメモリ90は、デジタルカメラ10で取得され、携帯電話11から電話回線網13を介して送信される画像データおよび音声データを一時的に格納し、これらのデータを時系列で並べて分別し、一定の間隔で文字認識装置91および音声認識装置92に送信する。   As shown in FIG. 7, the server 12 includes a buffer memory 90, a character recognition device 91, a voice recognition device 92, an editing device 93, a distribution device 94, and an automatic settlement device 95. The buffer memory 90 temporarily stores image data and audio data acquired by the digital camera 10 and transmitted from the mobile phone 11 via the telephone line network 13, and sorts these data by arranging them in time series. Are transmitted to the character recognition device 91 and the voice recognition device 92 at intervals of.

文字認識装置91は、文字認識ソフトを備えており、送信された画像データ(ホワイトボード21全体を撮影した画像データ)内の文字を文字認識して、第1のテキストデータに変換する。音声認識装置92は、音声認識ソフトを備えており、送信された音声データ(会議の参加者の発言を収録した音声データ)を音声認識して、第2のテキストデータに変換する。   The character recognition device 91 includes character recognition software, recognizes characters in the transmitted image data (image data obtained by photographing the entire whiteboard 21), and converts the characters into first text data. The voice recognition device 92 is provided with voice recognition software, recognizes the transmitted voice data (voice data containing the speech of the conference participants), and converts it into second text data.

文字認識は、まず、画像データの中から文字が書かれた部分を抜き出すレイアウト解析を行い、これにより抜き出された部分から1文字1文字を切り出していき、この1文字1文字について、その特徴量、例えばエッジ、輪郭、方向寄与度などを抽出し、図示しない認識辞書に予め登録されている標準パターンと比較照合する。そして、マッチした数種の標準パターンを候補として出力し、この候補から前後の文脈などを加味しながら誤認識を訂正して、最終的に残った候補を第1のテキストデータに変換する。   In character recognition, first, layout analysis is performed to extract a portion in which characters are written from image data, and one character is extracted from the extracted portion. A quantity such as an edge, contour, direction contribution, etc. is extracted and compared with a standard pattern registered in advance in a recognition dictionary (not shown). Then, several types of matched standard patterns are output as candidates, and misrecognition is corrected while taking into account the context before and after the candidates, and finally the remaining candidates are converted into first text data.

一方、音声認識は、15〜30ms程度の音声データを1フレームとし、5〜20msずつシフトしながら、高速フーリエ変換や線形予測法によりスペクトル分析を行って、その特徴量を算出する。次に、非線形伸縮パターンマッチングや隠れマルコフモデルを用いて、算出した特徴量と図示しない認識辞書に予め登録されている標準パターンとを比較照合する。そして、マッチした数種の標準パターンを候補として出力し、この候補から前後の文脈などを加味しながら誤認識を訂正して、最終的に残った候補を第2のテキストデータに変換する。なお、音声認識をより高精度に行うために、会議開始前に会議の参加者の音声を、デジタルカメラ10を介して音声認識装置92にサンプリングデータとして予め登録しておき、このサンプリングデータを元に音声認識を行ってもよい。   On the other hand, in speech recognition, speech data of about 15 to 30 ms is set as one frame, and spectrum analysis is performed by fast Fourier transform or linear prediction while shifting by 5 to 20 ms, and the feature amount is calculated. Next, using a non-linear expansion / contraction pattern matching or a hidden Markov model, the calculated feature value is compared with a standard pattern registered in advance in a recognition dictionary (not shown). Then, several types of matched standard patterns are output as candidates, and misrecognition is corrected while taking into consideration the context before and after the candidates, and finally the remaining candidates are converted into second text data. In order to perform voice recognition with higher accuracy, the voices of the participants of the conference are registered in advance as sampling data in the voice recognition device 92 via the digital camera 10 before the conference starts. Voice recognition may be performed.

編集装置93は、文字認識装置91および音声認識装置92で変換された第1、および第2のテキストデータを自動編集して、議事録ファイルを作成する。配信装置94には、顧客20の電子メールアドレスが予め登録されている。この配信装置94は、議事録ファイルのヘッダに作成日時、顧客20の氏名を付記して、これをインターネット14経由で顧客20のPC15に電子メールの形で配信する。   The editing device 93 automatically edits the first and second text data converted by the character recognition device 91 and the speech recognition device 92 to create a minutes file. In the distribution device 94, the e-mail address of the customer 20 is registered in advance. The distribution device 94 adds the creation date and time and the name of the customer 20 to the header of the minutes file, and distributes them to the PC 15 of the customer 20 via the Internet 14 in the form of an e-mail.

自動決済装置95には、顧客20の銀行口座が予め登録されている。この自動決済装置95は、配信装置94による議事録ファイルの配信後、電子決済により、顧客20の銀行口座からシステム利用料を自動的に引き落とす。   In the automatic settlement apparatus 95, the bank account of the customer 20 is registered in advance. The automatic settlement apparatus 95 automatically withdraws the system usage fee from the bank account of the customer 20 by electronic settlement after distribution of the minutes file by the distribution apparatus 94.

次に、上記実施形態による作用について、図8〜10のフローチャートを参照して説明する。まず、図8に示すように、顧客20は、ホワイトボード21全体が撮影可能な場所にデジタルカメラ10を設置し、USBケーブルなどでコネクタ35、76を繋ぎ、デジタルカメラ10に携帯電話11を接続する。また、PC15をインターネット14に接続する。そして、デジタルカメラ10の電源を投入し、議事録作成モードを選択する。   Next, the effect | action by the said embodiment is demonstrated with reference to the flowchart of FIGS. First, as shown in FIG. 8, the customer 20 installs the digital camera 10 in a place where the entire whiteboard 21 can be photographed, connects the connectors 35 and 76 with a USB cable or the like, and connects the mobile phone 11 to the digital camera 10. To do. Further, the PC 15 is connected to the Internet 14. Then, the digital camera 10 is turned on, and the minutes creation mode is selected.

会議の開始とともに、顧客20により会議開始命令がマイクロホン32に音声入力される。マイクロホン32から入力された顧客20の音声は、AMP59で増幅され、A/D60でデジタルの音声データに変換される。   At the start of the conference, the customer 20 inputs a conference start command to the microphone 32 by voice. The voice of the customer 20 input from the microphone 32 is amplified by the AMP 59 and converted into digital voice data by the A / D 60.

図9に示すように、デジタルカメラ10では、議事録作成モードの選択に伴って、EEPROM58に予め登録されている顧客20の語彙データおよび声紋データが、CPU43を通じて第1、第2比較回路63、64にプリセットされる。A/D60から出力された音声データは、語彙変換回路61および声紋変換回路62により、語彙変換および声紋変換をそれぞれ施され、語彙データおよび声紋データが生成される。次に、第1、第2比較回路63、64で、プリセットされたデータと、生成された語彙データおよび声紋データとが比較される。そして、生成されたデータと登録されているデータとが一致した場合に、第1、第2比較回路63、64からトリガ信号が出力される。ここで、第1比較回路63からは、トリガ信号とともに一致した語彙データがCPU43に送信される。   As shown in FIG. 9, in the digital camera 10, the vocabulary data and voiceprint data of the customer 20 registered in advance in the EEPROM 58 in accordance with the selection of the minutes creation mode are sent through the CPU 43 to the first and second comparison circuits 63, Preset to 64. The voice data output from the A / D 60 is subjected to vocabulary conversion and voiceprint conversion by the vocabulary conversion circuit 61 and the voiceprint conversion circuit 62, respectively, and vocabulary data and voiceprint data are generated. Next, the first and second comparison circuits 63 and 64 compare the preset data with the generated vocabulary data and voiceprint data. When the generated data matches the registered data, a trigger signal is output from the first and second comparison circuits 63 and 64. Here, from the first comparison circuit 63, the matched vocabulary data is transmitted to the CPU 43 together with the trigger signal.

論理回路65では、第1、第2比較回路63、64の出力の論理積が算出され、第1、第2比較回路63、64でともにトリガ信号が発生したときにのみ、CPU43に割り込み信号が送信される。CPU43では、論理回路65からの割り込み信号を受信して、携帯電話11および電話回線網13を介してサーバ12との回線をオープンさせる。   In the logic circuit 65, the logical product of the outputs of the first and second comparison circuits 63 and 64 is calculated, and an interrupt signal is sent to the CPU 43 only when a trigger signal is generated in both the first and second comparison circuits 63 and 64. Sent. The CPU 43 receives an interrupt signal from the logic circuit 65 and opens a line with the server 12 via the mobile phone 11 and the telephone line network 13.

図8において、回線開通後、顧客20により音声収録開始命令がマイクロホン32に音声入力されると、図9に示す処理と同様の手順で音声認識処理が行われ、マイクロホン32による会議の参加者の発言の収録が開始される。   8, when a voice recording start command is input to the microphone 32 by the customer 20 after the line is opened, voice recognition processing is performed in the same procedure as the processing shown in FIG. Recording of remarks begins.

マイクロホン32で収録された音声は、上記同様にAMP59で増幅され、A/D60でデジタルの音声データに変換される。A/D60から出力された音声データは、CPU43でノイズ除去などの各種信号処理を施された後、メモリカード56に記録される。   The sound recorded by the microphone 32 is amplified by the AMP 59 as described above, and converted to digital sound data by the A / D 60. The audio data output from the A / D 60 is recorded on the memory card 56 after various signal processing such as noise removal is performed by the CPU 43.

デジタルカメラ10の撮像レンズ30、絞り40を介して入射した被写体光は、CCD46により光電変換され、CDS47でサンプリングされる。CDS47から出力された画像データは、AMP48で増幅され、A/D49でデジタルの画像データに変換される。デジタル変換された画像データは、画像入力コントローラ50を介してSDRAM52に順次格納され、LCD37にスルー画像として表示される。   The subject light incident through the imaging lens 30 and the aperture 40 of the digital camera 10 is photoelectrically converted by the CCD 46 and sampled by the CDS 47. The image data output from the CDS 47 is amplified by the AMP 48 and converted to digital image data by the A / D 49. The digitally converted image data is sequentially stored in the SDRAM 52 via the image input controller 50 and displayed on the LCD 37 as a through image.

上記の状態で、発表者22がホワイトボード21に書いた会議の内容が1段落したときに、顧客20により撮影命令がマイクロホン32に音声入力されると、図9に示す処理と同様の手順で音声認識処理が行われ、そのときSDRAM52に格納されている画像データ(ホワイトボード21全体を撮影した画像データ)が画像信号処理回路54に読み出され、各種画像処理が施される。   In the state described above, when the content of the conference written by the presenter 22 on the whiteboard 21 reaches one paragraph and the customer 20 inputs a shooting command into the microphone 32, the procedure similar to the process shown in FIG. Voice recognition processing is performed. At that time, image data (image data obtained by photographing the entire whiteboard 21) stored in the SDRAM 52 is read out to the image signal processing circuit 54, and various image processing is performed.

画像信号処理回路54で各種処理を施された画像データは、SDRAM52から図示しないYC変換処理回路に読み出され、輝度信号Yと色差信号Cr、Cbとに変換される。変換された画像データは、図示しない圧縮伸長処理回路により、所定の圧縮形式(例えばJPEG形式)で画像圧縮を施される。圧縮された画像データは、メディアコントローラ55を経由してメモリカード56に記録される。   The image data that has been subjected to various processes by the image signal processing circuit 54 is read from the SDRAM 52 to a YC conversion processing circuit (not shown) and converted into a luminance signal Y and color difference signals Cr and Cb. The converted image data is subjected to image compression in a predetermined compression format (for example, JPEG format) by a compression / decompression processing circuit (not shown). The compressed image data is recorded on the memory card 56 via the media controller 55.

メモリカード56に記録された画像データおよび音声データは、携帯電話11から電話回線網13を介して、随時一定の間隔でサーバ12に送信される。メモリカード56の記録容量が不足した場合には、顧客20に対して事前に警告が発せられ、サーバ12へのデータ送信、あるいはメモリカード56の交換が促される。   Image data and audio data recorded in the memory card 56 are transmitted from the mobile phone 11 to the server 12 via the telephone line network 13 at regular intervals. When the recording capacity of the memory card 56 is insufficient, a warning is issued to the customer 20 in advance, and data transmission to the server 12 or replacement of the memory card 56 is prompted.

顧客20によりデータ送信命令がマイクロホン32に音声入力されると、図9に示す処理と同様の手順で音声認識処理が行われ、メモリカード56に記録されている画像データおよび音声データが、携帯電話11を介してサーバ12に送信される。これら一連の処理は、音声入力された操作命令に応じて、会議が終了するまで繰り返し行われる。   When the customer 20 inputs a data transmission command to the microphone 32 by voice, the voice recognition process is performed in the same procedure as the process shown in FIG. 9, and the image data and voice data recorded in the memory card 56 are transferred to the mobile phone. 11 is transmitted to the server 12 via 11. These series of processes are repeatedly performed until the conference is ended according to the operation command inputted by voice.

顧客20により会議終了命令がマイクロホン32に音声入力されると、図9に示す処理と同様の手順で音声認識処理が行われ、画像データおよび音声データがサーバ12に送信された後、サーバ12との回線がクローズされる。   When the customer 20 inputs a conference end command to the microphone 32, voice recognition processing is performed in the same procedure as the processing shown in FIG. 9, and after the image data and voice data are transmitted to the server 12, The line is closed.

図10に示すように、サーバ12側では、まず、顧客20による会議開始命令を受信して、携帯電話11を介してデジタルカメラ10との回線がオープンされる。回線開通後、携帯電話11を介してデジタルカメラ10から送信された画像データおよび音声データは、バッファメモリ90に一時的に格納される。バッファメモリ90では、これらのデータが時系列で並べて分別され、一定の間隔で文字認識装置91および音声認識装置92に送信される。   As shown in FIG. 10, the server 12 side first receives a conference start command from the customer 20 and opens a line with the digital camera 10 via the mobile phone 11. After the line is opened, the image data and audio data transmitted from the digital camera 10 via the mobile phone 11 are temporarily stored in the buffer memory 90. In the buffer memory 90, these data are sorted in time series and sorted, and transmitted to the character recognition device 91 and the speech recognition device 92 at regular intervals.

デジタルカメラ10から送信された画像データは、文字認識装置91で画像データ内の文字が文字認識され、第1のテキストデータに変換される。一方、音声データは、音声認識装置92で会議の参加者の発言が音声認識され、第2のテキストデータに変換される。会議終了命令が送信された場合は、編集装置93で第1のテキストデータと第2のテキストデータが自動編集され、議事録ファイルが作成される。送信されたデータが上記のいずれでもない場合は、エラー処理が行われる。   In the image data transmitted from the digital camera 10, characters in the image data are recognized by the character recognition device 91, and converted into first text data. On the other hand, the speech data is speech-recognized by the speech recognition device 92 for speech of the participants in the conference and converted into second text data. When the conference end command is transmitted, the first text data and the second text data are automatically edited by the editing device 93, and a minutes file is created. If the transmitted data is none of the above, error processing is performed.

編集装置93で作成された議事録ファイルは、配信装置94でヘッダに作成日時、顧客20の氏名が付記され、インターネット14経由で顧客20のPC15に電子メールの形で配信される。配信装置94による議事録ファイルの配信後、自動決済装置95により、顧客20の銀行口座からシステム利用料が自動的に引き落とされる。   The minutes file created by the editing device 93 has the date and time of creation and the name of the customer 20 added to the header by the distribution device 94 and is distributed via the Internet 14 to the PC 15 of the customer 20 in the form of an e-mail. After the minutes file is distributed by the distribution device 94, the automatic settlement device 95 automatically deducts the system usage fee from the bank account of the customer 20.

上記のような構成であると、顧客20はデジタルカメラ10、携帯電話11、およびPC15を用意するだけでよく、電話回線網13に接続可能な環境であれば、どんな場所でも議事録作成システム2を利用することができる。また、音声操作機能を備えたデジタルカメラ10を用いているので、顧客20はハンズフリーで撮影、音声収録、データ送信などを行え、議論に参加することが可能となる。さらに、会議終了後、会議の参加者の各々のPCに議事録ファイルを電子メールにて転送するだけで、容易且つ確実に情報を共有することができる。   With the configuration as described above, the customer 20 only needs to prepare the digital camera 10, the mobile phone 11, and the PC 15, and the minutes generation system 2 can be used anywhere as long as it can be connected to the telephone network 13. Can be used. Further, since the digital camera 10 having the voice operation function is used, the customer 20 can perform hands-free shooting, voice recording, data transmission, and the like, and can participate in the discussion. Furthermore, after the conference is over, the information can be easily and reliably shared by simply transferring the minutes file to each PC of the conference participants by e-mail.

なお、上記実施形態では、デジタルカメラ10で取得した画像データおよび音声データを携帯電話11を介してサーバ12に送信しているが、モジュラージャックを介して電話回線網13に直接デジタルカメラ10を接続してもよく、顧客20のPC15にデジタルカメラ10を接続して、インターネット14経由でデータ送信を行ってもよい。また、サーバ12内に文字認識装置91、音声認識装置92、編集装置93、および配信装置94を設けているが、これらを独立して設けてもよい。   In the above embodiment, image data and audio data acquired by the digital camera 10 are transmitted to the server 12 via the mobile phone 11, but the digital camera 10 is directly connected to the telephone line network 13 via a modular jack. Alternatively, the digital camera 10 may be connected to the PC 15 of the customer 20 and data transmission may be performed via the Internet 14. Further, although the character recognition device 91, the voice recognition device 92, the editing device 93, and the distribution device 94 are provided in the server 12, these may be provided independently.

さらに、サーバ12の文字認識装置91、音声認識回路92で変換した第1、第2のテキストデータを、RTF(RichText Format )やHTML(HyperText Markup Language )などの、より汎用性の高いファイル形式で出力してもよい。このようにすると、議事録ファイルの再編集を円滑に行うことができる。   Furthermore, the first and second text data converted by the character recognition device 91 and the speech recognition circuit 92 of the server 12 are converted into a more versatile file format such as RTF (RichText Format) or HTML (HyperText Markup Language). It may be output. In this way, the minutes file can be re-edited smoothly.

本発明の議事録作成システムの概略構成を示す図である。It is a figure which shows schematic structure of the minutes production system of this invention. 議事録作成システムを利用した会議の様子を示す説明図である。It is explanatory drawing which shows the mode of the meeting using the minutes creation system. デジタルカメラの正面外観斜視図である。It is a front external perspective view of a digital camera. デジタルカメラの背面外観斜視図である。It is a back external appearance perspective view of a digital camera. デジタルカメラの電気的構成を示すブロック図である。It is a block diagram which shows the electric constitution of a digital camera. 携帯電話の内部構成を示すブロック図である。It is a block diagram which shows the internal structure of a mobile telephone. サーバの内部構成を示すブロック図である。It is a block diagram which shows the internal structure of a server. デジタルカメラの処理手順を示すフローチャートである。It is a flowchart which shows the process sequence of a digital camera. デジタルカメラの音声操作機能の処理手順を示すフローチャートである。It is a flowchart which shows the process sequence of the voice operation function of a digital camera. サーバの処理手順を示すフローチャートである。It is a flowchart which shows the process sequence of a server.

符号の説明Explanation of symbols

2 議事録作成システム
10 デジタルカメラ
11 携帯電話
12 サーバ
13 電話回線網
14 インターネット
15 パーソナルコンピュータ(PC)
20 顧客
21 ホワイトボード
30 撮像レンズ
32 マイクロホン
33 レリーズボタン
35 コネクタ
37 液晶表示器(LCD)
43 CPU
46 CCD
52 SDRAM
54 画像信号処理回路
56 メモリカード
58 EEPROM
61 語彙変換回路
62 声紋変換回路
63、64 第1、第2比較回路
65 論理回路
75 アンテナ
76 コネクタ
77 メモリ
91 文字認識装置
92 音声認識装置
93 編集装置
94 配信装置
95 自動決済装置
2 Minutes creation system 10 Digital camera 11 Mobile phone 12 Server 13 Telephone network 14 Internet 15 Personal computer (PC)
20 Customer 21 Whiteboard 30 Imaging Lens 32 Microphone 33 Release Button 35 Connector 37 Liquid Crystal Display (LCD)
43 CPU
46 CCD
52 SDRAM
54 Image signal processing circuit 56 Memory card 58 EEPROM
61 vocabulary conversion circuit 62 voice print conversion circuit 63, 64 first and second comparison circuit 65 logic circuit 75 antenna 76 connector 77 memory 91 character recognition device 92 voice recognition device 93 editing device 94 distribution device 95 automatic settlement device

Claims (4)

会議室に設置された表示機器の表示エリアを撮像して、デジタルの画像データを出力するとともに、会議の参加者の発言を収録して、デジタルの音声データを出力するデジタルカメラと、
前記デジタルカメラに接続して、前記画像データおよび音声データを外部に送信する通信装置と、
前記通信装置から送信される前記画像データ内の文字を文字認識して、第1のテキストデータに変換する文字認識装置と、
前記通信装置から送信される前記音声データを音声認識して、第2のテキストデータに変換する音声認識装置と、
前記第1および第2のテキストデータを自動編集して、議事録ファイルを作成する編集装置と、
前記議事録ファイルを通信ネットワーク経由で顧客に配信する配信装置とから構成したことを特徴とする議事録作成システム。
A digital camera that captures the display area of the display device installed in the conference room, outputs digital image data, records the remarks of participants in the conference, and outputs digital audio data;
A communication device connected to the digital camera and transmitting the image data and audio data to the outside;
A character recognition device that recognizes characters in the image data transmitted from the communication device and converts the characters into first text data;
A voice recognition device that recognizes the voice data transmitted from the communication device and converts the voice data into second text data;
An editing device that automatically edits the first and second text data to create a minutes file;
A minutes creation system comprising: a delivery device for delivering the minutes file to a customer via a communication network.
前記文字認識装置、音声認識装置、編集装置、および配信装置は、前記通信装置に通信ネットワークを介して接続されたサーバ内に設けられていることを特徴とする請求項1に記載の議事録作成システム。   2. The minutes creation according to claim 1, wherein the character recognition device, the speech recognition device, the editing device, and the distribution device are provided in a server connected to the communication device via a communication network. system. 前記デジタルカメラは、前記顧客により音声入力された操作命令を音声認識する音声認識手段と、音声認識した操作命令に応じた処理を実行させるべく各部を制御する制御手段とを備えたことを特徴とする請求項1または2に記載の議事録作成システム。   The digital camera includes voice recognition means for voice recognition of an operation command inputted by the customer, and control means for controlling each unit to execute processing according to the voice-recognized operation command. The minutes creation system according to claim 1 or 2. 前記議事録ファイルの配信後、予め登録されている前記顧客の銀行口座から、システム利用料を自動的に引き落とす自動決済装置を備えたことを特徴とする請求項1ないし3のいずれかに記載の議事録作成システム。   The automatic settlement apparatus according to any one of claims 1 to 3, further comprising: an automatic settlement device that automatically deducts a system usage fee from the bank account of the customer registered in advance after distribution of the minutes file. Minutes creation system.
JP2003409479A 2003-12-08 2003-12-08 System for taking proceedings Pending JP2005175627A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003409479A JP2005175627A (en) 2003-12-08 2003-12-08 System for taking proceedings

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003409479A JP2005175627A (en) 2003-12-08 2003-12-08 System for taking proceedings

Publications (1)

Publication Number Publication Date
JP2005175627A true JP2005175627A (en) 2005-06-30

Family

ID=34730853

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003409479A Pending JP2005175627A (en) 2003-12-08 2003-12-08 System for taking proceedings

Country Status (1)

Country Link
JP (1) JP2005175627A (en)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4787328B2 (en) * 2005-10-31 2011-10-05 テレフオンアクチーボラゲット エル エム エリクソン(パブル) Method and apparatus for capturing audio during a conference call
US8494057B2 (en) 2009-10-30 2013-07-23 Samsung Electronics Co., Ltd. Video encoding apparatus and method
JP2013191039A (en) * 2012-03-14 2013-09-26 Toshiba Corp Ballot result tabulation system
JP5450864B1 (en) * 2013-02-01 2014-03-26 征治 久保 Combined system
JP2016534435A (en) * 2014-06-26 2016-11-04 シャオミ・インコーポレイテッド File locking method, file locking device, program, and recording medium
US9904774B2 (en) 2014-06-26 2018-02-27 Xiaomi Inc. Method and device for locking file
JP2020009459A (en) * 2016-03-04 2020-01-16 株式会社リコー Voice control of interactive whiteboard appliances
JP2020021288A (en) * 2018-07-31 2020-02-06 株式会社リコー Apparatus, method and system for processing information
CN112581965A (en) * 2020-12-11 2021-03-30 天津讯飞极智科技有限公司 Transcription method, device, recording pen and storage medium
KR20210054157A (en) * 2019-11-05 2021-05-13 두산중공업 주식회사 Apparatus and method for producing conference record
CN113205808A (en) * 2021-04-27 2021-08-03 无锡星凝互动科技有限公司 AI (Artificial intelligence) consultation based cloud computing building method and system

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4787328B2 (en) * 2005-10-31 2011-10-05 テレフオンアクチーボラゲット エル エム エリクソン(パブル) Method and apparatus for capturing audio during a conference call
US8494057B2 (en) 2009-10-30 2013-07-23 Samsung Electronics Co., Ltd. Video encoding apparatus and method
JP2013191039A (en) * 2012-03-14 2013-09-26 Toshiba Corp Ballot result tabulation system
JP5450864B1 (en) * 2013-02-01 2014-03-26 征治 久保 Combined system
JP2016534435A (en) * 2014-06-26 2016-11-04 シャオミ・インコーポレイテッド File locking method, file locking device, program, and recording medium
US9904774B2 (en) 2014-06-26 2018-02-27 Xiaomi Inc. Method and device for locking file
JP2020009459A (en) * 2016-03-04 2020-01-16 株式会社リコー Voice control of interactive whiteboard appliances
JP2020021288A (en) * 2018-07-31 2020-02-06 株式会社リコー Apparatus, method and system for processing information
KR20210054157A (en) * 2019-11-05 2021-05-13 두산중공업 주식회사 Apparatus and method for producing conference record
KR102291113B1 (en) * 2019-11-05 2021-08-19 두산중공업 주식회사 Apparatus and method for producing conference record
CN112581965A (en) * 2020-12-11 2021-03-30 天津讯飞极智科技有限公司 Transcription method, device, recording pen and storage medium
CN113205808A (en) * 2021-04-27 2021-08-03 无锡星凝互动科技有限公司 AI (Artificial intelligence) consultation based cloud computing building method and system

Similar Documents

Publication Publication Date Title
CN102783136B (en) For taking the imaging device of self-portrait images
US6038295A (en) Apparatus and method for recording, communicating and administering digital images
US6721001B1 (en) Digital camera with voice recognition annotation
EP1929368B1 (en) Image capture method and device also capturing audio
CN100535736C (en) Controlling method of using voice recognition, and digital photographing apparatus using the method
US5893037A (en) Combined electronic/silver-halide image capture system with cellular transmission capability
JP4639907B2 (en) Imaging apparatus, audio recording method, and program
JP2010219692A (en) Image capturing apparatus and camera
JP4595704B2 (en) Image processing apparatus, imaging apparatus, and program
JP2005175627A (en) System for taking proceedings
US20040119837A1 (en) Image pickup apparatus
CN103035020A (en) Mobile terminal and image remarking method thereof
JP4639902B2 (en) Imaging apparatus, audio recording method, and program
KR20050113058A (en) Method and apparatus for compounding taken image in mobile terminal having camera
JP2005197867A (en) System and method for conference progress support and utterance input apparatus
JP2019135609A (en) Character input support system, character input support control device, and character input support program
KR20050059759A (en) Photographing guidance method and apparatus for camera phone
CN116472705A (en) Conference content display method, conference system and conference equipment
CN106453905A (en) Automatic shooting control method and system for mobile terminal based on voice recognition
JP2012105234A (en) Subtitle generation and distribution system, subtitle generation and distribution method, and program
JP2000333150A (en) Video conference system
KR100835376B1 (en) Method and apparatus for recording moving images in mobile telecommunication terminal
JP7306168B2 (en) shooting system
JP2019159333A (en) Character input support system and character input support program
JP2006180089A (en) Digital camera and searching system