JP2000352995A - 会議音声処理方法および記録装置、情報記憶媒体 - Google Patents

会議音声処理方法および記録装置、情報記憶媒体

Info

Publication number
JP2000352995A
JP2000352995A JP11167371A JP16737199A JP2000352995A JP 2000352995 A JP2000352995 A JP 2000352995A JP 11167371 A JP11167371 A JP 11167371A JP 16737199 A JP16737199 A JP 16737199A JP 2000352995 A JP2000352995 A JP 2000352995A
Authority
JP
Japan
Prior art keywords
data
utterance
voice
input
speaker
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11167371A
Other languages
English (en)
Inventor
Ichiro Saito
一郎 斉藤
Hiroyuki Ishinaga
博之 石永
Yoshiyuki Imanaka
良行 今仲
Yoichi Tanetani
陽一 種谷
Muga Mochizuki
無我 望月
Noriyuki Matsumoto
宣幸 松本
Sadayuki Sugama
定之 須釜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP11167371A priority Critical patent/JP2000352995A/ja
Priority to EP00305012A priority patent/EP1061724A3/en
Publication of JP2000352995A publication Critical patent/JP2000352995A/ja
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/56Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/42221Conversation recording systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/38Displays
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/40Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition
    • H04M2201/405Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition involving speaker-dependent recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Telephonic Communication Services (AREA)
  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)

Abstract

(57)【要約】 【課題】 会議の議事録を自動的に作成する装置を実現
する。 【解決手段】 複数の話者の識別データごとに発声デー
タが発声記憶手段11にデータ登録された状態で、複数
の話者の発言音声が音声入力手段12にデータ入力され
ると、その話者と発言内容とを登録データに基づいて認
識する。この認識された発言内容を話者の識別データと
ともに記録作成手段14が所定形態に編集して議事録デ
ータを作成するので、複数の話者の発言内容が識別デー
タとともに所定形態に編集処理された議事録データが自
動的にリアルタイムに作成される。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、議事録データを作
成する会議音声処理方法および記録装置、コンピュータ
に各種の処理動作を実行させるためのプログラムがソフ
トウェアとして格納されている情報記憶媒体、に関す
る。
【0002】
【従来の技術】現在、一般企業において複数の社員によ
る会議は重要な作業であり、その会議での発言内容を記
録することも重要である。また、現在では電話やテレビ
会議システムなどの通信機器を利用して会議することも
あり、その会議の内容も記録が必要な場合がある。
【0003】
【発明が解決しようとする課題】上述のように会議や通
信の内容を記録する手段としては、特開平8−1944
92号公報に開示されているように、テープレコーダに
よる音声記録が一般に利用されている。
【0004】ところが、企業では会議や通信の内容を文
書とすることが要求される場合が多く、会議での各員の
発言内容の記録が必要な場合、これを文書とした議事録
が作成される。
【0005】会議の議事録を作成する場合は、例えば、
各員の発言を記録する専用の作業者を会議に参加させる
が、これでは議事録の作成に専用の作業者が必要であ
る。また、通信による会議の内容を文書とすることが必
要な場合、一度録音した音声を再生して文書を作成して
いるが、これでは作業が煩雑であり文書をリアルタイム
に獲得することもできない。
【0006】現在、高精度な音声認識装置が実用化され
ているので、このような音声認識装置を会議や通信に利
用すれば、その発言の内容をテキストデータとすること
が可能である。しかし、これでは複数の話者の発言内容
を一連のテキストデータとすることができるが、どの発
言が誰によるものかを特定できない。
【0007】本発明は上述のような課題に鑑みてなされ
たものであり、会議や通信での発言の内容を話者を特定
しながら記録できる会議音声処理方法および記録装置、
本発明の会議音声処理方法の処理動作をコンピュータに
実行させるためのプログラムがソフトウェアとして格納
されている情報記憶媒体、を提供することを目的とす
る。
【0008】
【課題を解決するための手段】本発明の第一の会議音声
記録装置は、複数の話者の識別データごとに発声データ
がデータ登録されている発声記憶手段と、複数の話者の
発言音声がデータ入力される音声入力手段と、該音声入
力手段に入力された音声データの話者と発言内容とを前
記発声記憶手段に登録されている発声データと識別デー
タとに基づいて認識する音声認識手段と、該音声認識手
段により認識された発言内容を話者の識別データととも
に所定形態に編集した議事録データを作成する記録作成
手段と、を具備している。
【0009】従って、本発明の会議音声記録装置による
会議音声処理方法では、発声記憶手段に複数の話者の識
別データごとに発声データがデータ登録されている状態
で、複数の話者の発言による音声データが音声入力手段
にデータ入力されると、この入力された音声データの話
者と発言内容とを音声認識手段が発声記憶手段に登録さ
れている発声データと識別データとに基づいて認識す
る。この認識された発言内容を話者の識別データととも
に記録作成手段が所定形態に編集した議事録データを作
成するので、複数の話者が発言すると、その内容が識別
データとともに所定形態に編集された議事録データが自
動的にリアルタイムに作成される。
【0010】本発明の第二の会議音声記録装置は、複数
の話者の識別データごとに発声データがデータ登録され
ている発声記憶手段と、複数の話者の発言音声がデータ
入力される音声入力手段と、発言する話者の識別データ
が逐次入力される識別入力手段と、該識別入力手段にデ
ータ入力された識別データに対応して前記発声記憶手段
から対応する話者の発声データを選択する発声選択手段
と、該発声選択手段により選択された発声データに基づ
いて前記音声入力手段に入力された音声データの発言内
容を認識する音声認識手段と、該音声認識手段により認
識された発言内容を前記識別入力手段にデータ入力され
た識別データとともに所定形態に編集した議事録データ
を作成する記録作成手段と、を具備している。
【0011】従って、本発明の会議音声記録装置による
会議音声処理方法では、発声記憶手段に複数の話者の識
別データごとに発声データがデータ登録されている状態
で、複数の話者の発言による音声データが音声入力手段
にデータ入力されると同時に、発言する話者の識別デー
タが識別入力手段に逐次入力される。すると、このデー
タ入力された識別データに対応して発声選択手段が発声
記憶手段から対応する話者の発声データを選択するの
で、この選択された発声データに基づいて入力された音
声データの発言内容を音声認識手段が認識する。この認
識された発言内容を話者の識別データとともに記録作成
手段が所定形態に編集した議事録データを作成するの
で、複数の話者が発言すると、その内容が識別データと
ともに所定形態に編集された議事録データが自動的にリ
アルタイムに作成される。
【0012】本発明の第三の会議音声記録装置は、複数
の話者の識別データごとに発声データがデータ登録され
ている発声記憶手段と、複数の話者による発言が個々に
データ入力される複数の音声入力手段と、これら複数の
音声入力手段に入力された音声データの発言内容を前記
発声記憶手段の対応する話者の発声データに基づいて認
識する音声認識手段と、該音声認識手段により認識され
た発言内容を話者の識別データとともに所定形態に編集
した議事録データを作成する記録作成手段と、を具備し
ている。
【0013】従って、本発明の会議音声記録装置による
会議音声処理方法では、発声記憶手段に複数の話者の識
別データごとに発声データがデータ登録されている状態
で、複数の話者の発言による音声データが複数の音声入
力手段に個々にデータ入力されるので、これら複数の音
声入力手段に入力された音声データの発言内容を音声認
識手段が発声記憶手段の対応する話者の発声データに基
づいて認識する。この認識された発言内容を話者の識別
データとともに記録作成手段が所定形態に編集した議事
録データを作成するので、複数の話者が発言すると、そ
の内容が識別データとともに所定形態に編集された議事
録データが自動的にリアルタイムに作成される。
【0014】本発明の第四の会議音声記録装置は、複数
の話者がデータ通信するデータ通信装置において、本発
明の会議音声記録装置を具備しており、前記発声記憶手
段は、データ通信により会議する複数の話者の識別デー
タごとに発声データがデータ登録されており、前記記録
作成手段は、データ通信される複数の話者の発言音声か
ら議事録データを作成する。
【0015】従って、本発明の会議音声記録装置による
会議音声処理方法では、複数の話者がデータ通信により
会議すると、このデータ通信による会議での発言内容が
識別データとともに所定形態に編集された議事録データ
が自動的にリアルタイムに作成される。
【0016】上述のような会議音声記録装置において、
前記議事録データを表示出力する画像表示手段と、該画
像表示手段により表示出力された議事録データに対する
修正がデータ入力される修正入力手段と、該修正入力手
段の入力データに対応して前記議事録データを修正する
修正実行手段と、を具備していることも可能である。
【0017】この場合、画像表示手段が議事録データを
表示出力した状態で、この表示出力された議事録データ
に対する修正が修正入力手段にデータ入力される。この
入力データに対応して修正実行手段が議事録データを修
正するので、議事録データが表示出力されながら適宜修
正される。
【0018】上述のような会議音声記録装置において、
前記議事録データを表示出力する画像表示手段と、該画
像表示手段に表示出力された議事録データの承認が話者
の識別データごとにデータ入力される承認入力手段と、
該承認入力手段にデータ入力された承認を話者の識別デ
ータとともに前記議事録データに付加する承認付加手段
と、を具備していることも可能である。
【0019】この場合、画像表示手段が議事録データを
表示出力した状態で、この表示出力された議事録データ
の承認が話者の識別データごとに承認入力手段にデータ
入力される。このデータ入力された承認を話者の識別デ
ータとともに承認付加手段が議事録データに付加するの
で、議事録データに話者による承認もデータ記録され
る。
【0020】上述のような会議音声記録装置において、
前記承認入力手段は、議事録データの承認を前記音声入
力手段により音声データとしてデータ入力することも可
能である。この場合、議事録データの承認を承認入力手
段が音声入力手段により音声データとしてデータ入力す
るので、話者が特定される音声データにより話者ごとの
承認がデータ入力される。
【0021】上述のような会議音声記録装置において、
前記議事録データを印刷出力する記録印刷手段を具備し
ていることも可能である。この場合、記録印刷手段が議
事録データを印刷出力するので、複数の話者による発言
内容が話者の識別データとともに記録された文書が印刷
される。
【0022】上述のような会議音声記録装置において、
前記音声入力手段に話者の発言音声がデータ入力される
ときに現在の時刻を検出する時刻検出手段も具備してお
り、前記記録作成手段は、前記時刻検出手段により検出
された時刻も利用して議事録データを作成することも可
能である。
【0023】この場合、音声入力手段に話者の発言音声
がデータ入力されるときに時刻検出手段が現在の時刻を
検出し、この時刻も利用して記録作成手段が議事録デー
タを作成するので、作成される議事録データに話者が発
言した時刻なども記録される。
【0024】なお、本発明で云う各種手段は、その機能
を実現するように形成されていれば良く、例えば、所定
の機能を発生する専用のハードウェア、所定の機能がプ
ログラムにより付与されたコンピュータ、プログラムに
よりコンピュータの内部に実現された所定の機能、これ
らの組み合わせ、等を許容する。
【0025】例えば、発声記憶手段は、複数の話者の識
別データごとに発声データをデータ登録できるものであ
れば良く、RAM(Random Access Memory)等の情報記憶
媒体の記憶エリアなどを許容する。音声入力手段は、発
言音声がデータ入力されるものであれば良く、音声入力
を信号出力するマイクロフォン、録音データを再生出力
するテープレコーダ、音声データをデータ受信する通信
I/F(Interface)、等を許容する。
【0026】画像表示手段は、議事録データを表示出力
できるものであれば良く、例えば、CRT(Cathode-Ray
Tube)やLCD(Li1uid Crystal Display)などのディス
プレイ装置を許容する。記録印刷手段は、議事録データ
を印刷出力できるものであれば良く、例えば、レーザプ
リンタやバブルジェットプリンタなどのプリンタ装置を
許容する。
【0027】修正入力手段は、議事録データに対する修
正をデータ入力できるものであれば良く、例えば、手動
操作されるキーボードなどを許容する。承認入力手段
は、議事録データの承認を話者の識別データごとにデー
タ入力できるものであれば良く、例えば、マイクロフォ
ンとコンピュータからなる音声認識装置などを許容す
る。
【0028】本発明の第一の情報記憶媒体は、複数の話
者の識別データごとに発声データがデータ登録されてい
る発声記憶手段と、複数の話者の発言音声がデータ入力
される音声入力手段と、が接続されているコンピュータ
が読取自在なソフトウェアが格納されている情報記憶媒
体であって、前記音声入力手段に入力された音声データ
の話者と発言内容とを前記発声記憶手段に登録されてい
る発声データと識別データとに基づいて認識すること、
この認識された発言内容を話者の識別データとともに所
定形態に編集した議事録データを作成すること、を前記
コンピュータに実行させるためのプログラムが格納され
ている。
【0029】従って、本発明の情報記憶媒体に格納され
ているプログラムをコンピュータに読み取らせて対応す
る処理動作を実行させると、このコンピュータは、音声
入力手段に入力された音声データの話者と発言内容とを
発声記憶手段に登録されている発声データと識別データ
とに基づいて認識し、この認識された発言内容を話者の
識別データとともに所定形態に編集した議事録データを
作成する。このため、複数の話者が発言すると、その内
容が識別データとともに所定形態に編集された議事録デ
ータが自動的にリアルタイムに作成される。
【0030】本発明の第二の情報記憶媒体は、複数の話
者の識別データごとに発声データがデータ登録されてい
る発声記憶手段と、複数の話者の発言音声がデータ入力
される音声入力手段と、が接続されているコンピュータ
が読取自在なソフトウェアが格納されている情報記憶媒
体であって、発言する話者の識別データのデータ入力を
受け付けること、このデータ入力された識別データに対
応して前記発声記憶手段から対応する話者の発声データ
を選択すること、この選択された発声データに基づいて
前記音声入力手段に入力された音声データの発言内容を
認識すること、この認識された発言内容をデータ入力さ
れた識別データとともに所定形態に編集した議事録デー
タを作成すること、を前記コンピュータに実行させるた
めのプログラムが格納されている。
【0031】従って、本発明の情報記憶媒体に格納され
ているプログラムをコンピュータに読み取らせて対応す
る処理動作を実行させると、このコンピュータは、発言
する話者の識別データのデータ入力を受け付け、このデ
ータ入力された識別データに対応して発声記憶手段から
対応する話者の発声データを選択する。この選択された
発声データに基づいて音声入力手段に入力された音声デ
ータの発言内容を認識し、この認識された発言内容をデ
ータ入力された識別データとともに所定形態に編集した
議事録データを作成する。このため、複数の話者が発言
すると、その内容が識別データとともに所定形態に編集
された議事録データが自動的にリアルタイムに作成され
る。
【0032】本発明の第三の情報記憶媒体は、複数の話
者の識別データごとに発声データがデータ登録されてい
る発声記憶手段と、複数の話者による発言が個々にデー
タ入力される複数の音声入力手段と、が接続されている
コンピュータが読取自在なソフトウェアが格納されてい
る情報記憶媒体であって、複数の前記音声入力手段に入
力された音声データの発言内容を前記発声記憶手段に登
録されている発声データと識別データとに基づいて認識
すること、この認識された発言内容を話者の識別データ
とともに所定形態に編集した議事録データを作成するこ
と、を前記コンピュータに実行させるためのプログラム
が格納されている。
【0033】従って、本発明の情報記憶媒体に格納され
ているプログラムをコンピュータに読み取らせて対応す
る処理動作を実行させると、このコンピュータは、複数
の音声入力手段に入力された音声データの発言内容を発
声記憶手段に登録されている発声データと識別データと
に基づいて認識し、この認識された発言内容を話者の識
別データとともに所定形態に編集した議事録データを作
成する。このため、複数の話者が発言すると、その内容
が識別データとともに所定形態に編集された議事録デー
タが自動的にリアルタイムに作成される。
【0034】なお、本発明で云う情報記憶媒体とは、コ
ンピュータに各種処理を実行させるためのプログラムが
ソフトウェアとして事前に格納されたハードウェアであ
れば良く、例えば、コンピュータを一部とする装置に固
定されているROM(Read Only Memory)やHDD(Hard
Disc Drive)、コンピュータを一部とする装置に着脱自
在に装填されるCD(Compact Disc)−ROMやFD(Flo
ppy Disc)、等を許容する。
【0035】また、本発明で云うコンピュータとは、ソ
フトウェアからなるプログラムを読み取って対応する処
理動作を実行できる装置であれば良く、例えば、CPU
(Central Processing Unit)を主体として、これにRO
MやRAMやI/F等の各種デバイスが必要により接続
された装置などを許容する。
【0036】
【発明の実施の形態】本発明の実施の一形態を図面を参
照して以下に説明する。ただし、本実施の形態に関して
前述した一従来例と同一の部分は、同一の名称を使用し
て詳細な説明は省略する。なお、図1は本実施の形態の
会議音声記録装置の論理構造を示す模式図、図2は物理
構造を示すブロック図、図3は本実施の形態の会議音声
記録装置を会議に使用した状態を示す模式図、図4は会
議音声記録装置の会議音声処理方法における初期設定の
サブルーチンを示すフローチャート、図5は会議音声処
理方法のメインルーチンを示すフローチャート、図6は
会議音声処理方法の事後処理のサブルーチンを示すフロ
ーチャート、図7は議事録データの印刷画像を示す平面
図、である。
【0037】本実施の形態の会議音声記録装置である議
事録生成システム1は、図2に示すように、一般的なパ
ーソナルコンピュータからなるコンピュータシステム1
00を具備しており、このコンピュータシステム100
が、コンピュータの主体となるハードウェアとしてCP
U101を具備している。
【0038】このCPU101には、バスライン102
により、ROM103、RAM104、HDD105、
FD106が着脱自在に装填されるFDD(FD Drive)1
07、CD−ROM108が着脱自在に装填されるCD
ドライブ109、キーボード110、マウス111、デ
ィスプレイ112、USB(Universal Serial Bus)−I
/F113、等のハードウェアが接続されている。
【0039】このUSB−I/F113には、接続コネ
クタ114により、マイクユニット115、IC(Integ
rated Circuit)カード116が着脱自在に装填されるカ
ードリーダ117、レーザプリンタ118、大型のディ
スプレイ119、等のデバイスが接続されている。
【0040】本実施の形態の議事録生成システム1は、
図3に示すように、複数の話者2が参加する会議に利用
されるもので、その会議の議事録データを作成するよう
に形成されている。そこで、マイクユニット115は、
無指向性に形成されており、音声データを全周方向から
音声入力して接続コネクタ114に信号出力する。IC
カード116は、会議に出席する複数の話者2が個々に
用意して持参するもので、その話者の識別データととも
に五十音などの基本的な発声データがデータ登録され
る。
【0041】本実施の形態の議事録生成システム1で
は、ROM103、RAM104、HDD105、FD
106、CD−ROM108、ICカード116、等の
ハードウェアが情報記憶媒体に相当し、これらの少なく
とも一個にコンピュータシステム100の各種動作に必
要な制御プログラムや各種データがソフトウェアとして
記憶されている。
【0042】例えば、コンピュータシステム100のC
PU101に各種の処理動作を実行させる制御プログラ
ムは、FD106やCD−ROM108に事前に格納さ
れている。このようなソフトウェアはHDD105に事
前にインストールされており、コンピュータシステム1
00の起動時にRAM104に複写されてCPU101
に読み取られる。
【0043】このようにコンピュータシステム100の
CPU101が適正なプログラムを読み取って各種の処
理動作を実行することにより、本実施の形態の議事録生
成システム1には、図1に示すように、発声記憶手段1
1、音声入力手段12、音声認識手段13、記録作成手
段14、画像表示手段15、修正入力手段16、修正実
行手段17、承認入力手段18、承認付加手段19、記
録印刷手段20、等の各種手段が各種機能として論理的
に実現されている。
【0044】発声記憶手段11は、ここではRAM10
4等の制御プログラムに対応してCPU101が認識で
きるようにHDD105等に構築された記憶エリアに相
当し、複数の話者の識別データごとに発声データがデー
タ登録されている。
【0045】より具体的には、本実施の形態の議事録生
成システム1では、前述のように会議に出席する話者2
が個々に用意して持参するICカード116に識別デー
タと音声データとがデータ登録されているので、このI
Cカード116に登録されている各種データが会議の開
始直前などにカードリーダ117からHDD105にデ
ータ複写される。
【0046】音声入力手段12は、ここではRAM10
4等に保持されている制御プログラムに対応してCPU
101がマイクユニット115の音声入力をデータ処理
する機能に相当し、複数の話者2の発言による音声デー
タのデータ入力を受け付ける。
【0047】音声認識手段13は、RAM104等に保
持されている制御プログラムに対応してCPU101が
所定のデータ処理を実行する機能に相当し、音声入力手
段12に入力された音声データの話者2と発言内容とを
発声記憶手段11の発声データと識別データとに基づい
て認識する。
【0048】より具体的には、音声認識手段13は、音
声入力手段12に経時的にデータ入力される一連の音声
データをRAM104等に一時保持させ、発声記憶手段
11の複数の話者の発声データに基づいて最初に話者2
の識別データを特定する。これで話者2が特定されると
発声記憶手段11から対応する発声データを読み出し、
この音声データを利用した音声認識により音声入力手段
12からデータ入力されて一時保持された音声データの
発言内容をテキストデータにデータ変換する。
【0049】記録作成手段14も、RAM104等に保
持されている制御プログラムに対応してCPU101が
所定のデータ処理を実行する機能に相当し、音声認識手
段13により認識された発言内容を話者2の識別データ
とともに所定形態に編集した議事録データを作成する。
【0050】この議事録データは、図7に示すように、
会議の議題の名称、会議の場所と日時、会議に参加した
話者2の氏名と識別データの一覧、等とともに、会議で
の発言内容のテキストデータが話者2の氏名とともに順
番に記録された形態などとして作成される。
【0051】画像表示手段15は、RAM104等に保
持されている制御プログラムに対応してCPU101が
ディスプレイ112,119の表示出力を動作制御する
機能に相当し、記録作成手段14により作成された議事
録データを会議に出席した複数の話者2に表示出力す
る。
【0052】修正入力手段16は、RAM104等に保
持されている制御プログラムに対応してCPU101が
キーボード110の入力操作をデータ処理する機能に相
当し、画像表示手段15により表示出力された議事録デ
ータに対する修正のデータ入力を受け付ける。
【0053】修正実行手段17は、RAM104等に保
持されている制御プログラムに対応してCPU101が
所定のデータ処理を実行する機能に相当し、修正入力手
段16の入力データに対応して議事録データを修正す
る。なお、前述の画像表示手段15は、修正実行手段1
7により修正された議事録データもリアルタイムに表示
出力する。
【0054】承認入力手段18は、RAM104等に保
持されている制御プログラムに対応してCPU101が
マイクユニット115の音声入力をデータ処理する機能
に相当し、画像表示手段15に表示出力された議事録デ
ータの承認が話者2の識別データごとにデータ入力され
る。
【0055】承認付加手段19は、RAM104等に保
持されている制御プログラムに対応してCPU101が
所定のデータ処理を実行する機能に相当し、音声データ
等によりデータ入力された承認を話者2の識別データと
ともに議事録データに付加する。
【0056】より具体的には、承認入力手段18は、
“この議事録を承認しますか?”などの所定のガイダン
ステキストとともに話者2の氏名を順番にディスプレイ
119等に表示出力するので、氏名が表示された話者2
が“イエス”等の発言をマイクユニット115に音声入
力すると、この音声データの話者2を確認し、議事録デ
ータの話者2の一覧の対応する位置に承認のチェックを
マーキングする。
【0057】記録印刷手段20は、RAM104等に保
持されている制御プログラムに対応してCPU101が
レーザプリンタ118のデータ印刷を動作制御する機能
に相当し、図7に示すように、レーザプリンタ118で
印刷用紙3に印刷出力する。
【0058】なお、上述のようにレーザプリンタ118
が記録印刷手段20として議事録データを印刷出力する
ときや、ディスプレイ112,119が画像表示手段1
5として議事録データを表示出力するとき、その前段の
データ処理として議事録データをHDD105やFD1
06でデータ記憶することも可能である。
【0059】上述のような各種手段は、必要によりキー
ボード110やディスプレイ112等のハードウェアを
利用して実現されるが、その主体はRAM104等の情
報記憶媒体に格納されたソフトウェアに対応して、コン
ピュータのハードウェアであるCPU101が機能する
ことにより実現されている。
【0060】このようなソフトウェアは、例えば、複数
の話者の識別データごとに発声データをデータ登録する
こと、複数の話者2の発言によりマイクユニット115
等からデータ入力される音声データを受け付けること、
入力された音声データの話者2と発言内容とをデータ登
録されている複数の話者2の発声データに基づいて認識
すること、これで認識された発言内容を話者2の識別デ
ータとともに所定形態に編集した議事録データを作成す
ること、この作成された議事録データをディスプレイ1
12,119等に表示出力させること、この表示出力さ
せた議事録データに対する修正のキーボード110等に
よるデータ入力を受け付けること、この入力データに対
応して議事録データを修正すること、表示出力させた議
事録データの承認を話者2の識別データごとにマイクユ
ニット115等からデータ入力すること、このデータ入
力された承認を話者2の識別データとともに議事録デー
タに付加すること、議事録データをレーザプリンタ11
8等により印刷出力すること、等の処理動作をCPU1
01等に実行させるための制御プログラムとしてRAM
104等の情報記憶媒体に格納されている。
【0061】上述のような構成において、本実施の形態
の議事録生成システム1による会議音声処理方法を以下
に説明する。まず、会議を開催する場合、そこに議事録
生成システム1の各部を適宜設置する。例えば、図3に
示すように、複数の話者2が着席する大型のテーブル4
を用意し、話者2の全員の発言が音声入力される位置に
一個の無指向性のマイクユニット115を設置する。
【0062】さらに、話者2の全員で目視できる位置に
大型のディスプレイ119を設置し、議長となる話者2
の位置にコンピュータシステム100のキーボード11
0等を設置し、会議室の入口(図示せず)の近傍などにカ
ードリーダ117を設置する。
【0063】このような状態で、会議に出席する複数の
話者2は、自身の識別データとともに発声データをデー
タ登録したICカード116を持参し、図4に示すよう
に、会議室に入室するときにICカード116をカード
リーダ117に装填する。
【0064】すると、議事録生成システム1は、カード
リーダ117によりICカード116に登録されている
発声データと識別データとをデータ読出してHDD10
5にデータ複写するので(ステップS1,S4)、会議に
出席する複数の話者2の全員のデータ入力を確認した議
長は、初期設定の完了をキーボード110で入力操作す
る(ステップS3,T1)。
【0065】なお、会議に出席する話者2には、ICカ
ード116の持参を失念するものや、ICカード116
へのデータ登録を失念するものが発生することもある。
そこで、本実施の形態の議事録生成システム1では、上
述のような場合にはキーボード110の入力操作で動作
モードを登録モードとし(ステップS2)、キーボード1
10で話者2の識別データを入力操作してからマイクユ
ニット115で話者2の発生の音声データをデータ登録
することもできる(ステップS5)。
【0066】上述のように会議に出席する複数の話者2
の全員の音声データが識別データとともに議事録生成シ
ステム1にデータ保持されると、図5に示すように、議
事録生成システム1は、初期設定が完了したとして会議
の議事録を自動生成できる状態となる(ステップT1)。
【0067】そこで、議長の宣言により複数の話者2が
会議を開始すると、議事録生成システム1は、話者2か
らマイクユニット115に音声入力される発言の音声デ
ータを(ステップT2)、HDD105に一時保持した全
員の話者2の発生の音声データに基づいて音声認識する
(ステップT3)。
【0068】そこで、発言した話者2を特定して識別デ
ータを発行するとともに(ステップT4,T5)、発言内
容をテキストデータにデータ変換し(ステップT6,T
7)、この発言内容のテキストデータを話者2の識別デ
ータとともにRAM104等でデータ記憶する(ステッ
プT8)。
【0069】ただし、発言した話者2を特定できない場
合には専用の不能データが出力され(ステップT9)、発
言内容を音声認識できない場合にも専用の不能データが
出力されるので(ステップT10)、これらの不能データ
も通常データとともにRAM104等でデータ記憶され
る(ステップT8)。
【0070】本実施の形態の議事録生成システム1は、
話者2が発言するごとに上述の一連の処理を実行するの
で(ステップT2〜T10)、会議での発言内容が話者2
の識別データとともに時系列にデータ記録されることに
なる。そこで、会議が終了すると議長はキーボード11
0を入力操作し、議事録生成システム1を事後処理の実
行状態に移行させる(ステップT11,T12)。
【0071】その場合、議長がキーボード110で書類
形態を入力操作すると(ステップE1)、これに対応して
RAM104の議事録データが所定形態に編集されて議
事録データが作成される(ステップE2)。このように作
成された議事録データはディスプレイ112,119に
より複数の話者2の全員に表示出力されるので(ステッ
プE3)、この状態で全員が議事録の内容を確認するこ
とになる。
【0072】このように表示出力される議事録データ
は、印刷結果と同様なレイアウトからなるので、図7に
示すように、会議の議題の名称、会議の場所と日時、会
議に参加した話者2の氏名と識別データの一覧、等とと
もに、会議での発言内容のテキストデータが話者2の氏
名とともに順番に記録されていることになる。
【0073】このとき、音声認識できなかった発言内容
や話者2の位置には“認識不能”等のガイダンスととも
に時間に対応した空欄が提示されるので、そこには全員
の承諾のもと議長が適正なテキストデータをキーボード
110で入力操作する(ステップE2,E4)。また、音
声認識の結果が誤っている場合もあるので、この場合も
全員の承諾のもと議長がキーボード110の入力操作で
テキストデータを修正する。
【0074】上述のように修正された議事録データもリ
アルタイムに表示出力されるので(ステップE3)、修正
が完了するとキーボード110の入力操作により全員の
承認の入力状態となる。その場合、“この議事録を承認
しますか?”などの所定のガイダンステキストとともに
話者2の氏名が順番にディスプレイ119に表示出力さ
れるので、氏名が表示された話者2は内容を承認する場
合には“イエス”等の発言をマイクユニット115に音
声入力する(ステップE5)。
【0075】すると、議事録生成システム1は、その音
声データの話者2とディスプレイ119に表示出力した
話者2とが一致することを確認し、これが確認されると
議事録データの話者2の一覧の対応する位置に承認のチ
ェックとして“○”をマーキングする(ステップE6)。
【0076】上述のように複数の話者2の全員が議事録
データを承認すると、議長はキーボード110により議
事録生成システム1に印刷出力を入力操作する。する
と、この議事録生成システム1は、図7に示すように、
会議の議題の名称、会議の場所と日時、会議に参加した
話者2の氏名と識別データの一覧、承認の有無、等とと
もに、話者2の氏名が付与された発言内容のテキストデ
ータ、等が所定のフォーマットで記録された議事録を話
者2の部数だけ印刷出力することになる(ステップE
7,E8)。
【0077】本実施の形態の議事録生成システム1は、
上述のように会議の議事録を自動的にリアルタイムに生
成し、文書として印刷出力することができる。本実施の
形態の議事録生成システム1では、複数の話者2の発生
の音声データをデータ登録しておくことにより、発言し
た話者2を特定すると同時に、その発言内容をテキスト
データに変換し、発言内容のテキストデータを話者2の
識別データとともに議事録に記録するので、誰が何時、
何を発言したかを議事録で確認することができる。
【0078】ただし、現在も音声認識による話者2の特
定や発言内容のデータ変換は完全ではないが、本実施の
形態の議事録生成システム1では、作成した議事録デー
タをディスプレイ112,119により表示出力してキ
ーボード110による修正を受け付けるので、最終的に
適切な議事録を獲得することができる。
【0079】さらに、作成した議事録データをディスプ
レイ119により会議に出席した話者2に表示し、その
話者2が議事録データを承認すると、これを議事録デー
タに付加するので、議事録データに話者2による承認も
データ記録することができる。特に、この話者2の承認
のデータ入力を音声入力で実行するので、承認のデータ
入力のために専用のデバイスを追加する必要がなく、話
者2を特定できる形態で承認のデータ入力を受け付ける
ことができる。
【0080】なお、本発明は上記形態に限定されるもの
ではなく、その要旨を逸脱しない範囲で各種の変形を許
容する。例えば、上記形態ではコンピュータシステム1
00にマイクユニット115を接続して音声入力手段1
2を実現し、マイクユニット115にリアルタイムに音
声入力される音声データで議事録データを作成すること
を例示した。
【0081】しかし、コンピュータシステム100にマ
イクユニット115でなくテープレコーダを接続して音
声入力手段を実現し(図示せず)、テープレコーダが作成
する録音音声で議事録データを作成することも可能であ
る。同様に、コンピュータシステム100にマイクユニ
ット115でなくモデム等の通信デバイスを接続して音
声入力手段を実現し(図示せず)、通信デバイスの送信音
声と受信音声とで議事録データを作成することも可能で
ある。
【0082】さらに、上記形態ではコンピュータシステ
ム100に一個の無指向性のマイクユニット115を接
続して音声入力手段12を実現し、一個のマイクユニッ
ト115の入力音声から話者2を特定すると同時に発言
内容を認識することを例示した。
【0083】しかし、会議に出席する複数の話者2の各
々にスイッチングデバイスを貸与して識別入力手段を実
現し(図示せず)、発言する話者2にスイッチングデバイ
スを操作させ、発言する話者2の識別データを逐次入力
させることも可能である。この場合、コンピュータシス
テム100は発声選択手段として、データ入力された識
別データに対応して発声記憶手段11から対応する話者
2の発声データを選択し、この選択した発声データに基
づいて音声入力手段12に入力された音声データの発言
内容を認識すれば良い。
【0084】この場合、発言する話者2を特定する専用
の手段は必要となるが、これを話者2が的確に操作する
ことも必要となるが、音声認識を実行することなく発言
する話者2を確実に特定することができ、発言内容の音
声認識も良好な精度で実行することができる。
【0085】また、超指向性の複数のマイクユニットを
会議に出席する複数の話者2ごとに配置して複数の音声
入力手段を実現し、発言音声がデータ入力されるマイク
ユニットにより発言する話者2を判別することも可能で
ある。この場合、複数のマイクユニットを用意する必要
があるが、話者2に特別な操作が必要ない。
【0086】なお、このように複数の話者2の各々に音
声入力手段を個々に用意することは、例えば、複数の話
者2がデータ通信により会議する電話やテレビ電話シス
テムなどのデータ通信装置(図示せず)にも適用可能であ
る。音声通信するデータ通信装置では、通信元の音声デ
ータは音声入力されてデータ送信され、通信先の音声デ
ータはデータ受信されて音声出力されるので、通信元と
通信先との話者2が発言した音声データは明白に識別さ
れる。
【0087】そこで、このようなデータ通信装置に本案
を適用する場合、通信元と通信先との話者2の識別デー
タごとに発声データをデータ登録しておき、データ受信
して音声出力する音声データは通信先の発声データによ
り音声認識し、音声入力されてデータ送信する音声デー
タは通信元の発声データにより音声認識すれば良い。
【0088】また、上記形態では複数の話者2の発言内
容が識別データとともに時系列の順番に記録された議事
録データを作成することを例示したが、このような議事
録データを所望により各種形態に編集することも可能で
ある。例えば、特定の話者2の発言内容のみ記録するこ
とや削除することも可能であり、発言内容を時系列の順
番でなく話者2ごとに配列することも可能であり、話者
2ごとに印刷のフォントやカラーを変更することも可能
である。
【0089】さらに、話者の発言音声がデータ入力され
るときに現在の時刻を検出する時刻検出手段をTOD(T
ime Of Day Clock)などで実現し、その検出時刻を議事
録データの作成に利用することも可能である。この場
合、作成される議事録データに話者が発言した時刻など
を記録できるので、より詳細な議事録を生成することか
できる。
【0090】さらに、上記形態ではRAM104等にソ
フトウェアとして格納されている制御プログラムに従っ
てCPU101が動作することにより、議事録生成シス
テム1の各種機能として各種手段が論理的に実現される
ことを例示した。しかし、このような各種手段の各々を
固有のハードウェアとして形成することも可能であり、
一部をソフトウェアとしてRAM104等に格納すると
ともに一部をハードウェアとして形成することも可能で
ある。
【0091】また、上記形態ではCD−ROM108等
からHDD105に事前にインストールされているソフ
トウェアがコンピュータシステム100の起動時にRA
M104に複写され、このようにRAM104に格納さ
れたソフトウェアをCPU101が読み取ることを想定
したが、このようなソフトウェアをHDD105に格納
したままCPU101に利用させることや、ROM10
3に事前に固定的に格納しておくことも可能である。
【0092】さらに、単体で取り扱える情報記憶媒体で
あるFD106やCD−ROM108にソフトウェアを
格納しておき、このFD106等からHDD105やR
AM104にソフトウェアをインストールすることも可
能であるが、このようなインストールを実行することな
くFD106等からCPU101がソフトウェアを直接
に読み取って処理動作を実行することも可能である。
【0093】つまり、本発明の議事録生成システム1の
各種手段をソフトウェアにより実現する場合、そのソフ
トウェアはCPU101が読み取って対応する動作を実
行できる状態に有れば良い。また、上述のような各種手
段を実現する制御プログラムを、複数のソフトウェアの
組み合わせで形成することも可能であり、その場合、単
体の製品となる情報記憶媒体には、本発明の議事録生成
システム1を実現するための必要最小限のソフトウェア
のみを格納しておけば良い。
【0094】例えば、既存のオペレーティングシステム
が実装されているコンピュータシステム100に、CD
−ROM108等の情報記憶媒体によりアプリケーショ
ンソフトを提供するような場合、本発明の議事録生成シ
ステム1の各種手段を実現するソフトウェアは、アプリ
ケーションソフトとオペレーティングシステムとの組み
合わせで実現されるので、オペレーティングシステムに
依存する部分のソフトウェアは情報記憶媒体のアプリケ
ーションソフトから省略することができる。
【0095】また、このように情報記憶媒体に記述した
ソフトウェアをCPU101に供給する手法は、その情
報記憶媒体をコンピュータシステム100に直接に装填
することに限定されない。例えば、上述のようなソフト
ウェアをホストコンピュータの情報記憶媒体に格納して
おき、このホストコンピュータを通信ネットワークで端
末コンピュータに接続し、ホストコンピュータから端末
コンピュータにデータ通信でソフトウェアを供給するこ
とも可能である。
【0096】上述のような場合、端末コンピュータが自
身の情報記憶媒体にソフトウェアをダウンロードした状
態でスタンドアロンの処理動作を実行することも可能で
あるが、ソフトウェアをダウンロードすることなくホス
トコンピュータとのリアルタイムのデータ通信により処
理動作を実行することも可能である。この場合、ホスト
コンピュータと端末コンピュータとを通信ネットワーク
で接続したシステム全体が、本発明の議事録生成システ
ム1に相当することになる。
【0097】
【発明の効果】本発明は以上説明したように構成されて
いるので、以下に記載するような効果を奏する。
【0098】本発明の第一の会議音声記録装置による会
議音声処理方法では、発声記憶手段に複数の話者の識別
データごとに発声データがデータ登録されている状態
で、複数の話者の発言による音声データが音声入力手段
にデータ入力されると、この入力された音声データの話
者と発言内容とを音声認識手段が発声記憶手段に登録さ
れている発声データと識別データとに基づいて認識し、
この認識された発言内容を話者の識別データとともに記
録作成手段が所定形態に編集した議事録データを作成す
ることにより、複数の話者の発言内容を識別データとと
もに所定形態に編集した議事録データを自動的にリアル
タイムに作成することができるので、専用の作業者を必
要とすることなく会議の議事録を作成することができ
る。
【0099】本発明の第二の会議音声記録装置による会
議音声処理方法では、発声記憶手段に複数の話者の識別
データごとに発声データがデータ登録されている状態
で、複数の話者の発言による音声データが音声入力手段
にデータ入力されると同時に、発言する話者の識別デー
タが識別入力手段に逐次入力されると、このデータ入力
された識別データに対応して発声選択手段が発声記憶手
段から対応する話者の発声データを選択し、この選択さ
れた発声データに基づいて入力された音声データの発言
内容を音声認識手段が認識し、この認識された発言内容
を話者の識別データとともに記録作成手段が所定形態に
編集した議事録データを作成することにより、複数の話
者の発言内容を識別データとともに所定形態に編集した
議事録データを自動的にリアルタイムに作成することが
できるので、専用の作業者を必要とすることなく会議の
議事録を作成することができ、特に、音声認識を必要と
することなく発言した話者を確実に判別することがで
き、発言内容の音声認識の精度も向上させることができ
る。
【0100】本発明の第三の会議音声記録装置による会
議音声処理方法では、発声記憶手段に複数の話者の識別
データごとに発声データがデータ登録されている状態
で、複数の話者の発言による音声データが複数の音声入
力手段に個々にデータ入力されると、これら複数の音声
入力手段に入力された音声データの発言内容を音声認識
手段が発声記憶手段の対応する話者の発声データに基づ
いて認識し、この認識された発言内容を話者の識別デー
タとともに記録作成手段が所定形態に編集した議事録デ
ータを作成することにより、複数の話者の発言内容を識
別データとともに所定形態に編集した議事録データを自
動的にリアルタイムに作成することができるので、専用
の作業者を必要とすることなく会議の議事録を作成する
ことができ、特に、音声認識を必要とすることなく発言
した話者を略確実に判別することができ、発言内容の音
声認識の精度も向上させることができる。
【0101】本発明の第四の会議音声記録装置による会
議音声処理方法では、複数の話者がデータ通信により会
議すると、このデータ通信による会議での発言内容が識
別データとともに所定形態に編集された議事録データが
自動的にリアルタイムに作成されることにより、複数の
話者のデータ通信による会議の内容が識別データととも
に所定形態に編集された議事録データを自動的にリアル
タイムに作成することができる。
【0102】また、上述のような会議音声記録装置にお
いて、画像表示手段が議事録データを表示出力した状態
で、この表示出力された議事録データに対する修正が修
正入力手段にデータ入力されると、この入力データに対
応して修正実行手段が議事録データを修正することによ
り、議事録データを表示出力させながら適宜修正するこ
とができるので、音声認識が確実でなくとも適正な形態
の議事録データを作成することができる。
【0103】また、画像表示手段が議事録データを表示
出力した状態で、この表示出力された議事録データの承
認が話者の識別データごとに承認入力手段にデータ入力
されると、このデータ入力された承認を話者の識別デー
タとともに承認付加手段が議事録データに付加すること
により、議事録データに話者による承認もデータ記録す
ることができる。
【0104】また、議事録データの承認を承認入力手段
が音声入力手段により音声データとしてデータ入力する
ことにより、話者が特定される音声データにより話者ご
との承認をデータ入力することができる。
【0105】また、記録印刷手段が議事録データを印刷
出力することにより、複数の話者による発言内容が話者
の識別データとともに記録された文書を印刷することが
できる。
【0106】また、音声入力手段に話者の発言音声がデ
ータ入力されるときに時刻検出手段が現在の時刻を検出
し、この時刻も利用して記録作成手段が議事録データを
作成することにより、作成される議事録データに話者が
発言した時刻などを記録することができる。
【図面の簡単な説明】
【図1】本発明の実施の一形態の会議音声記録装置の論
理構造を示す模式図である。
【図2】物理構造を示すブロック図である。
【図3】本実施の形態の会議音声記録装置を会議に使用
した状態を示す模式図である。
【図4】会議音声記録装置の会議音声処理方法における
初期設定のサブルーチンを示すフローチャートである。
【図5】会議音声処理方法のメインルーチンを示すフロ
ーチャートである。
【図6】会議音声処理方法の事後処理のサブルーチンを
示すフローチャートである。
【図7】議事録データの印刷画像を示す平面図である。
【符号の説明】
1 会議音声記録装置である議事録生成システム 2 話者 11 発声記憶手段 12 音声入力手段 13 音声認識手段 14 記録作成手段 15 画像表示手段 16 修正入力手段 17 修正実行手段 18 承認入力手段 19 承認付加手段 20 記録印刷手段 100 コンピュータシステム 101 コンピュータであるCPU 103 情報記憶媒体であるROM 104 情報記憶媒体であるRAM 105 情報記憶媒体であるHDD 106 情報記憶媒体であるFD 108 情報記憶媒体であるCD−ROM 116 情報記憶媒体であるICカード
───────────────────────────────────────────────────── フロントページの続き (72)発明者 今仲 良行 東京都大田区下丸子3丁目30番2号 キヤ ノン株式会社内 (72)発明者 種谷 陽一 東京都大田区下丸子3丁目30番2号 キヤ ノン株式会社内 (72)発明者 望月 無我 東京都大田区下丸子3丁目30番2号 キヤ ノン株式会社内 (72)発明者 松本 宣幸 東京都大田区下丸子3丁目30番2号 キヤ ノン株式会社内 (72)発明者 須釜 定之 東京都大田区下丸子3丁目30番2号 キヤ ノン株式会社内 Fターム(参考) 5B009 LA01 ND01 QB11 RC01 VA02 VA05 VA11 5D015 AA03 KK03 9A001 BB03 BB04 CC08 HH17 JJ05 JJ29 JJ35 KK31 LL03

Claims (17)

    【特許請求の範囲】
  1. 【請求項1】 複数の話者の識別データごとに発声デー
    タをデータ登録しておき、 複数の話者の発言音声をデータ入力し、 この入力された音声データの話者と発言内容とを前記発
    声データと前記識別データとに基づいて認識し、 この認識された発言内容を話者の識別データとともに所
    定形態に編集した議事録データを作成するようにした会
    議音声処理方法。
  2. 【請求項2】 複数の話者の識別データごとに発声デー
    タをデータ登録しておき、 発言による音声データを複数の話者ごとに個別にデータ
    入力し、 これら個別に入力された音声データの発言内容を対応す
    る話者の前記発声データと前記識別データとに基づいて
    認識し、 この認識された発言内容を話者の識別データとともに所
    定形態に編集した議事録データを作成するようにした会
    議音声処理方法。
  3. 【請求項3】 複数の話者の識別データごとに発声デー
    タをデータ登録しておき、 複数の話者の発言音声をデータ入力し、 発言する話者の識別データを逐次入力し、 このデータ入力された識別データに対応して対応する話
    者の発声データを選択し、 この選択された発声データに基づいてデータ入力された
    発言の音声データの発言内容を認識し、 この認識された発言内容をデータ入力された識別データ
    とともに所定形態に編集した議事録データを作成するよ
    うにした会議音声処理方法。
  4. 【請求項4】 複数の話者がデータ通信するデータ通信
    装置において、 データ通信により会議する複数の話者の識別データごと
    に発声データをデータ登録しておき、 データ通信される複数の話者の発言音声から請求項1な
    いし3の何れか一記載の会議音声処理方法により議事録
    データを作成するようにした会議音声処理方法。
  5. 【請求項5】 話者の発言音声をデータ入力するときに
    現在の時刻を検出し、 この検出された時刻も利用して議事録データを作成する
    ようにした請求項1ないし4の何れか一記載の会議音声
    処理方法。
  6. 【請求項6】 複数の話者の識別データごとに発声デー
    タがデータ登録されている発声記憶手段と、 複数の話者の発言音声がデータ入力される音声入力手段
    と、 該音声入力手段に入力された音声データの話者と発言内
    容とを前記発声記憶手段に登録されている発声データと
    識別データとに基づいて認識する音声認識手段と、 該音声認識手段により認識された発言内容を話者の識別
    データとともに所定形態に編集した議事録データを作成
    する記録作成手段と、を具備している会議音声記録装
    置。
  7. 【請求項7】 複数の話者の識別データごとに発声デー
    タがデータ登録されている発声記憶手段と、 複数の話者の発言音声がデータ入力される音声入力手段
    と、 発言する話者の識別データが逐次入力される識別入力手
    段と、 該識別入力手段にデータ入力された識別データに対応し
    て前記発声記憶手段から対応する話者の発声データを選
    択する発声選択手段と、 該発声選択手段により選択された発声データに基づいて
    前記音声入力手段に入力された音声データの発言内容を
    認識する音声認識手段と、 該音声認識手段により認識された発言内容を前記識別入
    力手段にデータ入力された識別データとともに所定形態
    に編集した議事録データを作成する記録作成手段と、を
    具備している会議音声記録装置。
  8. 【請求項8】 複数の話者の識別データごとに発声デー
    タがデータ登録されている発声記憶手段と、 複数の話者による発言が個々にデータ入力される複数の
    音声入力手段と、 これら複数の音声入力手段に入力された音声データの発
    言内容を前記発声記憶手段の対応する話者の発声データ
    に基づいて認識する音声認識手段と、 該音声認識手段により認識された発言内容を話者の識別
    データとともに所定形態に編集した議事録データを作成
    する記録作成手段と、を具備している会議音声記録装
    置。
  9. 【請求項9】 複数の話者がデータ通信するデータ通信
    装置において、 請求項6ないし8の何れか一記載の会議音声記録装置を
    具備しており、 前記発声記憶手段は、データ通信により会議する複数の
    話者の識別データごとに発声データがデータ登録されて
    おり、 前記記録作成手段は、データ通信される複数の話者の発
    言音声から議事録データを作成する会議音声記録装置。
  10. 【請求項10】 前記議事録データを表示出力する画像
    表示手段と、 該画像表示手段により表示出力された議事録データに対
    する修正がデータ入力される修正入力手段と、 該修正入力手段の入力データに対応して前記議事録デー
    タを修正する修正実行手段と、も具備している請求項6
    ないし9の何れか一記載の会議音声記録装置。
  11. 【請求項11】 前記議事録データを表示出力する画像
    表示手段と、 該画像表示手段に表示出力された議事録データの承認が
    話者の識別データごとにデータ入力される承認入力手段
    と、 該承認入力手段にデータ入力された承認を話者の識別デ
    ータとともに前記議事録データに付加する承認付加手段
    と、も具備している請求項6ないし10の何れか一記載
    の会議音声記録装置。
  12. 【請求項12】 前記承認入力手段は、議事録データの
    承認を前記音声入力手段により音声データとしてデータ
    入力する請求項11の何れか一記載の会議音声記録装
    置。
  13. 【請求項13】 前記議事録データを印刷出力する記録
    印刷手段も具備している請求項6ないし12の何れか一
    記載の会議音声記録装置。
  14. 【請求項14】 前記音声入力手段に話者の発言音声が
    データ入力されるときに現在の時刻を検出する時刻検出
    手段も具備しており、 前記記録作成手段は、前記時刻検出手段により検出され
    た時刻も利用して議事録データを作成する請求項6ない
    し13の何れか一記載の会議音声処理方法。
  15. 【請求項15】 複数の話者の識別データごとに発声デ
    ータがデータ登録されている発声記憶手段と、複数の話
    者の発言音声がデータ入力される音声入力手段と、が接
    続されているコンピュータが読取自在なソフトウェアが
    格納されている情報記憶媒体であって、 前記音声入力手段に入力された音声データの話者と発言
    内容とを前記発声記憶手段に登録されている発声データ
    と識別データとに基づいて認識すること、 この認識された発言内容を話者の識別データとともに所
    定形態に編集した議事録データを作成すること、を前記
    コンピュータに実行させるためのプログラムが格納され
    ていることを特徴とする情報記憶媒体。
  16. 【請求項16】 複数の話者の識別データごとに発声デ
    ータがデータ登録されている発声記憶手段と、複数の話
    者の発言音声がデータ入力される音声入力手段と、が接
    続されているコンピュータが読取自在なソフトウェアが
    格納されている情報記憶媒体であって、 発言する話者の識別データのデータ入力を受け付けるこ
    と、 このデータ入力された識別データに対応して前記発声記
    憶手段から対応する話者の発声データを選択すること、 この選択された発声データに基づいて前記音声入力手段
    に入力された音声データの発言内容を認識すること、 この認識された発言内容をデータ入力された識別データ
    とともに所定形態に編集した議事録データを作成するこ
    と、を前記コンピュータに実行させるためのプログラム
    が格納されていることを特徴とする情報記憶媒体。
  17. 【請求項17】 複数の話者の識別データごとに発声デ
    ータがデータ登録されている発声記憶手段と、複数の話
    者による発言が個々にデータ入力される複数の音声入力
    手段と、が接続されているコンピュータが読取自在なソ
    フトウェアが格納されている情報記憶媒体であって、 複数の前記音声入力手段に入力された音声データの発言
    内容を前記発声記憶手段に登録されている発声データと
    識別データとに基づいて認識すること、 この認識された発言内容を話者の識別データとともに所
    定形態に編集した議事録データを作成すること、を前記
    コンピュータに実行させるためのプログラムが格納され
    ていることを特徴とする情報記憶媒体。
JP11167371A 1999-06-14 1999-06-14 会議音声処理方法および記録装置、情報記憶媒体 Pending JP2000352995A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP11167371A JP2000352995A (ja) 1999-06-14 1999-06-14 会議音声処理方法および記録装置、情報記憶媒体
EP00305012A EP1061724A3 (en) 1999-06-14 2000-06-13 Conference voice processing method, apparatus and information memory medium therefor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11167371A JP2000352995A (ja) 1999-06-14 1999-06-14 会議音声処理方法および記録装置、情報記憶媒体

Publications (1)

Publication Number Publication Date
JP2000352995A true JP2000352995A (ja) 2000-12-19

Family

ID=15848484

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11167371A Pending JP2000352995A (ja) 1999-06-14 1999-06-14 会議音声処理方法および記録装置、情報記憶媒体

Country Status (2)

Country Link
EP (1) EP1061724A3 (ja)
JP (1) JP2000352995A (ja)

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004020739A (ja) * 2002-06-13 2004-01-22 Kojima Co Ltd 議事録作成装置、議事録作成方法、議事録作成プログラム
JP2005107529A (ja) * 2003-09-25 2005-04-21 Ricoh Co Ltd 時間ベースメディアのための印刷可能表現
JP2005165066A (ja) * 2003-12-03 2005-06-23 Internatl Business Mach Corp <Ibm> 音声認識システム、データ処理装置、そのデータ処理方法及びプログラム
WO2005069171A1 (ja) * 2004-01-14 2005-07-28 Nec Corporation 文書対応付け装置、および文書対応付け方法
JP2009069172A (ja) * 2007-09-10 2009-04-02 Konica Minolta Business Technologies Inc 議事録作成装置、議事録作成システム、議事録作成方法および議事録作成プログラム
JP2009086207A (ja) * 2007-09-28 2009-04-23 Toppan Printing Co Ltd 議事録情報生成システム、議事録情報生成方法、及び議事録情報生成プログラム
JP2009301125A (ja) * 2008-06-10 2009-12-24 Hitachi Ltd 会議音声録音システム
JP2011100355A (ja) * 2009-11-06 2011-05-19 Ricoh Co Ltd 発言記録装置、発言記録方法、プログラム及び記録媒体
US8077341B2 (en) 2003-09-25 2011-12-13 Ricoh Co., Ltd. Printer with audio or video receiver, recorder, and real-time content-based processing logic
JP2012146302A (ja) * 2011-01-11 2012-08-02 Hon Hai Precision Industry Co Ltd 音声をテキストに変換する装置及び方法
US8274666B2 (en) 2004-03-30 2012-09-25 Ricoh Co., Ltd. Projector/printer for displaying or printing of documents
JP2013011744A (ja) * 2011-06-29 2013-01-17 Mizuho Information & Research Institute Inc 議事録作成システム、議事録作成方法及び議事録作成プログラム
JP2013029690A (ja) * 2011-07-28 2013-02-07 Toshiba Corp 話者分類装置、話者分類方法および話者分類プログラム
US8373905B2 (en) 2003-09-25 2013-02-12 Ricoh Co., Ltd. Semantic classification and enhancement processing of images for printing applications
JP2014038132A (ja) * 2012-08-10 2014-02-27 Toshiba Corp 情報処理装置、プログラム、及び情報処理方法
JP2015062093A (ja) * 2013-09-21 2015-04-02 株式会社アクトエムティー 会計処理装置
JP2018106148A (ja) * 2016-12-12 2018-07-05 ソリザバ カンパニー リミテッドSorizava Co., Ltd. 多重話者音声認識修正システム
JP2019148780A (ja) * 2018-02-28 2019-09-05 シャープ株式会社 音声出力装置、音声出力方法及びプログラム
JP2020129080A (ja) * 2019-02-08 2020-08-27 三浦 浩之 音声認識システム
JP2021508848A (ja) * 2017-12-31 2021-03-11 美的集団股▲フン▼有限公司Midea Group Co., Ltd. ホームアシスタント装置を制御するための方法及びシステム
JP2021081483A (ja) * 2019-11-15 2021-05-27 前田建設工業株式会社 議事録データ作成システム
WO2021256614A1 (ko) * 2020-06-16 2021-12-23 주식회사 마인즈랩 화자가 표지된 텍스트 생성 방법
JP7486812B2 (ja) 2021-09-28 2024-05-20 ミチビク株式会社 情報処理方法、情報処理装置およびプログラム

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1363271A1 (de) * 2002-05-08 2003-11-19 Sap Ag Verfahren und System zur Verarbeitung und Speicherung von Sprachinformationen eines Dialogs
CN102572372B (zh) * 2011-12-28 2018-10-16 中兴通讯股份有限公司 会议纪要的提取方法和装置
CN104427292A (zh) * 2013-08-22 2015-03-18 中兴通讯股份有限公司 会议纪要的提取方法及装置
CN114514577A (zh) * 2019-08-15 2022-05-17 Kwb全球有限公司 生成和传输口头通信的文字记录的方法和系统

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61239358A (ja) * 1985-04-15 1986-10-24 Sharp Corp 音声入力による文書作成方式
JPH0350623A (ja) * 1989-07-18 1991-03-05 Nec Corp 会話の自動文書化システム
JPH07210190A (ja) * 1993-12-30 1995-08-11 Internatl Business Mach Corp <Ibm> 音声認識方法及びシステム
US5606643A (en) * 1994-04-12 1997-02-25 Xerox Corporation Real-time audio recording system for automatic speaker indexing
JPH10198393A (ja) * 1997-01-08 1998-07-31 Matsushita Electric Ind Co Ltd 会話記録装置

Cited By (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004020739A (ja) * 2002-06-13 2004-01-22 Kojima Co Ltd 議事録作成装置、議事録作成方法、議事録作成プログラム
JP2005107529A (ja) * 2003-09-25 2005-04-21 Ricoh Co Ltd 時間ベースメディアのための印刷可能表現
US8373905B2 (en) 2003-09-25 2013-02-12 Ricoh Co., Ltd. Semantic classification and enhancement processing of images for printing applications
US8077341B2 (en) 2003-09-25 2011-12-13 Ricoh Co., Ltd. Printer with audio or video receiver, recorder, and real-time content-based processing logic
US8150687B2 (en) 2003-12-03 2012-04-03 Nuance Communications, Inc. Recognizing speech, and processing data
JP2005165066A (ja) * 2003-12-03 2005-06-23 Internatl Business Mach Corp <Ibm> 音声認識システム、データ処理装置、そのデータ処理方法及びプログラム
WO2005069171A1 (ja) * 2004-01-14 2005-07-28 Nec Corporation 文書対応付け装置、および文書対応付け方法
JPWO2005069171A1 (ja) * 2004-01-14 2008-09-04 日本電気株式会社 文書対応付け装置、および文書対応付け方法
JP4600828B2 (ja) * 2004-01-14 2010-12-22 日本電気株式会社 文書対応付け装置、および文書対応付け方法
US8274666B2 (en) 2004-03-30 2012-09-25 Ricoh Co., Ltd. Projector/printer for displaying or printing of documents
JP2009069172A (ja) * 2007-09-10 2009-04-02 Konica Minolta Business Technologies Inc 議事録作成装置、議事録作成システム、議事録作成方法および議事録作成プログラム
JP2009086207A (ja) * 2007-09-28 2009-04-23 Toppan Printing Co Ltd 議事録情報生成システム、議事録情報生成方法、及び議事録情報生成プログラム
JP2009301125A (ja) * 2008-06-10 2009-12-24 Hitachi Ltd 会議音声録音システム
JP2011100355A (ja) * 2009-11-06 2011-05-19 Ricoh Co Ltd 発言記録装置、発言記録方法、プログラム及び記録媒体
JP2012146302A (ja) * 2011-01-11 2012-08-02 Hon Hai Precision Industry Co Ltd 音声をテキストに変換する装置及び方法
JP2013011744A (ja) * 2011-06-29 2013-01-17 Mizuho Information & Research Institute Inc 議事録作成システム、議事録作成方法及び議事録作成プログラム
JP2013029690A (ja) * 2011-07-28 2013-02-07 Toshiba Corp 話者分類装置、話者分類方法および話者分類プログラム
JP2014038132A (ja) * 2012-08-10 2014-02-27 Toshiba Corp 情報処理装置、プログラム、及び情報処理方法
JP2015062093A (ja) * 2013-09-21 2015-04-02 株式会社アクトエムティー 会計処理装置
JP2018106148A (ja) * 2016-12-12 2018-07-05 ソリザバ カンパニー リミテッドSorizava Co., Ltd. 多重話者音声認識修正システム
JP2021508848A (ja) * 2017-12-31 2021-03-11 美的集団股▲フン▼有限公司Midea Group Co., Ltd. ホームアシスタント装置を制御するための方法及びシステム
JP7044415B2 (ja) 2017-12-31 2022-03-30 美的集団股▲フン▼有限公司 ホームアシスタント装置を制御するための方法及びシステム
JP2019148780A (ja) * 2018-02-28 2019-09-05 シャープ株式会社 音声出力装置、音声出力方法及びプログラム
JP6998796B2 (ja) 2018-02-28 2022-01-18 シャープ株式会社 音声出力装置、音声出力方法及びプログラム
JP2020129080A (ja) * 2019-02-08 2020-08-27 三浦 浩之 音声認識システム
JP7296214B2 (ja) 2019-02-08 2023-06-22 浩之 三浦 音声認識システム
JP2021081483A (ja) * 2019-11-15 2021-05-27 前田建設工業株式会社 議事録データ作成システム
WO2021256614A1 (ko) * 2020-06-16 2021-12-23 주식회사 마인즈랩 화자가 표지된 텍스트 생성 방법
JP7486812B2 (ja) 2021-09-28 2024-05-20 ミチビク株式会社 情報処理方法、情報処理装置およびプログラム

Also Published As

Publication number Publication date
EP1061724A3 (en) 2003-03-12
EP1061724A2 (en) 2000-12-20

Similar Documents

Publication Publication Date Title
JP2000352995A (ja) 会議音声処理方法および記録装置、情報記憶媒体
US6101467A (en) Method of and system for recognizing a spoken text
US7698134B2 (en) Device in which selection is activated by voice and method in which selection is activated by voice
JP4574390B2 (ja) 音声認識方法
US8706495B2 (en) Synchronise an audio cursor and a text cursor during editing
US6735565B2 (en) Select a recognition error by comparing the phonetic
JP3827704B1 (ja) オペレータ業務支援システム
EP1442452B1 (en) Correction device marking parts of a recognized text
JP4272658B2 (ja) オペレータ業務支援システムとしてコンピュータを機能させるためのプログラム
JP4871491B2 (ja) 課金情報を生成する方法並びに口述トランスクリプション装置
JPH07191690A (ja) 議事録作成装置及び多地点議事録作成システム
JP2005266769A (ja) データ処理装置及びその方法
JP2007233075A (ja) 議事録作成装置
JP2008033879A (ja) 契約支援システム
US7421394B2 (en) Information processing apparatus, information processing method and recording medium, and program
JP2009031810A (ja) オペレータ業務支援システム
CN113947059A (zh) 演示支援系统
JP2009104047A (ja) 情報処理方法及び情報処理装置
US20030097253A1 (en) Device to edit a text in predefined windows
US20080256071A1 (en) Method And System For Selection Of Text For Editing
CN114626347B (zh) 剧本写作过程中的信息提示方法及电子设备
JPH0863185A (ja) 音声認識装置
JP2002297189A (ja) トランスクリプション装置、トランスクリプション方法、トランスクリプションプログラム、およびそのプログラムを記録した記録媒体
JPH07146919A (ja) 文書作成補助装置
JPS61239358A (ja) 音声入力による文書作成方式