JP2005025571A - 業務支援装置、業務支援方法およびそのプログラム - Google Patents
業務支援装置、業務支援方法およびそのプログラム Download PDFInfo
- Publication number
- JP2005025571A JP2005025571A JP2003191222A JP2003191222A JP2005025571A JP 2005025571 A JP2005025571 A JP 2005025571A JP 2003191222 A JP2003191222 A JP 2003191222A JP 2003191222 A JP2003191222 A JP 2003191222A JP 2005025571 A JP2005025571 A JP 2005025571A
- Authority
- JP
- Japan
- Prior art keywords
- character data
- character
- data
- word
- words
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【課題】会議や商談における会話の概要やキーワード情報などを自動で正確に作成することができる業務支援装置、業務支援方法およびそのプログラムを提供する。
【解決手段】文字変換処理部14は、音声情報データベース12aより読み出した音声データを文字データに変換して文字データを含む文字データファイルを出力する。単語抽出処理部15は、文字変換処理部14が出力した文字データファイルより文字データを参照して、文字データよりキーワードとなる単語を複数抽出する。単語関係解析部16は、単語抽出処理部15が抽出した複数の単語間における関係を解析して解析結果を出力する。
【選択図】 図1
【解決手段】文字変換処理部14は、音声情報データベース12aより読み出した音声データを文字データに変換して文字データを含む文字データファイルを出力する。単語抽出処理部15は、文字変換処理部14が出力した文字データファイルより文字データを参照して、文字データよりキーワードとなる単語を複数抽出する。単語関係解析部16は、単語抽出処理部15が抽出した複数の単語間における関係を解析して解析結果を出力する。
【選択図】 図1
Description
【0001】
【発明の属する技術分野】
本発明は、会議や商談などの録音データを基に、議事録や報告書などの業務文書を作成するための業務支援装置、業務支援方法およびそのプログラムに関するものである。
【0002】
【従来の技術】
従来、例えば、企業の販売担当者が日々顧客と行う商談の内容や結果は、業務日誌や業務報告等の報告書によって収集され、進捗管理や業績管理などに用いられている。これらの報告書は、販売担当者が各自作成しているが、各自が同じフォーマットの書類で報告書を作成していたとしても、その内容には報告書を作成する販売担当者の主観や恣意的な創作が含まれている。
【0003】
典型的な例を示すと、同じ商談に出席した複数の販売担当者が、その商談に関する報告書を各自で作成した場合には、各々の報告書が異なった内容となることが予想される。この時、何人かの販売担当者が自分に有利となるような内容を報告書に盛り込むことも考えられる。更に、個人が各々報告書を作成することにより、例えば、以下に示すような曖昧さが生じる。
・商談などにおける、契約の成立率が高い優秀な販売担当者の会話と、契約の成立率が低い販売担当者の会話との違いが報告書から明確に分からない。
・誰が最初に発した意見であるか等が曖昧になる。
【0004】
以上を踏まえて、会議の議事録や商談の報告書をより簡便であってより正確に作成したいという要望がある。
上述した要望にこたえるため、例えば、音声や画像などのマルチメディア情報を用いた会議システムにおいて、会議中の重要な項目を短時間で簡便に編集できる技術が開示されている(例えば特許文献1参照。)。
また、会議や商談を録音して、その録音情報を音声認識処理することにより、出席者の発言を文字に変換する音声認識システムなども開発されている。
【0005】
【特許文献1】
特許第3185505号公報
【0006】
【発明が解決しようとする課題】
上述したように、会議の議事録や商談の報告書の作成を人間個人の作業で行うと個人差や、曖昧さが生じてしまうので、会議や商談における会話の概要またはキーワードに関する情報などを正確に自動で把握したいという要望が高まっていた。
また、上記のように会議や商談における会話の録音情報より自動で会話の概要やキーワードを抽出するためには、上述した音声認識システムを用いて音声の文字への変換が必要であるが、現状ではその精度が十分ではないという問題がある。特に、音声認識システムに会議や商談の出席者の声(発音)に関する情報を登録していない場合には、音声認識率が低下し、誤変換が増加するという問題がある。
【0007】
更には、従来の会議の議事録や商談の報告書には個人差や曖昧さが含まれるので、異なる議事録間の比較検討や、異なる報告書間の比較検討が困難であり、更には、比較検討を行ったとしても、その有効性や正確性に問題がある。
【0008】
本発明は、上述した事情を考慮してなされたもので、会議や商談における会話の概要やキーワード情報などを自動で正確に作成することができる業務支援装置、業務支援方法およびそのプログラムを提供することを目的とする。
また好ましくは、本発明は、音声データから文字データへの変換精度が良くない場合に、文字データを効率よく修正することが更にできる業務支援装置、業務支援方法およびそのプログラムを提供することを目的とする。
【0009】
【課題を解決するための手段】
この発明は、上述した課題を解決すべくなされたもので、本発明による業務支援装置においては、音声データを文字データに変換して文字データを含む文字データファイルを出力する文字変換手段と、文字変換手段が出力した文字データファイルより文字データを参照して、文字データよりキーワードとなる単語を複数抽出する単語抽出手段と、単語抽出手段が抽出した複数の単語間における関係を解析して解析結果を出力する単語関係解析手段とを具備することを特徴とする。
【0010】
また、本発明による業務支援装置の一態様例においては、上記文字変換手段は、音声データから無音部分を削除した無音削除音声データを更に生成し、変換した文字データに対応させて音声データの再生時間に関する情報を更に含む文字データファイルを出力することを特徴とする。
【0011】
また、本発明による業務支援装置の一態様例においては、上記単語抽出手段は、文字データファイルに含まれる再生時間における単位時間ごとの文字データよりキーワードとなる単語を複数抽出し、上記単語関係解析手段は、単語抽出手段が単位時間ごとに抽出した複数の単語間の関係を単位時間ごとに解析することを特徴とする。
【0012】
また、本発明による業務支援装置の一態様例においては、上記単語関係解析手段が、第1の音声データに対する第1の解析結果と、第2の音声データに対する第2の解析結果を出力した場合に、第1の解析結果と第2の解析結果とを比較する比較手段を更に具備することを特徴とする。
【0013】
また、本発明による業務支援方法においては、音声データを文字データに変換して文字データを含む文字データファイルを出力する第1のステップと、第1のステップで出力した文字データファイルより文字データを参照して、文字データよりキーワードとなる単語を複数抽出する第2のステップと、第2のステップで抽出した複数の単語間における関係を解析して解析結果を出力する第3のステップとを有することを特徴とする。
【0014】
また、本発明によるプログラムにおいては、音声データを文字データに変換して文字データを含む文字データファイルを出力する第1のステップと、第1のステップで出力した文字データファイルより文字データを参照して、文字データよりキーワードとなる単語を複数抽出する第2のステップと、第2のステップで抽出した複数の単語間における関係を解析して解析結果を出力する第3のステップとをコンピュータに実行させるためのプログラムである。
【0015】
以上に示したように、本発明による業務支援装置、業務支援方法およびそのプログラムによれば、音声データを文字データに変換して文字データを含む文字データファイルを出力して、その文字データファイルより文字データを参照して、文字データよりキーワードとなる単語を複数抽出して、抽出した複数の単語間における関係を解析して解析結果を出力するので、音声データに含まれるキーワード情報を示すことができ、更にキーワードの関係を示すことで音声データの内容の概要を示すことができる。すなわち、解析対象が会議や商談における会話の音声データであれば、会議や商談における会話の概要やキーワード情報などを自動で正確に作成することができる。
【0016】
【発明の実施の形態】
以下、本発明の実施の形態を説明する。
まず、本発明の一実施形態における業務支援装置の機能構成について図を用いて説明する。図1は、本発明の一実施形態における業務支援装置の機能構成を示す図である。図1において、1は、業務支援装置であり、後述するデータベース12に格納する音声データ(音声情報)を文字データ(文字情報)に変換して解析する処理を行うコンピュータである。尚、本実施形態における音声データとは、会議や商談の会話を録音した音声データである。
【0017】
また、業務支援装置1は、マウスやキーボードなどの入力装置2および、CRT(Cathode Ray Tube)や液晶ディスプレイなどの表示装置3を具備している。更に、業務支援装置1は、音声データを再生時に音声を出力するスピーカなどの音声出力装置4を具備している。また、入力装置2と、表示装置3と、音声出力装置4は、それぞれ、入力装置制御部5、表示装置制御部6、音声出力装置制御部7を介して制御される。尚、本実施形態において業務支援装置1は、入力装置2、表示装置3、音声出力装置4を具備する構成としたが、この限りではなく、業務支援装置1と無線や有線によるデータの送受信が可能な入力装置2、表示装置3、音声出力装置4が業務支援装置1の外に設置される構成であってもよい。
【0018】
11は、制御部であり、業務支援装置1の内部におけるデータの流れや、各処理部などの制御を行う。12は、データベースであり、音声情報を格納する音声情報データベース12aと、文字情報を格納する文字情報データベース12bとを具備する。ここで、音声情報データベース12aと文字情報データベース12bのデータ構成について具体例を示す。
【0019】
図2(a)、図2(b)は、図1に示した音声情報データベース12aと文字情報データベース12bのデータ構成例を示す図である。図2(a)に示すように、音声情報データベース12aは、“音声データファイル”として、音声データに関する以下に示す情報を格納する。“ファイル名”とは、音声データを特定するファイルの名称であり、データ形式に応じた拡張子がついていてもよい。“作成日時”とは、“ファイル名”で特定される音声データが録音された日時を示す情報である。“録音時間”とは、“ファイル名”で特定される音声データを録音した時間の長さを示す情報である。“データ形式”とは、音声データのデータ形式を示す情報である。“音声データ”とは、音声データそのものである。尚、上述したデータ形式は、業務支援装置1などのコンピュータで音声を再生可能なデータ形式であれば、任意のデータ形式でよい。
【0020】
また、図2(b)に示すように、文字情報データベース12bは、“文字データファイル”として、文字データに関する以下に示す情報を格納する。“ファイル名”とは、文字データのファイルを特定するファイルの名称であり、データ形式に応じた拡張子がついていてもよい。“作成日時”とは、“ファイル名”で特定される文字データが生成された日時を示す情報である。“データ形式”とは、文字データのデータ形式を示す情報である。尚、上述したデータ形式は、業務支援装置1などのコンピュータで文字を表示および編集可能なデータ形式であれば、任意のデータ形式でよい。“文字データ”とは、“ファイル名”で特定される文字データそのものである。“対応する音声ファイル名”とは、文字データの基となる音声データ(業務支援装置1が文字データに変換する前の音声データ)のファイル名に関する情報である。
【0021】
次に、業務支援装置1の機能構成の説明に戻る。
13は、再生処理部であり、音声情報データベース12aより音声データを読み出して再生処理を行う。この再生処理部13の再生処理により、再生された音声が音声出力装置4より出力される。また、再生処理部13は、利用者から指定された再生時間より音声データを再生する機能を有する。
【0022】
14は、文字変換処理部であり、音声情報データベース12aより読み出した音声データを文字データに変換して文字データファイルを出力する処理を行う。具体的には、文字変換処理部14は、音声データを文字データに変換する際に、音声データにおける再生時間と文字データを対応付けた構成の図3に示すような文字データファイルを出力する。図3は、図1に示した文字変換処理部14が出力する文字データファイル例を示す図である。図3に示すように、文字変換処理部14が出力する文字データファイル30は、再生時間31に文字データ32を関連付けた構成である。
【0023】
尚、図3においては、再生時間31として、文字データ32の最初の文字が出現する再生時間のみを記録しているがこの限りではなく、文字データ32の最後の文字が出現する再生時間も記録してもよい。また、再生時間31の区切りは、無音部分でも良く、一文の終わり(「…です」、「…ます」などの文字で判断する)の部分であってもよい。また、文字変換処理部14は、音声データより無音部分を削除した新たな音声データを生成する。これにより、文字データ32が正しく変換されているものであるか否かを利用者が音声データを再生して確認する際に、上述した新たな音声データ(無音削除音声データ)を再生することで、音声データの再生時間を短縮できるという効果がある。また、文字データ32に再生時間31が関連づけられているので、変換の当否を確認する利用者は、再生中の音声と文字データ32の対応を簡便に把握することができる。また、文字変換処理部14が、出力した文字データファイルは、文字情報データベース12bに“文字データファイル”として格納される。
【0024】
15は、単語抽出処理部であり、文字情報データベース12bより文字データファイルを参照して、文字データ中よりキーワードとなる単語を複数抽出する処理を行う。具体的な動作例を示すと、単語抽出処理部15は、文字データ中に含まれる単語を品詞ごとに自動抽出して、出現頻度の多い単語から上位14個(任意の個数でよい)を抽出結果として出力する処理を行う。また、単語抽出処理部15は、抽出結果の単語の各々に出現頻度数を関連付けて図4に示すような単語ファイルとして出力する。尚、本実施形態においては、キーワードとなる単語は、出現頻度の高い単語としたが、この限りではなく、指定した単語(例えば、ある商談で重要と判断される単語)と同じまたは類似する単語や、大きな声で発言された単語や、指定した単語(例えば…を決定、…を結論、など周辺に重要な単語がある可能性が高い単語)に関連する単語などをキーワードとしてもよい。
【0025】
図4は、図1に示した単語抽出処理部15が出力する単語ファイルの内容例を示す図である。図4に示すように、単語ファイル35は、出現頻度36と単語37とより構成されている。図4において文字データの中で、「契約」という単語が32回出現し、「対応」という単語が27回出現し、…ということを示している。尚、上述したように、単語の抽出は品詞ごとの抽出でなくてもよい。また、上述したように、単語ファイルにおいて出現頻度と単語を対応させずに、単語のみの構成であってもよい。
【0026】
16は、単語関係解析部であり、単語抽出処理部15が抽出した複数の単語の関係を、文字データ中における各単語の出現位置の関係などを基に解析する処理を行う。具体的には、単語関係解析部16は、同一文に含まれる複数の単語間の関係が強いと判断して、単語抽出処理部15が抽出した複数の単語の関係度を数値化して、例えば図5に示すような解析結果を出力する。図5は、図1に示した単語関係解析部16が出力する解析結果を表示装置3に表示した表示例を示す図である。図5において、四角は、単語抽出処理部15が抽出した各単語を有するシンボルであり、その中に各単語を示している。また、楕円は、単語の出現頻度を示すシンボルであり、その中に単語の出現頻度数を示している。尚、図5においては、上位5つの単語のみ出現頻度数を表示している。また、四角を繋ぐ線は、単語間の関係の有無を示し、特に太線は、普通の線に比べて関係が強いことを示している。
【0027】
ここで、図5において符号を付与した単語や出現頻度数および線について説明する。図5に示すように、四角41の単語「職員」と四角44の単語「対応」の間を太線43で結んで表示している。すなわち、解析した文字データにおいて、単語「職員」と単語「対応」の関係は強いことを示している。また、楕円42は、単語「職員」の出現頻度数が23回であったことを示している。また、四角44の単語「対応」と四角46の単語「属人的」の間を線45で結んで表示している。
【0028】
尚、図5に示した解析結果の表示は一例であり、一度に表示する単語の数や、出現頻度数を表示する単語の数などは任意の数でよい。また、図5においては、単語間の関係度は強いと普通の2段階であったが、この限りではなく、3段階以上の関係度を3種類以上の太さの線で表現してもよい。また、重要な単語や、録音時に大きな声で録音されていた単語などを表示する色やフォントの大きさを変えるなどして強調表示してもよい。
【0029】
以上に示すように、単語関係解析部16は、解析結果を表示装置制御部6経由で表示装置3に表示することで、統計的な処理に基づいて抽出した単語(キーワード)およびその関係を示すことができる。すなわち、例えば、会議や商談における会話の概要やキーワード情報などを、業務支援装置1は、自動で正確に作成することができる。また、業務支援装置1が作成した会話の概要やキーワード情報を会議の議事録や商談の報告書に添付することで、利用者は、より正確で分かりやすい議事録や報告書を作成することができる。これにより、業務支援装置1は、業務の支援を行うことができる。
【0030】
尚、文字データから単語を抽出する単語抽出処理部15の処理および抽出した複数の単語間の関係を解析する単語関係解析部16の処理を行うソフトウェアとして、例えば、富士通(株)製のSymfoWARE(登録商標)を用いて好適である。このソフトウェアを利用することで、文字データから単語を抽出する処理おおび抽出した複数の単語間の関係を解析する処理を実現することができる。
【0031】
また、業務支援装置1において、17は、文字編集処理部であり、文字変換処理部14が自動変換した文字データが正しいものか否かを利用者が確認でき、更に文字データが正しくない場合には、その文字データを利用者が修正し編集できる編集用画面を表示装置3に表示する。具体的には、文字編集処理部17は、図3に示した文字データファイルを開いて、文字データ部分が編集可能な状態で表示装置3に表示する。これにより、利用者は、各再生時間における文字データに対して、対応する部分の音声データを再生して音声を聞くことで、正しいか否か確認する。ここで、文字データが正しくない場合は、利用者は、入力装置2を利用して編集操作を行う。これにより、文字編集処理部17は、利用者の編集操作に応じて文字データの修正および編集を行う。また、会議や商談の最初に行われる儀礼的な挨拶などの会話に対応する文字データの削除などを同時に行っても良い。
【0032】
以上に示した文字編集処理部17により、音声データから文字データへの変換精度が良くない場合に、効率良く文字の修正や編集を行うことができる。また、会議や商談の本題と関係のない儀礼的な挨拶など余分な部分の削除なども同時に利用者に行わせることで、業務支援装置1は、キーワードとなる単語の抽出や解析の精度を向上することができる。
【0033】
また、18は、解析結果比較処理部であり、異なる会議や商談より得た文字データに対する単語関係解析部16による解析結果を比較する処理を行う。具体的には2つの解析結果を比較する場合には、解析結果比較処理部18は、2つの解析結果で共通する単語群と、2つの解析結果で共通ではない単語群を出力する。更に具体例を示すと、例えば、新人の営業マンの商談に対する解析結果と、ベテランの営業マンの商談に対する解析結果を比較することで、商談中によく用いるキーワードの違いや、どのキーワードとどのキーワードを関連付けて話をしているかの違いなどを抽出することができる。これにより、新人の営業マンへ商談が上達するための適切なアドバイスなどを行うことができる。
【0034】
尚、図1に示した業務支援装置1の各処理部は、専用のハードウェアにより実現されるものであってもよく、また、各処理部はメモリおよびCPU(中央演算装置)により構成され、各処理部の機能を実現する為のプログラムをメモリに読み込んで実行することによりその機能を実現させるものであってもよい。
また、上記メモリは、ハードディスク装置や光磁気ディスク装置、フラッシュメモリ等の不揮発性のメモリや、CD−ROM等の読み出しのみが可能な記録媒体、RAM(Random Access Memory)のような揮発性のメモリ、あるいはこれらの組み合わせによるコンピュータ読み取り、書き込み可能な記録媒体より構成されるものとする。
【0035】
次に、図1に示した業務支援装置1における業務支援のための解析動作や解析結果の比較動作について説明する。
図6は、図1に示した業務支援装置1における業務支援のための解析動作や解析結果の比較動作を示すフロー図である。尚、図6に示す処理が開始する前に、業務支援装置1は、解析対象となる会議や商談の音声データが外部から入力されて、音声情報データベース12aに格納済みであるとする。
【0036】
図6に示すように、まず、ステップS1において、業務支援装置1の文字変換処理部14は、音声情報データベース12aより読み出した音声データを文字データに変換して図3に示すような文字データファイル30を出力する。また、ステップS1において、文字変換処理部14は、音声情報データベース12aより読み出した音声データ(第1音声データ)より無音部分を削除した新たな音声データ(第2の音声データ)する。
【0037】
次に、ステップS2において、文字編集処理部17は、文字変換処理部14がステップS1において変換した文字データの編集用画面を表示装置3に表示する。また、ステップS2において、再生処理部13は、音声情報データベース12aより文字データへの変換対象となった音声データを読み出して再生処理を行う。以上により、利用者は、再生される音声を基に文字変換処理部14がステップS1において変換した文字データが正しいものか否かを判断する。ここで、間違いを発見した場合には、利用者は、その文字データの編集操作を行う。また、単語抽出や解析に不要な会話部分の削除なども必要であれば行う。これに応じて、ステップS3に進み、文字編集処理部17は、利用者の編集操作に応じて文字データの編集を行う。
【0038】
次に、ステップS4に進み、利用者が編集処理を終了しない場合(ステップS4のNO)には、ステップS2に戻り、営業支援装置1は、編集画面の表示および新たな音声データの再生を継続する。また、利用者が編集処理を終了した場合(ステップS4のYES)には、ステップS5に進み、単語抽出処理部15は、文字情報データベース12bより文字データファイルを参照して、文字データ中よりキーワードとなる単語を複数抽出する処理を行う。
【0039】
次に、ステップS6に進み、単語関係解析部16は、単語抽出処理部15が抽出した複数の単語の関係を解析する処理を行う。これにより、業務支援装置1の表示装置3には、図5に示したような解析結果を表示することができる。これにより、解析対象となった会議や商談における会話のキーワード情報を解析結果として表示することができる。このキーワード情報は、統計処理によるものなので、人間が作成した議事録や報告書のように恣意的なものが排除されている。
【0040】
次に、ステップS7に進み、解析結果比較処理部18は、ステップS6における単語関係解析部16による解析結果と、他の解析結果との比較処理を行う。これにより、解析対象となった会議や商談におけるキーワード情報を客観的に評価することができる。尚、この場合には、予め、比較する他の解析結果を利用者が指定するなどにより、他の解析結果を特定しておく必要がある。
【0041】
尚、上述した実施形態においては、音声データから文字データへ変換を行ったがこの限りではなく、音声データを再生処理部13が再生することで音声を出力して、これを音声認識処理により文字データに置き換えてもよい。この場合は、業務支援装置1は、音声を認識して文字に変換する音声認識処理部を更に具備する構成となる。また、上述した単語抽出処理部15の単語抽出処理および単語関係解析部16の解析処理は、1つの文字データファイルに対して1回のみであったがこの限りではなく、1つの文字データファイルに対して複数回行っても良い。この場合は、例えば、再生時間において単位時間毎に単語抽出処理部15の単語抽出処理および単語関係解析部16の解析処理を行い、解析結果を出力する。これにより、儀礼的な挨拶や世間話などの文字データの解析における不要部分から単語を抽出して解析した解析結果は、キーワードが明らかに異なるので、簡便に排除できる。また、有効な解析結果となった再生時間の文字データの部分をまとめて再度、単語抽出処理部15の単語抽出処理および単語関係解析部16の解析処理を行ってもよい。これにより、より精度の高いキーワードの抽出とキーワード間の関係の解析ができる。
【0042】
また、上述した実施形態においては、業務支援装置1は、1台のコンピュータより構成されていたが、この限りではなく、例えば、再生処理部13および音声情報データベース12および文字変換処理部14より構成される音声認識システムと、文字解析システムとより構成されていてもよい。
【0043】
また、本実施形態においては、会議や商談の音声データを文字に変換して解析することで業務の支援を行う形態を示したが、この限りではなく、講演や講義などを録音した種々の音声データを文字に変換して解析する形態にも応用可能である。また、音声データは、音声データのみで記録されている場合と、映像データと合わせて記録されている場合とがあるが、どちらの場合でも本発明を適用可能である。
【0044】
また、本発明の実施形態は、コンピュータがプログラムを実行することによって実現することができる。また、プログラムをコンピュータに供給するための手段、例えばかかるプログラムを記録したコンピュータ読み取り可能な記録媒体又はかかるプログラムを伝送する伝送媒体も本発明の実施形態として適用することができる。また、上記のプログラムを記録したコンピュータ読み取り可能な記録媒体等のプログラムプロダクトも本発明の実施形態として適用することができる。上記のプログラム、記録媒体、伝送媒体およびプログラムプロダクトは、本発明の範疇に含まれる。
【0045】
また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発メモリ(RAM)のように、一定時間プログラムを保持しているものも含むものとする。
【0046】
また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。
また、上記プログラムは、前述した機能の一部を実現する為のものであっても良い。さらに、前述した機能をコンピュータシステムに既に記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であっても良い。
【0047】
以上、この発明の実施形態について図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。
【0048】
【発明の効果】
以上説明したように、本発明による業務支援装置、業務支援方法およびそのプログラムによれば、音声データを文字データに変換して文字データを含む文字データファイルを出力して、その文字データファイルより文字データを参照して、文字データよりキーワードとなる単語を複数抽出して、抽出した複数の単語間における関係を解析して解析結果を出力するので、音声データに含まれるキーワード情報を示すことができ、更にキーワードの関係を示すことで音声データの内容の概要を示すことができる。すなわち、解析対象が会議や商談における会話の音声データであれば、会議や商談における会話の概要やキーワード情報などを自動で正確に作成することができる。
【図面の簡単な説明】
【図1】本発明の一実施形態における業務支援装置の機能構成を示す図である。
【図2】図1に示した音声情報データベース12aと文字情報データベース12bのデータ構成例を示す図である。
【図3】図1に示した文字変換処理部14が出力する文字データファイル例を示す図である。
【図4】図1に示した単語抽出処理部15が出力する単語ファイルの内容例を示す図である。
【図5】図1に示した単語関係解析部16が出力する解析結果を表示装置3に表示した表示例を示す図である。
【図6】図1に示した業務支援装置1における業務支援のための解析動作や解析結果の比較動作を示すフロー図である。
【符号の説明】
1 業務支援装置
2 入力装置
3 表示装置
4 音声出力装置
5 入力装置制御部
6 表示装置制御部
7 音声出力装置制御部
11 制御部
12 データベース
12a 音声情報データベース
12b 文字情報データベース
13 再生処理部
14 文字変換処理部
15 単語抽出処理部
16 単語関係解析部
17 文字編集処理部
18 解析結果比較処理部
【発明の属する技術分野】
本発明は、会議や商談などの録音データを基に、議事録や報告書などの業務文書を作成するための業務支援装置、業務支援方法およびそのプログラムに関するものである。
【0002】
【従来の技術】
従来、例えば、企業の販売担当者が日々顧客と行う商談の内容や結果は、業務日誌や業務報告等の報告書によって収集され、進捗管理や業績管理などに用いられている。これらの報告書は、販売担当者が各自作成しているが、各自が同じフォーマットの書類で報告書を作成していたとしても、その内容には報告書を作成する販売担当者の主観や恣意的な創作が含まれている。
【0003】
典型的な例を示すと、同じ商談に出席した複数の販売担当者が、その商談に関する報告書を各自で作成した場合には、各々の報告書が異なった内容となることが予想される。この時、何人かの販売担当者が自分に有利となるような内容を報告書に盛り込むことも考えられる。更に、個人が各々報告書を作成することにより、例えば、以下に示すような曖昧さが生じる。
・商談などにおける、契約の成立率が高い優秀な販売担当者の会話と、契約の成立率が低い販売担当者の会話との違いが報告書から明確に分からない。
・誰が最初に発した意見であるか等が曖昧になる。
【0004】
以上を踏まえて、会議の議事録や商談の報告書をより簡便であってより正確に作成したいという要望がある。
上述した要望にこたえるため、例えば、音声や画像などのマルチメディア情報を用いた会議システムにおいて、会議中の重要な項目を短時間で簡便に編集できる技術が開示されている(例えば特許文献1参照。)。
また、会議や商談を録音して、その録音情報を音声認識処理することにより、出席者の発言を文字に変換する音声認識システムなども開発されている。
【0005】
【特許文献1】
特許第3185505号公報
【0006】
【発明が解決しようとする課題】
上述したように、会議の議事録や商談の報告書の作成を人間個人の作業で行うと個人差や、曖昧さが生じてしまうので、会議や商談における会話の概要またはキーワードに関する情報などを正確に自動で把握したいという要望が高まっていた。
また、上記のように会議や商談における会話の録音情報より自動で会話の概要やキーワードを抽出するためには、上述した音声認識システムを用いて音声の文字への変換が必要であるが、現状ではその精度が十分ではないという問題がある。特に、音声認識システムに会議や商談の出席者の声(発音)に関する情報を登録していない場合には、音声認識率が低下し、誤変換が増加するという問題がある。
【0007】
更には、従来の会議の議事録や商談の報告書には個人差や曖昧さが含まれるので、異なる議事録間の比較検討や、異なる報告書間の比較検討が困難であり、更には、比較検討を行ったとしても、その有効性や正確性に問題がある。
【0008】
本発明は、上述した事情を考慮してなされたもので、会議や商談における会話の概要やキーワード情報などを自動で正確に作成することができる業務支援装置、業務支援方法およびそのプログラムを提供することを目的とする。
また好ましくは、本発明は、音声データから文字データへの変換精度が良くない場合に、文字データを効率よく修正することが更にできる業務支援装置、業務支援方法およびそのプログラムを提供することを目的とする。
【0009】
【課題を解決するための手段】
この発明は、上述した課題を解決すべくなされたもので、本発明による業務支援装置においては、音声データを文字データに変換して文字データを含む文字データファイルを出力する文字変換手段と、文字変換手段が出力した文字データファイルより文字データを参照して、文字データよりキーワードとなる単語を複数抽出する単語抽出手段と、単語抽出手段が抽出した複数の単語間における関係を解析して解析結果を出力する単語関係解析手段とを具備することを特徴とする。
【0010】
また、本発明による業務支援装置の一態様例においては、上記文字変換手段は、音声データから無音部分を削除した無音削除音声データを更に生成し、変換した文字データに対応させて音声データの再生時間に関する情報を更に含む文字データファイルを出力することを特徴とする。
【0011】
また、本発明による業務支援装置の一態様例においては、上記単語抽出手段は、文字データファイルに含まれる再生時間における単位時間ごとの文字データよりキーワードとなる単語を複数抽出し、上記単語関係解析手段は、単語抽出手段が単位時間ごとに抽出した複数の単語間の関係を単位時間ごとに解析することを特徴とする。
【0012】
また、本発明による業務支援装置の一態様例においては、上記単語関係解析手段が、第1の音声データに対する第1の解析結果と、第2の音声データに対する第2の解析結果を出力した場合に、第1の解析結果と第2の解析結果とを比較する比較手段を更に具備することを特徴とする。
【0013】
また、本発明による業務支援方法においては、音声データを文字データに変換して文字データを含む文字データファイルを出力する第1のステップと、第1のステップで出力した文字データファイルより文字データを参照して、文字データよりキーワードとなる単語を複数抽出する第2のステップと、第2のステップで抽出した複数の単語間における関係を解析して解析結果を出力する第3のステップとを有することを特徴とする。
【0014】
また、本発明によるプログラムにおいては、音声データを文字データに変換して文字データを含む文字データファイルを出力する第1のステップと、第1のステップで出力した文字データファイルより文字データを参照して、文字データよりキーワードとなる単語を複数抽出する第2のステップと、第2のステップで抽出した複数の単語間における関係を解析して解析結果を出力する第3のステップとをコンピュータに実行させるためのプログラムである。
【0015】
以上に示したように、本発明による業務支援装置、業務支援方法およびそのプログラムによれば、音声データを文字データに変換して文字データを含む文字データファイルを出力して、その文字データファイルより文字データを参照して、文字データよりキーワードとなる単語を複数抽出して、抽出した複数の単語間における関係を解析して解析結果を出力するので、音声データに含まれるキーワード情報を示すことができ、更にキーワードの関係を示すことで音声データの内容の概要を示すことができる。すなわち、解析対象が会議や商談における会話の音声データであれば、会議や商談における会話の概要やキーワード情報などを自動で正確に作成することができる。
【0016】
【発明の実施の形態】
以下、本発明の実施の形態を説明する。
まず、本発明の一実施形態における業務支援装置の機能構成について図を用いて説明する。図1は、本発明の一実施形態における業務支援装置の機能構成を示す図である。図1において、1は、業務支援装置であり、後述するデータベース12に格納する音声データ(音声情報)を文字データ(文字情報)に変換して解析する処理を行うコンピュータである。尚、本実施形態における音声データとは、会議や商談の会話を録音した音声データである。
【0017】
また、業務支援装置1は、マウスやキーボードなどの入力装置2および、CRT(Cathode Ray Tube)や液晶ディスプレイなどの表示装置3を具備している。更に、業務支援装置1は、音声データを再生時に音声を出力するスピーカなどの音声出力装置4を具備している。また、入力装置2と、表示装置3と、音声出力装置4は、それぞれ、入力装置制御部5、表示装置制御部6、音声出力装置制御部7を介して制御される。尚、本実施形態において業務支援装置1は、入力装置2、表示装置3、音声出力装置4を具備する構成としたが、この限りではなく、業務支援装置1と無線や有線によるデータの送受信が可能な入力装置2、表示装置3、音声出力装置4が業務支援装置1の外に設置される構成であってもよい。
【0018】
11は、制御部であり、業務支援装置1の内部におけるデータの流れや、各処理部などの制御を行う。12は、データベースであり、音声情報を格納する音声情報データベース12aと、文字情報を格納する文字情報データベース12bとを具備する。ここで、音声情報データベース12aと文字情報データベース12bのデータ構成について具体例を示す。
【0019】
図2(a)、図2(b)は、図1に示した音声情報データベース12aと文字情報データベース12bのデータ構成例を示す図である。図2(a)に示すように、音声情報データベース12aは、“音声データファイル”として、音声データに関する以下に示す情報を格納する。“ファイル名”とは、音声データを特定するファイルの名称であり、データ形式に応じた拡張子がついていてもよい。“作成日時”とは、“ファイル名”で特定される音声データが録音された日時を示す情報である。“録音時間”とは、“ファイル名”で特定される音声データを録音した時間の長さを示す情報である。“データ形式”とは、音声データのデータ形式を示す情報である。“音声データ”とは、音声データそのものである。尚、上述したデータ形式は、業務支援装置1などのコンピュータで音声を再生可能なデータ形式であれば、任意のデータ形式でよい。
【0020】
また、図2(b)に示すように、文字情報データベース12bは、“文字データファイル”として、文字データに関する以下に示す情報を格納する。“ファイル名”とは、文字データのファイルを特定するファイルの名称であり、データ形式に応じた拡張子がついていてもよい。“作成日時”とは、“ファイル名”で特定される文字データが生成された日時を示す情報である。“データ形式”とは、文字データのデータ形式を示す情報である。尚、上述したデータ形式は、業務支援装置1などのコンピュータで文字を表示および編集可能なデータ形式であれば、任意のデータ形式でよい。“文字データ”とは、“ファイル名”で特定される文字データそのものである。“対応する音声ファイル名”とは、文字データの基となる音声データ(業務支援装置1が文字データに変換する前の音声データ)のファイル名に関する情報である。
【0021】
次に、業務支援装置1の機能構成の説明に戻る。
13は、再生処理部であり、音声情報データベース12aより音声データを読み出して再生処理を行う。この再生処理部13の再生処理により、再生された音声が音声出力装置4より出力される。また、再生処理部13は、利用者から指定された再生時間より音声データを再生する機能を有する。
【0022】
14は、文字変換処理部であり、音声情報データベース12aより読み出した音声データを文字データに変換して文字データファイルを出力する処理を行う。具体的には、文字変換処理部14は、音声データを文字データに変換する際に、音声データにおける再生時間と文字データを対応付けた構成の図3に示すような文字データファイルを出力する。図3は、図1に示した文字変換処理部14が出力する文字データファイル例を示す図である。図3に示すように、文字変換処理部14が出力する文字データファイル30は、再生時間31に文字データ32を関連付けた構成である。
【0023】
尚、図3においては、再生時間31として、文字データ32の最初の文字が出現する再生時間のみを記録しているがこの限りではなく、文字データ32の最後の文字が出現する再生時間も記録してもよい。また、再生時間31の区切りは、無音部分でも良く、一文の終わり(「…です」、「…ます」などの文字で判断する)の部分であってもよい。また、文字変換処理部14は、音声データより無音部分を削除した新たな音声データを生成する。これにより、文字データ32が正しく変換されているものであるか否かを利用者が音声データを再生して確認する際に、上述した新たな音声データ(無音削除音声データ)を再生することで、音声データの再生時間を短縮できるという効果がある。また、文字データ32に再生時間31が関連づけられているので、変換の当否を確認する利用者は、再生中の音声と文字データ32の対応を簡便に把握することができる。また、文字変換処理部14が、出力した文字データファイルは、文字情報データベース12bに“文字データファイル”として格納される。
【0024】
15は、単語抽出処理部であり、文字情報データベース12bより文字データファイルを参照して、文字データ中よりキーワードとなる単語を複数抽出する処理を行う。具体的な動作例を示すと、単語抽出処理部15は、文字データ中に含まれる単語を品詞ごとに自動抽出して、出現頻度の多い単語から上位14個(任意の個数でよい)を抽出結果として出力する処理を行う。また、単語抽出処理部15は、抽出結果の単語の各々に出現頻度数を関連付けて図4に示すような単語ファイルとして出力する。尚、本実施形態においては、キーワードとなる単語は、出現頻度の高い単語としたが、この限りではなく、指定した単語(例えば、ある商談で重要と判断される単語)と同じまたは類似する単語や、大きな声で発言された単語や、指定した単語(例えば…を決定、…を結論、など周辺に重要な単語がある可能性が高い単語)に関連する単語などをキーワードとしてもよい。
【0025】
図4は、図1に示した単語抽出処理部15が出力する単語ファイルの内容例を示す図である。図4に示すように、単語ファイル35は、出現頻度36と単語37とより構成されている。図4において文字データの中で、「契約」という単語が32回出現し、「対応」という単語が27回出現し、…ということを示している。尚、上述したように、単語の抽出は品詞ごとの抽出でなくてもよい。また、上述したように、単語ファイルにおいて出現頻度と単語を対応させずに、単語のみの構成であってもよい。
【0026】
16は、単語関係解析部であり、単語抽出処理部15が抽出した複数の単語の関係を、文字データ中における各単語の出現位置の関係などを基に解析する処理を行う。具体的には、単語関係解析部16は、同一文に含まれる複数の単語間の関係が強いと判断して、単語抽出処理部15が抽出した複数の単語の関係度を数値化して、例えば図5に示すような解析結果を出力する。図5は、図1に示した単語関係解析部16が出力する解析結果を表示装置3に表示した表示例を示す図である。図5において、四角は、単語抽出処理部15が抽出した各単語を有するシンボルであり、その中に各単語を示している。また、楕円は、単語の出現頻度を示すシンボルであり、その中に単語の出現頻度数を示している。尚、図5においては、上位5つの単語のみ出現頻度数を表示している。また、四角を繋ぐ線は、単語間の関係の有無を示し、特に太線は、普通の線に比べて関係が強いことを示している。
【0027】
ここで、図5において符号を付与した単語や出現頻度数および線について説明する。図5に示すように、四角41の単語「職員」と四角44の単語「対応」の間を太線43で結んで表示している。すなわち、解析した文字データにおいて、単語「職員」と単語「対応」の関係は強いことを示している。また、楕円42は、単語「職員」の出現頻度数が23回であったことを示している。また、四角44の単語「対応」と四角46の単語「属人的」の間を線45で結んで表示している。
【0028】
尚、図5に示した解析結果の表示は一例であり、一度に表示する単語の数や、出現頻度数を表示する単語の数などは任意の数でよい。また、図5においては、単語間の関係度は強いと普通の2段階であったが、この限りではなく、3段階以上の関係度を3種類以上の太さの線で表現してもよい。また、重要な単語や、録音時に大きな声で録音されていた単語などを表示する色やフォントの大きさを変えるなどして強調表示してもよい。
【0029】
以上に示すように、単語関係解析部16は、解析結果を表示装置制御部6経由で表示装置3に表示することで、統計的な処理に基づいて抽出した単語(キーワード)およびその関係を示すことができる。すなわち、例えば、会議や商談における会話の概要やキーワード情報などを、業務支援装置1は、自動で正確に作成することができる。また、業務支援装置1が作成した会話の概要やキーワード情報を会議の議事録や商談の報告書に添付することで、利用者は、より正確で分かりやすい議事録や報告書を作成することができる。これにより、業務支援装置1は、業務の支援を行うことができる。
【0030】
尚、文字データから単語を抽出する単語抽出処理部15の処理および抽出した複数の単語間の関係を解析する単語関係解析部16の処理を行うソフトウェアとして、例えば、富士通(株)製のSymfoWARE(登録商標)を用いて好適である。このソフトウェアを利用することで、文字データから単語を抽出する処理おおび抽出した複数の単語間の関係を解析する処理を実現することができる。
【0031】
また、業務支援装置1において、17は、文字編集処理部であり、文字変換処理部14が自動変換した文字データが正しいものか否かを利用者が確認でき、更に文字データが正しくない場合には、その文字データを利用者が修正し編集できる編集用画面を表示装置3に表示する。具体的には、文字編集処理部17は、図3に示した文字データファイルを開いて、文字データ部分が編集可能な状態で表示装置3に表示する。これにより、利用者は、各再生時間における文字データに対して、対応する部分の音声データを再生して音声を聞くことで、正しいか否か確認する。ここで、文字データが正しくない場合は、利用者は、入力装置2を利用して編集操作を行う。これにより、文字編集処理部17は、利用者の編集操作に応じて文字データの修正および編集を行う。また、会議や商談の最初に行われる儀礼的な挨拶などの会話に対応する文字データの削除などを同時に行っても良い。
【0032】
以上に示した文字編集処理部17により、音声データから文字データへの変換精度が良くない場合に、効率良く文字の修正や編集を行うことができる。また、会議や商談の本題と関係のない儀礼的な挨拶など余分な部分の削除なども同時に利用者に行わせることで、業務支援装置1は、キーワードとなる単語の抽出や解析の精度を向上することができる。
【0033】
また、18は、解析結果比較処理部であり、異なる会議や商談より得た文字データに対する単語関係解析部16による解析結果を比較する処理を行う。具体的には2つの解析結果を比較する場合には、解析結果比較処理部18は、2つの解析結果で共通する単語群と、2つの解析結果で共通ではない単語群を出力する。更に具体例を示すと、例えば、新人の営業マンの商談に対する解析結果と、ベテランの営業マンの商談に対する解析結果を比較することで、商談中によく用いるキーワードの違いや、どのキーワードとどのキーワードを関連付けて話をしているかの違いなどを抽出することができる。これにより、新人の営業マンへ商談が上達するための適切なアドバイスなどを行うことができる。
【0034】
尚、図1に示した業務支援装置1の各処理部は、専用のハードウェアにより実現されるものであってもよく、また、各処理部はメモリおよびCPU(中央演算装置)により構成され、各処理部の機能を実現する為のプログラムをメモリに読み込んで実行することによりその機能を実現させるものであってもよい。
また、上記メモリは、ハードディスク装置や光磁気ディスク装置、フラッシュメモリ等の不揮発性のメモリや、CD−ROM等の読み出しのみが可能な記録媒体、RAM(Random Access Memory)のような揮発性のメモリ、あるいはこれらの組み合わせによるコンピュータ読み取り、書き込み可能な記録媒体より構成されるものとする。
【0035】
次に、図1に示した業務支援装置1における業務支援のための解析動作や解析結果の比較動作について説明する。
図6は、図1に示した業務支援装置1における業務支援のための解析動作や解析結果の比較動作を示すフロー図である。尚、図6に示す処理が開始する前に、業務支援装置1は、解析対象となる会議や商談の音声データが外部から入力されて、音声情報データベース12aに格納済みであるとする。
【0036】
図6に示すように、まず、ステップS1において、業務支援装置1の文字変換処理部14は、音声情報データベース12aより読み出した音声データを文字データに変換して図3に示すような文字データファイル30を出力する。また、ステップS1において、文字変換処理部14は、音声情報データベース12aより読み出した音声データ(第1音声データ)より無音部分を削除した新たな音声データ(第2の音声データ)する。
【0037】
次に、ステップS2において、文字編集処理部17は、文字変換処理部14がステップS1において変換した文字データの編集用画面を表示装置3に表示する。また、ステップS2において、再生処理部13は、音声情報データベース12aより文字データへの変換対象となった音声データを読み出して再生処理を行う。以上により、利用者は、再生される音声を基に文字変換処理部14がステップS1において変換した文字データが正しいものか否かを判断する。ここで、間違いを発見した場合には、利用者は、その文字データの編集操作を行う。また、単語抽出や解析に不要な会話部分の削除なども必要であれば行う。これに応じて、ステップS3に進み、文字編集処理部17は、利用者の編集操作に応じて文字データの編集を行う。
【0038】
次に、ステップS4に進み、利用者が編集処理を終了しない場合(ステップS4のNO)には、ステップS2に戻り、営業支援装置1は、編集画面の表示および新たな音声データの再生を継続する。また、利用者が編集処理を終了した場合(ステップS4のYES)には、ステップS5に進み、単語抽出処理部15は、文字情報データベース12bより文字データファイルを参照して、文字データ中よりキーワードとなる単語を複数抽出する処理を行う。
【0039】
次に、ステップS6に進み、単語関係解析部16は、単語抽出処理部15が抽出した複数の単語の関係を解析する処理を行う。これにより、業務支援装置1の表示装置3には、図5に示したような解析結果を表示することができる。これにより、解析対象となった会議や商談における会話のキーワード情報を解析結果として表示することができる。このキーワード情報は、統計処理によるものなので、人間が作成した議事録や報告書のように恣意的なものが排除されている。
【0040】
次に、ステップS7に進み、解析結果比較処理部18は、ステップS6における単語関係解析部16による解析結果と、他の解析結果との比較処理を行う。これにより、解析対象となった会議や商談におけるキーワード情報を客観的に評価することができる。尚、この場合には、予め、比較する他の解析結果を利用者が指定するなどにより、他の解析結果を特定しておく必要がある。
【0041】
尚、上述した実施形態においては、音声データから文字データへ変換を行ったがこの限りではなく、音声データを再生処理部13が再生することで音声を出力して、これを音声認識処理により文字データに置き換えてもよい。この場合は、業務支援装置1は、音声を認識して文字に変換する音声認識処理部を更に具備する構成となる。また、上述した単語抽出処理部15の単語抽出処理および単語関係解析部16の解析処理は、1つの文字データファイルに対して1回のみであったがこの限りではなく、1つの文字データファイルに対して複数回行っても良い。この場合は、例えば、再生時間において単位時間毎に単語抽出処理部15の単語抽出処理および単語関係解析部16の解析処理を行い、解析結果を出力する。これにより、儀礼的な挨拶や世間話などの文字データの解析における不要部分から単語を抽出して解析した解析結果は、キーワードが明らかに異なるので、簡便に排除できる。また、有効な解析結果となった再生時間の文字データの部分をまとめて再度、単語抽出処理部15の単語抽出処理および単語関係解析部16の解析処理を行ってもよい。これにより、より精度の高いキーワードの抽出とキーワード間の関係の解析ができる。
【0042】
また、上述した実施形態においては、業務支援装置1は、1台のコンピュータより構成されていたが、この限りではなく、例えば、再生処理部13および音声情報データベース12および文字変換処理部14より構成される音声認識システムと、文字解析システムとより構成されていてもよい。
【0043】
また、本実施形態においては、会議や商談の音声データを文字に変換して解析することで業務の支援を行う形態を示したが、この限りではなく、講演や講義などを録音した種々の音声データを文字に変換して解析する形態にも応用可能である。また、音声データは、音声データのみで記録されている場合と、映像データと合わせて記録されている場合とがあるが、どちらの場合でも本発明を適用可能である。
【0044】
また、本発明の実施形態は、コンピュータがプログラムを実行することによって実現することができる。また、プログラムをコンピュータに供給するための手段、例えばかかるプログラムを記録したコンピュータ読み取り可能な記録媒体又はかかるプログラムを伝送する伝送媒体も本発明の実施形態として適用することができる。また、上記のプログラムを記録したコンピュータ読み取り可能な記録媒体等のプログラムプロダクトも本発明の実施形態として適用することができる。上記のプログラム、記録媒体、伝送媒体およびプログラムプロダクトは、本発明の範疇に含まれる。
【0045】
また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発メモリ(RAM)のように、一定時間プログラムを保持しているものも含むものとする。
【0046】
また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。
また、上記プログラムは、前述した機能の一部を実現する為のものであっても良い。さらに、前述した機能をコンピュータシステムに既に記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であっても良い。
【0047】
以上、この発明の実施形態について図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。
【0048】
【発明の効果】
以上説明したように、本発明による業務支援装置、業務支援方法およびそのプログラムによれば、音声データを文字データに変換して文字データを含む文字データファイルを出力して、その文字データファイルより文字データを参照して、文字データよりキーワードとなる単語を複数抽出して、抽出した複数の単語間における関係を解析して解析結果を出力するので、音声データに含まれるキーワード情報を示すことができ、更にキーワードの関係を示すことで音声データの内容の概要を示すことができる。すなわち、解析対象が会議や商談における会話の音声データであれば、会議や商談における会話の概要やキーワード情報などを自動で正確に作成することができる。
【図面の簡単な説明】
【図1】本発明の一実施形態における業務支援装置の機能構成を示す図である。
【図2】図1に示した音声情報データベース12aと文字情報データベース12bのデータ構成例を示す図である。
【図3】図1に示した文字変換処理部14が出力する文字データファイル例を示す図である。
【図4】図1に示した単語抽出処理部15が出力する単語ファイルの内容例を示す図である。
【図5】図1に示した単語関係解析部16が出力する解析結果を表示装置3に表示した表示例を示す図である。
【図6】図1に示した業務支援装置1における業務支援のための解析動作や解析結果の比較動作を示すフロー図である。
【符号の説明】
1 業務支援装置
2 入力装置
3 表示装置
4 音声出力装置
5 入力装置制御部
6 表示装置制御部
7 音声出力装置制御部
11 制御部
12 データベース
12a 音声情報データベース
12b 文字情報データベース
13 再生処理部
14 文字変換処理部
15 単語抽出処理部
16 単語関係解析部
17 文字編集処理部
18 解析結果比較処理部
Claims (6)
- 音声データを文字データに変換して前記文字データを含む文字データファイルを出力する文字変換手段と、
前記文字変換手段が出力した前記文字データファイルより前記文字データを参照して、前記文字データよりキーワードとなる単語を複数抽出する単語抽出手段と、
前記単語抽出手段が抽出した複数の前記単語間における関係を解析して解析結果を出力する単語関係解析手段と
を具備することを特徴とする業務支援装置。 - 前記文字変換手段は、前記音声データから無音部分を削除した無音削除音声データを更に生成し、変換した前記文字データに対応させて前記音声データの再生時間に関する情報を更に含む前記文字データファイルを出力することを特徴とする請求項1に記載の業務支援装置。
- 前記単語抽出手段は、前記文字データファイルに含まれる再生時間における単位時間ごとの文字データよりキーワードとなる単語を複数抽出し、
前記単語関係解析手段は、前記単語抽出手段が前記単位時間ごとに抽出した複数の前記単語間の関係を前記単位時間ごとに解析すること
を特徴とする請求項1または請求項2に記載の業務支援装置。 - 前記単語関係解析手段が、第1の音声データに対する第1の解析結果と、第2の音声データに対する第2の解析結果を出力した場合に、前記第1の解析結果と前記第2の解析結果とを比較する比較手段を更に具備することを特徴とする請求項1から請求項3のいずれか1項に記載の業務支援装置。
- 音声データを文字データに変換して前記文字データを含む文字データファイルを出力する第1のステップと、
前記第1のステップで出力した前記文字データファイルより前記文字データを参照して、前記文字データよりキーワードとなる単語を複数抽出する第2のステップと、
前記第2のステップで抽出した複数の前記単語間における関係を解析して解析結果を出力する第3のステップと
を有することを特徴とする業務支援方法。 - 音声データを文字データに変換して前記文字データを含む文字データファイルを出力する第1のステップと、
前記第1のステップで出力した前記文字データファイルより前記文字データを参照して、前記文字データよりキーワードとなる単語を複数抽出する第2のステップと、
前記第2のステップで抽出した複数の前記単語間における関係を解析して解析結果を出力する第3のステップと
をコンピュータに実行させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003191222A JP2005025571A (ja) | 2003-07-03 | 2003-07-03 | 業務支援装置、業務支援方法およびそのプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003191222A JP2005025571A (ja) | 2003-07-03 | 2003-07-03 | 業務支援装置、業務支援方法およびそのプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005025571A true JP2005025571A (ja) | 2005-01-27 |
Family
ID=34188905
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003191222A Pending JP2005025571A (ja) | 2003-07-03 | 2003-07-03 | 業務支援装置、業務支援方法およびそのプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2005025571A (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009025411A (ja) * | 2007-07-17 | 2009-02-05 | Yamaha Corp | 音声認識装置およびプログラム |
JP2010282404A (ja) * | 2009-06-04 | 2010-12-16 | Toyota Motor Corp | 対話処理装置、対話処理方法、及び対話処理プログラム |
JP2016091487A (ja) * | 2014-11-11 | 2016-05-23 | セイコーエプソン株式会社 | 表示装置および表示制御方法 |
JP2018139397A (ja) * | 2017-02-24 | 2018-09-06 | 沖電気工業株式会社 | 音声表示装置および音声表示プログラム |
JP2020042229A (ja) * | 2018-09-13 | 2020-03-19 | 京セラドキュメントソリューションズ株式会社 | 議事録生成システムおよび議事録生成プログラム |
WO2021255795A1 (ja) * | 2020-06-15 | 2021-12-23 | 日本電信電話株式会社 | 情報処理装置、情報処理方法およびプログラム |
-
2003
- 2003-07-03 JP JP2003191222A patent/JP2005025571A/ja active Pending
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009025411A (ja) * | 2007-07-17 | 2009-02-05 | Yamaha Corp | 音声認識装置およびプログラム |
JP2010282404A (ja) * | 2009-06-04 | 2010-12-16 | Toyota Motor Corp | 対話処理装置、対話処理方法、及び対話処理プログラム |
JP2016091487A (ja) * | 2014-11-11 | 2016-05-23 | セイコーエプソン株式会社 | 表示装置および表示制御方法 |
JP2018139397A (ja) * | 2017-02-24 | 2018-09-06 | 沖電気工業株式会社 | 音声表示装置および音声表示プログラム |
JP2020042229A (ja) * | 2018-09-13 | 2020-03-19 | 京セラドキュメントソリューションズ株式会社 | 議事録生成システムおよび議事録生成プログラム |
JP7205684B2 (ja) | 2018-09-13 | 2023-01-17 | 京セラドキュメントソリューションズ株式会社 | 議事録生成システムおよび議事録生成プログラム |
WO2021255795A1 (ja) * | 2020-06-15 | 2021-12-23 | 日本電信電話株式会社 | 情報処理装置、情報処理方法およびプログラム |
JPWO2021255795A1 (ja) * | 2020-06-15 | 2021-12-23 | ||
JP7355244B2 (ja) | 2020-06-15 | 2023-10-03 | 日本電信電話株式会社 | 情報処理装置、情報処理方法およびプログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10334384B2 (en) | Scheduling playback of audio in a virtual acoustic space | |
US8407049B2 (en) | Systems and methods for conversation enhancement | |
US11315569B1 (en) | Transcription and analysis of meeting recordings | |
US20180342251A1 (en) | Automatic speaker identification in calls using multiple speaker-identification parameters | |
US10347250B2 (en) | Utterance presentation device, utterance presentation method, and computer program product | |
US20080275700A1 (en) | Method of and System for Modifying Messages | |
US20040064322A1 (en) | Automatic consolidation of voice enabled multi-user meeting minutes | |
EP1798945A1 (en) | System and methods for enabling applications of who-is-speaking (WIS) signals | |
TWI590240B (zh) | 會議記錄裝置及其自動生成會議記錄的方法 | |
US20160189103A1 (en) | Apparatus and method for automatically creating and recording minutes of meeting | |
JP2005341015A (ja) | 議事録作成支援機能を有するテレビ会議システム | |
JP5206553B2 (ja) | 閲覧システム、方法、およびプログラム | |
JP2004287201A (ja) | 議事録作成装置及び方法、ならびに、コンピュータプログラム | |
JP2010060850A (ja) | 議事録作成支援装置、議事録作成支援方法、議事録作成支援用プログラム及び議事録作成支援システム | |
CN112562677A (zh) | 会议语音转写方法、装置、设备及存储介质 | |
JP3896760B2 (ja) | 対話記録編集装置、方法及び記憶媒体 | |
JP2005025571A (ja) | 業務支援装置、業務支援方法およびそのプログラム | |
JP2008011272A (ja) | 会議システム及び制御方法、並びにプログラム及び記憶媒体 | |
US20230230589A1 (en) | Extracting engaging questions from a communication session | |
US20230244874A1 (en) | Sentiment scoring for remote communication sessions | |
US20030097253A1 (en) | Device to edit a text in predefined windows | |
JP2006251042A (ja) | 情報処理装置、情報処理方法およびプログラム | |
JP6627315B2 (ja) | 情報処理装置、情報処理方法、および制御プログラム | |
KR102291113B1 (ko) | 회의록 작성 장치 및 방법 | |
JP2004020739A (ja) | 議事録作成装置、議事録作成方法、議事録作成プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20041202 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070828 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20071026 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20071127 |