JP2020042229A - 議事録生成システムおよび議事録生成プログラム - Google Patents

議事録生成システムおよび議事録生成プログラム Download PDF

Info

Publication number
JP2020042229A
JP2020042229A JP2018171569A JP2018171569A JP2020042229A JP 2020042229 A JP2020042229 A JP 2020042229A JP 2018171569 A JP2018171569 A JP 2018171569A JP 2018171569 A JP2018171569 A JP 2018171569A JP 2020042229 A JP2020042229 A JP 2020042229A
Authority
JP
Japan
Prior art keywords
importance
term
minutes
voice
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018171569A
Other languages
English (en)
Other versions
JP7205684B2 (ja
Inventor
夏子 宮端
Natsuko Miyahata
夏子 宮端
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kyocera Document Solutions Inc
Original Assignee
Kyocera Document Solutions Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kyocera Document Solutions Inc filed Critical Kyocera Document Solutions Inc
Priority to JP2018171569A priority Critical patent/JP7205684B2/ja
Publication of JP2020042229A publication Critical patent/JP2020042229A/ja
Application granted granted Critical
Publication of JP7205684B2 publication Critical patent/JP7205684B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • User Interface Of Digital Computer (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】 議事録における重要な内容を利用者に容易に理解させることができる議事録生成システムおよび議事録生成プログラムを提供する。【解決手段】 音声データから音声認識によって文字データとしての議事録を生成し、議事録に含まれる用語の重要度を判定し、重要度に基づいた出力内容で用語を出力する議事録生成システムは、音声データにおける音声の音調の変化と、音声データにおける音声の音量の変化と、音声データにおける賛同を示す賛同用語の存在とに基づいて音声データにおける重要な期間を特定し、重要な期間に含まれる用語の重要度を、重要な期間に含まれない用語の重要度より高く判定する(S54〜S56)ことを特徴とする。【選択図】 図2

Description

本発明は、音声データから音声認識によって文字データとしての議事録を生成する議事録生成システムおよび議事録生成プログラムに関する。
従来、音声データから音声認識によって文字データとしての議事録を生成する議事録生成システムが知られている(例えば、特許文献1−3参照。)。
特開2000−352995号公報 特開2006−267934号公報 特開2014−178934号公報
しかしながら、従来の議事録生成システムにおいては、議事録における重要な内容を利用者に容易に理解させることが困難であるという問題がある。
そこで、本発明は、議事録における重要な内容を利用者に容易に理解させることができる議事録生成システムおよび議事録生成プログラムを提供することを目的とする。
本発明の議事録生成システムは、音声データから音声認識によって文字データとしての議事録を生成する議事録生成部と、前記議事録に含まれる用語の重要度を判定する重要度判定部と、前記重要度に基づいた出力内容で前記用語を出力する用語出力部とを備え、前記重要度判定部は、前記音声データにおける音声の音調の変化と、前記音声データにおける音声の音量の変化と、前記音声データにおける賛同を示す賛同用語の存在との少なくとも1つに基づいて前記音声データにおける重要な期間を特定し、前記重要な期間に含まれる前記用語の前記重要度を、前記重要な期間に含まれない前記用語の前記重要度より高く判定することを特徴とする。
この構成により、本発明の議事録生成システムは、音声データにおける音声の音調の変化と、音声データにおける音声の音量の変化と、音声データにおける賛同を示す賛同用語の存在との少なくとも1つに基づいて音声データにおける重要な期間を特定し、重要な期間に含まれる用語の重要度を、重要な期間に含まれない用語の重要度より高く判定し、重要度に基づいた出力内容で用語を出力するので、議事録における重要な用語を利用者に容易に理解させることができ、その結果、議事録における重要な内容を利用者に容易に理解させることができる。
本発明の議事録生成システムにおいて、前記用語出力部は、前記重要度が特定の程度以上である前記用語を強調した状態で前記議事録を出力しても良い。
この構成により、本発明の議事録生成システムは、議事録における重要な用語を議事録上で利用者に容易に理解させることができるので、議事録における重要な内容を利用者に容易に理解させることができる。
本発明の議事録生成システムにおいて、前記用語出力部は、前記重要度の大きさ順に、または、前記重要度が特定の程度以上である前記用語を強調した状態で、前記用語の一覧を出力しても良い。
この構成により、本発明の議事録生成システムは、議事録における重要な用語を用語の一覧上で利用者に容易に理解させることができるので、議事録における重要な内容を利用者に容易に理解させることができる。
本発明の議事録生成システムにおいて、前記用語出力部は、前記音声データにおける音声の音調の変化に基づいた値を示す軸と、前記音声データにおける音声の音量の変化に基づいた値を示す軸と、前記音声データにおける前記賛同用語の存在に基づいた値を示す軸とのうち、少なくとも2軸によって構成される空間上に、前記重要度が特定の程度以上である前記用語を配置したマップを出力しても良い。
この構成により、本発明の議事録生成システムは、音声データにおける音声の音調の変化に基づいた値を示す軸と、音声データにおける音声の音量の変化に基づいた値を示す軸と、音声データにおける賛同用語の存在に基づいた値を示す軸とのうち、少なくとも2軸によって構成される空間上に用語を配置したマップ上で、議事録における重要な用語の重要度の詳細な内容を利用者に容易に理解させることができるので、議事録における重要な内容を利用者に容易に理解させることができる。
本発明の議事録生成システムにおいて、前記用語出力部は、前記重要度が特定の程度以上である前記用語同士の相互の関係を示す相互関係図を出力し、前記相互関係図は、前記音声データにおいて同一の前記重要な期間に含まれる前記用語同士が相互に関係があることを示しても良い。
この構成により、本発明の議事録生成システムは、用語同士の相互の関係を示す相互関係図上で、議事録における重要な用語同士の相互の関係を利用者に容易に理解させることができるので、議事録における重要な内容を利用者に容易に理解させることができる。
本発明の議事録生成システムにおいて、前記用語出力部は、前記重要度が特定の程度以上である前記用語が含まれるフレーズまたは文を前記議事録から抽出して出力しても良い。
この構成により、本発明の議事録生成システムは、重要度が特定の程度以上である用語が含まれるフレーズまたは文を議事録から抽出して出力するので、議事録における重要なフレーズまたは文を利用者に容易に理解させることができ、その結果、議事録における重要な内容を利用者に容易に理解させることができる。
本発明の議事録生成プログラムは、音声データから音声認識によって文字データとしての議事録を生成する議事録生成部と、前記議事録に含まれる用語の重要度を判定する重要度判定部と、前記重要度に基づいた出力内容で前記用語を出力する用語出力部とをコンピューターに実現させ、前記重要度判定部は、前記音声データにおける音声の音調の変化と、前記音声データにおける音声の音量の変化と、前記音声データにおける賛同を示す賛同用語の存在との少なくとも1つに基づいて前記音声データにおける重要な期間を特定し、前記重要な期間に含まれる前記用語の前記重要度を、前記重要な期間に含まれない前記用語の前記重要度より高く判定することを特徴とする。
この構成により、本発明の議事録生成プログラムを実行するコンピューターは、音声データにおける音声の音調の変化と、音声データにおける音声の音量の変化と、音声データにおける賛同を示す賛同用語の存在との少なくとも1つに基づいて音声データにおける重要な期間を特定し、重要な期間に含まれる用語の重要度を、重要な期間に含まれない用語の重要度より高く判定し、重要度に基づいた出力内容で用語を出力するので、議事録における重要な用語を利用者に容易に理解させることができ、その結果、議事録における重要な内容を利用者に容易に理解させることができる。
本発明の議事録生成システムおよび議事録生成プログラムは、議事録における重要な内容を利用者に容易に理解させることができる。
本発明の一実施の形態に係る議事録生成システムのブロック図である。 会議の音声データに基づいて議事録を生成する場合の図1に示す議事録生成システムの動作のフローチャートである。 図2に示す音調式重要度判定処理のフローチャートである。 図2に示す音量式重要度判定処理のフローチャートである。 図2に示す賛同用語式重要度判定処理のフローチャートである。 議事録を出力する場合の図1に示す議事録生成システムの動作のフローチャートである。 図1に示す表示部に表示される2次元マップの一例である。 図1に示す表示部に表示される相互関係図の一例である。
以下、本発明の実施の形態について、図面を用いて説明する。
まず、本発明の一実施の形態に係る議事録生成システムの構成について説明する。
図1は、本実施の形態に係る議事録生成システム10のブロック図である。
図1に示すように、議事録生成システム10は、種々の操作が入力される例えばキーボード、マウスなどの操作デバイスである操作部11と、種々の情報を表示する例えばLCD(Liquid Crystal Display)などの表示デバイスである表示部12と、LAN(Local Area Network)、インターネットなどのネットワーク経由で、または、ネットワークを介さずに有線または無線によって直接に、外部の装置と通信を行う通信デバイスである通信部13と、各種の情報を記憶する例えば半導体メモリー、HDD(Hard Disk Drive)などの不揮発性の記憶デバイスである記憶部14と、議事録生成システム10全体を制御する制御部15とを備えている。議事録生成システム10は、PC(Personal Computer)などのコンピューターによって構成されている。
記憶部14は、議事録を生成するための議事録生成プログラム14aを記憶している。議事録生成プログラム14aは、例えば、議事録生成システム10の製造段階で議事録生成システム10にインストールされていても良いし、CD(Compact Disk)、DVD(Digital Versatile Disk)、USB(Universal Serial Bus)メモリーなどの外部の記憶媒体から議事録生成システム10に追加でインストールされても良いし、ネットワーク上から議事録生成システム10に追加でインストールされても良い。
記憶部14は、議事録のデータ(以下「議事録データ」という。)14bを記憶可能である。記憶部14は、議事録データ14b以外にも、議事録データを少なくとも1つ記憶可能である。
記憶部14は、例えば「なるほど」、「いいね」などの賛同を示す用語(以下「賛同用語」という。)が登録される賛同用語データベース14cを記憶している。
記憶部14は、会議に参加する可能性がある者の音声の特徴を発声者毎に示す音声特徴情報14dを記憶可能である。
制御部15は、例えば、CPU(Central Processing Unit)と、プログラムおよび各種のデータを記憶しているROM(Read Only Memory)と、制御部15のCPUの作業領域として用いられるメモリーとしてのRAM(Random Access Memory)とを備えている。制御部15のCPUは、記憶部14または制御部15のROMに記憶されているプログラムを実行する。
制御部15は、議事録生成プログラム14aを実行することによって、音声データから音声認識によって文字データとしての議事録を生成する議事録生成部15aと、議事録に含まれる用語の重要度を判定する重要度判定部15bと、重要度に基づいた出力内容で用語を出力する用語出力部15cとを実現する。
次に、議事録生成システム10の動作について説明する。
まず、会議の音声データに基づいて議事録を生成する場合の議事録生成システム10の動作について説明する。
図2は、会議の音声データに基づいて議事録を生成する場合の議事録生成システム10の動作のフローチャートである。
利用者は、議事録の生成の基になる音声データ(以下「対象音声データ」という。)を操作部11を介して指定して、議事録生成システム10に議事録の生成を操作部11を介して指示することができる。議事録生成システム10の議事録生成部15aは、議事録の生成が指示されると、図2に示す動作を実行する。
図2に示すように、議事録生成部15aは、音声特徴情報14dを利用して対象音声データに対して音声認識を実行することによって、対象音声データに含まれる音声の発声者を全て検出する(S51)。
次いで、議事録生成部15aは、対象音声データに対して音声認識を実行することによって、対象音声データから文字データを生成する(S52)。ここで、議事録生成部15aは、対象音声データから文字データを生成する場合、対象音声データから生成した文字データにおけるいずれの文字が、S51において検出したいずれの発声者による発言に基づいた文字であるかも特定する。
次いで、重要度判定部15bは、S52において生成した文字データに含まれる用語を抽出する(S53)。重要度判定部15bは、S53において、重複がないように用語を抽出する。
次いで、重要度判定部15bは、音声データにおける音調の変化に基づいて用語の重要度を判定する音調式重要度判定処理を実行する(S54)。
図3は、音調式重要度判定処理のフローチャートである。
図3に示すように、重要度判定部15bは、S51において検出された全ての発声者のうち、今回の音調式重要度判定処理において未だ対象にしていない1人の発声者のみを対象とする(S61)。
次いで、重要度判定部15bは、対象音声データにおいて現在の対象の発声者の音声の音調が特定の高さ超になる時点を検索する(S62)。ここで、特定の高さは、対象音声データにおける現在の対象の発声者の音声に基づいて設定されても良いし、音声特徴情報14dにおける現在の対象の発声者の音声に基づいて設定されても良い。例えば、特定の高さは、対象音声データにおける現在の対象の発声者の最初の音声の高さでも良いし、対象音声データにおける現在の対象の発声者の全ての音声の高さの平均でも良い。
次いで、重要度判定部15bは、S62における検索において現在の対象の発声者の音声の音調が特定の高さ超になる時点が抽出されたか否かを判断する(S63)。
重要度判定部15bは、現在の対象の発声者の音声の音調が特定の高さ超になる時点が抽出されたとS63において判断すると、S62における検索において抽出された時点のうち、今回の音調式重要度判定処理において未だ対象にしていない1つの時点のみを対象とする(S64)。
重要度判定部15bは、S64の処理の後、対象音声データにおいて現在の対象の時点を含む特定の期間を重要な期間として特定する(S65)。ここで、現在の対象の時点を含む特定の期間とは、例えば、現在の対象の時点を基準として前の10秒と、後ろの10秒との合計20秒間である。
重要度判定部15bは、S65の処理の後、S53において抽出された用語のうち、対象音声データにおいてS65において特定した期間に含まれる用語の重要度に特定の値を加算する(S66)。ここで、重要度判定部15bは、S65において特定した期間に対象の用語が1回存在する場合には対象の用語の重要度に1ポイントを加算し、2回存在する場合には対象の用語の重要度に2ポイントを加算し、3回存在する場合には対象の用語の重要度に3ポイントを加算するなど、S65において特定した期間に対象の用語が存在する回数に応じたポイントを対象の用語の重要度にS66において加算する。また、重要度判定部15bは、S65において特定した期間に用語の後端が含まれる場合にのみ、S65において特定した期間に、この用語が含まれるとS66において判定する。
重要度判定部15bは、S66の処理の後、S62における検索において抽出された全ての時点を今回の音調式重要度判定処理において対象にしたか否かを判断する(S67)。
重要度判定部15bは、S62における検索において抽出された少なくとも1つの時点を未だ対象にしていないとS67において判断すると、S64の処理を実行する。
重要度判定部15bは、現在の対象の発声者の音声の音調が特定の高さ超になる時点が抽出されなかったとS63において判断するか、S62における検索において抽出された全ての時点を対象にしたとS67において判断すると、S51において検出された全ての発声者を今回の音調式重要度判定処理において対象にしたか否かを判断する(S68)。
重要度判定部15bは、S51において検出された少なくとも1人の発声者を未だ対象にしていないとS68において判断すると、S61の処理を実行する。
重要度判定部15bは、S51において検出された全ての発声者を対象にしたとS68において判断すると、図3に示す音調式重要度判定処理を終了する。
図2に示すように、重要度判定部15bは、S54の音調式重要度判定処理の後、音声データにおける音量の変化に基づいて用語の重要度を判定する音量式重要度判定処理を実行する(S55)。
図4は、音量式重要度判定処理のフローチャートである。
図4に示すように、重要度判定部15bは、S51において検出された全ての発声者のうち、今回の音量式重要度判定処理において未だ対象にしていない1人の発声者のみを対象とする(S71)。
次いで、重要度判定部15bは、対象音声データにおいて現在の対象の発声者の音声の音量が特定の大きさ超になる時点を検索する(S72)。ここで、特定の大きさは、対象音声データにおける現在の対象の発声者の音声に基づいて設定されても良いし、音声特徴情報14dにおける現在の対象の発声者の音声に基づいて設定されても良い。例えば、特定の大きさは、対象音声データにおける現在の対象の発声者の最初の音声の大きさでも良いし、対象音声データにおける現在の対象の発声者の全ての音声の大きさの平均でも良い。
次いで、重要度判定部15bは、S72における検索において現在の対象の発声者の音声の音量が特定の大きさ超になる時点が抽出されたか否かを判断する(S73)。
重要度判定部15bは、現在の対象の発声者の音声の音量が特定の大きさ超になる時点が抽出されたとS73において判断すると、S72における検索において抽出された時点のうち、今回の音量式重要度判定処理において未だ対象にしていない1つの時点のみを対象とする(S74)。
重要度判定部15bは、S74の処理の後、対象音声データにおいて現在の対象の時点を含む特定の期間を重要な期間として特定する(S75)。ここで、現在の対象の時点を含む特定の期間とは、例えば、現在の対象の時点を基準として前の10秒と、後ろの10秒との合計20秒間である。
重要度判定部15bは、S75の処理の後、S53において抽出された用語のうち、対象音声データにおいてS75において特定した期間に含まれる用語の重要度に特定の値を加算する(S76)。ここで、重要度判定部15bは、S75において特定した期間に対象の用語が存在する回数に応じたポイントを対象の用語の重要度にS76において加算する。また、重要度判定部15bは、S75において特定した期間に用語の後端が含まれる場合にのみ、S75において特定した期間に、この用語が含まれるとS76において判定する。
重要度判定部15bは、S76の処理の後、S72における検索において抽出された全ての時点を今回の音量式重要度判定処理において対象にしたか否かを判断する(S77)。
重要度判定部15bは、S72における検索において抽出された少なくとも1つの時点を未だ対象にしていないとS77において判断すると、S74の処理を実行する。
重要度判定部15bは、現在の対象の発声者の音声の音量が特定の大きさ超になる時点が抽出されなかったとS73において判断するか、S72における検索において抽出された全ての時点を対象にしたとS77において判断すると、S51において検出された全ての発声者を今回の音量式重要度判定処理において対象にしたか否かを判断する(S78)。
重要度判定部15bは、S51において検出された少なくとも1人の発声者を未だ対象にしていないとS78において判断すると、S71の処理を実行する。
重要度判定部15bは、S51において検出された全ての発声者を対象にしたとS78において判断すると、図4に示す音量式重要度判定処理を終了する。
図2に示すように、重要度判定部15bは、S55の音量式重要度判定処理の後、音声データにおける賛同用語の存在に基づいて用語の重要度を判定する賛同用語式重要度判定処理を実行する(S56)。
図5は、賛同用語式重要度判定処理のフローチャートである。
図5に示すように、重要度判定部15bは、S51において検出された全ての発声者のうち、今回の賛同用語式重要度判定処理において未だ対象にしていない1人の発声者のみを対象とする(S81)。
次いで、重要度判定部15bは、S52において生成した文字データと、賛同用語データベース14cとに基づいて、対象音声データにおいて現在の対象の発声者によって賛同用語が発声された時点を検索する(S82)。ここで、重要度判定部15bは、対象音声データにおける賛同用語の後端に対応する時点を、賛同用語が発声された時点として扱う。
次いで、重要度判定部15bは、S82における検索において現在の対象の発声者によって賛同用語が発声された時点が抽出されたか否かを判断する(S83)。
重要度判定部15bは、現在の対象の発声者によって賛同用語が発声された時点が抽出されたとS83において判断すると、S82における検索において抽出された時点のうち、今回の賛同用語式重要度判定処理において未だ対象にしていない1つの時点のみを対象とする(S84)。
重要度判定部15bは、S84の処理の後、対象音声データにおいて現在の対象の時点を含む特定の期間を重要な期間として特定する(S85)。ここで、現在の対象の時点を含む特定の期間とは、例えば、現在の対象の時点を基準として前の10秒と、後ろの10秒との合計20秒間である。
重要度判定部15bは、S85の処理の後、S53において抽出された用語のうち、対象音声データにおいてS85において特定した期間に含まれる用語の重要度に特定の値を加算する(S86)。ここで、重要度判定部15bは、S85において特定した期間に対象の用語が存在する回数に応じたポイントを対象の用語の重要度にS86において加算する。また、重要度判定部15bは、S85において特定した期間に用語の後端が含まれる場合にのみ、S85において特定した期間に、この用語が含まれるとS86において判定する。
重要度判定部15bは、S86の処理の後、S82における検索において抽出された全ての時点を今回の賛同用語式重要度判定処理において対象にしたか否かを判断する(S87)。
重要度判定部15bは、S82における検索において抽出された少なくとも1つの時点を未だ対象にしていないとS87において判断すると、S84の処理を実行する。
重要度判定部15bは、現在の対象の発声者によって賛同用語が発声された時点が抽出されなかったとS83において判断するか、S82における検索において抽出された全ての時点を対象にしたとS87において判断すると、S51において検出された全ての発声者を今回の賛同用語式重要度判定処理において対象にしたか否かを判断する(S88)。
重要度判定部15bは、S51において検出された少なくとも1人の発声者を未だ対象にしていないとS88において判断すると、S81の処理を実行する。
重要度判定部15bは、S51において検出された全ての発声者を対象にしたとS88において判断すると、図5に示す賛同用語式重要度判定処理を終了する。
図2に示すように、重要度判定部15bは、S56の賛同用語式重要度判定処理の後、S54〜S56の処理によって用語毎に判定された重要度を示す用語重要度情報を生成する(S57)。
次いで、議事録生成部15aは、S52において生成した文字データと、S57において生成した用語重要度情報とを含む議事録データを生成する(S58)。
次いで、議事録生成部15aは、S58において生成した議事録データを記憶部14に記憶して(S59)、図2に示す動作を終了する。
次に、議事録を出力する場合の議事録生成システム10の動作について説明する。
図6は、議事録を出力する場合の議事録生成システム10の動作のフローチャートである。
利用者は、記憶部14に記憶されているいずれかの議事録データを操作部11を介して指定して、議事録生成システム10に議事録の出力を操作部11を介して指示することができる。議事録生成システム10の用語出力部15cは、議事録の出力が指示されると、図6に示す動作を実行する。
図6に示すように、用語出力部15cは、議事録データの用語重要度情報に基づいて、特定の程度、すなわち、特定のポイント以上の重要度が付されている用語を抽出する(S91)。
次いで、用語出力部15cは、S91において抽出した用語を強調した状態で、議事録データに含まれる文字データ、すなわち、議事録を表示部12への表示によって出力して(S92)、図6に示す動作を終了する。ここで、S92における強調の方法としては、種々の方法を採用することが可能である。例えば、用語出力部15cは、S91において抽出した用語を、S91において抽出していない用語より太字にしたり、S91において抽出していない用語よりフォントサイズを大きくしたり、S91において抽出していない用語とはフォントの種類を変えたりすることによって強調することができる。
議事録生成システム10は、重要度が特定の程度以上である用語を強調した状態で議事録を出力する(S92)ので、議事録における重要な用語を議事録上で利用者に容易に理解させることができ、その結果、議事録における重要な内容を利用者に容易に理解させることができる。
なお、用語出力部15cは、対象音声データに含まれる用語の出力方法として、図6に示す出力方法以外の方法を採用しても良い。例えば、用語出力部15cは、対象音声データに含まれる用語の出力方法として、以下に説明する種々の方法を採用しても良い。用語出力部15cは、対象音声データに含まれる用語の出力方法を、操作部11を介した指示に応じて切り替えても良い。
例えば、用語出力部15cは、対象音声データに含まれる用語の一覧を表示部12に表示することによって、対象音声データに含まれる用語を出力しても良い。なお、用語出力部15cは、対象音声データに含まれる用語の全てではなく、対象音声データに含まれる用語の一部の一覧を表示しても良い。例えば、用語出力部15cは、対象音声データに含まれる用語のうち、議事録データの用語重要度情報における重要度が1ポイント以上である用語の一覧を表示しても良い。用語出力部15cは、議事録データの用語重要度情報における重要度の大きさ順に用語の一覧を表示部12に表示しても良い。また、用語出力部15cは、用語の一覧を表示部12に表示する場合に、議事録データの用語重要度情報における重要度が特定の程度以上である用語を強調した状態で表示しても良い。ここで、強調の方法としては、種々の方法を採用することが可能である。例えば、用語出力部15cは、議事録データの用語重要度情報における重要度が特定の程度以上である用語を、議事録データの用語重要度情報における重要度が特定の程度未満である用語より太字にしたり、議事録データの用語重要度情報における重要度が特定の程度未満である用語よりフォントサイズを大きくしたり、議事録データの用語重要度情報における重要度が特定の程度未満である用語とはフォントの種類を変えたりすることによって強調することができるし、議事録データの用語重要度情報における重要度が特定の程度以上である用語を、議事録データの用語重要度情報における重要度が特定の程度未満である用語より上位に配置することによって強調することができる。
議事録生成システム10は、重要度の大きさ順に、または、重要度が特定の程度以上である用語を強調した状態で、用語の一覧を出力する場合、議事録における重要な用語を用語の一覧上で利用者に容易に理解させることができるので、議事録における重要な内容を利用者に容易に理解させることができる。
例えば、用語出力部15cは、音声データにおける音声の音調の変化に基づいた値を示す軸と、音声データにおける音声の音量の変化に基づいた値を示す軸と、音声データにおける賛同用語の存在に基づいた値を示す軸とのうち、いずれか2軸によって構成される2次元空間上に用語を配置した2次元マップを表示部12に表示することによって、対象音声データに含まれる用語を出力しても良い。例えば、用語出力部15cは、音声データにおける音声の音調の変化に基づいた値を示す軸と、音声データにおける音声の音量の変化に基づいた値を示す軸と、音声データにおける賛同用語の存在に基づいた値を示す軸とのうち、利用者によって選択された2軸によって構成される2次元空間上に用語を配置した2次元マップを表示部12に表示しても良い。
ここで、音声データにおける音声の音調の変化に基づいた値としては、例えば、音調式重要度判定処理において用語毎に加算した重要度や、音調式重要度判定処理において重要度を加算した要因になった発声者の、用語毎の人数が採用されることができる。音声データにおける音声の音量の変化に基づいた値としては、例えば、音量式重要度判定処理において用語毎に加算した重要度や、音量式重要度判定処理において重要度を加算した要因になった発声者の、用語毎の人数が採用されることができる。音声データにおける賛同用語の存在に基づいた値としては、例えば、賛同用語式重要度判定処理において用語毎に加算した重要度や、賛同用語式重要度判定処理において重要度を加算した要因になった発声者の、用語毎の人数が採用されることができる。
なお、用語出力部15cは、対象音声データに含まれる用語の全てではなく、対象音声データに含まれる用語の一部を2次元マップ上に表示しても良い。例えば、用語出力部15cは、対象音声データに含まれる用語のうち、議事録データの用語重要度情報における重要度が特定の程度以上である用語のみを2次元マップ上に表示しても良い。
図7は、音声データにおける音声の音調の変化に基づいた値として、音調式重要度判定処理において用語毎に加算した重要度を示す軸と、音声データにおける賛同用語の存在に基づいた値として、賛同用語式重要度判定処理において用語毎に加算した重要度を示す軸との2軸によって構成される2次元空間上に用語を配置した2次元マップ20の一例である。2次元マップ20には、用語21〜25が配置されている。例えば、2次元マップ20において、用語21は、音調が高くなった時点を含む特定の期間に発声されていることと、賛同用語が発声された時点を含む特定の期間に発声されていることとの両方が多く、非常に重要な用語である可能性が高い。また、2次元マップ20において、用語22は、賛同用語が発声された時点を含む特定の期間に発声されていることが多いが、音調が高くなった時点を含む特定の期間に発声されていることが少ないので、用語21よりは重要ではない可能性が高い。また、2次元マップ20において、用語24は、音調が高くなった時点を含む特定の期間に発声されていることが多いが、賛同用語が発声された時点を含む特定の期間に発声されていることが少ないので、用語21よりは重要ではない可能性が高い。また、2次元マップ20において、用語25は、音調が高くなった時点を含む特定の期間に発声されていることと、賛同用語が発声された時点を含む特定の期間に発声されていることとの両方が少なく、用語21〜24よりは重要ではない可能性が高い。
なお、用語出力部15cは、音声データにおける音声の音調の変化に基づいた値を示す軸と、音声データにおける音声の音量の変化に基づいた値を示す軸と、音声データにおける賛同用語の存在に基づいた値を示す軸との3軸によって構成される3次元空間上に用語を配置した3次元マップを表示部12に表示することによって、対象音声データに含まれる用語を出力しても良い。
議事録生成システム10は、音声データにおける音声の音調の変化に基づいた値を示す軸と、音声データにおける音声の音量の変化に基づいた値を示す軸と、音声データにおける賛同用語の存在に基づいた値を示す軸とのうち、少なくとも2軸によって構成される空間上に、重要度が特定の程度以上である用語を配置したマップを出力する場合、このマップ上で、議事録における重要な用語の重要度の詳細な内容を利用者に容易に理解させることができるので、議事録における重要な内容を利用者に容易に理解させることができる。
例えば、用語出力部15cは、用語同士の相互の関係を示す相互関係図を表示部12に表示することによって、対象音声データに含まれる用語を出力しても良い。なお、用語出力部15cは、対象音声データに含まれる用語の全てではなく、対象音声データに含まれる用語の一部を相互関係図上に表示しても良い。例えば、用語出力部15cは、対象音声データに含まれる用語のうち、議事録データの用語重要度情報における重要度が特定の程度以上である用語のみを相互関係図上に表示しても良い。
図8は、用語同士の相互の関係を示す相互関係図30の一例である。相互関係図30には、用語31〜36が配置されている。相互関係図30において、S66、S76またはS86において同一の特定の期間に含まれていた用語同士は、相互に関係があることを示す矢印37a〜矢印37gによって接続されている。矢印37a〜矢印37gは、S66、S76またはS86において同一の特定の期間に含まれていた回数が多いほど、太く表示される。また、用語31〜36は、議事録データの用語重要度情報において付されている重要度が大きいほど、大きく表示される。
議事録生成システム10は、重要度が特定の程度以上である用語同士の相互の関係を示す相互関係図を出力する場合、この相互関係図上で、議事録における重要な用語同士の相互の関係を利用者に容易に理解させることができるので、議事録における重要な内容を利用者に容易に理解させることができる。
例えば、用語出力部15cは、議事録データの用語重要度情報における重要度が特定の程度以上である用語が含まれるフレーズを、議事録データに含まれる文字データから抽出して表示部12に表示することによって、対象音声データに含まれる用語を出力しても良い。また、用語出力部15cは、議事録データの用語重要度情報における重要度が特定の程度以上である用語が含まれる文を、議事録データに含まれる文字データから抽出して表示部12に表示することによって、対象音声データに含まれる用語を出力しても良い。
議事録生成システム10は、重要度が特定の程度以上である用語が含まれるフレーズまたは文を、議事録データに含まれる文字データ、すなわち、議事録から抽出して出力する場合、議事録における重要なフレーズまたは文を利用者に容易に理解させることができるので、議事録における重要な内容を利用者に容易に理解させることができる。
以上に説明したように、議事録生成システム10は、音声データにおける音声の音調の変化と、音声データにおける音声の音量の変化と、音声データにおける賛同を示す賛同用語の存在との少なくとも1つに基づいて音声データにおける重要な期間を特定し(S65、S75またはS85)、重要な期間に含まれる用語の重要度を、重要な期間に含まれない用語の重要度より高く判定し(S66、S76またはS86)、重要度に基づいた出力内容で用語を出力する(S92)ので、議事録における重要な用語を利用者に容易に理解させることができ、その結果、議事録における重要な内容を利用者に容易に理解させることができる。
議事録生成システム10は、上述のS51において、音声特徴情報14dを利用して対象音声データに対して音声認識を実行することによって、対象音声データに含まれる音声の発声者を全て検出する。しかしながら、議事録生成システム10は、S51において、音声特徴情報14dを利用せずに対象音声データに対して音声認識を実行することによって、対象音声データに含まれる音声の発声者を全て検出しても良い。議事録生成システム10は、音声特徴情報14dを利用せずに対象音声データに対して音声認識を実行する場合、対象音声データに含まれる音声の発声者を音声特徴情報14dに登録されている特定の人物として識別することはできないが、対象音声データに複数の発声者の音声が含まれるときに、対象音声データに含まれる音声の発声者同士を識別することは可能である。
議事録生成システム10は、上述のS66、S76およびS86において、S65、S75またはS85において特定した期間に対象の用語が存在する回数に応じたポイントを対象の用語の重要度に加算する。しかしながら、議事録生成システム10は、S66、S76およびS86において、上述の方法以外の方法によってポイントを対象の用語の重要度に加算しても良い。例えば、議事録生成システム10は、S65、S75またはS85において特定した期間に対象の用語が存在する回数にかかわらず、S66、S76およびS86において1ポイントのみを対象の用語の重要度に加算しても良い。
議事録生成システム10は、S65、S75またはS85において特定した期間に用語の後端が含まれる場合にのみ、S65、S75またはS85において特定した期間に、この用語が含まれると、上述のS66、S76およびS86において判定する。しかしながら、議事録生成システム10は、S66、S76およびS86において、上述の方法以外の方法によって、S65、S75またはS85において特定した期間に、この用語が含まれると判定しても良い。例えば、議事録生成システム10は、S65、S75またはS85において特定した期間に用語の少なくとも一部が含まれる場合に、S65、S75またはS85において特定した期間に、この用語が含まれると、S66、S76およびS86において判定しても良い。
議事録生成システム10は、上述のS82において、対象音声データにおける賛同用語の後端に対応する時点を、賛同用語が発声された時点として扱う。しかしながら、議事録生成システム10は、S82において、対象音声データにおける賛同用語の後端に対応する時点以外の時点を、賛同用語が発声された時点として扱っても良い。例えば、議事録生成システム10は、S82において、対象音声データにおける賛同用語の前端に対応する時点を、賛同用語が発声された時点として扱っても良い。
議事録生成システム10は、本実施の形態において、議事録や用語の出力方法として、表示を採用している。しかしながら、議事録生成システム10は、表示以外の方法によって議事録や用語を出力しても良い。例えば、議事録生成システム10は、印刷によって議事録や用語を出力しても良い。
議事録生成システム10は、本実施の形態において、1台のコンピューターによって構成されている。しかしながら、議事録生成システム10は、複数台のコンピューターによって構成されても良い。
10 議事録生成システム(コンピューター)
14a 議事録生成プログラム
15a 議事録生成部
15b 重要度判定部
15c 用語出力部
20 2次元マップ(マップ)
21〜25 用語
30 相互関係図
31〜36 用語
37a〜37g 矢印(用語同士の相互の関係を示す矢印)

Claims (7)

  1. 音声データから音声認識によって文字データとしての議事録を生成する議事録生成部と、
    前記議事録に含まれる用語の重要度を判定する重要度判定部と、
    前記重要度に基づいた出力内容で前記用語を出力する用語出力部と
    を備え、
    前記重要度判定部は、前記音声データにおける音声の音調の変化と、前記音声データにおける音声の音量の変化と、前記音声データにおける賛同を示す賛同用語の存在との少なくとも1つに基づいて前記音声データにおける重要な期間を特定し、前記重要な期間に含まれる前記用語の前記重要度を、前記重要な期間に含まれない前記用語の前記重要度より高く判定することを特徴とする議事録生成システム。
  2. 前記用語出力部は、前記重要度が特定の程度以上である前記用語を強調した状態で前記議事録を出力することを特徴とする請求項1に記載の議事録生成システム。
  3. 前記用語出力部は、前記重要度の大きさ順に、または、前記重要度が特定の程度以上である前記用語を強調した状態で、前記用語の一覧を出力することを特徴とする請求項1に記載の議事録生成システム。
  4. 前記用語出力部は、前記音声データにおける音声の音調の変化に基づいた値を示す軸と、前記音声データにおける音声の音量の変化に基づいた値を示す軸と、前記音声データにおける前記賛同用語の存在に基づいた値を示す軸とのうち、少なくとも2軸によって構成される空間上に、前記重要度が特定の程度以上である前記用語を配置したマップを出力することを特徴とする請求項1に記載の議事録生成システム。
  5. 前記用語出力部は、前記重要度が特定の程度以上である前記用語同士の相互の関係を示す相互関係図を出力し、
    前記相互関係図は、前記音声データにおいて同一の前記重要な期間に含まれる前記用語同士が相互に関係があることを示すことを特徴とする請求項1に記載の議事録生成システム。
  6. 前記用語出力部は、前記重要度が特定の程度以上である前記用語が含まれるフレーズまたは文を前記議事録から抽出して出力することを特徴とする請求項1に記載の議事録生成システム。
  7. 音声データから音声認識によって文字データとしての議事録を生成する議事録生成部と、
    前記議事録に含まれる用語の重要度を判定する重要度判定部と、
    前記重要度に基づいた出力内容で前記用語を出力する用語出力部と
    をコンピューターに実現させ、
    前記重要度判定部は、前記音声データにおける音声の音調の変化と、前記音声データにおける音声の音量の変化と、前記音声データにおける賛同を示す賛同用語の存在との少なくとも1つに基づいて前記音声データにおける重要な期間を特定し、前記重要な期間に含まれる前記用語の前記重要度を、前記重要な期間に含まれない前記用語の前記重要度より高く判定することを特徴とする議事録生成プログラム。
JP2018171569A 2018-09-13 2018-09-13 議事録生成システムおよび議事録生成プログラム Active JP7205684B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018171569A JP7205684B2 (ja) 2018-09-13 2018-09-13 議事録生成システムおよび議事録生成プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018171569A JP7205684B2 (ja) 2018-09-13 2018-09-13 議事録生成システムおよび議事録生成プログラム

Publications (2)

Publication Number Publication Date
JP2020042229A true JP2020042229A (ja) 2020-03-19
JP7205684B2 JP7205684B2 (ja) 2023-01-17

Family

ID=69798520

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018171569A Active JP7205684B2 (ja) 2018-09-13 2018-09-13 議事録生成システムおよび議事録生成プログラム

Country Status (1)

Country Link
JP (1) JP7205684B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022013586A (ja) * 2020-06-30 2022-01-18 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド 議事録の生成方法、装置、電子機器、及びコンピュータ可読記憶媒体

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005025571A (ja) * 2003-07-03 2005-01-27 Ns Solutions Corp 業務支援装置、業務支援方法およびそのプログラム
JP2013109635A (ja) * 2011-11-22 2013-06-06 Nippon Telegr & Teleph Corp <Ntt> 単語重要度算出装置とその方法とプログラム
JP2014085998A (ja) * 2012-10-26 2014-05-12 Univ Of Yamanashi 電子ノート作成支援装置および電子ノート作成支援装置用プログラム
JP2015082087A (ja) * 2013-10-24 2015-04-27 富士通株式会社 情報処理装置、プログラム、及び方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005025571A (ja) * 2003-07-03 2005-01-27 Ns Solutions Corp 業務支援装置、業務支援方法およびそのプログラム
JP2013109635A (ja) * 2011-11-22 2013-06-06 Nippon Telegr & Teleph Corp <Ntt> 単語重要度算出装置とその方法とプログラム
JP2014085998A (ja) * 2012-10-26 2014-05-12 Univ Of Yamanashi 電子ノート作成支援装置および電子ノート作成支援装置用プログラム
JP2015082087A (ja) * 2013-10-24 2015-04-27 富士通株式会社 情報処理装置、プログラム、及び方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022013586A (ja) * 2020-06-30 2022-01-18 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド 議事録の生成方法、装置、電子機器、及びコンピュータ可読記憶媒体
US11521603B2 (en) 2020-06-30 2022-12-06 Beijing Baidu Netcom Science And Technology Co., Ltd. Automatically generating conference minutes

Also Published As

Publication number Publication date
JP7205684B2 (ja) 2023-01-17

Similar Documents

Publication Publication Date Title
CN108288468B (zh) 语音识别方法及装置
KR102318340B1 (ko) 핫 워드-인식 음성 합성
JP5596649B2 (ja) 文書マークアップ支援装置、方法、及びプログラム
JP2007206317A (ja) オーサリング方法、オーサリング装置およびプログラム
TWI554984B (zh) 電子裝置
WO2021103712A1 (zh) 一种基于神经网络的语音关键词检测方法、装置及系统
TW200926140A (en) Method and system of generating and detecting confusion phones of pronunciation
JP2016045420A (ja) 発音学習支援装置およびプログラム
US20200210505A1 (en) Electronic apparatus and controlling method thereof
WO2020191828A1 (zh) 基于图的上下文关联回复生成方法、计算机及介质
JP2020042229A (ja) 議事録生成システムおよび議事録生成プログラム
JP6728116B2 (ja) 音声認識装置、音声認識方法およびプログラム
JPWO2003025787A1 (ja) 文章生成装置及び生成方法
JP2011170622A (ja) コンテンツ提供システム、コンテンツ提供方法、およびコンテンツ提供プログラム
JP6097791B2 (ja) 話題継続願望判定装置、方法、及びプログラム
JP5784196B2 (ja) 文書マークアップ支援装置、方法、及びプログラム
JP2008175851A (ja) 録音時間算出装置、発音練習装置および録音時間算出方法、発音練習処理方法、ならびにそのプログラム、電子辞書
CN113851106A (zh) 音频播放方法、装置、电子设备和可读存储介质
CN113590871A (zh) 一种音频分类方法、装置及计算机可读存储介质
JP2009150990A (ja) 発話応答生成装置、及びプログラム
CN114822492B (zh) 语音合成方法及装置、电子设备、计算机可读存储介质
KR20240091499A (ko) 사용자 음성 선명도에 기초한 응답 정보 출력 방법
JP6172491B2 (ja) テキスト整形プログラム、方法及び装置
KR20240091500A (ko) 단어의 감정 벡터에 기초한 추천 정보 생성 방법
JP2020008637A (ja) 音声認識装置、音声認識プログラム、音声認識方法および辞書生成装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210831

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220422

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220601

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220726

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20221130

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20221213

R150 Certificate of patent or registration of utility model

Ref document number: 7205684

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150