JP6795668B1

JP6795668B1 - 議事録作成システム

Info

Publication number: JP6795668B1
Application number: JP2019193392A
Authority: JP
Inventors: 剛大濱
Original assignee: Japan Cash Machine Co Ltd
Current assignee: Japan Cash Machine Co Ltd
Priority date: 2019-10-24
Filing date: 2019-10-24
Publication date: 2020-12-02
Anticipated expiration: 2039-10-24
Also published as: JP2021067830A

Abstract

【課題】議事録の閲覧者が会議の要点を容易に把握することができる議事録を作成することができる議事録作成システムを提供する。【解決手段】議事録作成システム１は、音声認識部とおよび情報処理部を備えたサーバ１００と端末２００で構成される。サーバ１００の音声認識部は、マイク２７０で取得した音声を認識し、サーバ１００の情報処理部は、音声の認識結果を音声認識テキストとして出力し、音声認識テキスト内で選択した内容から議事録を作成する。【選択図】図１

Description

本発明は、議事録作成システムに関する。

「音声を入力する音声入力手段と、音声入力手段から入力された音声を蓄積する音声蓄積手段と、音声蓄積手段に蓄積された音声の話者や発言内容を解析する音声解析手段と、音声解析手段によって解析された音声の話者や発言内容から議事録を生成する議事録作成手段と、議事録作成手段によって生成された議事録を表示する議事録表示手段と、議事録作成手段で生成された議事録を編集する議事録編集手段とを有しており、議事録編集手段は、議事録表示手段による議事録表示に基づいて、議事録作成手段で生成された議事録を編集可能となっていることを特徴とする議事録作成装置」が過去に提案されている（例えば、特開２００１−３２５２５０公報等参照）。

特開２００１−３２５２５０公報

上述のとおり、特許文献１の議事録作成装置は、会議中に取得した音声をテキスト化して自動的に議事録を作成している。しかし、会議中に取得した発言内容の全てから議事録が作成されるため、不必要な発言や削除すべき発言等も議事録として残ってしまう。かかる場合、議事録の閲覧者が会議の要点を容易に把握できなくなり、会議参加者が自由に意見を言えなくなる懸念がある。

本発明の課題は、議事録の閲覧者が会議の要点を容易に把握することができる議事録を作成することができる議事録作成システムを提供することである。

本発明の第１局面に係る議事録作成システムは、音声認識部および情報処理部を備える。音声認識部は、マイクで取得した音声を認識する。情報処理部は、音声の認識結果を音声認識テキストとして出力し、音声認識テキスト内で選択した内容から議事録を作成する。そして、情報処理部は、音声認識テキスト内の内容毎に１または複数のユーザによる第１投票を受け付け、ユーザの第１投票によって所定値以上の得票を獲得した内容を選択して議事録を作成する。

この議事録作成システムでは、情報処理部は、音声認識テキスト内の内容毎に１または複数のユーザ（例えば、会議参加者等）による第１投票を受け付けて、ユーザの第１投票によって所定値以上の得票を獲得した内容を選択して議事録を作成する。例えば、会議参加者のうち権限のある１人による投票を受け付け、投票された音声認識テキスト内の内容から議事録を作成するようにすることができる。また、例えば、複数の会議参加者それぞれによる投票を受け付けて、会議参加者のうち３人以上に投票された場合に、投票された音声認識テキスト内の内容から議事録を作成するようにすることもできる。このため、この議事録作成システムでは、会議中に取得した発言内容のうち不必要な発言内容を除外した（必要な発言内容のみを残した）議事録を作成することができ、延いては議事録の閲覧者が会議の要点を容易に把握できるようにすることができる。

本発明の第２局面に係る議事録作成システムは第１局面に係る議事録作成システムであって、表示部をさらに備える。表示部は、音声認識テキストを第１のエリアに表示し、議事録を第２のエリアに表示する。

この議事録作成システムでは、表示部は、音声認識テキストを第１のエリアに表示し、議事録を第２のエリアに表示する。例えば、端末（例えば、パーソナルコンピュータ、タブレット端末、スマートフォン等）のディスプレイの右側に音声認識テキストを表示し、端末のディスプレイの左側に議事録を表示することで、音声認識テキスト内のどの内容が選択されて議事録が作成されているかを確認することができる。このため、この議事録作成システムでは、音声認識テキスト内の議事録に残すべき内容が選択されていないことを見落とさないようにすることができる。

本発明の第３局面に係る議事録作成システムは第１局面または第２局面に係る議事録作成システムであって、情報処理部は、音声認識テキスト内の内容毎にユーザの第１投票を受け付けて重み付けをし、重み付けされたユーザの投票による得票が所定値以上である内容を選択して議事録を作成する。

この議事録作成システムでは、情報処理部は、音声認識テキスト内の内容毎にユーザ（例えば、会議参加者等）の第１投票を受け付けて重み付けをし、重み付けされたユーザの投票による得票が所定値以上である内容を選択して議事録を作成する。例えば、企業の会議において、議事録に残すべきと判断した内容に投票する場合、部長の投票は３人分であるとみなし、課長の投票は２人分であるとみなすようにすることができる。このため、この議事録作成システムでは、影響力のある人物等の意思を反映させやすくすることができる。

本発明の第４局面に係る議事録作成システムは第１局面から第３局面のいずれか１局面に係る議事録作成システムであって、情報処理部は、ユーザの第１投票によって所定値以上の得票を獲得した内容毎にユーザによる第２投票をさらに受け付け、ユーザの第２投票によって所定値以上の得票を獲得した内容を議事録に含めない。

この議事録作成システムでは、情報処理部は、ユーザの第１投票によって所定値以上の得票を獲得した内容（つまり、ユーザが議事録に残すべきと判断した内容）毎にユーザ（議事録に残す投票をしたユーザや、議事録に残す投票をしていないユーザ）による第２投票をさらに受け付け、ユーザの第２投票によって所定値以上の得票を獲得した内容を議事録に含めない。例えば、会議参加者等の投票によって議事録に残すべきと判断された内容があったとしても、「議事録に残す投票をしたが意見が変わった会議参加者等」や「その内容を議事録に残すべきではないと判断する会議参加者等」が居る場合がある。そして、これらの会議参加者等による投票を受け付けて、所定値以上の得票を獲得した内容を議事録に含めないようにすることができる。このため、この議事録作成システムでは、会議中に取得した発言内容のうち不必要な発言内容を除外した（必要な発言内容のみを残した）議事録を作成することができる。

本発明の第５局面に係る議事録作成システムは第４局面に係る議事録作成システムであって、情報処理部は、ユーザの第１投票によって所定値以上の得票を獲得した内容毎にユーザの第２投票を受け付けて重み付けをし、重み付けされたユーザの投票による得票が所定値以上である内容を議事録に含めない。

この議事録作成システムでは、情報処理部は、ユーザの第１投票によって所定値以上の得票を獲得した内容毎にユーザの第２投票を受け付けて重み付けをし、重み付けされたユーザの投票による得票が所定値以上である内容を議事録に含めない。例えば、企業の会議において、議事録に残すべきではないと判断した内容に投票する場合、部長の投票は３人分であるとみなし、課長は２人分であるとみなすようにすることができる。このため、この議事録作成システムでは、影響力のある人物等の意思を反映させやすくすることができる。

本発明の第６局面に係る議事録作成システムは第１局面から第５局面のいずれか１局面に係る議事録作成システムであって、情報処理部は、音声認識テキストと議事録との関係性に基づく学習により生成されたモデルを用いて音声認識テキスト内の内容を選択して議事録を作成する。

この議事録作成システムでは、情報処理部は、音声認識テキストと議事録との関係性に基づく学習により生成されたモデルを用いて音声認識テキスト内の内容を選択して議事録を作成する。例えば、ＡＩ（ＡｒｔｉｆｉｃｉａｌＩｎｔｅｌｌｉｇｅｎｃｅ）による学習を利用して生成した学習モデルを用いることで、音声認識テキスト内の内容が自動的に選択されて議事録が作成される。このため、この議事録作成システムでは、手間をかけることなく議事録を作成することができる。

本発明の第７局面に係る議事録作成システムは第１局面から第６局面のいずれか１局面に係る議事録作成システムであって、選択部をさらに備える。選択部は、キーワードをあらかじめ登録したキーワード辞書の選択をする。また、情報処理部は、選択部で選択されたキーワード辞書に登録されたキーワードが含まれている音声認識テキスト内の内容を選択して議事録を作成する。

この議事録作成システムでは、選択部は、キーワードをあらかじめ登録したキーワード辞書の選択をし、情報処理部は、選択部で選択されたキーワード辞書に登録されたキーワードが含まれている音声認識テキスト内の内容を選択して議事録を作成する。そして、選択されたキーワード辞書に登録されているキーワードが音声認識テキスト内の内容に含まれている場合、その音声認識テキスト内の内容が自動的に選択されて議事録が作成される。このため、この議事録作成システムでは、手間をかけることなく議事録を作成することができる。

本発明の第８局面に係る議事録作成システムは第１局面から第７局面のいずれか１局面に係る議事録作成システムであって、音声認識部は、音声の音量を認識する。情報処理部は、音量が閾値以上であった音声認識テキスト内の内容を選択して議事録を作成する。

本発明の第９局面に係る議事録作成システムは第１局面から第８局面のいずれか１局面に係る議事録作成システムであって、音声認識部は、認識した音声がいずれの話者から発せられたかを特定する。また、情報処理部は、話者の名前を付して音声の認識結果を音声認識テキストとして出力する。

この議事録作成システムでは、情報処理部は、話者の名前を付して音声の認識結果を音声認識テキストとして出力する。このため、この議事録作成システムでは、音声認識テキスト内および議事録内において、どのユーザ（例えば、会議参加者等）による発言であるかを特定することができる。

本発明の第１０局面に係る議事録作成システムは第１局面から第９局面のいずれか１局面に係る議事録作成システムであって、情報処理部は、音声認識テキストおよび議事録を音声の言語以外の言語に翻訳することが可能である。

この議事録作成システムでは、情報処理部は、音声認識テキストおよび議事録を音声の言語以外の言語に翻訳することが可能である。このため、この議事録作成システムでは、例えば、多言語（少なくとも２つの言語以上）による会議が行われる場合に、ユーザ（例えば、会議参加者等）は、各ユーザの言語に翻訳された音声認識テキストおよび議事録を確認することができ、延いては多言語による会議を円滑に進めることができる。

本発明の第１１局面に係る議事録作成システムは第１０局面に係る議事録作成システムであって、情報処理部は、ＡＩ（Artificial Intelligence）を利用して生成された機械学習モデルを用いて、翻訳辞書を基に、音声認識テキストおよび議事録を音声の言語以外の言語に翻訳することが可能である。

本発明の第１２局面に係る議事録作成システムは第１局面から第１１局面のいずれか１局面に係る議事録作成システムであって、情報処理部は、議事録における音声認識テキスト内の内容を選択して議事録から削除することができる。

この議事録作成システムでは、情報処理部は、議事録における音声認識テキスト内の内容の一部または全部を選択して議事録から削除することができる。つまり、議事録に残すべきではない内容（例えば、企業において、一定の役職以上の人にのみ共有されている情報、企業秘密情報等）が選択されて議事録として作成されていた場合に、その内容を削除することができる。このため、この議事録作成システムでは、作成された議事録から情報漏洩等が起きることを防ぐことができる。

本発明の第１３局面に係る議事録作成システムは第１２局面に係る議事録作成システムであって、情報処理部は、ＡＩを利用して生成された機械学習モデルを用いて、議事録における音声認識テキスト内の内容を選択して議事録から削除することができる。

本発明の第１４局面に係る議事録作成システムは第１局面から第１３局面のいずれか１局面に係る議事録作成システムであって、情報処理部は、議事録から音声データを生成することができる。

この議事録作成システムでは、情報処理部は、議事録から音声データを生成することができる。このため、この議事録作成システムでは、会議参加者等は、視覚で確認しなくても会議の内容を把握することができる。

本発明の第１５局面に係る議事録作成システムは第１局面から第１４局面のいずれか１局面に係る議事録作成システムであって、情報処理部は、ＡＩを利用して生成された機械学習モデルを用いて、音声認識辞書を基に、音声を認識する。

本発明の第１６局面に係る議事録作成システムは第１局面から第１５局面のいずれか１局面に係る議事録作成システムであって、情報処理部は、ＡＩを利用して生成された機械学習モデルを用いて、変換辞書を基に、音声認識テキスト内の第１用語（例えば、企業内や業界内のみで使用される用語）を第２用語（例えば、一般的に使用される用語）に変換する。

本発明の第１実施形態に係る議事録作成システムの全体構成を示すイメージ図である。本発明の第１実施形態に係る端末のキーワードによる議事録作成時の画面推移を示すイメージ図である。本発明の第１実施形態に係る端末のユーザ投票による議事録作成時の画面推移を示すイメージ図である。本発明の第１実施形態に係る端末の削除指示による画面推移を示すイメージ図である。本発明の実施形態に係るサーバの構成を示すブロック図である。本発明の第１実施形態に係る第１照合テーブルを示すイメージ図である。本発明の第１実施形態に係る第２照合テーブルを示すイメージ図である。本発明の実施形態に係る端末の構成を示すブロック図である。本発明の第１実施形態に係る議事録作成システムの処理の流れを示すフローチャートである。本発明の実施形態に係る議事録作成システムの機能構成を示すブロック図である。本発明の第２実施形態に係る議事録作成システムの全体構成を示すイメージ図である。本発明の第１実施形態に係る端末の変形例（Ｅ）適用時のユーザ投票による議事録作成時の画面推移を示すイメージ図である。

−第１実施形態−
＜本発明の第１実施形態に係る議事録作成システム１の全体構成例＞
本発明の第１実施形態に係る議事録作成システム１の全体構成について説明する。本発明の第１実施形態に係る議事録作成システム１は、例えば、１つの会議室において会議が行われる場合に使用されるものであって、図１に示されるように、主たる装置として、サーバ１００および端末２００等から構成されている。以下、これらの構成要素について詳述する。

１．サーバ
まず、本発明の第１実施形態に係る議事録作成システム１を構成するサーバ１００の構成の一態様について説明する。サーバ１００は、インターネットに接続され、会議参加者等の音声の認識結果を音声認識テキスト２３２として出力し、音声認識テキスト２３２内で選択した内容から議事録２３３を作成するサービス等を提供する。サーバ１００は、図５に示されるように、主たる構成要素として、ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）１１０、メモリ１２０、操作部１４０および通信インターフェイス１５０を含む。

（１）ＣＰＵ
ＣＰＵ１１０は、メモリ１２０に記憶されているプログラムを実行することによって、サーバ１００の各部を制御する。例えば、ＣＰＵ１１０は、メモリ１２０に格納されているプログラムを実行し、各種のデータを参照することによって、後述する各種の処理を実行する。

（２）メモリ
メモリ１２０は、各種のＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）、各種のＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）等であり、サーバ１００に内包されているものであってもよいし、サーバ１００の各種インターフェイスに着脱可能なものであってもよいし、サーバ１００からアクセス可能な他の装置の記録媒体であってもよい。メモリ１２０は、ＣＰＵ１１０によって実行されるプログラムや、ＣＰＵ１１０によるプログラムの実行により生成されたデータ、入力されたデータ、その他の第１実施形態に係るサービスに利用されるデータベース等を記憶する。

具体的には、メモリ１２０は、図６および図７に示されるような第１照合テーブル１２１および第２照合テーブル１２２を記憶する。第１照合テーブル１２１は、使用される各マイクに、そのマイクの使用者名を関連付けている。第２照合テーブル１２２は、各会議参加者等に、重み係数を関連付けている。ここで、重み係数は、各会議参加者の投票（後述）に対して重み付け処理をする際に用いられるものである。例えば、図７に示されるような第２照合テーブル１２２を参照して重み付け処理をすることで、「田中」による投票は３人分の投票とされ、「佐藤」の投票は２人分の投票とされる。なお、サービスの管理者等は、第１照合テーブル１２１および第２照合テーブル１２２に新しいデータを追加したり、第１照合テーブル１２１および第２照合テーブル１２２に格納されているデータを変更することができる。

また、メモリ１２０は、キーワード辞書も記憶する。キーワード辞書は、例えば、企業内で選定した単語や用語（日付、時間または金額等の変数も含まれる）を登録したもの等であり、音声認識テキスト２３２のうち特定のキーワードを含んでいる音声認識テキスト２３２内の内容から議事録２３３を作成するために用いられる。なお、キーワード辞書内の単語や用語は、必要に応じて追加および変更されてメモリ１２０に記憶されてもよいし、新しいキーワード辞書が、必要に応じて追加されてメモリ１２０に記憶されてもよい。

また、メモリ１２０は、ＡＩ（ＡｒｔｉｆｉｃｉａｌＩｎｔｅｌｌｉｇｅｎｃｅ）を利用して生成した学習モデルも記憶する。ここで、学習モデルは、音声認識テキスト２３２と議事録２３３との関係性に基づく学習により生成されたもの等である。なお、必要に応じて、学習モデルの再学習が行われてメモリ１２０に記憶されてもよい。

（３）操作部
操作部１４０は、サービスの管理者等の命令を受け付けて、当該命令をＣＰＵ１１０に入力する。

（４）通信インターフェイス
通信インターフェイス１５０は、ＣＰＵ１１０からのデータを、インターネット、キャリア網、ルータ等を介して、端末２００等の他の装置に送信する。逆に、通信インターフェイス１５０は、インターネット、キャリア網、ルータ等を介して端末２００等の他の装置からのデータを受信して、ＣＰＵ１１０に受け渡す。

２．端末
次に、本発明の第１実施形態に係る議事録作成システム１を構成する端末２００の一態様について説明する。端末２００は、会議参加者等に使用され、主に、会議参加者等の音声を取得し、取得した音声データをサーバ１００に送信したり、サーバ１００から送信された音声認識結果等を受信して表示するためのものである。本発明の第１実施形態に係る議事録作成システム１おいて、端末２００は、パーソナルコンピュータやタブレット端末やスマートフォン等である。また、端末２００は、ルータやインターネットやキャリア網等を介して、サーバ１００が提供する各種のサービスを利用可能である。端末２００は、図８に示されるように、主たる構成要素として、ＣＰＵ２１０、メモリ２２０、ディスプレイ２３０、操作部２４０、通信インターフェイス２５０、スピーカ２６０、マイク２７０およびプロジェクタ２８０等を含む。

（１）ＣＰＵ
ＣＰＵ２１０は、メモリ２２０あるいは外部の記憶媒体に記憶されているプログラムを実行することによって、端末２００の各部を制御する。

（２）メモリ
メモリ２２０は、各種のＲＡＭや、各種のＲＯＭ等である。メモリ２２０は、ＣＰＵ２１０によって実行されるプログラムや、ＣＰＵ２１０によるプログラムの実行により生成されたデータ、入力されたデータ、サーバ１００から受信したデータ、操作部２４０を介して入力されたデータ等を記憶する。

（３）ディスプレイ
ディスプレイ２３０は、ＣＰＵ２１０からの信号に基づいて、テキスト、画像、映像等を表示する。例えば、ＣＰＵ２１０は、通信インターフェイス２５０を介してサーバ１００から送られてくるデータ基づいて、図２〜４に示されるような音声認識テキスト２３２および議事録２３３を同時にディスプレイ２３０に表示する。なお、ディスプレイ２３０は、タッチパネル機能を有していてもよい。

（４）操作部
操作部２４０は、マウス、キーボード、ボタンおよびタッチパネル等であり、ユーザからの各種命令をＣＰＵ２１０に入力する。

（５）通信インターフェイス
通信インターフェイス２５０は、無線ＬＡＮ通信あるいは有線ＬＡＮ等の通信モジュールである。通信インターフェイス２５０は、サーバ１００等の他の装置との間でデータの送受信を仲介する。例えば、ＣＰＵ２１０は、操作部２４０を介したキーワード辞書選択命令、その他の各種の入力情報を、通信インターフェイス２５０を介してサーバ１００に送信したり、通信インターフェイス２５０を介してサーバ１００から受信したデータに基づいてディスプレイ２３０に図２〜４に示されるような画面を表示したりする。

（６）スピーカ
スピーカ２６０は、ＣＰＵ２１０からの信号に基づいて、音声を出力する。なお、音声を出力する機器は、スピーカ２６０に限定されていない。つまり、ヘッドホン、イヤホンまたはヘッドセット等の機器が用いられてもよい。

（７）マイク
マイク２７０は、会議参加者等の音声を取得する。マイク２７０は、有線接続または無線接続によって端末２００に接続される。なお、ここで、マイク２７０は会議参加者数と同じ数だけ用意され、会議参加者１人に１つのマイクが用意されることが好ましい。

（８）プロジェクタ
プロジェクタ２８０は、図１に示されるように、ディスプレイ２３０に表示されている画面をスクリーンに映し出し、ディスプレイ２３０に表示されている画面を会議参加者が共有できるようにする場合に用いられる。

＜本発明の第１実施形態に係る議事録作成システム１の利用方法および情報処理概要＞
ここでは、図９を参照して、本発明の第１実施形態に係る議事録作成システム１の利用方法および情報処理概要について説明する。まず、会議参加者（会議主催者を含む）等は、会議が始まる前に、第１照合テーブル１２１（図６参照）および第２照合テーブル１２２（図７参照）を作成しておく。第１照合テーブル１２１および第２照合テーブル１２２は、サーバ１００において作成されてサーバ１００のメモリ１２０に記憶されてもよいし、端末２００において作成されて通信インターフェイス１５０を介してサーバ１００のメモリ１２０に記憶されてもよい。

また、会議参加者等は、キーワードによる議事録作成（後述）を選択する場合に備えて、会議が始まる前に端末２００を用いてキーワード辞書を選択する。そして、サーバ１００のＣＰＵ１１０が、サーバ１００の通信インターフェイス１５０を介して端末２００からのキーワード辞書の選択結果を受け付け、サーバ１００のメモリ１２０に格納されているキーワード辞書を選択する。これによって、選択されたキーワード辞書を基に議事録２３３を作成する処理（後述）を実行することができる。なお、ここで、会議参加者等は、１つのキーワード辞書だけを選択してもよいし、複数のキーワード辞書を選択してもよい。また、会議参加者等は、会議中にキーワード辞書を切り換えるために改めてキーワード辞書の選択を行うことができる。なお、会議参加者等は、キーワードによる議事録作成を選択しない場合、キーワード辞書の選択をしてなくてもよい。

また、会議参加者等は、ＡＩによる議事録作成（後述）を選択する場合に備えて、端末２００を用いて会議が始まる前に学習モデルを選択する。そして、サーバ１００のＣＰＵ１１０が、サーバ１００の通信インターフェイス１５０を介して端末２００からの学習モデルの選択結果を受け付け、サーバ１００のメモリ１２０に格納されている学習モデルを選択する。これによって、選択された学習モデルを基にＡＩで議事録２３３を作成する処理（後述）を実行することができる。なお、ここで、会議参加者等は、１つの学習モデルだけを選択してもよいし、複数の学習モデルを選択してもよい。また、会議参加者等は、会議中に学習モデルを切り換えるために改めて学習モデルの選択を行うことができる。なお、会議参加者等は、ＡＩによる議事録作成を選択しない場合、学習モデルの選択をしてなくてもよい。

まず、会議参加者等は、会議が始まる前に端末２００を用いて、図２（Ｂ）、図３（Ｂ）および図４に示されるような会議開催情報２３８（例えば、開催日時、開催場所、会議参加者名等）の入力を行う（ステップＳ１０２）。そして、サーバ１００のＣＰＵ１１０が、サーバ１００の通信インターフェイス１５０を介して端末２００からの入力情報を受け付けて、会議開催情報２３８を記憶する。なお、この会議開催情報２３８は、議事録２３３を作成する処理（後述）が実行された際に、議事録２３３の一部として出力される。

会議が始まると、会議参加者毎に用意されたマイク２７０が、会議参加者の音声を取得する（ステップＳ１０４）。また、端末２００は、会議参加者の音声が取得された後、会議参加者の音声を取得したマイク２７０の識別情報を、取得した音声データとともに端末２００の通信インターフェイス２５０を介してサーバ１００に送信する。

次に、サーバ１００のＣＰＵ１１０は、受信したマイク２７０の識別情報を第１照合テーブル１２１に照合して、取得した音声を発した会議参加者名（マイク２７０の使用者名）を特定する（ステップＳ１０６）。例えば、図６に示されるように、受信したマイク２７０の識別情報が「マイクＡ」である場合、サーバ１００のＣＰＵ１１０は、取得した音声を発した会議参加者を「田中」と特定する。

次に、サーバ１００のＣＰＵ１１０は、取得した音声の内容を認識する（ステップＳ１０８）。

次に、サーバ１００のＣＰＵ１１０は、「会議参加者名の特定結果」および「音声の内容の認識結果」を音声認識テキスト２３２として出力する（ステップＳ１１０）。なお、ここで、サーバ１００のＣＰＵ１１０は、会議参加者等が切り替わる度に音声認識テキスト２３２を出力してもよいし、会議参加者等の音声の内容の認識結果に応じて（例えば、会議参加者等の音声の内容の認識結果が「。」で区切られる度に）音声認識テキスト２３２を出力してもよい。

次に、サーバ１００のＣＰＵ１１０は、図２〜４に示されるようなＷｅｂページ２３１を作成する。Ｗｅｂページ２３１は、エリア２３１Ａおよびエリア２３１Ｂから構成されている。エリア２３１Ａには議事録２３３が表示され、エリア２３１Ｂにはキーワードによる議事録作成ボタン２３４、ＡＩによる議事録作成ボタン２３５、チェックボックス２３７、音声認識テキスト２３２等が表示される。なお、ここで、エリア２３１Ａは特許請求の範囲に記載の「第２のエリア」に相当し、エリア２３１Ｂは特許請求の範囲に記載の「第１のエリア」に相当する。音声認識テキスト２３２は、時系列順に並べられて表示され、チェックボックス２３７は、各音声認識テキスト２３２の左側に隣接するように配設されている。そして、サーバ１００のＣＰＵ１１０は、サーバ１００の通信インターフェイス１５０を介して、Ｗｅｂページ２３１を端末２００に送信する。そして、端末２００は、Ｗｅｂページ２３１を端末２００のディスプレイ２３０に表示することによって、音声認識テキスト２３２を表示する（ステップＳ１１２）。なお、Ｗｅｂページ２３１ではなく議事録作成用のアプリケーション画面が、サーバ１００のＣＰＵ１１０によって作成され、端末２００のディスプレイ２３０に表示させてもよい。また、Ｗｅｂページ２３１は、端末２００のプロジェクタ２８０によってスクリーンに映し出されて会議参加者に共有される。

次に、議事録２３３の作成を開始する場合（ステップＳ１１４にてＹＥＳである場合）、サーバ１００のＣＰＵ１１０は、サーバ１００の通信インターフェイス１５０を介して端末２００からの議事録作成命令および議事録作成方法の選択結果を受け付け（ステップＳ１１６）、選択された議事録作成方法に基づいて議事録２３３を作成する処理を実行する。なお、議事録２３３を作成する処理は、会議の終了後に実行されてもよいし、会議中に実行されてもよい。

議事録２３３をまだ作成しない場合（ステップＳ１１４にてＮＯである場合）、ステップＳ１０２〜ステップＳ１１２の処理が繰り返される。

−ステップＳ１１８における処理−
図９に示されるように「キーワードによる議事録作成」が選ばれた場合、サーバ１００のＣＰＵ１１０は、キーワード辞書を基に議事録２３３を自動的に作成する。より詳細には、会議参加者等は、図２に示されるように、マウスポインタ２４０Ａを用いて「キーワードによる議事録作成ボタン２３４」を選ぶ（例えば、クリックする）。そして、サーバ１００のＣＰＵ１１０は、サーバ１００の通信インターフェイス１５０を介して端末２００からの議事録作成方法の選択結果を受け付け、会議が始まる前に選択したキーワード辞書に登録されているキーワードが含まれている音声認識テキスト２３２を選択して議事録２３３を自動的に作成する。例えば、キーワード辞書に「売上」「Ｂ社」が登録されている場合、サーバ１００のＣＰＵ１１０は、図２に示されるように、「売上」「Ｂ社」を含んでいる破線で囲まれた音声認識テキスト２３２を自動的に選択する。そして、サーバ１００のＣＰＵ１１０は、図２に示されるように、選択した音声認識テキスト２３２から議事録２３３を自動的に作成する。

−ステップＳ１２０における処理−
図９に示されるように「ＡＩによる議事録作成」が選ばれた場合（サーバ１００のＣＰＵ１１０がステップＳ１２０の処理を実行する場合）、サーバ１００のＣＰＵ１１０は、学習モデルに基づいてＡＩで議事録２３３を自動的に作成する。より詳細には、会議参加者等は、マウスポインタ２４０Ａを用いて「ＡＩによる議事録作成ボタン２３５」を選ぶ（例えば、クリックする）。そして、サーバ１００のＣＰＵ１１０は、サーバ１００の通信インターフェイス１５０を介して端末２００からの議事録作成方法の選択結果を受け付け、会議が始まる前に選択した学習モデルを基に音声認識テキスト２３２を選択して議事録２３３をＡＩで自動的に作成する。

−ステップＳ１２２における処理−
図９に示されるように「ユーザ投票による議事録作成」が選ばれた場合、サーバ１００のＣＰＵ１１０は、会議参加者等の投票を基に議事録２３３を作成する。より詳細には、各会議参加者等は、図３に示されるように、マウスポインタ２４０Ａを用いて自身の名前の欄のチェックボックス２３７を選択することで、議事録２３３に残すべきと判断した音声認識テキスト２３２に投票する。そして、サーバ１００のＣＰＵ１１０は、サーバ１００の通信インターフェイス１５０を介して、各会議参加者等の投票を端末２００から受け付け、第２照合テーブル１２２を参照して重み付け処理を行う。重み付け処理では、例えば、「田中」による投票は３人分の投票とし、「佐藤」による投票は２人分の投票とする。そして、サーバ１００のＣＰＵ１１０は、得票が所定値以上（例えば、３人以上）である音声認識テキスト２３２を選択し、選択した音声認識テキスト２３２から議事録２３３を作成する。また、重み付け係数および得票の所定値は、会議が始まる前にあらかじめ設定されていることが好ましい。なお、自身の名前の欄のチェックボックス２３７を選択した各会議参加者等がマウスポインタ２４０Ａを用いて同じチェックボックス２３７をもう一度選択した場合、議事録２３３に残すべきと判断した音声認識テキスト２３２に対する投票を取り消す処理が行われてもよい。そして、この取り消し処理によってその音声認識テキスト２３２の得票が所定値以上から所定値未満になった場合、議事録２３３に残されていたその音声認識テキスト２３２は議事録２３３から削除されてもよい。

また、サーバ１００のＣＰＵ１１０は、議事録２３３に残すべきと判断された音声認識テキスト２３２において、議事録２３３に残すための投票をした会議参加者等以外の会議参加者等の投票をさらに受け付ける。言い換えれば、サーバ１００のＣＰＵ１１０は、議事録２３３に残すべきと判断された音声認識テキスト２３２において、議事録２３３に残すべきではないと判断する会議参加者等の投票をさらに受け付ける。なお、説明の便宜上、議事録２３３に残すための投票をした会議参加者等を「第１会議参加者等」と称し、議事録２３３に残す投票をした会議参加者等（第１会議参加者等）以外の会議参加者等を「第２会議参加者等」と称する。まず、サーバ１００のＣＰＵ１１０は、例えば、第１会議参加者等の投票によって議事録２３３に残すべきと判断された各音声認識テキスト２３２の側に投票者切換ボタンを表示させる。そして、マウスポインタ２４０Ａを用いて投票者切換ボタンが選ばれると、サーバ１００のＣＰＵ１１０は、その音声認識テキスト２３２において、第２会議参加者等からの投票を受け付ける状態になる。例えば、議事録２３３に残すべきと判断された音声認識テキスト２３２の１つにおいて、「佐藤」および「鈴木」が第１会議参加者等であり、「田中」が第２会議参加者等である場合、「田中」からの投票を受け付ける状態になる。そして、第２会議参加者等は、マウスポインタ２４０Ａを用いて自身の名前の欄のチェックボックス２３７を選択することで、その音声認識テキスト２３２に投票する。そして、サーバ１００のＣＰＵ１１０は、サーバ１００の通信インターフェイス１５０を介して、各第２会議参加者等の投票を端末２００から受け付け、第２照合テーブル１２２を参照して重み付け処理を行う。重み付け処理では、例えば、「田中」による投票は３人分の投票とする。そして、サーバ１００のＣＰＵ１１０は、得票が所定値以上（例えば、３人以上）である音声認識テキスト２３２を議事録２３３に含めないようにする。なお、上述の通り、重み付け係数および得票の所定値は、会議が始まる前にあらかじめ設定されていることが好ましい。

そして、ステップＳ１１８、Ｓ１２０またはＳ１２２のいずれかの処理が終わると、サーバ１００のＣＰＵ１１０は、作成した議事録２３３を表示するためにＷｅｂページ２３１を更新する。そして、端末２００は、Ｗｅｂページ２３１を端末２００のディスプレイ２３０に表示することによって、議事録２３３を表示する（ステップＳ１２４）。

そして、他の議事録作成方法（キーワードによる議事録作成、ＡＩによる議事録作成およびユーザ投票による議事録作成のうち、まだ選ばれていない議事録作成方法）をさらに選ぶ場合（ステップＳ１２６にてＹＥＳである場合）、サーバ１００のＣＰＵ１１０は、ステップＳ１１６からの処理を繰り返す。なお、他の議事録作成方法がさらに選ばれた場合であっても、他の議事録作成方法と先の議事録作成方法との両方によって選択された音声認識テキスト２３２は、重複して議事録２３３に残されない。例えば、先にステップＳ１１６においてキーワード選択が選ばれて、「田中：１週目の売り上げが・・・」という音声認識テキスト２３２が選択されて議事録２３３に残されたとする。そして、次にステップＳ１１６においてＡＩ選択が選ばれて、「田中：１週目の売り上げが・・・」という音声認識テキスト２３２が選択された場合であっても、この音声認識テキスト２３２は重複して議事録２３３に残されない。

他の議事録作成方法をさらに選ばない場合（ステップＳ１２６においてＮＯである場合）、サーバ１００のＣＰＵ１１０は、会議を終了させるための入力情報（例えば、会議参加者等が会議終了ボタン（図示せず）を選んだという情報）を端末２００から受け付けて今回の処理を終了し、会議が継続する場合はステップＳ１０４からの処理を繰り返す。

なお、会議参加者等は、音声認識テキスト２３２が出力された後に、必要に応じて音声認識テキスト２３２の内容の一部または全部を修正することができる。例えば、会議参加者等は、端末２００の操作部２４０等を用いて、Ｗｅｂページ２３１内の音声認識テキスト２３２の内容の一部または全部を選択し、選択した内容の修正指示を行う。サーバ１００のＣＰＵ１１０は、サーバ１００の通信インターフェイス１５０を介して端末２００からの修正指示を受け付け、音声認識テキスト２３２を修正する。そして、サーバ１００のＣＰＵ１１０は、Ｗｅｂページ２３１を更新し、端末２００は、修正内容が反映されたＷｅｂページ２３１を端末２００のディスプレイ２３０に表示する。

なお、会議参加者等は、議事録２３３が作成された後に、必要に応じて議事録２３３の内容の一部または全部を削除することができる。例えば、会議参加者等は、図４に示されるように、マウスポインタ２４０Ａを用いて、Ｗｅｂページ２３１内の議事録２３３の内容の一部または全部を選択し、選択した内容の削除指示を行う。図４では、議事録２３３において「鈴木」が発言した内容の一部である「えーっと」が選択されている。サーバ１００のＣＰＵ１１０は、サーバ１００の通信インターフェイス１５０を介して端末２００からの削除指示を受け付け、選択された内容を削除する。そして、サーバ１００のＣＰＵ１１０は、Ｗｅｂページ２３１を更新する。端末２００は、図４に示されるように、選択された内容の削除が反映されたＷｅｂページ２３１を端末２００のディスプレイ２３０に表示する。

また、例えば、「議事録２３３」と「議事録２３３から削除された内容」との関係性等に基づいて、ＡＩを利用して生成されたモデルを用いて、議事録２３３の内容の一部または全部が自動的に削除されてもよい。

以上の通り、本発明の第１実施形態に係る議事録作成システム１は、全体として、図１０の機能ブロック図に示すように、入力装置２００Ａと、音声認識部１００Ａと、情報処理部１００Ｂと、選択部１００Ｃと、表示部２００Ｂ等を有する。

そして、入力装置２００Ａは、例えば、端末２００の操作部２４０、端末２００のマイク２７０等である。音声認識部１００Ａは、例えば、サーバ１００のＣＰＵ１１０がメモリ１２０のプログラム（図９のステップＳ１０６〜Ｓ１０８等の処理を実行するためのプログラム）を実行することによって実現される。情報処理部１００Ｂは、例えば、サーバ１００のＣＰＵ１１０がメモリ１２０のプログラム（図９のステップＳ１１０〜Ｓ１２２等の処理を実行するためのプログラム）を実行することによって実現される。選択部１００Ｃは、例えば、端末２００の操作部２４０介したキーワード辞書選択命令を受け付けたサーバ１００のＣＰＵ１１０がメモリ１２０のプログラムを実行することによって実現される。表示部２００Ｂは、例えば、端末２００のディスプレイ２３０等である。

＜本発明の第１実施形態に係る議事録作成システム１の特徴＞
（１）
本発明の第１実施形態に係る議事録作成システム１では、サーバ１００のＣＰＵ１１０は、図２〜４に示されるようなＷｅｂページ２３１を作成する。Ｗｅｂページ２３１は、エリア２３１Ａおよびエリア２３１Ｂから構成されている。エリア２３１Ａには議事録２３３が表示され、エリア２３１Ｂには音声認識テキスト２３２が表示される。そして、議事録２３３は、選択された音声認識テキスト２３２の内容から作成されている。このため、この議事録作成システム１では、議事録２３３の閲覧者が会議の要点を容易に把握することができる。また、どの音声認識テキスト２３２が選択されて議事録２３３が作成されているかを確認することができ、議事録２３３に残すべき音声認識テキスト２３２が選択されていないことを見落とさないようにすることができる。

（２）
本発明の第１実施形態に係る議事録作成システム１では、サーバ１００のＣＰＵ１１０は、サーバ１００の通信インターフェイス１５０を介して端末２００からの議事録作成方法の選択結果を受け付け、会議が始まる前に選択したキーワード辞書に登録されているキーワードが含まれている音声認識テキスト２３２を選択して議事録２３３を自動的に作成することができる。このため、この議事録作成システム１では、手間をかけることなく議事録２３３を作成することができる。

（３）
本発明の第１実施形態に係る議事録作成システム１では、サーバ１００のＣＰＵ１１０は、サーバ１００の通信インターフェイス１５０を介して端末２００からの議事録作成方法の選択結果を受け付け、会議が始まる前に選択した学習モデルを基にＡＩで音声認識テキスト２３２を選択して議事録２３３を自動的に作成することができる。このため、本発明の第１実施形態に係る議事録作成システム１では、手間をかけることなく議事録２３３を作成することができる。

（４）
本発明の第１実施形態に係る議事録作成システム１では、サーバ１００のＣＰＵ１１０は、サーバ１００の通信インターフェイス１５０を介して、各第１会議参加者等の投票を端末２００から受け付け、第２照合テーブル１２２を参照して重み付け処理をする。そして、サーバ１００のＣＰＵ１１０は、得票が所定値以上である音声認識テキスト２３２を選択し、選択した音声認識テキスト２３２から議事録２３３を作成する。また、サーバ１００のＣＰＵ１１０は、第１会議参加者等によって議事録２３３に残すべきと判断された音声認識テキスト２３２において、サーバ１００の通信インターフェイス１５０を介して、各第２会議参加者等の投票を端末２００から受け付け、第２照合テーブル１２２を参照して重み付け処理をする。そして、サーバ１００のＣＰＵ１１０は、得票が所定値以上である音声認識テキスト２３２を議事録２３３に含めないようにする。このため、この議事録作成システム１では、影響力のある人物等の意思を反映させやすくすることができると共に、会議中に取得した発言内容のうち不必要な発言内容を除外した（必要な発言内容のみを残した）議事録２３３を作成することができる。

（５）
本発明の第１実施形態に係る議事録作成システム１では、サーバ１００のＣＰＵ１１０は、「取得した音声を発した会議参加者名」および「取得した音声の認識結果」を音声認識テキスト２３２として出力する。そして、この音声認識テキスト２３２から議事録２３３が作成される。このため、この議事録作成システム１では、音声認識テキスト２３２内および議事録２３３内に示された発言がどの会議参加者等による発言であるかを特定することができる。

（６）
本発明の第１実施形態に係る議事録作成システム１では、会議参加者等は、音声認識テキスト２３２が出力された後に、必要に応じて音声認識テキスト２３２の内容の一部または全部を修正することができる。このため、この議事録作成システム１では、音声の認識結果に誤りがある場合、その認識結果を修正することで正しい結果を会議参加者等に伝えることができ、延いては音声の誤った認識結果から議事録２３３が作成されることを防止することができる。

（７）
本発明の第１実施形態に係る議事録作成システム１では、会議参加者等は、議事録２３３が作成された後に、必要に応じて議事録２３３の内容の一部または全部を削除することができる。つまり、議事録２３３に残すべきではない内容（例えば、一定の役職以上の人にのみ共有されている情報、企業秘密情報等）が選択されて議事録２３３として作成されていた場合に、当該内容を削除することができる。このため、この議事録作成システム１では、作成された議事録２３３から情報漏洩等が起きることを防ぐことができる。

＜変形例＞
（Ａ）
本発明の第１実施形態に係る議事録作成システム１のサーバ１００や端末２００等の各装置の役割の一部または全部を他の装置が実行してもよい。例えば、図１０に示される音声認識部１００Ａ、情報処理部１００Ｂおよび選択部１００Ｃが、端末２００や他の装置によって実現されてもよい。あるいは、端末２００のＣＰＵ２１０がメモリ２２０のプログラムを実行することによって、図９に示される処理の一部または全部が実現されてもよい。サーバ１００のＣＰＵ１１０が、端末２００から送信された音声データ受信し、音声の内容を認識して認識結果を音声認識テキスト２３２として出力していたが、例えば、端末２００のＣＰＵ２１０が、音声の内容を認識して認識結果を音声認識テキスト２３２として出力してもよい。かかる場合、端末２００は、端末２００の通信インターフェイス２５０を介して音声認識テキスト２３２をサーバ１００に送信することになる。なお、図９に示される処理の一部または全部を実行するためのプログラムを、端末２００がインターネット等を介してダウンロード可能であることが好ましい。

（Ｂ）
本発明の第１実施形態に係る議事録作成システム１では、サーバ１００のＣＰＵ１１０は、端末２００のマイク２７０の識別情報を第１照合テーブル１２１に照合して、取得した音声を発した会議参加者名を特定していた。しかし、例えば、会議参加者の声紋データをあらかじめサーバ１００のメモリ１２０等に記憶しておき、サーバ１００のＣＰＵ１１０が、取得した音声を声紋データと照合して声紋認証を行い、取得した音声を発した会議参加者名（マイク２７０の使用者名）を認識してもよい。

（Ｃ）
本発明の第１実施形態に係る議事録作成システム１では、サーバ１００のＣＰＵ１１０は、サーバ１００の通信インターフェイス１５０を介して端末２００からの議事録作成方法の選択結果を受け付け、選択された議事録作成方法に基づいて議事録２３３を作成する処理を実行していた。しかし、サーバ１００のＣＰＵ１１０は、取得した音声の音量を認識し、その音声の音量が所定値以上である場合にその音声の内容を議事録２３３に含めてもよい。

（Ｄ）
本発明の第１実施形態に係る議事録作成システム１では、ステップＳ１１６にて「ユーザ投票による議事録作成」が選ばれた場合、サーバ１００のＣＰＵ１１０は、サーバ１００の通信インターフェイス１５０を介して、各会議参加者等の投票を端末２００から受け付け、重み付け処理をしていた。しかし、サーバ１００のＣＰＵ１１０は、各会議参加者等の投票を受け付けても、重み付け処理をしなくてもよい。

（Ｅ）
本発明の第１実施形態に係る議事録作成システム１では、ステップＳ１１６にて「ユーザ投票による議事録作成」が選ばれた場合、各会議参加者等が、図３に示されるように、マウスポインタ２４０Ａを用いて自身の名前の欄のチェックボックス２３７を選択することで、議事録２３３に残すべきと判断した音声認識テキスト２３２に投票していた。しかし、会議参加者等のうち権限のある者を１人選任し、権限のある者のみが、議事録２３３に残すべきと判断した音声認識テキスト２３２を選択してもよい。かかる場合、図１２に示されるように、各音声認識テキスト２３２の左側に隣接するようにラジオボタン２３６が配設され、権限のある者は、ラジオボタン２３６を選択することで、議事録２３３に残すべきと判断した音声認識テキスト２３２を選択して議事録２３３を作成するとよい。なお、各音声認識テキスト２３２の左側にラジオボタン２３６およびチェックボックス２３７が配設され、「権限のある者のみがラジオボタン２３６を選択する方法」および「各会議参加者等がチェックボックス２３７を選択する方法」の両方によって議事録２３３として残す音声認識テキスト２３２が決められてもよい。例えば、ある音声認識テキスト２３２において各会議参加者等がチェックボックス２３７を選択して投票していない場合、権限のある者がラジオボタン２３６を選択すればその音声認識テキスト２３２は議事録２３３として残される。また、ある音声認識テキスト２３２において各会議参加者等がチェックボックス２３７を選択して投票している場合、その投票による得票が所定値以上であるか所定値未満であるかにかかわらず、権限のある者がラジオボタン２３６を選択すればその音声認識テキスト２３２は議事録２３３として残される。また、ある音声認識テキスト２３２において権限のある者がラジオボタン２３６を選択していない場合、各会議参加者がチェックボックス２３７を選択して投票し、その投票による得票が所定値以上であればその音声認識テキスト２３２は議事録２３３として残される。また、権限のある者は、議事録２３３に残すべきと判断した音声認識テキスト２３２を議事録２３３にドラッグアンドドロップすることで議事録２３３を作成してもよい。

（Ｆ）
本発明の第１実施形態に係る議事録作成システム１では、会議参加者等は、図４に示されるように、マウスポインタ２４０Ａを用いて、Ｗｅｂページ２３１内の議事録２３３の内容の一部または全部を選択し、選択した内容の削除指示を行っていた。そして、サーバ１００のＣＰＵ１１０は、サーバ１００の通信インターフェイス１５０を介して端末２００からの削除指示を受け付け、選択された内容を削除していた。しかし、サーバ１００のＣＰＵ１１０は、選択された内容の削除の可否を投票によって受け付けてもよい。そして、サーバ１００のＣＰＵ１１０は、得票が所定値以上である場合、選択された内容を削除する。なお、サーバ１００のＣＰＵ１１０は、投票受け付けた際に、所定の重み係数に従って各投票を重み付け処理してもよい。

（Ｇ）
本発明の第１実施形態に係る議事録作成システム１において、会議参加者等の話し方の癖、会議参加者等の方言、会議の議題、企業内や業界内でのみで使用される用語（例えば、社内用語、業界用語等）等に対応した音声認識を行うための音声認識辞書がサーバ１００のメモリ１２０に記憶されてもよい。かかる場合、サーバ１００のＣＰＵ１１０は、ＡＩによる学習を利用することによって、音声認識辞書を基に、取得した音声の内容を認識する。これによって、取得した音声の内容の認識結果の精度を向上させることができる。

（Ｈ）
本発明の第１実施形態に係る議事録作成システム１において、企業内や業界内のみで使用される用語を一般的な用語に変換するための変換辞書がサーバ１００のメモリ１２０に記憶されてもよい。これによって、企業内や業界内のみで使用される用語を知らない者が議事録２３３を閲覧しても会議の内容を理解することができ、変形例（Ｉ）に記載の翻訳処理時に翻訳結果の精度を向上させることができる。

（Ｉ）
本発明の第１実施形態に係る議事録作成システム１は、多言語（少なくとも２つ以上の言語）が用いられる場合であっても適用することができる。まず、会議参加者が発した音声の言語で出力された音声認識テキスト２３２が、１つのＷｅｂページ２３１内のエリア２３１Ｂに表示される。次に、音声認識テキスト２３２が、会議参加者が発した音声の言語以外の１または複数の言語に翻訳され、翻訳結果が、会議参加者が発した音声の言語以外の言語毎に翻訳テキストとして出力される。そして、会議参加者が発した音声の言語以外の言語毎にＷｅｂページ２３１が作成されて、各Ｗｅｂページ２３１内のエリア２３１Ｂに各翻訳テキストが表示される。つまり、会議で用いられる言語の数だけＷｅｂページ２３１が作成されて、各Ｗｅｂページ２３１が端末２００に並べられて表示されることになる。このため、会議参加者等は、多言語による会議であっても、各会議参加者等の言語で議事録２３３を確認することができる。なお、音声認識テキスト２３２を取得した音声以外の言語に翻訳する処理は、サーバ１００のＣＰＵ１１０によって行われるとよい。かかる場合、会議参加者等は、使用されるマイク毎にそのマイクの使用者名に加えてそのマイクの使用者の言語等を格納した照合テーブル（図示せず）を会議前に作成しておくとよい。これによって、会議参加者が発した音声の言語（例えば、日本語）を認識することができると共に、会議参加者が発した音声の言語を他のどの言語（例えば、英語、中国語等）に翻訳するかを認識することができる。

また、かかる場合、会議参加者等は、翻訳テキストの内容の一部または全部を必要に応じて修正してもよい。例えば、会議参加者等は、端末２００の操作部２４０等を用いて、翻訳テキストの一部または全部を選択し、選択した内容の修正指示を行う。サーバ１００のＣＰＵ１１０は、サーバ１００の通信インターフェイス１５０を介して端末２００からの修正指示を受け付け、翻訳テキストを修正する。これによって、誤った翻訳結果から議事録２３３が作成されることを防止することができる。

さらに、かかる場合、サーバ１００のメモリ１２０は、会議の議題に適した翻訳を行うための翻訳辞書（用語、対訳データ、文章データ等）を記憶してもよい。翻訳辞書は、例えば、化学分野における専門用語に重点を置いたもの、企業や業界における専門用語重点を置いたもの等である。なお、翻訳辞書内の用語は、随時追加および変更されてメモリ１２０に記憶されてもよいし、新しい翻訳辞書が追加されてメモリ１２０に記憶されてもよい。そして、会議参加者等は、会議が始まる前に、会議の議題に適した翻訳を行うための翻訳辞書の選択を行うことになる。かかる場合、ＡＩを利用することによって、選択された翻訳辞書を基に、翻訳処理が実行される。なお、会議参加者等は、１つの翻訳辞書だけを選択してもよいし、複数の翻訳辞書を選択してもよい。会議参加者等は、複数の翻訳辞書を選択する場合に翻訳辞書毎に優先度を設定してもよく、設定された優先度の順に翻訳処理が実行される。また、会議参加者等は、会議中であっても会議の議題が変更される場合に、翻訳辞書を切り換えるために改めて翻訳辞書の選択を行ってもよい。

（Ｊ）
第１実施形態に係る議事録作成システム１において、サーバ１００のＣＰＵ１１０は、作成された議事録２３３から音声合成により音声データを生成してもよい。これによって、会議参加者等は、端末２００（例えば、パーソナルコンピュータやタブレット端末やスマートフォン）のスピーカ２６０やデジタルオーディオプレーヤー等から出力される音声を聞くことで、視覚で確認しなくても会議の内容を把握することができる。

（Ｋ）
第１実施形態に係る議事録作成システム１において、サーバ１００のＣＰＵ１１０は、議事録２３３に残すべきと判断された音声認識テキスト２３２において、「議事録２３３に残すための投票をした会議参加者等以外の会議参加者等の投票」をさらに受け付けていた。そして、サーバ１００のＣＰＵ１１０は、その投票による得票が所定値以上である音声認識テキスト２３２を議事録２３３に含めないようにしていた。しかし、サーバ１００のＣＰＵ１１０は、「議事録２３３に残すための投票をした会議参加者等以外の会議参加者等の投票」だけでなく、「議事録２３３に残すための投票をした会議参加者等の投票」も受け付けてもよい。これは、一度は議事録２３３に残すための投票をしたが議事録２３３に残すべきではないという考えに変わった会議参加者等からの投票を受け付けるためである。

−第２実施形態−
上記の第１実施形態に係る議事録作成システム１は、１つの会議室において会議が行われる場合に使用されるものであった。しかし、上記の技術は、例えば、図１１に示されるようなウェブ会議が行われる場合であっても適用することができる。ただし、本発明の第２実施形態に係る議事録作成システム２において、端末２００は、各会議参加者に１つずつ用意されており、プロジェクタ２８０を含まなくてもよい。本発明の第２実施形態に係る議事録作成システム２において、図１１に示される各端末２００が、上記の第１実施形態に係る議事録作成システム１にて説明したＷｅｂページ２３１を表示する。

なお、第２実施形態に係る議事録作成システム２において、上記の変形例（Ａ）〜（Ｋ）が適用されてもよい。ただし、変形例（Ｉ）が適用される場合、会議参加者等が使用している各端末２００は、会議で用いられる言語の数だけ作成されたＷｅｂページ２３１を並べて表示しなくてもよく、１つのＷｅｂページ２３１だけを表示するとよい。例えば、「日本語」を話す会議参加者等が使用している端末２００には、「日本語」による自身の音声認識テキスト２３２と、「日本語以外の言語（例えば、英語）」を話す会議参加者の音声認識テキスト２３２を「日本語」に翻訳した翻訳テキストとが表示されたＷｅｂページ２３１が表示されればよい。

さらに、変形例（Ｉ）が適用される場合、音声認識テキスト２３２または翻訳テキストの内容の一部または全部が修正されている際、修正中であることが各端末２００に表示されてもよい。例えば、音声認識テキスト２３２または翻訳テキストの内容の一部または全部が修正されている際、「修正されている音声認識テキスト２３２に対応する翻訳テキスト」または「修正されている翻訳テキストに対応する音声認識テキスト２３２または翻訳テキスト」の横に通知マークが表示されるとよい。そして、修正が完了すると、通知マークが表示されなくなるとよい。

１００：サーバ
１１０：ＣＰＵ（音声認識部、情報処理部、選択部）
１００Ａ：音声認識部
１００Ｂ：情報処理部
１００Ｃ：選択部
２００：端末
２００Ａ：入力装置
２００Ｂ：表示部
２３０：ディスプレイ（表示部）
２３２：音声認識テキスト
２３３：議事録
２７０：マイク

Claims

マイクで取得した音声を認識する音声認識部と、
前記音声の認識結果を音声認識テキストとして出力し、前記音声認識テキスト内で選択した内容から議事録を作成する情報処理部と
を備え、
前記情報処理部は、前記音声認識テキスト内の内容毎に１または複数のユーザによる第１投票を受け付け、前記ユーザの第１投票によって所定値以上の得票を獲得した内容を選択して前記議事録を作成する、
議事録作成システム。
前記音声認識テキストを第１のエリアに表示し、前記議事録を第２のエリアに表示する表示部をさらに備える、
請求項１に記載の議事録作成システム。
前記情報処理部は、前記音声認識テキスト内の内容毎に前記ユーザの第１投票を受け付けて重み付けをし、重み付けされた前記ユーザの投票による得票が所定値以上である内容を選択して前記議事録を作成する、
請求項１または２に記載の議事録作成システム。
前記情報処理部は、前記ユーザの第１投票によって所定値以上の得票を獲得した内容毎に前記ユーザによる第２投票をさらに受け付け、前記ユーザの第２投票によって所定値以上の得票を獲得した内容を前記議事録に含めない、
請求項１から３のいずれか１項に記載の議事録作成システム。
前記情報処理部は、前記ユーザの第１投票によって所定値以上の得票を獲得した内容毎に前記ユーザの第２投票を受け付けて重み付けをし、重み付けされた前記ユーザの投票による得票が所定値以上である内容を前記議事録に含めない、
請求項４に記載の議事録作成システム。
前記情報処理部は、前記音声認識テキストと前記議事録との関係性に基づく学習により生成されたモデルを用いて前記音声認識テキスト内の内容を選択して前記議事録を作成する、
請求項１から５のいずれか１項に記載の議事録作成システム。
キーワードをあらかじめ登録したキーワード辞書の選択をする選択部をさらに備え、
前記情報処理部は、前記選択部で選択されたキーワード辞書に登録されたキーワードが含まれている前記音声認識テキスト内の内容を選択して前記議事録を作成する、
請求項１から６のいずれか１項に記載の議事録作成システム。
前記音声認識部は、前記音声の音量を認識し、
前記情報処理部は、前記音量が閾値以上であった前記音声認識テキスト内の内容を選択して前記議事録を作成することができる、
請求項１から７のいずれか１項に記載の議事録作成システム。
前記音声認識部は、認識した前記音声がいずれの話者から発せられたかを特定し、
前記情報処理部は、前記話者の名前を付して前記音声の認識結果を音声認識テキストとして出力する、
請求項１から８のいずれか１項に記載の議事録作成システム。
前記情報処理部は、前記音声認識テキストおよび前記議事録を前記音声の言語以外の言語に翻訳することが可能である、
請求項１から９のいずれか１項に記載の議事録作成システム。
前記情報処理部は、ＡＩ（Artificial Intelligence）を利用して生成された機械学習モデルを用いて、翻訳辞書を基に、前記音声認識テキストおよび前記議事録を前記音声の言語以外の言語に翻訳することが可能である、
請求項１０に記載の議事録作成システム。
前記情報処理部は、前記議事録における前記音声認識テキスト内の内容を選択して前記議事録から削除することができる、
請求項１から１１のいずれか１項に記載の議事録作成システム。
前記情報処理部は、ＡＩを利用して生成された機械学習モデルを用いて、前記議事録における前記音声認識テキスト内の内容を選択して前記議事録から削除することができる、
請求項１２に記載の議事録作成システム。
前記情報処理部は、前記議事録から音声データを生成することができる、
請求項１から１３のいずれか１項に記載の議事録作成システム。
前記音声認識部は、ＡＩを利用して生成された機械学習モデルを用いて、音声認識辞書を基に、前記音声を認識する、
請求項１から１４のいずれか１項に記載の議事録作成システム。
前記情報処理部は、ＡＩを利用して生成された機械学習モデルを用いて、変換辞書を基に、前記音声認識テキスト内の第１用語を第２用語に変換する、
請求項１から１５のいずれか１項に記載の議事録作成システム。