JP7172299B2 - 情報処理装置、情報処理方法、プログラムおよび情報処理システム - Google Patents
情報処理装置、情報処理方法、プログラムおよび情報処理システム Download PDFInfo
- Publication number
- JP7172299B2 JP7172299B2 JP2018162690A JP2018162690A JP7172299B2 JP 7172299 B2 JP7172299 B2 JP 7172299B2 JP 2018162690 A JP2018162690 A JP 2018162690A JP 2018162690 A JP2018162690 A JP 2018162690A JP 7172299 B2 JP7172299 B2 JP 7172299B2
- Authority
- JP
- Japan
- Prior art keywords
- person
- name
- voiceprint information
- utterance
- database
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明の実施形態は、複数の人物の間で行われるコミュニケーションの記録を自動で作成するための情報処理システムに関する。複数の人物の間でコミュニケーションが行われる場としては、例えば、対面の会議、座談会、TV会議およびTV電話などが挙げられる。以下では、情報処理システムとして、対面の会議でのコミュニケーションの記録である議事録を自動で作成するための議事録作成システムについて説明を進める。
議事録表示装置10は、議事録作成サーバ20が生成した議事録画面を表示する。例えば、議事録表示装置10は、会議が行われる空間に配置され、議事録画面は会議の進行と共にリアルタイムで更新される。このため、会議の参加者は、議事録画面でそれまでの発言を確認しながら議論を進めることが可能である。ただし、本発明の実施形態は、会議後の議事録作成にも適用可能である。以下、図2を参照し、議事録画面の具体例を説明する。
議事録作成サーバ20は、上述した議事録画面を生成する情報処理装置である。議事録作成サーバ20は、会議の音声データに基づき、音声認識サーバ30、AIサーバ40、声紋認証サーバ50および声紋情報サーバ60と協働して議事録画面を生成する。議事録作成サーバ20の構成および動作は図4以降を参照して詳細に説明する。
音声認識サーバ30は、音声データを認識し、音声データの内容を表現するテキストデータを生成する。例えば、音声認識サーバ30は、議事録作成サーバ20から会議の音声データを受信し、会議の音声データの内容を表現するテキストデータを生成し、当該テキストデータを議事録作成サーバ20に送信する。なお、音声認識サーバ30は、音声データの無音区間の存在により音声データを区分し、音声データの区分ごとにテキストデータを生成してもよい。
AIサーバ40は、テキストデータから人物名を抽出する。例えば、AIサーバ40は、議事録作成サーバ20からテキストデータを受信し、テキストデータから人物名を抽出し、当該人物名を議事録作成サーバ20に送信する。さらに、AIサーバ40は、テキストデータが人物紹介の意味を有するテキストデータであるか否かを識別し、識別の結果を議事録作成サーバ20に送信してもよい。
声紋認証サーバ50は、音声データから声紋情報を取得する。例えば、声紋認証サーバ50は、議事録作成サーバ20から会議の音声データを受信し、会議の音声データの声紋情報を取得し、当該声紋情報を議事録作成サーバ20に送信する。
声紋情報サーバ60は、人物名と声紋情報を関連付けて格納するデータベース62を有する。データベース62は、図3に示すように、複数の人物名(例えば、人物名A、人物名B)の各々に、当該人物名を有する人物の声紋情報(例えば、声紋情報A、声紋情報B)を関連付けて格納する。なお、声紋情報は人物に応じて一意である。
上述したデータベース62に会議の全ての出席者の人物名および声紋情報が事前に格納されていれば、当該データベース62を用いて各発言と人物との紐付けを行い得る。しかし、会議前に意図的に人物名および声紋情報を登録する作業を行うことは手間である。
図4は、本発明の実施形態による議事録作成サーバ20の構成を示す説明図である。図4に示したように、表示部220、通信部230、メモリ部240、データ蓄積部250および制御部260を有する。
表示部220は、議事録作成サーバ20のコンソール機能のために用いられる画面を表示する。
通信部230は、他の装置とのインタフェースであり、他の装置と多様な情報を通信する。例えば、通信部230は、議事録表示装置10から会議の音声データを受信する。また、通信部230は、当該音声データを音声認識サーバ30に送信し、音声認識サーバ30から音声データの内容を表現するテキストデータを受信する。また、通信部230は、当該テキストデータをAIサーバ40に送信し、AIサーバ40から当該テキストデータに含まれる人物名を取得する人物名取得部としての機能を有する。また、通信部230は、音声データを声紋認証サーバ50に送信し、声紋認証サーバ50から音声データの声紋情報を受信する声紋情報取得部としての機能も有する。
メモリ部240は、データ蓄積部250に蓄積されたデータを読み込み、演算処理に当該データを利用するために当該データを一時的に格納する。
データ蓄積部250は、会議中に取得されたテキストデータおよび声紋情報などのデータを蓄積する。
制御部260は、議事録作成サーバ20の動作全般を制御する。例えば、制御部260は、通信部230と他の装置との通信を制御する。また、制御部260は、図2を参照して説明した議事録画面を生成する。具体的には、制御部260は、手動で入力された議事録のタイトルをタイトル表示領域71に配置する。また、制御部260は、音声認識サーバ30により順次に取得されるテキストデータを順次に議事録表示領域72に配置する。また、制御部260は、声紋認証サーバ50により取得された1の発言の声紋情報がデータベース62において人物名と関連付けて格納されている場合、発言者表示領域73において当該発言を示すテキストデータと同じ行に当該人物名を配置する。また、制御部260は、発言者表示領域73に配置した人物名の一覧、すなわち、それまでに発言があった人物の人物名の一覧を出席者一覧表示領域74に配置する。
以上、本発明の実施形態による議事録作成サーバ20の構成を説明した。続いて、図7を参照し、声紋情報がデータベース62に格納されていない発言を行った人物の人物名を特定するための、本発明の実施形態による議事録作成サーバ20の動作を整理する。
以上説明した本発明の実施形態によれば、人物名と声紋情報の関連付けを事前に行わなくても会議での発言を行った人物を特定し得るので、人物名と声紋情報の関連付けのための作業負荷を軽減することが可能である。また、自己紹介の発言に含まれる人物名と、当該発言から得られる声紋情報を関連付けてデータベースに登録する技術と比較して、本発明の実施形態は、自己紹介において発言者が自分の名前を言わない場合にも人物名と声紋情報の関連付けを実現し得るという利点を有する。
以上、本発明の各実施形態を説明した。上述した議事録画面の生成およびデータベース62の管理などの情報処理は、ソフトウェアと、以下に説明する議事録作成サーバ20のハードウェアとの協働により実現される。
以上、添付図面を参照しながら本発明の好適な実施形態について詳細に説明したが、本発明はかかる例に限定されない。本発明の属する技術の分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本発明の技術的範囲に属するものと了解される。
20 議事録作成サーバ
30 音声認識サーバ
40 AIサーバ
50 声紋認証サーバ
60 声紋情報サーバ
62 データベース
220 表示部
230 通信部
240 メモリ部
250 データ蓄積部
260 制御部
Claims (10)
- 第1の発言の内容を示すテキストデータに含まれる人物名を取得する人物名取得部と、
前記第1の発言の後に行われた第2の発言の声紋情報を取得する声紋情報取得部と、
前記人物名取得部により取得された人物名と、前記声紋情報取得部により取得された声紋情報を関連付けてデータベースに格納する制御部と、
を備え、
前記制御部は、前記人物名取得部により取得された人物名と、前記第2の発言のうちで、声紋情報が前記データベースに人物名と関連付けて格納されていない発言であって、かつ、最先である発言の声紋情報と、を関連付けてデータベースに格納する、情報処理装置。 - 前記制御部は、前記声紋情報取得部により取得された声紋情報に対応する声紋情報が前記データベースに人物名と関連付けて格納されていないことに基づき、前記人物名取得部により取得された人物名と、前記声紋情報取得部により取得された声紋情報を関連付けてデータベースに格納する、請求項1に記載の情報処理装置。
- 前記制御部は、前記第1の発言の後に行われた前記第2の発言を含む所定数の発言の範囲内で、前記声紋情報取得部により取得された声紋情報に対応する声紋情報が前記データベースに名前情報と関連付けて格納されているか否かを判定し、判定の結果に応じて前記人物名および前記声紋情報の前記データベースへの格納を制御する、請求項2に記載の情報処理装置。
- 前記人物名取得部により複数の人物名が取得された場合、前記制御部は、前記第1の発言において前記複数の人物名が現れた順序、および前記声紋情報取得部により前記データベースに人物名と関連付けて格納されていない声紋情報が取得された発言の順序に従って、前記人物名および前記声紋情報の前記データベースへの格納を制御する、請求項1に記載の情報処理装置。
- 前記制御部は、前記第1の発言および前記第2の発言を含む複数の発言のテキストデータ、および各発言の発言者の人物名を含む表示画面を生成し、
前記制御部は、前記各発言の発言者の人物名には、前記各発言の声紋情報に関連付けて前記データベースに関連付けて格納されている人物名を用いる、請求項1~4のいずれか一項に記載の情報処理装置。 - 前記制御部は、前記表示画面に、発言があった人物の人物名の一覧を配置する、請求項5に記載の情報処理装置。
- 前記第1の発言は、人物を紹介する意味を有する発言である、請求項1~6のいずれか一項に記載の情報処理装置。
- 第1の発言の内容を示すテキストデータに含まれる人物名を取得することと、
前記第1の発言の後に行われた第2の発言の声紋情報を取得することと、
取得された人物名と、取得された声紋情報を関連付けてデータベースに格納することと、
を含み、
前記格納することは、前記取得された人物名と、前記第2の発言のうちで、声紋情報が前記データベースに人物名と関連付けて格納されていない発言であって、かつ、最先である発言の声紋情報と、を関連付けてデータベースに格納することを含む、情報処理方法。 - コンピュータを、
第1の発言の内容を示すテキストデータに含まれる人物名を取得する人物名取得部と、
前記第1の発言の後に行われた第2の発言の声紋情報を取得する声紋情報取得部と、
前記人物名取得部により取得された人物名と、前記声紋情報取得部により取得された声紋情報を関連付けてデータベースに格納する制御部と、
を備え、
前記制御部は、前記人物名取得部により取得された人物名と、前記第2の発言のうちで、声紋情報が前記データベースに人物名と関連付けて格納されていない発言であって、かつ、最先である発言の声紋情報と、を関連付けてデータベースに格納する、情報処理装置として機能させるための、プログラム。 - 第1の発言の内容を示すテキストデータに含まれる人物名を取得する人物名取得部と、
前記第1の発言の後に行われた第2の発言の声紋情報を取得する声紋情報取得部と、
前記人物名取得部により取得された人物名と、前記声紋情報取得部により取得された声紋情報を関連付けてデータベースに格納する制御部と、
を備え、
前記制御部は、前記人物名取得部により取得された人物名と、前記第2の発言のうちで、声紋情報が前記データベースに人物名と関連付けて格納されていない発言であって、かつ、最先である発言の声紋情報と、を関連付けてデータベースに格納する、情報処理システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018162690A JP7172299B2 (ja) | 2018-08-31 | 2018-08-31 | 情報処理装置、情報処理方法、プログラムおよび情報処理システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018162690A JP7172299B2 (ja) | 2018-08-31 | 2018-08-31 | 情報処理装置、情報処理方法、プログラムおよび情報処理システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020035292A JP2020035292A (ja) | 2020-03-05 |
JP7172299B2 true JP7172299B2 (ja) | 2022-11-16 |
Family
ID=69668250
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018162690A Active JP7172299B2 (ja) | 2018-08-31 | 2018-08-31 | 情報処理装置、情報処理方法、プログラムおよび情報処理システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7172299B2 (ja) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010060850A (ja) | 2008-09-04 | 2010-03-18 | Nec Corp | 議事録作成支援装置、議事録作成支援方法、議事録作成支援用プログラム及び議事録作成支援システム |
JP2014236228A (ja) | 2013-05-30 | 2014-12-15 | 株式会社Nttドコモ | 人物情報登録装置及びプログラム |
JP2016156993A (ja) | 2015-02-25 | 2016-09-01 | シャープ株式会社 | 情報処理装置、情報処理装置の制御方法、制御プログラム、記録媒体 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3879786B2 (ja) * | 1997-08-05 | 2007-02-14 | 富士ゼロックス株式会社 | 会議情報記録再生装置および会議情報記録再生方法 |
US8515025B1 (en) * | 2012-08-30 | 2013-08-20 | Google Inc. | Conference call voice-to-name matching |
-
2018
- 2018-08-31 JP JP2018162690A patent/JP7172299B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010060850A (ja) | 2008-09-04 | 2010-03-18 | Nec Corp | 議事録作成支援装置、議事録作成支援方法、議事録作成支援用プログラム及び議事録作成支援システム |
JP2014236228A (ja) | 2013-05-30 | 2014-12-15 | 株式会社Nttドコモ | 人物情報登録装置及びプログラム |
JP2016156993A (ja) | 2015-02-25 | 2016-09-01 | シャープ株式会社 | 情報処理装置、情報処理装置の制御方法、制御プログラム、記録媒体 |
Also Published As
Publication number | Publication date |
---|---|
JP2020035292A (ja) | 2020-03-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI536365B (zh) | 聲紋辨識 | |
US10930300B2 (en) | Automated transcript generation from multi-channel audio | |
US9256860B2 (en) | Tracking participation in a shared media session | |
JP5201050B2 (ja) | 会議支援装置、会議支援方法、会議システム、会議支援プログラム | |
US9917756B2 (en) | Systems and methods for visualizing a call over network with a caller readiness dialog box | |
JP2006208482A (ja) | 会議の活性化を支援する装置,方法,プログラム及び記録媒体 | |
TWI590240B (zh) | 會議記錄裝置及其自動生成會議記錄的方法 | |
JP2013222347A (ja) | 議事録生成装置及び議事録生成方法 | |
JP2006301223A (ja) | 音声認識システム及び音声認識プログラム | |
US20190171760A1 (en) | System, summarization apparatus, summarization system, and method of controlling summarization apparatus, for acquiring summary information | |
WO2016187910A1 (zh) | 一种语音文字的转换方法及设备、存储介质 | |
CN115735357A (zh) | 用于电话会议讨论的投票问题 | |
KR20170126667A (ko) | 회의 기록 자동 생성 방법 및 그 장치 | |
US8868419B2 (en) | Generalizing text content summary from speech content | |
JP2016102920A (ja) | 文書記録システム及び文書記録プログラム | |
JP2006345250A (ja) | 発言者決定方法 | |
KR20160108874A (ko) | 대화록 자동 생성 방법 및 장치 | |
CN112634879B (zh) | 语音会议管理方法、装置、设备及介质 | |
JP2005202035A (ja) | 対話情報分析装置 | |
JP7172299B2 (ja) | 情報処理装置、情報処理方法、プログラムおよび情報処理システム | |
US8775163B1 (en) | Selectable silent mode for real-time audio communication system | |
JP6950708B2 (ja) | 情報処理装置、情報処理方法、および情報処理システム | |
JP2006251042A (ja) | 情報処理装置、情報処理方法およびプログラム | |
JP5892598B2 (ja) | 音声文字変換作業支援装置、音声文字変換システム、音声文字変換作業支援方法及びプログラム | |
US20230066829A1 (en) | Server device, conference assistance system, and conference assistance method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20190327 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20190328 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210507 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220308 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220412 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220601 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20221004 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20221017 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7172299 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |