JP6716300B2 - 議事録生成装置、及び議事録生成プログラム - Google Patents
議事録生成装置、及び議事録生成プログラム Download PDFInfo
- Publication number
- JP6716300B2 JP6716300B2 JP2016052216A JP2016052216A JP6716300B2 JP 6716300 B2 JP6716300 B2 JP 6716300B2 JP 2016052216 A JP2016052216 A JP 2016052216A JP 2016052216 A JP2016052216 A JP 2016052216A JP 6716300 B2 JP6716300 B2 JP 6716300B2
- Authority
- JP
- Japan
- Prior art keywords
- voice
- minutes
- data
- time axis
- voice data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Description
以下、図1を参照して、本実施形態に係る議事録生成システムの構成について説明する。
次に、図7〜図9を参照して、第2の実施形態に係る議事録生成システムについて説明する。
次に、図10を参照して、第3の実施形態に係る議事録生成システムについて説明する。
本発明は、上記実施形態に限らず、種々に変形態様が考えられる。
本明細書および添付図面の記載によって、少なくとも以下の事項が明らかとなる。
D1〜D3 音声データ
10 議事録生成装置
11 記憶部
12 取得部
13 時間軸調整部
14 選択部
15 合成部
16 音声認識部
17 議事録生成部
20 閲覧・編集端末
Claims (9)
- 同一の音空間に配置された複数の音声入力装置で個別に生成された複数の音声データを用いて、前記音空間において行われた会話の議事録を生成する議事録生成装置であって、
前記複数の音声データのそれぞれが示す音声波形に基づいて、前記複数の音声データのそれぞれの時間軸を共通の時間軸に対応付ける時間軸調整部と、
前記複数の音声データのそれぞれに対して、当該音声データが示す音声レベルに基づいて発話区間を検出する選択部と、
前記複数の音声データのそれぞれにおいて検出された前記発話区間に対して音声認識処理を行う音声認識部と、
前記音声認識処理により得られたテキストデータを前記共通の時間軸に沿って並べることにより、前記議事録を生成する議事録生成部と、を備え、
前記時間軸調整部は、前記複数の音声データから、同一の音源から同一のタイミングで出力された音声に対応する共通部分を検出し、検出された前記共通部分が前記共通の時間軸上で同一の位置となるように、前記複数の音声データの時間軸を前記共通の時間軸に対応付ける、
議事録生成装置。 - 同一の音空間に配置された複数の音声入力装置で個別に生成された複数の音声データを用いて、前記音空間において行われた会話の議事録を生成する議事録生成装置であって、
前記複数の音声データのそれぞれが示す音声波形に基づいて、前記複数の音声データのそれぞれの時間軸を共通の時間軸に対応付ける時間軸調整部と、
前記複数の音声データのそれぞれに対して、当該音声データが示す音声レベルに基づいて発話区間を検出する選択部と、
前記複数の音声データのそれぞれにおいて検出された前記発話区間を、前記共通の時間軸において合成して合成音声データを生成する合成部と、
前記合成音声データの前記発話区間に対して音声認識処理を行う音声認識部と、
前記音声認識処理により得られたテキストデータを前記共通の時間軸に沿って並べることにより、前記議事録を生成する議事録生成部と、
を備える、
議事録生成装置。 - 前記選択部は、
前記共通の時間軸上の同一時刻において1つの発話音声のみが検出されたとき、当該1つの発話区間を選択し、前記共通の時間軸上の同一時刻において複数の発話音声が検出されたとき、当該複数の発話区間を比較することにより当該複数の発話区間の中から1つを選択し、
前記議事録生成部は、
選択された前記発話区間の前記テキストデータに基づいて、前記議事録を生成する、
請求項1又は2に記載の議事録生成装置。 - 前記時間軸調整部は、
前記複数の音声データのそれぞれから、前記音声データが示す波形の波高値が閾値よりも大きい部分を、前記共通部分として検出する、
請求項1に記載の議事録生成装置。 - 前記時間軸調整部は、
第1の前記音声データに含まれる音声波形を、第2の前記音声データで探索することにより、前記共通部分を検出する、
請求項1に記載の議事録生成装置。 - 前記議事録生成部は、
前記発話区間ごとに、前記テキストデータと元の前記音声データの識別情報とを対応づけて表示する、議事録画面を生成して出力する、
請求項1又は2に記載の議事録生成装置。 - 前記音声認識部は、
話者モデルに基づいて、前記音声データが示す波形から音声認識の対象となる話者を特定して前記音声認識を行い、
前記議事録生成部は、
特定された話者の識別情報を前記テキストデータに対応付けて表示する、前記議事録画面を生成する、
請求項6に記載の議事録生成装置。 - 同一の音空間に配置された複数の音声入力装置で個別に生成された複数の音声データを用いて、前記音空間において行われた会話の議事録を生成するための議事録生成プログラムであって、
コンピュータに、
前記複数の音声データのそれぞれが示す音声波形に基づいて、前記複数の音声データのそれぞれの時間軸を共通の時間軸に対応付ける第1処理と、
前記複数の音声データのそれぞれに対して、当該音声データが示す音声レベルに基づいて発話区間を検出する第2処理と、
前記複数の音声データのそれぞれにおいて検出された前記発話区間に対して音声認識処理を行う第3処理と、
前記音声認識処理により得られたテキストデータを前記共通の時間軸に沿って並べることにより、前記議事録を生成する第4処理と、を実行させる、
議事録生成プログラムであって、
前記第1処理では、前記複数の音声データから、同一の音源から同一のタイミングで出力された音声に対応する共通部分を検出し、検出された前記共通部分が前記共通の時間軸上で同一の位置となるように、前記複数の音声データの時間軸を前記共通の時間軸に対応付ける、
議事録生成プログラム。 - 同一の音空間に配置された複数の音声入力装置で個別に生成された複数の音声データを用いて、前記音空間において行われた会話の議事録を生成するための議事録生成プログラムであって、
コンピュータに、
前記複数の音声データのそれぞれが示す音声波形に基づいて、前記複数の音声データのそれぞれの時間軸を共通の時間軸に対応付ける第1処理と、
前記複数の音声データのそれぞれに対して、当該音声データが示す音声レベルに基づいて発話区間を検出する第2処理と、
前記複数の音声データのそれぞれにおいて検出された前記発話区間を、前記共通の時間軸において合成して合成音声データを生成する第3処理と、
前記合成音声データの前記発話区間に対して音声認識処理を行う第4処理と、
前記音声認識処理により得られたテキストデータを前記共通の時間軸に沿って並べることにより、前記議事録を生成する第5処理と、
を実行させる、
議事録生成プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016052216A JP6716300B2 (ja) | 2016-03-16 | 2016-03-16 | 議事録生成装置、及び議事録生成プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016052216A JP6716300B2 (ja) | 2016-03-16 | 2016-03-16 | 議事録生成装置、及び議事録生成プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017167318A JP2017167318A (ja) | 2017-09-21 |
JP6716300B2 true JP6716300B2 (ja) | 2020-07-01 |
Family
ID=59913235
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016052216A Active JP6716300B2 (ja) | 2016-03-16 | 2016-03-16 | 議事録生成装置、及び議事録生成プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6716300B2 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019153099A (ja) * | 2018-03-05 | 2019-09-12 | コニカミノルタ株式会社 | 会議支援システム及び会議支援プログラム |
JP7095569B2 (ja) * | 2018-11-21 | 2022-07-05 | 株式会社リコー | 音声認識システム、及び音声認識方法 |
CN113544772A (zh) * | 2019-03-15 | 2021-10-22 | 富士通株式会社 | 编辑支持程序、编辑支持方法和编辑支持装置 |
KR102291113B1 (ko) * | 2019-11-05 | 2021-08-19 | 두산중공업 주식회사 | 회의록 작성 장치 및 방법 |
KR102376058B1 (ko) * | 2020-07-10 | 2022-03-18 | (주)액션파워 | 대화록 서비스를 제공하는 컴퓨팅 장치 |
JP7356960B2 (ja) * | 2020-10-29 | 2023-10-05 | 株式会社Nsd先端技術研究所 | 発言切り分けシステムとその方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015106058A (ja) * | 2013-11-29 | 2015-06-08 | 株式会社東芝 | 電子機器および録音ファイル送信方法 |
JP6721298B2 (ja) * | 2014-07-16 | 2020-07-15 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 音声情報制御方法及び端末装置 |
-
2016
- 2016-03-16 JP JP2016052216A patent/JP6716300B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2017167318A (ja) | 2017-09-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6716300B2 (ja) | 議事録生成装置、及び議事録生成プログラム | |
JP6463825B2 (ja) | 多重話者音声認識修正システム | |
JP4837917B2 (ja) | 音声に基づく装置制御 | |
US8762144B2 (en) | Method and apparatus for voice activity detection | |
US7617106B2 (en) | Error detection for speech to text transcription systems | |
US7698134B2 (en) | Device in which selection is activated by voice and method in which selection is activated by voice | |
US8311832B2 (en) | Hybrid-captioning system | |
JP4980018B2 (ja) | 字幕生成装置 | |
JP2023041843A (ja) | 音声区間検出装置、音声区間検出方法及びプログラム | |
US10409547B2 (en) | Apparatus for recording audio information and method for controlling same | |
WO2018100743A1 (ja) | 制御装置および機器制御システム | |
JP2008233672A (ja) | マスキングサウンド生成装置、マスキングサウンド生成方法、プログラムおよび記録媒体 | |
EP3522570A2 (en) | Spatial audio signal filtering | |
JP2010054728A (ja) | 音源抽出装置 | |
JP2006330170A (ja) | 記録文書作成支援システム | |
JP2012163692A (ja) | 音声信号処理システム、音声信号処理方法および音声信号処理方法プログラム | |
JP4564416B2 (ja) | 音声合成装置および音声合成プログラム | |
JP2011199698A (ja) | Av機器 | |
KR101501705B1 (ko) | 음성 데이터를 이용한 문서 생성 장치, 방법 및 컴퓨터 판독 가능 기록 매체 | |
KR102471678B1 (ko) | 음향 신호를 사용자 인터페이스에 시각적으로 표시하는 사용자 인터페이싱 방법 및 장치 | |
JPWO2019030810A1 (ja) | 音声認識装置および音声認識方法 | |
JP2023174514A (ja) | 情報処理装置、情報処理方法、プログラム | |
WO2022071959A1 (en) | Audio-visual hearing aid | |
JP2014235263A (ja) | 音声認識装置およびプログラム | |
JP2020085942A (ja) | 情報処理装置、情報処理方法、およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190208 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20190621 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20191105 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20191209 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20191217 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200214 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200526 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200610 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6716300 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |