JP7259307B2 - 議事録出力装置および議事録出力装置の制御プログラム - Google Patents
議事録出力装置および議事録出力装置の制御プログラム Download PDFInfo
- Publication number
- JP7259307B2 JP7259307B2 JP2018234375A JP2018234375A JP7259307B2 JP 7259307 B2 JP7259307 B2 JP 7259307B2 JP 2018234375 A JP2018234375 A JP 2018234375A JP 2018234375 A JP2018234375 A JP 2018234375A JP 7259307 B2 JP7259307 B2 JP 7259307B2
- Authority
- JP
- Japan
- Prior art keywords
- speaker
- unit
- minutes
- participants
- output
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 claims description 51
- 230000008569 process Effects 0.000 claims description 39
- 230000008859 change Effects 0.000 claims description 17
- 238000012937 correction Methods 0.000 claims description 6
- 238000012545 processing Methods 0.000 description 17
- 238000010586 diagram Methods 0.000 description 15
- 238000001228 spectrum Methods 0.000 description 11
- 230000004048 modification Effects 0.000 description 8
- 238000012986 modification Methods 0.000 description 8
- 238000004891 communication Methods 0.000 description 5
- 238000007621 cluster analysis Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 230000001174 ascending effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/02—Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/06—Decision making techniques; Pattern matching strategies
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L65/00—Network arrangements, protocols or services for supporting real-time applications in data packet communication
- H04L65/40—Support for services or applications
- H04L65/401—Support for services or applications wherein the services involve a main real-time session and one or more additional parallel real-time or time sensitive sessions, e.g. white board sharing or spawning of a subconference
- H04L65/4015—Support for services or applications wherein the services involve a main real-time session and one or more additional parallel real-time or time sensitive sessions, e.g. white board sharing or spawning of a subconference where at least one of the additional parallel sessions is real time or time sensitive, e.g. white board sharing, collaboration or spawning of a subconference
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L65/00—Network arrangements, protocols or services for supporting real-time applications in data packet communication
- H04L65/40—Support for services or applications
- H04L65/403—Arrangements for multi-party communication, e.g. for conferences
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L65/00—Network arrangements, protocols or services for supporting real-time applications in data packet communication
- H04L65/40—Support for services or applications
- H04L65/403—Arrangements for multi-party communication, e.g. for conferences
- H04L65/4053—Arrangements for multi-party communication, e.g. for conferences without floor control
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Acoustics & Sound (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Game Theory and Decision Science (AREA)
- Business, Economics & Management (AREA)
- Computational Linguistics (AREA)
- Telephonic Communication Services (AREA)
Description
上述した実施形態では、制御部11が、ステップS101において、参加人数に関する情報を取得する場合を例に挙げて説明した。変形例1では、制御部11が、異なるタイミングにおいて、参加人数に関する情報を取得する場合について説明する。
上述した実施形態では、会議において、1つのユーザー端末10が使用される場合を例に挙げて説明した。変形例2では、複数のユーザー端末10が使用される場合について説明する。
11 制御部、
111 情報取得部、
112 音声取得部、
113 音声認識部、
114 表示制御部(出力制御部)、
115 判別部、
12 記憶部、
13 通信部、
14 表示部、
15 操作受付部、
16 音入力部。
Claims (18)
- 会議における参加人数に関する情報を取得する情報取得部と、
前記会議における音声に関するデータを取得する音声取得部と、
前記音声取得部によって取得された前記音声に関するデータに基づいて、前記音声を認識し、発言者の発言としてテキスト化する音声認識部と、
前記情報取得部によって取得された前記参加人数に関する情報と、前記音声取得部によって取得された前記音声に関するデータとに基づいて、前記発言者を判別する判別部と、
前記判別部によって判別された前記発言者を示すラベルと、前記音声認識部によってテキスト化された前記発言の内容とを関連付けた議事録を、出力部に出力させる出力制御部と、
を有し、
前記判別部は、前記音声に関するデータに基づいて算出した前記音声の特徴量をクラスターとして分類するとともに、前記クラスター間の類似度を算出し、前記類似度が高い順に前記クラスターを併合し、最も低い前記類似度に応じて前記クラスターが併合される前に存在していた前記クラスターの数を、前記発言者の人数として決定する議事録出力装置。 - 前記判別部は、前記参加人数に関する情報に基づいて、前記発言者の人数が前記参加人数を超えないように、前記発言者を判別する請求項1に記載の議事録出力装置。
- 前記判別部は、前記音声の特徴量に基づいて、前記発言者を判別する請求項1または2に記載の議事録出力装置。
- 前記判別部は、同じ前記クラスターに併合された前記音声の特徴量を、同じ前記発言者の前記音声の特徴量として判別する請求項1~3のいずれか一項に記載の議事録出力装置。
- 前記判別部は、前記発言者の判別結果に基づいて、前記発言者が変化したか否かを判断し、前記発言者が変化したと判断する場合、変化後の前記発言者が前記会議において過去に発言していたか否かをさらに判断し、
前記出力制御部は、
前記判別部によって、変化後の前記発言者が過去に発言していなかったと判断された場合、新たな前記発言者を示す前記ラベルを前記出力部に出力させ、
前記判別部によって、変化後の前記発言者が過去に発言していたと判断された場合、対応する過去の前記発言者を示す前記ラベルを前記出力部に出力させる請求項1~4のいずれか一項に記載の議事録出力装置。 - 前記判別部は、所定の時間毎または所定の発言数毎に、前記発言者を判別する請求項1~5のいずれか一項に記載の議事録出力装置。
- 前記情報取得部は、入力された前記参加人数に関する情報を取得する請求項1~6のいずれか一項に記載の議事録出力装置。
- 前記情報取得部は、前記会議における参加者によって所有される携帯端末から送信された通知に基づいて、前記参加人数に関する情報を取得する請求項1~6のいずれか一項に記載の議事録出力装置。
- 前記情報取得部は、記憶部に記憶されている過去の議事録のデータを確認し、前記参加人数に関する情報として、過去の議事録によって示される過去の前記会議における前記参加人数に関する情報を取得する請求項1~6のいずれか一項に記載の議事録出力装置。
- 前記情報取得部は、前記会議における参加者の点呼の状況に基づいて、前記参加人数に関する情報を取得する請求項1~6のいずれか一項に記載の議事録出力装置。
- 前記情報取得部は、前記会議が開始された後において前記参加人数が変化した場合、変化後の前記参加人数に関する情報をさらに取得し、
前記判別部は、前記情報取得部によって取得された変化後の前記参加人数に関する情報に基づいて、以降の前記発言者を判別する請求項1~10のいずれか一項に記載の議事録出力装置。 - 前記情報取得部は、誤った前記ラベルが前記発言の内容に関連付けられた場合、前記ラベルの訂正に関する情報をさらに取得し、
前記出力制御部は、前記情報取得部によって取得された前記ラベルの訂正に関する情報に基づいて、誤った前記ラベルを訂正し、訂正した前記ラベルを前記出力部に出力させる請求項1~11のいずれか一項に記載の議事録出力装置。 - 前記情報取得部は、前記ラベルに対応する前記発言者の名前に関する情報を取得し、
前記出力制御部は、前記ラベルを前記発言者の名前に置き換えて、前記出力部に出力させる請求項1~12のいずれか一項に記載の議事録出力装置。 - 前記出力制御部は、前記議事録において同一の前記ラベルが複数含まれる場合、全ての同一の前記ラベルを同一の前記発言者の名前に置き換えて、前記出力部に出力させる請求項13に記載の議事録出力装置。
- 議事録を出力する議事録出力装置の制御プログラムであって、
会議における参加人数に関する情報を取得する情報取得ステップと、
前記会議における音声に関するデータを取得する音声取得ステップと、
前記音声取得ステップにおいて取得された前記音声に関するデータに基づいて、前記音声を認識し、発言者の発言としてテキスト化する音声認識ステップと、
前記情報取得ステップにおいて取得された前記参加人数に関する情報と、前記音声取得ステップにおいて取得された前記音声に関するデータとに基づいて、前記発言者を判別する判別ステップと、
前記判別ステップにおいて判別された前記発言者を示すラベルと、前記音声認識ステップにおいてテキスト化された前記発言の内容とを関連付けた議事録を、出力部に出力させる出力ステップと、
を含む処理をコンピューターに実行させ、
前記判別ステップは、前記音声に関するデータに基づいて算出した前記音声の特徴量をクラスターとして分類するとともに、前記クラスター間の類似度を算出し、前記類似度が高い順に前記クラスターを併合し、最も低い前記類似度に応じて前記クラスターが併合される前に存在していた前記クラスターの数を、前記発言者の人数として決定する制御プログラム。 - 前記判別ステップは、前記参加人数に関する情報に基づいて、前記発言者の人数が前記参加人数を超えないように、前記発言者を判別する請求項15に記載の制御プログラム。
- 前記判別ステップは、前記音声の特徴量に基づいて、前記発言者を判別する請求項15または16に記載の制御プログラム。
- 前記判別ステップは、同じ前記クラスターに併合された前記音声の特徴量を、同じ前記発言者の前記音声の特徴量として判別する請求項15~17のいずれか一項に記載の制御プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018234375A JP7259307B2 (ja) | 2018-12-14 | 2018-12-14 | 議事録出力装置および議事録出力装置の制御プログラム |
US16/687,780 US20200194003A1 (en) | 2018-12-14 | 2019-11-19 | Meeting minute output apparatus, and control program of meeting minute output apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018234375A JP7259307B2 (ja) | 2018-12-14 | 2018-12-14 | 議事録出力装置および議事録出力装置の制御プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020095210A JP2020095210A (ja) | 2020-06-18 |
JP7259307B2 true JP7259307B2 (ja) | 2023-04-18 |
Family
ID=71071217
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018234375A Active JP7259307B2 (ja) | 2018-12-14 | 2018-12-14 | 議事録出力装置および議事録出力装置の制御プログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US20200194003A1 (ja) |
JP (1) | JP7259307B2 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113010704B (zh) * | 2020-11-18 | 2022-03-29 | 北京字跳网络技术有限公司 | 一种会议纪要的交互方法、装置、设备及介质 |
JP7000547B1 (ja) | 2020-12-22 | 2022-01-19 | 株式会社オプティム | プログラム、方法、情報処理装置、システム |
JP7337772B2 (ja) * | 2020-12-25 | 2023-09-04 | 株式会社エクシオテック | 会議確認評価システム |
US11837219B2 (en) | 2021-11-18 | 2023-12-05 | International Business Machines Corporation | Creation of a minute from a record of a teleconference |
KR102549882B1 (ko) * | 2022-05-23 | 2023-06-30 | 브레인소프트주식회사 | 다수의 휴대폰을 이용한 음성인식 기반의 회의록 자동 생성 시스템 및 방법 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004287201A (ja) | 2003-03-24 | 2004-10-14 | Seiko Epson Corp | 議事録作成装置及び方法、ならびに、コンピュータプログラム |
JP2008293310A (ja) | 2007-05-25 | 2008-12-04 | Toyota Motor Corp | 消費者の嗜好動向を分析する方法、システムおよびプログラム |
JP2009053430A (ja) | 2007-08-27 | 2009-03-12 | Yamaha Corp | 音声処理装置およびプログラム |
JP2009069172A (ja) | 2007-09-10 | 2009-04-02 | Konica Minolta Business Technologies Inc | 議事録作成装置、議事録作成システム、議事録作成方法および議事録作成プログラム |
JP2010060850A (ja) | 2008-09-04 | 2010-03-18 | Nec Corp | 議事録作成支援装置、議事録作成支援方法、議事録作成支援用プログラム及び議事録作成支援システム |
JP2010169924A (ja) | 2009-01-23 | 2010-08-05 | Nec Corp | 音声分類装置、音声分類方法及びプログラム |
JP2014206896A (ja) | 2013-04-15 | 2014-10-30 | Yamagata Intech株式会社 | 情報処理装置、及び、プログラム |
JP2017167636A (ja) | 2016-03-14 | 2017-09-21 | 株式会社リコー | 会議室予約装置、会議室予約方法、及びプログラム |
-
2018
- 2018-12-14 JP JP2018234375A patent/JP7259307B2/ja active Active
-
2019
- 2019-11-19 US US16/687,780 patent/US20200194003A1/en not_active Abandoned
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004287201A (ja) | 2003-03-24 | 2004-10-14 | Seiko Epson Corp | 議事録作成装置及び方法、ならびに、コンピュータプログラム |
JP2008293310A (ja) | 2007-05-25 | 2008-12-04 | Toyota Motor Corp | 消費者の嗜好動向を分析する方法、システムおよびプログラム |
JP2009053430A (ja) | 2007-08-27 | 2009-03-12 | Yamaha Corp | 音声処理装置およびプログラム |
JP2009069172A (ja) | 2007-09-10 | 2009-04-02 | Konica Minolta Business Technologies Inc | 議事録作成装置、議事録作成システム、議事録作成方法および議事録作成プログラム |
JP2010060850A (ja) | 2008-09-04 | 2010-03-18 | Nec Corp | 議事録作成支援装置、議事録作成支援方法、議事録作成支援用プログラム及び議事録作成支援システム |
JP2010169924A (ja) | 2009-01-23 | 2010-08-05 | Nec Corp | 音声分類装置、音声分類方法及びプログラム |
JP2014206896A (ja) | 2013-04-15 | 2014-10-30 | Yamagata Intech株式会社 | 情報処理装置、及び、プログラム |
JP2017167636A (ja) | 2016-03-14 | 2017-09-21 | 株式会社リコー | 会議室予約装置、会議室予約方法、及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
US20200194003A1 (en) | 2020-06-18 |
JP2020095210A (ja) | 2020-06-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7259307B2 (ja) | 議事録出力装置および議事録出力装置の制御プログラム | |
CN108305615B (zh) | 一种对象识别方法及其设备、存储介质、终端 | |
US20170084274A1 (en) | Dialog management apparatus and method | |
US9293133B2 (en) | Improving voice communication over a network | |
US20190259388A1 (en) | Speech-to-text generation using video-speech matching from a primary speaker | |
WO2020211354A1 (zh) | 基于说话内容的说话者身份识别方法、装置及存储介质 | |
US9047866B2 (en) | System and method for identification of a speaker by phonograms of spontaneous oral speech and by using formant equalization using one vowel phoneme type | |
US20180018974A1 (en) | System and method for detecting tantrums | |
WO2019067312A1 (en) | SYSTEMS AND METHODS FOR PROVIDING CONTENT NOT READ | |
US20150227510A1 (en) | System for speaker diarization based multilateral automatic speech translation system and its operating method, and apparatus supporting the same | |
KR102628211B1 (ko) | 전자 장치 및 그 제어 방법 | |
US10699706B1 (en) | Systems and methods for device communications | |
JP2010232780A (ja) | 通信制御装置、通信制御方法、及び通信制御プログラム | |
CN110827803A (zh) | 方言发音词典的构建方法、装置、设备及可读存储介质 | |
WO2021169365A1 (zh) | 声纹识别的方法和装置 | |
JP5549506B2 (ja) | 音声認識装置及び音声認識方法 | |
JP6731802B2 (ja) | 検出装置、検出方法及び検出プログラム | |
US20200279570A1 (en) | Speaker determination apparatus, speaker determination method, and control program for speaker determination apparatus | |
JP2013257418A (ja) | 情報処理装置、および情報処理方法、並びにプログラム | |
US20180350360A1 (en) | Provide non-obtrusive output | |
JP2009086207A (ja) | 議事録情報生成システム、議事録情報生成方法、及び議事録情報生成プログラム | |
CN113096651A (zh) | 语音信号处理方法、装置、可读存储介质及电子设备 | |
CN113593523A (zh) | 基于人工智能的语音检测方法、装置及电子设备 | |
CN111582708A (zh) | 医疗信息的检测方法、系统、电子设备及计算机可读存储介质 | |
WO2021171417A1 (ja) | 発話終端検出装置、制御方法、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20211117 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220926 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20221004 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221117 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230307 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230320 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7259307 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |