JP2018049140A - 音声分析プログラム、音声分析装置、及び音声分析方法 - Google Patents
音声分析プログラム、音声分析装置、及び音声分析方法 Download PDFInfo
- Publication number
- JP2018049140A JP2018049140A JP2016184176A JP2016184176A JP2018049140A JP 2018049140 A JP2018049140 A JP 2018049140A JP 2016184176 A JP2016184176 A JP 2016184176A JP 2016184176 A JP2016184176 A JP 2016184176A JP 2018049140 A JP2018049140 A JP 2018049140A
- Authority
- JP
- Japan
- Prior art keywords
- graph
- speakers
- characters
- voice
- text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- User Interface Of Digital Computer (AREA)
Abstract
Description
〔1−1〕音声分析システムの構成例
一実施形態に係る音声分析システムは、例えば、ディスカッションにおける発言内容の分析に利用可能である。ディスカッションとしては、例えば、複数人が参加して発言する授業(例えば協調学習)や会議等が挙げられる。
次に、図1を参照して、一実施形態に係る音声分析システム1について説明する。図1に示すように、一実施形態に係る音声分析システム1は、例示的に、コンピュータ10、ネットワーク20、及び、端末30をそなえてよい。
次に、音声変換部12及びグラフ出力部13による音声分析処理について説明する。
表示領域150には、Webページレイアウトとして、グラフのスケールや表示範囲を変更するためのズームボタン162、及び、スケール変更領域170が表示されている(図3等参照)。
表示領域150には、1つの第1分類グループに着目したグラフに代えて、他の観点により集計されたグラフが表示されてもよい。
図11は、1つの第2分類グループに着目したグラフの一例を示す図である。図11の例では、第2分類グループ“groupX”(図2参照)に属する“USER1”、“USER11”、及び“USER21”のそれぞれの発話内容のテキストに対応する文字数の折れ線が、それぞれ実線、破線、一点鎖線でグラフ領域160Aに示されている。
上述したグラフ領域160及び160Aには、集計単位時間ごとの発話量を示すグラフが表示されているが、これに限定されるものではない。例えば、グラフとして、複数のユーザのそれぞれの音声に対応した文字数の累積値を示す積み上げグラフ(棒グラフ)が用いられてもよい。
次に、図14〜図16を参照して、上述の如く構成された音声分析システム1の動作例を説明する。
はじめに、音声変換部12の動作例について説明する。図14に例示するように、ディスカッションの開始に応じて、例えばオペレータによりコンピュータ10の音声変換部12の機能が起動されると(ステップA1)、音声取得部121は、話者単位、発話単位で集音装置11から発話内容を取り込む(ステップA2)。
次に、グラフ出力部13の動作例について説明する。図15に例示するように、グラフ出力部13は、オペレータからのグラフ表示要求を待ち受ける(ステップB1、ステップB1でNo)。
次に、図15のステップB4におけるグラフ表示変更処理の動作例について説明する。図16に例示するように、制御部132は、グラフ表示変更要求が集計単位時間の変更に係る要求か否かを判定する(ステップB11)。なお、この要求は、表示スケール変更を伴っていてもよく伴っていなくてもよい。
次に、上述したコンピュータ10のハードウェア構成例について説明する。図17に示すように、コンピュータ10は、例示的に、CPU(Central Processing Unit)10a、メモリ10b、記憶部10c、IF(Interface)部10d、I/O(Input / Output)部10e、及び読取部10fをそなえてよい。
上述した一実施形態に係る技術は、以下のように変形、変更して実施することができる。
以上の実施形態に関し、さらに以下の付記を開示する。
複数の話者のそれぞれの音声を受け付け、
受け付けた前記複数の話者のそれぞれの音声を音声認識によりテキスト化し、
所定時間ごとの前記複数の話者のそれぞれの音声に対応するテキストの文字数を特定し、
前記所定時間ごとに、前記複数の話者のそれぞれの音声に対応した前記文字数を示すグラフを出力する、
処理をコンピュータに実行させることを特徴とする、音声分析プログラム。
前記文字数を示すグラフとともに、前記複数の話者のそれぞれに対応する付加情報を出力する処理を前記コンピュータに実行させることを特徴とする、付記1記載の音声分析プログラム。
前記付加情報は、前記複数の話者のそれぞれの音声に対応するテキストであることを特徴とする、付記2記載の音声分析プログラム。
前記文字数を示すグラフに対して表示範囲の時間スケールの変更を制御する処理を前記コンピュータに実行させることを特徴とする、付記1〜3のいずれか1項記載の音声分析プログラム。
前記所定時間の長さを変更し、
変更後の所定時間ごとの前記複数の話者のそれぞれの音声に対応するテキストの文字数を特定し、
前記変更後の所定時間ごとに、前記複数の話者のそれぞれの音声に対応した前記文字数を示すグラフを出力する、
処理を前記コンピュータに実行させることを特徴とする、付記1〜4のいずれか1項記載の音声分析プログラム。
前記文字数を示すグラフは、時間軸及び文字数軸を含む表示範囲上に、前記所定時間ごとの前記複数の話者のそれぞれの音声に対応した前記文字数をプロットした折れ線グラフであることを特徴とする、付記1〜5のいずれか1項記載の音声分析プログラム。
前記複数の話者のそれぞれは、複数の第1分類グループのうちのいずれかに属するとともに、複数の第2分類グループのうちのいずれかに属し、前記複数の第1分類グループのそれぞれには、互いに異なる第2分類グループに属する話者が含まれ、
前記文字数を示すグラフは、同一の第1分類グループに属する複数の話者を対象として生成されるグラフである
ことを特徴とする、付記1〜6のいずれか1項記載の音声分析プログラム。
前記文字数を示すグラフを、同一の第2分類グループに属する複数の話者を対象として生成されるグラフに切り替える制御を行なう処理を前記コンピュータに実行させることを特徴とする、付記7記載の音声分析プログラム。
前記文字数を示すグラフは、時間軸及び文字数軸を含む表示範囲上に、前記所定時間ごとの前記複数の話者のそれぞれの音声に対応した前記文字数の累積値を示す棒グラフであることを特徴とする、付記1〜5のいずれか1項記載の音声分析プログラム。
前記文字数を示すグラフを、時間軸及び文字数軸を含む表示範囲上に、前記所定時間ごとの前記複数の話者のそれぞれの音声に対応した前記文字数をプロットした折れ線グラフと、前記表示範囲上に、前記所定時間ごとの前記複数の話者のそれぞれの音声に対応した前記文字数の累積値を示す棒グラフと、の間で切り替える制御を行なう処理を前記コンピュータに実行させることを特徴とする、付記1〜9のいずれか1項記載の音声分析プログラム。
複数の話者のそれぞれの音声を受け付ける受付部と、
受け付けた前記複数の話者のそれぞれの音声を音声認識によりテキスト化するテキスト化部と、
所定時間ごとの前記複数の話者のそれぞれの音声に対応するテキストの文字数を特定する特定部と、
前記所定時間ごとに、前記複数の話者のそれぞれの音声に対応した前記文字数を示すグラフを出力する出力部と、をそなえる
ことを特徴とする、音声分析装置。
前記出力部は、前記文字数を示すグラフとともに、前記複数の話者のそれぞれに対応する付加情報を出力することを特徴とする、付記11記載の音声分析装置。
前記付加情報は、前記複数の話者のそれぞれの音声に対応するテキストであることを特徴とする、付記12記載の音声分析装置。
前記文字数を示すグラフに対して表示範囲の時間スケールの変更を制御する制御部、をそなえることを特徴とする、付記11〜13のいずれか1項記載の音声分析装置。
前記制御部は、前記所定時間の長さを変更し、
前記特定部は、変更後の所定時間ごとの前記複数の話者のそれぞれの音声に対応するテキストの文字数を特定し、
前記出力部は、前記変更後の所定時間ごとに、前記複数の話者のそれぞれの音声に対応した前記文字数を示すグラフを出力する、
ことを特徴とする、付記11〜14のいずれか1項記載の音声分析装置。
前記複数の話者のそれぞれは、複数の第1分類グループのうちのいずれかに属するとともに、複数の第2分類グループのうちのいずれかに属し、前記複数の第1分類グループのそれぞれには、互いに異なる第2分類グループに属する話者が含まれ、
前記文字数を示すグラフは、同一の第1分類グループに属する複数の話者を対象として生成されるグラフである
ことを特徴とする、付記11〜15のいずれか1項記載の音声分析装置。
前記制御部は、前記文字数を示すグラフを、同一の第2分類グループに属する複数の話者を対象として生成されるグラフに切り替える制御を行なうことを特徴とする、付記16記載の音声分析装置。
前記制御部は、前記文字数を示すグラフを、時間軸及び文字数軸を含む表示範囲上に、前記所定時間ごとの前記複数の話者のそれぞれの音声に対応した前記文字数をプロットした折れ線グラフと、前記表示範囲上に、前記所定時間ごとの前記複数の話者のそれぞれの音声に対応した前記文字数の累積値を示す棒グラフと、の間で切り替える制御を行なうことを特徴とする、付記11〜17のいずれか1項記載の音声分析装置。
コンピュータのプロセッサが、複数の話者のそれぞれの音声を受け付け、
前記プロセッサが、受け付けた前記複数の話者のそれぞれの音声を音声認識によりテキスト化し、
前記プロセッサが、所定時間ごとの前記複数の話者のそれぞれの音声に対応するテキストの文字数を特定し、
前記プロセッサが、前記所定時間ごとに、前記複数の話者のそれぞれの音声に対応した前記文字数を示すグラフを出力する、
ことを特徴とする、音声分析方法。
前記プロセッサが、前記文字数を示すグラフとともに、前記複数の話者のそれぞれに対応する付加情報を出力することを特徴とする、付記19記載の音声分析方法。
10 コンピュータ
11、31 集音装置
12 音声変換部
121 音声取得部
122 テキスト変換部
13 グラフ出力部
131 グラフ生成部
132 制御部
14 発話データベース
15 表示装置
20 ネットワーク
30 端末
150、150A、150B 表示領域
160、160A、160B グラフ領域
162 ズームボタン
164 マウスカーソル
166 テキスト領域
167、168、169 ポップアップ
170 スケール変更領域
172 プレビュー領域
174 調整部
176 スライダ
180 操作領域
190 条件指定画面
192 表示グループ選択領域
194 表示方法選択領域
196 グラフ出力ボタン
Claims (10)
- 複数の話者のそれぞれの音声を受け付け、
受け付けた前記複数の話者のそれぞれの音声を音声認識によりテキスト化し、
所定時間ごとの前記複数の話者のそれぞれの音声に対応するテキストの文字数を特定し、
前記所定時間ごとに、前記複数の話者のそれぞれの音声に対応した前記文字数を示すグラフを出力する、
処理をコンピュータに実行させることを特徴とする、音声分析プログラム。 - 前記文字数を示すグラフとともに、前記複数の話者のそれぞれに対応する付加情報を出力する処理を前記コンピュータに実行させることを特徴とする、請求項1記載の音声分析プログラム。
- 前記付加情報は、前記複数の話者のそれぞれの音声に対応するテキストであることを特徴とする、請求項2記載の音声分析プログラム。
- 前記文字数を示すグラフに対して表示範囲の時間スケールの変更を制御する処理を前記コンピュータに実行させることを特徴とする、請求項1〜3のいずれか1項記載の音声分析プログラム。
- 前記所定時間の長さを変更し、
変更後の所定時間ごとの前記複数の話者のそれぞれの音声に対応するテキストの文字数を特定し、
前記変更後の所定時間ごとに、前記複数の話者のそれぞれの音声に対応した前記文字数を示すグラフを出力する、
処理を前記コンピュータに実行させることを特徴とする、請求項1〜4のいずれか1項記載の音声分析プログラム。 - 前記複数の話者のそれぞれは、複数の第1分類グループのうちのいずれかに属するとともに、複数の第2分類グループのうちのいずれかに属し、前記複数の第1分類グループのそれぞれには、互いに異なる第2分類グループに属する話者が含まれ、
前記文字数を示すグラフは、同一の第1分類グループに属する複数の話者を対象として生成されるグラフである
ことを特徴とする、請求項1〜5のいずれか1項記載の音声分析プログラム。 - 前記文字数を示すグラフを、同一の第2分類グループに属する複数の話者を対象として生成されるグラフに切り替える制御を行なう処理を前記コンピュータに実行させることを特徴とする、請求項6記載の音声分析プログラム。
- 前記文字数を示すグラフを、時間軸及び文字数軸を含む表示範囲上に、前記所定時間ごとの前記複数の話者のそれぞれの音声に対応した前記文字数をプロットした折れ線グラフと、前記表示範囲上に、前記所定時間ごとの前記複数の話者のそれぞれの音声に対応した前記文字数の累積値を示す棒グラフと、の間で切り替える制御を行なう処理を前記コンピュータに実行させることを特徴とする、請求項1〜7のいずれか1項記載の音声分析プログラム。
- 複数の話者のそれぞれの音声を受け付ける受付部と、
受け付けた前記複数の話者のそれぞれの音声を音声認識によりテキスト化するテキスト化部と、
所定時間ごとの前記複数の話者のそれぞれの音声に対応するテキストの文字数を特定する特定部と、
前記所定時間ごとに、前記複数の話者のそれぞれの音声に対応した前記文字数を示すグラフを出力する出力部と、をそなえる
ことを特徴とする、音声分析装置。 - コンピュータのプロセッサが、複数の話者のそれぞれの音声を受け付け、
前記プロセッサが、受け付けた前記複数の話者のそれぞれの音声を音声認識によりテキスト化し、
前記プロセッサが、所定時間ごとの前記複数の話者のそれぞれの音声に対応するテキストの文字数を特定し、
前記プロセッサが、前記所定時間ごとに、前記複数の話者のそれぞれの音声に対応した前記文字数を示すグラフを出力する、
ことを特徴とする、音声分析方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016184176A JP6733452B2 (ja) | 2016-09-21 | 2016-09-21 | 音声分析プログラム、音声分析装置、及び音声分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016184176A JP6733452B2 (ja) | 2016-09-21 | 2016-09-21 | 音声分析プログラム、音声分析装置、及び音声分析方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018049140A true JP2018049140A (ja) | 2018-03-29 |
JP6733452B2 JP6733452B2 (ja) | 2020-07-29 |
Family
ID=61766293
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016184176A Active JP6733452B2 (ja) | 2016-09-21 | 2016-09-21 | 音声分析プログラム、音声分析装置、及び音声分析方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6733452B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020129230A (ja) * | 2019-02-07 | 2020-08-27 | 株式会社メルカリ | 情報処理プログラム、情報処理端末、情報処理方法、及び情報処理装置 |
JP2020160336A (ja) * | 2019-03-27 | 2020-10-01 | 株式会社博報堂Dyホールディングス | 評価システム、評価方法、及びコンピュータプログラム。 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006251042A (ja) * | 2005-03-08 | 2006-09-21 | Fuji Xerox Co Ltd | 情報処理装置、情報処理方法およびプログラム |
JP2006268089A (ja) * | 2005-03-22 | 2006-10-05 | Fuji Xerox Co Ltd | 情報処理装置、情報処理方法およびプログラム |
JP2007257284A (ja) * | 2006-03-23 | 2007-10-04 | Asahi Kasei Homes Kk | 生活エネルギー削減支援システム |
JP2007288539A (ja) * | 2006-04-17 | 2007-11-01 | Fuji Xerox Co Ltd | 会議システム及び会議方法 |
JP2011102862A (ja) * | 2009-11-10 | 2011-05-26 | Advanced Media Inc | 音声認識結果管理装置および音声認識結果表示方法 |
-
2016
- 2016-09-21 JP JP2016184176A patent/JP6733452B2/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006251042A (ja) * | 2005-03-08 | 2006-09-21 | Fuji Xerox Co Ltd | 情報処理装置、情報処理方法およびプログラム |
JP2006268089A (ja) * | 2005-03-22 | 2006-10-05 | Fuji Xerox Co Ltd | 情報処理装置、情報処理方法およびプログラム |
JP2007257284A (ja) * | 2006-03-23 | 2007-10-04 | Asahi Kasei Homes Kk | 生活エネルギー削減支援システム |
JP2007288539A (ja) * | 2006-04-17 | 2007-11-01 | Fuji Xerox Co Ltd | 会議システム及び会議方法 |
JP2011102862A (ja) * | 2009-11-10 | 2011-05-26 | Advanced Media Inc | 音声認識結果管理装置および音声認識結果表示方法 |
Non-Patent Citations (1)
Title |
---|
""第64回 少子高齢化時代の文教ビジネス 対話型の学習における発話とメモの記録をデータ分析することで授", PC−WEBZINE VOL.295 (2016-08-25), JPN6020009738, 25 August 2016 (2016-08-25), ISSN: 0004233069 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020129230A (ja) * | 2019-02-07 | 2020-08-27 | 株式会社メルカリ | 情報処理プログラム、情報処理端末、情報処理方法、及び情報処理装置 |
JP2020160336A (ja) * | 2019-03-27 | 2020-10-01 | 株式会社博報堂Dyホールディングス | 評価システム、評価方法、及びコンピュータプログラム。 |
Also Published As
Publication number | Publication date |
---|---|
JP6733452B2 (ja) | 2020-07-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11527233B2 (en) | Method, apparatus, device and computer storage medium for generating speech packet | |
US10586528B2 (en) | Domain-specific speech recognizers in a digital medium environment | |
US10540994B2 (en) | Personal device for hearing degradation monitoring | |
US10282409B2 (en) | Performance modification based on aggregation of audience traits and natural language feedback | |
Yousaf et al. | A Novel Technique for Speech Recognition and Visualization Based Mobile Application to Support Two‐Way Communication between Deaf‐Mute and Normal Peoples | |
JP2017016566A (ja) | 情報処理装置、情報処理方法及びプログラム | |
US20190147760A1 (en) | Cognitive content customization | |
CN110289015B (zh) | 一种音频处理方法、装置、服务器、存储介质及系统 | |
EP4181124A1 (en) | Communication system and related methods | |
JP2014206896A (ja) | 情報処理装置、及び、プログラム | |
James et al. | Automated classification of classroom climate by audio analysis | |
ES2751375T3 (es) | Análisis lingüístico basado en una selección de palabras y dispositivo de análisis lingüístico | |
CN111052749A (zh) | 用于计量对话的机制和工具 | |
Southwell et al. | Challenges and feasibility of automatic speech recognition for modeling student collaborative discourse in classrooms | |
Huber et al. | Automatically analyzing brainstorming language behavior with Meeter | |
JP6733452B2 (ja) | 音声分析プログラム、音声分析装置、及び音声分析方法 | |
CN104424955A (zh) | 生成音频的图形表示的方法和设备、音频搜索方法和设备 | |
Lansford et al. | Cognitive predictors of perception and adaptation to dysarthric speech in young adult listeners | |
Herrmann et al. | Senti-analyzer: joint sentiment analysis for text-based and verbal communication in software projects | |
Kurniawan et al. | How Blind Users' Mental Models Affect Their Perceived Usability of an Unfamiliar Screen Reader. | |
Viswanathan et al. | Collaboration detection that preserves privacy of students’ speech | |
US10505879B2 (en) | Communication support device, communication support method, and computer program product | |
JP2021089576A (ja) | 情報処理装置、情報処理方法およびプログラム | |
JP7452299B2 (ja) | 会話支援システム、会話支援方法及びプログラム | |
JP7230085B2 (ja) | 音声を処理するための方法及び装置、電子機器、記憶媒体並びにコンピュータプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A80 | Written request to apply exceptions to lack of novelty of invention |
Free format text: JAPANESE INTERMEDIATE CODE: A80 Effective date: 20161011 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20190607 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190611 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200212 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200317 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200514 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200609 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200622 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6733452 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |