JP7407190B2 - 発話解析装置、発話解析方法及びプログラム - Google Patents
発話解析装置、発話解析方法及びプログラム Download PDFInfo
- Publication number
- JP7407190B2 JP7407190B2 JP2021529930A JP2021529930A JP7407190B2 JP 7407190 B2 JP7407190 B2 JP 7407190B2 JP 2021529930 A JP2021529930 A JP 2021529930A JP 2021529930 A JP2021529930 A JP 2021529930A JP 7407190 B2 JP7407190 B2 JP 7407190B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- utterance
- category
- likelihood
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004458 analytical method Methods 0.000 title claims description 133
- 238000012545 processing Methods 0.000 claims description 35
- 238000000034 method Methods 0.000 claims description 26
- 230000001186 cumulative effect Effects 0.000 description 28
- 230000008569 process Effects 0.000 description 21
- 238000004364 calculation method Methods 0.000 description 15
- 238000012800 visualization Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000007476 Maximum Likelihood Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000010606 normalization Methods 0.000 description 3
- 230000007704 transition Effects 0.000 description 3
- 230000003252 repetitive effect Effects 0.000 description 2
- 230000000699 topical effect Effects 0.000 description 2
- 238000007792 addition Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 239000012925 reference material Substances 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/353—Clustering; Classification into predefined classes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3343—Query execution using phonetics
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
- G06F40/35—Discourse or dialogue representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/42—Data-driven translation
- G06F40/44—Statistical methods, e.g. probability models
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/10—Speech classification or search using distance or distortion measures between unknown speech and reference templates
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Artificial Intelligence (AREA)
- Acoustics & Sound (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Description
従来の技術では、発話者の発話を解析する際、文単位を処理対象とし、各文に含まれる単語を用いて解析している。一方、1文ではなく、ある期間の複数の文を対象に解析することが好ましい場合もある。
[1-1.構成]
以下に、図面を用いて本開示における実施形態を、図面を適宜参照しながら説明する。ただし、詳細な説明において、従来技術および実質的に同一の構成に関する説明のうち不必要な部分は省略されることもある。これは、説明を簡単にするためである。また、以下の説明および添付の図面は、当業者が本開示を充分に理解できるよう開示されるのであって、特許請求の範囲の主題を限定することを意図されていない。
ここで、式(1)に使用する各値はそれぞれ以下のように規定する。
c:カテゴリを特定する番号
i:対象範囲を特定する番号
Lc2(i):i番目の対象範囲の積算尤度
j:対象範囲の中で各発話データ121に付された番号
Lc(j):対象範囲の中でj番目の発話データ121のカテゴリ尤度
w1:鮮度重み値
w2:頻度重み値
なお、式(1)は、i=1からi=q(後述する対象範囲の数)までの総和である。
図7及び図8に示すフローチャートを用いて、発話解析装置1における発話データの発話解析処理について説明する。図7に示すように、発話解析装置1では、発話者が発話をする際、取得部111は、発話データを取得し、時系列に付与される番号とともに発話データ121として記憶部12に記憶させる(S1)。
一方、発話が終了した場合(S6でYES)、発話解析装置1は、処理を終了する。
発話解析装置1では、このように、発話者の発話を解析し、ある期間における発話者の発話における話題に応じた情報を提供することができる。また、これにより、発話者は、容易に、現在の状況に対応する情報にアクセスすることが可能となる。
実施の形態においては、発話解析装置1内の演算部112において、「カテゴリ尤度」を演算する一例で説明したが、これに限定されない。具体的には、発話解析装置1は、外部の演算装置で演算されたカテゴリ尤度を取得し、利用してもよい。
(1)本開示の発話解析装置は、発話者の発話データを時系列の順番で取得する取得部と、取得部で取得した発話データが各カテゴリに該当する可能性を特定する値である複数の第1の尤度を用いて、発話データの内容を解析する制御部と、制御部による制御に従って、発話データのカテゴリに関連する関連情報を含む表示データを表示させる表示処理部とを備え、制御部は、時系列に沿って発話データが取得される毎に複数の第1の尤度を用いて、複数のカテゴリにおける各カテゴリに関連した複数の関連情報を記憶する記憶部から、表示処理部に優先して表示させる関連情報を順次選択してもよい。
11 制御部
111 取得部
112 演算部
113 解析部
114 生成部
115 表示処理部
12 記憶部
121 発話データ
122 マニュアルデータ
Claims (12)
- 発話者の発話データを時系列の順番で取得する取得部と、
前記取得部で取得した発話データが各カテゴリに該当する可能性を特定する値である複数の第1の尤度を用いて、前記発話データの内容を解析する制御部と、
前記制御部による制御に従って、前記発話データのカテゴリに関連する関連情報を含む表示データを表示させる表示処理部とを備え、
前記制御部は、前記時系列に沿って前記発話データが取得される毎に前記複数の第1の尤度を用いて、複数のカテゴリにおける各カテゴリに関連した複数の関連情報を記憶する記憶部から、前記表示処理部に優先して表示させる関連情報を順次選択する
発話解析装置。 - 前記制御部は、
前記時系列における解析対象期間内の複数の発話データの第1の尤度を積算して第2の尤度をカテゴリ毎に演算し、
当該第2の尤度が高いカテゴリを優先して、対応する関連情報を前記表示処理部に表示させる
請求項1に記載の発話解析装置。 - 前記制御部は、前記解析対象期間に出現する頻度が高い程、大きな値に設定される第1の重み値を用いて、前記第2の尤度を求める
請求項2に記載の発話解析装置。 - 前記制御部は、前記解析対象期間の開始時よりも終了時に近い程、大きな値に設定される第2の重み値を用いて、前記第2の尤度を求める
請求項2又は3に記載の発話解析装置。 - ユーザから指定された期間の入力を受け付ける受付部を備え、
前記制御部は、前記受付部が受け付けた期間を前記解析対象期間として前記第2の尤度を求める
請求項2乃至4のいずれか1に記載の発話解析装置。 - 前記制御部は、前記第2の尤度の高いカテゴリと関連付けられる所定数の情報を選択し、
前記表示処理部によって表示される表示データは、前記第2の尤度の降順で前記情報を含む
請求項2乃至5のいずれか1に記載の発話解析装置。 - 前記表示処理部によって表示される表示データは、前記発話データが音声認識処理によってテキスト化されたテキストデータを発話の時系列で含む
請求項1乃至6のいずれか1に記載の発話解析装置。 - 前記表示処理部によって表示される表示データは、前記テキストデータにおいて所定の用語を強調されたデータである
請求項7に記載の発話解析装置。 - 前記制御部は、前記発話データ毎に、各カテゴリに関する第1の尤度を演算する
請求項1乃至8のいずれか1に記載の発話解析装置。 - 前記発話データは、複数の発話者の対話のデータである
請求項1乃至9のいずれか1に記載の発話解析装置。 - 発話者の発話の内容を解析し、発話に関する情報を表示する発話解析方法であって、
取得部が、発話者の発話データを時系列の順番で取得するステップと、
制御部が、前記取得部で取得した発話データが各カテゴリに該当する可能性を特定する値である複数の第1の尤度を用いて、前記発話データの内容を解析するステップと、
表示処理部が、前記制御部による制御に従って、前記発話データのカテゴリに関連する関連情報を含む表示データを表示させるステップとを含み、
前記制御部は、前記時系列に沿って前記発話データが取得される毎に前記複数の第1の尤度を用いて、複数のカテゴリにおける各カテゴリに関連した複数の関連情報を記憶する記憶部から、前記表示処理部に優先して表示させる関連情報を順次に選択する
発話解析方法。 - 請求項11に記載の方法をコンピュータに実行させるためのプログラム。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019125454 | 2019-07-04 | ||
JP2019125454 | 2019-07-04 | ||
JP2019134559 | 2019-07-22 | ||
JP2019134559 | 2019-07-22 | ||
PCT/JP2020/021811 WO2021002137A1 (ja) | 2019-07-04 | 2020-06-02 | 発話解析装置、発話解析方法及びプログラム |
Publications (3)
Publication Number | Publication Date |
---|---|
JPWO2021002137A1 JPWO2021002137A1 (ja) | 2021-01-07 |
JPWO2021002137A5 JPWO2021002137A5 (ja) | 2022-06-02 |
JP7407190B2 true JP7407190B2 (ja) | 2023-12-28 |
Family
ID=74100168
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021529929A Pending JPWO2021002136A1 (ja) | 2019-07-04 | 2020-06-02 | |
JP2021529930A Active JP7407190B2 (ja) | 2019-07-04 | 2020-06-02 | 発話解析装置、発話解析方法及びプログラム |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021529929A Pending JPWO2021002136A1 (ja) | 2019-07-04 | 2020-06-02 |
Country Status (4)
Country | Link |
---|---|
US (2) | US20220108697A1 (ja) |
JP (2) | JPWO2021002136A1 (ja) |
CN (2) | CN114072786A (ja) |
WO (2) | WO2021002137A1 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20220343067A1 (en) * | 2019-09-02 | 2022-10-27 | Imatrix Holdings Corp. | Text Analysis System, and Characteristic Evaluation System for Message Exchange Using the Same |
JP2022117730A (ja) * | 2021-02-01 | 2022-08-12 | オムロン株式会社 | 情報処理装置、制御システムおよびレポート出力方法 |
US11893990B2 (en) * | 2021-09-27 | 2024-02-06 | Sap Se | Audio file annotation |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011123706A (ja) | 2009-12-11 | 2011-06-23 | Advanced Media Inc | 文章分類装置および文章分類方法 |
JP2011221873A (ja) | 2010-04-12 | 2011-11-04 | Nippon Telegr & Teleph Corp <Ntt> | データ分類方法及び装置及びプログラム |
JP2013120547A (ja) | 2011-12-08 | 2013-06-17 | Nomura Research Institute Ltd | 談話要約テンプレート作成システムおよび談話要約テンプレート作成プログラム |
WO2016027364A1 (ja) | 2014-08-22 | 2016-02-25 | 株式会社日立製作所 | 話題クラスタ選択装置、及び検索方法 |
WO2018110029A1 (ja) | 2016-12-13 | 2018-06-21 | 株式会社東芝 | 情報処理装置、情報処理方法、および情報処理プログラム |
JP2018194980A (ja) | 2017-05-15 | 2018-12-06 | 富士通株式会社 | 判定プログラム、判定方法および判定装置 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080300872A1 (en) * | 2007-05-31 | 2008-12-04 | Microsoft Corporation | Scalable summaries of audio or visual content |
WO2009084554A1 (ja) * | 2007-12-27 | 2009-07-09 | Nec Corporation | テキスト分割装置とテキスト分割方法およびプログラム |
US8612211B1 (en) * | 2012-09-10 | 2013-12-17 | Google Inc. | Speech recognition and summarization |
EP3254456B1 (en) * | 2015-02-03 | 2020-12-30 | Dolby Laboratories Licensing Corporation | Optimized virtual scene layout for spatial meeting playback |
JP2017016566A (ja) * | 2015-07-06 | 2017-01-19 | ソニー株式会社 | 情報処理装置、情報処理方法及びプログラム |
JP6718345B2 (ja) * | 2016-09-21 | 2020-07-08 | 日本電信電話株式会社 | テキスト分析方法、テキスト分析装置、及びプログラム |
-
2020
- 2020-06-02 WO PCT/JP2020/021811 patent/WO2021002137A1/ja active Application Filing
- 2020-06-02 JP JP2021529929A patent/JPWO2021002136A1/ja active Pending
- 2020-06-02 JP JP2021529930A patent/JP7407190B2/ja active Active
- 2020-06-02 CN CN202080048836.2A patent/CN114072786A/zh active Pending
- 2020-06-02 CN CN202080046853.2A patent/CN114026557A/zh active Pending
- 2020-06-02 WO PCT/JP2020/021809 patent/WO2021002136A1/ja active Application Filing
-
2021
- 2021-12-17 US US17/554,248 patent/US20220108697A1/en active Pending
- 2021-12-22 US US17/559,033 patent/US20220114348A1/en active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011123706A (ja) | 2009-12-11 | 2011-06-23 | Advanced Media Inc | 文章分類装置および文章分類方法 |
JP2011221873A (ja) | 2010-04-12 | 2011-11-04 | Nippon Telegr & Teleph Corp <Ntt> | データ分類方法及び装置及びプログラム |
JP2013120547A (ja) | 2011-12-08 | 2013-06-17 | Nomura Research Institute Ltd | 談話要約テンプレート作成システムおよび談話要約テンプレート作成プログラム |
WO2016027364A1 (ja) | 2014-08-22 | 2016-02-25 | 株式会社日立製作所 | 話題クラスタ選択装置、及び検索方法 |
WO2018110029A1 (ja) | 2016-12-13 | 2018-06-21 | 株式会社東芝 | 情報処理装置、情報処理方法、および情報処理プログラム |
JP2018194980A (ja) | 2017-05-15 | 2018-12-06 | 富士通株式会社 | 判定プログラム、判定方法および判定装置 |
Also Published As
Publication number | Publication date |
---|---|
US20220108697A1 (en) | 2022-04-07 |
CN114026557A (zh) | 2022-02-08 |
WO2021002136A1 (ja) | 2021-01-07 |
JPWO2021002137A1 (ja) | 2021-01-07 |
US20220114348A1 (en) | 2022-04-14 |
JPWO2021002136A1 (ja) | 2021-01-07 |
CN114072786A (zh) | 2022-02-18 |
WO2021002137A1 (ja) | 2021-01-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7407190B2 (ja) | 発話解析装置、発話解析方法及びプログラム | |
JP6755304B2 (ja) | 情報処理装置 | |
CN108630193B (zh) | 语音识别方法及装置 | |
US11450311B2 (en) | System and methods for accent and dialect modification | |
CN107818798A (zh) | 客服服务质量评价方法、装置、设备及存储介质 | |
US10839788B2 (en) | Systems and methods for selecting accent and dialect based on context | |
US10592997B2 (en) | Decision making support device and decision making support method | |
CN109313892A (zh) | 稳健的语言识别方法和系统 | |
CN110570853A (zh) | 基于语音数据的意图识别方法和装置 | |
US11270691B2 (en) | Voice interaction system, its processing method, and program therefor | |
JP2015219480A (ja) | 対話状況特徴計算装置、文末記号推定装置、これらの方法及びプログラム | |
CN112053702B (zh) | 一种语音处理的方法、装置及电子设备 | |
US20220392485A1 (en) | System and Method For Identifying Sentiment (Emotions) In A Speech Audio Input | |
JP2020034683A (ja) | 音声認識装置、音声認識プログラムおよび音声認識方法 | |
JP6616038B1 (ja) | 営業トークナビゲーションシステム、営業トークナビゲーション方法および営業トークナビゲーション用プログラム | |
JP2021124530A (ja) | 情報処理装置、情報処理方法及びプログラム | |
KR20210000802A (ko) | 인공지능 음성 인식 처리 방법 및 시스템 | |
WO2020196743A1 (ja) | 評価システム及び評価方法 | |
CN113593523A (zh) | 基于人工智能的语音检测方法、装置及电子设备 | |
CN116741143B (zh) | 基于数字分身的个性化ai名片的交互方法及相关组件 | |
EP4024395A1 (en) | Speech analyser and related method | |
Patel et al. | Google duplex-a big leap in the evolution of artificial intelligence | |
KR20230156482A (ko) | 음성으로부터 감정 상태를 추론하는 신경망 기반의 감정 상태 추론 장치 및 방법 | |
JP2022082049A (ja) | 発話評価方法および発話評価装置 | |
CN117219118A (zh) | 音频质检的方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A529 | Written submission of copy of amendment under article 34 pct |
Free format text: JAPANESE INTERMEDIATE CODE: A5211 Effective date: 20211227 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230509 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230926 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231120 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231205 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20231218 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7407190 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |