JP6055804B2 - 内容抽出装置、内容抽出方法及びコンピュータプログラム - Google Patents
内容抽出装置、内容抽出方法及びコンピュータプログラム Download PDFInfo
- Publication number
- JP6055804B2 JP6055804B2 JP2014181405A JP2014181405A JP6055804B2 JP 6055804 B2 JP6055804 B2 JP 6055804B2 JP 2014181405 A JP2014181405 A JP 2014181405A JP 2014181405 A JP2014181405 A JP 2014181405A JP 6055804 B2 JP6055804 B2 JP 6055804B2
- Authority
- JP
- Japan
- Prior art keywords
- words
- utterance
- content
- threshold
- conversation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Telephonic Communication Services (AREA)
- Machine Translation (AREA)
Description
[概略]
本発明における内容抽出システムでは、会話者間の会話内容の音声データをテキスト化したテキストデータを用いてテキストデータ内から所望の内容を抽出する。具体的には、本発明における内容抽出システムでは、テキストデータに含まれる会話者それぞれの発話のうち、特定の会話者の所定期間内の発話(以下、「一発話」という。)を構成する単語の単語数が閾値以上である場合に、単語数が閾値以上である一発話の内容を所望の内容としてテキストデータから抽出する。所定期間内の発話とは、例えば他の会話者が発話するまでのある会話者の発話を表す。より具体的には、A(他の会話者)が発話してから所定の時間経過後にB(特定の会話者)が発話して、B(特定の会話者)が発話してから所定の時間経過後にA(他の会話者)が発話する状況を考えた場合、本実施形態ではB(特定の会話者)が発話してA(他の会話者)が発話するまでの期間を所定期間とし、当該所定期間内のB(特定の会話者)の発話を所定期間内の発話とする。
以下、内容抽出システムの具体的な構成について説明する。
コールセンタ20は、利用者への電話対応業務を専門に行う事業所である。
通話録音装置22は、利用者用端末10のユーザ(利用者)と従業員用端末21のユーザ(従業員)との通話音声を録音する。通話録音装置22は、例えばコンバージャー等である。
内容抽出装置40は、音声認識サーバ30によって変換されたテキストデータから所望の内容を抽出する。例えば、内容抽出装置40は、オペレータ端末23によって入力された各種条件に従い、テキストデータから所望の内容を抽出する。なお、音声認識サーバ30から受信されたテキストデータには、例えば発話内容の「全文ひらがなの文字列」、発話内容が「かな漢字変換」された文字列、発話内容が「形態素解析」された単語の区切り情報等が含まれる。
第2ネットワーク60は、どのように構成されたネットワークでもよい。例えば、第2ネットワーク60はインターネットを用いて構成されてもよい。
オペレータ端末23は、バスで接続されたCPU(Central Processing Unit)やメモリや補助記憶装置などを備え、表示プログラムを実行する。表示プログラムの実行によって、オペレータ端末23は、入力部231、通信部232、表示制御部233、表示部234を備える装置として機能する。なお、オペレータ端末23の各機能の全て又は一部は、ASIC(Application Specific Integrated Circuit)やPLD(Programmable Logic Device)やFPGA(Field Programmable Gate Array)等のハードウェアを用いて実現されてもよい。また、表示プログラムは、コンピュータ読み取り可能な記録媒体に記録されてもよい。コンピュータ読み取り可能な記録媒体とは、例えばフレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置である。また、表示プログラムは、電気通信回線を介して送受信されてもよい。
内容抽出装置40は、バスで接続されたCPUやメモリや補助記憶装置などを備え、内容抽出プログラムを実行する。内容抽出プログラムの実行によって、内容抽出装置40は、通信部401、通信制御部402、記憶部403、会話種別判定部404、単語数取得部405、閾値決定部406、閾値判定部407、送信制御部408を備える装置として機能する。なお、内容抽出装置40の各機能の全て又は一部は、ASICやPLDやFPGA等のハードウェアを用いて実現されてもよい。また、内容抽出プログラムは、コンピュータ読み取り可能な記録媒体に記録されてもよい。コンピュータ読み取り可能な記録媒体とは、例えばフレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置である。また、内容抽出プログラムは、電気通信回線を介して送受信されてもよい。
会話情報記憶部4031は、磁気ハードディスク装置や半導体記憶装置などの記憶装置を用いて構成される。会話情報記憶部4031は、会話情報テーブルを記憶する。会話情報テーブルには、会話情報に関するレコード(以下、「会話情報レコード」という。)が登録されている。
会話情報テーブルは、会話情報レコード70を複数有する。会話情報レコード70は、会話ID、内線番号、日時、応対履歴及びテキストデータの各値を有する。会話IDの値は、会話を一意に識別するための識別情報を表す。内線番号の値は、同じ会話情報レコード70の会話の対応を行った従業員の内線番号を表す。日時の値は、同じ会話情報レコード70の会話の対応を行った日時を表す。応対履歴の値は、同じ会話情報レコード70の会話の対応を行った従業員が入力した応対履歴を表す。テキストデータの値は、同じ会話情報レコード70の会話内容の音声データがテキスト化されたデータを表す。
条件記憶部4032は、磁気ハードディスク装置や半導体記憶装置などの記憶装置を用いて構成される。条件記憶部4032は、対象データ条件、閾値決定条件及び発話内容抽出条件などの各種条件を記憶する。
会話種別判定部404は、会話情報テーブルに記憶されている応対履歴に基づいて対話種別を判定する。そして、会話種別判定部404は、条件記憶部4032に記憶されている対象データ条件に基づいて、会話情報テーブルに記憶されているテキストデータのうち、対象データ条件を満たすテキストデータを会話情報テーブルから抽出する。
閾値決定部406は、条件記憶部4032に記憶されている閾値決定条件に従って閾値を決定する。例えば、閾値決定条件として管理者が直接入力した閾値が設定されている場合、閾値決定部406は管理者が直接入力した閾値を、一発話を構成する単語の単語数と比較する基準となる閾値に決定する。
送信制御部408は、通信部401の送信を制御する。
オペレータ端末23の表示部234には、画面に表示させる対象となる会話内容の条件を設定する条件設定領域205と、内容抽出装置40によって抽出された、条件を満たす会話内容が表示される結果表示領域206とが表示される。管理者がオペレータ端末23の入力部231において、条件設定領域205に条件を入力する前には結果表示領域206には何も表示されない。
このように、所望の内容を他の発話内容と異なる表示態様で表示させることにより、管理者は所望の内容を容易に把握することができる。
図6において、縦軸は密度を表し、横軸は単語数を表す。図6には、利用者とコールセンタ20の従業員との会話における利用者の一発話の単語数の分布傾向が示されている。図6に示されるように、利用者の発話の内容は、単語数に応じて3つに分類することができる(図6のA、B、C)。
また、従業員用端末21は、応対履歴情報を内容抽出装置40に送信する(ステップS102)。
内容抽出装置40の通信部401は、オペレータ端末23から送信された条件信号を受信する。通信部401は、受信した条件信号を通信制御部402に出力する。通信制御部402は、条件信号に含まれる各種条件を条件記憶部4032に記録する(ステップS106)。
オペレータ端末23の通信部232は、内容抽出装置40から送信された会話内容を受信する。表示制御部233は、受信された会話内容を表示部234に表示させる。この際、表示制御部233は、所望の内容を他の会話内容と異なる表示態様で表示部234に表示させる。表示部234は、表示制御部233の制御に従って所望の内容を画面に表示する(ステップS113)。
本実施形態では、内容抽出システム100には1台の利用者用端末10が接続されているが、内容抽出システム100には2台以上の利用者用端末10が接続されてもよい。
本実施形態では、会話情報記憶部4031に蓄積された会話情報を用いて所望の内容を抽出する構成を示したが、内容抽出装置40はリアルタイムに所望の内容を抽出するように構成されてもよい。
本実施形態における内容抽出システム100は、上述の場面(例えば、コールセンタ)以外にも適用可能である。例えば、内容抽出システム100は、小説や絵本などの書物をOCRにより文書に変換することで生成されたテキストデータを用いて所望の内容を抽出することも可能である。
(一発話を構成する単語の単語数の平均値を閾値とする場合)
閾値決定部406は、以下の式1に基づいて閾値xtを算出する。
閾値決定部406は、以下の式2に基づいて閾値xtを算出する。
閾値決定部406は、以下の式3に基づいて閾値xtを算出する。
閾値決定部406は、以下の式4に基づいて閾値xtを算出する。
Claims (4)
- テキストデータを取得する取得部と、
取得された前記テキストデータを構成する単語の単語数を所定の区間毎に取得する単語数取得部と、
取得された前記単語数が閾値以上である区間内の単語で構成される内容を前記テキストデータから抽出する抽出部と、
を備え、
前記テキストデータは、会話内容の音声データがテキスト化されたデータであり、
前記単語数取得部は、前記会話内容において、特定の会話者の所定期間内の発話毎に単語数を取得し、
前記抽出部は、前記会話内容のうち、前記単語数が閾値以上である所定期間内の発話と前記所定期間内の発話の前後所定数の発話とをテキスト化したデータを抽出し、
前記単語数が閾値以上であるか否かを判定する閾値判定部をさらに備え、
前記閾値判定部は、前記特定の会話者の所定期間内の発話を構成する単語の単語数と、前記特定の会話者の所定期間内の発話の前又は後の発話を構成する単語の単語数との差が第1の閾値以上である場合に前記単語数が閾値以上であると判定する内容抽出装置。 - 前記単語数が閾値以上である所定期間内の発話と、前記単語数が閾値未満である所定期間内の発話とを異なる表示態様で表示部に表示させる表示制御部をさらに備える、請求項1に記載の内容抽出装置。
- テキストデータから所望の内容を抽出する内容抽出装置が行う内容抽出方法であって、
前記内容抽出装置が、前記テキストデータを取得する取得ステップと、
前記内容抽出装置が、取得した前記テキストデータを構成する単語の単語数を所定の区間毎に取得する単語数取得ステップと、
前記内容抽出装置が、取得した前記単語数が閾値以上である区間内の単語で構成される内容を前記テキストデータから抽出する抽出ステップと、
を有し、
前記テキストデータは、会話内容の音声データがテキスト化されたデータであり、
前記内容抽出装置が、前記単語数取得ステップにおいて、前記会話内容から、特定の会話者の所定期間内の発話毎に単語数を取得し、
前記内容抽出装置が、前記抽出ステップにおいて、前記会話内容のうち、前記単語数が閾値以上である所定期間内の発話と前記所定期間内の発話の前後所定数の発話とをテキスト化したデータを抽出し、
前記内容抽出装置が、前記単語数が閾値以上であるか否かを判定する閾値判定ステップをさらに有し、
前記内容抽出装置が、前記閾値判定ステップにおいて、前記特定の会話者の所定期間内の発話を構成する単語の単語数と、前記特定の会話者の所定期間内の発話の前又は後の発話を構成する単語の単語数との差が第1の閾値以上である場合に前記単語数が閾値以上であると判定する内容抽出方法。 - テキストデータを取得する取得ステップと、
取得された前記テキストデータを構成する単語の単語数を所定の区間毎に取得する単語数取得ステップと、
取得された前記単語数が閾値以上である区間内の単語で構成される内容を前記テキストデータから抽出する抽出ステップと、
をコンピュータに実行させ、
前記テキストデータは、会話内容の音声データがテキスト化されたデータであり、
前記単語数取得ステップにおいて、前記会話内容から、特定の会話者の所定期間内の発話毎に単語数を取得し、
前記抽出ステップにおいて、前記会話内容のうち、前記単語数が閾値以上である所定期間内の発話と前記所定期間内の発話の前後所定数の発話とをテキスト化したデータを抽出し、
前記単語数が閾値以上であるか否かを判定する閾値判定ステップをさらにコンピュータに実行させ、
前記閾値判定ステップにおいて、前記特定の会話者の所定期間内の発話を構成する単語の単語数と、前記特定の会話者の所定期間内の発話の前又は後の発話を構成する単語の単語数との差が第1の閾値以上である場合に前記単語数が閾値以上であると判定するためのコンピュータプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014181405A JP6055804B2 (ja) | 2014-09-05 | 2014-09-05 | 内容抽出装置、内容抽出方法及びコンピュータプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014181405A JP6055804B2 (ja) | 2014-09-05 | 2014-09-05 | 内容抽出装置、内容抽出方法及びコンピュータプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016057355A JP2016057355A (ja) | 2016-04-21 |
JP6055804B2 true JP6055804B2 (ja) | 2016-12-27 |
Family
ID=55758292
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014181405A Active JP6055804B2 (ja) | 2014-09-05 | 2014-09-05 | 内容抽出装置、内容抽出方法及びコンピュータプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6055804B2 (ja) |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08166954A (ja) * | 1994-12-13 | 1996-06-25 | Sharp Corp | 翻訳支援装置 |
JPH09134358A (ja) * | 1995-11-13 | 1997-05-20 | Oki Electric Ind Co Ltd | 機械翻訳装置 |
JP3696765B2 (ja) * | 1999-04-23 | 2005-09-21 | シャープ株式会社 | 辞書作成装置、辞書作成方法、辞書作成プログラムを記録したコンピュータで読取可能な記録媒体および翻訳装置 |
JP3791877B2 (ja) * | 1999-06-15 | 2006-06-28 | 富士通株式会社 | 文書の参照理由を用いて情報検索を行う装置 |
JP2004326315A (ja) * | 2003-04-23 | 2004-11-18 | Nippon Hoso Kyokai <Nhk> | 文書要約装置、文書要約方法、及びそのプログラム |
JP2007102662A (ja) * | 2005-10-07 | 2007-04-19 | Advanced Telecommunication Research Institute International | 情報処理装置、およびプログラム |
JP4662861B2 (ja) * | 2006-02-07 | 2011-03-30 | 日本電気株式会社 | モニタリング装置、評価データ選別装置、応対者評価装置、応対者評価システムおよびプログラム |
JP2011103075A (ja) * | 2009-11-11 | 2011-05-26 | Kansai Electric Power Co Inc:The | 抜粋文抽出方法 |
JP2010266880A (ja) * | 2010-06-23 | 2010-11-25 | Sony Corp | 携帯端末装置、情報処理方法、及びプログラム |
-
2014
- 2014-09-05 JP JP2014181405A patent/JP6055804B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2016057355A (ja) | 2016-04-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9621698B2 (en) | Identifying a contact based on a voice communication session | |
US10462300B2 (en) | Technologies for monitoring interaction between customers and agents using sentiment detection | |
US8442563B2 (en) | Automated text-based messaging interaction using natural language understanding technologies | |
US20170034479A1 (en) | Video endpoints and related methods for transmitting stored text to other video endpoints | |
KR102136706B1 (ko) | 정보 처리 시스템, 접수 서버, 정보 처리 방법 및 프로그램 | |
JP2016103270A (ja) | 情報処理システム、受付サーバ、情報処理方法及びプログラム | |
US9172795B1 (en) | Phone call context setting | |
US20150279391A1 (en) | Dissatisfying conversation determination device and dissatisfying conversation determination method | |
US11398224B2 (en) | Communication system and method for providing advice to improve a speaking style | |
JPWO2015083741A1 (ja) | 中継装置、表示装置および通信システム | |
US11343290B2 (en) | Methods and systems for facilitating context-to-call communications between communication points in multiple communication modes | |
JP6570893B2 (ja) | 翻訳支援システムおよび情報処理装置 | |
JP7028179B2 (ja) | 情報処理装置、情報処理方法およびコンピュータ・プログラム | |
JP5691174B2 (ja) | オペレータ選定装置、オペレータ選定プログラム、オペレータ評価装置、オペレータ評価プログラム及びオペレータ評価方法 | |
CN107331396A (zh) | 输出数字的方法及装置 | |
JP6055804B2 (ja) | 内容抽出装置、内容抽出方法及びコンピュータプログラム | |
US10984229B2 (en) | Interactive sign language response system and method | |
CN115118820A (zh) | 一种通话处理方法、装置、计算机设备及存储介质 | |
CN109005304A (zh) | 一种排队方法及装置、计算机可读存储介质 | |
CN112969000A (zh) | 网络会议的控制方法、装置、电子设备和存储介质 | |
CN110895657B (zh) | 一种基于口语对话特征的语义逻辑表达和分析方法 | |
US20230412764A1 (en) | Analysis apparatus, system, method, and non-transitory computer readable medium storing program | |
US20220188526A1 (en) | Translation device and method for the hearing impaired | |
CN115731937A (zh) | 信息处理方法、装置、电子设备及存储介质 | |
JP2024084169A (ja) | 音声認識システム、及び、音声認識方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160412 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160610 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20161108 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20161205 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6055804 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |