JP7370521B2 - 音声分析装置、音声分析方法、オンラインコミュニケーションシステム、およびコンピュータプログラム - Google Patents
音声分析装置、音声分析方法、オンラインコミュニケーションシステム、およびコンピュータプログラム Download PDFInfo
- Publication number
- JP7370521B2 JP7370521B2 JP2020012609A JP2020012609A JP7370521B2 JP 7370521 B2 JP7370521 B2 JP 7370521B2 JP 2020012609 A JP2020012609 A JP 2020012609A JP 2020012609 A JP2020012609 A JP 2020012609A JP 7370521 B2 JP7370521 B2 JP 7370521B2
- Authority
- JP
- Japan
- Prior art keywords
- sentence
- question
- text
- speaker
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
図1に示されている、音声分析装置100は、複数人の会話をテキスト化して、データベースを参照してテキスト化された文の中から質問文を推定すると共に、話者の切り替わりを検知することで質問文と推定された文を質問文と判断する装置である。
音声分析装置100は、メモリなどの記憶媒体、プロセッサ、通信モジュール、及び入力/出力インターフェース等で構成され、プロセッサが記憶媒体に記録されたコンピュータプログラムを実行することで、図1に示した機能ブロックを実現するようになっている。記憶媒体は、コンピュータ読み取り可能記録媒体であって、RAM(random access memory)、ROM(read only memory)、ディスクドライブ、SSD(solid state drive)、フラッシュメモリ(flash memory)のような記憶装置等を含んでよい。ここで、ROMやディスクドライブ、SSD、フラッシュメモリのような非一時的、記憶装置は、メモリとは区分される別の格納装置として音声分析装置100に含まれてもよい。
音声取得部101は、マイクロフォンによって入力された音声が複数存在する場合は、音声が取得できる状態になるまで音声取得を保留してもよい。また、複数の話者による音声を同時に取得してもよい。
音声取得部101による音声取得は、ユーザにより音声取得を開始するアイコンやボタン等を押下することで開始してもよく、音声取得を終了するアイコンやボタン等を押下することで終了してもよい。
音声取得部101が取得する音声は、人に限らず機械のマイクロフォンを通して出力される音声でもよい。
なお、テキスト化された全文を構成する個々の文は、句点によって区切られた文を一つの意味のある文とみなし、当該一つの意味のある文ごとに質問文であるかどうかを推定する。
また、イントネーションに基づき質問文であるかを推定する際に使用する技術は、語尾のイントネーションが疑問形なのかそれ以外なのかを推定できるものであればよい。例えば、音声分析技術であるピッチ抽出等を使用してもよい。
例えば、発話したユーザを識別可能とする識別効果を設定する。具体例では、AさんとBさんが会話をしている時に、識別部104がAさんの音声とBさんの音声を識別し、テキストデータ中のAさんの音声部分に赤色の文字を設定し、Bさんの音声部分に青色の文字を設定する。このような色分けの例に限らず、識別効果設定部108による識別効果は、所定の文と他の文を識別できるようになっていればよい。
<実施例1>
(ステップS101)音声取得部101は、複数人が会話をしている時に、当該複数人のそれぞれの音声を取得する。音声取得部101が使用する機器は、マイクロフォン等の音声入力をするため機器である。音声取得部101が音声を取得する時は、発話者が一人である場合でも複数人の発話者が同時に発話している場合でも良い。音声取得部101が取得した音声データの形式は問わない。
なお、識別部104による話者の識別は少なくとも、特定部103により質問文を特定してから、当該質問文とその直後の文について、検知部105が話者の切り替わりを検知するまでに実行されていれば、検知部105による話者の切り替わりの検知の処理に利用することができる。
例えば、図3のAさんの「明日のご予定はいかがでしょうか。」という文が、特定部103によって質問文と推定される文として特定された時に、識別部104は、この文とその直後の「明日の午前11時からでよろしいでしょうか。」という文の話者を識別できる。そして、検知部105が話者の切り替わりを検知することで、前記「明日のご予定はいかがでしょうか。」という文が質問文と判別される。
なお、このステップS104で検知部105が話者の切り替えを検知する処理では、識別部104がそれぞれの文の話者を識別できるため、その識別結果を利用して検知部105が話者の切り替わりを検知しているが、これに限らず、話者を特定することなく、話者の切り替わり検知できれば、最終的に質問文を判別する精度は担保される。
<実施例2>
なお、本発明に係るすべての実施形態について、音声分析装置100が対象とする音声の言語はいかなるものについても適用可能である。
本実施形態によれば、複数人での会話において、入力された音声をテキスト化し、質問文を精度よく特定することで、テキスト化された会話の中から所望の話題等を探すことが容易になる。特に、商談等では、質問文が商談の成否に重要なことが多いため、質問文に着目して会話内容をレビューできて便利である。
以上、実施形態に基づいて本発明を説明したが、本発明は、上述した実施形態に限定されるものではなく、本発明の要旨の範囲内で種々の変形や応用が可能なことは勿論である。
オンラインコミュニケーションシステム1とは、インターネットを利用したユーザ間で音声通話やビデオ通話、チャット等、又はそれらを組み合わせてコミュニケーションをとるシステムである。近年は、オンラインコミュニケーションシステム1によって、遠隔地に所在している人と会議などを行うことがある。
本実施形態の補足では、このコミュニケーションIDは四桁の数字によって構成されている。このように桁数が抑えられた数字のみによって構成されていることで、ユーザや顧客が容易に覚えることができると共に、顧客がユーザにコミュニケーションIDを伝える際に、間違いにくくなっている。
ここで、顧客アドレスは、顧客端末4をネットワークNW上で識別可能な情報であって、例えばIPアドレスとして構成される。
また、顧客情報取得部12はこのほか、顧客端末4の利用環境に係る情報として、顧客端末4のOS(Operating System)に係る情報や、ウェブカメラ等のデバイスを顧客端末4が備えているか否かといった情報なども取得する。
検索の結果はユーザ端末3に対して提供され、これによりユーザは、オンラインコミュニケーションシステム1に対し、検索結果において示された顧客端末4とのコミュニケーションの開始を要求する。
また、設定処理部14は、ユーザ端末3から、所定のコミュニケーションIDと関連付けられた顧客アドレスによって識別される顧客端末4とのコミュニケーションの開始要求を受信した際、コミュニケーション情報記憶部1Bを参照して、当該ユーザ端末3と、当該所定のコミュニケーションIDと関連付けられた顧客アドレスによって識別される顧客端末4との関連付けを設定する。
これにより、ユーザ端末3と顧客端末4が同じウェブページを共有することができると共に、当該ウェブページ上で行われたユーザあるいは顧客による端末操作が各端末の画面上に反映される。その結果、常に同じウェブページを参照すると共に、相手の端末操作を把握しながら、コミュニケーションを図ることができる。
これにより、削除されたコミュニケーションIDはその後に発生したコミュニケーションに対して発行可能となるため、コミュニケーションの増加に伴うコミュニケーションIDの増加を抑制することができる。
この通信処理部17により、顧客端末4に対してコミュニケーションIDを送信したり、ユーザ端末3から顧客端末4とのコミュニケーションの開始要求を受信したりすることができる。また、ユーザ端末3及び顧客端末4との間でセッションを確立し、両端末との同期をとるのに必要なデータの送受信が可能となっている。
このユーザ情報記憶部1Aには例えば、ユーザを識別するためのユーザIDに関連付けて、ユーザを認証するための認証情報、ユーザの名称や連絡先等に関するその他の詳細情報、ユーザが顧客とのコミュニケーションにおいて利用する文書データ等が記憶されている。
なお、文書データは、PDFやパワーポイント等の形式からなるデータであった場合、ウェブページを共有する本システムの利用時において、ウェブページに変換されて、ユーザと顧客によって共有される。ウェブページへの変換は、共有の都度、行われるものであってもよいし、予め行われていてもよい。
このコミュニケーション情報記憶部1Bには例えば、コミュニケーションごとに固有なコミュニケーションIDに関連付けて、顧客アドレスとユーザIDとが記憶されている。
このユーザ端末3は、所謂パーソナルコンピュータやタブレット端末などによって構成され、ディスプレイ、スピーカ、キーボード、タッチパネル、ポインティングデバイス、ヘッドセット等によって実現される入出力処理部、データの送受信を行うためのブラウザ等の通信処理部といった機能部を備える。
この顧客端末4は、所謂パーソナルコンピュータやタブレット端末、データ通信が可能な携帯型電話機端末などによって構成され、ディスプレイ、スピーカ、キーボード、タッチパネル、ポインティングデバイス等によって実現される入出力処理部、データの送受信を行うためのブラウザ等の通信処理部といった機能部を備える。
音声取得部21は、コンピュータに接続されているマイクロフォンから入力された音声を取得する。音声取得部21は、異なるコンピュータ間または同一のコンピュータで複数人が音声通話やビデオ通話をしている話者の音声を取得する。
2 音声分析システム
3 ユーザ端末
4 顧客端末
11 ID発行部
12 顧客情報取得部
13 検索処理部
14 設定処理部
15 同期処理部
16 ID削除部
17 通信処理部
1A ユーザ情報記憶部
1B コミュニケーション情報記憶部
21 音声取得部
22 テキスト化部
23 特定部
24 識別部
25 検知部
26 判別部
27 分類部
28 識別効果設定部
100 音声分析装置
101 音声取得部
102 テキスト化部
103 特定部
104 識別部
105 検知部
106 判別部
107 分類部
108 識別効果設定部
Claims (11)
- マイクロフォンを通して入力された音声から、質問文を判別するための装置であって、
複数の話者による音声をテキスト化するテキスト化手段と、
テキスト化された音声から質問文と推定される文を特定する特定手段と、
話者の切り替わりを検知する検知手段と、
質問文と推定されると共に、直後に話者が切り替わる文を質問文と判別する判別手段と、を有する、
音声分析装置。 - 前記特定手段は、質問文において使用される表現を記憶した辞書に基づき、テキスト化された音声から質問文と推定される文を特定する、
請求項1記載の音声分析装置。 - 前記特定手段は、文の語尾のイントネーションに基づき、テキスト化された音声から質問文と推定される文を特定する、
請求項1又は2記載の音声分析装置。 - 質問文をカテゴライズする分類手段、をさらに有する、
請求項1乃至3いずれかの項に記載の音声分析装置。 - 所定の識別効果を質問文に設定する識別効果設定手段、をさらに有する、
請求項1乃至4いずれかの項に記載の音声分析装置。 - 前記識別効果設定手段はさらに、話者の切り替わり部分に所定の識別効果を設定する、
請求項5記載の音声分析装置。 - 音声の話者を識別する識別手段、をさらに有する、
請求項5又は6記載の音声分析装置。 - 前記識別効果設定手段はさらに、前記識別手段により識別された各ユーザの発話部分に対して発話者を識別可能な識別効果を設定する、
請求項7記載の音声分析装置。 - 前記請求項1乃至8いずれかの項に記載の音声分析装置、を備えた、
オンラインコミュニケーションシステム。 - マイクロフォンを通して入力された音声から、質問文を判別するコンピュータが、
複数の話者による音声をテキスト化するテキスト化ステップと、
テキスト化された音声から質問文と推定される文を特定する特定ステップと、
話者の切り替わりを検知する検知ステップと、
質問文と推定されると共に、直後に話者が切り替わる文を質問文と判別する判別ステップと、を実行する、
ことを特徴とする音声分析方法。 - マイクロフォンを通して入力された音声から、質問文を判別するコンピュータに対して、
複数の話者による音声をテキスト化するテキスト化処理と、
テキスト化された音声から質問文と推定される文を特定する特定処理と、
話者の切り替わりを検知する検知処理と、
質問文と推定されると共に、直後に話者が切り替わる文を質問文と判別する判別処理と、を実行させる、
ことを特徴とするコンピュータプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020012609A JP7370521B2 (ja) | 2020-01-29 | 2020-01-29 | 音声分析装置、音声分析方法、オンラインコミュニケーションシステム、およびコンピュータプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020012609A JP7370521B2 (ja) | 2020-01-29 | 2020-01-29 | 音声分析装置、音声分析方法、オンラインコミュニケーションシステム、およびコンピュータプログラム |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2021117444A JP2021117444A (ja) | 2021-08-10 |
JP2021117444A5 JP2021117444A5 (ja) | 2022-12-28 |
JP7370521B2 true JP7370521B2 (ja) | 2023-10-30 |
Family
ID=77174753
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020012609A Active JP7370521B2 (ja) | 2020-01-29 | 2020-01-29 | 音声分析装置、音声分析方法、オンラインコミュニケーションシステム、およびコンピュータプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7370521B2 (ja) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011123565A (ja) | 2009-12-08 | 2011-06-23 | Nomura Research Institute Ltd | Faq候補抽出システムおよびfaq候補抽出プログラム |
JP2018169506A (ja) | 2017-03-30 | 2018-11-01 | トヨタ自動車株式会社 | 会話満足度推定装置、音声処理装置および会話満足度推定方法 |
WO2019003395A1 (ja) | 2017-06-29 | 2019-01-03 | 株式会社オプティム | コールセンター会話内容表示システム、方法及びプログラム |
-
2020
- 2020-01-29 JP JP2020012609A patent/JP7370521B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011123565A (ja) | 2009-12-08 | 2011-06-23 | Nomura Research Institute Ltd | Faq候補抽出システムおよびfaq候補抽出プログラム |
JP2018169506A (ja) | 2017-03-30 | 2018-11-01 | トヨタ自動車株式会社 | 会話満足度推定装置、音声処理装置および会話満足度推定方法 |
WO2019003395A1 (ja) | 2017-06-29 | 2019-01-03 | 株式会社オプティム | コールセンター会話内容表示システム、方法及びプログラム |
Non-Patent Citations (1)
Title |
---|
福岡知隆, 白井清昭,対話行為に固有の特徴を考慮した自由対話システムにおける対話行為推定,自然言語処理,第24巻, 第4号,2017年09月15日,pp.523-546 |
Also Published As
Publication number | Publication date |
---|---|
JP2021117444A (ja) | 2021-08-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10586541B2 (en) | Communicating metadata that identifies a current speaker | |
KR102151681B1 (ko) | 언어 모델용 대화 상태들 결정 | |
US10270736B2 (en) | Account adding method, terminal, server, and computer storage medium | |
US9483582B2 (en) | Identification and verification of factual assertions in natural language | |
CN109361825A (zh) | 会议纪要记录方法、终端及计算机存储介质 | |
KR102548365B1 (ko) | 회의 기록 자동 생성 방법 및 그 장치 | |
US20200004878A1 (en) | System and method for generating dialogue graphs | |
KR20180123150A (ko) | 정보 처리 시스템, 접수 서버, 정보 처리 방법 및 프로그램 | |
JP2017152948A (ja) | 情報提供方法、情報提供プログラム、および情報提供システム | |
CN106713111B (zh) | 一种添加好友的处理方法、终端及服务器 | |
CN112468665A (zh) | 一种会议纪要的生成方法、装置、设备及存储介质 | |
CN111063355A (zh) | 会议记录的生成方法及记录终端 | |
KR102198424B1 (ko) | 통화 녹음 정보 관리방법, 이를 위한 컴퓨터 프로그램 | |
CN111626061A (zh) | 会议记录生成方法、装置、设备及可读存储介质 | |
CN113064983A (zh) | 语义检测方法、装置、计算机设备及存储介质 | |
JP2020064493A (ja) | オンラインコミュニケーションのレビューシステム、方法、及びコンピュータプログラム | |
US20090007148A1 (en) | Search tool that aggregates disparate tools unifying communication | |
CN114064943A (zh) | 会议管理方法、装置、存储介质及电子设备 | |
JP2010002973A (ja) | 音声データ主題推定装置およびこれを用いたコールセンタ | |
JP4143541B2 (ja) | 動作モデルを使用して非煩雑的に話者を検証するための方法及びシステム | |
CN113327129A (zh) | 客服任务处理方法及装置 | |
KR102284912B1 (ko) | 상담 서비스 제공 방법 및 장치 | |
JP7370521B2 (ja) | 音声分析装置、音声分析方法、オンラインコミュニケーションシステム、およびコンピュータプログラム | |
JPWO2014069121A1 (ja) | 会話分析装置及び会話分析方法 | |
US20220207066A1 (en) | System and method for self-generated entity-specific bot |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221220 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20221220 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230926 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231005 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20231006 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7370521 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |