WO2022185360A1 - 支援装置、支援方法およびプログラム - Google Patents

支援装置、支援方法およびプログラム Download PDF

Info

Publication number
WO2022185360A1
WO2022185360A1 PCT/JP2021/007622 JP2021007622W WO2022185360A1 WO 2022185360 A1 WO2022185360 A1 WO 2022185360A1 JP 2021007622 W JP2021007622 W JP 2021007622W WO 2022185360 A1 WO2022185360 A1 WO 2022185360A1
Authority
WO
WIPO (PCT)
Prior art keywords
call
label
teacher data
utterance
inference
Prior art date
Application number
PCT/JP2021/007622
Other languages
English (en)
French (fr)
Inventor
翔太 折橋
雅人 澤田
Original Assignee
日本電信電話株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電信電話株式会社 filed Critical 日本電信電話株式会社
Priority to US18/279,590 priority Critical patent/US20240144057A1/en
Priority to JP2023503531A priority patent/JPWO2022185360A1/ja
Priority to PCT/JP2021/007622 priority patent/WO2022185360A1/ja
Publication of WO2022185360A1 publication Critical patent/WO2022185360A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • G06N5/046Forward inferencing; Production systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Definitions

  • Non-Patent Documents 1 and 2 above require a large amount of teacher data in order to bring the estimation accuracy to a level that can withstand practical use.
  • high estimation accuracy can be obtained by learning a model by creating training data from call center conversation logs of about 1000 calls.
  • Teacher data is created by an operator (teacher data creator) assigning a label to each uttered text while referring to uttered texts obtained by speech recognition of uttered voices.
  • the purpose of the present disclosure which has been made in view of the above problems, is to provide a support device, support method, and program that can more efficiently evaluate teacher data creators.
  • speech text corresponding to the operator's speech (hereinafter, the speech text corresponding to the speech may be simply referred to as "speech text") is indicated by a solid-line balloon, and the customer's speech text is indicated by a dotted-line balloon. is shown.
  • the call-by-call inference result evaluation unit 13 receives input of teacher data and the inference result of the label inference unit 12 .
  • teacher data includes a group of spoken texts for a plurality of calls made by a plurality of speakers.
  • the teacher data includes multiple element groups consisting of multiple elements in sequence.
  • the call-by-call inference result evaluation unit 13 evaluates the input teacher data and the inference result of the label inference unit 12 for each call.
  • the call-by-call reasoning result evaluation unit 13 outputs the evaluation result (call-by-call evaluation result) to the call-by-call confirmation screen generation unit 14 and the external output interface 1 . The details of the call-by-call evaluation results will be described later.
  • the call-by-call confirmation screen generation unit 14 generates, for each call, a beginning time that is the time when an utterance that constitutes a call is started, an end time that is the time when the utterance ends, and an utterance text. , and the correct label and inference label for each uttered text, to generate a confirmation screen for each call.
  • the call-by-call confirmation screen generation unit 14 generates a teacher data confirmation screen including elements that constitute teacher data, correct labels of the elements, and inference labels of the elements.
  • the call-by-call confirmation screen generation unit 14 displays the correct label and the inference label corresponding to the elements constituting the teacher data in a comparable manner (for example, as shown in FIG.
  • the support device 10A further includes an inference error exclusion unit 18 that excludes elements whose inference labels inferred by a trained model are determined to be erroneous according to a predetermined rule.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Machine Translation (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本開示に係る教師データ確認支援装置(10)は、要素と、要素に対応する正解ラベルとが対応付けられた教師データを用いて学習された、要素に対応するラベルを推論するモデルを用いて、教師データを構成する要素に対応するラベルである推論ラベルを推論するラベル推論部(12)と、教師データを構成する要素に対応する正解ラベルと、前記要素の推論ラベルとの比較に基づき、前記教師データ作成者の評価結果を生成する評価部(17)と、を備える。

Description

支援装置、支援方法およびプログラム
 本開示は、支援装置、支援方法およびプログラムに関する。
 近年、コンタクトセンタにおける応対品質の向上を目的として、通話内容をリアルタイムに音声認識し、自然言語処理技術を駆使して応対中のオペレータに適切な情報を自動的に提示するシステムが提案されている。
 例えば、非特許文献1には、オペレータとカスタマとの対話において、予め想定される質問事項とその質問事項に対する回答(FAQ)とをオペレータに提示する技術が開示されている。この技術では、オペレータとカスタマとの対話が音声認識され、話者が話し終わったかを判定する「話し終わり判定」により、意味的なまとまりのある発話テキストに変換される。次に、発話テキストに対応する発話が、オペレータによる挨拶、カスタマの用件の確認、用件への対応あるいは対話のクロージングといった、対話におけるどの応対シーンでの発話であるかを推定する「応対シーン推定」が行われる。「応対シーン推定」により対話の構造化が行われる。「応対シーン推定」の結果から、カスタマの用件を含む発話あるいはオペレータがカスタマの用件を確認する発話を抽出する「FAQ検索発話判定」が行われる。予め用意されたFAQのデータベースに対して、「FAQ検索発話判定」により抽出された発話に基づく検索クエリを用いた検索が行われ、検索結果がオペレータに提示される。
 上述した「話し終わり判定」、「応対シーン推定」および「FAQ検索発話判定」には、発話テキストに対して、発話を区分するラベルが付与された教師データを、深層ニューラルネットワークなどを用いて学習することで構築されたモデルが用いられる。したがって、「話し終わり判定」、「応対シーン推定」および「FAQ検索発話判定」は、系列的な要素(対話における発話)にラベル付けする系列ラベリング問題として捉えることができる。非特許文献2には、系列的な発話に、その発話が含まれる応対シーンに対応するラベルを付与した大量の教師データを、長短期記憶を含む深層ニューラルネットワークにより学習することで、応対シーンを推定する技術が記載されている。
長谷川隆明, 関口裕一郎, 山田節夫, 田本真詞, "オペレータの応対を支援する自動知識支援システム," NTT技術ジャーナル, vol.31, no.7, pp.16-19, Jul. 2019. R. Masumura, S. Yamada, T. Tanaka, A. Ando, H. Kamiyama, and Y. Aono, "Online Call Scene Segmentation of Contact Center Dialogues based on Role Aware Hierarchical LSTM-RNNs," Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC), Nov. 2018.
 上述した非特許文献1,2に記載の技術では、推定精度を実用に耐えうる水準にするためには、大量の教師データが必要となる。例えば、非特許文献1によれば、1000通話程度のコールセンタの対話ログから教師データを作成してモデルを学習することで、高い推定精度を得ることができる。教師データは、作業者(教師データ作成者)が、発話音声の音声認識により得られた発話テキストを参照しながら、各発話テキストにラベルを付与することで作成される。
 教師データは、その教師データを用いて学習されるモデルの適用先(例えば、コンタクトセンタの業界ごと)に合わせて作成する必要がある。上述したように、高い推定精度を得るためには、大量の教師データが必要となることから、ラベルを付与する教師データの作成作業は、複数の作業者により行われることが多い。ここで、作業者ごとに、経験あるいはラベル付与の細かなポリシーが異なることから、同じ内容の発話であっても、異なるラベルが付与されてしまうという、ラベル付与のブレが生じることがある。教師データにラベルのブレが生じると、その教師データを用いて学習したモデルの推定精度の低下を招いてしまう。ここで、どの教師データ作成者が作成した教師データが原因でラベル付与のブレが生じているかを効率的に確認する手法が確立されておらず、従来は、有識者による暗黙知による分析あるいはトライアンドエラーの繰り返しが必要であった。
 したがって、教師データ作成者の評価をより効率的に行うことができる技術が求められている。
 上記のような問題点に鑑みてなされた本開示の目的は、教師データ作成者の評価をより効率的に行うことができる支援装置、支援方法およびプログラムを提供することにある。
 上記課題を解決するため、本開示に係る支援装置は、要素と、前記要素に対応する正解ラベルとの組からなる教師データを作成する教師データ作成者の評価を支援する支援装置であって、前記教師データを用いて学習された、前記要素に対応するラベルを推論するモデルを用いて、前記教師データを構成する要素に対応するラベルである推論ラベルを推論するラベル推論部と、前記教師データを構成する要素に対応する正解ラベルと、前記要素の推論ラベルとの比較に基づき、前記教師データ作成者の評価結果を生成する評価部と、を備える。
 また、上記課題を解決するため、本開示に係る支援方法は、要素と、前記要素に対応する正解ラベルとの組からなる教師データを作成する教師データ作成者の評価を支援する支援装置における支援方法であって、前記教師データを用いて学習された、前記要素に対応するラベルを推論するモデルを用いて、前記教師データを構成する要素に対応するラベルである推論ラベルを推論するステップと、前記教師データを構成する要素に対応する正解ラベルと、前記要素の推論ラベルとの比較に基づき、前記教師データ作成者の評価結果を生成するステップと、を含む。
 また、上記課題を解決するため、本開示に係るプログラムは、コンピュータを上述した支援装置として機能させる。
 本開示に係る支援装置、支援方法およびプログラムによれば、教師データ作成者の評価をより効率的に行うことができる。
本開示の第1の実施形態に係る支援装置として機能するコンピュータの概略構成を示すブロック図である。 本開示の第1の実施形態に係る支援装置の機能構成例を示す図である。 図2に示す支援装置の動作の一例を示すフローチャートである。 図2に示す通話別推論結果評価部による通話別評価結果の一例を示す図である。 図2に示す通話別確認画面生成部が生成する通話別確認画面の一例を示す図である。 図2に示す通話別確認画面生成部が生成する通話別確認画面の他の一例を示す図である。 図2に示す発話別推論結果評価部による発話別評価結果の一例を示す図である。 図2に示す発話別確認画面生成部が生成する発話別確認画面の一例を示す図である。 本開示の第2の実施形態に係る支援装置の機能構成例を示す図である。 図9に示す支援装置の動作の一例を示すフローチャートである。 本開示の第3の実施形態に係る支援装置の機能構成例を示す図である。 図11に示す支援装置の動作の一例を示すフローチャートである。 図11に示す教師データ作成者評価部による教師データ作成者評価結果の一例を示す図である。 図11に示す通話別推論結果評価部による通話別評価結果の一例を示す図である。 図11に示す通話別確認画面生成部が生成する通話別確認画面の一例を示す図である。 図11に示す発話別推論結果評価部による発話別評価結果の一例を示す図である。 図11に示す発話別推論結果評価部による発話別評価結果の他の一例を示す図である。 図11に示す発話別確認画面生成部が生成する発話別確認画面の一例を示す図である。 複数の項目からなるラベルの構造の一例を示す図である。
 以下、本開示の実施の形態について図面を参照して説明する。
(第1の実施形態)
 図1は、本開示の第1の実施形態に係る支援装置10がプログラム命令を実行可能なコンピュータである場合のハードウェア構成を示すブロック図である。ここで、コンピュータは、汎用コンピュータ、専用コンピュータ、ワークステーション、PC(Personal Computer)、電子ノートパッドなどであってもよい。プログラム命令は、必要なタスクを実行するためのプログラムコード、コードセグメントなどであってもよい。
 図1に示すように、支援装置10は、プロセッサ110、ROM(Read Only Memory)120、RAM(Random Access Memory)130、ストレージ140、入力部150、表示部160および通信インタフェース(I/F)170を有する。各構成は、バス190を介して相互に通信可能に接続されている。プロセッサ110は、具体的にはCPU(Central Processing Unit)、MPU(Micro Processing Unit)、GPU(Graphics Processing Unit)、DSP(Digital Signal Processor)、SoC(System on a Chip)などであり、同種または異種の複数のプロセッサにより構成されてもよい。
 プロセッサ110は、各構成の制御、および各種の演算処理を実行する。すなわち、プロセッサ110は、ROM120またはストレージ140からプログラムを読み出し、RAM130を作業領域としてプログラムを実行する。プロセッサ110は、ROM120ストレージ140に記憶されているプログラムに従って、上記各構成の制御および各種の演算処理を行う。本実施形態では、ROM120またはストレージ140には、本開示に係るプログラムが格納されている。
 プログラムは、CD-ROM(Compact Disk Read Only Memory)、DVD-ROM(Digital Versatile Disk Read Only Memory)、USB(Universal Serial Bus)メモリなどの非一時的(non-transitory)記憶媒体に記憶された形態で提供されてもよい。また、プログラムは、ネットワークを介して外部装置からダウンロードされる形態としてもよい。
 ROM120は、各種プログラムおよび各種データを格納する。RAM130は、作業領域として一時的にプログラム又はデータを記憶する。ストレージ140は、HDD(Hard Disk Drive)またはSSD(Solid State Drive)により構成され、オペレーティングシステムを含む各種プログラムおよび各種データを格納する。
 入力部150は、マウスなどのポインティングデバイス、およびキーボードを含み、各種の入力を行うために使用される。
 表示部160は、例えば、液晶ディスプレイであり、各種の情報を表示する。表示部160は、タッチパネル方式を採用して、入力部150として機能してもよい。
 通信インタフェース170は、外部装置(図示しない)などの他の機器と通信するためのインタフェースであり、例えば、イーサネット(登録商標)、FDDI、Wi-Fi(登録商標)などの規格が用いられる。
 次に、本実施形態に係る支援装置10の機能構成について説明する。
 図2は、本実施形態に係る支援装置10の構成例を示す図である。本実施形態に係る支援装置10は、要素と、その要素に付与されているラベル(以下、「正解ラベル」と称する。)との組からなる教師データを作成する作業者による、例えば、ラベルの付与基準のブレの有無の確認などの、教師データの確認作業を支援するものである。なお、正解ラベルとは、あくまでも教師データの作成時に付与されたラベルであり、確認作業の対象である。したがって、付与された正解ラベルが必ずしも正解であるとは限らない。教師データの確認を支援することで、修正が必要なラベルの抽出も容易になり、教師データの修正作業の効率化を図ることができる。以下では、図19に示すような、コンタクトセンタでの複数の話者(オペレータおよびカスタマ)による対話における発話を音声認識して得られた発話テキストにラベルを付与する例を用いて説明する。図19においては、オペレータの発話に対応する発話テキスト(以下では、発話に対応する発話テキストを単に「発話テキスト」称することがある。)は実線の吹き出しで示し、カスタマの発話テキストは点線の吹き出しで示している。
 図19に示す例では、各発話テキストに、発話が話し終わりの発話であるか否かを示す話し終わりラベルを付与することで、「話し終わり判定」のための教師データが作成される。また、発話テキストごとに、発話が含まれる応対シーンを示すシーンラベルを付与することで、「応対シーン推定」のための教師データが作成される。また、カスタマの用件を把握する「用件把握」の応対シーンに含まれる発話のうち、カスタマの用件を示す発話に、カスタマの用件を示す発話であることを示す用件ラベルを付与し、オペレータがカスタマの用件を確認する発話に、カスタマの用件を確認する発話であることを示す用件確認ラベルを付与することで、「FAQ検索発話判定」のための教師データが作成される。ただし、本開示は、図19に示す教師データの例に限られるものではなく、任意の複数の要素と、各要素のラベルとの組からなる教師データに適用可能である。また、発話テキストは、通話における発話をテキスト化したものだけでなく、チャットなどのテキストによる対話における発話であってもよい。また、対話における発話者は、人間に限らず、ロボットあるいはバーチャルエージェントなどであってもよい。
 図2に示すように、本実施形態に係る支援装置10は、モデル学習部11と、ラベル推論部12と、通話別推論結果評価部13と、通話別確認画面生成部14と、発話別推論結果評価部15と、発話別確認画面生成部16と、を備える。通話別推論結果評価部13、通話別確認画面生成部14、発話別推論結果評価部15および発話別確認画面生成部16は、評価部17を構成する。モデル学習部11、ラベル推論部12、通話別推論結果評価部13、通話別確認画面生成部14、発話別推論結果評価部15および発話別確認画面生成部16は、ASIC(Application Specific Integrated Circuit)、FPGA(Field-Programmable Gate Array)など専用のハードウェアによって構成されてもよいし、上述したように1つ以上のプロセッサによって構成されてもよい。
 モデル学習部11は、発話テキスト(要素)と、発話テキストに付与された正解ラベルとの組からなる教師データが入力される。モデル学習部11は、入力された教師データを用いて、発話テキストに対応するラベルを推論するモデルを学習する。モデルの学習方法は、当該モデルが適用されるシステムの目的に応じて、任意の学習方法を適用することができる。モデル学習部11は、教師データの学習により作成したモデル(以下、「学習済みモデル」と称する。)をラベル推論部12に出力する。なお、学習済みモデルは、予め用意されていてもよい。従って、支援装置10は、モデル学習部11を備えなくてもよい。
 ラベル推論部12は、教師データと、モデル学習部11により作成された学習済みモデルとが入力される。ラベル推論部12に入力される教師データは、学習済みモデルの学習に用いられた教師データと同じである。ラベル推論部12は、学習済みモデルを用いて、教師データを構成する発話テキスト(要素)のラベルを推論する(以下、学習済みモデルにより推論されたラベルを「推論ラベル」と称する。)。ラベル推論部12は、教師データを構成する発話テキストそれぞれの推論ラベルを、推論結果として通話別推論結果評価部13および発話別推論結果評価部15に出力する。
 評価部17は、教師データを構成する要素に付与されている正解ラベルと、ラベル推論部12により推論された推論ラベルとを比較して評価し、評価結果を外部出力インタフェース1に出力する。また、評価部17は、教師データを構成する要素と、その要素に付与されている正解ラベルと、その要素の推論ラベルとを含む、教師データを確認するための教師データ確認画面を生成する。評価部17は、生成した教師データ確認画面を外部出力インタフェース1に出力する。
 外部出力インタフェース1は、教師データの作成・修正作業を行う作業者あるいは作業者による作業を管理する管理者により用いられる装置である。外部出力インタフェース1は、評価部17から出力された、教師データに付与されている正解ラベルと、学習済みモデルにより推論された推論ラベルとの比較結果を表示するなどして提示する。外部出力インタフェース1は、支援装置10と通信を行う機能、評価部17の評価結果および教師データ確認画面などを提示(表示)する機能および操作入力を受け付ける機能を備えていれば、任意の構成であってよい。
 上述したように、評価部17は、通話別推論結果評価部13、通話別確認画面生成部14、発話別推論結果評価部15および発話別確認画面生成部16を備える。
 通話別推論結果評価部13は、教師データと、ラベル推論部12の推論結果とが入力される。通常、教師データには、複数の話者による通話における複数の発話テキストからなる発話テキスト群が、複数の通話分だけ含まれる。すなわち、教師データは、系列的な複数の要素からなる要素群を複数含む。通話別推論結果評価部13は、入力された教師データと、ラベル推論部12の推論結果とを通話ごとに評価する。通話別推論結果評価部13は、評価結果(通話別評価結果)を、通話別確認画面生成部14および外部出力インタフェース1に出力する。通話別評価結果の詳細は後述する。
 通話別確認画面生成部14は、通話別推論結果評価部13から出力された通話別評価結果に基づき、通話ごとの教師データ確認画面(以下、「通話別確認画面」と称する。)を生成し、外部出力インタフェース1に出力する。通話別確認画面の詳細は後述する。
 発話別推論結果評価部15は、教師データと、ラベル推論部12の推論結果とが入力される。発話別推論結果評価部15は、入力された教師データと、ラベル推論部12の推論結果とを発話ごとに評価する。発話別推論結果評価部15は、評価結果(発話別評価結果)を、発話別確認画面生成部16および外部出力インタフェース1に出力する。発話別評価結果の詳細は後述する。
 発話別確認画面生成部16は、発話別推論結果評価部15から出力された発話別評価結果に基づき、発話ごとの教師データ確認画面(以下、「発話別確認画面」と称する。)を生成し、外部出力インタフェース1に出力する。発話別確認画面の詳細は後述する。
 本実施形態においては、教師データを構成する発話テキスト(要素)と、その発話テキストに付与されている正解ラベルと、その教師データを用いて学習された学習済みモデルにより推論された推論ラベルとを含む教師データ確認画面を生成する。そのため、本実施形態に係る支援装置10によれば、作業者は、教師データ確認画面により、要素の正解ラベルと推論ラベルとを対比し、教師データの確認を容易に行うことができるので、教師データの確認作業の効率化を図ることができる。また、教師データの確認作業の効率化が図られることで、修正の必要なラベルの抽出が容易になり、ラベルの修正作業の効率化も図ることができる。
 次に、本実施形態に係る支援装置10の動作について説明する。
 図3は、支援装置10の動作の一例を示すフローチャートであり、本実施形態に係る支援装置10による支援方法を説明するための図である。
 モデル学習部11は、教師データを用いて、発話テキストを区別するラベルを推論するモデルを学習する(ステップS11)。
 ラベル推論部12は、モデル学習部11により学習された学習済みモデルを用いて、教師データの要素に対応する推論ラベルを推論する(ステップS12)。上述したように、学習済みモデルの学習に用いられる教師データと、ラベル推論部12による教師データ推論処理に用いられる教師データとは同じである。
 通話別推論結果評価部13は、教師データと、ラベル推論部12の推論結果とを通話ごとに評価し、評価結果(通話別評価結果)を出力する(ステップS13)。具体的には、通話別推論結果評価部13は、通話ごとに、教師データを構成する発話テキストに付与されている正解ラベルと、ラベル推論部12により推論された推論ラベルとの差異を比較する。そして、通話別推論結果評価部13は、通話ごとの評価値を、評価結果の悪い通話(例えば、評価値が閾値以下の発話)から順に並べて、通話別評価結果として出力する。すなわち、通話別推論結果評価部13は、評価結果の悪い要素群(複数の発話からなる通話)から順に、要素群ごとの評価結果を出力する。通話の評価値は、教師データを構成する各発話テキストの正解ラベルと推論ラベルとの適合率、再現率、F値あるいは一致率などを用いることができる。
 図4は、通話別評価結果の一例を示す図である。
 図4に示すように、通話別推論結果評価部13は、通話別評価結果として、通話を識別するための識別情報である通話インデックスと、その通話における一致率などの評価値とを対応付けて出力する。ここで、通話別推論結果評価部13は、評価結果が悪い順に、通話インデックスと評価値とを羅列し、例えば、テキストデータとして出力する。通話別評価結果には、通話の始端時刻および終端時刻が含まれてもよい。
 図3を再び参照すると、通話別確認画面生成部14は、通話別評価結果に基づき、通話別確認画面を生成し(ステップS14)、外部出力インタフェース1に出力する。
 図5は、通話別確認画面の一例を示す図である。
 図5に示すように、通話別確認画面生成部14は、1通話ごとに、通話を構成する発話が開始された時間である始端時間と、発話が終了した時間である終端時間と、発話テキストと、各発話テキストの正解ラベルおよび推論ラベルとを含む、通話別確認画面を生成する。このように、通話別確認画面生成部14は、教師データを構成する要素と、その要素の正解ラベルと、その要素の推論ラベルとを含む教師データ確認画面を生成する。具体的には、通話別確認画面生成部14は、教師データを構成する要素に対応する正解ラベルと推論ラベルとを対比可能に示す(例えば、図5に示すように、要素に対応する正解ラベルと推論ラベルとを並べて示す)、教師データ確認画面を生成する。ここで、通話別確認画面生成部14は、評価結果が悪い通話から順に、通話別確認画面を提示する。例えば、通話別確認画面生成部14は、図5に示すように、評価結果が悪い通話ほど、通話別確認画面が手前に表示されるようにしてよい。すなわち、通話別確認画面生成部14は、評価結果が悪い通話から順に確認可能となるように、要素ごとの通話別確認画面を生成してよい。上述したように、通話別確認画面には、発話の始端時間および終端時間が含まれる。そのため、作業者は、発話が重複しているかを確認することができる。なお、始端時間および終端時間は、通話別確認画面に必ずしも含まれていなくてもよい。
 このように、評価部17を構成する通話別推論結果評価部13は、要素群ごとに、その要素群を構成する要素に付与されている正解ラベルと、学習済みモデルにより推論された推論ラベルとの差異を評価する。また、評価部17を構成する通話別確認画面生成部14は、通話別評価結果に基づき、要素群ごとの教師データ確認画面(通話別確認画面)を生成し、評価結果の悪い要素群から順に、通話別確認画面を提示する。
 また、評価部17を構成する通話別確認画面生成部14は、通話ごとの通話別確認画面を切り替え可能に提示してよい。図5に示す例では、通話別確認画面生成部14は、例えば、作業者による切替操作に応じて、手前に表示する発話別確認画面を切り替えてよい。このように、通話別確認画面生成部14は、要素群ごとの評価結果を切り替え可能に提示してよい。
 通話ごとに通話別確認画面を提示することで、作業者は、通話単位で質の悪い教師データを発見し、修正することができる。また、通話ごとの通話別確認画面を切り替え可能とすることで、作業者は、例えば、連続的に通話ごとの評価結果を確認することができるので、教師データの確認作業の効率化を図ることができる。また、評価結果の悪い通話から順に確認可能となるように、通話別確認画面を生成することで、作業者は、通話単位で質の悪い教師データの傾向を発見し、修正の要点を把握することができる。その結果、教師データの修正作業の効率化を図ることができる。なお、通話別確認画面生成部14は、図5に示す通話別確認画面を切り替え可能に提示する代わりに、通話別確認画面に相当するテキストデータのファイル群を、通話ごとの評価値に基づきディレクトリなどに分けて外部出力インタフェース1に出力してもよい。
 通話別確認画面は、図5に示す例に限られるものではない。図6は、通話別確認画面生成部14が生成する通話別確認画面の他の一例を示す図である。
 通話別確認画面生成部14は、図6に示すように、通話別確認画面において、オペレータおよびカスタマの発話テキストを時系列順に一列に並んで配置してよい。また、通話別確認画面生成部14は、各発話テキストに対応付けて、発話が始まった始端時間、発話が終了した終端時間および発話に付与されたラベル(シーンラベル、用件ラベル、用件確認ラベルおよび話し終わりラベル)を配置してよい。図6に示すように、通話別確認画面生成部14は、オペレータの発話テキストと、カスタマの発話テキストとを異なる色で表示してよい。なお、図6においては、色の相違がハッチングの相違により表現されている。
 通話別確認画面生成部14は、図6に示すように、通話別確認画面において、複数の要素を一列に配置するとともに、複数の項目のラベルの構造に基づき、複数の項目のラベルを、そのラベルに対応する要素の一方側および他方側に振り分けて配置してよい。
 一般に、発話テキストに近い領域にラベルを配置したほうが、ラベルの確認・修正作業を行いやすい。したがって、発話テキストを一列に配置するとともに、発話テキストの両側に、複数の項目のラベルを振り分けて配置することで、発話テキストに近い領域を有効に活用し、ラベルの確認・修正の作業効率を高めることができる。
 図6に示す例では、シーンラベル、用件ラベルならびに用件確認ラベルが発話テキストの左側に配置され、話し終わりラベルが発話テキストの右側に配置されている。発話テキストへのシーンラベル、用件ラベルおよび用件確認ラベルの付与には、その発話テキストだけでなく、その前後の発話テキストの内容も考慮される。すなわち、シーンラベル、用件ラベルおよび用件確認ラベルは、発話テキストに付与するラベルを、その発話テキストを含む複数の発話テキストの内容に基づき決定する、長期文脈を考慮すべきラベルである。一方、発話テキストへの話し終わりラベルの付与は、主にその発話テキストだけを考慮すればよい。したがって、通話別確認画面生成部14は、長期文脈を考慮すべきラベルを、発話テキストの左側に配置し、長期文脈を考慮しないラベルを、発話テキストの右側に配置してよい。
 また、図6に示す例では、通話別確認画面生成部14は、用件ラベルおよび用件確認ラベルをシーンラベルよりも、発話テキストの近くに配置している。通常、「用件把握」のシーンラベルが付与された発話テキストに、用件ラベルあるいは用件確認ラベルが付与される。すなわち、シーンラベルが上位階層のラベルであり、用件ラベル/用件確認ラベルが下位階層のラベルである。したがって、通話別確認画面生成部14は、階層的な構造を有する複数の項目のラベルのうち、階層の低いラベルほど、発話テキストの近くに配置してよい。こうすることで、下位階層のラベルほど、発話テキストを見たほうがラベルの確認・修正作業を行いやすいので、作業効率を高めることができる。また、話し終わりラベルは主に、発話の末尾に着目して付与される。したがって、発話テキストの右側に話し終わりラベルを配置することで、作業者は、発話テキストの末尾が見やすくなるので、話し終わりラベルの確認・修正の作業効率を高めることができる。
 また、通話別確認画面生成部14は、教師データの修正作業において、作業者により修正作業のラベルが選択されると、複数の項目のラベルの階層構造に基づき、修正対象のラベルと関連するラベル(上位階層のラベルおよび下位階層のラベル)の表示態様を変化させてよい。図6に示す例では、「用件把握」のシーンラベルが更新対象のラベルとして選択されたとする。この場合、通話別確認画面生成部14は、シーンラベルの下位階層のラベルである用件ラベルおよび用件確認発話ラベルの表示色を異ならせるなどして、表示態様を変化させる。こうすることで、修正対象のラベルと関連するラベルを作業者が把握しやすくなり、ラベルの付与の作業効率を高めることができる。
 また、通話別確認画面生成部14は、上位階層のラベルまたは下位階層のラベルを更新した際に、関連するラベル間で矛盾が生じる場合には、矛盾が生じたラベルの表示態様を変化させてよい。こうすることで、階層的な構造を有する複数の項目のラベル間で矛盾が生じることをなくし、ラベルの修正の精度を向上することができる。
 また、通話別確認画面生成部14は、教師データの対象としない発話テキスト、例えば、フィラーおよび「はい」などの短い発話テキストの表示態様を、他の発話テキストと異ならせてよい。こうすることで、ラベルの付与が不要な発話テキストを作業者が容易に把握できるので、作業効率を高めることができる。
 図3を再び参照すると、発話別推論結果評価部15は、教師データと、ラベル推論部12の推論結果とを発話ごとに評価し、評価結果(発話別評価結果)を出力する(ステップS15)。発話別推論結果評価部15は、教師データのラベルと、ラベル推論部12の推論結果のラベルとを発話ごとに比較し、教師データのラベルと推論結果のラベルとが異なるパターンである差異パターンを集計して、発話別評価結果として出力する。
 図7は、発話別評価結果の一例を示す図である。
 図7に示すように、発話別推論結果評価部15は、発話別評価結果として、例えば、差異パターンの出現回数を混同行列で示した結果、および、ラベル別の評価値(適合率(precision)、再現率(recall)、F値(f1-score)、出現数(support))を、テキストデータで出力する。
 図3を再び参照すると、発話別確認画面生成部16は、発話別評価結果に基づき、発話別確認画面を生成し(ステップS16)、外部出力インタフェース1に出力する。
 図8は、発話別確認画面の一例を示す図である。
 図8に示すように、発話別確認画面生成部16は、発話テキストと、その発話が含まれる通話における、当該発話テキストの順番を示す行番号と、その発話テキストの正解ラベルおよび推論ラベルとを対応つけた発話別確認画面を生成する。このように、発話別確認画面生成部16は、教師データを構成する要素と、その要素に付与された正解ラベルと、その要素の推論ラベルとを含む教師データ確認画面を生成する。具体的には、発話別確認画面生成部16は、教師データを構成する要素に対応する正解ラベルと推論ラベルとを対比可能に示す(例えば、図8に示すように、要素に対応する正解ラベルと推論ラベルとを並べて示す)、教師データ確認画面を生成する。発話別確認画面生成部16は、正解ラベルと推論ラベルとが異なる発話ごとに、発話別確認画面を生成する。図8においては、点線矩形で囲まれた行番号41の発話が表示対象の発話である。図8に示すように、発話別確認画面生成部16は、表示対象の発話テキスト(正解ラベルと推論ラベルとが異なる発話テキスト)には、所定の印(図8では、「**」)を付してよい。発話別確認画面生成部16は、表示対象の発話の発話別確認画面に、表示対象の発話の前後の発話を含めてよい。すなわち、発話別確認画面生成部16は、正解ラベルと、推論ラベルとが異なる要素およびその要素の前後の要素を含む発話別確認画面を生成してよい。図8においては、行番号38から行番号44までの発話テキストが、行番号41の発話テキストを表示対象とする発話別確認画面に含まれる例を示している。
 発話別確認画面生成部16は、発話ごとの発話別確認画面を、教師データと推論ラベルとが異なるパターンである差異パターンのうち、出現回数の多い差異パターンを含む発話テキストから順に提示する。すなわち、発話別確認画面生成部16は、教師データと推論ラベルとが異なるパターンである差異パターンのうち、出現回数の多い差異パターンを含む要素から順に発話別確認画面を提示してよい。
 このように、評価部17を構成する発話別推論結果評価部15は、教師データを構成する要素ごとに、当該要素に付与されている正解ラベルと、学習済みモデルにより推論された推論ラベルとを比較し、評価結果を出力する。また、評価部17を構成する発話別確認画面生成部16は、教師データを構成する要素ごとに、正解ラベルと推論ラベルとが異なる差異パターンのうち、出現回数の多い差異パターンを含む要素から順に、教師データ確認画面(発話別確認画面)を生成して提示する。
 発話別確認画面生成部16は、図8に示すように、複数の発話別確認画面を一部が重畳するようにして提示し、例えば、作業者による切替操作に応じて、手前に表示する発話別確認画面を切り替えてよい。すなわち、発話別確認画面生成部16は、出現回数の多い差異パターンを含む要素から順に確認可能となるように、発話別確認画面を生成してよい。こうすることで、確認すべき教師データだけを、影響が大きい順に素早く確認することができる。
 発話別確認画面を表示することで、作業者は、発話単位でラベルに誤りのある教師データを発見し、修正することができる。また、正解ラベルと、推論ラベルとが異なる要素およびその要素の前後の要素を提示することで、作業者は、前後の発話テキスト(要素)の内容も考慮して、表示対象の発話テキストのラベルを修正することができるので、ラベルの修正作業の効率化を図ることができる。また、同じ差異パターンの複数の発話別確認画面を切り替え可能に提示することで、作業者は、同じ差異パターンの発話別確認画面を連続的に確認し、差異パターンごとに、修正の要点を把握することができる。その結果、教師データの修正作業の効率化を図ることができる。なお、発話別確認画面生成部16は、図8に示す発話別確認画面を切り替え可能に提示する代わりに、発話別確認画面に相当するテキストデータのファイル群を、ディレクトリなどに分けて外部出力インタフェース1に出力してもよい。
 このように、本実施形態に係る支援装置10は、ラベル推論部12と、評価部17とを備える。ラベル推論部12は、教師データを用いて学習された学習済みモデルを用いて、教師データを構成する要素の推論ラベルを推論する。評価部17は、教師データを構成する要素と、その要素に付与されている正解ラベルと、学習済みモデルにより推論された推論ラベルとを含む、教師データ確認画面を生成する。
 また、本実施形態に係る教師データ修正方法は、ラベルを推論するステップ(ステップS12)と、教師データ確認画面を生成するステップ(ステップS14,S16)とを含む。ラベルを推論するステップでは、教師データを用いて学習された学習済みモデルを用いて、教師データを構成する要素の推論ラベルを推論する。教師データ確認画面を生成するステップでは、教師データを構成する要素と、その要素に付与されている正解ラベルと、その要素の推論ラベルとを含む、教師データ確認画面を生成する。
 こうすることで、本実施形態に係る支援装置10および支援方法によれば、要素の正解ラベルと推論ラベルとを含む教師データ確認画面により、作業者による教師データの確認が容易になるので、教師データの確認作業の効率化を図ることができる。
 (第2の実施形態)
 図9は、本開示の第2の実施形態に係る支援装置10Aの構成例を示す図である。図9において、図2と同様の構成には同じ符号を付し、説明を省略する。
 本実施形態に係る支援装置10Aは、第1の実施形態に係る支援装置10と比較して、推論誤り除外部18を追加した点が異なる。
 推論誤り除外部18は、発話別推論結果評価部15による発話別評価結果が入力される。推論誤り除外部18は、学習済みモデルにより推論された推論ラベルが予め定められた規則により誤りであると判定される要素を除外する推論誤り除外処理を行う。具体的には、推論誤り除外部18は、発話別推論結果評価部15の発話別評価結果から、推論ラベルが明らかに誤っている発話を除外する。明らかに誤っている発話とは、例えば、1つの発話のみで1つのシーンが構成されている発話、通話の冒頭であるにも関わらず、発話テキストに、通話の終了を示すクロージングあるいはカスタマの用件に対する対応を示すラベルが付与された発話である。明らかに誤っている発話の判定条件は、予め人手により定められる。
 次に、本実施形態に係る支援装置10Aの動作について説明する。図10は、支援装置10Aの動作の一例を示すフローチャートである。図10において、図3と同様の処理には同じ符号を付し、説明を省略する。
 発話別推論結果評価部15から発話別評価結果が出力されると(ステップS15)、推論誤り除外部18は、発話別評価結果から、学習済みモデルにより推論された推論ラベルが明らかに誤っている発話を除外する(ステップS21)。
 なお、本実施形態においては、推論誤り除外部18は、発話別評価結果から、明らかに誤っている発話を除外する例を用いて説明したが、本開示はこれに限られるものではない。要は、推論誤り除外部18は、評価結果および教師データ確認画面から、明らかに誤っている発話を除外すればよい。したがって、推論誤り除外部18は、例えば、ラベル推論部12と、通話別推論結果評価部13ならびに発話別推論結果評価部15との間に設けられてもよい。
 このように本実施形態においては、支援装置10Aは、学習済みモデルにより推論された推論ラベルが予め定められた規則により誤りであると判定される要素を除外する推論誤り除外部18をさらに備える。
 そのため、明らかな誤りが除去されるので、作業者が確認すべき教師データの数を減らし、教師データの修正作業の効率化を図ることができる。
 (第3の実施形態)
 図11は、本開示の第3の実施形態に係る支援装置10Bの機能構成の一例を示す図である。本実施形態に係る支援装置10Bは、教師データを構成する要素にラベルを付与して教師データを作成する教師データ作成者の評価を支援するものである。図11において、図2と同様の構成には同じ符号を付し、説明を省略する。
 図11に示すように、本実施形態に係る支援装置10Bは、モデル学習部11と、ラベル推論部12と、通話別推論結果評価部13Bと、通話別確認画面生成部14Bと、発話別推論結果評価部15Bと、発話別確認画面生成部16Bと、教師データ作成者評価部21とを備える。通話別推論結果評価部13B、通話別確認画面生成部14B、発話別推論結果評価部15B、発話別確認画面生成部16Bおよび教師データ作成者評価部21は、評価部17Bを構成する。すなわち、本実施形態に係る支援装置10Bは、第1の実施形態に係る支援装置10と比較して、通話別推論結果評価部13、通話別確認画面生成部14、発話別推論結果評価部15および発話別確認画面生成部16をそれぞれ、通話別推論結果評価部13B、通話別確認画面生成部14B、発話別推論結果評価部15B、発話別確認画面生成部16Bに変更した点と、教師データ作成者評価部21を追加した点とが異なる。
 評価部17Bは、教師データを構成する要素の正解ラベルと、ラベル推論部12により推論された、要素の推論ラベルとの比較に基づき、教師データ作成者の評価結果を生成する。上述したように、通話別推論結果評価部13B、通話別確認画面生成部14B、発話別推論結果評価部15B、発話別確認画面生成部16Bおよび教師データ作成者評価部21は、評価部17Bを構成する。
 通話別推論結果評価部13B、通話別確認画面生成部14B、発話別推論結果評価部15Bおよび発話別確認画面生成部16Bには、学習済みモデルの作成に用いられた教師データを作成した教師データ作成者を識別する情報である教師データ作成者情報が入力される。上述したように、実用に耐えうる推定精度のモデルを作成するためには、大量の教師データが必要となる。そのため、通常、教師データの作成は、複数の教師データ作業者により行われる。教師データ作成者情報は、教師データの作成を行った複数の教師データ作成者それぞれを識別する情報である。
 通話別推論結果評価部13Bは、通話別推論結果評価部13と同様に、教師データと、ラベル推論部12の推論結果とを通話ごとに評価し、評価結果(通話別評価結果)を、通話別確認画面生成部14Bおよび外部出力インタフェース1に出力する。ここで、通話別推論結果評価部13Bは、教師データ作成者情報に基づき、通話別評価結果を教師データ作成者ごとに生成する。すなわち、評価部17Bを構成する通話別推論結果評価部13Bは、要素群ごとの、その要素群を構成する要素の正解ラベルと推論ラベルとの比較による評価結果を、教師データ作成者ごとに生成する。詳細は後述するが、通話別推論結果評価部13Bは、教師データ作成者ごとに生成した通話別評価結果を切り替え可能に提示してよい。
 通話別確認画面生成部14Bは、通話別確認画面生成部14と同様に、通話別推論結果評価部13Bから出力された通話別評価結果に基づき、通話ごとの教師データ確認画面(通話別確認画面)を生成し、外部出力インタフェース1に出力する。ここで、通話別確認画面生成部14Bは、教師データ作成者情報に基づき、通話別確認画面を教師データ作成者ごとに生成する。すなわち、評価部17Bを構成する通話別確認画面生成部14Bは、要素群ごとの、その要素群を構成する要素と、要素の正解ラベルと、要素の推論ラベルとを含む教師データ確認画面を、教師データ作成者ごとに生成する。詳細は後述するが、通話別確認画面生成部14Bは、同一の教師データ作成者について生成した教師データ確認画面を切り替え可能に提示してよい。
 発話別推論結果評価部15Bは、発話別推論結果評価部15と同様に、教師データと、ラベル推論部12の推論結果とを発話ごとに評価し、評価結果(発話別評価結果)を、発話別確認画面生成部16Bおよび外部出力インタフェース1に出力する。すなわち、評価部17Bを構成する発話別推論結果評価部15Bは、教師データを構成する要素ごとの、正解ラベルと推論ラベルとの比較に基づく評価結果を、教師データ作成者ごとに生成する。
 発話別確認画面生成部16Bは、発話別確認画面生成部16と同様に、発話別推論結果評価部15Bから出力された発話別評価結果に基づき、発話ごとの教師データ確認画面(発話別確認画面)を生成し、外部出力インタフェース1に出力する。ここで、発話別確認画面生成部16Bは、教師データ作成者情報に基づき、発話別確認画面を教師データ作成者ごとに生成する。すなわち、評価部17Bを構成する発話別確認画面生成部16Bは、教師データを構成する要素と、その要素の正解ラベルと、その要素の推論ラベルとを含む教師データ確認画面を、教師データ作成者ごとに生成する。詳細は後述するが、発話別確認画面生成部16Bは、発話別確認画面(要素群ごとの評価結果を確認可能な画面)を、教師データ作成者ごとに切り替え可能なように生成してよい。
 教師データ作成者評価部21は、教師データと、ラベル推論部12による推論結果と、教師データ作成者情報とが入力される。教師データ作成者評価部21は、教師データを構成する要素の正解ラベルと、その要素の推論ラベルとの比較に基づき、教師データ作成者の評価結果(以下、「教師データ作成者評価結果」と称する。)を生成し、外部出力インタフェース1に出力する。
 本実施形態においては、教師データを構成する要素に付与されている正解ラベルと、その要素の推論ラベルとの比較に基づき、教師データ作成者の評価結果を生成することで、教師データ作成者の評価をより効率的に行うことができる。また、教師データ作成者ごとに、教師データの作成時における誤りの傾向を詳細に分析することを可能とし、教師データ作成者に対する教師データの作成方針の教育を、効率的に行うことができる。
 次に、本実施形態に係る支援装置10Bの動作について説明する。
 図12は、支援装置10Bの動作の一例を示すフローチャートであり、本実施形態に係る支援装置10Bによる支援方法を説明するための図である。図12において、図3と同様の処理には同じ符号を付し、説明を省略する。
 ラベル推論部12により教師データを構成する要素の推論ラベルが推論されると(ステップS12)、教師データ作成者評価部21は、教師データを構成する要素の正解ラベルと、その要素の推論ラベルとの比較に基づき、教師データ作成者評価結果を生成し、外部出力インタフェース1に出力する(ステップS31)。
 図13は、教師データ作成者評価結果の一例を示す図である。
 図13に示すように、教師データ作成者評価部21は、教師データ作成者評価結果として、教師データ作成者を識別するための識別情報である教師データ作成者インデックスと、その教師データ作成者により作成された教師データの評価値とを対応付けて出力する。教師データの評価値は、例えば、教師データ作成者が作成した複数の教師データの正解ラベルに対する、推論ラベルの適合率、再現率、F値あるいは一致率などの値の平均値である。すなわち、教師データ作成者評価部21は、要素群ごとの、その要素群を構成する要素に対応する正解ラベルと推論ラベルとの比較に基づく評価結果を、教師データ作成者ごとに確認可能なように生成する。作成した教師データの評価値が高い教師データ作成者は、適切なラベルを付与している可能性が高いと考えられる。一方、作成した教師データの評価値が低い教師データ作成者は、適切なラベルを付与することができておらず、ラベルの付与のポリシーの習得などの訓練が必要である可能性が高いと考えられる。教師データ作成者評価部21は、例えば、評価値の悪い順に、教師データインデックスと、評価値とを出力する。こうすることで、作成する教師データの品質が低く、ラベル付与のポリシーの習得などのトレーニングが必要な可能性が高い教師データ作成者を容易に把握することができる。
 図12を再び参照すると、通話別推論結果評価部13Bは、教師データの正解ラベルと、ラベル推論部12の推論結果とを通話ごとに評価し、通話別評価結果を出力する(ステップS32)。
 図14は、通話別推論結果評価部13Bが出力する通話別推論結果の一例を示す図である。
 図14に示すように、通話別推論結果評価部13Bは、通話別推論結果評価部13と同様に、通話別評価結果として、通話インデックスと、その通話における一致率などの評価値とを対応付けて出力する。また、通話別推論結果評価部13Bは、通話別推論結果評価部13と同様に、評価結果が悪い順に、通話インデックスと評価値とを羅列し、例えば、テキストデータとして出力してよい。通話別評価結果には、通話の始端時刻および終端時刻が含まれてもよい。
 通話別推論結果評価部13Bは、図14に示すように、通話別評価結果を、教師データ作成者ごとに生成する。そして、通話別推論結果評価部13は、教師データ作成者ごとの通話別評価結果を切り替え可能に提示してよい。教師データ作成者ごとの通話別評価結果が生成されることで、教師データ作成者ごとの、ラベル付与の傾向などを容易に把握することができる。
 図12を再び参照すると、通話別確認画面生成部14Bは、通話別評価結果に基づき、通話別確認画面を生成し(ステップS33)、外部出力インタフェース1に出力する。
 図15は、通話別確認画面の一例を示す図である。
 図15に示すように、通話別確認画面生成部14Bは、通話別確認画面生成部14と同様に、1通話ごとに、通話を構成する発話の始端時間と、発話の終端時間と、発話テキストと、発話テキストの正解ラベルおよび推論ラベルとを含む、通話別確認画面生成する。ここで、通話別確認画面生成部14Bは、教師データ作成者ごとに、通話別確認画面を生成する。通話別確認画面生成部14Bは、どの教師データ作成者について生成した通話別確認画面であるかを示すために、図15に示すように、教師データ作成者インデックスを通話別確認画面に含める。通話別確認画面生成部14Bは、図15に示すように、同一の教師データ作成者について生成した通話別確認画面を重畳し、切り替え可能に提示してもよい。すなわち、通話別確認画面生成部14Bは、要素群ごとの、その要素群を構成する要素と、その要素に対応する正解ラベルと、その要素の推論ラベルとを含み、要素群ごとに切り替え可能な教師データ確認画面(通話別確認画面)を、教師データ作成者ごとに生成してよい。この場合、通話別確認画面生成部14Bは、評価結果が悪い通話ほど、通話別確認画面が手前に表示されるようにしてよい。
 図12を再び参照すると、発話別推論結果評価部15Bは、教師データと、ラベル推論部12の推論結果とを発話ごとに評価し、評価結果(発話別評価結果)を出力する(ステップS34)。
 図16は、発話別評価結果の一例を示す図である。
 図16に示すように、発話別推論結果評価部15Bは、発話別推論結果評価部15と同様に、発話別評価結果として、例えば、差異パターンの出現回数を混同行列で示した結果、および、ラベル別の評価値(適合率(precision)、再現率(recall)、F値(f1-score)、出現数(support))を、テキストデータで出力する。ここで、発話別推論結果評価部15Bは、教師データ作成者ごとに、発話別評価結果を出力する。発話別推論結果評価部15Bは、どの教師データ作成者について出力した発話別評価結果であるかを示すために、図16に示すように、教師データ作成者インデックスを発話別評価結果に含める。教師データ作成者ごとに発話別評価結果を出力することで、その教師データ作成者がラベルの付与を誤りやすい差異パターンを確認することができる。また、教師データ作成者あるいはその管理者がラベルを付与するポリシーの誤りを把握しやすくなる。上述したように、発話別評価結果は、差異パターンの出現頻度およびラベルごとの評価値などの、教師データ作成者が作成した教師データの評価結果を含む。したがって、発話別評価結果が教師データ作成者評価結果として出力されてもよい。
 なお、発話別推論結果評価部15Bは、図16に示すラベルごとの評価値の代わりに、図17に示すような、混同が生じやすい差異パターンをランキング形式で示してもよい。混同が生じやすい差異パターンとは、正解ラベルと推論ラベルとが異なるパターンであって、混同あるいは入れ替わりが生じやすいパターンである。混同が生じやすい差異パターンの件数は、例えば、正解ラベルがAであり、推論ラベルがBである発話の件数と、正解ラベルがBであり、推論ラベルがAである発話との合計である。また、発話別推論結果評価部15Bは、混同が生じやすい差異パターンを発話別評価結果に含めてもよい。こうすることで、教師データ作成者が、間違いやすい差異パターン(付与が苦手なラベル)を把握することができる。また、教師データ作成者毎のラベルの付与ポリシーの認識誤りに、教師データ作成者の管理者が気付くことができる。
 図12を再び参照すると、発話別確認画面生成部16Bは、発話別評価結果に基づき、発話別確認画面を生成し(ステップS35)、外部出力インタフェース1に出力する。
 図18は、発話別確認画面の一例を示す図である。
 図18に示すように、発話別確認画面生成部16Bは、発話別確認画面生成部16と同様に、発話テキストと、発話が含まれる通話における、当該発話テキストの順番を示す行番号と、その発話テキストの正解ラベルおよび推論ラベルとを対応つけた発話別確認画面を生成する。ここで、発話別確認画面生成部16Bは、教師データ作成者ごとに、発話別確認画面を生成する。すなわち、発話別確認画面生成部16Bは、要素ごとの、要素と、要素に対応する正解ラベルと、要素の推論ラベルとを含む教師データ確認画面(発話別確認画面)を、教師データ作成者ごとに確認可能なように生成する。
 なお、発話別確認画面生成部16Bは、発話別確認画面生成部16と同様に、出現回数の多い差異パターンを含む発話テキストから順に、発話別確認画面を生成して提示してよい。すなわち、発話別確認画面生成部16Bは、教師データに付与されている正解ラベルと学習済みモデルによる推論ラベルとが異なるパターンである差異パターンのうち、出現回数の多い差異パターンを含む要素から順に発話別確認画面を提示してよい。また、発話別確認画面生成部16Bは、同一の教師データ作成者について生成した複数の発話別確認画面を切り替え可能に提示してよい。
 このように本実施形態に係る支援装置10Bは、ラベル推論部12と、評価部17Bとを備える。ラベル推論部12は、教師データを用いて学習された、要素に対応するラベルを推論するモデルを用いて、教師データを構成する要素に対応するラベルである推論ラベルを推論する。評価部17は、教師データを構成する要素の正解ラベルと、要素の推論ラベルとの比較に基づき、教師データ作成者の評価結果を生成する。
 また、本実施形態に係る支援方法は、推論するステップと、評価結果を生成するステップと、を含む。推論するステップでは、教師データを用いて学習された、要素に対応するラベルを推論するモデルを用いて、教師データを構成する要素に対応するラベルである推論ラベルを推論する。評価結果を生成するステップでは、教師データを構成する要素の正解ラベルと、要素の推論ラベルとの比較に基づき、教師データ作成者の評価結果を生成する。
 教師データを構成する要素の正解ラベルと、その要素の推論ラベルとの比較に基づき、教師データ作成者の評価結果を生成することで、教師データ作成者の評価をより効率的に行うことができる。また、教師データ作成者ごとに、教師データ作成時における誤りの傾向を詳細に分析することを可能とし、教師データ作成者に対する作成方針の教育を、効率的に行うことができる。
 上述した支援装置10,10A,10Bの各部として機能させるためにコンピュータを好適に用いることが可能である。そのようなコンピュータは、支援装置10,10A,10Bの各部の機能を実現する処理内容を記述したプログラムを該コンピュータの記憶部に格納しておき、該コンピュータのCPU(Central Processing Unit)によってこのプログラムを読み出して実行させることで実現することができる。すなわち、当該プログラムは、コンピュータを、上述した支援装置10,10A,10Bとして機能させることができる。
 以上の実施形態に関し、更に以下の付記を開示する。
 (付記項1)
 メモリと、
 前記メモリに接続された少なくとも1つのプロセッサと、
 を含み、
 前記プロセッサは、
 要素と、前記要素に対応する正解ラベルとの組からなる教師データを用いて学習された、前記要素に対応するラベルを推論するモデルを用いて、前記教師データを構成する要素に対応するラベルである推論ラベルを推論し、
 前記教師データを構成する要素に対応する正解ラベルと、前記要素の推論ラベルとの比較に基づき、前記教師データ作成者の評価結果を生成する、支援装置。
 (付記項2)
 コンピュータによって実行可能なプログラムを記憶した非一時的記憶媒体であって、前記コンピュータを付記項1に記載の支援装置として機能させる、プログラムを記憶した非一時的記憶媒体。
 本明細書に記載された全ての文献、特許出願および技術規格は、個々の文献、特許出願、および技術規格が参照により取り込まれることが具体的かつ個々に記載された場合と同程度に、本明細書中に参照により取り込まれる。
 10,10A,10B  支援装置
 11  モデル学習部
 12  ラベル推論部
 13,13B  通話別推論結果評価部
 14,14B  通話別確認画面生成部
 15,15B  発話別推論結果評価部
 16,16B  発話別確認画面生成部
 17  評価部
 18  推論誤り除外部
 21  教師データ作成者評価部
 110  プロセッサ
 120  ROM
 130  RAM
 140  ストレージ
 150  入力部
 160  表示部
 170  通信インタフェース
 190  バス
 

Claims (8)

  1.  要素と、前記要素に対応する正解ラベルとの組からなる教師データを作成する教師データ作成者の評価を支援する支援装置であって、
     前記教師データを用いて学習された、前記要素に対応するラベルを推論するモデルを用いて、前記教師データを構成する要素に対応するラベルである推論ラベルを推論するラベル推論部と、
     前記教師データを構成する要素に対応する正解ラベルと、前記要素の推論ラベルとの比較に基づき、前記教師データ作成者の評価結果を生成する評価部と、を備える支援装置。
  2.  請求項1に記載の支援装置において、
     前記教師データは、系列的な複数の要素からなる要素群を複数含み、
     前記評価部は、前記要素群ごとの、当該要素群を構成する要素に対応する前記正解ラベルと前記推論ラベルとの比較に基づく評価結果を、前記教師データ作成者ごとに確認可能なように生成する、支援装置。
  3.  請求項1または2に記載の支援装置において、
     前記教師データは、系列的な複数の要素からなる要素群を複数含み、
     前記評価部は、前記要素群ごとの、当該要素群を構成する要素と、前記要素に対応する正解ラベルと、前記要素の推論ラベルとを含む、前記要素群ごとに切り替え可能な教師データ確認画面を、前記教師データ作成者ごとに生成する、支援装置。
  4.  請求項1から3のいずれか一項に記載の支援装置において、
     前記評価部は、前記教師データを構成する要素ごとの、前記正解ラベルと前記推論ラベルとの比較に基づく評価結果を、前記教師データ作成者ごとに生成する、支援装置。
  5.  請求項4に記載の支援装置において、
     前記評価部は、前記要素ごとの、前記要素と、前記要素に対応する正解ラベルと、前記要素の推論ラベルとを含む教師データ確認画面を、前記教師データ作成者ごとに確認可能なように生成する、支援装置。
  6.  請求項4または5に記載の支援装置において、
     前記評価部は、前記正解ラベルと前記推論ラベルとが異なるパターンであって、混同が生じやすい差異パターンを前記評価結果に含める、支援装置。
  7.  要素と、前記要素に対応する正解ラベルとの組からなる教師データを作成する教師データ作成者の評価を支援する支援装置における支援方法であって、
     前記教師データを用いて学習された、前記要素に対応するラベルを推論するモデルを用いて、前記教師データを構成する要素に対応するラベルである推論ラベルを推論するステップと、
     前記教師データを構成する要素に対応する正解ラベルと、前記要素の推論ラベルとの比較に基づき、前記教師データ作成者の評価結果を生成するステップと、を含む支援方法。
  8.  コンピュータを、請求項1から6のいずれか一項に記載の支援装置として機能させるためのプログラム。
     
PCT/JP2021/007622 2021-03-01 2021-03-01 支援装置、支援方法およびプログラム WO2022185360A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
US18/279,590 US20240144057A1 (en) 2021-03-01 2021-03-01 Support device, support method, and program
JP2023503531A JPWO2022185360A1 (ja) 2021-03-01 2021-03-01
PCT/JP2021/007622 WO2022185360A1 (ja) 2021-03-01 2021-03-01 支援装置、支援方法およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2021/007622 WO2022185360A1 (ja) 2021-03-01 2021-03-01 支援装置、支援方法およびプログラム

Publications (1)

Publication Number Publication Date
WO2022185360A1 true WO2022185360A1 (ja) 2022-09-09

Family

ID=83155183

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2021/007622 WO2022185360A1 (ja) 2021-03-01 2021-03-01 支援装置、支援方法およびプログラム

Country Status (3)

Country Link
US (1) US20240144057A1 (ja)
JP (1) JPWO2022185360A1 (ja)
WO (1) WO2022185360A1 (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017091479A (ja) * 2015-11-17 2017-05-25 エヌ・ティ・ティ・コムウェア株式会社 学習支援システム、学習支援方法、学習支援装置、および学習支援プログラム
JP2018106662A (ja) * 2016-12-22 2018-07-05 キヤノン株式会社 情報処理装置、情報処理方法、プログラム
WO2019167556A1 (ja) * 2018-02-27 2019-09-06 国立大学法人九州工業大学 ラベル収集装置、ラベル収集方法及びラベル収集プログラム
JP2020042737A (ja) * 2018-09-13 2020-03-19 株式会社東芝 モデル更新支援システム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017091479A (ja) * 2015-11-17 2017-05-25 エヌ・ティ・ティ・コムウェア株式会社 学習支援システム、学習支援方法、学習支援装置、および学習支援プログラム
JP2018106662A (ja) * 2016-12-22 2018-07-05 キヤノン株式会社 情報処理装置、情報処理方法、プログラム
WO2019167556A1 (ja) * 2018-02-27 2019-09-06 国立大学法人九州工業大学 ラベル収集装置、ラベル収集方法及びラベル収集プログラム
JP2020042737A (ja) * 2018-09-13 2020-03-19 株式会社東芝 モデル更新支援システム

Also Published As

Publication number Publication date
JPWO2022185360A1 (ja) 2022-09-09
US20240144057A1 (en) 2024-05-02

Similar Documents

Publication Publication Date Title
US10776580B2 (en) Method for providing dialogue service with chatbot assisted by human agents
US20170046625A1 (en) Information processing apparatus and method and non-transitory computer readable medium
CN107818798A (zh) 客服服务质量评价方法、装置、设备及存储介质
CN115398396A (zh) 在面向任务的对话系统中训练用户系统对话
US10180939B2 (en) Emotional and personality analysis of characters and their interrelationships
CN109119067B (zh) 语音合成方法及装置
US11114111B2 (en) Dialogue analysis
WO2020247586A1 (en) Automated conversation review to surface virtual assistant misunderstandings
WO2016087982A1 (en) Persona-based profiles in question answering system
US20190295098A1 (en) Performing Real-Time Analytics for Customer Care Interactions
Wang et al. “Love ya, jerkface”: Using Sparse Log-Linear Models to Build Positive and Impolite Relationships with Teens
US11093716B2 (en) Conversation support apparatus, conversation support method, and computer readable recording medium
WO2022185360A1 (ja) 支援装置、支援方法およびプログラム
WO2022185362A1 (ja) 支援装置、支援方法およびプログラム
US11960847B2 (en) Systems and methods for generating responses for an intelligent virtual
CN113257060A (zh) 一种答疑解决方法、装置、设备和存储介质
Weitz et al. Working memory and sequence learning in the Hebb digits task: Awareness is predicted by individual differences in operation span
JP2021157419A (ja) 対話型業務支援システムおよび対話型業務支援方法
US20200257494A1 (en) Voice-based grading assistant
CN113657118B (zh) 基于通话文本的语义分析方法、装置和系统
KR102168556B1 (ko) 훈련 평가 시스템
WO2022185363A1 (ja) ラベル付与支援装置、ラベル付与支援方法およびプログラム
US20200125658A1 (en) Inter-reviewer conflict resolution
WO2022185364A1 (ja) 学習装置、学習方法およびプログラム
JP2022001930A (ja) アクティブラーニングシステム及びアクティブラーニングプログラム

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 21928938

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2023503531

Country of ref document: JP

Kind code of ref document: A

WWE Wipo information: entry into national phase

Ref document number: 18279590

Country of ref document: US

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 21928938

Country of ref document: EP

Kind code of ref document: A1