JPWO2016151692A1 - タグ付与支援装置、方法およびプログラム - Google Patents

タグ付与支援装置、方法およびプログラム Download PDF

Info

Publication number
JPWO2016151692A1
JPWO2016151692A1 JP2017507158A JP2017507158A JPWO2016151692A1 JP WO2016151692 A1 JPWO2016151692 A1 JP WO2016151692A1 JP 2017507158 A JP2017507158 A JP 2017507158A JP 2017507158 A JP2017507158 A JP 2017507158A JP WO2016151692 A1 JPWO2016151692 A1 JP WO2016151692A1
Authority
JP
Japan
Prior art keywords
intention
candidates
hierarchical
utterance
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Abandoned
Application number
JP2017507158A
Other languages
English (en)
Inventor
雅弘 伊藤
雅弘 伊藤
憲治 岩田
憲治 岩田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Publication of JPWO2016151692A1 publication Critical patent/JPWO2016151692A1/ja
Abandoned legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9032Query formulation
    • G06F16/90332Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1815Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1822Parsing for meaning understanding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/221Announcement of recognition results
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Physics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

短時間かつ正確なタグ付与を支援できる。本実施形態に係るタグ付与支援装置は、第1取得部、推定部、第1格納部、第2取得部および提示部。第1取得部は、ユーザの発話に関する発話文を取得する。推定部は、前記発話文の発話意図を推定し、該発話意図の候補となる1以上の意図候補を得る。第1格納部は、対話システムで用いられる意図を階層構造で表現した意図体系を格納する。第2取得部は、前記1以上の意図候補に基づいて、前記意図体系の一部を1以上の階層意図候補として取得する。提示部は、前記1以上の階層意図候補を提示する。

Description

本発明の実施形態は、タグ付与支援装置、方法およびプログラムに関する。
対話システムにおいて、ユーザが発話した内容を示す発話文に対し、ユーザの発話意図を表す意図タグを付与する処理がある。この処理には、作業者が発話文を見て、意図タグの候補群から正しい意図だと思われる意図タグを選択するという手法が一般的に用いられる。この際、例えば、全ての候補を提示して作業者に意図タグを選択させる手法と、より確からしい少数の候補に意図タグを絞り込んでから提示し、作業者に意図タグを選択させる手法とがある。
米国特許出願公開第2014/0379326号
しかし、全ての意図タグの候補を提示する手法では、候補の数が数十、数百と多くなるほど、全ての候補の意味を理解して意図タグを付与することは困難である。また、候補の数が多いのにもかかわらず短時間で作業を行う必要がある場合、候補の意味を十分に理解しにくいため、意図タグの付与処理の精度が低下してしまう。
また、候補が少数の候補群に絞り込まれる手法では、絞り込まれた候補群の中に正解となる候補が存在しない可能性もあり、このような場合は、正しい意図タグを付与することができない。
本開示は、上述の課題を解決するためになされたものであり、短時間で正確なタグ付与を支援することができるタグ付与支援装置、方法およびプログラムを提供することを目的とする。
本実施形態に係るタグ付与支援装置は、第1取得部、推定部、第1格納部、第2取得部および提示部。第1取得部は、ユーザの発話に関する発話文を取得する。推定部は、前記発話文の発話意図を推定し、該発話意図の候補となる1以上の意図候補を得る。第1格納部は、対話システムで用いられる意図を階層構造で表現した意図体系を格納する。第2取得部は、前記1以上の意図候補に基づいて、前記意図体系の一部を1以上の階層意図候補として取得する。提示部は、前記1以上の階層意図候補を提示する。
第1の実施形態に係るタグ付与支援装置を示すブロック図。 意図体系DBに格納される意図体系の一例を示す図。 タグ付与支援装置の動作を示すフローチャート。 意図候補推定部の処理によって得られる1以上の意図候補の一例を示す図。 図4に示す意図候補から意図体系取得部が取得する階層意図候補の一例を示す図。 作業結果DB107に格納されるデータの一例を示す図。 第2の実施形態に係るタグ付与支援装置を示すブロック図。 階層意図候補の階層構造が変換された結果の一例を示す図。
以下、図面を参照しながら本実施形態に係るタグ付与支援装置、方法およびプログラム、および端末について詳細に説明する。なお、以下の実施形態では、同一の参照符号を付した部分は同様の動作をおこなうものとして、重複する説明を適宜省略する。
(第1の実施形態)
第1の実施形態に係るタグ付与支援装置について図1のブロック図を参照して説明する。
第1の実施形態に係るタグ付与支援装置100は、発話文取得部101(第1取得部ともいう)、意図候補推定部102、意図体系データベース(DB)103(第1格納部ともいう)、意図体系取得部104(第2取得部ともいう)、提示部105、意図選択部106および作業結果データベース(DB)107(第2格納部ともいう)を含む。
発話文取得部101は、対話システムに対して発話されるような、ユーザの発話に関する発話文を取得する。ここでは、外部から、対話システムの対話履歴やログデータを取得すればよい。また、発話文は、キーボード入力されたものでもよいし、発話を音声認識した結果を発話文として取得してもよい。
意図候補推定部102は、発話文取得部101から発話文を受け取り、発話文から、発話文が表す可能性のある発話意図を推定し、発話意図の候補となる1以上の意図候補を得る。
意図体系DB103は、対話システムで用いられる意図を階層構造で表現した意図体系を格納する。意図体系については、図2を参照して後述する。
意図体系取得部104は、前記意図候補推定部102から発話文および1以上の意図候補を受け取り、1以上の意図候補に基づいて、意図体系DB103から意図体系の一部を1以上の階層意図候補として取得する。
提示部105は、意図体系取得部104から発話文および1以上の階層意図候補を取得し、発話文および1以上の階層意図候補を作業者150に提示する。作業者150は、意図タグの付与処理を行う作業者であり、発話文に関する発話をしたユーザとは別の者を想定するが、発話文に関する発話をしたユーザが作業を行なってもよい。
意図選択部106は、提示部105から発話文および1以上の階層意図候補を、作業者150からの指示をそれぞれ受け取り、作業者150からの指示に応じた階層意図候補を、発話文の選択意図として選択する。
作業結果DB107は、意図選択部106から発話文および選択意図を受け取り、発話文および選択意図を対応付けて格納する。
次に、意図体系DB103に格納される意図体系の一例について図2を参照して説明する。
図2に示すように、意図体系は、上位概念201および下位概念202を持つ階層構造で設計される。具体的には、上位概念201の意図として「電源操作」があり、「電源操作」の下位概念202の意図として「入れる」および「切る」が関連付いている。すなわち、「電源操作」という概念には、「電源を入れる」操作か「電源を切る」操作かを特定せず、「電源に関して何らかの操作をする」という意図が表されている。意図体系DB103に格納される意図体系は、外部データなどを参照して予め作成されればよい。
図2では、具体例として、テレビ操作に関する対話システムを想定する場合の意図体系を示しており、テレビ操作に関する対話システムは、テレビ操作に関する意図として、以下の意図が設計されていると想定する。
「Power(電源操作)」
「Power−on(電源を入れる)」
「Power−off(電源を切る)」
「Mute(消音操作)」
「Mute−on(消音する)」
「Mute−off(消音を解除する)」
「Volume(音量操作)」
「Volume−up(音量を上げる)」
「Volume−down(音量を下げる)」
「Volume−specific(音量を特定値にする)」
なお、各意図は、意図タグによって識別される。意図タグは、単なる意図を表す識別子であり、数字であっても記号であってもよい。また、その意図の意味を自然言語で説明する説明文が対応付けられていてもよい。なお、ハイフン「−」で接続される意図は、「上位概念−下位概念」を表す。
例えば、意図「Power(電源操作)」の場合、「Power」が意図タグであり、「電源操作」が説明文である。上述の意図が設計される場合、例えば、この対話システムに対してユーザが「電源を操作したい」と発話すると、発話の意図として「Power」が意図解析処理によって自動的に付与される。
なお、図2の例では、上位概念「Volume」の下位概念「up」の説明文として「上げる」が対応付けられている。よって、意図タグ「Volume−up」の説明文は、「音量操作−上げる」であってもよい。すなわち、図2に示すような意図体系の意図タグを組み合わせたときの説明文の組み合わせ(例えば、「音量操作−上げる」)でもよいし、全ての組み合わせについて予め意図タグに説明文を付けておいてもよい(例えば、「音量を上げる」)。
次に、第1の実施形態に係るタグ付与支援装置100の動作について図3のフローチャートを参照して説明する。
ステップS301では、発話文取得部101が、意図タグの付与処理を行う対象となる1つの発話文を取得する。
ステップS302では、意図候補推定部102が、発話文の1以上の意図候補を推定する。意図候補は、対話システムで用いられる意図から推定される。意図候補は、例えば、既存の意図解析処理によって得られる意図をN−bestの形式で取得すればよい。または、発話文と対話システムで取り扱われる意図の説明文との文字列マッチングによって、一致度の高い説明文に対応する意図から1以上の意図候補を選択すればよい。また、統計的手法によって、推定スコアの高い意図から順に1以上の意図候補として選択してもよい。統計的手法とは、事前に用意した複数の発話文と発話文の意図とのペアを正解データとして、未知の発話文に関する意図を統計的に推定する手法である。
ステップS303では、意図体系取得部104が、1以上の意図候補に基づいて、意図体系DB103から、意図体系の一部を、意図体系の構造を保持したまま階層意図候補として取得する。ステップS303の処理によって、少数の意図候補の中で類似しやすいまたは混同しやすい意図を、意図体系の階層構造を用いてできる限り網羅的に取得することができる。
階層意図候補は、例えば、少なくとも1つの意図候補について、意図候補に対応する意図体系における意図の階層上の上位概念の意図と、上位概念の意図の下位概念となる意図とを取得する方法があげられる。なお、1以上の意図候補のそれぞれについて、上位概念の意図の下位概念となる意図を全て取得してもよい。
ステップS304では、提示部105が、発話文および1以上の階層意図候補を作業者に提示する。例えば、意図タグの付与処理を実施するためのユーザインタフェース画面に1以上の階層意図候補を選択肢として表示すればよい。また、提示する階層意図候補の中に、発話の意図を表すと考えられる意図が存在しない場合に作業者が選択する項目、「該当なし」「N/A」等を別途追加してもよい。また、階層意図候補の階層構造全体を提示してもよいし、初めは最上位の階層である階層意図候補(上位候補)を提示し、ユーザインタフェース画面において、作業者が上位候補をタッチ、またはマウスなどでクリックするなど、作業者の指示に応じて下位層が展開されて提示されるようにしてもよい。
ステップS305では、意図選択部106が、作業者からの指示に応じて、選択された階層意図候補を選択意図として得る。
ステップS306では、作業結果DB107が、発話文と選択意図とを対応付けて格納する。以上で、第1の実施形態に係るタグ付与支援装置100の動作を終了する。
次に、第1の実施形態に係るタグ付与支援装置100の具体例について図2、図4および図5を参照して説明する。
ここで、上述のテレビの操作に関する対話システムでは意図が正確に解釈できない場合、例えばユーザが「音を少なくして」と発話した場合を想定する。発話文取得部101は、発話文「音を少なくして」を取得する。
発話文「音を少なくして」から意図候補推定部102の処理によって得られる1以上の意図候補の一例を図4に示す。
ここでは、発話文「音を少なくして」の発話意図を既存の意図解析処理によって推定し、4−bestの意図候補401を得る。具体的には、「消音する」「音量を上げる」「音量を特定の値に変える」「音響モードを変更する」を得たとする。
図4に示す意図候補から意図体系取得部104が取得する階層意図候補の一例を図5に示す。
図5は、図4の意図候補401について、図2に示す意図体系における上位概念の意図と、上位概念の意図に対する全ての下位概念の意図とを取得した階層意図候補501の例である。
具体的には、例えば、意図候補401「消音する」について、図2に示す意図体系では、意図「Mute−on(消音操作−消音する)」が対応し、「Mute−on(消音操作−消音する)」の上位概念の意図である「Mute(消音操作)」を取得する。さらに、上位概念の意図「Mute(消音操作)」の下位概念の意図「on(消音する)」「off(解除する)」も全て取得する。
よって、階層意図候補として、「Mute(消音操作)」「Mute−on(消音操作−消音する)」「Mute−off(消音操作−解除する)」を得ることができる。
また、意図候補401「音量を上げる」「音量を特定の値に変える」「音響モードを変更する」についても、同様の処理によって図5に示す階層意図候補501を得ることができる。なお、意図候補401「音量を上げる」および意図候補401「音量を特定の値に変える」については、同一の上位概念が抽出されるので、階層意図候補501は、どちらかの意図候補401の処理によって得られる階層意図候補501を保持すればよい。
作業者は、図5の階層意図候補501が提示された画面を参照して、選択肢となる階層意図候補501の各意図の上位概念または並列の概念の関係を確認した上で、発話文の意味を正しく表すと思われる意図タグを選択することができる。
つまり、作業者は、発話文「音を少なくして」に対して音量操作の下位層にある「下げる」を選択することで、意図選択部106が選択意図「volume−down(音量を下げる)」を得ることができる。
図5に示す階層意図候補501によれば、図4に示す意図候補では存在しない「volume−down(音量を下げる)」という意図を作業者に提示することができ、最適な意図タグを付与することができる。
次に、作業結果DB107に格納されるデータについて図6を参照して説明する。
図6に示すテーブル600は、発話文601と意図タグ602とを対応付けて格納する。上述の例では、図5に示すような階層意図候補501のうち、作業者に選択された階層意図候補501を選択意図(図6では意図タグ)として格納する。作業者の選択により付与されたテーブル600を意図候補推定部102で利用する意図解析処理のデータベースなどにフィードバックすることで、より意図候補推定の精度を高めることができる。
以上に示した第1の実施形態によれば、意図体系取得部が、対話システムが取り扱う意図体系の階層構造を用いて、類似するまたは混同しやすい意図を拡張することによって、意図候補推定部で取得された意図候補の推定が不十分である場合でも、より網羅的な選択候補を作業者に提示することができ、作業者による短時間かつ正確なタグ付与を支援することができる。
(第2の実施形態)
第1の実施形態では、意図体系の階層構造を保持したままの階層意図候補が提示されるが、第2の実施形態では、階層意図候補の階層構造を変換する点が異なる。このようにすることで、
第2の実施形態に係るタグ付与支援装置について図7を参照して説明する。
第2の実施形態に係るタグ付与支援装置700は、発話文取得部101、意図候補推定部102、意図体系DB103、意図体系取得部104、提示部105、意図選択部106、作業結果データベースDB107および変換部701を含む。
変換部701以外については、第1の実施形態と同様であるので、ここでの説明を省略する。
変換部701は、意図体系取得部104から階層意図候補を受け取り、階層意図候補の階層構造を変換する。変換方法としては、階層意図候補の中で下位概念として出現する回数が閾値以上である意図が上位概念となるように、階層意図候補の階層構造が変換されればよい。または、変換部701が発話文を1以上の文節に分割した際に、意図を表す確信度が閾値以上である文節の意味を表す意図が上位概念となるように、階層意図候補の階層構造が変換されればよい。確信度を算出する方法としては、例えば、対象とする対話システムの構築に用いられる発話文コーパスにおける各文節の出現確率を用いればよい。なお、文節の意味を表す意図は、意図候補推定部102における発話意図の推定処理と同様の処理を用いて取得すればよい。
なお、提示部105は、変換部701から変換後の階層意図候補を受け取り、変換後の階層意図候補を作業者に提示する。
次に、変換部701が階層意図候補の階層構造を変換した結果の一例について図8を参照して説明する。
図8(a)は、発話文「見てるのを止めて」に対して意図タグの付与処理を行った結果、意図体系取得部104で得られる階層意図候補の一例である。図8(a)に示すように、階層意図候補の中では下位概念の意図801「execute(する)」および下位概念の意図802「stop(止める)」が多く出現する。よって、予め設定される閾値が「5」である場合、変換部701は、階層意図候補の中で下位概念の意図801「execute(する)」および意図802「stop(止める)」が出現する回数が「7」回であり、閾値以上となることから、下位概念の意図801「execute(する)」および意図802「stop(止める)」がそれぞれ上位概念となるように階層構造を変換する。
図8(b)は、変換後の階層意図候補の階層構造を示す。図8(b)に示すように、意図801「execute(する)」および意図802「stop(止める)」が上位概念となり、変換前に上位概念の意図であった「Doublescreen(2画面表示)」「Rec(録画操作)」「Slowmotion(スロー再生)」「FastForward(早送り)」「Rewind(巻き戻し)」「Play(番組再生)」「Pause(一時停止)」が新たな下位概念となる。
なお、発話文「見てるのを止めて」の文節「止めて」が、意図「止める」を表すという確信度が高い場合、変換部701は、意図801「execute(する)」に関する階層意図候補を削除し、意図802「stop(止める)」に関する階層意図候補のみを残すようにしてもよい。これにより、作業者が検討すべき選択肢が絞られるので、作業者は、より意図タグの付与処理がしやすくなる。
なお、変換部701は、階層意図候補の階層構造を変換する代わりに、意図体系DB103に格納される意図体系の階層構造を変換してもよい。変換方法は、上述の場合と同様に行えばよい。変換部701は、変換後の意図体系の階層構造を保持し、意図体系取得部104は、変換後の意図体系から階層意図候補を取得すればよい。階層意図候補を取得する前に意図体系の階層構造を変換する場合でも、図8(b)に示すような変換後の階層意図候補を得ることができる。
以上に示した第2の実施形態によれば、意図体系の階層構造を変換することにより、類似するまたは混同しやすい意図が下位概念として同一階層にまとめられるので、作業者は、意図候補中の比較対象が明確になり、変換前より短時間で効率よく付与候補として提示される意図タグの違いを把握できる。よって、作業者による短時間かつ正確なタグ付与を支援することができる。
上述の実施形態の中で示した処理手順に示された指示は、ソフトウェアであるプログラムに基づいて実行されることが可能である。汎用の計算機システムが、このプログラムを予め記憶しておき、このプログラムを読み込むことにより、上述したタグ付与支援装置による効果と同様な効果を得ることも可能である。上述の実施形態で記述された指示は、コンピュータに実行させることのできるプログラムとして、磁気ディスク(フレキシブルディスク、ハードディスクなど)、光ディスク(CD−ROM、CD−R、CD−RW、DVD−ROM、DVD±R、DVD±RW、Blu−ray(登録商標)Discなど)、半導体メモリ、又はこれに類する記録媒体に記録される。コンピュータまたは組み込みシステムが読み取り可能な記録媒体であれば、その記憶形式は何れの形態であってもよい。コンピュータは、この記録媒体からプログラムを読み込み、このプログラムに基づいてプログラムに記述されている指示をCPUで実行させれば、上述した実施形態のタグ付与支援装置と同様な動作を実現することができる。もちろん、コンピュータがプログラムを取得する場合又は読み込む場合はネットワークを通じて取得又は読み込んでもよい。
また、記録媒体からコンピュータや組み込みシステムにインストールされたプログラムの指示に基づきコンピュータ上で稼働しているOS(オペレーティングシステム)や、データベース管理ソフト、ネットワーク等のMW(ミドルウェア)等が本実施形態を実現するための各処理の一部を実行してもよい。
さらに、本実施形態における記録媒体は、コンピュータあるいは組み込みシステムと独立した媒体に限らず、LANやインターネット等により伝達されたプログラムをダウンロードして記憶または一時記憶した記録媒体も含まれる。
また、記録媒体は1つに限られず、複数の媒体から本実施形態における処理が実行される場合も、本実施形態における記録媒体に含まれ、媒体の構成は何れの構成であってもよい。
なお、本実施形態におけるコンピュータまたは組み込みシステムは、記録媒体に記憶されたプログラムに基づき、本実施形態における各処理を実行するためのものであって、パソコン、マイコン等の1つからなる装置、複数の装置がネットワーク接続されたシステム等の何れの構成であってもよい。
また、本実施形態におけるコンピュータとは、パソコンに限らず、情報処理機器に含まれる演算処理装置、マイコン等も含み、プログラムによって本実施形態における機能を実現することが可能な機器、装置を総称している。
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行なうことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
100,700…タグ付与支援装置、101…発話文取得部、102…意図候補推定部、103…意図体系データベース(DB)、104…意図体系取得部、105…提示部、106…意図選択部、107…作業結果データベース(DB)、150…作業者、301…上位概念、302…下位概念、401…意図候補、501…階層意図候補、600…テーブル、601…発話文、602…意図タグ、701…変換部、801,802…意図。

Claims (14)

  1. ユーザの発話に関する発話文を取得する第1取得部と、
    前記発話文の発話意図を推定し、該発話意図の候補となる1以上の意図候補を得る推定部と、
    対話システムで用いられる意図を階層構造で表現した意図体系を格納する第1格納部と、
    前記1以上の意図候補に基づいて、前記意図体系の一部を1以上の階層意図候補として取得する第2取得部と、
    前記1以上の階層意図候補を提示する提示部と、を具備することを特徴とするタグ付与支援装置。
  2. 前記1以上の階層意図候補から、前記ユーザまたは作業者からの指示に応じて階層意図候補を選択意図として選択する選択部をさらに具備することを特徴とする請求項1に記載のタグ付与支援装置。
  3. 前記発話文および前記選択意図を対応付けて格納する第2格納部をさらに具備することを特徴とする請求項2に記載のタグ付与支援装置。
  4. 前記第2取得部は、前記1以上の意図候補の少なくとも1つの意図候補について、対応する前記意図体系における意図の階層上の上位概念の意図と、該上位概念の意図の下位概念の意図とを取得することを特徴とする請求項1から請求項3のいずれか1項に記載のタグ付与支援装置。
  5. 前記1以上の階層意図候補の階層構造を変換する変換部をさらに具備し、
    前記提示部は、前記階層構造が変換された1以上の階層意図候補を提示することを特徴とする請求項1から請求項4のいずれか1項に記載のタグ付与支援装置。
  6. 前記第1格納部に格納される前記意図体系の階層構造を変換する変換部をさらに具備し、
    前記第2取得部は、前記階層構造が変換された意図体系から、前記1以上の階層意図候補として取得することを特徴とする請求項1から請求項4のいずれか1項に記載のタグ付与支援装置。
  7. 前記変換部は、下位概念として出現する回数が閾値以上である意図が上位概念となるように前記階層構造を変換することを特徴とする請求項5または請求項6に記載のタグ付与支援装置。
  8. 前記変換部は、前記発話文の1以上の文節のうち、意図を表す確信度が閾値以上である文節の意図が上位概念となるように前記階層構造を変換することを特徴とする請求項5から請求項7のいずれか1項に記載のタグ付与支援装置。
  9. 前記推定部は、前記発話文と意図タグの説明文との文字列マッチングにより、前記1以上の意図候補を得ることを特徴とする請求項1から請求項8のいずれか1項に記載のタグ付与支援装置。
  10. 前記推定部は、推定した意図のうちのN−bestを前記1以上の意図候補として得ることを特徴とする請求項1から請求項8のいずれか1項に記載のタグ付与支援装置。
  11. 前記第2取得部は、前記階層意図候補として、前記意図体系の一部を前記意図体系の構造を保持したまま取得することを特徴とする請求項1から請求項10のいずれか1項に記載のタグ付与支援装置。
  12. 前記提示部は、前記1以上の階層意図候補のうち最上位の階層を提示し、作業者の指示に応じて、該1以上の階層意図候補のうちの下位層を展開して提示することを特徴とする請求項3に記載のタグ付与支援装置。
  13. ユーザの発話に関する発話文を取得し、
    前記発話文の発話意図を推定し、該発話意図の候補となる1以上の意図候補を得、
    対話システムで用いられる意図を階層構造で表現した意図体系を格納部に格納し、
    前記1以上の意図候補に基づいて、前記意図体系の一部を1以上の階層意図候補として取得し、
    前記1以上の階層意図候補を提示することを特徴とするタグ付与支援方法。
  14. コンピュータを、
    ユーザの発話に関する発話文を取得する第1取得手段と、
    前記発話文の発話意図を推定し、該発話意図の候補となる1以上の意図候補を得る推定手段と、
    対話システムで用いられる意図を階層構造で表現した意図体系を格納する第1格納手段と、
    前記1以上の意図候補に基づいて、前記意図体系の一部を1以上の階層意図候補として取得する第2取得手段と、
    前記1以上の階層意図候補を提示する提示手段と、して機能させるためのタグ付与支援プログラム。
JP2017507158A 2015-03-20 2015-03-20 タグ付与支援装置、方法およびプログラム Abandoned JPWO2016151692A1 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2015/058544 WO2016151692A1 (ja) 2015-03-20 2015-03-20 タグ付与支援装置、方法およびプログラム

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2018172662A Division JP6633708B2 (ja) 2018-09-14 2018-09-14 タグ付与支援装置、方法およびプログラム

Publications (1)

Publication Number Publication Date
JPWO2016151692A1 true JPWO2016151692A1 (ja) 2017-06-15

Family

ID=56977862

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017507158A Abandoned JPWO2016151692A1 (ja) 2015-03-20 2015-03-20 タグ付与支援装置、方法およびプログラム

Country Status (3)

Country Link
US (1) US10311867B2 (ja)
JP (1) JPWO2016151692A1 (ja)
WO (1) WO2016151692A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016151692A1 (ja) * 2015-03-20 2016-09-29 株式会社 東芝 タグ付与支援装置、方法およびプログラム
KR102368488B1 (ko) * 2018-11-30 2022-03-02 주식회사 카카오 발화 내용을 태깅하는 서버, 사용자 단말 및 방법

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000200273A (ja) * 1998-11-04 2000-07-18 Atr Interpreting Telecommunications Res Lab 発話意図認識装置
JP2012042998A (ja) * 2010-08-12 2012-03-01 Nec Biglobe Ltd 最適タグ提案装置、最適タグ提案システム、最適タグ提案方法、およびプログラム

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU3694300A (en) 1999-02-01 2000-08-18 Ibm Multimedia archive description scheme
JP2003242136A (ja) * 2002-02-20 2003-08-29 Fuji Xerox Co Ltd 構文情報タグ付与支援システムおよび方法
US7747601B2 (en) * 2006-08-14 2010-06-29 Inquira, Inc. Method and apparatus for identifying and classifying query intent
US8265939B2 (en) * 2005-08-31 2012-09-11 Nuance Communications, Inc. Hierarchical methods and apparatus for extracting user intent from spoken utterances
JP2007193697A (ja) 2006-01-20 2007-08-02 Oki Electric Ind Co Ltd 情報収集装置,情報収集方法およびプログラム
JP4895988B2 (ja) 2007-12-13 2012-03-14 ヤフー株式会社 文書分類装置の余分構造減退方法
US8521818B2 (en) * 2010-08-05 2013-08-27 Solariat, Inc. Methods and apparatus for recognizing and acting upon user intentions expressed in on-line conversations and similar environments
US20130325992A1 (en) * 2010-08-05 2013-12-05 Solariat, Inc. Methods and apparatus for determining outcomes of on-line conversations and similar discourses through analysis of expressions of sentiment during the conversations
US8688453B1 (en) * 2011-02-28 2014-04-01 Nuance Communications, Inc. Intent mining via analysis of utterances
US9928484B2 (en) * 2011-06-24 2018-03-27 Facebook, Inc. Suggesting tags in status messages based on social context
US9311298B2 (en) 2013-06-21 2016-04-12 Microsoft Technology Licensing, Llc Building conversational understanding systems using a toolset
US9870356B2 (en) * 2014-02-13 2018-01-16 Microsoft Technology Licensing, Llc Techniques for inferring the unknown intents of linguistic items
US9690771B2 (en) * 2014-05-30 2017-06-27 Nuance Communications, Inc. Automated quality assurance checks for improving the construction of natural language understanding systems
WO2016151692A1 (ja) * 2015-03-20 2016-09-29 株式会社 東芝 タグ付与支援装置、方法およびプログラム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000200273A (ja) * 1998-11-04 2000-07-18 Atr Interpreting Telecommunications Res Lab 発話意図認識装置
JP2012042998A (ja) * 2010-08-12 2012-03-01 Nec Biglobe Ltd 最適タグ提案装置、最適タグ提案システム、最適タグ提案方法、およびプログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
入江 友紀 外4名: "意図タグつきコーパスを用いた発話意図推定手法", 第38回 言語・音声理解と対話処理研究会資料 (SIG−SLUD−A301), JPN6018004890, 4 July 2003 (2003-07-04), JP, pages 7 - 12, ISSN: 0003738734 *

Also Published As

Publication number Publication date
US10311867B2 (en) 2019-06-04
US20170140758A1 (en) 2017-05-18
WO2016151692A1 (ja) 2016-09-29

Similar Documents

Publication Publication Date Title
US10229675B2 (en) Scalable dynamic class language modeling
US20120016671A1 (en) Tool and method for enhanced human machine collaboration for rapid and accurate transcriptions
JP2019046468A (ja) インターフェイススマートインタラクティブ制御方法、装置、システム及びプログラム
JP2016057986A (ja) 音声翻訳装置、方法およびプログラム
JP2015176099A (ja) 対話システム構築支援装置、方法、及びプログラム
JP6235280B2 (ja) 音声同時処理装置、方法およびプログラム
JP6470097B2 (ja) 通訳装置、方法およびプログラム
JP2015026057A (ja) インタラクティブキャラクター基盤の外国語学習装置及び方法
JP6143883B2 (ja) 対話支援システム、方法、及びプログラム
US20140149119A1 (en) Speech transcription including written text
JP6873805B2 (ja) 対話支援システム、対話支援方法、及び対話支援プログラム
JP7132090B2 (ja) 対話システム、対話装置、対話方法、及びプログラム
JP2016062357A (ja) 音声翻訳装置、方法およびプログラム
JP2017058865A (ja) 機械翻訳装置、機械翻訳方法および機械翻訳プログラム
JP6495792B2 (ja) 音声認識装置、音声認識方法、プログラム
KR20170035529A (ko) 전자 기기 및 그의 음성 인식 방법
US8688447B1 (en) Method and system for domain-specific noisy channel natural language processing (NLP)
JP6305629B2 (ja) 分類装置、方法及びプログラム
KR20210060897A (ko) 음성 처리 방법 및 장치
JP2013109061A (ja) 音声データ検索システムおよびそのためのプログラム
CN111326144A (zh) 语音数据处理方法、装置、介质和计算设备
WO2016151692A1 (ja) タグ付与支援装置、方法およびプログラム
JP2015148758A (ja) 音声対話システム及び音声対話方法
JP6391925B2 (ja) 音声対話装置、方法およびプログラム
JP2013050742A (ja) 音声認識装置および音声認識方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20161205

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180213

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180315

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180828

A762 Written abandonment of application

Free format text: JAPANESE INTERMEDIATE CODE: A762

Effective date: 20180925