JP6305629B2 - 分類装置、方法及びプログラム - Google Patents
分類装置、方法及びプログラム Download PDFInfo
- Publication number
- JP6305629B2 JP6305629B2 JP2017505993A JP2017505993A JP6305629B2 JP 6305629 B2 JP6305629 B2 JP 6305629B2 JP 2017505993 A JP2017505993 A JP 2017505993A JP 2017505993 A JP2017505993 A JP 2017505993A JP 6305629 B2 JP6305629 B2 JP 6305629B2
- Authority
- JP
- Japan
- Prior art keywords
- classification
- dialogue
- user
- search
- utterance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 20
- 238000000605 extraction Methods 0.000 claims description 27
- 230000002452 interceptive effect Effects 0.000 claims description 16
- 238000004364 calculation method Methods 0.000 claims description 11
- 238000013500 data storage Methods 0.000 claims description 9
- 230000003993 interaction Effects 0.000 claims description 9
- 230000008859 change Effects 0.000 claims description 7
- 230000009471 action Effects 0.000 description 21
- 230000004044 response Effects 0.000 description 17
- 230000008569 process Effects 0.000 description 7
- 238000012937 correction Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 239000000470 constituent Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/242—Dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/268—Morphological analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
- G06F40/35—Discourse or dialogue representation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1822—Parsing for meaning understanding
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Artificial Intelligence (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
図1は、第1の実施形態に係る対話システム100を概略的に示している。対話システム100は、図1に示されるように、音声認識部101、意図理解部102、辞書記憶部103、意図モデル記憶部104、対話制御部105、応答生成部106、対話ログ管理部107、対話ログ記憶部108、対象ログ抽出部109、分類関係生成部110、及び分類データ記憶部111を備える。対象ログ抽出部109及び分類関係生成部110を含む部分を分類装置と称する。
図2は、ユーザと対話システム100との対話の例を示す。この例では、クライアントがテレビ装置であり、対話システム100は、データベースからユーザが所望する番組を取得し、取得した番組をテレビ装置に提供する。
Inputフィールドについて説明する。dialogue.textは、ユーザの発話を表す。ID=1では、ユーザの発話は、dialogue.textに記述された「ジャンルがサスペンスドラマである番組が見たい」である。dialogue.screenは、クライアントのスクリーンの状態を表す。ID=1では、dialogue.screenはOAであり、これは、クライアントが放送中の番組を表示していることを示す。ID=5では、dialogue.screenはresult.searchであり、これは、クライアントが検索結果を表示していることを示す。resultは、クライアントのアクション結果を表す。検索などのアクションの成功又は失敗又はエラーを示す状態はresult.statusに記述され、検索結果の件数はresult.args.hitに記述される。
このようにして、対象ログ抽出部109は、データの分類をカスタマイズするために使用する対話ログのセットを抽出する。
図8は、第2の実施形態に係る対話システム800を概略的に示している。図8に示される対話システム800は、図1に示される対話システム100の構成に加えて、重要度計算部801及び分類関係更新部802を備える。本実施形態では、複数のユーザが対話システム800を利用し、分類データ記憶部111は、これらユーザの分類データに基づいて生成される共有分類データを管理する。
重要度=ユーザ数+分類関係利用頻度+検索結果利用頻度
図9Aに示される状態で分類関係の重要度を計算する。ここでは、説明を簡単にするために、分類関係利用頻度は全て1であり、検索結果利用頻度は全て1であるとする。
番組I1が分類C3に所属する分類関係の重要度=1+1+1=3
番組I3が分類C4に所属する分類関係の重要度=1+1+1=3
分類C4が分類C3の下位分類である分類関係の重要度=1+1+1=3
分類関係更新部802は、閾値以上の重要度を持つ分類関係を用いて、共有分類データを更新する。例えば閾値を4とする。この場合、図9Bに示すように、番組I1が分類C2に所属する分類関係が共有分類データに追加される。なお、閾値は、対話システム100を用いるユーザの数又は検索回数の分布から動的に設定されてもよい。共有分類データは、全てのユーザに共有される。具体的には、共有分類データに追加された共有分類は、全てのユーザの分類データに含まれるようになる。また、例えば、新たなユーザが発生した場合、このユーザの初期の分類データを共有分類データと同じものとすることができる。
図10は、第3の実施形態に係る対話システム1000を概略的に示している。図10に示される対話システム1000は、図1に示される対話システム100の構成に加えて、類似度計算部1001を備える。類似度計算部1001は、対話ログに含まれる分類間の類似度を計算する。
また、記録媒体からコンピュータや組み込みシステムにインストールされたプログラムの指示に基づきコンピュータ上で稼働しているOS(オペレーティングシステム)や、データベース管理ソフト、ネットワーク等のMW(ミドルウェア)等が本実施形態を実現するための各処理の一部を実行してもよい。
さらに、本実施形態における記録媒体は、コンピュータあるいは組み込みシステムと独立した媒体に限らず、LANやインターネット等により伝達されたプログラムをダウンロードして記憶又は一時記憶した記録媒体も含まれる。
また、記録媒体は1つに限られず、複数の媒体から本実施形態における処理が実行される場合も、本実施形態における記録媒体に含まれ、媒体の構成は何れの構成であってもよい。
また、本実施形態におけるコンピュータとは、パソコンに限らず、情報処理機器に含まれる演算処理装置、マイコン等も含み、プログラムによって本実施形態における機能を実現することが可能な機器、装置を総称している。
Claims (6)
- ユーザと対話システムとの対話に関する対話ログであって少なくとも当該ユーザの発話意図を含む対話ログを記憶する対話ログ記憶部にアクセス可能な分類装置であって、
前記対話ログ記憶部から、前記対話システムが前記ユーザの第1の発話に基づいて実行した第1の検索に使用された第1の分類を示す情報と、前記第1の検索が失敗したことを示す情報と、前記対話システムが前記第1の発話より後に生じた前記ユーザの第2の発話に基づいて実行した第2の検索の結果として取得されたデータを示す情報と、を含む1つの対話に関する対話ログのセットを抽出する対象ログ抽出部と、
前記第1の分類と前記データとを、前記発話意図に基づいて関連付けた分類関係を生成する分類関係生成部と、
を具備する分類装置。 - 前記対話ログのセットは、前記第2の検索に使用された第2の分類を示す情報をさらに含み、
前記分類関係生成部は、前記第1の分類が前記第2の分類の下位分類であることを示す分類関係をさらに生成する、請求項1に記載の分類装置。 - 前記分類関係生成部によって生成された分類関係を含む分類データを複数のユーザ毎に格納し、さらに、前記複数のユーザに共有される共有分類データを格納する分類データ記憶部と、
対象の分類関係を有するユーザの数、前記複数のユーザを対象にして前記対象の分類関係が検索に利用された頻度を示す分類関係利用頻度、及び前記複数のユーザを対象として前記対象の分類関係を用いた検索の結果が利用された頻度を示す検索結果利用頻度に基づいて、前記対象の分類関係の重要度を計算する重要度計算部と、
前記重要度が閾値以上である場合、前記対象の分類関係を前記共有分類データに追加する更新部と、
をさらに具備する請求項1に記載の分類装置。 - 前記対話ログに含まれる分類間の類似度を計算する類似度計算部をさらに具備し、
前記対象ログ抽出部は、前記類似度に基づいて、話題の変化を検出する、請求項1に記載の分類装置。 - 分類装置によって実行される分類方法であって、
ユーザと対話システムとの対話に関する対話ログであって少なくとも当該ユーザの発話意図を含む対話ログから、前記対話システムが前記ユーザの第1の発話に基づいて実行した第1の検索に使用された第1の分類を示す情報と、前記第1の検索が失敗したことを示す情報と、前記対話システムが前記第1の発話より後に生じた前記ユーザの第2の発話に基づいて実行した第2の検索の結果として取得されたデータを示す情報と、を含む1つの対話に関する対話ログのセットを抽出することと、
前記第1の分類と前記データとを、前記発話意図に基づいて関連付けた第1の分類関係を生成することと、
を具備する分類方法。 - コンピュータを、
ユーザと対話システムとの対話に関する対話ログであって少なくとも当該ユーザの発話意図を含む対話ログから、前記対話システムが前記ユーザの第1の発話に基づいて実行した第1の検索に使用された第1の分類を示す情報と、前記第1の検索が失敗したことを示す情報と、前記対話システムが前記第1の発話より後に生じた前記ユーザの第2の発話に基づいて実行した第2の検索の結果として取得されたデータを示す情報と、を含む1つの対話に関する対話ログのセットを抽出する手段と、
前記第1の分類と前記データとを、前記発話意図に基づいて関連付けた第1の分類関係を生成する手段として機能させるための分類プログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2015/058324 WO2016147401A1 (ja) | 2015-03-19 | 2015-03-19 | 分類装置、方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2016147401A1 JPWO2016147401A1 (ja) | 2017-06-08 |
JP6305629B2 true JP6305629B2 (ja) | 2018-04-04 |
Family
ID=56918573
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017505993A Active JP6305629B2 (ja) | 2015-03-19 | 2015-03-19 | 分類装置、方法及びプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US11163812B2 (ja) |
JP (1) | JP6305629B2 (ja) |
WO (1) | WO2016147401A1 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6791825B2 (ja) * | 2017-09-26 | 2020-11-25 | 株式会社日立製作所 | 情報処理装置、対話処理方法及び対話システム |
JP7009912B2 (ja) * | 2017-10-26 | 2022-01-26 | 富士通株式会社 | 回答出力プログラム、回答出力方法および情報処理装置 |
US20200327890A1 (en) * | 2017-11-28 | 2020-10-15 | Sony Corporation | Information processing device and information processing method |
CN111727473A (zh) * | 2018-02-22 | 2020-09-29 | 索尼公司 | 信息处理装置、信息处理方法和程序 |
CA3119946A1 (en) | 2018-11-16 | 2020-05-22 | Liveperson, Inc. | Automatic bot creation based on scripts |
CN112035613B (zh) * | 2020-08-28 | 2023-09-12 | 光大科技有限公司 | 基于多轮对话的信息推送方法及装置、存储介质、电子装置 |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02238567A (ja) | 1989-03-13 | 1990-09-20 | Agency Of Ind Science & Technol | データの自動分類支援装置 |
FR2799913B1 (fr) * | 1999-10-14 | 2001-11-23 | France Telecom | Procede de mise en communication telephonique par commande vocale et serveur vocal correspondant |
JP2001229200A (ja) | 2000-02-17 | 2001-08-24 | Hitachi Ltd | データ検索結果の表示方式とその為のデータ登録方式 |
JP2002288201A (ja) | 2001-03-23 | 2002-10-04 | Fujitsu Ltd | 質問応答処理方法,質問応答処理プログラム,質問応答処理プログラム記録媒体および質問応答処理装置 |
DE10209928A1 (de) * | 2002-03-07 | 2003-09-18 | Philips Intellectual Property | Verfahren zum Betrieb eines Sprach-Dialogsystems |
JP2004334638A (ja) * | 2003-05-09 | 2004-11-25 | Nippon Telegr & Teleph Corp <Ntt> | 追加検索語取得装置、追加検索語取得方法、これらの追加検索語取得装置または追加検索語取得方法を実現するプログラムおよびそのプログラムが記憶された記録媒体 |
US7657519B2 (en) * | 2004-09-30 | 2010-02-02 | Microsoft Corporation | Forming intent-based clusters and employing same by search |
JP2006277676A (ja) * | 2005-03-30 | 2006-10-12 | Toshiba Corp | 情報検索装置、情報検索方法および情報検索プログラム |
JP4888996B2 (ja) | 2005-10-21 | 2012-02-29 | 株式会社ユニバーサルエンターテインメント | 会話制御装置 |
JP2007220045A (ja) * | 2006-02-20 | 2007-08-30 | Toshiba Corp | コミュニケーション支援装置、コミュニケーション支援方法およびコミュニケーション支援プログラム |
JP5089955B2 (ja) | 2006-10-06 | 2012-12-05 | 三菱電機株式会社 | 音声対話装置 |
TWI321313B (en) * | 2007-03-03 | 2010-03-01 | Ind Tech Res Inst | Apparatus and method to reduce recognization errors through context relations among dialogue turns |
JP5228529B2 (ja) * | 2008-02-26 | 2013-07-03 | 富士通株式会社 | データ検索プログラム、データ検索装置およびデータ検索方法 |
JP2011086032A (ja) * | 2009-10-14 | 2011-04-28 | Hitachi Solutions Ltd | 変化話題抽出装置または変化話題抽出方法 |
JP5345582B2 (ja) * | 2010-03-31 | 2013-11-20 | 株式会社ゼンリンデータコム | シソーラス構築システム、シソーラス構築方法およびシソーラス構築プログラム |
CN102289436B (zh) * | 2010-06-18 | 2013-12-25 | 阿里巴巴集团控股有限公司 | 确定搜索词权重值方法及装置、搜索结果生成方法及装置 |
JP5835197B2 (ja) * | 2012-11-29 | 2015-12-24 | トヨタ自動車株式会社 | 情報処理システム |
-
2015
- 2015-03-19 WO PCT/JP2015/058324 patent/WO2016147401A1/ja active Application Filing
- 2015-03-19 JP JP2017505993A patent/JP6305629B2/ja active Active
-
2017
- 2017-02-15 US US15/433,149 patent/US11163812B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US20170161374A1 (en) | 2017-06-08 |
JPWO2016147401A1 (ja) | 2017-06-08 |
US11163812B2 (en) | 2021-11-02 |
WO2016147401A1 (ja) | 2016-09-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6305629B2 (ja) | 分類装置、方法及びプログラム | |
US11853536B2 (en) | Intelligent automated assistant in a media environment | |
EP3491533B1 (en) | Providing command bundle suggestions for an automated assistant | |
KR102315732B1 (ko) | 음성 인식 방법, 디바이스, 장치, 및 저장 매체 | |
US11756544B2 (en) | Selectively providing enhanced clarification prompts in automated assistant interactions | |
US11222628B2 (en) | Machine learning based product solution recommendation | |
US10255321B2 (en) | Interactive system, server and control method thereof | |
US11475080B2 (en) | Natural language-based search and discovery of content service | |
JP2020077159A (ja) | 対話システム、対話装置、対話方法、及びプログラム | |
KR20210060897A (ko) | 음성 처리 방법 및 장치 | |
US11922931B2 (en) | Systems and methods for phonetic-based natural language understanding | |
JP2019164824A (ja) | リソースに対するアクションへのインデックス付け | |
CN115148212A (zh) | 一种语音交互方法、智能设备及系统 | |
US12038954B2 (en) | Query correction based on reattempts learning | |
KR20060100646A (ko) | 영상물의 특정 위치를 검색하는 방법 및 영상 검색 시스템 | |
US12002460B2 (en) | Information processing device, information processing system, and information processing method, and program | |
US11636363B2 (en) | Cognitive computer diagnostics and problem resolution | |
US11935533B1 (en) | Content-related actions based on context | |
JP6115487B2 (ja) | 情報収集方法、対話システム及び情報収集装置 | |
US20220238108A1 (en) | Information processing device, information processing method, and program | |
US20220236945A1 (en) | Information processing device, information processing method, and program | |
JP6585288B2 (ja) | 知識構築活用システムおよびプログラム | |
JP2011113426A (ja) | 辞書作成装置,辞書作成プログラムおよび辞書作成方法 | |
JPWO2016151692A1 (ja) | タグ付与支援装置、方法およびプログラム | |
US11955120B1 (en) | Systems and methods for integrating voice controls into applications |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20161205 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170606 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170804 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180206 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180306 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6305629 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313114 Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |