JP6115487B2 - 情報収集方法、対話システム及び情報収集装置 - Google Patents
情報収集方法、対話システム及び情報収集装置 Download PDFInfo
- Publication number
- JP6115487B2 JP6115487B2 JP2014014265A JP2014014265A JP6115487B2 JP 6115487 B2 JP6115487 B2 JP 6115487B2 JP 2014014265 A JP2014014265 A JP 2014014265A JP 2014014265 A JP2014014265 A JP 2014014265A JP 6115487 B2 JP6115487 B2 JP 6115487B2
- Authority
- JP
- Japan
- Prior art keywords
- sentence
- information
- word
- sentence group
- specific topic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Description
ネットワーク上から特定の話題に関する情報を収集する情報収集装置を用いた情報収集方法であって、
前記情報収集装置は、
前記特定の話題とは異なる他の話題に関する情報を示す複数の文章である第2の文章群を予め格納したデータベースを備え、
前記情報収集装置が、
前記特定の話題に関する情報の一部を示す入力文章を受け付け、
前記入力文章内の単語を含む複数の文章である第1の文章群を、前記ネットワーク上から収集し、
前記データベースに格納された第2の文章群内に前記第1の文章群に含まれる各単語が出現する頻度に基づいて、当該第1の文章群に含まれる各単語のうち一部を、前記特定の話題における重要語として選択し、
前記重要語を含む複数の文章である第3の文章群を、前記特定の話題に関する情報として前記ネットワーク上から収集する。
ネットワーク上から特定の話題に関する情報を収集する情報収集装置であって、
前記特定の話題とは異なる他の話題に関する情報を示す複数の文章である第2の文章群を予め格納したデータベースと、
前記特定の話題に関する情報の一部を示す入力文章を受け付ける受付部と、
前記入力文章内の単語を含む複数の文章である第1の文章群を、前記ネットワーク上から収集する第1の収集部と、
前記データベースに格納された第2の文章群内に前記第1の文章群に含まれる各単語が出現する頻度に基づいて、当該第1の文章群に含まれる各単語の一部を、前記特定の話題における重要語として選択する選択部と、
前記重要語を含む複数の文章である第3の文章群を、前記特定の話題に関する情報として前記ネットワーク上から収集する第2の収集部と、
を備える。
本発明の実施の形態1は、特定の話題に関する情報を集約した良質なデータベース(DB)を構築するために、ネットワーク上から質の高い情報を効率的に収集するための情報収集方法等に関するものである。ここで、本発明の実施の形態における「話題」とは、テーマ、トピック、ジャンル、分野等を含む概念とする。また、「特定の話題に関する情報」とは、ある話題領域における知識等であり、例えば、「地球と月」という話題について月が地球の衛星である点、月が地球の周りを公転している点、地球と月との距離等の複数の情報を意味する。
補完する情報としては、例えば、特定の話題についてシード文200に不足している内容や、内容は同等だが観点や言い回しを変えた文章、表現のバリエーションが異なる文章、さらに、特定の話題に関連する情報や展開した文章等が挙げられる。
110 受付部
120 第1の収集部
130 選択部
140 第2の収集部
150 記憶部
151 一般文
152 関連文
153 重要語
154 重要度
155 応答文
161 関連文DB
162 一般文DB
163 重要語DB
164 応答文DB
200 シード文
300 Web
400 対話ロボット
410 音声認識部
420 対話エンジン
430 音声合成部
500 ユーザ
Claims (6)
- ネットワーク上から特定の話題に関する情報を収集する情報収集装置を用いた情報収集方法であって、
前記情報収集装置は、
前記特定の話題とは異なる他の話題に関する情報を示す複数の文章である第2の文章群を予め格納したデータベースを備え、
前記情報収集装置が、
前記特定の話題に関する情報の一部を示す入力文章を受け付け、
前記入力文章内の単語を含む複数の文章である第1の文章群を、前記ネットワーク上から収集し、
前記データベースに格納された第2の文章群内に前記第1の文章群に含まれる各単語が出現する頻度に基づいて、当該第1の文章群に含まれる各単語のうち一部を、前記特定の話題における重要語として選択し、
前記重要語を含む複数の文章である第3の文章群を、前記特定の話題に関する情報として前記ネットワーク上から収集する
情報収集方法。 - 前記重要語は、
前記第1の文章群に含まれる各単語のうち、当該第1の文章群内の単語の出現頻度が高く、かつ、前記第2の文章群内で出現する文章数が少ない単語である
請求項1に記載の情報収集方法。 - 前記第2の文章群内に前記第1の文章群に含まれる各単語が出現する頻度に基づいて、前記特定の話題における重要度を算出し、
前記重要度が所定の閾値以上である単語を、前記重要語として選択する
請求項1又は2に記載の情報収集方法。 - 前記収集された第3の文章群を前記データベースに格納し、
外部から入力される前記特定の話題に関する問合せ文章に基づいて、前記データベースに格納された前記第3の文章群を用いて当該問合せに対応する応答文章を生成して、出力する
請求項1乃至3のいずれか1項に記載の情報収集方法を用いた対話システム。 - 前記問合せ文章は音声により入力され、
前記応答文章は音声により出力する
請求項4に記載の対話システム。 - ネットワーク上から特定の話題に関する情報を収集する情報収集装置であって、
前記特定の話題とは異なる他の話題に関する情報を示す複数の文章である第2の文章群を予め格納したデータベースと、
前記特定の話題に関する情報の一部を示す入力文章を受け付ける受付部と、
前記入力文章内の単語を含む複数の文章である第1の文章群を、前記ネットワーク上から収集する第1の収集部と、
前記データベースに格納された第2の文章群内に前記第1の文章群に含まれる各単語が出現する頻度に基づいて、当該第1の文章群に含まれる各単語の一部を、前記特定の話題における重要語として選択する選択部と、
前記重要語を含む複数の文章である第3の文章群を、前記特定の話題に関する情報として前記ネットワーク上から収集する第2の収集部と、
を備える情報収集装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014014265A JP6115487B2 (ja) | 2014-01-29 | 2014-01-29 | 情報収集方法、対話システム及び情報収集装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014014265A JP6115487B2 (ja) | 2014-01-29 | 2014-01-29 | 情報収集方法、対話システム及び情報収集装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015141323A JP2015141323A (ja) | 2015-08-03 |
JP6115487B2 true JP6115487B2 (ja) | 2017-04-19 |
Family
ID=53771708
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014014265A Active JP6115487B2 (ja) | 2014-01-29 | 2014-01-29 | 情報収集方法、対話システム及び情報収集装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6115487B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6294279B2 (ja) * | 2015-10-09 | 2018-03-14 | Necパーソナルコンピュータ株式会社 | コンテンツ推薦装置、コンテンツ推薦システム、コンテンツ推薦方法、及び、プログラム |
JP6993575B2 (ja) * | 2018-02-23 | 2022-01-13 | 富士通株式会社 | 情報処理プログラム、情報処理装置及び情報処理方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4466334B2 (ja) * | 2004-11-08 | 2010-05-26 | 日本電信電話株式会社 | 情報分類方法及び装置及びプログラム及びプログラムを格納した記憶媒体 |
JP5046170B2 (ja) * | 2010-05-13 | 2012-10-10 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 検索システム、検索方法、報告システム、報告方法、及びプログラム |
JP5073024B2 (ja) * | 2010-08-10 | 2012-11-14 | 株式会社東芝 | 音声対話装置 |
JP2013069246A (ja) * | 2011-09-26 | 2013-04-18 | Kddi Corp | 話題語抽出装置、話題語抽出方法、およびプログラム |
-
2014
- 2014-01-29 JP JP2014014265A patent/JP6115487B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2015141323A (ja) | 2015-08-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9646606B2 (en) | Speech recognition using domain knowledge | |
JP3923513B2 (ja) | 音声認識装置および音声認識方法 | |
KR101255405B1 (ko) | 텍스트 메타데이터를 갖는 음성문서의 인덱싱 및 검색방법, 컴퓨터 판독가능 매체 | |
EP2727103B1 (en) | Speech recognition using variable-length context | |
Alberti et al. | An audio indexing system for election video material | |
US8731930B2 (en) | Contextual voice query dilation to improve spoken web searching | |
KR20080069990A (ko) | 음성 세그먼트 색인 및 검색 방법과 컴퓨터 실행 가능명령어를 갖는 컴퓨터 판독 가능 매체 | |
US9922650B1 (en) | Intent-specific automatic speech recognition result generation | |
US11693900B2 (en) | Method and system for providing resegmented audio content | |
WO2017161749A1 (zh) | 一种信息匹配方法及装置 | |
US20150371627A1 (en) | Voice dialog system using humorous speech and method thereof | |
Eskevich et al. | SAVA at MediaEval 2015: Search and anchoring in video archives | |
CN108345679B (zh) | 一种音视频检索方法、装置、设备及可读存储介质 | |
JP6363478B2 (ja) | 音声認識装置、音声認識方法及び音声認識プログラム | |
JP6115487B2 (ja) | 情報収集方法、対話システム及び情報収集装置 | |
JP6322125B2 (ja) | 音声認識装置、音声認識方法および音声認識プログラム | |
JP6126965B2 (ja) | 発話生成装置、方法、及びプログラム | |
JP2011248107A (ja) | 音声認識結果検索方法とその装置とプログラム | |
Sen et al. | Audio indexing | |
Tetariy et al. | An efficient lattice-based phonetic search method for accelerating keyword spotting in large speech databases | |
WO2018190128A1 (ja) | 情報処理装置および情報処理方法 | |
JP2006209173A (ja) | 係り受け構造解析装置及びコンピュータプログラム | |
JP5860439B2 (ja) | 言語モデル作成装置とその方法、そのプログラムと記録媒体 | |
JP2009271785A (ja) | 情報提供方法及び装置及びコンピュータ読み取り可能な記録媒体 | |
Pan et al. | Type-II dialogue systems for information access from unstructured knowledge sources |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160211 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170210 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170221 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170306 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6115487 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |