JP2009193533A - 情報抽出装置、方法及びプログラム - Google Patents
情報抽出装置、方法及びプログラム Download PDFInfo
- Publication number
- JP2009193533A JP2009193533A JP2008036356A JP2008036356A JP2009193533A JP 2009193533 A JP2009193533 A JP 2009193533A JP 2008036356 A JP2008036356 A JP 2008036356A JP 2008036356 A JP2008036356 A JP 2008036356A JP 2009193533 A JP2009193533 A JP 2009193533A
- Authority
- JP
- Japan
- Prior art keywords
- information
- attribute
- information extraction
- input
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】本発明の情報抽出装置は、複数の分野における複数の用語の関係を体系的に分類した知識データベースと、入力情報を取り込む入力手段と、入力情報に含まれている抽出対象の属性を検出すると、知識データベースにおける属性に係る分野の知識を用いて、入力情報に含まれる属性に対する属性値を抽出する情報抽出手段と、情報抽出手段により抽出された属性及びその属性の属性値を対応付けて格納する抽出情報格納手段とを備えることを特徴とする。
【選択図】 図1
Description
以下、本発明の情報抽出装置、方法及びプログラムの第1の実施形態について図面を参照しながら詳細に説明する。
(A−1−1)ランダリング型検索システムの全体構成の説明
まず、以下では、本発明の情報抽出装置、方法及びプログラムを適用するランダリング型検索システムの全体的なイメージについて図面を参照して説明する。
次に、第1の実施形態に係る情報抽出装置について図面を参照しながら詳細に説明する。また、以下では、サービスサイト2が転職者向けの職業紹介ドメインサイトである場合を例示して説明する。
次に、第1の実施形態の情報抽出処理の動作について図面を参照しながら詳細に説明する。
以上のように、第1の実施形態によれば、情報抽出方法切り替え手段を備えることにより、入力情報の構成に応じた情報抽出方法を適切に切り替えることできる。そのため、多彩に展開される対話であっても、その入力情報の構成に応じた情報抽出方法によって、対話に含まれる情報を適切に抽出することができる。
(B−1)第1の実施形態では、サービスサイトの一例として、転職者向けの職業紹介サイトを例示したが、これに限定されるものではなく、ネットワーク上に存在する情報に広く適用することができる。
Claims (7)
- 複数の分野における複数の用語の関係を体系的に分類した知識データベースと、
入力情報を取り込む入力手段と、
上記入力情報に含まれている抽出対象の属性を検出すると、上記知識データベースにおける上記属性に係る分野の知識を用いて、上記入力情報に含まれる上記属性に対する属性値を抽出する情報抽出手段と、
上記情報抽出手段により抽出された上記属性及びその属性の上記属性値を対応付けて格納する抽出情報格納手段と
を備えることを特徴とする情報抽出装置。 - 上記情報抽出手段が、上記入力情報から上記属性値を抽出する抽出方法を、所定の指定情報に応じて決定する情報抽出方法決定部を有するものであることを特徴とする請求項1に記載の情報抽出装置。
- 上記情報抽出手段は、上記知識データベースにおける上記属性に係る分野知識と、上記入力情報を構成する文字列又は形態解析結果とのマッチングにより、上記属性に対する上記属性値を抽出するものであることを特徴とする請求項2に記載の情報抽出装置。
- 上記情報抽出手段は、上記入力情報の構文解析により、上記入力情報が、上記属性と上記属性値との対応関係がある所定の文構造で構成されるものである場合に、上記所定の文構造を抽出するものであることを特徴とする請求項2又は3に記載の情報抽出装置。
- 上記情報抽出手段は、上記入力情報に含まれるユーザの意図を示す情報を抽出するものであることを特徴とする請求項2〜3のいずれかに記載の情報抽出装置。
- 複数の分野における複数の用語の関係を体系的に分類した知識データベースと、入力手段と、情報抽出手段と、抽出情報格納手段とを備え、
上記入力手段が、入力情報を取り込む入力工程と、
上記情報抽出手段が、上記入力情報に含まれている抽出対象の属性を検出すると、上記知識データベースにおける上記属性に係る分野の知識を用いて、上記入力情報に含まれる上記属性に対する属性値を抽出する情報抽出工程と、
上記抽出情報格納手段が、上記情報抽出手段により抽出された上記属性及びその属性の上記属性値を対応付けて格納する抽出情報格納工程と
を有することを特徴とする情報抽出方法。 - 複数の分野における複数の用語の関係を体系的に分類した知識データベースを備え、
コンピュータを、
入力情報を取り込む入力手段、
上記入力情報に含まれている抽出対象の属性を検出すると、上記知識データベースにおける上記属性に係る分野の知識を用いて、上記入力情報に含まれる上記属性に対する属性値を抽出する情報抽出手段、
上記情報抽出手段により抽出された上記属性及びその属性の上記属性値を対応付けて格納する抽出情報格納手段
として機能させる情報抽出プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008036356A JP2009193533A (ja) | 2008-02-18 | 2008-02-18 | 情報抽出装置、方法及びプログラム |
US12/273,556 US20090210411A1 (en) | 2008-02-15 | 2008-11-19 | Information Retrieving System |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008036356A JP2009193533A (ja) | 2008-02-18 | 2008-02-18 | 情報抽出装置、方法及びプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2009193533A true JP2009193533A (ja) | 2009-08-27 |
Family
ID=41075461
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008036356A Pending JP2009193533A (ja) | 2008-02-15 | 2008-02-18 | 情報抽出装置、方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2009193533A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012037797A (ja) * | 2010-08-10 | 2012-02-23 | Nippon Telegr & Teleph Corp <Ntt> | 対話学習装置、要約装置、対話学習方法、要約方法、プログラム |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006004274A (ja) * | 2004-06-18 | 2006-01-05 | Nippon Telegr & Teleph Corp <Ntt> | 対話処理装置、対話処理方法及び対話処理プログラム |
JP2007079397A (ja) * | 2005-09-16 | 2007-03-29 | Nippon Telegr & Teleph Corp <Ntt> | 対話方法、対話装置、対話プログラムおよび記録媒体 |
-
2008
- 2008-02-18 JP JP2008036356A patent/JP2009193533A/ja active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006004274A (ja) * | 2004-06-18 | 2006-01-05 | Nippon Telegr & Teleph Corp <Ntt> | 対話処理装置、対話処理方法及び対話処理プログラム |
JP2007079397A (ja) * | 2005-09-16 | 2007-03-29 | Nippon Telegr & Teleph Corp <Ntt> | 対話方法、対話装置、対話プログラムおよび記録媒体 |
Non-Patent Citations (2)
Title |
---|
OKIとリクルート、次世代型「ラダリング型検索サービス」の共同開発を開始, JPN6009050070, 26 July 2007 (2007-07-26), JP, ISSN: 0001428297 * |
酒井桂一: "複数の対話エージェントを導入した情報検索の対話モデル", 自然言語処理, vol. 9, no. 3, JPN6010010268, 10 July 2002 (2002-07-10), JP, pages 109 - 128, ISSN: 0001549612 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012037797A (ja) * | 2010-08-10 | 2012-02-23 | Nippon Telegr & Teleph Corp <Ntt> | 対話学習装置、要約装置、対話学習方法、要約方法、プログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101723862B1 (ko) | 텍스트를 포함하는 문서 분류 및 분석 방법 및 이를 수행하는 문서 분류 및 분석 장치 | |
CN102693272B (zh) | 从统一资源定位符(url)的关键字提取 | |
US9064006B2 (en) | Translating natural language utterances to keyword search queries | |
US20090210411A1 (en) | Information Retrieving System | |
JP6014725B2 (ja) | 単文/複文構造の自然言語クエリに対する検索および情報提供方法並びにシステム | |
JP2009193532A (ja) | 対話管理装置、方法及びプログラム、並びに意識抽出システム | |
RU2704531C1 (ru) | Способ и устройство для анализа семантической информации | |
Forstall et al. | Modeling the scholars: Detecting intertextuality through enhanced word-level n-gram matching | |
US10832049B2 (en) | Electronic document classification system optimized for combining a plurality of contemporaneously scanned documents | |
Kavalec et al. | Discovery of lexical entries for non-taxonomic relations in ontology learning | |
Sheu | Semantic computing | |
JP2015511746A5 (ja) | ||
KR20220000046A (ko) | 대화형 지능 서비스 제공 챗봇 제작 시스템 및 방법 | |
JPWO2008023470A1 (ja) | 文単位検索方法、文単位検索装置、コンピュータプログラム、記録媒体及び文書記憶装置 | |
JP2019207648A (ja) | 対話型業務支援システム | |
Lommatzsch et al. | An Information Retrieval-based Approach for Building Intuitive Chatbots for Large Knowledge Bases. | |
JP2011076627A (ja) | 対話管理装置、方法及びプログラム、並びに意識抽出システム | |
KR101478016B1 (ko) | 공기 정보를 이용한 문장 클러스터 기반의 정보 검색 장치 및 방법 | |
Patil et al. | Novel technique for script translation using NLP: performance evaluation | |
Goel | Developments in The Field of Natural Language Processing. | |
Rusu et al. | Document visualization based on semantic graphs | |
Anwar et al. | Social relationship analysis using state-of-the-art embeddings | |
Manias et al. | SemAI: A novel approach for achieving enhanced semantic interoperability in public policies | |
KR20100003087A (ko) | 온톨로지 프로퍼티를 이용한 온톨로지 인스턴스 추출시스템 및 그 방법 | |
JP4401269B2 (ja) | 対訳判断装置及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090929 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091126 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100302 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100423 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20100629 |