JP2014228993A - 情報抽出方法、情報抽出装置及び情報抽出プログラム - Google Patents
情報抽出方法、情報抽出装置及び情報抽出プログラム Download PDFInfo
- Publication number
- JP2014228993A JP2014228993A JP2013106917A JP2013106917A JP2014228993A JP 2014228993 A JP2014228993 A JP 2014228993A JP 2013106917 A JP2013106917 A JP 2013106917A JP 2013106917 A JP2013106917 A JP 2013106917A JP 2014228993 A JP2014228993 A JP 2014228993A
- Authority
- JP
- Japan
- Prior art keywords
- candidate
- extraction
- combination
- category
- storage means
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
Description
・第20回横須賀
・第20回横須賀祭り
・横須賀
・横須賀祭り
・祭り
第20回横須賀祭り − 神奈川県横須賀市 − 2012年12月20日
・・・
お祭り − 東京都 − 2013年1月1日
15…イベント名候補抽出機能
20…抽出候補DB
30…正解DB
40…コストDB
50…イベント抽出モデル学習機能
60…イベント抽出モデルDB
70…予測対象文書DB
80…予測対象抽出候補DB
90…イベント抽出機能
100…イベントDB
Claims (5)
- 関連性のあるカテゴリそれぞれの候補を文書情報から抽出して格納した抽出候補記憶手段と、
文書情報から抽出した前記候補のうち、当該候補が同じカテゴリの別の候補の部分文字列となっている場合に、前記別の候補の文字数に対する当該候補の文字数の割合が予め設定した除去比率に満たないときは当該候補を除去する候補除去手段と、
カテゴリそれぞれの正解を格納した正解記憶手段と、
関連性のあるカテゴリの情報を抽出するための抽出モデルを格納する抽出モデル記憶手段と、
前記抽出候補記憶手段に格納されたカテゴリそれぞれの候補の全ての可能な組み合わせ対して、当該組み合わせの特徴を表す特徴ベクトルを計算する特徴ベクトル計算手段と、
前記抽出モデル記憶手段に格納された抽出モデルと前記特徴ベクトルを用いて算出されるスコアが最大となる組み合わせを取得する組み合わせ取得手段と、
前記正解記憶手段から前記正解の組み合わせを読み出してスコアを計算し、前記正解の組み合わせのスコアに対する前記組み合わせ取得手段が取得した組み合わせのスコアの損失が所定の範囲内の場合は、前記抽出モデル記憶手段に格納された抽出モデルを更新する抽出モデル更新手段と、を有し、
カテゴリそれぞれの候補を予測対象文書情報から抽出して格納した予測対象抽出候補記憶手段と、
前記予測対象抽出候補記憶手段に格納された前記カテゴリそれぞれの候補の全ての可能な組み合わせ対して、当該組み合わせの特徴を表す特徴ベクトルを計算し、前記抽出モデル記憶手段に格納された抽出モデルと前記特徴ベクトルを用いて算出されるスコアが最大となる組み合わせを取得する情報抽出手段と、を有すること
を特徴とする情報抽出装置。 - 前記候補が前記正解の部分文字列である場合と部分文字列でない場合の誤りコストを格納したコスト記憶手段を更に備え、
前記抽出モデル更新手段は、前記コスト記憶手段から前記誤りコストを読み出して前記正解に対する前記候補の一致の割合に応じたコストを求め、求めたコストを前記所定の範囲とすることを特徴とする請求項1記載の情報抽出装置。 - 関連性のあるカテゴリそれぞれの候補を文書情報から抽出して格納した抽出候補記憶手段に格納された前記候補のうち、当該候補が同じカテゴリの別の候補の部分文字列となっている場合に、前記別の候補の文字数に対する当該候補の文字数の割合が予め設定した除去比率に満たないときは当該候補を除去するステップと、
前記抽出候補記憶手段に格納されたカテゴリそれぞれの候補の全ての可能な組み合わせ対して、当該組み合わせの特徴を表す特徴ベクトルを計算するステップと、
抽出モデル記憶手段に格納された抽出モデルと前記特徴ベクトルを用いて算出されるスコアが最大となる組み合わせを取得するステップと、
前記カテゴリそれぞれの正解を格納した正解記憶手段から前記正解の組み合わせを読み出してスコアを計算し、前記正解の組み合わせのスコアに対する前記組み合わせ取得手段が取得した組み合わせのスコアの損失が所定の範囲内の場合は、前記抽出モデル記憶手段に格納された抽出モデルを更新するステップと、を有し、
カテゴリそれぞれの候補を予測対象文書情報から抽出して格納した予測対象抽出候補記憶手段に格納された前記カテゴリそれぞれの候補の全ての可能な組み合わせ対して、当該組み合わせの特徴を表す特徴ベクトルを計算し、前記抽出モデル記憶手段に格納された抽出モデルと前記特徴ベクトルを用いて算出されるスコアが最大となる組み合わせを取得するステップを有すること
を特徴とする情報抽出方法。 - 前記抽出モデルを更新するステップは、前記候補が前記正解の部分文字列である場合と部分文字列でない場合の誤りコストを格納したコスト記憶手段から前記誤りコストを読み出して前記正解に対する前記候補の一致の割合に応じたコストを求め、求めたコストを前記所定の範囲とすることを特徴とする請求項3記載の情報抽出方法。
- 請求項1又は2に記載の情報抽出装置の各手段としてコンピュータを動作させることを特徴とする情報抽出プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013106917A JP6059598B2 (ja) | 2013-05-21 | 2013-05-21 | 情報抽出方法、情報抽出装置及び情報抽出プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013106917A JP6059598B2 (ja) | 2013-05-21 | 2013-05-21 | 情報抽出方法、情報抽出装置及び情報抽出プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014228993A true JP2014228993A (ja) | 2014-12-08 |
JP6059598B2 JP6059598B2 (ja) | 2017-01-11 |
Family
ID=52128805
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013106917A Active JP6059598B2 (ja) | 2013-05-21 | 2013-05-21 | 情報抽出方法、情報抽出装置及び情報抽出プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6059598B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20210036318A (ko) * | 2020-03-20 | 2021-04-02 | 베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디. | 이벤트 아규먼트 추출 방법, 장치 및 전자 기기 |
CN112967144A (zh) * | 2021-03-09 | 2021-06-15 | 华泰证券股份有限公司 | 一种金融信用风险事件抽取方法、可读存储介质及设备 |
JP2021099884A (ja) * | 2020-03-20 | 2021-07-01 | 北京百度網訊科技有限公司 | イベント引数抽出方法、イベント引数抽出装置、電子デバイス、記憶媒体及びコンピュータプログラム製品 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007172315A (ja) * | 2005-12-22 | 2007-07-05 | Nec Corp | 同義語辞書生成システム、同義語辞書生成方法および同義語辞書生成プログラム |
JP2007219880A (ja) * | 2006-02-17 | 2007-08-30 | Fujitsu Ltd | 評判情報処理プログラム、方法及び装置 |
JP2011059947A (ja) * | 2009-09-09 | 2011-03-24 | Nippon Telegr & Teleph Corp <Ntt> | ランキング関数生成装置、ランキング関数生成方法、ランキング関数生成プログラム |
JP2013097723A (ja) * | 2011-11-04 | 2013-05-20 | Nippon Telegr & Teleph Corp <Ntt> | テキスト要約装置、方法及びプログラム |
-
2013
- 2013-05-21 JP JP2013106917A patent/JP6059598B2/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007172315A (ja) * | 2005-12-22 | 2007-07-05 | Nec Corp | 同義語辞書生成システム、同義語辞書生成方法および同義語辞書生成プログラム |
JP2007219880A (ja) * | 2006-02-17 | 2007-08-30 | Fujitsu Ltd | 評判情報処理プログラム、方法及び装置 |
JP2011059947A (ja) * | 2009-09-09 | 2011-03-24 | Nippon Telegr & Teleph Corp <Ntt> | ランキング関数生成装置、ランキング関数生成方法、ランキング関数生成プログラム |
JP2013097723A (ja) * | 2011-11-04 | 2013-05-20 | Nippon Telegr & Teleph Corp <Ntt> | テキスト要約装置、方法及びプログラム |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20210036318A (ko) * | 2020-03-20 | 2021-04-02 | 베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디. | 이벤트 아규먼트 추출 방법, 장치 및 전자 기기 |
JP2021099886A (ja) * | 2020-03-20 | 2021-07-01 | 北京百度網訊科技有限公司 | イベント引数抽出方法、装置及び電子デバイス |
JP2021099884A (ja) * | 2020-03-20 | 2021-07-01 | 北京百度網訊科技有限公司 | イベント引数抽出方法、イベント引数抽出装置、電子デバイス、記憶媒体及びコンピュータプログラム製品 |
JP7292321B2 (ja) | 2020-03-20 | 2023-06-16 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド | イベント引数抽出方法、イベント引数抽出装置、電子デバイス、記憶媒体及びコンピュータプログラム製品 |
US11880397B2 (en) | 2020-03-20 | 2024-01-23 | Beijing Baidu Netcom Science Technology Co., Ltd. | Event argument extraction method, event argument extraction apparatus and electronic device |
KR102653312B1 (ko) * | 2020-03-20 | 2024-03-29 | 베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디. | 이벤트 아규먼트 추출 방법, 장치 및 전자 기기 |
CN112967144A (zh) * | 2021-03-09 | 2021-06-15 | 华泰证券股份有限公司 | 一种金融信用风险事件抽取方法、可读存储介质及设备 |
CN112967144B (zh) * | 2021-03-09 | 2024-01-23 | 华泰证券股份有限公司 | 一种金融信用风险事件抽取方法、可读存储介质及设备 |
Also Published As
Publication number | Publication date |
---|---|
JP6059598B2 (ja) | 2017-01-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
De Cao et al. | Question answering by reasoning across documents with graph convolutional networks | |
Mani et al. | Deeptriage: Exploring the effectiveness of deep learning for bug triaging | |
Clark et al. | Simple and effective multi-paragraph reading comprehension | |
CN110019471B (zh) | 从结构化数据生成文本 | |
CN112711948B (zh) | 一种中文句子的命名实体识别方法及装置 | |
CN109978060B (zh) | 一种自然语言要素抽取模型的训练方法及装置 | |
CN107391614A (zh) | 一种基于wmd的中文问答匹配方法 | |
JP7211045B2 (ja) | 要約文生成方法、要約文生成プログラム及び要約文生成装置 | |
US11755657B2 (en) | Training a question-answer dialog system to avoid adversarial attacks | |
KR20180077847A (ko) | 문장 검증 장치 및 방법 | |
Yang et al. | xMoCo: Cross momentum contrastive learning for open-domain question answering | |
JP6059598B2 (ja) | 情報抽出方法、情報抽出装置及び情報抽出プログラム | |
CN109271624A (zh) | 一种目标词确定方法、装置及存储介质 | |
CN113343692B (zh) | 搜索意图的识别方法、模型训练方法、装置、介质及设备 | |
Onal et al. | Named entity recognition from scratch on social media | |
JP2011227749A (ja) | 略語完全語復元装置とその方法と、プログラム | |
JP5863193B2 (ja) | 情報抽出装置、情報抽出方法及び情報抽出プログラム | |
CN111241843B (zh) | 基于复合神经网络的语义关系推断系统和方法 | |
Wan et al. | Multi-grained knowledge retrieval for end-to-end task-oriented dialog | |
JP6839001B2 (ja) | モデル学習装置、情報判定装置およびそれらのプログラム | |
JP6018545B2 (ja) | イベント情報抽出装置、その動作方法およびコンピュータプログラム | |
US20220383159A1 (en) | Systems and methods for open domain multi-hop question answering | |
JP7135730B2 (ja) | 要約生成方法及び要約生成プログラム | |
Brito et al. | Towards German word embeddings: A use case with predictive sentiment analysis | |
JP5182960B2 (ja) | 店舗名曖昧性解消装置、その方法、プログラム及び記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150928 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160719 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160720 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160913 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20161004 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20161109 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20161206 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20161209 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6059598 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |