JP5399988B2 - 重要日時表現判定方法、重要日時表現判定装置、重要日時表現判定プログラム - Google Patents
重要日時表現判定方法、重要日時表現判定装置、重要日時表現判定プログラム Download PDFInfo
- Publication number
- JP5399988B2 JP5399988B2 JP2010145982A JP2010145982A JP5399988B2 JP 5399988 B2 JP5399988 B2 JP 5399988B2 JP 2010145982 A JP2010145982 A JP 2010145982A JP 2010145982 A JP2010145982 A JP 2010145982A JP 5399988 B2 JP5399988 B2 JP 5399988B2
- Authority
- JP
- Japan
- Prior art keywords
- date
- time expression
- important
- time
- expression
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
まず、図2に基づき前記判定装置1の前処理の動作ステップを説明する。ここでは前記判定装置1は、ロボット型検索エンジンに応用され、Webページの文書、例えば図3の文書に対して前処理を行うものとする。この文書例は、WebページからHTMLタグが除去されているが、HTMLタグを含む文書であってもよい。なお、前記判定装置1は、図示省略の入力部への前記文書例の入力により前処理(S101〜S105)を開始する。
つぎに図4に基づき実際の判定処理の動作ステップを説明する。ここでは前処理と同様に前記判定装置1はロボット型検索エンジンに応用され、クローラ(ロボットスパイダー)のクローリングによりWWW(World Wide Web)から収集されたWebページの文書、例えば図5の文書例に含まれる日時表現が重要か否かを判定するものとする。この文書例は、図3の文書例と同様にWebページからHTMLタグが除去されているが、HTMLタグを含む文書であってもよい。なお、前記入力部への前記文書例の入力により判定処理(S201〜S205)が開始される。
本発明は、前記判定装置1の各部11〜18の一部もしくは全部として、コンピュータを機能させるプログラムとして構成することもできる。この場合には、前処理(S101〜S105)、判定処理(S201〜S205)の全ステップあるいは一部のステップをコンピュータに実行させる。
11…文分割部(文分割手段)
12…単語分割部(単語分割手段)
13…日時表現特定部(日時表現特定手段)
14…日時表現文脈ベクトル取得部(日時表現文脈ベクトル取得手段)
15…重要日時表現判定モデル作成部(重要日時表現判定モデル作成手段)
16…重要日時表現判定部(重要日時表現判定手段)
17…日時表現辞書
18…重要日時表現判定モデルDB
G…日時表現重要度
Claims (9)
- 電子文書に含まれる日時表現に対して、電子文書の内容に関連する重要な日時表現か否かを判定する重要日時表現判定方法であって、
日時表現特定手段が、日時表現に該当する単語列のパターンが記述された日時表現辞書を参照して、入力された電子文書を構成する各文の単語列パターンから日時表現を特定する日時表現特定ステップと、
日時表現文脈ベクトル取得手段が、前記特定ステップで特定された日時表現の表記パターン、該日時表現の前後に出現する単語、該日時表現の文書中での出現位置に基づき、事前に定めた特徴パターンにマッチするか否かを要素値とする日時表現文脈ベクトルを求める日時表現文脈ベクトル取得ステップと、
重要日時表現判定手段が、前記ベクトル取得ステップで算出された日時表現文脈ベクトルを、事前の学習で作成した日時表現の重要・不要を判定するための重要日時表現判定モデルに応じて分類し、前記特定手段により特定された日時表現が重要か否かを判定する重要日時表現判定ステップと、
を有することを特徴とする重要日時判定方法。 - 前記学習時に前記特定ステップおよび前記ベクトル取得ステップを通じて日時表現文脈ベクトルを求め、
重要日時表現判定モデル作成手段が、該日時表現文脈ベクトルと日時表現の重要性を数値化した日時表現重要度とを用いて、2値分類可能な機械学習により前記判定モデルを作成する重要日時表現判定モデル作成ステップをさらに有する
ことを特徴とする請求項1記載の重要日時判定方法。 - 文分割手段が、入力された電子文書を文毎に分割する文分割ステップと、
単語分割手段が、文分割ステップで分割された各文を単語毎に分割する単語分割ステップと、をさらに有し、
前記特定ステップは、前記単語分割ステップで分割された単語の単語列パターンから日時表現を特定する
ことを特徴とする請求項1または2のいずれか1項に記載の重要日時判定方法。 - 文書タイプ判別手段が、事前に用意された文書タイプに応じて、入力された電子文書の文書タイプを判別する文書タイプ判別ステップをさらに有し、
前記ベクトル取得ステップにおいて、前記判別ステップの判別結果を前記日時表現文脈ベクトルに反映させる
ことを特徴とする請求項1〜3のいずれか1項に記載の重要日時判定方法。 - 電子文書に含まれる日時表現に対して、電子文書の内容に関連する重要な日時表現か否かを判定する重要日時表現判定装置であって、
電子文書に含まれる日時表現を特定し、該日時表現が電子文書の内容に関わる重要な日時表現か否かを判定する重要日時表現判定装置であって、
日時表現に該当する単語列のパターンが記述された日時表現辞書を参照して、入力された電子文書を構成する各文の単語列パターンから日時表現を特定する日時表現特定手段と、
該特定手段により特定された日時表現の表記パターン、該日時表現の前後に出現する単語、該日時表現の文書中での出現位置に基づき、事前に定めた特徴パターンにマッチするか否かを要素値とする日時表現文脈ベクトル取得手段と、
該ベクトル取得手段で求めた日時表現文脈ベクトルを、事前学習で作成した日時表現の重要・不要を判定するための重要日時表現判定モデルに応じて分類し、前記特定手段により特定された日時表現が重要か否かを判定する重要日時表現判定手段と、
を備えることを特徴とする重要日時判定装置。 - 前記学習時に前記特定手段および前記ベクトル取得手段で求めた日時表現文脈ベクトルと、日時表現の重要性を数値化した日時表現重要度とを用いて、
2値分類可能な機械学習により前記判定モデルを作成する重要日時表現判定モデル作成手段をさらに備える
ことを特徴とする請求項5記載の重要日時判定装置。 - 入力された電子文書を文毎に分割する文分割手段と、該文分割手段により分割された各文を単語毎に分割する単語分割手段とをさらに備え、
前記特定手段が、前記単語分割手段により分割された単語の単語列パターンから日時表現を特定する
ことを特徴とする請求項5または6のいずれか1項に記載の重要日時判定装置。 - 事前に用意された文書タイプに応じて、入力された電子文書の文書タイプを判別する文書タイプ判別手段をさらに備え、
前記ベクトル取得手段が、前記判別手段の判別結果を前記日時表現文脈ベクトルに反映させる
ことを特徴とする請求項3記載の重要日時判定装置。 - 請求項5〜請求項8のいずれか1項に記載の重要日時判定装置としてコンピュータを機能させるための重要日時判定プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010145982A JP5399988B2 (ja) | 2010-06-28 | 2010-06-28 | 重要日時表現判定方法、重要日時表現判定装置、重要日時表現判定プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010145982A JP5399988B2 (ja) | 2010-06-28 | 2010-06-28 | 重要日時表現判定方法、重要日時表現判定装置、重要日時表現判定プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012008908A JP2012008908A (ja) | 2012-01-12 |
JP5399988B2 true JP5399988B2 (ja) | 2014-01-29 |
Family
ID=45539348
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010145982A Active JP5399988B2 (ja) | 2010-06-28 | 2010-06-28 | 重要日時表現判定方法、重要日時表現判定装置、重要日時表現判定プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5399988B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103578285B (zh) * | 2012-08-07 | 2017-03-08 | 上海博泰悦臻电子设备制造有限公司 | 车载设备和车载设备的语音提示方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09269940A (ja) * | 1996-03-29 | 1997-10-14 | Sharp Corp | 日時等を抽出する装置 |
JP2000163418A (ja) * | 1997-12-26 | 2000-06-16 | Canon Inc | 自然言語処理装置及びその方法、及びそのプログラムを格納した記憶媒体 |
JP3379443B2 (ja) * | 1998-08-21 | 2003-02-24 | 日本電気株式会社 | 情報通知装置及び情報通知方法並びにプログラムを記録した機械読み取り可能な記録媒体 |
US20090187467A1 (en) * | 2008-01-23 | 2009-07-23 | Palo Alto Research Center Incorporated | Linguistic extraction of temporal and location information for a recommender system |
JP2009237640A (ja) * | 2008-03-26 | 2009-10-15 | National Institute Of Information & Communication Technology | 情報抽出装置、情報抽出方法および情報抽出プログラム |
-
2010
- 2010-06-28 JP JP2010145982A patent/JP5399988B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2012008908A (ja) | 2012-01-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11030199B2 (en) | Systems and methods for contextual retrieval and contextual display of records | |
US10146862B2 (en) | Context-based metadata generation and automatic annotation of electronic media in a computer network | |
CN108280114B (zh) | 一种基于深度学习的用户文献阅读兴趣分析方法 | |
US11762926B2 (en) | Recommending web API's and associated endpoints | |
US8473473B2 (en) | Object oriented data and metadata based search | |
JP5492187B2 (ja) | 編集距離および文書情報を使用する検索結果順位付け | |
US20190129942A1 (en) | Methods and systems for automatically generating reports from search results | |
CN111125086B (zh) | 获取数据资源的方法、装置、存储介质及处理器 | |
US20150154306A1 (en) | Method for searching related entities through entity co-occurrence | |
KR20160124079A (ko) | 인-메모리 데이터베이스 탐색을 위한 시스템 및 방법 | |
US20120016863A1 (en) | Enriching metadata of categorized documents for search | |
CN117667841A (zh) | 一种企业数据管理平台及方法 | |
CN112035723A (zh) | 资源库的确定方法和装置、存储介质及电子装置 | |
JP7293780B2 (ja) | 情報処理装置、文書管理システム及びプログラム | |
JP5757551B2 (ja) | 意味分類付与装置、意味分類付与方法、意味分類付与プログラム | |
JP5399988B2 (ja) | 重要日時表現判定方法、重要日時表現判定装置、重要日時表現判定プログラム | |
JP5416552B2 (ja) | ランキング関数生成装置、ランキング関数生成方法、ランキング関数生成プログラム | |
CN114218347A (zh) | 多个文件内容的快速索引查找方法 | |
US20090319505A1 (en) | Techniques for extracting authorship dates of documents | |
JP5393392B2 (ja) | 時間表現抽出装置、時間表現抽出方法および時間表現抽出プログラム | |
Hast et al. | Making large collections of handwritten material easily accessible and searchable | |
WO2019142094A1 (en) | System and method for semantic text search | |
Hast et al. | TexT-Text Extractor Tool for Handwritten Document Transcription and Annotation | |
Kushnarenko et al. | Web Technologies and Effective Representation Tools of the Archival Resources of Ukraine. | |
Thottempudi | A visual narrative of ramayana using extractive summarization topic modeling and named entity recognition |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130121 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130129 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130329 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20131022 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20131024 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5399988 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |