JP5727415B2 - 文書検索用関連語発見装置及び方法及びプログラム - Google Patents
文書検索用関連語発見装置及び方法及びプログラム Download PDFInfo
- Publication number
- JP5727415B2 JP5727415B2 JP2012113851A JP2012113851A JP5727415B2 JP 5727415 B2 JP5727415 B2 JP 5727415B2 JP 2012113851 A JP2012113851 A JP 2012113851A JP 2012113851 A JP2012113851 A JP 2012113851A JP 5727415 B2 JP5727415 B2 JP 5727415B2
- Authority
- JP
- Japan
- Prior art keywords
- word
- occurrence
- search
- previous
- post
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
過去の文書検索において入力順序を有する複数の語で文書検索が行われた際の、入力順序の前後関係を持つ2語の組の共起頻度について記憶する検索共起語記憶手段と、
指定語を一つ入力として受け取り、前記検索共起語記憶手段から、該指定語よりも入力順序が後の共起語である後共起語の集合を取得する後共起語集合取得手段と、
指定語を一つ入力として受け取り、前記検索共起語記憶手段から、該指定語よりも入力順序が前の共起語である前共起語の集合を取得する前共起語集合取得手段と、
指定語を二つ入力として受け取り、前記検索共起語記憶手段から、第一の指定語が、第二の指定語よりも前に出現して共起した頻度を取得する共起頻度取得手段と、
前記後共起語集合取得手段で取得された前記検索語qの後共起語集合に含まれる各後共起語aについて、前記前共起語集合取得手段で取得された該後共起語aの前共起語集合を取得し、該前共起語集合に含まれる各前共起語bについて、前記共起頻度取得手段で取得した該前共起語bと該後共起語aの組の共起頻度を取得し、取得した全ての共起頻度集合を用いて、前記検索語qに関する該後共起語aの検索精度p(q|a)を推定する検索精度推定手段と、
前記検索精度推定手段の出力に基づいて、前記検索語qの後共起語集合に含まれる語の中から、前記検索語qに関連する関連語を決定する関連語決定手段と、を有する。
前記後共起語集合取得手段で得られた前記検索語qの後共起語集合に含まれる各後共起語aについて、前記前共起語集合取得手段で得られた該後共起語aの前共起語集合を取得し、該前共起語集合に含まれる各前共起語bについて、前記検索語qに関する該前共起語bの前記検索精度p(q|b)と、該前共起語bに関する該後共起語aの前記検索精度p(b|a)を推定し、推定した全ての検索精度を用いて、前記検索語qに関する該後共起語aの検索精度p(q|a)を推定する手段を含む。
20 前共起語集合取得部
30 共起頻度取得部
40 検索精度推定部
50 関連語決定部
60 検索共起語記憶部
Claims (5)
- 文書検索の検索語qに関連する語を発見する文書検索用関連語発見装置であって、
過去の文書検索において入力順序を有する複数の語で文書検索が行われた際の、入力順序の前後関係を持つ2語の組の共起頻度について記憶する検索共起語記憶手段と、
指定語を一つ入力として受け取り、前記検索共起語記憶手段から、該指定語よりも入力順序が後の共起語である後共起語の集合を取得する後共起語集合取得手段と、
指定語を一つ入力として受け取り、前記検索共起語記憶手段から、該指定語よりも入力順序が前の共起語である前共起語の集合を取得する前共起語集合取得手段と、
指定語を二つ入力として受け取り、前記検索共起語記憶手段から、第一の指定語が、第二の指定語よりも前に出現して共起した頻度を取得する共起頻度取得手段と、
前記後共起語集合取得手段で取得された前記検索語qの後共起語集合に含まれる各後共起語aについて、前記前共起語集合取得手段で取得された該後共起語aの前共起語集合を取得し、該前共起語集合に含まれる各前共起語bについて、前記共起頻度取得手段で取得した該前共起語bと該後共起語aの組の共起頻度を取得し、取得した全ての共起頻度集合を用いて、前記検索語qに関する該後共起語aの検索精度p(q|a)を推定する検索精度推定手段と、
前記検索精度推定手段の出力に基づいて、前記検索語qの後共起語集合に含まれる語の中から、前記検索語qに関連する関連語を決定する関連語決定手段と、
を有することを特徴とする文書検索用関連語発見装置。 - 前記検索精度推定手段は、
前記後共起語集合取得手段で得られた前記検索語qの後共起語集合に含まれる各後共起語aについて、前記前共起語集合取得手段で得られた該後共起語aの前共起語集合を取得し、該前共起語集合に含まれる各前共起語bについて、前記検索語qに関する該前共起語bの前記検索精度p(q|b)と、該前共起語bに関する該後共起語aの前記検索精度p(b|a)を推定し、推定した全ての検索精度を用いて、前記検索語qに関する該後共起語aの検索精度p(q|a)を推定する手段を含む、
ことを特徴とする請求項1記載の文書検索用関連語発見装置。 - 文書検索の検索語qに関連する語を発見する文書検索用関連語発見方法であって、
過去の文書検索において入力順序を有する複数の語で文書検索が行われた際の、入力順序の前後関係を持つ2語の組の共起頻度について記憶する検索共起語記憶手段を有する装置において、
後共起語集合取得手段が、指定語を一つ入力として受け取り、前記検索共起語記憶手段から、該指定語よりも入力順序が後の共起語である後共起語の集合を取得する後共起語集合取得ステップと、
前共起語集合取得手段が、指定語を一つ入力として受け取り、前記検索共起語記憶手段から、該指定語よりも入力順序が前の共起語である前共起語の集合を取得する前共起語集合取得ステップと、
共起頻度取得手段が、指定語を二つ入力として受け取り、前記検索共起語記憶手段から、第一の指定語が、第二の指定語よりも前に出現して共起した頻度を取得する共起頻度取得ステップと、
検索精度推定手段が、前記後共起語集合取得ステップで得られた前記検索語qの後共起語集合に含まれる各後共起語aについて、前記前共起語集合取得ステップで得られた該後共起語aの前共起語集合を取得し、該前共起語集合に含まれる各前共起語bについて、前記共起頻度取得ステップで得られた該前共起語bと該後共起語aの組の共起頻度を取得し、取得した全ての共起頻度集合を用いて、前記検索語qに関する該後共起語aの検索精度p(q|a)を推定する検索精度推定ステップと、
関連語決定手段が、前記検索精度推定ステップで得られた前記検索語qに関する該後共起語aの検索精度p(q|a)に基づいて、前記検索語qの後共起語集合に含まれる語の中から、前記検索語qに関連する関連語を決定する関連語決定ステップと、
を行うことを特徴とする文書検索用関連語発見方法。 - 前記検索精度推定ステップにおいて、
前記後共起語集合取得ステップで得られた前記検索語qの後共起語集合に含まれる各後共起語aについて、前記前共起語集合取得ステップで得られた該後共起語aの前共起語集合を取得し、該前共起語集合に含まれる各前共起語bについて、前記検索語qに関する該前共起語bの前記検索精度p(q|b)と、該前共起語bに関する該後共起語aの前記検索精度p(b|a)を推定し、推定した全ての検索精度を用いて、前記検索語qに関する該後共起語aの検索精度p(q|a)を推定する、
ことを特徴とする請求項3記載の文書検索用関連語発見方法。 - コンピュータを、
請求項1または2記載の文書検索用関連語発見装置の各手段として機能させるための文書検索用関連語発見プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012113851A JP5727415B2 (ja) | 2012-05-17 | 2012-05-17 | 文書検索用関連語発見装置及び方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012113851A JP5727415B2 (ja) | 2012-05-17 | 2012-05-17 | 文書検索用関連語発見装置及び方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013242621A JP2013242621A (ja) | 2013-12-05 |
JP5727415B2 true JP5727415B2 (ja) | 2015-06-03 |
Family
ID=49843468
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012113851A Expired - Fee Related JP5727415B2 (ja) | 2012-05-17 | 2012-05-17 | 文書検索用関連語発見装置及び方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5727415B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102012213273B4 (de) | 2012-07-27 | 2021-08-05 | Hydac Technology Gmbh | Energiespeichervorrichtung |
JP6679681B2 (ja) * | 2018-09-19 | 2020-04-15 | ヤフー株式会社 | 生成装置、生成方法及び生成プログラム |
CN112989224B (zh) * | 2021-03-25 | 2024-06-25 | 北京百度网讯科技有限公司 | 一种检索方法、装置、电子设备和存储介质 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3422350B2 (ja) * | 1996-02-09 | 2003-06-30 | 日本電信電話株式会社 | 追加検索語候補提示方法、文書検索方法およびそれらの装置 |
JP3598211B2 (ja) * | 1998-01-13 | 2004-12-08 | 富士通株式会社 | 関連語抽出装置および関連語抽出方法および関連語抽出プログラムが記録されたコンピュータ読取可能な記録媒体 |
JP4631795B2 (ja) * | 2006-05-18 | 2011-02-16 | 日本電気株式会社 | 情報検索支援システム、情報検索支援方法および情報検索支援プログラム |
KR101052631B1 (ko) * | 2009-01-29 | 2011-07-28 | 성균관대학교산학협력단 | 동시 발생빈도를 이용한 검색어에 대한 연관어 제공 방법 및 이를 이용한 장치 |
-
2012
- 2012-05-17 JP JP2012113851A patent/JP5727415B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2013242621A (ja) | 2013-12-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Bhatia et al. | Automatic labelling of topics with neural embeddings | |
US9558264B2 (en) | Identifying and displaying relationships between candidate answers | |
CN105183923B (zh) | 新词发现方法及装置 | |
US9348900B2 (en) | Generating an answer from multiple pipelines using clustering | |
Potthast et al. | Overview of the 2nd international competition on plagiarism detection | |
CN102915314B (zh) | 一种纠错对自动生成方法及系统 | |
KR102080362B1 (ko) | 쿼리 확장 | |
US20180218241A1 (en) | Webpage classification method and apparatus, calculation device and machine readable storage medium | |
US10152478B2 (en) | Apparatus, system and method for string disambiguation and entity ranking | |
CN102693279B (zh) | 一种快速计算评论相似度的方法、装置及系统 | |
CN108241613A (zh) | 一种提取关键词的方法及设备 | |
US20150262078A1 (en) | Weighting dictionary entities for language understanding models | |
JP2009093647A (ja) | ワードと文書の深さの決定 | |
JP5727415B2 (ja) | 文書検索用関連語発見装置及び方法及びプログラム | |
Rao et al. | Reproducible experiments on lexical and temporal feedback for tweet search | |
JP5367632B2 (ja) | 知識量推定装置及びプログラム | |
Perea-Ortega et al. | Application of text summarization techniques to the geographical information retrieval task | |
TWI446191B (zh) | Word matching and information query method and device | |
Ma et al. | Web API discovery using semantic similarity and hungarian algorithm | |
JP5292336B2 (ja) | 検索システムユーザの分野ごとにおける知識量推定装置、知識量推定方法および知識量推定プログラム | |
JP5184195B2 (ja) | 言語処理装置およびプログラム | |
CN111191126B (zh) | 一种基于关键词的科技成果精准推送方法及装置 | |
Chahal | Measuring Similarity between Documents Using TF-IDF Cosine Similarity Function | |
Bashir | Estimating retrievability ranks of documents using document features | |
Simo et al. | Regrets: A new corpus of regrettable (self-) disclosures on social media |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140701 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20141219 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150106 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150309 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150331 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150402 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5727415 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |