WO2009066501A1 - 情報検索方法及び装置及びプログラム及びコンピュータ読取可能な記録媒体 - Google Patents

情報検索方法及び装置及びプログラム及びコンピュータ読取可能な記録媒体 Download PDF

Info

Publication number
WO2009066501A1
WO2009066501A1 PCT/JP2008/066356 JP2008066356W WO2009066501A1 WO 2009066501 A1 WO2009066501 A1 WO 2009066501A1 JP 2008066356 W JP2008066356 W JP 2008066356W WO 2009066501 A1 WO2009066501 A1 WO 2009066501A1
Authority
WO
WIPO (PCT)
Prior art keywords
character string
information search
information
words
program
Prior art date
Application number
PCT/JP2008/066356
Other languages
English (en)
French (fr)
Inventor
Yukio Uematsu
Kengo Fujioka
Syunsuke Konagai
Ryoji Kataoka
Original Assignee
Nippon Telegraph And Telephone Corporation
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph And Telephone Corporation filed Critical Nippon Telegraph And Telephone Corporation
Priority to US12/742,442 priority Critical patent/US8909654B2/en
Priority to JP2009542497A priority patent/JP5116775B2/ja
Publication of WO2009066501A1 publication Critical patent/WO2009066501A1/ja

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/313Selection or weighting of terms for indexing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/316Indexing structures

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

 クライアントからの文字列を取得する文字列入力手段と、該文字列が含まれる情報をインデックスDBから取得する文字列情報検索手段と、該文字列と検索された情報との類似度を算出する類似度算出手段と、類似度の高い順に検索された情報を出力する出力手段と、を有する情報検索装置が提供される。当該情報検索装置において、前記文字列情報検索手段は、入力された前記文字列が複数の単語からなる場合に、各単語に基づいて、単語及び該単語の出現位置情報を格納したインデックスDBを検索し、該単語の出現位置間の距離を求める手段を含み、前記類似度算出手段は、前記単語の出現位置間の距離に基づいて類似度を算出する手段を含む。
PCT/JP2008/066356 2007-11-19 2008-09-10 情報検索方法及び装置及びプログラム及びコンピュータ読取可能な記録媒体 WO2009066501A1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
US12/742,442 US8909654B2 (en) 2007-11-19 2008-09-10 Information search method, apparatus, program and computer readable recording medium
JP2009542497A JP5116775B2 (ja) 2007-11-19 2008-09-10 情報検索方法及び装置及びプログラム及びコンピュータ読取可能な記録媒体

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2007-299784 2007-11-19
JP2007299784 2007-11-19

Publications (1)

Publication Number Publication Date
WO2009066501A1 true WO2009066501A1 (ja) 2009-05-28

Family

ID=40667330

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2008/066356 WO2009066501A1 (ja) 2007-11-19 2008-09-10 情報検索方法及び装置及びプログラム及びコンピュータ読取可能な記録媒体

Country Status (3)

Country Link
US (1) US8909654B2 (ja)
JP (1) JP5116775B2 (ja)
WO (1) WO2009066501A1 (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010282480A (ja) * 2009-06-05 2010-12-16 Nippon Telegr & Teleph Corp <Ntt> 検索結果ランキング方法及び装置及びプログラム及びコンピュータ読取可能な記録媒体
JP2012533818A (ja) * 2009-07-20 2012-12-27 アリババ・グループ・ホールディング・リミテッド 単語の重みに基づいた検索結果の順位付け
JP2018067264A (ja) * 2016-10-21 2018-04-26 富士通株式会社 データ検索プログラム、データ検索装置およびデータ検索方法
JPWO2018096686A1 (ja) * 2016-11-28 2019-08-08 富士通株式会社 検証プログラム、検証装置、検証方法、インデックス生成プログラム、インデックス生成装置およびインデックス生成方法
JP2020184294A (ja) * 2019-04-26 2020-11-12 Arithmer株式会社 対話管理サーバ、対話管理方法、及びプログラム
JP2021089696A (ja) * 2019-12-06 2021-06-10 アイビーリサーチ株式会社 入力支援装置、入力支援システム及びプログラム
US11055328B2 (en) 2017-03-29 2021-07-06 Fujitsu Limited Non-transitory computer readable medium, encode device, and encode method
JPWO2022219804A1 (ja) * 2021-04-16 2022-10-20

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8473467B2 (en) * 2009-01-02 2013-06-25 Apple Inc. Content profiling to dynamically configure content processing
US8612431B2 (en) * 2009-02-13 2013-12-17 International Business Machines Corporation Multi-part record searches
US8463797B2 (en) * 2010-07-20 2013-06-11 Barracuda Networks Inc. Method for measuring similarity of diverse binary objects comprising bit patterns
US9727641B2 (en) 2013-04-25 2017-08-08 Entit Software Llc Generating a summary based on readability
JP6152711B2 (ja) * 2013-06-04 2017-06-28 富士通株式会社 情報検索装置および情報検索方法
US10372739B2 (en) * 2014-03-17 2019-08-06 NLPCore LLC Corpus search systems and methods
US10102274B2 (en) * 2014-03-17 2018-10-16 NLPCore LLC Corpus search systems and methods
US9600542B2 (en) * 2014-06-27 2017-03-21 Sap Se Fuzzy substring search
US10915543B2 (en) 2014-11-03 2021-02-09 SavantX, Inc. Systems and methods for enterprise data search and analysis
CN107102998A (zh) * 2016-02-22 2017-08-29 阿里巴巴集团控股有限公司 一种字符串距离计算方法和装置
JP6740845B2 (ja) * 2016-10-07 2020-08-19 富士通株式会社 文書符号化プログラム、情報処理装置および文書符号化方法
US10528668B2 (en) * 2017-02-28 2020-01-07 SavantX, Inc. System and method for analysis and navigation of data
US11328128B2 (en) 2017-02-28 2022-05-10 SavantX, Inc. System and method for analysis and navigation of data
CN108959440A (zh) * 2018-06-13 2018-12-07 福建新大陆软件工程有限公司 一种短信聚类方法及装置
US11151325B2 (en) * 2019-03-22 2021-10-19 Servicenow, Inc. Determining semantic similarity of texts based on sub-sections thereof
CN110633356B (zh) * 2019-09-04 2022-05-20 广州市巴图鲁信息科技有限公司 一种词语相似度计算方法、装置以及存储介质
CN111950272B (zh) * 2020-06-23 2023-06-27 北京百度网讯科技有限公司 文本相似度的生成方法、装置及电子设备
CN116578666B (zh) * 2023-07-12 2023-09-22 拓尔思信息技术股份有限公司 段句位的倒排索引结构设计及其限定运算全文检索的方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000242646A (ja) * 1999-02-18 2000-09-08 Real World Computing Partnership 情報検索方法及び情報検索装置
JP2004094387A (ja) * 2002-08-29 2004-03-25 Chubu Electric Power Co Inc 特定情報検索方法および情報検索装置
JP2005215716A (ja) * 2004-01-27 2005-08-11 Hitachi Ltd テキスト検索方法
JP2007004458A (ja) * 2005-06-23 2007-01-11 National Institute Of Information & Communication Technology 二項関係抽出装置,二項関係抽出処理を用いた情報検索装置,二項関係抽出処理方法,二項関係抽出処理を用いた情報検索処理方法,二項関係抽出処理プログラム,および二項関係抽出処理を用いた情報検索処理プログラム

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1049549A (ja) * 1996-05-29 1998-02-20 Matsushita Electric Ind Co Ltd 文書検索装置
US7003516B2 (en) * 2002-07-03 2006-02-21 Word Data Corp. Text representation and method
US8166033B2 (en) * 2003-02-27 2012-04-24 Parity Computing, Inc. System and method for matching and assembling records
CN100437561C (zh) * 2003-12-17 2008-11-26 国际商业机器公司 电子文档的处理方法和装置及其系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000242646A (ja) * 1999-02-18 2000-09-08 Real World Computing Partnership 情報検索方法及び情報検索装置
JP2004094387A (ja) * 2002-08-29 2004-03-25 Chubu Electric Power Co Inc 特定情報検索方法および情報検索装置
JP2005215716A (ja) * 2004-01-27 2005-08-11 Hitachi Ltd テキスト検索方法
JP2007004458A (ja) * 2005-06-23 2007-01-11 National Institute Of Information & Communication Technology 二項関係抽出装置,二項関係抽出処理を用いた情報検索装置,二項関係抽出処理方法,二項関係抽出処理を用いた情報検索処理方法,二項関係抽出処理プログラム,および二項関係抽出処理を用いた情報検索処理プログラム

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010282480A (ja) * 2009-06-05 2010-12-16 Nippon Telegr & Teleph Corp <Ntt> 検索結果ランキング方法及び装置及びプログラム及びコンピュータ読取可能な記録媒体
JP2012533818A (ja) * 2009-07-20 2012-12-27 アリババ・グループ・ホールディング・リミテッド 単語の重みに基づいた検索結果の順位付け
JP2018067264A (ja) * 2016-10-21 2018-04-26 富士通株式会社 データ検索プログラム、データ検索装置およびデータ検索方法
US10922343B2 (en) 2016-10-21 2021-02-16 Fujitsu Limited Data search device, data search method, and recording medium
JPWO2018096686A1 (ja) * 2016-11-28 2019-08-08 富士通株式会社 検証プログラム、検証装置、検証方法、インデックス生成プログラム、インデックス生成装置およびインデックス生成方法
US11055328B2 (en) 2017-03-29 2021-07-06 Fujitsu Limited Non-transitory computer readable medium, encode device, and encode method
JP2020184294A (ja) * 2019-04-26 2020-11-12 Arithmer株式会社 対話管理サーバ、対話管理方法、及びプログラム
JP2021089696A (ja) * 2019-12-06 2021-06-10 アイビーリサーチ株式会社 入力支援装置、入力支援システム及びプログラム
JP7377524B2 (ja) 2019-12-06 2023-11-10 アイビーリサーチ株式会社 入力支援装置、入力支援システム及びプログラム
JPWO2022219804A1 (ja) * 2021-04-16 2022-10-20
WO2022219804A1 (ja) * 2021-04-16 2022-10-20 三菱電機株式会社 情報処理装置、作成方法、及び作成プログラム
JP7286052B2 (ja) 2021-04-16 2023-06-02 三菱電機株式会社 情報処理装置、作成方法、及び作成プログラム

Also Published As

Publication number Publication date
JPWO2009066501A1 (ja) 2011-04-07
US8909654B2 (en) 2014-12-09
US20100257159A1 (en) 2010-10-07
JP5116775B2 (ja) 2013-01-09

Similar Documents

Publication Publication Date Title
WO2009066501A1 (ja) 情報検索方法及び装置及びプログラム及びコンピュータ読取可能な記録媒体
CN104252533B (zh) 搜索方法和搜索装置
CN104584003B (zh) 词检测和域字典推荐
CN104078044B (zh) 移动终端及其录音搜索的方法和装置
WO2009085555A3 (en) Methods and systems for implementing approximate string matching within a database
DK1952285T3 (da) Anlæg og fremgangsmåde til gennemsøgning og sammenligning af data, som har ordbilled-agtigt indhold
JP2009512923A5 (ja)
WO2007008798A3 (en) System and method for searching for network-based content in a multi-modal system using spoken keywords
WO2008101130A3 (en) Music-based search engine
WO2008051750A3 (en) Associating geographic-related information with objects
WO2004072757A3 (en) Text and attribute searches of data stores that include business object
WO2008031062A3 (en) System and method for building and retriving a full text index
WO2007002412A3 (en) Systems and methods for retrieving data
JP2012256354A5 (ja)
WO2010151788A3 (en) System and methods for units-based numeric information retrieval
SG142158A1 (en) Index structure of metadata, method for providing indices of metadata, and metadata searching method and apparatus using the indices of metadata
JP2020191075A (ja) Web APIおよび関連エンドポイントの推薦
CN104991943A (zh) 音乐搜索方法及装置
CN102693279A (zh) 一种快速计算评论相似度的方法、装置及系统
KR101541306B1 (ko) 컴퓨터 실행 가능한 중요 키워드 추출 방법, 이를 수행하는 중요 키워드 추출 서버 및 이를 저장하는 기록매체
WO2009016729A1 (ja) 音声認識用照合ルール学習システム、音声認識用照合ルール学習プログラムおよび音声認識用照合ルール学習方法
CN105701083A (zh) 文本表示方法和装置
CN103150356A (zh) 一种应用的泛需求检索方法及系统
WO2005062202A3 (en) Knowledge management system with ontology based methods for knowledge extraction and knowledge search
WO2009066393A1 (ja) 地図検索装置、地図検索方法、地図検索プログラム及び記憶媒体

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 08851166

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 2009542497

Country of ref document: JP

WWE Wipo information: entry into national phase

Ref document number: 12742442

Country of ref document: US

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 08851166

Country of ref document: EP

Kind code of ref document: A1