JP2017162190A - 類似文書検索プログラム、類似文書検索装置、及び類似文書検索方法 - Google Patents
類似文書検索プログラム、類似文書検索装置、及び類似文書検索方法 Download PDFInfo
- Publication number
- JP2017162190A JP2017162190A JP2016046088A JP2016046088A JP2017162190A JP 2017162190 A JP2017162190 A JP 2017162190A JP 2016046088 A JP2016046088 A JP 2016046088A JP 2016046088 A JP2016046088 A JP 2016046088A JP 2017162190 A JP2017162190 A JP 2017162190A
- Authority
- JP
- Japan
- Prior art keywords
- semantic
- search
- context information
- symbols
- similar document
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/93—Document management systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Business, Economics & Management (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Abstract
Description
(1)コンピュータは、検索文から、検索文における単語又は意味記号の出現頻度を表す検索文脈情報を生成する。
(2)コンピュータは、複数個の意味構造と複数の文脈情報との対応関係を参照する。複数の文書に含まれる複数の文に対する意味解析を行うことで、各文に含まれる複数の意味記号の間の関係種別に基づいて、複数個の意味構造が生成され、各意味構造は、3個以上の意味記号と、それらの意味記号の間の関係種別とを含む。また、複数の文書のうち複数個の意味構造それぞれにマッチする文書群における単語又は意味記号の出現頻度を表す複数の文脈情報が生成され、複数個の意味構造を複数の文脈情報にそれぞれ対応付けることで、対応関係が生成される。
(3)コンピュータは、複数の文脈情報と検索文脈情報とに基づいて、複数個の意味構造のうち1個の意味構造を特定する。
(4)コンピュータは、特定した意味構造を用いて、複数の文書の中から検索文に類似する類似文書を検索する。
(5)コンピュータは、類似文書を示す検索結果を出力する。
意味構造を用いた類似文書検索では、事前に検索対象文書に含まれる各文の意味構造が意味最小単位に分解され、生成された意味最小単位がデータベースに格納される。そして、自然文の検索要求である検索文を入力として、検索文の意味構造から意味最小単位が計算され、それぞれの意味最小単位を検索キーとしてデータベースが検索される。このとき、意味最小単位毎にスコアが設定され、各文書のスコアは、マッチした意味最小単位のスコアの総計に基づいて計算される。
意味記号数:35442
2つ組の種類の数:123896
3つ組の種類の数:63059
「0xK0,0xKU,0xS8」
「0xK0,0xKU,0xKR」
「0xK0,0xKU,0xN3」
「0xK0,0xKU,0xAM」
「0xK0,0xKU,0xC1」
「0xK0,0xS8,0xKR」
「0xK0,0xS8,0xN3」
「0xHA,0xKS,0xP7」
・・・
0xK0:「異なる」、「違う」
0xKU:「国」
0xS8:「制度」
0xKR:「比べ」
0xN3:「日本」
0xAM:「米国」、「アメリカ」
0xC1:「中国」
0xP7:「社長」
0xKS:「決算」
0xHA:「発表」
「0xK0,0xKU,0xKR」:3981
「0xK0,0xKU,0xN3」:2359
「0xK0,0xKU,0xAM」:1090
「0xK0,0xKU,0xC1」:2733
「0xHA,0xKS,0xP7」:78370
・・・
idf(W)=log(L/dfreq(W))+1 (2)
Val(Wn,D)) (3)
1.差異度計算部1101は、Pを0に設定する。
2.2個の意味構造の間で基点ノードの意味記号が異なる場合、差異度計算部1101は、Pに1.5を加算する。この場合、P=1.5となり、Pが所定値に達したため、他の組み合わせに対する差異スコアPをさらに計算しても、差異度の判定結果は変化しない。そこで、差異度計算部1101は、差異スコアPの計算を終了して、3つ組の差異度を1.5に決定する。
3.2個の意味構造の間で基点ノードの意味記号が同じである場合、差異度計算部1101は、各意味構造を2つ組の意味構造に分解し、同じ2つ組を含む意味構造同士を比較して、Pに値を加算する。
SS1:(0xHA,0xP7,動作主)、(0xHA,0xKS,対象)
SS2:(0xHA,0xP7,動作主)、(0xHA,0xKS,関する)
(付記1)
検索文から、前記検索文における単語又は意味記号の出現頻度を表す検索文脈情報を生成し、
複数の文書に含まれる複数の文に対する意味解析を行って、前記複数の文各々に含まれる複数の意味記号の間の関係種別に基づき、3個以上の意味記号と前記3個以上の意味記号の間の関係種別とを含む意味構造を複数個生成し、前記複数の文書のうち前記複数個の意味構造それぞれにマッチする文書群における単語又は意味記号の出現頻度を表す複数の文脈情報を生成し、前記複数個の意味構造を前記複数の文脈情報にそれぞれ対応付けることで生成される、前記複数個の意味構造と前記複数の文脈情報との対応関係を参照し、
前記複数の文脈情報と前記検索文脈情報とに基づいて、前記複数個の意味構造のうち1個の意味構造を特定し、
特定した前記意味構造を用いて、前記複数の文書の中から前記検索文に類似する類似文書を検索し、
前記類似文書を示す検索結果を出力する、
処理をコンピュータに実行させる類似文書検索プログラム。
(付記2)
前記コンピュータは、前記検索文に含まれる複数の意味記号から3個以上の意味記号の組を生成し、前記複数の文脈情報のうち、前記検索文から生成した前記3個以上の意味記号の組を含む複数個の意味構造にそれぞれ対応付けられた複数の文脈情報各々と、前記検索文脈情報との類似度を求め、最も大きな類似度を有する文脈情報に対応付けられた意味構造を、前記1個の意味構造として特定することを特徴とする付記1記載の類似文書検索プログラム。
(付記3)
前記コンピュータは、前記検索文から生成した前記3個以上の意味記号の組の前記複数の文書における出現頻度が第1所定値よりも大きい場合、前記検索文から前記検索文脈情報を生成し、前記類似度を求め、前記1個の意味構造を特定することを特徴とする付記2記載の類似文書検索プログラム。
(付記4)
前記コンピュータは、前記検索文から生成した前記3個以上の意味記号の組を含む複数の意味構造の間における意味の差異を示す差異度が、第2所定値よりも大きい場合、前記検索文から前記検索文脈情報を生成し、前記類似度を求め、前記1個の意味構造を特定することを特徴とする付記2又は3記載の類似文書検索プログラム。
(付記5)
前記類似文書検索プログラムは、
前記複数の文に対する前記意味解析を行って、前記複数個の意味構造を生成し、
前記複数個の意味構造それぞれに対する前記複数の文脈情報を生成し、
前記複数個の意味構造と前記複数の文脈情報との前記対応関係を生成する、
処理をさらに前記コンピュータに実行させる付記1乃至4のいずれか1項に記載の類似文書検索プログラム。
(付記6)
複数の文書に含まれる複数の文に対する意味解析を行って、前記複数の文各々に含まれる複数の意味記号の間の関係種別に基づき、3個以上の意味記号と前記3個以上の意味記号の間の関係種別とを含む意味構造を複数個生成し、前記複数の文書のうち前記複数個の意味構造それぞれにマッチする文書群における単語又は意味記号の出現頻度を表す複数の文脈情報を生成し、前記複数個の意味構造を前記複数の文脈情報にそれぞれ対応付けることで生成される、前記複数個の意味構造と前記複数の文脈情報との対応関係を記憶する記憶部と、
検索文から、前記検索文における単語又は意味記号の出現頻度を表す検索文脈情報を生成し、前記複数の文脈情報と前記検索文脈情報とに基づいて、前記複数個の意味構造のうち1個の意味構造を特定する特定部と、
前記特定部が特定した前記意味構造を用いて、前記複数の文書の中から前記検索文に類似する類似文書を検索する検索部と、
前記類似文書を示す検索結果を出力する出力部と、
を備えることを特徴とする類似文書検索装置。
(付記7)
前記特定部は、前記検索文に含まれる複数の意味記号から3個以上の意味記号の組を生成し、前記複数の文脈情報のうち、前記検索文から生成した前記3個以上の意味記号の組を含む複数個の意味構造にそれぞれ対応付けられた複数の文脈情報各々と、前記検索文脈情報との類似度を求め、最も大きな類似度を有する文脈情報に対応付けられた意味構造を、前記1個の意味構造として特定することを特徴とする付記6記載の類似文書検索装置。
(付記8)
前記特定部は、前記検索文から生成した前記3個以上の意味記号の組の前記複数の文書における出現頻度が第1所定値よりも大きい場合、前記検索文から前記検索文脈情報を生成し、前記類似度を求め、前記1個の意味構造を特定することを特徴とする付記7記載の類似文書検索装置。
(付記9)
前記特定部は、前記検索文から生成した前記3個以上の意味記号の組を含む複数の意味構造の間における意味の差異を示す差異度が、第2所定値よりも大きい場合、前記検索文から前記検索文脈情報を生成し、前記類似度を求め、前記1個の意味構造を特定することを特徴とする付記7又は8記載の類似文書検索装置。
(付記10)
前記複数の文に対する前記意味解析を行って、前記複数個の意味構造を生成し、前記複数個の意味構造それぞれに対する前記複数の文脈情報を生成し、前記複数個の意味構造と前記複数の文脈情報との前記対応関係を生成する対応関係生成部をさらに備えることを特徴とする付記6乃至9のいずれか1項に記載の類似文書検索装置。
(付記11)
コンピュータが、
検索文から、前記検索文における単語又は意味記号の出現頻度を表す検索文脈情報を生成し、
複数の文書に含まれる複数の文に対する意味解析を行って、前記複数の文各々に含まれる複数の意味記号の間の関係種別に基づき、3個以上の意味記号と前記3個以上の意味記号の間の関係種別とを含む意味構造を複数個生成し、前記複数の文書のうち前記複数個の意味構造それぞれにマッチする文書群における単語又は意味記号の出現頻度を表す複数の文脈情報を生成し、前記複数個の意味構造を前記複数の文脈情報にそれぞれ対応付けることで生成される、前記複数個の意味構造と前記複数の文脈情報との対応関係を参照し、
前記複数の文脈情報と前記検索文脈情報とに基づいて、前記複数個の意味構造のうち1個の意味構造を特定し、
特定した前記意味構造を用いて、前記複数の文書の中から前記検索文に類似する類似文書を検索し、
前記類似文書を示す検索結果を出力する、
ことを特徴とする類似文書検索方法。
(付記12)
前記コンピュータは、前記検索文に含まれる複数の意味記号から3個以上の意味記号の組を生成し、前記複数の文脈情報のうち、前記検索文から生成した前記3個以上の意味記号の組を含む複数個の意味構造にそれぞれ対応付けられた複数の文脈情報各々と、前記検索文脈情報との類似度を求め、最も大きな類似度を有する文脈情報に対応付けられた意味構造を、前記1個の意味構造として特定することを特徴とする付記11記載の類似文書検索方法。
(付記13)
前記コンピュータは、前記検索文から生成した前記3個以上の意味記号の組の前記複数の文書における出現頻度が第1所定値よりも大きい場合、前記検索文から前記検索文脈情報を生成し、前記類似度を求め、前記1個の意味構造を特定することを特徴とする付記12記載の類似文書検索方法。
(付記14)
前記コンピュータは、前記検索文から生成した前記3個以上の意味記号の組を含む複数の意味構造の間における意味の差異を示す差異度が、第2所定値よりも大きい場合、前記検索文から前記検索文脈情報を生成し、前記類似度を求め、前記1個の意味構造を特定することを特徴とする付記12又は13記載の類似文書検索方法。
(付記15)
前記コンピュータは、
前記複数の文に対する前記意味解析を行って、前記複数個の意味構造を生成し、
前記複数個の意味構造それぞれに対する前記複数の文脈情報を生成し、
前記複数個の意味構造と前記複数の文脈情報との前記対応関係を生成する、
ことを特徴とする付記11乃至14のいずれか1項に記載の類似文書検索方法。
201 類似文書検索装置
211 記憶部
212 特定部
213 検索部
214 出力部
221 対応関係
401 対応関係生成部
402 インデックス生成部
411 記号決定部
412 文脈生成部
413 構造決定部
421 検索インデックス
422 検索キー
423 検索結果
501−1〜501−N 文書群
502−1〜502−N 文脈情報
1101 差異度計算部
1601 CPU
1602 メモリ
1603 入力装置
1604 出力装置
1605 補助記憶装置
1606 媒体駆動装置
1607 ネットワーク接続装置
1608 バス
1609 可搬型記録媒体
Claims (6)
- 検索文から、前記検索文における単語又は意味記号の出現頻度を表す検索文脈情報を生成し、
複数の文書に含まれる複数の文に対する意味解析を行って、前記複数の文各々に含まれる複数の意味記号の間の関係種別に基づき、3個以上の意味記号と前記3個以上の意味記号の間の関係種別とを含む意味構造を複数個生成し、前記複数の文書のうち前記複数個の意味構造それぞれにマッチする文書群における単語又は意味記号の出現頻度を表す複数の文脈情報を生成し、前記複数個の意味構造を前記複数の文脈情報にそれぞれ対応付けることで生成される、前記複数個の意味構造と前記複数の文脈情報との対応関係を参照し、
前記複数の文脈情報と前記検索文脈情報とに基づいて、前記複数個の意味構造のうち1個の意味構造を特定し、
特定した前記意味構造を用いて、前記複数の文書の中から前記検索文に類似する類似文書を検索し、
前記類似文書を示す検索結果を出力する、
処理をコンピュータに実行させる類似文書検索プログラム。 - 前記コンピュータは、前記検索文に含まれる複数の意味記号から3個以上の意味記号の組を生成し、前記複数の文脈情報のうち、前記検索文から生成した前記3個以上の意味記号の組を含む複数個の意味構造にそれぞれ対応付けられた複数の文脈情報各々と、前記検索文脈情報との類似度を求め、最も大きな類似度を有する文脈情報に対応付けられた意味構造を、前記1個の意味構造として特定することを特徴とする請求項1記載の類似文書検索プログラム。
- 前記コンピュータは、前記検索文から生成した前記3個以上の意味記号の組の前記複数の文書における出現頻度が第1所定値よりも大きい場合、前記検索文から前記検索文脈情報を生成し、前記類似度を求め、前記1個の意味構造を特定することを特徴とする請求項2記載の類似文書検索プログラム。
- 前記コンピュータは、前記検索文から生成した前記3個以上の意味記号の組を含む複数の意味構造の間における意味の差異を示す差異度が、第2所定値よりも大きい場合、前記検索文から前記検索文脈情報を生成し、前記類似度を求め、前記1個の意味構造を特定することを特徴とする請求項2又は3記載の類似文書検索プログラム。
- 複数の文書に含まれる複数の文に対する意味解析を行って、前記複数の文各々に含まれる複数の意味記号の間の関係種別に基づき、3個以上の意味記号と前記3個以上の意味記号の間の関係種別とを含む意味構造を複数個生成し、前記複数の文書のうち前記複数個の意味構造それぞれにマッチする文書群における単語又は意味記号の出現頻度を表す複数の文脈情報を生成し、前記複数個の意味構造を前記複数の文脈情報にそれぞれ対応付けることで生成される、前記複数個の意味構造と前記複数の文脈情報との対応関係を記憶する記憶部と、
検索文から、前記検索文における単語又は意味記号の出現頻度を表す検索文脈情報を生成し、前記複数の文脈情報と前記検索文脈情報とに基づいて、前記複数個の意味構造のうち1個の意味構造を特定する特定部と、
前記特定部が特定した前記意味構造を用いて、前記複数の文書の中から前記検索文に類似する類似文書を検索する検索部と、
前記類似文書を示す検索結果を出力する出力部と、
を備えることを特徴とする類似文書検索装置。 - コンピュータが、
検索文から、前記検索文における単語又は意味記号の出現頻度を表す検索文脈情報を生成し、
複数の文書に含まれる複数の文に対する意味解析を行って、前記複数の文各々に含まれる複数の意味記号の間の関係種別に基づき、3個以上の意味記号と前記3個以上の意味記号の間の関係種別とを含む意味構造を複数個生成し、前記複数の文書のうち前記複数個の意味構造それぞれにマッチする文書群における単語又は意味記号の出現頻度を表す複数の文脈情報を生成し、前記複数個の意味構造を前記複数の文脈情報にそれぞれ対応付けることで生成される、前記複数個の意味構造と前記複数の文脈情報との対応関係を参照し、
前記複数の文脈情報と前記検索文脈情報とに基づいて、前記複数個の意味構造のうち1個の意味構造を特定し、
特定した前記意味構造を用いて、前記複数の文書の中から前記検索文に類似する類似文書を検索し、
前記類似文書を示す検索結果を出力する、
ことを特徴とする類似文書検索方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016046088A JP6638480B2 (ja) | 2016-03-09 | 2016-03-09 | 類似文書検索プログラム、類似文書検索装置、及び類似文書検索方法 |
US15/452,381 US10467271B2 (en) | 2016-03-09 | 2017-03-07 | Search apparatus and search method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016046088A JP6638480B2 (ja) | 2016-03-09 | 2016-03-09 | 類似文書検索プログラム、類似文書検索装置、及び類似文書検索方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017162190A true JP2017162190A (ja) | 2017-09-14 |
JP6638480B2 JP6638480B2 (ja) | 2020-01-29 |
Family
ID=59787912
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016046088A Active JP6638480B2 (ja) | 2016-03-09 | 2016-03-09 | 類似文書検索プログラム、類似文書検索装置、及び類似文書検索方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US10467271B2 (ja) |
JP (1) | JP6638480B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109815312A (zh) * | 2018-12-27 | 2019-05-28 | 达闼科技(北京)有限公司 | 一种文档查询的方法、装置、计算设备及计算机存储介质 |
JP2020057105A (ja) * | 2018-09-28 | 2020-04-09 | 株式会社リコー | 言語処理方法、言語処理プログラム及び言語処理装置 |
US11574003B2 (en) | 2020-02-19 | 2023-02-07 | Alibaba Group Holding Limited | Image search method, apparatus, and device |
Families Citing this family (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11475488B2 (en) | 2017-09-11 | 2022-10-18 | Accenture Global Solutions Limited | Dynamic scripts for tele-agents |
US11853930B2 (en) | 2017-12-15 | 2023-12-26 | Accenture Global Solutions Limited | Dynamic lead generation |
US11347749B2 (en) | 2018-05-24 | 2022-05-31 | Sap Se | Machine learning in digital paper-based interaction |
US11468882B2 (en) * | 2018-10-09 | 2022-10-11 | Accenture Global Solutions Limited | Semantic call notes |
US10923114B2 (en) | 2018-10-10 | 2021-02-16 | N3, Llc | Semantic jargon |
US12001972B2 (en) | 2018-10-31 | 2024-06-04 | Accenture Global Solutions Limited | Semantic inferencing in customer relationship management |
US11132695B2 (en) | 2018-11-07 | 2021-09-28 | N3, Llc | Semantic CRM mobile communications sessions |
US10742813B2 (en) | 2018-11-08 | 2020-08-11 | N3, Llc | Semantic artificial intelligence agent |
US10972608B2 (en) | 2018-11-08 | 2021-04-06 | N3, Llc | Asynchronous multi-dimensional platform for customer and tele-agent communications |
CN110737751B (zh) * | 2019-09-06 | 2023-10-20 | 平安科技(深圳)有限公司 | 基于相似度值的搜索方法、装置、计算机设备和存储介质 |
US20230026321A1 (en) * | 2019-10-25 | 2023-01-26 | Semiconductor Energy Laboratory Co., Ltd. | Document retrieval system |
US11443264B2 (en) | 2020-01-29 | 2022-09-13 | Accenture Global Solutions Limited | Agnostic augmentation of a customer relationship management application |
US11392960B2 (en) | 2020-04-24 | 2022-07-19 | Accenture Global Solutions Limited | Agnostic customer relationship management with agent hub and browser overlay |
US11481785B2 (en) | 2020-04-24 | 2022-10-25 | Accenture Global Solutions Limited | Agnostic customer relationship management with browser overlay and campaign management portal |
US11507903B2 (en) | 2020-10-01 | 2022-11-22 | Accenture Global Solutions Limited | Dynamic formation of inside sales team or expert support team |
US11797586B2 (en) | 2021-01-19 | 2023-10-24 | Accenture Global Solutions Limited | Product presentation for customer relationship management |
US11816677B2 (en) | 2021-05-03 | 2023-11-14 | Accenture Global Solutions Limited | Call preparation engine for customer relationship management |
US12026525B2 (en) | 2021-11-05 | 2024-07-02 | Accenture Global Solutions Limited | Dynamic dashboard administration |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001511565A (ja) * | 1997-07-22 | 2001-08-14 | マイクロソフト コーポレイション | 自然言語処理技法を用いたテキスト入力処理システム |
JP2004110200A (ja) * | 2002-09-13 | 2004-04-08 | Fuji Xerox Co Ltd | テキスト文比較装置 |
JP2006039811A (ja) * | 2004-07-26 | 2006-02-09 | Fuji Xerox Co Ltd | ドキュメント管理プログラム、ドキュメント管理方法、及びドキュメント管理装置 |
JP2007293685A (ja) * | 2006-04-26 | 2007-11-08 | Mitsubishi Electric Corp | テキストマイニング装置、テキストマイニングプログラム、及びテキストマイニング方法 |
JP2013186766A (ja) * | 2012-03-09 | 2013-09-19 | Fujitsu Ltd | 情報検索方法、プログラムおよび情報検索装置 |
JP2014235664A (ja) * | 2013-06-04 | 2014-12-15 | 富士通株式会社 | 情報検索装置および情報検索方法 |
JP2015060243A (ja) * | 2013-09-17 | 2015-03-30 | 富士通株式会社 | 検索装置、検索方法、およびプログラム |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6556983B1 (en) * | 2000-01-12 | 2003-04-29 | Microsoft Corporation | Methods and apparatus for finding semantic information, such as usage logs, similar to a query using a pattern lattice data space |
US7571177B2 (en) * | 2001-02-08 | 2009-08-04 | 2028, Inc. | Methods and systems for automated semantic knowledge leveraging graph theoretic analysis and the inherent structure of communication |
US20080294599A1 (en) * | 2007-05-23 | 2008-11-27 | International Business Machines Corporation | Apparatus and method of semantic tuplespace system |
JP2012003603A (ja) | 2010-06-18 | 2012-01-05 | Hitachi Systems & Services Ltd | 情報検索システム |
US9798732B2 (en) * | 2011-01-06 | 2017-10-24 | Micro Focus Software Inc. | Semantic associations in data |
JP6093200B2 (ja) | 2013-02-05 | 2017-03-08 | 日本放送協会 | 情報検索装置及び情報検索プログラム |
US10424016B2 (en) * | 2013-12-19 | 2019-09-24 | International Business Machines Corporation | Modeling asset transfer flow relationships discovered in unstructured data |
JP6260294B2 (ja) | 2014-01-21 | 2018-01-17 | 富士通株式会社 | 情報検索装置、情報検索方法および情報検索プログラム |
-
2016
- 2016-03-09 JP JP2016046088A patent/JP6638480B2/ja active Active
-
2017
- 2017-03-07 US US15/452,381 patent/US10467271B2/en active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001511565A (ja) * | 1997-07-22 | 2001-08-14 | マイクロソフト コーポレイション | 自然言語処理技法を用いたテキスト入力処理システム |
JP2004110200A (ja) * | 2002-09-13 | 2004-04-08 | Fuji Xerox Co Ltd | テキスト文比較装置 |
JP2006039811A (ja) * | 2004-07-26 | 2006-02-09 | Fuji Xerox Co Ltd | ドキュメント管理プログラム、ドキュメント管理方法、及びドキュメント管理装置 |
JP2007293685A (ja) * | 2006-04-26 | 2007-11-08 | Mitsubishi Electric Corp | テキストマイニング装置、テキストマイニングプログラム、及びテキストマイニング方法 |
JP2013186766A (ja) * | 2012-03-09 | 2013-09-19 | Fujitsu Ltd | 情報検索方法、プログラムおよび情報検索装置 |
JP2014235664A (ja) * | 2013-06-04 | 2014-12-15 | 富士通株式会社 | 情報検索装置および情報検索方法 |
JP2015060243A (ja) * | 2013-09-17 | 2015-03-30 | 富士通株式会社 | 検索装置、検索方法、およびプログラム |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020057105A (ja) * | 2018-09-28 | 2020-04-09 | 株式会社リコー | 言語処理方法、言語処理プログラム及び言語処理装置 |
JP7147439B2 (ja) | 2018-09-28 | 2022-10-05 | 株式会社リコー | 言語処理方法、言語処理プログラム及び言語処理装置 |
CN109815312A (zh) * | 2018-12-27 | 2019-05-28 | 达闼科技(北京)有限公司 | 一种文档查询的方法、装置、计算设备及计算机存储介质 |
US11574003B2 (en) | 2020-02-19 | 2023-02-07 | Alibaba Group Holding Limited | Image search method, apparatus, and device |
Also Published As
Publication number | Publication date |
---|---|
US10467271B2 (en) | 2019-11-05 |
US20170262530A1 (en) | 2017-09-14 |
JP6638480B2 (ja) | 2020-01-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6638480B2 (ja) | 類似文書検索プログラム、類似文書検索装置、及び類似文書検索方法 | |
WO2021189951A1 (zh) | 文本搜索方法、装置、计算机设备和存储介质 | |
WO2017101342A1 (zh) | 情感分类方法及装置 | |
US11334609B2 (en) | Semantic structure search device and semantic structure search method | |
JP4930379B2 (ja) | 類似文検索方法、類似文検索システム及び類似文検索用プログラム | |
CN110704743A (zh) | 一种基于知识图谱的语义搜索方法及装置 | |
CN107885717B (zh) | 一种关键词提取方法及装置 | |
CN108287875B (zh) | 人物共现关系确定方法、专家推荐方法、装置及设备 | |
JP2018045537A (ja) | 検索プログラム、検索装置および検索方法 | |
US12067061B2 (en) | Systems and methods for automated information retrieval | |
CN117076636A (zh) | 一种智能客服的信息查询方法、系统和设备 | |
JP6563350B2 (ja) | データ分類装置、データ分類方法、及びプログラム | |
JP6805927B2 (ja) | インデックス生成プログラム、データ検索プログラム、インデックス生成装置、データ検索装置、インデックス生成方法、及びデータ検索方法 | |
WO2023245869A1 (zh) | 语音识别模型的训练方法、装置、电子设备及存储介质 | |
JP2006285419A (ja) | 情報処理装置および方法、並びにプログラム | |
JP6495206B2 (ja) | 文書概念ベース生成装置、文書概念検索装置、方法、及びプログラム | |
CN109918661A (zh) | 同义词获取方法及装置 | |
JP6173958B2 (ja) | 複数のハッシュテーブルを用いて検索するプログラム、装置及び方法 | |
CN114385777A (zh) | 文本数据处理方法、装置、计算机设备和存储介质 | |
KR101544639B1 (ko) | 입력되는 문자열로부터 사용자의 감정을 판단하는 방법 | |
US20210271990A1 (en) | Answer sentence selection device, method, and program | |
JP2009181183A (ja) | 人名表現同定装置、その方法、プログラム及び記録媒体 | |
JP7435740B2 (ja) | 音声認識装置、制御方法、及びプログラム | |
CN113220841B (zh) | 确定鉴别信息的方法、装置、电子设备和存储介质 | |
JP7490670B2 (ja) | 検索装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20181112 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20191011 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20191126 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20191209 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6638480 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |