JP2021026515A - 情報処理装置、情報処理方法および情報処理プログラム - Google Patents
情報処理装置、情報処理方法および情報処理プログラム Download PDFInfo
- Publication number
- JP2021026515A JP2021026515A JP2019144071A JP2019144071A JP2021026515A JP 2021026515 A JP2021026515 A JP 2021026515A JP 2019144071 A JP2019144071 A JP 2019144071A JP 2019144071 A JP2019144071 A JP 2019144071A JP 2021026515 A JP2021026515 A JP 2021026515A
- Authority
- JP
- Japan
- Prior art keywords
- document
- similarity
- information processing
- distance
- newly acquired
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
文書データベースに保存された複数の文書のそれぞれに含まれる単語の意味を表すベクトルの積算結果としての点と、新たに取得した文書に含まれる単語の意味を表すベクトルの積算結果としての点との距離を第1類似度として算出する第1算出部と、
複数の文書のそれぞれに含まれる文字と、新たに取得した文書に含まれる文字との相違を距離として算出し、その距離の近さを第2類似度として算出する第2算出部と、
前記第1類似度および前記第2類似度に基づいて、前記新たに取得した文書に類似する文書を前記複数の文書から選択する選択部と、
を備えた。
文書データベースに保存された複数の文書のそれぞれに含まれる単語の意味を表すベクトルの積算結果としての点と、新たに取得した文書に含まれる単語の意味を表すベクトルの積算結果としての点との距離を第1類似度として算出する第1算出ステップと、
複数の文書のそれぞれに含まれる文字と、新たに取得した文書に含まれる文字との相違を距離として算出し、その距離の近さを第2類似度として算出する第2算出ステップと、
前記第1類似度および前記第2類似度に基づいて、前記新たに取得した文書に類似する文書を前記複数の文書から選択する選択ステップと、
を含む。
文書データベースに保存された複数の文書のそれぞれに含まれる単語の意味を表すベクトルの積算結果としての点と、新たに取得した文書に含まれる単語の意味を表すベクトルの積算結果としての点との距離を第1類似度として算出する第1算出ステップと、
複数の文書のそれぞれに含まれる文字と、新たに取得した文書に含まれる文字との相違を距離として算出し、その距離の近さを第2類似度として算出する第2算出ステップと、
前記第1類似度および前記第2類似度に基づいて、前記新たに取得した文書に類似する文書を前記複数の文書から選択する選択ステップと、
をコンピュータに実行させる。
本発明の第1実施形態に係る情報処理装置について、図1を用いて説明する。図1は、本実施形態に係る情報処理装置の内部構成を説明するための図である。
次に本発明の第2実施形態に係る情報処理装置について、図2A乃至図6を用いて説明する。図2Aは、本実施形態に係る情報処理装置200の動作の概要を説明する図である。例えば、工作機械販売者210が、工作機械の購入希望者から工作機械の見積り依頼や工作機械の設計依頼を受けた場合、その種の依頼に基づいて、文書250(設計書)を作成して、情報処理装置200に送信する。情報処理装置200は、受け取った分書250に類似する仕様書261をデータベース260から検索し、過去の類似事例の工作機械の仕様書261を工作機械販売者210に提示する。
以上、実施形態を参照して本願発明を説明したが、本願発明は上記実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明の技術的範囲で当業者が理解し得る様々な変更をすることができる。また、それぞれの実施形態に含まれる別々の特徴を如何様に組み合わせたシステムまたは装置も、本発明の技術的範囲に含まれる。
工作機械の仕様書のオプション欄に記載されているであろう単語を含む検索対象としての文書データをユーザから受信する受信部と、
前記文書データに含まれる複数の単語の意味をそれぞれベクトル化して積算して第1文書ベクトルを算出する算出部と、
過去の仕様書のオプション欄に自由に記載された文書を示すオプション欄データと、前記オプション欄データに含まれる単語の意味をそれぞれベクトル化して積算した結果としての第2文書ベクトルとを対応付けて記憶する仕様書データベースと、
前記第1文書ベクトルと前記第2文書ベクトルとのコサイン距離を第1類似度として算出する第1算出部と、
前記オプション欄データに含まれる文字列と、前記文書データに含まれる文字列とを比較し、文字列の相違を表す距離を第2類似度として算出する第2算出部と、
前記第1類似度および前記第2類似度に基づいて、前記文書データに類似する前記オプション欄データを含む類似仕様書を前記仕様書データベースから選択する選択部と、
前記類似仕様書を前記ユーザに送信する送信部と、
を備えた。
上記目的を達成するため、本発明にかかる他の情報処理装置は、
機械の種類と、日程と、自由入力が可能なオプション欄とを含む仕様書データを取得する取得部と、
(a)文書データベースに保存された複数の仕様書データのそれぞれのオプション欄に含まれる単語の意味を表すベクトルの積算結果としての第1ベクトルと、前記取得部が取得した前記仕様書データに含まれるオプション欄に記載された第1オプションに含まれる単語の意味を表すベクトルの積算結果としての第2ベクトルと、のコサイン距離を前記第1オプションの第1類似度として算出し、(b)前記第1ベクトルと、前記取得部が取得した仕様書のデータに含まれる前記オプション欄に記載された第2オプションに含まれる単語の意味を表すベクトルの積算結果としての第3ベクトルと、のコサイン距離を前記第2オプションの第1類似度として算出する第1算出部と、
(c)前記文書データベースに保存された複数の仕様書データのそれぞれのオプション欄に含まれる文字列と、前記第1オプションに含まれる文字列との相違を距離として算出し、その距離の近さを前記第1オプションの第2類似度として算出し、(d)前記文書データベースに保存された複数の仕様書データのそれぞれのオプション欄に含まれる文字列と、前記第2オプションに含まれる文字列との相違を距離として算出し、その距離の近さを前記第2オプションの第2類似度として算出する第2算出部と、
(e)前記第1オプションの前記第1類似度及び前記第2類似度に基づいて前記第1オプションに類似する文書を前記文書データベースに保存された複数の仕様書から選択し、(f)前記第2オプションの前記第1類似度及び前記第2類似度に基づいて前記第2オプションに類似する文書を前記文書データベースに保存された複数の仕様書から選択する選択部と、
を備えた。
工作機械の仕様書のオプション欄に記載されているであろう単語を含む検索対象としての文書データをユーザから受信部が受信する受信ステップと、
前記文書データに含まれる複数の単語の意味をそれぞれベクトル化して積算して第1文書ベクトルを文書ベクトル算出部が算出する文書ベクトル算出ステップと、
過去の仕様書のオプション欄に自由に記載された文書を示すオプション欄データと、前記オプション欄データに含まれる単語の意味をそれぞれベクトル化して積算した結果としての第2文書ベクトルとを対応付けてを記憶する仕様書データベースを用いて、前記第1文書ベクトルと前記第2文書ベクトルとのコサイン距離を第1算出部が第1類似度として算出する第1算出ステップと、
前記オプション欄データに含まれる文字列と、前記文書データに含まれる文字列とを比較し、文字列の相違を表す距離を第2類似度として第2算出部が算出する第2算出ステップと、
前記第1類似度および前記第2類似度に基づいて、前記文書データに類似する前記オプション欄データを含む類似仕様書を前記仕様書データベースから選択部が選択する選択ステップと、
前記類似仕様書を前記ユーザに送信部が送信する送信ステップと、
を含む。
次に本発明の第2実施形態に係る情報処理装置について、図2A乃至図6を用いて説明する。図2Aは、本実施形態に係る情報処理装置200の動作の概要を説明する図である。例えば、工作機械販売者210が、工作機械の購入希望者から工作機械の見積り依頼や工作機械の設計依頼を受けた場合、その種の依頼に基づいて、文書250(設計書または仕様書)を作成して、情報処理装置200に送信する。情報処理装置200は、受け取った文書250に類似する仕様書261をデータベース260から検索し、過去の類似事例の工作機械の仕様書261を工作機械販売者210に提示する。
Claims (6)
- 文書データベースに保存された複数の文書のそれぞれに含まれる単語の意味を表すベクトルの積算結果としての点と、新たに取得した文書に含まれる単語の意味を表すベクトルの積算結果としての点との距離を第1類似度として算出する第1算出部と、
複数の文書のそれぞれに含まれる文字と、新たに取得した文書に含まれる文字との相違を距離として算出し、その距離の近さを第2類似度として算出する第2算出部と、
前記第1類似度および前記第2類似度に基づいて、前記新たに取得した文書に類似する文書を前記複数の文書から選択する選択部と、
を備えた情報処理装置。 - 前記複数の文書および前記新たに取得した文書は、工作機械の仕様書である請求項1に記載の情報処理装置。
- 前記複数の文書および前記新たに取得した文書は、前記工作機械の仕様書において、顧客要望を自由に表した文書である請求項2に記載の情報処理装置。
- 前記新たに取得した文書を電子メールで受信し、返信メールとして、前記選択部で選択した文書または、前記選択部で選択した文書へのリンクを送信する送受信部を
さらに備えた請求項1または2に記載の情報処理装置。 - 文書データベースに保存された複数の文書のそれぞれに含まれる単語の意味を表すベクトルの積算結果としての点と、新たに取得した文書に含まれる単語の意味を表すベクトルの積算結果としての点との距離を第1類似度として算出する第1算出ステップと、
複数の文書のそれぞれに含まれる文字と、新たに取得した文書に含まれる文字との相違を距離として算出し、その距離の近さを第2類似度として算出する第2算出ステップと、
前記第1類似度および前記第2類似度に基づいて、前記新たに取得した文書に類似する文書を前記複数の文書から選択する選択ステップと、
を含む情報処理方法。 - 文書データベースに保存された複数の文書のそれぞれに含まれる単語の意味を表すベクトルの積算結果としての点と、新たに取得した文書に含まれる単語の意味を表すベクトルの積算結果としての点との距離を第1類似度として算出する第1算出ステップと、
複数の文書のそれぞれに含まれる文字と、新たに取得した文書に含まれる文字との相違を距離として算出し、その距離の近さを第2類似度として算出する第2算出ステップと、
前記第1類似度および前記第2類似度に基づいて、前記新たに取得した文書に類似する文書を前記複数の文書から選択する選択ステップと、
をコンピュータに実行させる情報処理プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019144071A JP6751188B1 (ja) | 2019-08-05 | 2019-08-05 | 情報処理装置、情報処理方法および情報処理プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019144071A JP6751188B1 (ja) | 2019-08-05 | 2019-08-05 | 情報処理装置、情報処理方法および情報処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP6751188B1 JP6751188B1 (ja) | 2020-09-02 |
JP2021026515A true JP2021026515A (ja) | 2021-02-22 |
Family
ID=72240884
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019144071A Active JP6751188B1 (ja) | 2019-08-05 | 2019-08-05 | 情報処理装置、情報処理方法および情報処理プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6751188B1 (ja) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10240759A (ja) * | 1997-02-28 | 1998-09-11 | Sharp Corp | 検索装置 |
JP2004062893A (ja) * | 2002-06-28 | 2004-02-26 | Microsoft Corp | 重み付き編集距離に基づく例文の自動検索用システムおよび方法 |
JP2008242681A (ja) * | 2007-03-27 | 2008-10-09 | Nec Corp | 検索サービスシステム、検索サーバ、検索サービス方法および検索サービス用プログラム |
JP2011141892A (ja) * | 2009-09-30 | 2011-07-21 | Rakuten Inc | 画像内に存在しない物品をレコメンドするシステム |
WO2014002774A1 (ja) * | 2012-06-25 | 2014-01-03 | 日本電気株式会社 | 同義語抽出システム、方法および記録媒体 |
-
2019
- 2019-08-05 JP JP2019144071A patent/JP6751188B1/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10240759A (ja) * | 1997-02-28 | 1998-09-11 | Sharp Corp | 検索装置 |
JP2004062893A (ja) * | 2002-06-28 | 2004-02-26 | Microsoft Corp | 重み付き編集距離に基づく例文の自動検索用システムおよび方法 |
JP2008242681A (ja) * | 2007-03-27 | 2008-10-09 | Nec Corp | 検索サービスシステム、検索サーバ、検索サービス方法および検索サービス用プログラム |
JP2011141892A (ja) * | 2009-09-30 | 2011-07-21 | Rakuten Inc | 画像内に存在しない物品をレコメンドするシステム |
WO2014002774A1 (ja) * | 2012-06-25 | 2014-01-03 | 日本電気株式会社 | 同義語抽出システム、方法および記録媒体 |
Also Published As
Publication number | Publication date |
---|---|
JP6751188B1 (ja) | 2020-09-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107111614B (zh) | 使用统计流数据进行不同语言之间的机器翻译 | |
US20170004169A1 (en) | Systems and methods for type coercion | |
CN110298035B (zh) | 基于人工智能的字向量定义方法、装置、设备及存储介质 | |
EP1320041A2 (en) | Searching profile information | |
KR101991320B1 (ko) | 온톨로지에 의해 표현되는 자원들을 이용하여 상기 온톨로지를 확장하는 방법 | |
US20140324550A1 (en) | Method and system for determining an optimal low fare for a trip | |
CN105786838A (zh) | 一种信息匹配处理方法和装置 | |
US11194963B1 (en) | Auditing citations in a textual document | |
KR102307517B1 (ko) | 네트워크 기반 상품 추천 방법 및 장치 | |
US8041727B2 (en) | System, method, and computer program product for finding web services using example queries | |
CN111274822A (zh) | 语义匹配方法、装置、设备及存储介质 | |
US11977552B2 (en) | System and method for reducing client-server network traffic for internet database queries | |
JP4963110B2 (ja) | サービス検索システム、方法及びプログラム | |
EP3798863A1 (en) | Creating line item information from free-form tabular data | |
KR102285308B1 (ko) | 경영 표준 규격 자동 매핑 시스템 | |
JP2021026515A (ja) | 情報処理装置、情報処理方法および情報処理プログラム | |
CN109165283B (zh) | 资源推荐方法、装置、设备及存储介质 | |
CN111078202A (zh) | 业务架构模型维护方法、装置、电子设备和介质 | |
CN116451688A (zh) | 汉语分词方法、装置、服务器及存储介质 | |
US8706660B2 (en) | System and method for efficient interpretation of natural images and document images in terms of objects and their parts | |
JP5533272B2 (ja) | データ出力装置、データ出力方法およびデータ出力プログラム | |
JP2022079755A (ja) | 特許情報処理装置、特許情報処理方法、およびプログラム | |
CN113822039A (zh) | 近义词挖掘方法及相关设备 | |
JP6451904B1 (ja) | スコア算出ユニット、検索装置、スコア算出方法、およびスコア算出プログラム | |
CN112464081A (zh) | 项目信息匹配方法、装置以及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20191220 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20191220 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20200323 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200326 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200525 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200804 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200813 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6751188 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |