JP6942028B2 - 比較装置、比較方法および比較プログラム - Google Patents
比較装置、比較方法および比較プログラム Download PDFInfo
- Publication number
- JP6942028B2 JP6942028B2 JP2017204653A JP2017204653A JP6942028B2 JP 6942028 B2 JP6942028 B2 JP 6942028B2 JP 2017204653 A JP2017204653 A JP 2017204653A JP 2017204653 A JP2017204653 A JP 2017204653A JP 6942028 B2 JP6942028 B2 JP 6942028B2
- Authority
- JP
- Japan
- Prior art keywords
- field
- vector
- comparison
- comparison device
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 46
- 239000013598 vector Substances 0.000 claims description 207
- 230000008569 process Effects 0.000 claims description 22
- 238000006243 chemical reaction Methods 0.000 claims description 15
- 230000006870 function Effects 0.000 description 68
- 230000010365 information processing Effects 0.000 description 16
- 238000012545 processing Methods 0.000 description 12
- 239000002131 composite material Substances 0.000 description 11
- 238000010586 diagram Methods 0.000 description 10
- 230000014509 gene expression Effects 0.000 description 8
- 238000004891 communication Methods 0.000 description 4
- 238000010411 cooking Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000000877 morphologic effect Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000007306 functionalization reaction Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 235000019640 taste Nutrition 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Landscapes
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
〔1.比較装置の一例〕
まず、図1を用いて、比較装置が実行する比較処理の一例について説明する。図1は、実施形態に係る比較装置が実行する比較処理の一例を示す図である。図1では、比較装置10は、以下に説明する比較処理を実行する情報処理装置であり、例えば、サーバ装置やクラウドシステム等により実現される。
ここで、比較装置10は、情報処理装置200から指定された分野(以下、「指定分野」と記載する場合がある。)の比較を行い、比較結果に基づいて、指定分野が類似するか否かを判定する。例えば、比較装置10は、w2v(word2vec)やs2v(sentence2vec)等、単語や文章をベクトル(多次元量)に変換し、変換後のベクトルを用いて入力された文章に対応する応答を出力する。より具体的な例を挙げると、比較装置10は、情報処理装置100から受付けた文章を分野ごとに選別する。そして、比較装置10は、ある分野に属する文章から、形態素解析等の技術を用いて単語群を抽出し、抽出した単語をベクトルに変換する。すなわち、比較装置10は、分野ごとに異なるベクトル空間を生成する。
以下、数式を用いて、比較装置10が実行する比較処理の概念について説明する。例えば、比較装置10は、医療、物理学、料理等、様々な分野に関連する文章をその分野に属する文章として取得する。より具体的な例を挙げると、比較装置10は、医療関連の論文や特許公報等を医療分野に関連する文章として取得し、レシピや料理の歴史を示す論文等を料理に関連する文章として取得する。そして、比較装置10は、各文章から単語を抽出し、抽出した単語の相対的な関連性に基づいて、単語をベクトル化する。すなわち、比較装置10は、各分野ごとに異なる単語ベクトル空間を生成する。なお、このようなベクトル化については、w2v等の任意のベクトル化技術が採用可能である。
以下、図1を用いて、比較装置10が実行する比較処理の一例について説明する。例えば、比較装置10は、情報処理装置100から学習データを受付ける(ステップS1)。このような学習データには、各分野に属する文献等の文章が含まれる。このような場合、比較装置10は、単語を所定の次元数でベクトル化し、各分野ごとのベクトル空間を学習する(ステップS2)。例えば、比較装置10は、w2v等の各種ベクトル化技術を用いて、単語#1や単語#2等をベクトル#1やベクトル#2へと変換する。ここで、比較装置10は、分野と単語の組ごとにベクトルを生成する。例えば、比較装置10は、第1分野の文章に含まれている単語#1と、第2分野の文章に含まれている単語#2とをそれぞれ異なる単語として学習する。
ここで、比較装置10は、無限次元ベクトル同士の内積に基づいて、指定分野の類似度を判定するのであれば、任意の処理を実行して良い。例えば、比較装置10は、無限次元ベクトル同士のコサイン積の値そのものを、類似度として採用してもよい。また、比較装置10は、類似度を示す数値を比較結果として提供してもよい。また、比較装置10は、類似度が所定の閾値を超えるか否かに基づいて、指定分野が類似するか否かを判定し、判定結果を比較結果として出力してもよい。
以下、上記した比較処理を実現する比較装置10が有する機能構成の一例について説明する。図2は、実施形態に係る比較装置の構成例を示す図である。図2に示すように、比較装置10は、通信部20、記憶部30、および制御部40を有する。
次に、図5を用いて、比較装置10が実行する比較処理の流れの一例について説明する。図5は、実施形態に係る比較処理の流れの一例を説明するフローチャートである。例えば、比較装置10は、単語をベクトル化し(ステップS101)、各分野の対応関数を学習する(ステップS102)。続いて、比較装置10は、指定分野と固定単語の指定を受付けたか否かを判定し(ステップS103)、受付けていない場合は(ステップS103:No)、受付けるまで待機する。一方、比較装置10は、指定分野と固定単語の指定を受付けた場合は(ステップS103:Yes)、固定単語をベクトル化し(ステップS104)、カーネル関数を用いて、対応関数を無限次元ベクトル化する(ステップS105)。そして、比較装置10は、無限次元ベクトルの内積に基づいて、比較対象分野を比較し(ステップS106)、比較結果を提供して(ステップS107)、処理を終了する。
上記では、比較装置10による比較処理の一例について説明した。しかしながら、実施形態は、これに限定されるものではない。以下、比較装置10が実行する比較処理のバリエーションについて説明する。
上述した例では、比較装置10は、比較装置10内で比較処理を実行した。しかしながら、実施形態は、これに限定されるものではない。例えば、比較装置10は、指定分野や固定単語の指定を受付けるフロントエンドサーバと比較処理を行うバックエンドサーバが協調して動作することにより、実現されてもよい。例えば、比較装置10は、生成部41、変換部42、比較部43を有するフロントエンドサーバと、出力部44を有するバックエンドサーバにより実現されてもよい。また、比較装置10は、ベクトル空間データベース31を外部のストレージサーバに記憶させてもよい。
また、上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文章中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
また、上述してきた実施形態に係る比較装置10は、例えば図6に示すような構成のコンピュータ1000によって実現される。図6は、ハードウェア構成の一例を示す図である。コンピュータ1000は、出力装置1010、入力装置1020と接続され、演算装置1030、一次記憶装置1040、二次記憶装置1050、出力IF(Interface)1060、入力IF1070、ネットワークIF1080がバス1090により接続された形態を有する。
上述したように、比較装置10は、指定された分野毎に単語ベクトルによって作成された分散表現空間を共通の基底ベクトルで分野ごとに比較するために、分野ごとの基底ベクトルを分野共通基底ベクトルに変換する。そして、比較装置10は、共通基底ベクトルで生成されるベクトルの比較結果に基づいて、指定された分野同士を比較する。また、比較装置10は、共通基底ベクトルをカーネル関数によって作成する。
20 通信部
30 記憶部
31 ベクトル空間データベース
40 制御部
41 生成部
42 変換部
43 比較部
44 出力部
100、200 情報処理装置
Claims (5)
- 指定された分野毎に単語ベクトルによって作成された分散表現空間を共通の基底ベクトルで分野ごとに比較するために、分野ごとの基底ベクトルを分野共通基底ベクトルに変換する変換部と、
前記分野共通基底ベクトルで生成されるベクトルの比較結果に基づいて、指定された分野同士を比較する比較部と
を有することを特徴とする比較装置。 - 前記変換部は、前記分野共通基底ベクトルをカーネル関数によって作成する
ことを特徴とする請求項1に記載の比較装置。 - 前記変換部は、前記分散表現空間を再生核ヒルベルト空間に変換する
ことを特徴とする請求項2に記載の比較装置。 - 比較装置が実行する比較方法であって、
指定された分野毎に単語ベクトルによって作成された分散表現空間を共通の基底ベクトルで分野ごとに比較するために、分野ごとの基底ベクトルを分野共通基底ベクトルに変換する変換工程と、
前記分野共通基底ベクトルで生成されるベクトルの比較結果に基づいて、指定された分野同士を比較する比較工程と
を含むことを特徴とする比較方法。 - 指定された分野毎に単語ベクトルによって作成された分散表現空間を共通の基底ベクトルで分野ごとに比較するために、分野ごとの基底ベクトルを分野共通基底ベクトルに変換する変換手順と、
前記分野共通基底ベクトルで生成されるベクトルの比較結果に基づいて、指定された分野同士を比較する比較手順と
をコンピュータに実行させるための比較プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017204653A JP6942028B2 (ja) | 2017-10-23 | 2017-10-23 | 比較装置、比較方法および比較プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017204653A JP6942028B2 (ja) | 2017-10-23 | 2017-10-23 | 比較装置、比較方法および比較プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019079198A JP2019079198A (ja) | 2019-05-23 |
JP6942028B2 true JP6942028B2 (ja) | 2021-09-29 |
Family
ID=66627952
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017204653A Active JP6942028B2 (ja) | 2017-10-23 | 2017-10-23 | 比較装置、比較方法および比較プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6942028B2 (ja) |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4233836B2 (ja) * | 2002-10-16 | 2009-03-04 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 文書自動分類システム、不要語判定方法、文書自動分類方法、およびプログラム |
-
2017
- 2017-10-23 JP JP2017204653A patent/JP6942028B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2019079198A (ja) | 2019-05-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11521110B2 (en) | Learning apparatus, learning method, and non-transitory computer readable storage medium | |
JP6537340B2 (ja) | 要約生成装置、要約生成方法、及び要約生成プログラム | |
US11055338B2 (en) | Dynamic facet tree generation | |
CN111078842A (zh) | 查询结果的确定方法、装置、服务器及存储介质 | |
JP7032233B2 (ja) | 情報処理装置、情報処理方法、および情報処理プログラム | |
JP6321845B1 (ja) | 付与装置、付与方法および付与プログラム | |
US11061943B2 (en) | Constructing, evaluating, and improving a search string for retrieving images indicating item use | |
JP7354014B2 (ja) | 情報処理装置、情報処理方法及び情報処理プログラム | |
JP7058556B2 (ja) | 判定装置、判定方法、および判定プログラム | |
Rad et al. | Radial basis functions approach on optimal control problems: a numerical investigation | |
JP6775366B2 (ja) | 選択装置、および選択方法 | |
JP6942028B2 (ja) | 比較装置、比較方法および比較プログラム | |
JP6963988B2 (ja) | 提供装置、提供方法および提供プログラム | |
US11055345B2 (en) | Constructing, evaluating, and improving a search string for retrieving images indicating item use | |
JP6400037B2 (ja) | 判定装置、および判定方法 | |
JP6680655B2 (ja) | 学習装置および学習方法 | |
JP7071213B2 (ja) | 情報処理装置、情報処理方法、および情報処理プログラム | |
JP6680656B2 (ja) | 判定装置および判定方法 | |
JP6756648B2 (ja) | 生成装置、生成方法および生成プログラム | |
JP2019021210A (ja) | 特定装置および特定方法 | |
JP2018156332A (ja) | 生成装置、生成方法および生成プログラム | |
Tofighi et al. | Stability analysis of three-dimensional (3-D) systems using a wave advanced model (WAM) | |
US10664517B2 (en) | Constructing, evaluating, and improving a search string for retrieving images indicating item use | |
JP2020004054A (ja) | 出力装置、出力方法および出力プログラム | |
JP2020149664A (ja) | 処理装置、処理方法及び処理プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20191101 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20191108 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200309 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210217 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210302 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210430 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210831 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210907 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6942028 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |