JP2021007024A

JP2021007024A - 文書検索方法、文書検索システム、プログラム

Info

Publication number: JP2021007024A
Application number: JP2020158272A
Authority: JP
Inventors: 和樹東; Kazuki Higashi; 純平桃; Junpei Momo
Original assignee: Semiconductor Energy Laboratory Co Ltd
Current assignee: Semiconductor Energy Laboratory Co Ltd
Priority date: 2018-03-23
Filing date: 2020-09-23
Publication date: 2021-01-21
Anticipated expiration: 2039-03-13
Also published as: US11789953B2; JP2023134810A; US20200409963A1; JP6916941B2; KR20200134265A; CN112136126A; JP7321143B2; JPWO2019180546A1; JP2021072102A; DE112019001497T5; WO2019180546A1; US20210026861A1

Abstract

【課題】簡便な入力方法で、精度の高い文書検索、特に知的財産に係る文書の検索を実現する文書検索システム、文書検索方法、プログラム、及び非一時的コンピュータ可読記憶媒体を提供する。【解決手段】処理部を有する文書検索システムであって、処理部は、文章データに含まれるキーワードを抽出する機能と、複数の第１の参照用文章解析データに含まれる単語の中からキーワードの関連語を抽出する機能と、キーワード及び関連語のそれぞれに対して重みを付与する機能と、複数の第２の参照用文章解析データのそれぞれに対して重みに基づいて点数を付与する機能と、点数に基づいて複数の第２の参照用文章解析データを順位づけすることでランキングデータを生成する機能と、ランキングデータを出力する機能と、を有する。【選択図】図４

Description

本発明の一態様は、文書検索システム、文書検索方法、プログラム、及び非一時的コンピ
ュータ可読記憶媒体に関する。本発明の一態様は、知的財産に係る文書検索システム及び
文書検索方法に関する。

なお、本発明の一態様は、上記の技術分野に限定されない。本発明の一態様の技術分野と
しては、半導体装置、表示装置、発光装置、蓄電装置、記憶装置、電子機器、照明装置、
入力装置（例えば、タッチセンサなど）、入出力装置（例えば、タッチパネルなど）、そ
れらの駆動方法、またはそれらの製造方法を一例として挙げることができる。

出願前の発明に関し先行技術調査を行うことで、関連する知的財産権が存在するか否かを
調査することができる。先行技術調査を行うことで得られた国内外の特許文献及び論文な
どは、発明の新規性及び進歩性の確認、並びに、特許を出願するか否かの判断に、利用す
ることができる。また、特許文献の無効資料調査を行うことで、自身の所有する特許権が
無効化する恐れが無いか、或いは、他者の所有する特許権を無効化できるか、調査するこ
とができる。

例えば、特許文献を検索するシステムに、使用者がキーワードを入力することで、そのキ
ーワードを含む特許文献を出力することができる。

このようなシステムを用いて高い精度で先行技術調査を行うためには、適切なキーワード
で検索すること、さらに、出力された多くの特許文献から必要な特許文献を抽出すること
など、使用者に高い技量が求められる。

また、様々な用途において、人工知能の活用が検討されている。特に、人工ニューラルネ
ットワークなどを利用することで、従来のノイマン型コンピュータよりも高性能なコンピ
ュータが実現できると期待されており、近年、電子回路上で人工ニューラルネットワーク
を構築する種々の研究が進められている。

例えば、特許文献１には、チャネル形成領域に酸化物半導体を有するトランジスタを用い
た記憶装置によって、人工ニューラルネットワークを用いた計算に必要な重みデータを保
持する発明が開示されている。

米国特許公開第２０１６／０３４３４５２号公報

そこで、本発明の一態様は、高い精度で文書を検索できる文書検索システムを提供するこ
とを課題の一つとする。または、本発明の一態様は、高い精度で文書を検索できる文書検
索方法を提供することを課題の一つとする。または、本発明の一態様は、簡便な入力方法
で、精度の高い文書検索、特に知的財産に係る文書の検索を実現することを課題の一つと
する。

なお、これらの課題の記載は、他の課題の存在を妨げるものではない。本発明の一態様は
、必ずしも、これらの課題の全てを解決する必要はないものとする。明細書、図面、請求
項の記載から、これら以外の課題を抽出することが可能である。

本発明の一態様は、処理部を有する文書検索システムである。処理部は、文章データに含
まれるキーワードを抽出する機能と、複数の第１の参照用文章解析データに含まれる単語
の中から、キーワードの関連語を抽出する機能と、キーワード及び関連語のそれぞれに対
して、重みを付与する機能と、複数の第２の参照用文章解析データのそれぞれに対して、
重みに基づいて点数を付与する機能と、点数に基づいて複数の第２の参照用文章解析デー
タを順位づけすることで、ランキングデータを生成する機能と、ランキングデータを出力
する機能と、を有する。

本発明の一態様は、文章データに含まれるキーワードを抽出し、複数の第１の参照用文章
解析データに含まれる単語の中から、キーワードの関連語を抽出し、キーワード及び関連
語のそれぞれに対して、重みを付与し、複数の第２の参照用文章解析データのそれぞれに
対して、重みに基づいて点数を付与し、点数に基づいて複数の第２の参照用文章解析デー
タを順位づけすることで、ランキングデータを生成し、ランキングデータを出力する、文
書検索方法である。

本発明の一態様は、文章データに含まれるキーワードを抽出する第１のステップと、複数
の第１の参照用文章解析データに含まれる単語の中からキーワードの関連語を抽出する第
２のステップと、キーワード及び関連語のそれぞれに対して重みを付与する第３のステッ
プと、複数の第２の参照用文章解析データのそれぞれに対して、第２の参照用文章解析デ
ータに含まれる単語と一致したキーワードまたは関連語の重みに基づいて点数を付与する
第４のステップと、点数に基づいて複数の第２の参照用文章解析データを順位づけするこ
とでランキングデータを生成する第５のステップと、をプロセッサに実行させるプログラ
ムである。また、本発明の一態様は、上記プログラムが記憶された非一時的コンピュータ
可読記憶媒体である。

キーワードの重みは、キーワードの、複数の第１の参照用文章解析データまたは複数の第
２の参照用文章解析データにおける逆文書頻度に基づいた値であることが好ましい。関連
語の重みは、関連語の分散表現ベクトルとキーワードの分散表現ベクトルとの類似度また
は距離に基づいた値と、キーワードの重みと、の積であることが好ましい。

キーワードまたは関連語と一致する単語を有する第２の参照用文章解析データに対して、
点数を付与することが好ましい。

複数の第１の参照用文章解析データは、複数の第２の参照用文章解析データと同一であっ
てもよい。

関連語は、複数の第１の参照用文章解析データに含まれる単語の分散表現を機械学習する
ことで得られる分散表現ベクトルを用いて抽出することが好ましい。

関連語は、複数の第１の参照用文章解析データに含まれる単語の中から、単語の分散表現
ベクトルとキーワードの分散表現ベクトルとの類似度の高さまたは距離の近さに基づいて
抽出することが好ましい。単語の分散表現ベクトルは、ニューラルネットワークを用いて
生成されたベクトルであることが好ましい。

文章データに含まれるキーワードを抽出する機能として、文章データの形態素解析を行う
ことで解析データを生成する機能と、解析データからキーワードを抽出する機能と、を有
することが好ましい。キーワードは、解析データに含まれる単語の中から、複数の第１の
参照用文章解析データまたは複数の第２の参照用文章解析データにおける逆文書頻度の高
さに基づいて抽出することが好ましい。

重みは、ユーザが変更できると好ましい。

第１の参照用文章解析データは、第１の参照用文章データの形態素解析を行うことで生成
されたデータであり、第２の参照用文章解析データは、第２の参照用文章データの形態素
解析を行うことで生成されたデータであることが好ましい。

本発明の一態様の文書検索システムは、電子機器と、サーバと、を有することが好ましい
。電子機器は、第１の通信部を有する。サーバは、上記処理部と、第２の通信部と、を有
する。第１の通信部は、有線通信及び無線通信のうち一方または双方により、サーバに文
章データを供給する機能を有する。処理部は、ランキングデータを第２の通信部に供給す
る機能を有する。第２の通信部は、有線通信及び無線通信のうち一方または双方により、
電子機器にランキングデータを供給する機能を有する。

処理部は、チャネル形成領域に金属酸化物を有するトランジスタを有していてもよく、チ
ャネル形成領域にシリコンを有するトランジスタを有していてもよい。

本発明の一態様により、高い精度で文書を検索できる文書検索システムを提供できる。ま
たは、本発明の一態様により、高い精度で文書を検索できる文書検索方法を提供できる。
または、本発明の一態様により、簡単な入力方法で、精度の高い文書検索、特に知的財産
に係る文書の検索を実現できる。

なお、これらの効果の記載は、他の効果の存在を妨げるものではない。本発明の一態様は
、必ずしも、これらの効果の全てを有する必要はない。明細書、図面、請求項の記載から
、これら以外の効果を抽出することが可能である。

文書検索システムの一例を示すブロック図。検索用データの生成方法の一例を示すフロー図。（Ａ）〜（Ｃ）検索用データの生成方法の一例を示す図。文書検索方法の一例を示すフロー図。文書検索方法の一例を示すフロー図。（Ａ）〜（Ｃ）文書検索方法の一例を示す図。（Ａ）、（Ｂ）文書検索方法の一例を示す図。文書検索方法の一例を示すフロー図。文書検索方法の一例を示すフロー図。（Ａ）、（Ｂ）文書検索方法の一例を示す図。文書検索システムの一例を示すブロック図。（Ａ）、（Ｂ）ニューラルネットワークの構成例を示す図。半導体装置の構成例を示す図。メモリセルの構成例を示す図。オフセット回路の構成例を示す図。タイミングチャート。

実施の形態について、図面を用いて詳細に説明する。但し、本発明は以下の説明に限定さ
れず、本発明の趣旨及びその範囲から逸脱することなくその形態及び詳細を様々に変更し
得ることは当業者であれば容易に理解される。従って、本発明は以下に示す実施の形態の
記載内容に限定して解釈されるものではない。

なお、以下に説明する発明の構成において、同一部分または同様な機能を有する部分には
同一の符号を異なる図面間で共通して用い、その繰り返しの説明は省略する。また、同様
の機能を指す場合には、ハッチパターンを同じくし、特に符号を付さない場合がある。

また、図面において示す各構成の、位置、大きさ、範囲などは、理解の簡単のため、実際
の位置、大きさ、範囲などを表していない場合がある。このため、開示する発明は、必ず
しも、図面に開示された位置、大きさ、範囲などに限定されない。

なお、「膜」という言葉と、「層」という言葉とは、場合によっては、または、状況に応
じて、互いに入れ替えることが可能である。例えば、「導電層」という用語を、「導電膜
」という用語に変更することが可能である。または、例えば、「絶縁膜」という用語を、
「絶縁層」という用語に変更することが可能である。

（実施の形態１）
本実施の形態では、本発明の一態様の文書検索システム及び文書検索方法について図１〜
図１１を用いて説明する。

本発明の一態様は、処理部を有する文書検索システムである。当該処理部は、文章データ
に含まれるキーワードを抽出する機能と、複数の第１の参照用文章解析データに含まれる
単語の中からキーワードの関連語を抽出する機能と、キーワード及び関連語のそれぞれに
対して重みを付与する機能と、複数の第２の参照用文章解析データのそれぞれに対して重
みに基づいて点数を付与する機能と、点数に基づいて複数の第２の参照用文章解析データ
を順位づけすることでランキングデータを生成する機能と、ランキングデータを出力する
機能と、を有する。

本発明の一態様の文書検索システムでは、第１の参照用文章解析データを用いてキーワー
ドの関連語を抽出し、第２の参照用文章解析データを検索対象として、文章データに関連
または類似するデータを検索することができる。

第１の参照用文章解析データと第２の参照用文章解析データは同一であってもよい。この
とき、本発明の一態様の文書検索システムでは、検索対象である参照用文章解析データを
用いてキーワードの関連語を抽出することができる。また、第１の参照用文章解析データ
は、第２の参照用文章解析データの一部または全部を含んでいてもよい。

つまり、本発明の一態様の文書検索システムが有する処理部は、文章データに含まれるキ
ーワードを抽出する機能と、複数の参照用文章解析データに含まれる単語の中からキーワ
ードの関連語を抽出する機能と、キーワード及び関連語のそれぞれに対して重みを付与す
る機能と、複数の参照用文章解析データのそれぞれに対して重みに基づいて点数を付与す
る機能と、点数に基づいて複数の参照用文章解析データを順位づけすることでランキング
データを生成する機能と、ランキングデータを出力する機能と、を有していてもよい。

文書検索システムにおいて、検索に用いるキーワードを使用者が選定する場合、使用者は
、キーワード単体だけでなく、当該キーワードの同義語、類義語、及び表記の揺らぎなど
も考慮して、検索に用いるキーワードを選定することが求められる。そのため、キーワー
ド選定は使用者にとって負担となり、また、技量による差が生じやすい。また、使用者に
とって、文書検索システムにより出力された多くの文書から必要な文書を探し出すことも
負担となる。

ここで、本発明の一態様の文書検索システムは、文章データに含まれるキーワードと、当
該キーワードの関連語と、を抽出する機能を有する。そのため、本発明の一態様の文書検
索システムの使用者は、検索に用いるキーワードを自ら選定しなくてもよい。使用者は、
キーワードよりも分量の多い文章データ（テキストデータ）をそのまま文書検索システム
に入力することができる。また、使用者自身がキーワード及び関連語を選定したい場合も
、一から選定する必要はなく、文書検索システムが抽出したキーワード及び関連語を参照
して、キーワード及び関連語の追加、修正、削除などを行えばよい。したがって、文書検
索における使用者の負担を軽減し、また、使用者の技量による検索結果の差を生じにくく
できる。

特に、本発明の一態様の文書検索システムは、複数の参照用文章解析データに含まれる単
語の中からキーワードの関連語を抽出する機能を有する。既存の概念辞書に含まれる単語
の中からキーワードの関連語を抽出する場合、検索対象であるデータに含まれる独特な表
記を関連語として抽出することが困難なことがある。一方、本発明の一態様では、キーワ
ードの関連語を抽出するために用意されたデータ（第１の参照用文章解析データ）、また
は、検索対象であるデータ（第２の参照用文章解析データ）に含まれる単語の中からキー
ワードの関連語を抽出する。これにより、当該独特な表記も関連語として抽出することが
容易となり、検索漏れを低減でき、好ましい。

さらに、本発明の一態様の文書検索システムは、抽出したキーワード及び関連語のそれぞ
れに重みを付与する機能を有する。キーワード及び関連語のそれぞれが重みを有すること
で、キーワードまたは関連語がヒットした参照用文章解析データに、重みに基づいた点数
を付与することができる。そして、本発明の一態様の文書検索システムは、当該点数に基
づいて検索対象である参照用文章解析データを順位づけすることでランキングデータを生
成し、出力する機能を有する。関連性または類似性の高さで順位づけされて検索結果が出
力されるため、使用者は、検索結果から必要な文書を探しやすく作業効率が高まり、また
見落としが生じにくくなる。このように、本発明の一態様の文書検索システムは、簡便か
つ高精度に文書を検索することができる。

キーワードの重みは、キーワードの、複数の第１または第２の参照用文章解析データにお
ける逆文書頻度（ＩｎｖｅｒｓｅＤｏｃｕｍｅｎｔＦｒｅｑｕｅｎｃｙ、以下ＩＤＦ
と記す）に基づいた値であることが好ましい。ＩＤＦは、ある単語の文書への現れにくさ
を表す。多くの文書に出現する単語のＩＤＦは小さく、一部の文書にのみ出現する単語の
ＩＤＦは高くなる。したがって、ＩＤＦが高い単語は、第１または第２の参照用文章解析
データにおいて特徴的な単語であるといえる。

文章データからのキーワードの抽出自体も、文章データに含まれる単語の、複数の第１の
または第２の参照用文章解析データにおけるＩＤＦに基づいて行うことができる。例えば
、ＩＤＦがある数値以上の単語をキーワードとして抽出してもよく、ＩＤＦが高い順に任
意の個数の単語をキーワードとして抽出してもよい。

キーワードは、第１の参照用文章解析データ及び第２の参照用文章解析データのどちらの
ＩＤＦに基づいて抽出してもよい。検索対象である第２の参照用文章解析データにおける
ＩＤＦに基づいて、文章データからキーワードを抽出するほうが、検索対象の文書におけ
る特徴的な単語を抽出しやすいため、好ましい。ただし、検索対象となる文書が少ない場
合など、第１の参照用文章解析データにおけるＩＤＦに基づいて、文章データからキーワ
ードを抽出するほうが、文章データにおけるキーワードを抽出しやすいこともある。

または、使用者が入力した文章データを形態素解析することで得られた単語の品詞情報な
どに基づき、キーワードを抽出してもよい。例えば、日本語の文章を形態素解析する場合
、名詞を抽出することが好ましい。また、英語の文章を形態素解析する場合、形容詞、名
詞、及び動詞を抽出することが好ましい。

関連語としては、同義語、類義語、対義語、上位語、下位語などが挙げられる。関連語は
、複数の参照用文章解析データに含まれる単語の中から、当該単語の分散表現ベクトルと
キーワードの分散表現ベクトルとの類似度の高さまたは距離の近さに基づいて抽出するこ
とが好ましい。使用者が入力した文章データに含まれるキーワードについて、参照用文章
解析データに含まれる同義語、類義語などを関連語として抽出することができる。これに
より、検索精度を高めることができる。

関連語の重みは、関連語の分散表現ベクトルとキーワードの分散表現ベクトルとの類似度
または距離に基づいた値と、キーワードの重みと、の積であることが好ましい。関連語の
重みが、関連語とキーワードの関連度と、キーワード自体の重みと、の双方に基づいて設
定されることで、ランキングの精度をより高めることができる。

文書検索システムは、少なくとも一部の処理に人工知能（ＡＩ：Ａｒｔｉｆｉｃｉａｌ
Ｉｎｔｅｌｌｉｇｅｎｃｅ）を用いることが好ましい。

文書検索システムは、特に、人工ニューラルネットワーク（ＡＮＮ：Ａｒｔｉｆｉｃｉａ
ｌＮｅｕｒａｌＮｅｔｗｏｒｋ、以下、単にニューラルネットワークとも記す）を用
いることが好ましい。ニューラルネットワークは、回路（ハードウェア）またはプログラ
ム（ソフトウェア）により実現される。

例えば、単語の分散表現ベクトルを生成する際に、機械学習を用いることが好ましく、ニ
ューラルネットワークを用いることがさらに好ましい。具体的には、関連語は、複数の参
照用文章解析データに含まれる単語の分散表現を機械学習することで得られる分散表現ベ
クトルを用いて抽出することが好ましい。これにより、関連語の抽出及び関連語の重みの
精度を高めることができる。

本明細書等において、ニューラルネットワークとは、生物の神経回路網を模し、学習によ
ってニューロンどうしの結合強度を決定し、問題解決能力を持たせるモデル全般を指す。
ニューラルネットワークは、入力層、中間層（隠れ層）、及び出力層を有する。

本明細書等において、ニューラルネットワークについて述べる際に、既にある情報からニ
ューロンとニューロンの結合強度（重み係数ともいう）を決定することを「学習」と呼ぶ
場合がある。

本明細書等において、学習によって得られた結合強度を用いてニューラルネットワークを
構成し、そこから新たな結論を導くことを「推論」と呼ぶ場合がある。

＜１．文書検索システムの構成例１＞
本実施の形態では、文書検索システムの一例として、知的財産の検索に用いることができ
る文書検索システムについて説明する。なお、本発明の一態様の文書検索システムは、知
的財産の検索用途に限られず、知的財産以外の検索に使用することもできる。

図１に、文書検索システム１００のブロック図を示す。なお、本明細書に添付した図面で
は、構成要素を機能ごとに分類し、互いに独立したブロックとしてブロック図を示してい
るが、実際の構成要素は機能ごとに完全に切り分けることが難しく、一つの構成要素が複
数の機能に係わることもあり得る。また、一つの機能が複数の構成要素に係わることもあ
り得、例えば、処理部１０３で行われる２つの処理は、互いに異なるサーバによって実行
されることがある。

文書検索システム１００は、少なくとも、処理部１０３を有する。図１に示す文書検索シ
ステム１００は、さらに、入力部１０１、伝送路１０２、記憶部１０５、データベース１
０７、及び出力部１０９を有する。

［入力部１０１］
入力部１０１には、文書検索システム１００の外部からデータが供給される。入力部１０
１に供給されたデータは、伝送路１０２を介して、処理部１０３、記憶部１０５、または
データベース１０７に供給される。

［伝送路１０２］
伝送路１０２は、データを伝達する機能を有する。入力部１０１、処理部１０３、記憶部
１０５、データベース１０７、及び出力部１０９の間のデータの送受信は、伝送路１０２
を介して行うことができる。

［処理部１０３］
処理部１０３は、入力部１０１、記憶部１０５、データベース１０７などから供給された
データを用いて、演算、推論などを行う機能を有する。処理部１０３は、演算結果、推論
結果などを、記憶部１０５、データベース１０７、出力部１０９などに供給することがで
きる。

処理部１０３には、チャネル形成領域に金属酸化物を有するトランジスタを用いることが
好ましい。当該トランジスタはオフ電流が極めて小さいため、当該トランジスタを記憶素
子として機能する容量素子に流入した電荷（データ）を保持するためのスイッチとして用
いることで、データの保持期間を長期にわたり確保することができる。この特性を、処理
部１０３が有するレジスタ及びキャッシュメモリのうち少なくとも一方に用いることで、
必要なときだけ処理部１０３を動作させ、他の場合には直前の処理の情報を当該記憶素子
に待避させることにより処理部１０３をオフにすることができる。すなわち、ノーマリー
オフコンピューティングが可能となり、文書検索システムの低消費電力化を図ることがで
きる。

なお、本明細書等において、チャネル形成領域に酸化物半導体または金属酸化物を用いた
トランジスタをＯｘｉｄｅＳｅｍｉｃｏｎｄｕｃｔｏｒトランジスタ、あるいはＯＳト
ランジスタと呼ぶ。ＯＳトランジスタのチャネル形成領域は、金属酸化物を有することが
好ましい。

本明細書等において、金属酸化物（ｍｅｔａｌｏｘｉｄｅ）とは、広い意味での金属の
酸化物である。金属酸化物は、酸化物絶縁体、酸化物導電体（透明酸化物導電体を含む）
、酸化物半導体（ＯｘｉｄｅＳｅｍｉｃｏｎｄｕｃｔｏｒまたは単にＯＳともいう）な
どに分類される。例えば、トランジスタの半導体層に金属酸化物を用いた場合、当該金属
酸化物を酸化物半導体と呼称する場合がある。つまり、金属酸化物が増幅作用、整流作用
、及びスイッチング作用の少なくとも１つを有する場合、当該金属酸化物を、金属酸化物
半導体（ｍｅｔａｌｏｘｉｄｅｓｅｍｉｃｏｎｄｕｃｔｏｒ）、略してＯＳと呼ぶこ
とができる。

チャネル形成領域が有する金属酸化物はインジウム（Ｉｎ）を含むことが好ましい。チャ
ネル形成領域が有する金属酸化物がインジウムを含む金属酸化物の場合、ＯＳトランジス
タのキャリア移動度（電子移動度）が高くなる。また、チャネル形成領域が有する金属酸
化物は、元素Ｍを含む酸化物半導体であると好ましい。元素Ｍは、好ましくは、アルミニ
ウム（Ａｌ）、ガリウム（Ｇａ）またはスズ（Ｓｎ）などとする。そのほかの元素Ｍに適
用可能な元素としては、ホウ素（Ｂ）、シリコン（Ｓｉ）、チタン（Ｔｉ）、鉄（Ｆｅ）
、ニッケル（Ｎｉ）、ゲルマニウム（Ｇｅ）、イットリウム（Ｙ）、ジルコニウム（Ｚｒ
）、モリブデン（Ｍｏ）、ランタン（Ｌａ）、セリウム（Ｃｅ）、ネオジム（Ｎｄ）、ハ
フニウム（Ｈｆ）、タンタル（Ｔａ）、タングステン（Ｗ）などがある。ただし、元素Ｍ
として、前述の元素を複数組み合わせても構わない場合がある。元素Ｍは、例えば、酸素
との結合エネルギーが高い元素である。例えば、酸素との結合エネルギーがインジウムよ
りも高い元素である。また、チャネル形成領域が有する金属酸化物は、亜鉛（Ｚｎ）を含
む金属酸化物であると好ましい。亜鉛を含む金属酸化物は結晶化しやすくなる場合がある
。

チャネル形成領域が有する金属酸化物は、インジウムを含む金属酸化物に限定されない。
半導体層は、例えば、亜鉛スズ酸化物、ガリウムスズ酸化物などの、インジウムを含まず
、亜鉛を含む金属酸化物、ガリウムを含む金属酸化物、スズを含む金属酸化物などであっ
ても構わない。

また、処理部１０３には、チャネル形成領域にシリコンを含むトランジスタを用いてもよ
い。

また、処理部１０３には、チャネル形成領域に酸化物半導体を含むトランジスタと、チャ
ネル形成領域にシリコンを含むトランジスタと、を組み合わせて用いることが好ましい。

処理部１０３は、例えば、演算回路または中央演算装置（ＣＰＵ：ＣｅｎｔｒａｌＰｒ
ｏｃｅｓｓｉｎｇＵｎｉｔ）等を有する。

処理部１０３は、ＤＳＰ（ＤｉｇｉｔａｌＳｉｇｎａｌＰｒｏｃｅｓｓｏｒ）、ＧＰ
Ｕ（ＧｒａｐｈｉｃｓＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）等のマイクロプロセッサを有
していてもよい。マイクロプロセッサは、ＦＰＧＡ（ＦｉｅｌｄＰｒｏｇｒａｍｍａｂ
ｌｅＧａｔｅＡｒｒａｙ）、ＦＰＡＡ（ＦｉｅｌｄＰｒｏｇｒａｍｍａｂｌｅＡ
ｎａｌｏｇＡｒｒａｙ）等のＰＬＤ（ＰｒｏｇｒａｍｍａｂｌｅＬｏｇｉｃＤｅｖ
ｉｃｅ）によって実現された構成であってもよい。処理部１０３は、プロセッサにより種
々のプログラムからの命令を解釈し実行することで、各種のデータ処理及びプログラム制
御を行うことができる。プロセッサにより実行しうるプログラムは、プロセッサが有する
メモリ領域及び記憶部１０５のうち少なくとも一方に格納される。

処理部１０３はメインメモリを有していてもよい。メインメモリは、ＲＡＭ（Ｒａｎｄｏ
ｍＡｃｃｅｓｓＭｅｍｏｒｙ）等の揮発性メモリ、及びＲＯＭ（ＲｅａｄＯｎｌｙ
Ｍｅｍｏｒｙ）等の不揮発性メモリのうち少なくとも一方を有する。

ＲＡＭとしては、例えばＤＲＡＭ（ＤｙｎａｍｉｃＲａｎｄｏｍＡｃｃｅｓｓＭｅ
ｍｏｒｙ）、ＳＲＡＭ（ＳｔａｔｉｃＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）等
が用いられ、処理部１０３の作業空間として仮想的にメモリ空間が割り当てられ利用され
る。記憶部１０５に格納されたオペレーティングシステム、アプリケーションプログラム
、プログラムモジュール、プログラムデータ、及びルックアップテーブル等は、実行のた
めにＲＡＭにロードされる。ＲＡＭにロードされたこれらのデータ、プログラム、及びプ
ログラムモジュールは、それぞれ、処理部１０３に直接アクセスされ、操作される。

ＲＯＭには、書き換えを必要としない、ＢＩＯＳ（ＢａｓｉｃＩｎｐｕｔ／Ｏｕｔｐｕ
ｔＳｙｓｔｅｍ）及びファームウェア等を格納することができる。ＲＯＭとしては、マ
スクＲＯＭ、ＯＴＰＲＯＭ（ＯｎｅＴｉｍｅＰｒｏｇｒａｍｍａｂｌｅＲｅａｄ
ＯｎｌｙＭｅｍｏｒｙ）、ＥＰＲＯＭ（ＥｒａｓａｂｌｅＰｒｏｇｒａｍｍａｂｌｅ
ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）等が挙げられる。ＥＰＲＯＭとしては、紫外線照
射により記憶データの消去を可能とするＵＶ−ＥＰＲＯＭ（Ｕｌｔｒａ−Ｖｉｏｌｅｔ
ＥｒａｓａｂｌｅＰｒｏｇｒａｍｍａｂｌｅＲｅａｄＯｎｌｙＭｅｍｏｒｙ）、
ＥＥＰＲＯＭ（ＥｌｅｃｔｒｉｃａｌｌｙＥｒａｓａｂｌｅＰｒｏｇｒａｍｍａｂｌ
ｅＲｅａｄＯｎｌｙＭｅｍｏｒｙ）、フラッシュメモリ等が挙げられる。

［記憶部１０５］
記憶部１０５は、処理部１０３が実行するプログラムを記憶する機能を有する。また、記
憶部１０５は、処理部１０３が生成した演算結果及び推論結果、並びに、入力部１０１に
入力されたデータなどを記憶する機能を有していてもよい。

記憶部１０５は、揮発性メモリ及び不揮発性メモリのうち少なくとも一方を有する。記憶
部１０５は、例えば、ＤＲＡＭ、ＳＲＡＭなどの揮発性メモリを有していてもよい。記憶
部１０５は、例えば、ＲｅＲＡＭ（ＲｅｓｉｓｔｉｖｅＲａｎｄｏｍＡｃｃｅｓｓ
Ｍｅｍｏｒｙ、抵抗変化型メモリともいう）、ＰＲＡＭ（ＰｈａｓｅｃｈａｎｇｅＲ
ａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）、ＦｅＲＡＭ（Ｆｅｒｒｏｅｌｅｃｔｒｉｃ
ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）、ＭＲＡＭ（Ｍａｇｎｅｔｏｒｅｓｉｓ
ｔｉｖｅＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ、磁気抵抗型メモリともいう）、
またはフラッシュメモリなどの不揮発性メモリを有していてもよい。また、記憶部１０５
は、ハードディスクドライブ（ＨａｒｄＤｉｓｃＤｒｉｖｅ：ＨＤＤ）及びソリッド
ステートドライブ（ＳｏｌｉｄＳｔａｔｅＤｒｉｖｅ：ＳＳＤ）等の記録メディアド
ライブを有していてもよい。

［データベース１０７］
データベース１０７は、少なくとも、検索対象となる参照用文章解析データ、ＩＤＦデー
タ、及びベクトルデータを記憶する機能を有する。また、データベース１０７は、処理部
１０３が生成した演算結果及び推論結果、並びに、入力部１０１に入力されたデータなど
を記憶する機能を有していてもよい。なお、記憶部１０５及びデータベース１０７は互い
に分離されていなくてもよい。例えば、文書検索システムは、記憶部１０５及びデータベ
ース１０７の双方の機能を有する記憶ユニットを有していてもよい。

［出力部１０９］
出力部１０９は、文書検索システム１００の外部にデータを供給する機能を有する。例え
ば、処理部１０３における演算結果または推論結果などを外部に供給することができる。

＜２．文書検索方法＞
まず、図２及び図３を用いて、文書検索システム１００を用いて検索を行うために事前に
行う処理について説明する。図２にフローチャートを示し、図３に、図２に示す各ステッ
プの模式図を示す。なお、図３に示す各データの図示は一例であり、これに限定されない
。

また、以下では、キーワードの関連語を抽出するために用いる参照用文章データと、検索
対象となる参照用文章用データが同一である（参照用文章データＴＤ_ｒｅｆと記す）場合
を例に挙げて説明する。前述の通り、これら２つの参照用文章用データが異なっていても
よい。例えば、第１の参照用文章データを用いてベクトルデータＶＤ（後述する）を生成
し、第２の参照用文章データを検索対象としてもよい。このとき、後述するＩＤＦデータ
ＩＤは、第１の参照用文章データを用いて生成してもよく、第２の参照用文章データを用
いて生成してもよい。

［ステップＳ１］
まず、入力部１０１に、参照用文章データＴＤ_ｒｅｆを複数入力する（図２及び図３（Ａ
））。

本実施の形態の文書検索方法では、事前に準備された複数の文書を検索の対象として、入
力された文書に関連または類似する文書を検索することができる。参照用文章データＴＤ
_ｒｅｆは、文書検索システム１００において検索の対象となる文書の文章データである。
参照用文章データＴＤ_ｒｅｆとして用いるデータは、文書検索システム１００の用途に応
じて適宜選択できる。

参照用文章データＴＤ_ｒｅｆは、文書検索システム１００の外部から入力部１０１に入力
される。そして、参照用文章データＴＤ_ｒｅｆは、入力部１０１から、伝送路１０２を介
して、処理部１０３に供給される。または、参照用文章データＴＤ_ｒｅｆは、入力部１０
１から、伝送路１０２を介して、記憶部１０５またはデータベース１０７に保存され、記
憶部１０５またはデータベース１０７から、伝送路１０２を介して、処理部１０３に供給
されてもよい。

図３（Ａ）では、ｎ個（ｎは、２以上の整数）の参照用文章データＴＤ_ｒｅｆを図示し、
それぞれ、データＴＤ_ｒｅｆ（ｘ）（ｘは、１以上ｎ以下の整数）と記す。

本実施の形態では、検索の対象が知的財産に係る文書である例を示す。参照用文章データ
ＴＤ_ｒｅｆは、知的財産に係る文書の文章データである。

なお、上述の通り、ステップＳ１で入力する参照用文章データが検索の対象となるデータ
と異なる場合もある。ステップＳ１で入力する参照用文章データは、知的財産に係る文書
の文章データであることが好ましいが、これに限られない。また、ステップＳ１で入力す
る参照用文章データの一部が、検索の対象となるデータである場合もある。例えば、ステ
ップＳ１で入力する参照用文章データが特許文献及び論文の文章データであり、検索の対
象は、特許文献の文章データのみであってもよい。

ここで、知的財産に係る文書としては、具体的には、特許文献（公開特許公報、特許公報
など）、実用新案公報、意匠公報、及び論文などの刊行物が挙げられる。国内で発行され
た刊行物に限られず、世界各国で発行された刊行物を、知的財産に係る文書として用いる
ことができる。

特許文献に含まれる明細書、特許請求の範囲、及び要約書は、それぞれ、一部または全部
を参照用文章データＴＤ_ｒｅｆとして用いることができる。例えば、特定の発明を実施す
るための形態、実施例、または請求項を、参照用文章データＴＤ_ｒｅｆとして用いてもよ
い。同様に、論文など他の刊行物に含まれる文章についても、一部または全部を参照用文
章データＴＤ_ｒｅｆとして用いることができる。

知的財産に係る文書は、刊行物に限られない。例えば、文書検索システムの使用者または
使用団体が独自に有する文書ファイルも参照用文章データＴＤ_ｒｅｆとして用いることが
できる。

さらに、知的財産に係る文書としては、発明、考案、もしくは意匠、または工業製品を説
明する文章などが挙げられる。

参照用文章データＴＤ_ｒｅｆは、例えば、特定の出願人の特許文献、または特定の技術分
野の特許文献を有することができる。

参照用文章データＴＤ_ｒｅｆは、知的財産自体の説明（例えば、明細書など）だけでなく
、当該知的財産に関係する様々な情報（例えば、書誌情報など）を有することができる。
当該情報としては、例えば、特許の出願人、技術分野、出願番号、公開番号、ステータス
（係属中、登録済、取り下げ済など）などが挙げられる。

参照用文章データＴＤ_ｒｅｆは、知的財産に係る日付情報を有することが好ましい。日付
情報としては、例えば、知的財産が特許文献であれば、出願日、公開日、登録日などが挙
げられ、知的財産が工業製品の技術情報であれば、発売日などが挙げられる。

このように、参照用文章データＴＤ_ｒｅｆが知的財産に関係する様々な情報を有すること
で、文書検索システムを用いて、様々な検索範囲を選択することができる。

例えば、本実施の形態の文書検索システムを用いて、出願前の発明と関連または類似する
特許文献、論文、または工業製品を検索することができる。これにより、出願前の発明に
係る先行技術調査をすることができる。関連する先行技術を把握し再検討することで、発
明を強化し、他社が回避困難な強い特許になる発明とすることができる。

また、例えば、本実施の形態の文書検索システムを用いて、発売前の工業製品と関連また
は類似する特許文献、論文、または工業製品を検索することができる。参照用文章データ
ＴＤ_ｒｅｆが自社の特許文献を有する場合、発売前の工業製品に係る技術が社内で十分に
特許出願できているかを確認することができる。または、参照用文章データＴＤ_ｒｅｆが
他社の知的財産の情報を有する場合、発売前の工業製品が他社の知的財産権を侵害してい
ないかを確認することができる。関連する先行技術を把握し、発売前の工業製品に係る技
術を再検討することで、新たな発明を発掘し、自社の事業に貢献する強い特許になる発明
とすることができる。なお、発売前の工業製品に限らず、発売後の工業製品について、検
索してもよい。

また、例えば、本実施の形態の文書検索システムを用いて、特定の特許と関連または類似
する特許文献、論文、または工業製品を検索することができる。特に、当該特許の出願日
を基準に調べることで、当該特許が無効理由を含まないか、簡便かつ高い精度で調査する
ことができる。

［ステップＳ２］
次に、複数の参照用文章データＴＤ_ｒｅｆそれぞれの形態素解析を行い、参照用文章解析
データＡＤ_ｒｅｆを複数生成する（図２及び図３（Ａ））。

処理部１０３は、ｎ個の参照用文章データＴＤ_ｒｅｆそれぞれの形態素解析を行い、ｎ個
の参照用文章解析データＡＤ_ｒｅｆ（それぞれ、参照用文章解析データＡＤ_ｒｅｆ（ｘ）
（ｘは、１以上ｎ以下の整数）と記す）を生成する。例えば、参照用文章データＴＤ_ｒｅ
_ｆ（ｎ）の形態素解析を行うことで、参照用文章解析データＡＤ_ｒｅｆ（ｎ）を生成する
。

形態素解析では、自然言語で書かれた文章を、形態素（言語として意味を持つ最小単位）
に分割し、形態素の品詞などを判別することができる。これにより、例えば、参照用文章
データＴＤ_ｒｅｆから名詞のみを抽出することができる。

図３（Ａ）では、入力する参照用文章データＴＤ_ｒｅｆ（１）は長い文を含み、出力され
た参照用文章解析データＡＤ_ｒｅｆ（１）では、当該文が複数の単語に分けられている。

図３（Ａ）では、生成した参照用文章解析データＡＤ_ｒｅｆを処理部１０３の外部に出力
する例を示す。例えば、処理部１０３は、データベース１０７に複数の参照用文章解析デ
ータＡＤ_ｒｅｆを供給することができる。なお、処理部１０３は、複数の参照用文章解析
データＡＤ_ｒｅｆを１つのデータにまとめたコーパスを生成し、出力してもよい。

なお、日本語の文章だけでなく、様々な言語（例えば、英語、中国語、韓国語など）の文
章の解析を行うことができる。文章の解析方法は、言語に応じて様々な方法を適用できる
。

［ステップＳ３］
ステップＳ２の後、複数の参照用文章解析データＡＤ_ｒｅｆに含まれる単語のＩＤＦを計
算し、ＩＤＦデータＩＤを生成する（図２及び図３（Ｂ））。ここで、ＩＤＦは、規格化
することが好ましい。

参照用文章解析データＡＤ_ｒｅｆは、データベース１０７から、伝送路１０２を介して、
処理部１０３に供給される。

処理部１０３は、ｎ個の参照用文章解析データＡＤ_ｒｅｆに含まれる単語のＩＤＦを計算
し規格化することで、ＩＤＦデータＩＤを生成する。

図３（Ｂ）に示すように、ＩＤＦデータＩＤは、単語（Ｗｏｒｄ）と規格化されたＩＤＦ
を含む。

ある単語ｔのＩＤＦ（ｔ）は、式（１）のｉｄｆ（ｔ）を規格化することで求められる。
規格化の方法は特に限定されず、例えば、式（２）により、ｉｄｆ（ｔ）を規格化できる
。式（１）において、Ｎは全文書数（参照用文章解析データＡＤ_ｒｅｆの数、上記ｎと等
しい）であり、ｄｆ（ｔ）はある単語ｔが出現する文書数（参照用文章解析データＡＤ_ｒ
_ｅｆの数）である。式（２）において、ｉｄｆ_ＭＡＸは、参照用文章解析データＡＤ_ｒｅ
_ｆに含まれる単語のｉｄｆ（ｔ）の最大値であり、ｉｄｆ_ＭＩＮは、参照用文章解析デー
タＡＤ_ｒｅｆに含まれる単語のｉｄｆ（ｔ）の最小値である。

例えば、ＷｏｒｄＡの規格化されたＩＤＦは０．８６８であり、ＷｏｒｄＢの規格化
されたＩＤＦは０．１１５であり、ＷｏｒｄＣの規格化されたＩＤＦは０．６４２であ
ることから、ＷｏｒｄＡは、ＷｏｒｄＢ及びＷｏｒｄＣに比べて、ＩＤＦが高く、
参照用文章解析データＡＤ_ｒｅｆに現れにくい特徴的な単語であるといえる。なお、図３
（Ｂ）では、名前順に単語を並べる例を示すが、これに限られず、ＩＤＦの高い順などに
単語を並べてもよい。

図３（Ｂ）では、生成したＩＤＦデータＩＤを処理部１０３の外部に出力する例を示す。
例えば、処理部１０３は、伝送路１０２を介して、データベース１０７にＩＤＦデータＩ
Ｄを供給することができる。

［ステップＳ４］
ステップＳ２の後、複数の参照用文章解析データＡＤ_ｒｅｆに含まれる単語の分散表現ベ
クトルを生成し、ベクトルデータＶＤを生成する（図２及び図３（Ｃ））。

なお、ステップＳ３とステップＳ４はどちらを先に行ってもよく、並行して行ってもよい
。

処理部１０３は、ｎ個の参照用文章解析データＡＤ_ｒｅｆに含まれる単語の分散表現ベク
トルを生成し、ベクトルデータＶＤを生成する。

単語の分散表現は、単語埋め込みともいわれ、単語の分散表現ベクトルは、単語を、各特
徴要素（次元）に対して、定量化した連続値で表現したベクトルである。意味の近い単語
どうしは、ベクトルも近くなる。

図３（Ｃ）に示すように、処理部１０３は、ニューラルネットワークＮＮを用いて、単語
の分散表現ベクトルを生成することが好ましい。

ここで、ニューラルネットワークＮＮを用いて、単語の分散表現ベクトルを生成する方法
の一例を説明する。ニューラルネットワークＮＮの学習は教師あり学習で行う。具体的に
は、ある単語を入力層に与え、当該単語の周辺語を出力層に与えて、ニューラルネットワ
ークＮＮに、ある単語に対するその周辺語の確率を学習させる。中間層（隠れ層）は１０
次元以上１０００次元以下の比較的低次元のベクトルを有することが好ましい。学習後の
当該ベクトルが、単語の分散表現ベクトルである。

単語の分散表現は、例えば、オープンソース化されているアルゴリズムのＷｏｒｄ２ｖｅ
ｃを用いて行うことができる。Ｗｏｒｄ２ｖｅｃは、同じ文脈で利用される単語は、同じ
意味を持つという仮説に基づき、単語の特徴及び意味構造を含めて単語をベクトル化する
。

単語のベクトル化において、単語の分散表現ベクトルを生成することで、ベクトル間の演
算で単語間の類似度や距離などを計算することができる。２つのベクトルの類似度が高い
とき、当該２つのベクトルは関係性が高いといえる。また、２つのベクトルの距離が近い
とき、当該２つのベクトルは関係性が高いといえる。

また、ｏｎｅ−ｈｏｔ表現が１単語に１次元を割り当てるのに対し、分散表現では単語を
低次元の実数値ベクトルで表すことができるため、語彙数が増えても少ない次元数で表現
することができる。したがって、コーパスに含まれる単語数が多くても計算量が増加しに
くく、膨大なデータを短時間で処理することができる。

図３（Ｃ）に示すように、ベクトルデータＶＤは、単語（Ｗｏｒｄ）とベクトル（Ｖｅｃ
ｔｏｒ）を含む。例えば、ＷｏｒｄＡのＶｅｃｔｏｒは（０．１２，０．９０，０．３
２，・・・）であり、ＷｏｒｄＢのＶｅｃｔｏｒは（０．８８，０．１０，０．２９，
・・・）であり、ＷｏｒｄＣのＶｅｃｔｏｒは（０．２３，０．５６，０．４７，・・
・）である。

図３（Ｃ）では、生成したベクトルデータＶＤを処理部１０３の外部に出力する例を示す
。例えば、処理部１０３は、データベース１０７にベクトルデータＶＤを供給することが
できる。

以上のステップを事前に行い、参照用文章解析データＡＤ_ｒｅｆ、ＩＤＦデータＩＤ、及
びベクトルデータＶＤを生成しておくことで、文書検索システム１００を用いて、文書を
検索することができる。

なお、本実施の形態では、文書検索システム１００を用いて、参照用文章解析データＡＤ
_ｒｅｆ、ＩＤＦデータＩＤ、及びベクトルデータＶＤを生成する例を示したが、文書検索
システム１００の外部で、参照用文章解析データＡＤ_ｒｅｆ、ＩＤＦデータＩＤ、及びベ
クトルデータＶＤのうち少なくとも１つを生成してもよい。この場合、外部で生成したデ
ータを、文書検索システム１００の入力部１０１に入力し、データベース１０７に保存す
ることで、文書検索システム１００を用いた検索が可能となる。

次に、文書検索システム１００を用いた検索方法について説明する。図４、図５、図８、
及び図９にフローチャートを示し、図６、図７（Ａ）、及び図１０に、フローチャートに
示す各ステップの模式図を示す。なお、図６、図７（Ａ）、及び図１０に示す各データの
図示は一例であり、これに限定されない。

［ステップＳ１１］
まず、入力部１０１に、文章データＴＤを入力する（図４、図５、及び図６（Ａ））。

本実施の形態の文書検索方法では、参照用文章データＴＤ_ｒｅｆの中から、文章データＴ
Ｄに関連または類似する文章データを検索することができる。

文章データＴＤは、文書検索システム１００の外部から入力部１０１に入力される。そし
て、文章データＴＤは、入力部１０１から、伝送路１０２を介して、処理部１０３に供給
される。または、文章データＴＤは、伝送路１０２を介して、記憶部１０５またはデータ
ベース１０７に保存され、記憶部１０５またはデータベース１０７から、伝送路１０２を
介して、処理部１０３に供給されてもよい。

本実施の形態では、検索の対象が知的財産に係る文書である例を示す。文章データＴＤは
、知的財産に係る文書のデータである。知的財産に係る文書の例は上述の通りである。

文章データＴＤは、例えば、出願前の発明、考案もしくは意匠、発売前の工業製品、技術
情報、または技術的思想を説明する文章などを有することができる。

特に、文章データＴＤとして、特許請求の範囲、要約書、または発明の概要を説明する文
章などを好適に用いることができる。このような文章量が比較的少ない（明細書全文に比
べて文章量が少ない）文章データＴＤは、文章データＴＤに含まれる特徴的なキーワード
を抽出しやすいため好ましい。本実施の形態の文書検索システムは、特徴的なキーワード
の関連語を抽出することができるため、文章データＴＤの語彙数が少なくても、高精度の
検索を行うことができる。

［ステップＳ１２］
次に、文章データＴＤの形態素解析を行い、文章解析データＡＤを生成する（図４、図５
、及び図６（Ａ））。

処理部１０３は、文章データＴＤの形態素解析を行い、文章解析データＡＤを生成する。

図６（Ａ）では、入力する文章データＴＤは長い文を含み、出力された文章解析データＡ
Ｄでは、当該文が複数の単語に分けられている。

図６（Ａ）では、生成した文章解析データＡＤを処理部１０３の外部に出力する例を示す
。例えば、処理部１０３は、記憶部１０５またはデータベース１０７に、文章解析データ
ＡＤを供給することができる。

［ステップＳ１３、Ｓ３３］
次に、文章解析データＡＤをＩＤＦデータＩＤと照合することで、キーワードデータＫＤ
を生成する（図４、図５、及び図６（Ｂ））。

文章解析データＡＤは、記憶部１０５またはデータベース１０７から、伝送路１０２を介
して、処理部１０３に供給される。ＩＤＦデータＩＤは、データベース１０７から、伝送
路１０２を介して、処理部１０３に供給される。

処理部１０３は、文章解析データＡＤとＩＤＦデータＩＤとを照合し、文章解析データＡ
Ｄに含まれる単語をＩＤＦの高い順に並べることで、キーワードデータＫＤを生成する。

キーワードデータＫＤは、キーワードＫＷとそのＩＤＦとを含む。ここでは、規格化され
たＩＤＦを用いる例を示す。

キーワードＫＷは、文章解析データＡＤに含まれる特徴的な単語であるといえる。キーワ
ードＫＷは、例えば、文章解析データＡＤ及びＩＤＦデータＩＤの双方に含まれている単
語全てであってもよく、ＩＤＦが所定の値以上の単語であってもよく、ＩＤＦが高い上位
の所定の個数の単語であってもよい。文章データＴＤの文章量に応じて、キーワードＫＷ
の抽出基準を設定することが好ましい。例えば、キーワードＫＷの数は、２個以上１００
個以下が好ましく、５個以上３０個以下がより好ましい。

ここで、キーワードＫＷの規格化されたＩＤＦは、後に参照用文章解析データＡＤ_ｒｅｆ
に点数を付与する際に用いる、キーワードＫＷの重みに相当する。

図６（Ｂ）では、ＷｏｒｄＤの重みが０．８７３、ＷｏｒｄＡの重みが０．８６８、
ＷｏｒｄＥの重みが０．８６７である例を示している。

図６（Ｂ）では、キーワードデータＫＤを処理部１０３の外部に出力する例を示す。例え
ば、処理部１０３は、伝送路１０２を介して、記憶部１０５またはデータベース１０７に
、キーワードデータＫＤを供給することができる。

［ステップＳ１４、Ｓ３４］
次に、文章解析データＡＤまたはキーワードデータＫＤと、ベクトルデータＶＤと、を用
いて、関連語データＲＤを生成する（図４、図５、及び図６（Ｃ））。

文章解析データＡＤまたはキーワードデータＫＤは、記憶部１０５またはデータベース１
０７から、伝送路１０２を介して、処理部１０３に供給される。ベクトルデータＶＤは、
データベース１０７から、伝送路１０２を介して、処理部１０３に供給される。

ステップＳ１４の場合、処理部１０３は、キーワードＫＷの分散表現ベクトルと、参照用
文章解析データＡＤ_ｒｅｆに含まれる単語の分散表現ベクトルと、の類似度の高さまたは
距離の近さに基づいて、キーワードＫＷの関連語ＲＷを抽出する。そして、関連語ＲＷを
類似度の高い順または距離の近い順に並べることで、関連語データＲＤを生成する。具体
的には、１つのキーワードＫＷに対して、関連語ＲＷを１個以上１０個以下抽出すること
が好ましく、２個以上５個以下抽出することがより好ましい。関連語ＲＷは、例えば、類
似度が所定の値以上の単語であってもよく、距離が所定の値以下の単語であってもよく、
類似度が高い上位の所定の個数の単語であってもよく、距離が近い上位の所定の個数の単
語であってもよい。キーワードＫＷによって、同義語、類義語、対義語、上位語、下位語
などの数は異なるため、キーワードＫＷによって、関連語ＲＷの数は異なっていてもよい
。参照用文章解析データＡＤ_ｒｅｆに含まれる単語の中からキーワードＫＷの関連語ＲＷ
を抽出することで、参照用文章解析データＡＤ_ｒｅｆが独特の表記でキーワードＫＷを表
現している場合であっても、当該表記を関連語ＲＷとして抽出することができる。したが
って、表記の揺らぎによる検索漏れが低減でき、好ましい。

ステップＳ３４の場合、処理部１０３は、文章解析データＡＤに含まれる単語の分散表現
ベクトルと、参照用文章解析データＡＤ_ｒｅｆに含まれる単語の分散表現ベクトルと、の
類似度の高さまたは距離の近さに基づいて、関連語ＲＷを抽出する。それ以外は、ステッ
プＳ１４と同様である。

２つのベクトルの類似度は、コサイン類似度、共分散、不偏共分散、ピアソンの積率相関
係数などを用いて求めることができる。特に、コサイン類似度を用いることが好ましい。

２つのベクトルの距離は、ユークリッド距離、標準（標準化、平均）ユークリッド距離、
マハラノビス距離、マンハッタン距離、チェビシェフ距離、ミンコフスキー距離などを用
いて求めることができる。

関連語データＲＤは、関連語ＲＷとその関連度ＲＳとを含む。

関連語ＲＷは、文章解析データＡＤに含まれる単語またはキーワードＫＷと関連する単語
であるといえる。

関連度ＲＳは、上記類似度の高さもしくは距離の近さを示す値、またはこれらを規格化し
た値である。関連度ＲＳは、後に参照用文章解析データＡＤ_ｒｅｆに点数を付与する際に
用いる、関連語の重みの算出に利用する。具体的には、キーワードＫＷの規格化されたＩ
ＤＦと関連語ＲＷの関連度ＲＳとの積が、関連語の重みに相当する。

図６（Ｃ）では、ＷｏｒｄＤの関連語ＲＷとして、関連度ＲＳが高い順にＷｏｒｄＸ
（関連度ＲＳが０．９９９）、ＷｏｒｄＹ（関連度ＲＳが０．９０１）、ＷｏｒｄＺ
（関連度ＲＳが０．７１２）が抽出された例を示す。

図６（Ｃ）では、関連語データＲＤを処理部１０３の外部に出力する例を示す。例えば、
処理部１０３は、伝送路１０２を介して、記憶部１０５またはデータベース１０７に、関
連語データＲＤを供給することができる。

なお、キーワードデータＫＤを用いて関連語を抽出する場合、図４に示すように、ステッ
プＳ１３の後に、ステップＳ１４を行う。一方、文章解析データＡＤを用いて関連語を抽
出する場合、図５に示すように、ステップＳ３３とステップＳ３４はどちらを先に行って
もよく、並行して行ってもよい。

さらに、関連語ＲＷが、概念辞書に含まれている単語か否かを判断し、当該関連語ＲＷの
重みを決定するステップを有していてもよい。関連語ＲＷが概念辞書に含まれている場合
、当該関連語ＲＷはキーワードＫＷとの関連度が高いといえる。そのため、概念辞書に含
まれる場合は、含まれない場合に比べて、関連語ＲＷの重みが大きくなるように設定して
もよい。例えば、判断結果に応じて、類似度の高さまたは距離の近さを示す値に、所定の
値を加えた値または減らした値を、関連語ＲＷの重みとして用いてもよい。または、関連
語ＲＷが概念辞書に含まれる場合または含まれない場合の一方において、類似度の高さま
たは距離の近さに関わらず、所定の値を関連語ＲＷの重みとして用いてもよい。例えば、
関連語ＲＷが概念辞書に含まれる場合、関連語ＲＷの重みを、キーワードＫＷと同じ重み
にしてもよい。

［ステップＳ１５］
次に、参照用文章解析データＡＤ_ｒｅｆに含まれる単語と一致したキーワードＫＷまたは
関連語ＲＷの重みに基づいて、参照用文章解析データＡＤ_ｒｅｆに点数を付与する（図４
、図５、及び図７（Ａ））。

参照用文章解析データＡＤ_ｒｅｆは、データベース１０７から、伝送路１０２を介して、
処理部１０３に供給される。キーワードデータＫＤ及び関連語データＲＤは、記憶部１０
５またはデータベース１０７から、伝送路１０２を介して、処理部１０３に供給される。
処理部１０３は、点数づけ（スコアリングともいう）の結果を、伝送路１０２を介して、
記憶部１０５またはデータベース１０７に供給することができる。

まず、図７（Ｂ）を用いて、点数づけの具体例を説明する。図７（Ｂ）では、３種類のキ
ーワードＫＷと、キーワードＫＷ１つに対して４種類の関連語ＲＷと、を用いる例を示す
。

スコアの分母はキーワードＫＷの重みの総和であり、図７（Ｂ）の場合、０．９＋０．９
＋０．８＝２．６である。

スコアの分子は参照用文章解析データＡＤ_ｒｅｆに含まれる単語と一致したキーワードＫ
Ｗまたは関連語ＲＷの重みの総和であり、図７（Ｂ）の場合、ＷｏｒｄＤ、Ｗｏｒｄ
ｅ、及びＷｏｒｄｆの重みの和である１．９５である。

このことから、スコアは、１．９５／２．６＝０．７５（７５％）と求めることができる
。

図８を用いてステップＳ１５を詳細に説明する。図８に示すように、ステップＳ１５は、
ステップＳ２１からステップＳ２７を有する。なお、キーワードＫＷの数がｐ個、各キー
ワードＫＷの関連語ＲＷの数がｑ個である場合、ｘは１以上ｐ以下の整数を表し、ｙは１
以上ｑ以下の整数を表す。

［ステップＳ２１］
まず、点数づけしていない参照用文章解析データＡＤ_ｒｅｆを１件選択する。

［ステップＳ２２］
次に、参照用文章解析データＡＤ_ｒｅｆにおいて、キーワードＫＷ_ｘがヒットするか判断
する。ヒットする場合、ステップＳ２５に進む。ヒットしない場合、ステップＳ２３に進
む。

［ステップＳ２３］
次に、参照用文章解析データＡＤ_ｒｅｆにおいて、キーワードＫＷ_ｘの関連語ＲＷ_ｘｙが
ヒットするか判断する。ヒットする場合、ステップＳ２５に進む。ヒットしない場合、ス
テップＳ２４に進む。

［ステップＳ２４］
次に、キーワードＫＷｘの全ての関連語ＲＷで検索したか判断する。検索した場合、ステ
ップＳ２６に進む。検索していない場合、ステップＳ２３に進む。例えば、キーワードＫ
Ｗ_ｘの関連語ＲＷが２つあり、先のステップＳ２３で関連語ＲＷ_ｘ１がヒットするか判断
していた場合、ステップＳ２３に戻って関連語ＲＷ_ｘ２がヒットするか判断する。

［ステップＳ２５］
ステップＳ２５では、ヒットした単語に対応する重みをスコアに加算する。ステップＳ２
２でヒットした場合、キーワードＫＷ_ｘのＩＤＦをスコアに加算する。ステップＳ２３で
ヒットした場合、キーワードＫＷ_ｘのＩＤＦと、関連語ＲＷ_ｘｙの関連度ＲＳと、の積を
スコアに加算する。なお、上述の点数づけの例では、スコアの分子に加算する。

［ステップＳ２６］
次に、全てのキーワードＫＷで検索したか判断する。検索した場合、ステップＳ２７に進
む。検索していない場合、ステップＳ２２に進む。例えば、キーワードＫＷ_ｘが２つあり
、先のステップＳ２２でキーワードＫＷ_１がヒットするか判断していた場合、ステップＳ
２２に戻ってキーワードＫＷ_２がヒットするか判断する。

［ステップＳ２７］
次に、全ての参照用文章解析データＡＤ_ｒｅｆの点数づけをしたか判断する。全ての点数
づけが終わった場合、ステップＳ１６に進む。終わっていない場合、ステップＳ２１に進
む。

［ステップＳ１６］
そして、参照用文章解析データＡＤ_ｒｅｆを順位づけし、ランキングデータＬＤを生成し
、出力する（図４、５、及び図７（Ａ））。

処理部１０３は、ランキングデータＬＤを、伝送路１０２を介して、記憶部１０５または
データベース１０７に供給することができる。また、処理部１０３は、ランキングデータ
ＬＤを、伝送路１０２を介して、出力部１０９に供給することができる。これにより、出
力部１０９は、文書検索システム１００の外部にランキングデータＬＤを供給することが
できる。

ランキングデータＬＤは、順位（Ｌａｎｋ）、参照用文章データＴＤ_ｒｅｆの情報（名称
や識別番号など）（Ｄｏｃ）、スコア（Ｓｃｏｒｅ）などを含むことができる。なお、デ
ータベース１０７などに参照用文章データＴＤ_ｒｅｆが保存されている場合、ランキング
データＬＤは、参照用文章データＴＤ_ｒｅｆへのファイルパスを含むことが好ましい。こ
れにより、使用者は、ランキングデータＬＤから、目的の文書に容易にアクセスすること
ができる。

参照用文章解析データＡＤ_ｒｅｆのスコアが高いほど、当該参照用文章解析データＡＤ_ｒ
_ｅｆに対応する参照用文章データＴＤ_ｒｅｆは、文章データＴＤと関連または類似してい
るといえる。

図７（Ａ）に示す例では、ランキングデータＬＤから、ｎ個の参照用文章データＴＤ_ｒｅ
_ｆのうち、文章データＴＤと最も関連または類似しているデータは、参照用文章データＴ
Ｄ_ｒｅｆ（７）であり、二番目に関連または類似しているデータは、参照用文章データＴ
Ｄ_ｒｅｆ（４）であり、三番目に関連または類似しているデータは、参照用文章データＴ
Ｄ_ｒｅｆ（１３）であるとわかる。

以上により、文書検索システム１００を用いて、検索を行うことができる。

なお、ステップＳ１４で出力したキーワードＫＷ、キーワードＫＷの重み（ＩＤＦ）、関
連語ＲＷ、及び関連語ＲＷの重み（ＩＤＦ×ＲＳ）を、手作業で編集してから、ステップ
Ｓ１５に進んでもよい。

図９に編集のステップを含むフローチャートを示し、図１０に図９に示すステップの模式
図を示す。なお、図１０に示すデータの図示は一例であり、これに限定されない。

［ステップＳ４１］
ステップ１４の後、ステップＳ１５で使用予定のキーワードデータＫＤ及び関連語データ
ＲＤの一覧を出力する（図９及び図１０（Ａ））。

図１０（Ａ）から、キーワードＫＷとして、ＷｏｒｄＤ、ＷｏｒｄＡ、ＷｏｒｄＥ
が挙げられており、それぞれの重み（ＩＤＦ）が０．９、０．９、０．８であることがわ
かる。

ＷｏｒｄＤの関連語ＲＷとしては、ＷｏｒｄＸ、ＷｏｒｄＹ、ＷｏｒｄＺ、及び
Ｗｏｒｄａが挙げられており、それぞれの重み（ＩＤＦ×ＲＳ）は０．９、０．８、０
．６、０．５であることがわかる。

ＷｏｒｄＡの関連語ＲＷとしては、Ｗｏｒｄｂ、Ｗｏｒｄｃ、Ｗｏｒｄｄ、及び
Ｗｏｒｄｅが挙げられており、それぞれの重み（ＩＤＦ×ＲＳ）は０．５、０．５、０
．４５、０．３であることがわかる。

ＷｏｒｄＥの関連語ＲＷとしては、Ｗｏｒｄｆ、Ｗｏｒｄｇ、Ｗｏｒｄｈ、及び
Ｗｏｒｄｉが挙げられており、それぞれの重み（ＩＤＦ×ＲＳ）は０．７５、０．７５
、０．７５、０．７５であることがわかる。

［ステップＳ４２］
次に、キーワードデータＫＤ及び関連語データＲＤを編集する（図９及び図１０（Ｂ））
。

図１０（Ｂ）では、３か所の編集を行った例を示す。具体的には、ＷｏｒｄＡ及びその
関連語ＲＷの削除と、Ｗｏｒｄａ（重み０．５）からＷｏｒｄｘ（重み０．８）への
変更と、Ｗｏｒｄｆの重みの変更（０．７５から０．８へ）である。

このように、使用者が単語及び重みの少なくとも一方を編集することで、検索精度の向上
を図ってもよい。

その後、ステップＳ１５では、編集済みのキーワードデータＫＤ及び関連語データＲＤを
用いて参照用文章解析データＡＤ_ｒｅｆに点数を付与し、ステップＳ１６でランキングデ
ータＬＤを生成し、出力する。

［ステップＳ４３］
次に、ランキングデータＬＤが期待した結果であるか確認する（図９）。期待した結果で
あれば、検索を終了する。期待した結果が得られなかった場合、ステップＳ４１に戻って
、編集済みのキーワードデータＫＤ及び関連語データＲＤの一覧を出力し、ステップＳ４
２にて、再度編集してもよい。

なお、単語及び重みの編集は、手作業に限らず、辞書データ、自然言語処理により生成し
た解析データ等を用いて、自動で行われてもよい。編集により、検索精度の向上を図るこ
とができる。

＜３．文書検索システムの構成例２＞
次に、図１１に示す文書検索システム１５０について説明する。

図１１に、文書検索システム１５０のブロック図を示す。文書検索システム１５０は、サ
ーバ１５１と、端末１５２（パーソナルコンピュータなど）とを有する。

サーバ１５１は、通信部１６１ａ、伝送路１６２、処理部１６３ａ、及びデータベース１
６７を有する。図１１では図示しないが、さらに、サーバ１５１は、記憶部、入出力部な
どを有していてもよい。

端末１５２は、通信部１６１ｂ、伝送路１６８、処理部１６３ｂ、記憶部１６５、及び入
出力部１６９を有する。図１１では図示しないが、端末１５２は、さらに、データベース
などを有していてもよい。

文書検索システム１５０の使用者は、端末１５２から、文章データＴＤを、サーバ１５１
に入力する。文章データＴＤは、通信部１６１ｂから通信部１６１ａに送信される。

通信部１６１ａが受信した文章データＴＤは、伝送路１６２を介して、データベース１６
７または記憶部（図示しない）に保存される。または、文章データＴＤは、通信部１６１
ａから、直接、処理部１６３ａに供給されてもよい。

上記＜２．文書検索方法＞で説明した各種処理は、処理部１６３ａにて行われる。これら
の処理は、高い処理能力が求められるため、サーバ１５１が有する処理部１６３ａで行う
ことが好ましい。

そして、処理部１６３ａによりランキングデータＬＤが生成される。ランキングデータＬ
Ｄは、伝送路１６２を介して、データベース１６７または記憶部（図示しない）に保存さ
れる。または、ランキングデータＬＤは、処理部１６３ａから、直接、通信部１６１ａに
供給されてもよい。その後、サーバ１５１から、ランキングデータＬＤが、端末１５２に
出力される。ランキングデータＬＤは、通信部１６１ａから通信部１６１ｂに送信される
。

［入出力部１６９］
入出力部１６９には、文書検索システム１５０の外部からデータが供給される。入出力部
１６９は、文書検索システム１５０の外部にデータを供給する機能を有する。なお、文書
検索システム１００のように、入力部と出力部が分かれていてもよい。

［伝送路１６２及び伝送路１６８］
伝送路１６２及び伝送路１６８は、データを伝達する機能を有する。通信部１６１ａ、処
理部１６３ａ、及びデータベース１６７の間のデータの送受信は、伝送路１６２を介して
行うことができる。通信部１６１ｂ、処理部１６３ｂ、記憶部１６５、及び入出力部１６
９の間のデータの送受信は、伝送路１６８を介して行うことができる。

［処理部１６３ａ及び処理部１６３ｂ］
処理部１６３ａは、通信部１６１ａ及びデータベース１６７などから供給されたデータを
用いて、演算、推論などを行う機能を有する。処理部１６３ｂは、通信部１６１ｂ、記憶
部１６５、及び入出力部１６９などから供給されたデータを用いて、演算などを行う機能
を有する。処理部１６３ａ及び処理部１６３ｂは、処理部１０３の説明を参照できる。特
に、処理部１６３ａは、上記＜２．文書検索方法＞で説明した各種処理を行うことができ
る。そのため、処理部１６３ａは、処理部１６３ｂに比べて処理能力が高いことが好まし
い。

［記憶部１６５］
記憶部１６５は、処理部１６３ｂが実行するプログラムを記憶する機能を有する。また、
記憶部１６５は、処理部１６３ｂが生成した演算結果、通信部１６１ｂに入力されたデー
タ、及び入出力部１６９に入力されたデータなどを記憶する機能を有する。

［データベース１６７］
データベース１６７は、参照用文章解析データＡＤ_ｒｅｆ、ＩＤＦデータＩＤ、及びベク
トルデータＶＤを記憶する機能を有する。また、データベース１６７は、処理部１６３ａ
が生成した演算結果、及び通信部１６１ａに入力されたデータなどを記憶する機能を有し
ていてもよい。または、サーバ１５１は、データベース１６７とは別に記憶部を有し、当
該記憶部が、処理部１６３ａが生成した演算結果、及び通信部１６１ａに入力されたデー
タなどを記憶する機能を有していてもよい。

［通信部１６１ａ及び通信部１６１ｂ］
通信部１６１ａ及び通信部１６１ｂを用いて、サーバ１５１と端末１５２との間で、デー
タの送受信を行うことができる。通信部１６１ａ及び通信部１６１ｂとしては、ハブ、ル
ータ、モデムなどを用いることができる。データの送受信には、有線を用いても無線（例
えば、電波、赤外線など）を用いてもよい。

以上のように、本実施の形態の文書検索システムでは、事前に準備された文書を検索の対
象として、入力された文書に関連または類似する文書を検索することができる。検索に用
いるキーワードを使用者が選択する必要がなく、キーワードよりも分量の多い文章データ
を用いて検索することができるため、検索精度の個人差を低減することができ、簡便かつ
高精度に、文書を検索できる。また、本実施の形態の文書検索システムは、キーワードの
関連語を、事前に準備された文書の中から抽出するため、当該文書に含まれる独特な表記
も関連語として抽出することができ、検索漏れを低減できる。また、本実施の形態の文書
検索システムは、関連性または類似性の高さで順位づけして検索結果を出力することがで
きるため、使用者にとっては、検索結果から必要な文書を探しやすく、かつ、見落としに
くくなる。

本実施の形態は、他の実施の形態と適宜組み合わせることができる。また、本明細書にお
いて、１つの実施の形態の中に、複数の構成例が示される場合は、構成例を適宜組み合わ
せることが可能である。

（実施の形態２）
本実施の形態では、ニューラルネットワークに用いることが可能な半導体装置の構成例に
ついて説明する。

本実施の形態の半導体装置は、例えば、本発明の一態様の文書検索システムの処理部に用
いることができる。

図１２（Ａ）に示すように、ニューラルネットワークＮＮは入力層ＩＬ、出力層ＯＬ、中
間層（隠れ層）ＨＬによって構成することができる。入力層ＩＬ、出力層ＯＬ、中間層Ｈ
Ｌはそれぞれ、１または複数のニューロン（ユニット）を有する。なお、中間層ＨＬは１
層であってもよいし２層以上であってもよい。２層以上の中間層ＨＬを有するニューラル
ネットワークはＤＮＮ（ディープニューラルネットワーク）と呼ぶこともでき、ディープ
ニューラルネットワークを用いた学習は深層学習と呼ぶこともできる。

入力層ＩＬの各ニューロンには入力データが入力され、中間層ＨＬの各ニューロンには前
層または後層のニューロンの出力信号が入力され、出力層ＯＬの各ニューロンには前層の
ニューロンの出力信号が入力される。なお、各ニューロンは、前後の層の全てのニューロ
ンと結合されていてもよいし（全結合）、一部のニューロンと結合されていてもよい。

図１２（Ｂ）に、ニューロンによる演算の例を示す。ここでは、ニューロンＮと、ニュー
ロンＮに信号を出力する前層の２つのニューロンを示している。ニューロンＮには、前層
のニューロンの出力ｘ_１と、前層のニューロンの出力ｘ_２が入力される。そして、ニュー
ロンＮにおいて、出力ｘ_１と重みｗ_１の乗算結果（ｘ_１ｗ_１）と出力ｘ_２と重みｗ_２の乗
算結果（ｘ_２ｗ_２）の総和ｘ_１ｗ_１＋ｘ_２ｗ_２が計算された後、必要に応じてバイアスｂ
が加算され、値ａ＝ｘ_１ｗ_１＋ｘ_２ｗ_２＋ｂが得られる。そして、値ａは活性化関数ｈに
よって変換され、ニューロンＮから出力信号ｙ＝ｈ（ａ）が出力される。

このように、ニューロンによる演算には、前層のニューロンの出力と重みの積を足し合わ
せる演算、すなわち積和演算が含まれる（上記のｘ_１ｗ_１＋ｘ_２ｗ_２）。この積和演算は
、プログラムを用いてソフトウェア上で行ってもよいし、ハードウェアによって行われて
もよい。積和演算をハードウェアによって行う場合は、積和演算回路を用いることができ
る。この積和演算回路としては、デジタル回路を用いてもよいし、アナログ回路を用いて
もよい。積和演算回路にアナログ回路を用いる場合、積和演算回路の回路規模の縮小、ま
たは、メモリへのアクセス回数の減少による処理速度の向上及び消費電力の低減を図るこ
とができる。

積和演算回路は、チャネル形成領域にシリコン（単結晶シリコンなど）を含むトランジス
タ（「Ｓｉトランジスタ」ともいう）によって構成してもよいし、チャネル形成領域に金
属酸化物の一種である酸化物半導体を含むトランジスタ（「ＯＳトランジスタ」ともいう
）によって構成してもよい。特に、ＯＳトランジスタはオフ電流が極めて小さいため、積
和演算回路のメモリを構成するトランジスタとして好適である。なお、Ｓｉトランジスタ
とＯＳトランジスタの両方を用いて積和演算回路を構成してもよい。以下、積和演算回路
の機能を備えた半導体装置の構成例について説明する。

＜半導体装置の構成例＞
図１３に、ニューラルネットワークの演算を行う機能を有する半導体装置ＭＡＣの構成例
を示す。半導体装置ＭＡＣは、ニューロン間の結合強度（重み）に対応する第１のデータ
と、入力データに対応する第２のデータの積和演算を行う機能を有する。なお、第１のデ
ータ及び第２のデータはそれぞれ、アナログデータまたは多値のデジタルデータ（離散的
なデータ）とすることができる。また、半導体装置ＭＡＣは、積和演算によって得られた
データを活性化関数によって変換する機能を有する。

半導体装置ＭＡＣは、セルアレイＣＡ、電流源回路ＣＳ、カレントミラー回路ＣＭ、回路
ＷＤＤ、回路ＷＬＤ、回路ＣＬＤ、オフセット回路ＯＦＳＴ、及び活性化関数回路ＡＣＴ
Ｖを有する。

セルアレイＣＡは、複数のメモリセルＭＣ及び複数のメモリセルＭＣｒｅｆを有する。図
１３には、セルアレイＣＡがｍ行ｎ列（ｍ，ｎは１以上の整数）のメモリセルＭＣ（ＭＣ
［１，１］乃至ＭＣ［ｍ，ｎ］）と、ｍ個のメモリセルＭＣｒｅｆ（ＭＣｒｅｆ［１］乃
至ＭＣｒｅｆ［ｍ］）を有する構成例を示している。メモリセルＭＣは、第１のデータを
格納する機能を有する。また、メモリセルＭＣｒｅｆは、積和演算に用いられる参照デー
タを格納する機能を有する。なお、参照データはアナログデータまたは多値のデジタルデ
ータとすることができる。

メモリセルＭＣ［ｉ，ｊ］（ｉは１以上ｍ以下の整数、ｊは１以上ｎ以下の整数）は、配
線ＷＬ［ｉ］、配線ＲＷ［ｉ］、配線ＷＤ［ｊ］、及び配線ＢＬ［ｊ］と接続されている
。また、メモリセルＭＣｒｅｆ［ｉ］は、配線ＷＬ［ｉ］、配線ＲＷ［ｉ］、配線ＷＤｒ
ｅｆ、配線ＢＬｒｅｆと接続されている。ここで、メモリセルＭＣ［ｉ，ｊ］と配線ＢＬ
［ｊ］間を流れる電流をＩ_{ＭＣ［ｉ，ｊ］}と表記し、メモリセルＭＣｒｅｆ［ｉ］と配線
ＢＬｒｅｆ間を流れる電流をＩ_{ＭＣｒｅｆ［ｉ］}と表記する。

メモリセルＭＣ及びメモリセルＭＣｒｅｆの具体的な構成例を、図１４に示す。図１４に
は代表例としてメモリセルＭＣ［１，１］、ＭＣ［２，１］及びメモリセルＭＣｒｅｆ［
１］、ＭＣｒｅｆ［２］を示しているが、他のメモリセルＭＣ及びメモリセルＭＣｒｅｆ
にも同様の構成を用いることができる。メモリセルＭＣ及びメモリセルＭＣｒｅｆはそれ
ぞれ、トランジスタＴｒ１１、トランジスタＴｒ１２、容量素子Ｃ１１を有する。ここで
は、トランジスタＴｒ１１及びトランジスタＴｒ１２がｎチャネル型のトランジスタであ
る場合について説明する。

メモリセルＭＣにおいて、トランジスタＴｒ１１のゲートは配線ＷＬと接続され、ソース
またはドレインの一方はトランジスタＴｒ１２のゲート、及び容量素子Ｃ１１の第１の電
極と接続され、ソースまたはドレインの他方は配線ＷＤと接続されている。トランジスタ
Ｔｒ１２のソースまたはドレインの一方は配線ＢＬと接続され、ソースまたはドレインの
他方は配線ＶＲと接続されている。容量素子Ｃ１１の第２の電極は、配線ＲＷと接続され
ている。配線ＶＲは、所定の電位を供給する機能を有する配線である。ここでは一例とし
て、配線ＶＲから低電源電位（接地電位など）が供給される場合について説明する。

トランジスタＴｒ１１のソースまたはドレインの一方、トランジスタＴｒ１２のゲート、
及び容量素子Ｃ１１の第１の電極と接続されたノードを、ノードＮＭとする。また、メモ
リセルＭＣ［１，１］、ＭＣ［２，１］のノードＮＭを、それぞれノードＮＭ［１，１］
、ＮＭ［２，１］と表記する。

メモリセルＭＣｒｅｆも、メモリセルＭＣと同様の構成を有する。ただし、メモリセルＭ
Ｃｒｅｆは配線ＷＤの代わりに配線ＷＤｒｅｆと接続され、配線ＢＬの代わりに配線ＢＬ
ｒｅｆと接続されている。また、メモリセルＭＣｒｅｆ［１］、ＭＣｒｅｆ［２］におい
て、トランジスタＴｒ１１のソースまたはドレインの一方、トランジスタＴｒ１２のゲー
ト、及び容量素子Ｃ１１の第１の電極と接続されたノードを、それぞれノードＮＭｒｅｆ
［１］、ＮＭｒｅｆ［２］と表記する。

ノードＮＭとノードＮＭｒｅｆはそれぞれ、メモリセルＭＣとメモリセルＭＣｒｅｆの保
持ノードとして機能する。ノードＮＭには第１のデータが保持され、ノードＮＭｒｅｆに
は参照データが保持される。また、配線ＢＬ［１］からメモリセルＭＣ［１，１］、ＭＣ
［２，１］のトランジスタＴｒ１２には、それぞれ電流Ｉ_{ＭＣ［１，１］}、Ｉ_{ＭＣ［２，}
_１］が流れる。また、配線ＢＬｒｅｆからメモリセルＭＣｒｅｆ［１］、ＭＣｒｅｆ［２
］のトランジスタＴｒ１２には、それぞれ電流Ｉ_{ＭＣｒｅｆ［１］}、Ｉ_{ＭＣｒｅｆ［２］}
が流れる。

トランジスタＴｒ１１は、ノードＮＭまたはノードＮＭｒｅｆの電位を保持する機能を有
するため、トランジスタＴｒ１１のオフ電流は小さいことが好ましい。そのため、トラン
ジスタＴｒ１１としてオフ電流が極めて小さいＯＳトランジスタを用いることが好ましい
。これにより、ノードＮＭまたはノードＮＭｒｅｆの電位の変動を抑えることができ、演
算精度の向上を図ることができる。また、ノードＮＭまたはノードＮＭｒｅｆの電位をリ
フレッシュする動作の頻度を低く抑えることが可能となり、消費電力を削減することがで
きる。

トランジスタＴｒ１２は特に限定されず、例えばＳｉトランジスタまたはＯＳトランジス
タなどを用いることができる。トランジスタＴｒ１２にＯＳトランジスタを用いる場合、
トランジスタＴｒ１１と同じ製造装置を用いて、トランジスタＴｒ１２を作製することが
可能となり、製造コストを抑制することができる。なお、トランジスタＴｒ１２はｎチャ
ネル型であってもｐチャネル型であってもよい。

電流源回路ＣＳは、配線ＢＬ［１］乃至ＢＬ［ｎ］及び配線ＢＬｒｅｆと接続されている
。電流源回路ＣＳは、配線ＢＬ［１］乃至ＢＬ［ｎ］及び配線ＢＬｒｅｆに電流を供給す
る機能を有する。なお、配線ＢＬ［１］乃至ＢＬ［ｎ］に供給される電流値と配線ＢＬｒ
ｅｆに供給される電流値は異なっていてもよい。ここでは、電流源回路ＣＳから配線ＢＬ
［１］乃至ＢＬ［ｎ］に供給される電流をＩ_Ｃ、電流源回路ＣＳから配線ＢＬｒｅｆに供
給される電流をＩ_Ｃｒｅｆと表記する。

カレントミラー回路ＣＭは、配線ＩＬ［１］乃至ＩＬ［ｎ］及び配線ＩＬｒｅｆを有する
。配線ＩＬ［１］乃至ＩＬ［ｎ］はそれぞれ配線ＢＬ［１］乃至ＢＬ［ｎ］と接続され、
配線ＩＬｒｅｆは、配線ＢＬｒｅｆと接続されている。ここでは、配線ＩＬ［１］乃至Ｉ
Ｌ［ｎ］と配線ＢＬ［１］乃至ＢＬ［ｎ］の接続箇所をノードＮＰ［１］乃至ＮＰ［ｎ］
と表記する。また、配線ＩＬｒｅｆと配線ＢＬｒｅｆの接続箇所をノードＮＰｒｅｆと表
記する。

カレントミラー回路ＣＭは、ノードＮＰｒｅｆの電位に応じた電流Ｉ_ＣＭを配線ＩＬｒｅ
ｆに流す機能と、この電流Ｉ_ＣＭを配線ＩＬ［１］乃至ＩＬ［ｎ］にも流す機能を有する
。図１３には、配線ＢＬｒｅｆから配線ＩＬｒｅｆに電流Ｉ_ＣＭが排出され、配線ＢＬ［
１］乃至ＢＬ［ｎ］から配線ＩＬ［１］乃至ＩＬ［ｎ］に電流Ｉ_ＣＭが排出される例を示
している。また、カレントミラー回路ＣＭから配線ＢＬ［１］乃至ＢＬ［ｎ］を介してセ
ルアレイＣＡに流れる電流を、Ｉ_Ｂ［１］乃至Ｉ_Ｂ［ｎ］と表記する。また、カレントミ
ラー回路ＣＭから配線ＢＬｒｅｆを介してセルアレイＣＡに流れる電流を、Ｉ_Ｂｒｅｆと
表記する。

回路ＷＤＤは、配線ＷＤ［１］乃至ＷＤ［ｎ］及び配線ＷＤｒｅｆと接続されている。回
路ＷＤＤは、メモリセルＭＣに格納される第１のデータに対応する電位を、配線ＷＤ［１
］乃至ＷＤ［ｎ］に供給する機能を有する。また、回路ＷＤＤは、メモリセルＭＣｒｅｆ
に格納される参照データに対応する電位を、配線ＷＤｒｅｆに供給する機能を有する。回
路ＷＬＤは、配線ＷＬ［１］乃至ＷＬ［ｍ］と接続されている。回路ＷＬＤは、データの
書き込みを行うメモリセルＭＣまたはメモリセルＭＣｒｅｆを選択するための信号を、配
線ＷＬ［１］乃至ＷＬ［ｍ］に供給する機能を有する。回路ＣＬＤは、配線ＲＷ［１］乃
至ＲＷ［ｍ］と接続されている。回路ＣＬＤは、第２のデータに対応する電位を、配線Ｒ
Ｗ［１］乃至ＲＷ［ｍ］に供給する機能を有する。

オフセット回路ＯＦＳＴは、配線ＢＬ［１］乃至ＢＬ［ｎ］及び配線ＯＬ［１］乃至ＯＬ
［ｎ］と接続されている。オフセット回路ＯＦＳＴは、配線ＢＬ［１］乃至ＢＬ［ｎ］か
らオフセット回路ＯＦＳＴに流れる電流量、及び／または、配線ＢＬ［１］乃至ＢＬ［ｎ
］からオフセット回路ＯＦＳＴに流れる電流の変化量を検出する機能を有する。また、オ
フセット回路ＯＦＳＴは、検出結果を配線ＯＬ［１］乃至ＯＬ［ｎ］に出力する機能を有
する。なお、オフセット回路ＯＦＳＴは、検出結果に対応する電流を配線ＯＬに出力して
もよいし、検出結果に対応する電流を電圧に変換して配線ＯＬに出力してもよい。セルア
レイＣＡとオフセット回路ＯＦＳＴの間を流れる電流を、Ｉ_α［１］乃至Ｉ_α［ｎ］と表
記する。

オフセット回路ＯＦＳＴの構成例を図１５に示す。図１５に示すオフセット回路ＯＦＳＴ
は、回路ＯＣ［１］乃至ＯＣ［ｎ］を有する。また、回路ＯＣ［１］乃至ＯＣ［ｎ］はそ
れぞれ、トランジスタＴｒ２１、トランジスタＴｒ２２、トランジスタＴｒ２３、容量素
子Ｃ２１、及び抵抗素子Ｒ１を有する。各素子の接続関係は図１５に示す通りである。な
お、容量素子Ｃ２１の第１の電極及び抵抗素子Ｒ１の第１の端子と接続されたノードを、
ノードＮａとする。また、容量素子Ｃ２１の第２の電極、トランジスタＴｒ２１のソース
またはドレインの一方、及びトランジスタＴｒ２２のゲートと接続されたノードを、ノー
ドＮｂとする。

配線ＶｒｅｆＬは電位Ｖｒｅｆを供給する機能を有し、配線ＶａＬは電位Ｖａを供給する
機能を有し、配線ＶｂＬは電位Ｖｂを供給する機能を有する。また、配線ＶＤＤＬは電位
ＶＤＤを供給する機能を有し、配線ＶＳＳＬは電位ＶＳＳを供給する機能を有する。ここ
では、電位ＶＤＤが高電源電位であり、電位ＶＳＳが低電源電位である場合について説明
する。また、配線ＲＳＴは、トランジスタＴｒ２１の導通状態を制御するための電位を供
給する機能を有する。トランジスタＴｒ２２、トランジスタＴｒ２３、配線ＶＤＤＬ、配
線ＶＳＳＬ、及び配線ＶｂＬによって、ソースフォロワ回路が構成される。

次に、回路ＯＣ［１］乃至ＯＣ［ｎ］の動作例を説明する。なお、ここでは代表例として
回路ＯＣ［１］の動作例を説明するが、回路ＯＣ［２］乃至ＯＣ［ｎ］も同様に動作させ
ることができる。まず、配線ＢＬ［１］に第１の電流が流れると、ノードＮａの電位は、
第１の電流と抵抗素子Ｒ１の抵抗値に応じた電位となる。また、このときトランジスタＴ
ｒ２１はオン状態であり、ノードＮｂに電位Ｖａが供給される。その後、トランジスタＴ
ｒ２１はオフ状態となる。

次に、配線ＢＬ［１］に第２の電流が流れると、ノードＮａの電位は、第２の電流と抵抗
素子Ｒ１の抵抗値に応じた電位に変化する。このときトランジスタＴｒ２１はオフ状態で
あり、ノードＮｂはフローティング状態となっているため、ノードＮａの電位の変化に伴
い、ノードＮｂの電位は容量結合により変化する。ここで、ノードＮａの電位の変化をΔ
Ｖ_Ｎａとし、容量結合係数を１とすると、ノードＮｂの電位はＶａ＋ΔＶ_Ｎａとなる。そ
して、トランジスタＴｒ２２のしきい値電圧をＶ_ｔｈとすると、配線ＯＬ［１］から電位
Ｖａ＋ΔＶ_Ｎａ−Ｖ_ｔｈが出力される。ここで、Ｖａ＝Ｖ_ｔｈとすることにより、配線Ｏ
Ｌ［１］から電位ΔＶ_Ｎａを出力することができる。

電位ΔＶ_Ｎａは、第１の電流から第２の電流への変化量、抵抗素子Ｒ１の抵抗値、及び電
位Ｖｒｅｆに応じて定まる。ここで、抵抗素子Ｒ１の抵抗値と電位Ｖｒｅｆは既知である
ため、電位ΔＶ_Ｎａから配線ＢＬに流れる電流の変化量を求めることができる。

上記のようにオフセット回路ＯＦＳＴによって検出された電流量、及び／または電流の変
化量に対応する信号は、配線ＯＬ［１］乃至ＯＬ［ｎ］を介して活性化関数回路ＡＣＴＶ
に入力される。

活性化関数回路ＡＣＴＶは、配線ＯＬ［１］乃至ＯＬ［ｎ］、及び、配線ＮＩＬ［１］乃
至ＮＩＬ［ｎ］と接続されている。活性化関数回路ＡＣＴＶは、オフセット回路ＯＦＳＴ
から入力された信号を、あらかじめ定義された活性化関数に従って変換するための演算を
行う機能を有する。活性化関数としては、例えば、シグモイド関数、ｔａｎｈ関数、ｓｏ
ｆｔｍａｘ関数、ＲｅＬＵ関数、しきい値関数などを用いることができる。活性化関数回
路ＡＣＴＶによって変換された信号は、出力データとして配線ＮＩＬ［１］乃至ＮＩＬ［
ｎ］に出力される。

＜半導体装置の動作例＞
上記の半導体装置ＭＡＣを用いて、第１のデータと第２のデータの積和演算を行うことが
できる。以下、積和演算を行う際の半導体装置ＭＡＣの動作例を説明する。

図１６に半導体装置ＭＡＣの動作例のタイミングチャートを示す。図１６には、図１４に
おける配線ＷＬ［１］、配線ＷＬ［２］、配線ＷＤ［１］、配線ＷＤｒｅｆ、ノードＮＭ
［１，１］、ノードＮＭ［２，１］、ノードＮＭｒｅｆ［１］、ノードＮＭｒｅｆ［２］
、配線ＲＷ［１］、及び配線ＲＷ［２］の電位の推移と、電流Ｉ_Ｂ［１］−Ｉ_α［１］、
及び電流Ｉ_Ｂｒｅｆの値の推移を示している。電流Ｉ_Ｂ［１］−Ｉ_α［１］は、配線ＢＬ
［１］からメモリセルＭＣ［１，１］、ＭＣ［２，１］に流れる電流の総和に相当する。

なお、ここでは代表例として図１４に示すメモリセルＭＣ［１，１］、ＭＣ［２，１］及
びメモリセルＭＣｒｅｆ［１］、ＭＣｒｅｆ［２］に着目して動作を説明するが、他のメ
モリセルＭＣ及びメモリセルＭＣｒｅｆも同様に動作させることができる。

［第１のデータの格納］
まず、時刻Ｔ０１−時刻Ｔ０２の期間において、配線ＷＬ［１］の電位がハイレベル（Ｈ
ｉｇｈ）となり、配線ＷＤ［１］の電位が接地電位（ＧＮＤ）よりもＶ_ＰＲ−Ｖ_Ｗ［１，
_１］大きい電位となり、配線ＷＤｒｅｆの電位が接地電位よりもＶ_ＰＲ大きい電位となる
。また、配線ＲＷ［１］、及び配線ＲＷ［２］の電位が基準電位（ＲＥＦＰ）となる。な
お、電位Ｖ_{Ｗ［１，１］}はメモリセルＭＣ［１，１］に格納される第１のデータに対応す
る電位である。また、電位Ｖ_ＰＲは参照データに対応する電位である。これにより、メモ
リセルＭＣ［１，１］及びメモリセルＭＣｒｅｆ［１］が有するトランジスタＴｒ１１が
オン状態となり、ノードＮＭ［１，１］の電位がＶ_ＰＲ−Ｖ_{Ｗ［１，１］}、ノードＮＭｒ
ｅｆ［１］の電位がＶ_ＰＲとなる。

このとき、配線ＢＬ［１］からメモリセルＭＣ［１，１］のトランジスタＴｒ１２に流れ
る電流Ｉ_{ＭＣ［１，１］，０}は、次の式で表すことができる。ここで、ｋはトランジスタ
Ｔｒ１２のチャネル長、チャネル幅、移動度、及びゲート絶縁膜の容量などで決まる定数
である。また、Ｖ_ｔｈはトランジスタＴｒ１２のしきい値電圧である。

Ｉ_{ＭＣ［１，１］，０}＝ｋ（Ｖ_ＰＲ−Ｖ_{Ｗ［１，１］}−Ｖ_ｔｈ）^２（Ｅ１）

また、配線ＢＬｒｅｆからメモリセルＭＣｒｅｆ［１］のトランジスタＴｒ１２に流れる
電流Ｉ_{ＭＣｒｅｆ［１］，０}は、次の式で表すことができる。

Ｉ_{ＭＣｒｅｆ［１］，０}＝ｋ（Ｖ_ＰＲ−Ｖ_ｔｈ）^２（Ｅ２）

次に、時刻Ｔ０２−時刻Ｔ０３の期間において、配線ＷＬ［１］の電位がローレベル（Ｌ
ｏｗ）となる。これにより、メモリセルＭＣ［１，１］及びメモリセルＭＣｒｅｆ［１］
が有するトランジスタＴｒ１１がオフ状態となり、ノードＮＭ［１，１］及びノードＮＭ
ｒｅｆ［１］の電位が保持される。

なお、前述の通り、トランジスタＴｒ１１としてＯＳトランジスタを用いることが好まし
い。これにより、トランジスタＴｒ１１のリーク電流を抑えることができ、ノードＮＭ［
１，１］及びノードＮＭｒｅｆ［１］の電位を正確に保持することができる。

次に、時刻Ｔ０３−時刻Ｔ０４の期間において、配線ＷＬ［２］の電位がハイレベルとな
り、配線ＷＤ［１］の電位が接地電位よりもＶ_ＰＲ−Ｖ_{Ｗ［２，１］}大きい電位となり、
配線ＷＤｒｅｆの電位が接地電位よりもＶ_ＰＲ大きい電位となる。なお、電位Ｖ_Ｗ［２，
_１］はメモリセルＭＣ［２，１］に格納される第１のデータに対応する電位である。これ
により、メモリセルＭＣ［２，１］及びメモリセルＭＣｒｅｆ［２］が有するトランジス
タＴｒ１１がオン状態となり、ノードＮＭ［２，１］の電位がＶ_ＰＲ−Ｖ_{Ｗ［２，１］}、
ノードＮＭｒｅｆ［２］の電位がＶ_ＰＲとなる。

このとき、配線ＢＬ［１］からメモリセルＭＣ［２，１］のトランジスタＴｒ１２に流れ
る電流Ｉ_{ＭＣ［２，１］，０}は、次の式で表すことができる。

Ｉ_{ＭＣ［２，１］，０}＝ｋ（Ｖ_ＰＲ−Ｖ_{Ｗ［２，１］}−Ｖ_ｔｈ）^２（Ｅ３）

また、配線ＢＬｒｅｆからメモリセルＭＣｒｅｆ［２］のトランジスタＴｒ１２に流れる
電流Ｉ_{ＭＣｒｅｆ［２］，０}は、次の式で表すことができる。

Ｉ_{ＭＣｒｅｆ［２］，０}＝ｋ（Ｖ_ＰＲ−Ｖ_ｔｈ）^２（Ｅ４）

次に、時刻Ｔ０４−時刻Ｔ０５の期間において、配線ＷＬ［２］の電位がローレベルとな
る。これにより、メモリセルＭＣ［２，１］及びメモリセルＭＣｒｅｆ［２］が有するト
ランジスタＴｒ１１がオフ状態となり、ノードＮＭ［２，１］及びノードＮＭｒｅｆ［２
］の電位が保持される。

以上の動作により、メモリセルＭＣ［１，１］、ＭＣ［２，１］に第１のデータが格納さ
れ、メモリセルＭＣｒｅｆ［１］、ＭＣｒｅｆ［２］に参照データが格納される。

ここで、時刻Ｔ０４−時刻Ｔ０５の期間において、配線ＢＬ［１］及び配線ＢＬｒｅｆに
流れる電流を考える。配線ＢＬｒｅｆには、電流源回路ＣＳから電流が供給される。また
、配線ＢＬｒｅｆを流れる電流は、カレントミラー回路ＣＭ、メモリセルＭＣｒｅｆ［１
］、ＭＣｒｅｆ［２］へ排出される。電流源回路ＣＳから配線ＢＬｒｅｆに供給される電
流をＩ_Ｃｒｅｆ、配線ＢＬｒｅｆからカレントミラー回路ＣＭへ排出される電流をＩ_ＣＭ
_，０とすると、次の式が成り立つ。

Ｉ_Ｃｒｅｆ−Ｉ_ＣＭ，０＝Ｉ_{ＭＣｒｅｆ［１］，０}＋Ｉ_{ＭＣｒｅｆ［２］，０}
（Ｅ５）

配線ＢＬ［１］には、電流源回路ＣＳからの電流が供給される。また、配線ＢＬ［１］を
流れる電流は、カレントミラー回路ＣＭ、メモリセルＭＣ［１，１］、ＭＣ［２，１］へ
排出される。また、配線ＢＬ［１］からオフセット回路ＯＦＳＴに電流が流れる。電流源
回路ＣＳから配線ＢＬ［１］に供給される電流をＩ_Ｃ，０、配線ＢＬ［１］からオフセッ
ト回路ＯＦＳＴに流れる電流をＩ_α，０とすると、次の式が成り立つ。

Ｉ_Ｃ−Ｉ_ＣＭ，０＝Ｉ_{ＭＣ［１，１］，０}＋Ｉ_{ＭＣ［２，１］，０}＋Ｉ_α，０
（Ｅ６）

［第１のデータと第２のデータの積和演算］
次に、時刻Ｔ０５−時刻Ｔ０６の期間において、配線ＲＷ［１］の電位が基準電位よりも
Ｖ_Ｘ［１］大きい電位となる。このとき、メモリセルＭＣ［１，１］、及びメモリセルＭ
Ｃｒｅｆ［１］のそれぞれの容量素子Ｃ１１には電位Ｖ_Ｘ［１］が供給され、容量結合に
よりトランジスタＴｒ１２のゲートの電位が上昇する。なお、電位Ｖ_Ｘ［１］はメモリセ
ルＭＣ［１，１］及びメモリセルＭＣｒｅｆ［１］に供給される第２のデータに対応する
電位である。

トランジスタＴｒ１２のゲートの電位の変化量は、配線ＲＷの電位の変化量に、メモリセ
ルの構成によって決まる容量結合係数を乗じて得た値となる。容量結合係数は、容量素子
Ｃ１１の容量、トランジスタＴｒ１２のゲート容量、及び寄生容量などによって算出され
る。以下では便宜上、配線ＲＷの電位の変化量とトランジスタＴｒ１２のゲートの電位の
変化量が同じ、すなわち容量結合係数が１であるとして説明する。実際には、容量結合係
数を考慮して電位Ｖ_Ｘを決定すればよい。

メモリセルＭＣ［１，１］及びメモリセルＭＣｒｅｆ［１］の容量素子Ｃ１１に電位Ｖ_Ｘ
_［１］が供給されると、ノードＮＭ［１，１］及びノードＮＭｒｅｆ［１］の電位がそれ
ぞれＶ_Ｘ［１］上昇する。

ここで、時刻Ｔ０５−時刻Ｔ０６の期間において、配線ＢＬ［１］からメモリセルＭＣ［
１，１］のトランジスタＴｒ１２に流れる電流Ｉ_{ＭＣ［１，１］，１}は、次の式で表すこ
とができる。

Ｉ_{ＭＣ［１，１］，１}＝ｋ（Ｖ_ＰＲ−Ｖ_{Ｗ［１，１］}＋Ｖ_Ｘ［１］−Ｖ_ｔｈ）^２
（Ｅ７）

すなわち、配線ＲＷ［１］に電位Ｖ_Ｘ［１］を供給することにより、配線ＢＬ［１］から
メモリセルＭＣ［１，１］のトランジスタＴｒ１２に流れる電流は、ΔＩ_{ＭＣ［１，１］}
＝Ｉ_{ＭＣ［１，１］，１}−Ｉ_{ＭＣ［１，１］，０}増加する。

また、時刻Ｔ０５−時刻Ｔ０６の期間において、配線ＢＬｒｅｆからメモリセルＭＣｒｅ
ｆ［１］のトランジスタＴｒ１２に流れる電流Ｉ_{ＭＣｒｅｆ［１］，１}は、次の式で表す
ことができる。

Ｉ_{ＭＣｒｅｆ［１］，１}＝ｋ（Ｖ_ＰＲ＋Ｖ_Ｘ［１］−Ｖ_ｔｈ）^２（Ｅ８）

すなわち、配線ＲＷ［１］に電位Ｖ_Ｘ［１］を供給することにより、配線ＢＬｒｅｆから
メモリセルＭＣｒｅｆ［１］のトランジスタＴｒ１２に流れる電流は、ΔＩ_{ＭＣｒｅｆ［}
_１］＝Ｉ_{ＭＣｒｅｆ［１］，１}−Ｉ_{ＭＣｒｅｆ［１］，０}増加する。

また、配線ＢＬ［１］及び配線ＢＬｒｅｆに流れる電流について考える。配線ＢＬｒｅｆ
には、電流源回路ＣＳから電流Ｉ_Ｃｒｅｆが供給される。また、配線ＢＬｒｅｆを流れる
電流は、カレントミラー回路ＣＭ、メモリセルＭＣｒｅｆ［１］、ＭＣｒｅｆ［２］へ排
出される。配線ＢＬｒｅｆからカレントミラー回路ＣＭへ排出される電流をＩ_ＣＭ，１と
すると、次の式が成り立つ。

Ｉ_Ｃｒｅｆ−Ｉ_ＣＭ，１＝Ｉ_{ＭＣｒｅｆ［１］，１}＋Ｉ_{ＭＣｒｅｆ［２］，０}
（Ｅ９）

配線ＢＬ［１］には、電流源回路ＣＳから電流Ｉ_Ｃが供給される。また、配線ＢＬ［１］
を流れる電流は、カレントミラー回路ＣＭ、メモリセルＭＣ［１，１］、ＭＣ［２，１］
へ排出される。さらに、配線ＢＬ［１］からオフセット回路ＯＦＳＴにも電流が流れる。
配線ＢＬ［１］からオフセット回路ＯＦＳＴに流れる電流をＩ_α，１とすると、次の式が
成り立つ。

Ｉ_Ｃ−Ｉ_ＣＭ，１＝Ｉ_{ＭＣ［１，１］，１}＋Ｉ_{ＭＣ［２，１］，１}＋Ｉ_α，１
（Ｅ１０）

そして、式（Ｅ１）乃至式（Ｅ１０）から、電流Ｉ_α，０と電流Ｉ_α，１の差（差分電流
ΔＩ_α）は次の式で表すことができる。

ΔＩ_α＝Ｉ_α，１−Ｉ_α，０＝２ｋＶ_{Ｗ［１，１］}Ｖ_Ｘ［１］（Ｅ１１）

このように、差分電流ΔＩ_αは、電位Ｖ_{Ｗ［１，１］}とＶ_Ｘ［１］の積に応じた値となる
。

その後、時刻Ｔ０６−時刻Ｔ０７の期間において、配線ＲＷ［１］の電位は基準電位とな
り、ノードＮＭ［１，１］及びノードＮＭｒｅｆ［１］の電位は時刻Ｔ０４−時刻Ｔ０５
の期間と同様になる。

次に、時刻Ｔ０７−時刻Ｔ０８の期間において、配線ＲＷ［１］の電位が基準電位よりも
Ｖ_Ｘ［１］大きい電位となり、配線ＲＷ［２］の電位が基準電位よりもＶ_Ｘ［２］大きい
電位となる。これにより、メモリセルＭＣ［１，１］、及びメモリセルＭＣｒｅｆ［１］
のそれぞれの容量素子Ｃ１１に電位Ｖ_Ｘ［１］が供給され、容量結合によりノードＮＭ［
１，１］及びノードＮＭｒｅｆ［１］の電位がそれぞれＶ_Ｘ［１］上昇する。また、メモ
リセルＭＣ［２，１］、及びメモリセルＭＣｒｅｆ［２］のそれぞれの容量素子Ｃ１１に
電位Ｖ_Ｘ［２］が供給され、容量結合によりノードＮＭ［２，１］及びノードＮＭｒｅｆ
［２］の電位がそれぞれＶ_Ｘ［２］上昇する。

ここで、時刻Ｔ０７−時刻Ｔ０８の期間において、配線ＢＬ［１］からメモリセルＭＣ［
２，１］のトランジスタＴｒ１２に流れる電流Ｉ_{ＭＣ［２，１］，１}は、次の式で表すこ
とができる。

Ｉ_{ＭＣ［２，１］，１}＝ｋ（Ｖ_ＰＲ−Ｖ_{Ｗ［２，１］}＋Ｖ_Ｘ［２］−Ｖ_ｔｈ）^２
（Ｅ１２）

すなわち、配線ＲＷ［２］に電位Ｖ_Ｘ［２］を供給することにより、配線ＢＬ［１］から
メモリセルＭＣ［２，１］のトランジスタＴｒ１２に流れる電流は、ΔＩ_{ＭＣ［２，１］}
＝Ｉ_{ＭＣ［２，１］，１}−Ｉ_{ＭＣ［２，１］，０}増加する。

また、時刻Ｔ０７−時刻Ｔ０８の期間において、配線ＢＬｒｅｆからメモリセルＭＣｒｅ
ｆ［２］のトランジスタＴｒ１２に流れる電流Ｉ_{ＭＣｒｅｆ［２］，１}は、次の式で表す
ことができる。

Ｉ_{ＭＣｒｅｆ［２］，１}＝ｋ（Ｖ_ＰＲ＋Ｖ_Ｘ［２］−Ｖ_ｔｈ）^２（Ｅ１３）

すなわち、配線ＲＷ［２］に電位Ｖ_Ｘ［２］を供給することにより、配線ＢＬｒｅｆから
メモリセルＭＣｒｅｆ［２］のトランジスタＴｒ１２に流れる電流は、ΔＩ_{ＭＣｒｅｆ［}
_２］＝Ｉ_{ＭＣｒｅｆ［２］，１}−Ｉ_{ＭＣｒｅｆ［２］，０}増加する。

また、配線ＢＬ［１］及び配線ＢＬｒｅｆに流れる電流について考える。配線ＢＬｒｅｆ
には、電流源回路ＣＳから電流Ｉ_Ｃｒｅｆが供給される。また、配線ＢＬｒｅｆを流れる
電流は、カレントミラー回路ＣＭ、メモリセルＭＣｒｅｆ［１］、ＭＣｒｅｆ［２］へ排
出される。配線ＢＬｒｅｆからカレントミラー回路ＣＭへ排出される電流をＩ_ＣＭ，２と
すると、次の式が成り立つ。

Ｉ_Ｃｒｅｆ−Ｉ_ＣＭ，２＝Ｉ_{ＭＣｒｅｆ［１］，１}＋Ｉ_{ＭＣｒｅｆ［２］，１}
（Ｅ１４）

配線ＢＬ［１］には、電流源回路ＣＳから電流Ｉ_Ｃが供給される。また、配線ＢＬ［１］
を流れる電流は、カレントミラー回路ＣＭ、メモリセルＭＣ［１，１］、ＭＣ［２，１］
へ排出される。さらに、配線ＢＬ［１］からオフセット回路ＯＦＳＴにも電流が流れる。
配線ＢＬ［１］からオフセット回路ＯＦＳＴに流れる電流をＩ_α，２とすると、次の式が
成り立つ。

Ｉ_Ｃ−Ｉ_ＣＭ，２＝Ｉ_{ＭＣ［１，１］，１}＋Ｉ_{ＭＣ［２，１］，１}＋Ｉ_α，２
（Ｅ１５）

そして、式（Ｅ１）乃至式（Ｅ８）、及び、式（Ｅ１２）乃至式（Ｅ１５）から、電流Ｉ
_α，０と電流Ｉ_α，２の差（差分電流ΔＩ_α）は次の式で表すことができる。

ΔＩ_α＝Ｉ_α，２−Ｉ_α，０＝２ｋ（Ｖ_{Ｗ［１，１］}Ｖ_Ｘ［１］＋Ｖ_{Ｗ［２，１］}Ｖ_Ｘ［
_２］）（Ｅ１６）

このように、差分電流ΔＩ_αは、電位Ｖ_{Ｗ［１，１］}と電位Ｖ_Ｘ［１］の積と、電位Ｖ_Ｗ
_{［２，１］}と電位Ｖ_Ｘ［２］の積と、を足し合わせた結果に応じた値となる。

その後、時刻Ｔ０８−時刻Ｔ０９の期間において、配線ＲＷ［１］、［２］の電位は基準
電位となり、ノードＮＭ［１，１］、ＮＭ［２，１］及びノードＮＭｒｅｆ［１］、ＮＭ
ｒｅｆ［２］の電位は時刻Ｔ０４−時刻Ｔ０５の期間と同様になる。

式（Ｅ１１）及び式（Ｅ１６）に示されるように、オフセット回路ＯＦＳＴに入力される
差分電流ΔＩ_αは、第１のデータ（重み）に対応する電位Ｖ_Ｗと、第２のデータ（入力デ
ータ）に対応する電位Ｖ_Ｘの積の項を有する式から算出することができる。すなわち、差
分電流ΔＩ_αをオフセット回路ＯＦＳＴで計測することにより、第１のデータと第２のデ
ータの積和演算の結果を得ることができる。

なお、上記では特にメモリセルＭＣ［１，１］、ＭＣ［２，１］及びメモリセルＭＣｒｅ
ｆ［１］、ＭＣｒｅｆ［２］に着目したが、メモリセルＭＣ及びメモリセルＭＣｒｅｆの
数は任意に設定することができる。メモリセルＭＣ及びメモリセルＭＣｒｅｆの行数ｍを
任意の数ｉとした場合の差分電流ΔＩαは、次の式で表すことができる。

ΔＩ_α＝２ｋΣ_ｉＶ_{Ｗ［ｉ，１］}Ｖ_Ｘ［ｉ］（Ｅ１７）

また、メモリセルＭＣ及びメモリセルＭＣｒｅｆの列数ｎを増やすことにより、並列して
実行される積和演算の数を増やすことができる。

以上のように、半導体装置ＭＡＣを用いることにより、第１のデータと第２のデータの積
和演算を行うことができる。なお、メモリセルＭＣ及びメモリセルＭＣｒｅｆとして図１
４に示す構成を用いることにより、少ないトランジスタ数で積和演算回路を構成すること
ができる。そのため、半導体装置ＭＡＣの回路規模の縮小を図ることができる。

半導体装置ＭＡＣをニューラルネットワークにおける演算に用いる場合、メモリセルＭＣ
の行数ｍは一のニューロンに供給される入力データの数に対応させ、メモリセルＭＣの列
数ｎはニューロンの数に対応させることができる。例えば、図１２（Ａ）に示す中間層Ｈ
Ｌにおいて半導体装置ＭＡＣを用いた積和演算を行う場合を考える。このとき、メモリセ
ルＭＣの行数ｍは、入力層ＩＬから供給される入力データの数（入力層ＩＬのニューロン
の数）に設定し、メモリセルＭＣの列数ｎは、中間層ＨＬのニューロンの数に設定するこ
とができる。

なお、半導体装置ＭＡＣを適用するニューラルネットワークの構造は特に限定されない。
例えば半導体装置ＭＡＣは、畳み込みニューラルネットワーク（ＣＮＮ）、再帰型ニュー
ラルネットワーク（ＲＮＮ）、オートエンコーダ、ボルツマンマシン（制限ボルツマンマ
シンを含む）などに用いることもできる。

以上のように、半導体装置ＭＡＣを用いることにより、ニューラルネットワークの積和演
算を行うことができる。さらに、セルアレイＣＡに図１４に示すメモリセルＭＣ及びメモ
リセルＭＣｒｅｆを用いることにより、演算精度の向上、消費電力の削減、または回路規
模の縮小を図ることが可能な集積回路を提供することができる。

本実施の形態は、他の実施の形態と適宜組み合わせることができる。

ＡＤ：文章解析データ、ＡＤ_ｒｅｆ：参照用文章解析データ、Ｃ１１：容量素子、Ｃ２１
：容量素子、ＩＤ：ＩＤＦデータ、ＫＤ：キーワードデータ、ＫＷ：キーワード、ＫＷ_１
：キーワード、ＫＷ_２：キーワード、ＫＷ_ｘ：キーワード、ＬＤ：ランキングデータ、Ｎ
Ｎ：ニューラルネットワーク、Ｒ１：抵抗素子、ＲＤ：関連語データ、ＲＳ：関連度、Ｒ
Ｗ：関連語、ＲＷ_ｘ１：関連語、ＲＷ_ｘ２：関連語、ＲＷ_ｘｙ：関連語、ＴＤ：文章デー
タ、ＴＤ_ｒｅｆ：参照用文章データ、Ｔｒ１１：トランジスタ、Ｔｒ１２：トランジスタ
、Ｔｒ２１：トランジスタ、Ｔｒ２２：トランジスタ、Ｔｒ２３：トランジスタ、ＶＤ：
ベクトルデータ、１００：文書検索システム、１０１：入力部、１０２：伝送路、１０３
：処理部、１０５：記憶部、１０７：データベース、１０９：出力部、１５０：文書検索
システム、１５１：サーバ、１５２：端末、１６１ａ：通信部、１６１ｂ：通信部、１６
２：伝送路、１６３ａ：処理部、１６３ｂ：処理部、１６５：記憶部、１６７：データベ
ース、１６８：伝送路、１６９：入出力部

Claims

文章データに含まれるキーワードを抽出し、
複数の第１の参照用文章解析データに含まれる単語の分散表現を機械学習することで得られる分散表現ベクトルを用いて、前記複数の第１の参照用文章解析データに含まれる単語の中から前記キーワードの関連語を抽出し、
前記キーワード及び前記関連語を用いて、前記文章データに関連または類似するデータを検索する文書検索方法。
文章データに含まれるキーワードを抽出し、
複数の第１の参照用文章解析データに含まれる単語の分散表現を機械学習することで得られる分散表現ベクトルを用いて、前記複数の第１の参照用文章解析データに含まれる単語の中から前記キーワードの関連語を抽出し、
前記キーワード及び前記関連語の変更を受け付け、前記受け付け後の前記キーワード及び前記関連語を用いて、前記文章データに関連または類似するデータを検索する文書検索方法。
文章データに含まれるキーワードを抽出し、
複数の第１の参照用文章解析データに含まれる単語の分散表現を機械学習することで得られる前記キーワードの分散表現ベクトル及び前記単語の分散表現ベクトルを用いて、前記複数の第１の参照用文章解析データに含まれる単語の中から前記キーワードの関連語を抽出し、
前記キーワード及び前記関連語を用いて、前記文章データに関連または類似するデータを検索する文書検索方法。
文章データに含まれるキーワードを抽出し、
複数の第１の参照用文章解析データに含まれる単語の分散表現を機械学習することで得られる前記キーワードの分散表現ベクトルと前記単語の分散表現ベクトルを用いて、前記複数の第１の参照用文章解析データに含まれる単語の中から前記キーワードの関連語を抽出し、
前記キーワード及び前記関連語の変更を受け付け、前記受け付け後の前記キーワード及び前記関連語を用いて、前記文章データに関連または類似するデータを検索する文書検索方法。
文章データに含まれるキーワードを抽出し、
複数の第１の参照用文章解析データに含まれる単語の分散表現を機械学習することで得られる分散表現ベクトルを用いて、前記複数の第１の参照用文章解析データに含まれる単語の中から前記キーワードの関連語を抽出し、
前記キーワード及び前記関連語のそれぞれに対して、重みを付与し、
複数の第２の参照用文章解析データのそれぞれに対して、前記重みに基づいて点数を付与し、
前記点数に基づいて前記複数の第２の参照用文章解析データを順位づけすることで、ランキングデータを生成し、
前記ランキングデータを出力する、文書検索方法。
文章データに含まれるキーワードを抽出し、
複数の第１の参照用文章解析データに含まれる単語の分散表現を機械学習することで得られる分散表現ベクトルを用いて、前記複数の第１の参照用文章解析データに含まれる単語の中から前記キーワードの関連語を抽出し、
前記キーワード及び前記関連語の変更を受け付け、
前記受け付け後の前記キーワード及び前記関連語のそれぞれに対して、重みを付与し、
複数の第２の参照用文章解析データのそれぞれに対して、前記重みに基づいて点数を付与し、
前記点数に基づいて前記複数の第２の参照用文章解析データを順位づけすることで、ランキングデータを生成し、
前記ランキングデータを出力する、文書検索方法。
文章データに含まれるキーワードを抽出し、
複数の第１の参照用文章解析データに含まれる単語の分散表現を機械学習することで得られる前記キーワードの分散表現ベクトル及び前記単語の分散表現ベクトルを用いて、前記複数の第１の参照用文章解析データに含まれる単語の中から前記キーワードの関連語を抽出し、
前記キーワード及び前記関連語のそれぞれに対して、重みを付与し、
複数の第２の参照用文章解析データのそれぞれに対して、前記重みに基づいて点数を付与し、
前記点数に基づいて前記複数の第２の参照用文章解析データを順位づけすることで、ランキングデータを生成し、
前記ランキングデータを出力する、文書検索方法。
文章データに含まれるキーワードを抽出し、
複数の第１の参照用文章解析データに含まれる単語の分散表現を機械学習することで得られる前記キーワードの分散表現ベクトル及び前記単語の分散表現ベクトルを用いて、前記複数の第１の参照用文章解析データに含まれる単語の中から前記キーワードの関連語を抽出し、
前記キーワード及び前記関連語の変更を受け付け、
前記受け付け後の前記キーワード及び前記関連語のそれぞれに対して、重みを付与し、
複数の第２の参照用文章解析データのそれぞれに対して、前記重みに基づいて点数を付与し、
前記点数に基づいて前記複数の第２の参照用文章解析データを順位づけすることで、ランキングデータを生成し、
前記ランキングデータを出力する、文書検索方法。
文章データに含まれるキーワードを抽出し、
複数の第１の参照用文章解析データに含まれる単語の分散表現を機械学習することで得られる分散表現ベクトルを用いて、前記複数の第１の参照用文章解析データに含まれる単語の中から前記キーワードの関連語を抽出し、
前記キーワード及び前記関連語のそれぞれに対して、重みを付与し、
前記重みの修正を受け付け、
複数の第２の参照用文章解析データのそれぞれに対して、前記受け付け後の重みに基づいて点数を付与し、
前記点数に基づいて前記複数の第２の参照用文章解析データを順位づけすることで、ランキングデータを生成し、
前記ランキングデータを出力する、文書検索方法。
文章データに含まれるキーワードを抽出し、
複数の第１の参照用文章解析データに含まれる単語の分散表現を機械学習することで得られる分散表現ベクトルを用いて、前記複数の第１の参照用文章解析データに含まれる単語の中から前記キーワードの関連語を抽出し、
前記キーワード及び前記関連語の変更を受け付け、
前記受け付け後の前記キーワード及び前記関連語のそれぞれに対して、重みを付与し、
前記重みの修正を受け付け、
複数の第２の参照用文章解析データのそれぞれに対して、前記受け付け後の重みに基づいて点数を付与し、
前記点数に基づいて前記複数の第２の参照用文章解析データを順位づけすることで、ランキングデータを生成し、
前記ランキングデータを出力する、文書検索方法。
文章データに含まれるキーワードを抽出し、
複数の第１の参照用文章解析データに含まれる単語の分散表現を機械学習することで得られる前記キーワードの分散表現ベクトル及び前記単語の分散表現ベクトルを用いて、前記複数の第１の参照用文章解析データに含まれる単語の中から前記キーワードの関連語を抽出し、
前記キーワード及び前記関連語のそれぞれに対して、重みを付与し、
前記重みの修正を受け付け、
複数の第２の参照用文章解析データのそれぞれに対して、前記受け付け後の重みに基づいて点数を付与し、
前記点数に基づいて前記複数の第２の参照用文章解析データを順位づけすることで、ランキングデータを生成し、
前記ランキングデータを出力する、文書検索方法。
文章データに含まれるキーワードを抽出し、
複数の第１の参照用文章解析データに含まれる単語の分散表現を機械学習することで得られる前記キーワードの分散表現ベクトル及び前記単語の分散表現ベクトルを用いて、前記複数の第１の参照用文章解析データに含まれる単語の中から前記キーワードの関連語を抽出し、
前記キーワード及び前記関連語の変更を受け付け、
前記受け付け後の前記キーワード及び前記関連語のそれぞれに対して、重みを付与し、
前記重みの修正を受け付け、
複数の第２の参照用文章解析データのそれぞれに対して、前記受け付け後の重みに基づいて点数を付与し、
前記点数に基づいて前記複数の第２の参照用文章解析データを順位づけすることで、ランキングデータを生成し、
前記ランキングデータを出力する、文書検索方法。
請求項７、８、１１、及び１２のいずれか一において、
前記キーワードの前記重みは、前記キーワードの、前記複数の第１の参照用文章解析データまたは前記複数の第２の参照用文章解析データにおける逆文書頻度に基づいた値であり、
前記関連語の前記重みは、前記関連語の分散表現ベクトルと前記キーワードの分散表現ベクトルとの類似度または距離に基づいた値と、前記キーワードの前記重みと、の積である、文書検索方法。
請求項５乃至８のいずれか一、または請求項７及び８のいずれか一を引用する請求項１３において、
前記点数の付与は、前記キーワードまたは前記関連語と一致する単語を有する前記第２の参照用文章解析データに対して、前記重みに基づいた点数を付与することにより行う、文書検索方法。
請求項９乃至１２のいずれか一、または請求項９乃至１２のいずれか一を引用する請求項１３において、
前記点数の付与は、前記キーワードまたは前記関連語と一致する単語を有する前記第２の参照用文章解析データに対して、前記受け付け後の重みに基づいた点数を付与することにより行う、文書検索方法。
請求項５乃至１５のいずれか一において、
前記複数の第１の参照用文章解析データは、前記複数の第２の参照用文章解析データと同一である、文書検索方法。
請求項５乃至１６のいずれか一において、
前記文章データの形態素解析を行うことで解析データを生成し、
前記複数の第１の参照用文章解析データまたは前記複数の第２の参照用文章解析データにおける逆文書頻度の高さに基づいて、前記解析データに含まれる単語の中から前記キーワードを抽出する、文書検索方法。
請求項５乃至１７のいずれか一において、
第２の参照用文章データの形態素解析を行うことで前記第２の参照用文章解析データを生成する、文書検索方法。
請求項１乃至１８のいずれか一において、
第１の参照用文章データの形態素解析を行うことで前記第１の参照用文章解析データを生成する、文書検索方法。
請求項１乃至１９のいずれか一において、
前記単語の分散表現ベクトルは、ニューラルネットワークを用いて生成されたベクトルである、文書検索方法。
請求項１乃至２０のいずれか一に記載の文書検索方法を実行するサーバと、
前記サーバに前記文章データを供給し、前記サーバから前記ランキングデータを供給される電子機器と、を有し、
前記サーバと前記電子機器は、有線通信及び無線通信のうち一方または双方により通信を行う文書検索システム。
請求項１乃至２０のいずれか一に記載の文書検索方法をコンピュータに実行させるプログラム。