WO2020217140A1

WO2020217140A1 - 文書検索システム、および文書検索方法

Info

Publication number: WO2020217140A1
Application number: PCT/IB2020/053578
Authority: WO
Inventors: 東和樹; 桃純平
Original assignee: 株式会社半導体エネルギー研究所
Priority date: 2019-04-26
Filing date: 2020-04-16
Publication date: 2020-10-29
Also published as: CN113711205A; KR20220002394A; US20220207070A1; JPWO2020217140A1

Abstract

簡便な入力方法で、精度の高い文書検索、特に知的財産に係る文書の検索を実現する。処理部は、入力部に入力された文章データから文章解析データを生成する機能と、文章解析データに含まれる単語の中から検索ワードを抽出する機能と、検索ワードから、重み辞書データおよび類義語辞書データに基づいて、第１の検索データを生成する機能と、を有する。記憶部は、第１の検索データがユーザに修正されることで生成される、第２の検索データを記憶する。処理部は、第２の検索データに応じて、類義語辞書データの更新を行う。

Description

文書検索システム、および文書検索方法

　本発明の一態様は、文書検索システム、および文書検索方法に関する。

　なお、本発明の一態様は、上記の技術分野に限定されない。本発明の一態様の技術分野としては、半導体装置、表示装置、発光装置、蓄電装置、記憶装置、電子機器、照明装置、入力装置（例えば、タッチセンサなど）、入出力装置（例えば、タッチパネルなど）、それらの駆動方法、またはそれらの製造方法を一例として挙げることができる。

　出願前の発明に関し先行技術調査を行うことで、関連する知的財産権が存在するか否かを調査することができる。先行技術調査を行うことで得られた国内外の特許文献および論文などは、発明の新規性および進歩性の確認、並びに、特許を出願するか否かの判断に、利用することができる。また、特許文献の無効資料調査を行うことで、自身の所有する特許権が無効化する恐れが無いか、或いは、他者の所有する特許権を無効化できるか、調査することができる。

　例えば、特許文献を検索するシステムに、ユーザがキーワードを入力することで、そのキーワードを含む特許文献を出力することができる。

　このようなシステムを用いて高い精度で先行技術調査を行うためには、適切なキーワードで検索すること、さらに、出力された多くの特許文献から必要な特許文献を抽出することなど、ユーザに高い技量が求められる。

　また、様々な用途において、人工知能の活用が検討されている。特に、人工ニューラルネットワークなどを利用することで、従来のノイマン型コンピュータよりも高性能なコンピュータが実現できると期待されており、近年、電子回路上で人工ニューラルネットワークを構築する種々の研究が進められている。

　例えば、特許文献１には、チャネル形成領域に酸化物半導体を有するトランジスタを用いた記憶装置によって、人工ニューラルネットワークを用いた計算に必要な重みデータを保持する発明が開示されている。

米国特許公開第２０１６／０３４３４５２号公報

　そこで、本発明の一態様は、高い精度で文書を検索できる文書検索システムを提供することを課題の一つとする。または、本発明の一態様は、高い精度で文書を検索できる文書検索方法を提供することを課題の一つとする。または、本発明の一態様は、簡便な入力方法で、精度の高い文書検索、特に知的財産に係る文書の検索を実現することを課題の一つとする。

　複数の課題の記載は、互いの課題の存在を妨げるものではない。本発明の一形態は、例示した全ての課題を解決する必要はない。また、列記した以外の課題が、本明細書の記載から、自ずと明らかとなり、このような課題も、本発明の一形態の課題となり得る。

　本発明の一態様は、入力部と、データベースと、記憶部と、処理部と、を有し、データベースは、複数の参照用文書データと、重み辞書データと、類義語辞書データと、を記憶する機能を有し、処理部は、参照用文書データに基づいて、重み辞書データおよび類義語辞書データを生成する機能と、入力部に入力された文章データから文章解析データを生成する機能と、文章解析データに含まれる単語の中から検索ワードを抽出する機能と、検索ワードから、重み辞書データおよび類義語辞書データに基づいて、第１の検索データを生成する機能と、を有し、記憶部は、第１の検索データがユーザに修正されることで生成される、第２の検索データを記憶する機能を有し、処理部は、第２の検索データに応じて、類義語辞書データの更新を行う機能を有する、文書検索システムである。

　本発明の一態様において、処理部は、参照用文書データから参照用文章解析データを生成する機能と、参照用文章解析データに含まれる単語の中から複数のキーワードおよびキーワードに対応する関連語を抽出する機能と、を有する、文書検索システムが好ましい。

　本発明の一態様において、重み辞書データは、参照用文章解析データに含まれる単語の中から、キーワードの出現頻度を抽出し、キーワードのそれぞれに対して、出現頻度に応じた第１の重みを付与して生成されるデータである、文書検索システムが好ましい。

　本発明の一態様において、第１の重みは、キーワードの、参照用文章解析データにおける逆文書頻度に基づいた値である、文書検索システムが好ましい。

　本発明の一態様において、類義語辞書データは、関連語のそれぞれに対して、第２の重みを付与して生成されるデータである、文書検索システムが好ましい。

　本発明の一態様において、第２の重みは、関連語の分散表現ベクトルとキーワードの分散表現ベクトルとの類似度または距離に基づいた値と、キーワードの第１の重みと、の積である、文書検索システムが好ましい。

　本発明の一態様において、分散表現ベクトルは、ニューラルネットワークを用いて生成されたベクトルである、文書検索システムが好ましい。

　本発明の一態様において、処理部は、トランジスタを有し、トランジスタは、チャネル形成領域に金属酸化物を有する、文書検索システムが好ましい。

　本発明の一態様において、処理部は、トランジスタを有し、トランジスタは、チャネル形成領域にシリコンを有する、文書検索システムが好ましい。

　本発明の一態様は、複数の参照用文書データに基づいて、重み辞書データおよび類義語辞書データを生成し、文章データから文章解析データを生成し、文章解析データに含まれる単語の中から検索ワードを抽出し、検索ワードから、重み辞書データおよび類義語辞書データに基づいて、第１の検索データを生成し、第１の検索データがユーザに修正されることで生成される第２の検索データに応じて、類義語辞書データの更新を行い、第２の検索データに基づいて参照用文書データに点数を付与し、点数に基づいて複数の参照用文書データを順位づけすることで、ランキングデータを生成する、文書検索方法である。

　本発明の一態様において、参照用文書データから参照用文章解析データを生成し、参照用文章解析データに含まれる単語の中から複数のキーワードおよびキーワードの関連語を抽出する、文書検索方法が好ましい。

　本発明の一態様において、重み辞書データは、参照用文章解析データに含まれる単語の中から、キーワードの出現頻度を抽出し、複数のキーワードのそれぞれに対して、出現頻度に応じた第１の重みを付与して生成されるデータである、文書検索方法が好ましい。

　本発明の一態様において、第１の重みは、キーワードの、参照用文章解析データにおける逆文書頻度に基づいた値である、文書検索方法が好ましい。

　本発明の一態様において、類義語辞書データは、関連語のそれぞれに対して、第２の重みを付与して生成されるデータである、文書検索方法が好ましい。

　本発明の一態様において、第２の重みは、関連語の分散表現ベクトルとキーワードの分散表現ベクトルとの類似度または距離に基づいた値と、キーワードの第１の重みと、の積である、文書検索方法が好ましい。

　本発明の一態様において、分散表現ベクトルは、ニューラルネットワークを用いて生成されたベクトルである、文書検索方法が好ましい。

　なおその他の本発明の一態様については、以下で述べる実施の形態における説明、および図面に記載されている。

　本発明の一態様により、高い精度で文書を検索できる文書検索システムを提供できる。または、本発明の一態様により、高い精度で文書を検索できる文書検索方法を提供できる。または、本発明の一態様により、簡単な入力方法で、精度の高い文書検索、特に知的財産に係る文書の検索を実現できる。

　複数の効果の記載は、他の効果の存在を妨げるものではない。また、本発明の一形態は、必ずしも、例示した効果の全てを有する必要はない。また、本発明の一形態について、上記以外の課題、効果、および新規な特徴については、本明細書の記載および図面から自ずと明らかになるものである。

図１は、文書検索システムの一例を示すブロック図である。
図２は、文書検索方法を説明するためのフロー図である。
図３は、文書検索方法を説明するためのフロー図である。
図４は、文書検索方法を説明するためのフロー図である。
図５は、文書検索方法を説明するためのフロー図である。
図６Ａ乃至図６Ｃは、文書検索方法を説明するための模式図である。
図７は、文書検索方法を説明するための模式図である。
図８は、文書検索方法を説明するための模式図である。
図９は、文書検索方法を説明するための模式図である。
図１０は、文書検索方法を説明するためのフロー図である。
図１１は、文書検索方法を説明するためのフロー図である。
図１２は、文書検索方法を説明するためのフロー図である。
図１３Ａ、図１３Ｂは、ニューラルネットワークの構成例を示す図である。
図１４は、半導体装置の構成例を示す図である。
図１５は、メモリセルの構成例を示す図である。
図１６は、オフセット回路の構成例を示す図である。
図１７は、タイミングチャートである。

　以下に、本発明の実施の形態を説明する。ただし、本発明の一形態は、以下の説明に限定されず、本発明の主旨およびその範囲から逸脱することなくその形態および詳細を様々に変更し得ることは、当業者であれば容易に理解される。したがって、本発明の一形態は、以下に示す実施の形態の記載内容に限定して解釈されるものではない。

　なお本明細書等において、「第１」、「第２」、「第３」という序数詞は、構成要素の混同を避けるために付したものである。従って、構成要素の数を限定するものではない。また、構成要素の順序を限定するものではない。また例えば、本明細書等の実施の形態の一において「第１」に言及された構成要素が、他の実施の形態、あるいは特許請求の範囲において「第２」に言及された構成要素とすることもありうる。また例えば、本明細書等の実施の形態の一において「第１」に言及された構成要素を、他の実施の形態、あるいは特許請求の範囲において省略することもありうる。

　図面において、同一の要素または同様な機能を有する要素、同一の材質の要素、あるいは同時に形成される要素等には同一の符号を付す場合があり、その繰り返しの説明は省略する場合がある。

　本明細書において、例えば、電源電位ＶＤＤを、電位ＶＤＤ、ＶＤＤ等と省略して記載する場合がある。これは、他の構成要素（例えば、信号、電圧、回路、素子、電極、配線等）についても同様である。

　また、複数の要素に同じ符号を用いる場合、特に、それらを区別する必要があるときには、符号に“＿１”、“＿２”、“［ｎ］”、“［ｍ，ｎ］”等の識別用の符号を付記して記載する場合がある。例えば、２番目の配線ＧＬを配線ＧＬ［２］と記載する。

（実施の形態１）
　本実施の形態では、本発明の一態様の文書検索システムおよび文書検索方法について図１乃至図１２を用いて説明する。

　本実施の形態では、文書検索システムの一例として、知的財産の検索に用いることができる文書検索システムについて説明する。なお、本発明の一態様の文書検索システムは、知的財産の検索用途に限られず、知的財産以外の検索に使用することもできる。

　図１に、文書検索システム１０のブロック図を示す。文書検索システム１０は、入力部２０、処理部３０、記憶部４０、データベース５０、出力部６０、および伝送路７０を有する。

　入力部２０には、文書検索システム１０の外部からデータ（文章データ２１など）が供給される。また入力部には、出力部６０から出力されるデータ（検索データ６１など）を、文書検索システムを利用するユーザが修正することで生成される、修正されたデータ（検索データ６２など）が供給される。文章データ２１および検索データ６２は、伝送路７０を介して、処理部３０、記憶部４０またはデータベース５０に供給される。

　なお本明細書等において、知的財産に係る文書のデータは文書データと呼ぶ。上記文章データは、文書データの一部に相当するデータである。文書データとしては、具体的には、特許文献（公開特許公報、特許公報など）、実用新案公報、意匠公報、および論文などの刊行物のデータが挙げられる。国内で発行された刊行物に限られず、世界各国で発行された刊行物を、知的財産に係る文書データとして用いることができる。なお文書データは、検索したい文章を含む文章データに対して参照されるデータに相当する。そのため、文書データは参照用文書データと呼ぶ場合がある。

　上記文章データ２１は、上記参照用文書データの一部のデータである。具体的に言えば、特許文献に含まれる明細書、特許請求の範囲、および要約書は、それぞれ、一部または全部を文章データ２１として用いることができる。例えば、特定の発明を実施するための形態、実施例、または請求項を、文章データ２１として用いてもよい。同様に、論文など他の刊行物に含まれる文章についても、一部または全部を文章データ２１として用いることができる。

　知的財産に係る文書は、刊行物に限られない。例えば、文書検索システムのユーザまたは使用団体が独自に有する文書ファイルも文章データ２１として用いることができる。

　さらに、知的財産に係る文書としては、発明、考案、もしくは意匠、または工業製品を説明する文章などが挙げられる。

　文章データ２１は、例えば、特定の出願人の特許文献、または特定の技術分野の特許文献を有することができる。

　文章データ２１は、知的財産自体の説明（例えば、明細書など）だけでなく、当該知的財産に関係する様々な情報（例えば、書誌情報など）を有することができる。当該情報としては、例えば、特許の出願人、技術分野、出願番号、公開番号、ステータス（係属中、登録済、取り下げ済など）などが挙げられる。

　文章データ２１は、知的財産に係る日付情報を有することが好ましい。日付情報としては、例えば、知的財産が特許文献であれば、出願日、公開日、登録日などが挙げられ、知的財産が工業製品の技術情報であれば、発売日などが挙げられる。

　このように、文章データ２１が知的財産に関係する様々な情報を有することで、文書検索システムを用いて、様々な検索範囲を選択することができる。

　処理部３０は、入力部２０、記憶部４０、データベース５０などから供給されたデータを用いて、演算、推論などを行う機能を有する。処理部３０は、演算結果、推論結果などを、記憶部４０、データベース５０、出力部６０などに供給することができる。

　処理部３０には、チャネル形成領域に金属酸化物を有するトランジスタを用いることが好ましい。当該トランジスタはオフ電流が極めて小さいため、当該トランジスタを記憶素子として機能する容量素子に流入した電荷（データ）を保持するためのスイッチとして用いることで、データの保持期間を長期にわたり確保することができる。この特性を、処理部３０が有するレジスタおよびキャッシュメモリのうち少なくとも一方に用いることで、必要なときだけ処理部３０を動作させ、他の場合には直前の処理の情報を当該記憶素子に待避させることにより処理部３０をオフにすることができる。すなわち、ノーマリーオフコンピューティングが可能となり、文書検索システムの低消費電力化を図ることができる。

　なお、本明細書等において、チャネル形成領域に酸化物半導体または金属酸化物を用いたトランジスタをＯｘｉｄｅ　Ｓｅｍｉｃｏｎｄｕｃｔｏｒトランジスタ、あるいはＯＳトランジスタと呼ぶ。ＯＳトランジスタのチャネル形成領域は、金属酸化物を有することが好ましい。

　本明細書等において、金属酸化物（ｍｅｔａｌ　ｏｘｉｄｅ）とは、広い意味での金属の酸化物である。金属酸化物は、酸化物絶縁体、酸化物導電体（透明酸化物導電体を含む）、酸化物半導体（Ｏｘｉｄｅ　Ｓｅｍｉｃｏｎｄｕｃｔｏｒまたは単にＯＳともいう）などに分類される。例えば、トランジスタの半導体層に金属酸化物を用いた場合、当該金属酸化物を酸化物半導体と呼称する場合がある。つまり、金属酸化物が増幅作用、整流作用、およびスイッチング作用の少なくとも１つを有する場合、当該金属酸化物を、金属酸化物半導体（ｍｅｔａｌ　ｏｘｉｄｅ　ｓｅｍｉｃｏｎｄｕｃｔｏｒ）、略してＯＳと呼ぶことができる。

　チャネル形成領域が有する金属酸化物はインジウム（Ｉｎ）を含むことが好ましい。チャネル形成領域が有する金属酸化物がインジウムを含む金属酸化物の場合、ＯＳトランジスタのキャリア移動度（電子移動度）が高くなる。また、チャネル形成領域が有する金属酸化物は、元素Ｍを含む酸化物半導体であると好ましい。元素Ｍは、好ましくは、アルミニウム（Ａｌ）、ガリウム（Ｇａ）またはスズ（Ｓｎ）などとする。そのほかの元素Ｍに適用可能な元素としては、ホウ素（Ｂ）、シリコン（Ｓｉ）、チタン（Ｔｉ）、鉄（Ｆｅ）、ニッケル（Ｎｉ）、ゲルマニウム（Ｇｅ）、イットリウム（Ｙ）、ジルコニウム（Ｚｒ）、モリブデン（Ｍｏ）、ランタン（Ｌａ）、セリウム（Ｃｅ）、ネオジム（Ｎｄ）、ハフニウム（Ｈｆ）、タンタル（Ｔａ）、タングステン（Ｗ）などがある。ただし、元素Ｍとして、前述の元素を複数組み合わせても構わない場合がある。元素Ｍは、例えば、酸素との結合エネルギーが高い元素である。例えば、酸素との結合エネルギーがインジウムよりも高い元素である。また、チャネル形成領域が有する金属酸化物は、亜鉛（Ｚｎ）を含む金属酸化物であると好ましい。亜鉛を含む金属酸化物は結晶化しやすくなる場合がある。

　チャネル形成領域が有する金属酸化物は、インジウムを含む金属酸化物に限定されない。半導体層は、例えば、亜鉛スズ酸化物、ガリウムスズ酸化物などの、インジウムを含まず、亜鉛を含む金属酸化物、ガリウムを含む金属酸化物、スズを含む金属酸化物などであっても構わない。

　また、処理部３０には、チャネル形成領域にシリコンを含むトランジスタを用いてもよい。

　また、処理部３０には、チャネル形成領域に酸化物半導体を含むトランジスタと、チャネル形成領域にシリコンを含むトランジスタと、を組み合わせて用いることが好ましい。

　処理部３０は、例えば、演算回路または中央演算装置（ＣＰＵ：Ｃｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）等を有する。

　処理部３０は、ＤＳＰ（Ｄｉｇｉｔａｌ　Ｓｉｇｎａｌ　Ｐｒｏｃｅｓｓｏｒ）、ＧＰＵ（Ｇｒａｐｈｉｃｓ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）等のマイクロプロセッサを有していてもよい。マイクロプロセッサは、ＦＰＧＡ（Ｆｉｅｌｄ　Ｐｒｏｇｒａｍｍａｂｌｅ　Ｇａｔｅ　Ａｒｒａｙ）、ＦＰＡＡ（Ｆｉｅｌｄ　Ｐｒｏｇｒａｍｍａｂｌｅ　Ａｎａｌｏｇ　Ａｒｒａｙ）等のＰＬＤ（Ｐｒｏｇｒａｍｍａｂｌｅ　Ｌｏｇｉｃ　Ｄｅｖｉｃｅ）によって実現された構成であってもよい。処理部３０は、プロセッサにより種々のプログラムからの命令を解釈し実行することで、各種のデータ処理およびプログラム制御を行うことができる。プロセッサにより実行しうるプログラムは、プロセッサが有するメモリ領域および記憶部４０のうち少なくとも一方に格納される。

　処理部３０はメインメモリを有していてもよい。メインメモリは、ＲＡＭ（Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ）等の揮発性メモリ、およびＲＯＭ（Ｒｅａｄ　Ｏｎｌｙ　Ｍｅｍｏｒｙ）等の不揮発性メモリのうち少なくとも一方を有する。

　ＲＡＭとしては、例えばＤＲＡＭ（Ｄｙｎａｍｉｃ　Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ）、ＳＲＡＭ（Ｓｔａｔｉｃ　Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ）等が用いられ、処理部３０の作業空間として仮想的にメモリ空間が割り当てられ利用される。記憶部４０に格納されたオペレーティングシステム、アプリケーションプログラム、プログラムモジュール、プログラムデータ、およびルックアップテーブル等は、実行のためにＲＡＭにロードされる。ＲＡＭにロードされたこれらのデータ、プログラム、およびプログラムモジュールは、それぞれ、処理部３０に直接アクセスされ、操作される。

　ＲＯＭには、書き換えを必要としない、ＢＩＯＳ（Ｂａｓｉｃ　Ｉｎｐｕｔ／Ｏｕｔｐｕｔ　Ｓｙｓｔｅｍ）およびファームウェア等を格納することができる。ＲＯＭとしては、マスクＲＯＭ、ＯＴＰＲＯＭ（Ｏｎｅ　Ｔｉｍｅ　Ｐｒｏｇｒａｍｍａｂｌｅ　Ｒｅａｄ　Ｏｎｌｙ　Ｍｅｍｏｒｙ）、ＥＰＲＯＭ（Ｅｒａｓａｂｌｅ　Ｐｒｏｇｒａｍｍａｂｌｅ　Ｒｅａｄ　Ｏｎｌｙ　Ｍｅｍｏｒｙ）等が挙げられる。ＥＰＲＯＭとしては、紫外線照射により記憶データの消去を可能とするＵＶ−ＥＰＲＯＭ（Ｕｌｔｒａ−Ｖｉｏｌｅｔ　Ｅｒａｓａｂｌｅ　Ｐｒｏｇｒａｍｍａｂｌｅ　Ｒｅａｄ　Ｏｎｌｙ　Ｍｅｍｏｒｙ）、ＥＥＰＲＯＭ（Ｅｌｅｃｔｒｉｃａｌｌｙ　Ｅｒａｓａｂｌｅ　Ｐｒｏｇｒａｍｍａｂｌｅ　Ｒｅａｄ　Ｏｎｌｙ　Ｍｅｍｏｒｙ）、フラッシュメモリ等が挙げられる。

　記憶部４０は、処理部３０が実行するプログラムを記憶する機能を有する。また、記憶部４０は、処理部３０が生成した演算結果および推論結果、並びに、入力部２０に入力されたデータなどを記憶する機能を有していてもよい。また記憶部４０は、入力部２０に入力される検索データ６２を、検索データ４１として記憶部４０内に記憶する機能を有する。記憶部４０に記憶される検索データ４１は、後述する類似語辞書データを更新するために用いられる。

　記憶部４０は、揮発性メモリおよび不揮発性メモリのうち少なくとも一方を有する。記憶部４０は、例えば、ＤＲＡＭ、ＳＲＡＭなどの揮発性メモリを有していてもよい。記憶部４０は、例えば、ＲｅＲＡＭ（Ｒｅｓｉｓｔｉｖｅ　Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ、抵抗変化型メモリともいう）、ＰＲＡＭ（Ｐｈａｓｅ　ｃｈａｎｇｅ　Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ）、ＦｅＲＡＭ（Ｆｅｒｒｏｅｌｅｃｔｒｉｃ　Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ）、ＭＲＡＭ（Ｍａｇｎｅｔｏｒｅｓｉｓｔｉｖｅ　Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ、磁気抵抗型メモリともいう）、またはフラッシュメモリなどの不揮発性メモリを有していてもよい。また、記憶部４０は、ハードディスクドライブ（Ｈａｒｄ　Ｄｉｓｃ　Ｄｒｉｖｅ：ＨＤＤ）およびソリッドステートドライブ（Ｓｏｌｉｄ　Ｓｔａｔｅ　Ｄｒｉｖｅ：ＳＳＤ）等の記録メディアドライブを有していてもよい。

　データベース５０は、少なくとも、検索対象となる参照用文書データ５１、重み辞書データ５２、および類似語検索データ５３を記憶する機能を有する。また、データベース５０は、処理部３０が生成した演算結果および推論結果、並びに、入力部２０に入力されたデータなどを記憶する機能を有していてもよい。なお、記憶部４０およびデータベース５０は互いに分離されていなくてもよい。例えば、文書検索システム１０は、記憶部４０およびデータベース５０の双方の機能を有する記憶ユニットを有していてもよい。

　参照用文書データ５１は、知的財産に係る複数の文書のデータである。また重み辞書データ５２は、参照用文書データ５１を解析して得られる参照用文章解析データに含まれる単語の中から、複数のキーワードの出現頻度を抽出し、複数のキーワードのそれぞれに対して、出現頻度に応じた重みを付与して生成されるデータである。また類似語検索データ５３は、参照用文章解析データに含まれる単語の中から、キーワードに対応する関連語を抽出し、関連語のそれぞれに対して類似度に応じた重みを付与して生成されるデータである。

　またデータベース５０は、重み辞書データ５２および類似語検索データ５３の生成に必要な逆文書頻度（Ｉｎｖｅｒｓｅ　Ｄｏｃｕｍｅｎｔ　Ｆｒｅｑｕｅｎｃｙ、以下ＩＤＦと記す）データ（以下、ＩＤＦデータと記す）を記憶する機能を有する。ＩＤＦは、ある単語の文書への現れにくさを表す。多くの文書に出現する単語のＩＤＦは小さく、一部の文書にのみ出現する単語のＩＤＦは高くなる。したがって、ＩＤＦが高い単語は、参照用文章解析データにおいて特徴的な単語であるといえる。上記キーワードの出現頻度の算定には、ＩＤＦデータを用いることが好ましい。

　なお文章データからの検索ワードの抽出も、ＩＤＦに基づいて行うことができる。例えば、ＩＤＦがある数値以上の単語を検索ワードとして抽出してもよく、ＩＤＦが高い順に任意の個数の単語を検索ワードとして抽出することができる。

　またデータベース５０は、キーワードに対応する関連語の算定に必要なベクトルデータを記憶する機能を有する。関連語は、参照用文章解析データに含まれる単語の中から、当該単語の分散表現ベクトルとキーワードの分散表現ベクトルとの類似度の高さまたは距離の近さに基づいて抽出する。関連語の重みの算定は、関連語の分散表現ベクトルとキーワードの分散表現ベクトルとの類似度または距離に基づいた値と、キーワードの重みと、の積を用いることが好ましい。または、関連語の重みの算定は、関連語の分散表現ベクトルとキーワードの分散表現ベクトルとの類似度または距離に基づいた値を用いてもよい。関連語の重みが、関連語とキーワードの類似度と、キーワード自体の重みと、の双方に基づいて設定されることで検索精度を高めることができる。なお関連語としては、同義語、類義語、対義語、上位語、下位語などが挙げられる。

　なお上記検索データ６１は、文章データ２１に含まれる検索ワードを抽出し、類似語辞書データおよび重み辞書データを参照することで生成されるデータに相当する。検索データは、検索ワードに対応するキーワードおよび当該キーワードに対応する関連語のそれぞれに重みが付与されたデータである。キーワードおよび関連語のそれぞれが重みを有することで、キーワードまたは関連語がヒットした参照用文書データに、重みに基づいた点数を付与することができる。検索データ６２は、検索データ６１において、ユーザの操作によって上記重みが修正されたデータに相当する。

　出力部６０は、文書検索システム１０の外部に検索データを供給する機能を有する。例えば、処理部３０において生成された検索データを、文書検索システム１０の外部に設けられる表示装置などに供給することができる。ユーザは、文書検索システム１０の外部に設けられる表示装置などを介して生成された検索データを確認することができる。

　伝送路７０は、データを伝達する機能を有する。入力部２０、処理部３０、記憶部４０、データベース５０、および出力部６０の間のデータの送受信は、伝送路７０を介して行うことができる。

　図２は、図１で説明した文書検索システム１０を用いる文書検索方法を説明するためのフローを示す図である。

　図２に図示するフローでは、まず、データベース５０に対して、参照用文書データの登録を行う（ステップＳ１１）。この登録を行うステップは、以降のステップの途中で行う構成であってもよい。

　次いで重み辞書データの作成を行う（ステップＳ１２）。このステップＳ１２における重み辞書データ作成フローについては、後述する図３を用いて説明する。

　次いで類義語辞書データの作成を行う（ステップＳ１３）。このステップＳ１３における類義語辞書データ作成フローについては、後述する図４を用いて説明する。なおステップＳ１３は、ステップＳ１２と入れ替えて行ってもよいし、同じタイミングで行ってもよい。

　次いで、文章データの入力を行う（ステップＳ１４）。この文章データの入力は、文書検索システム１０の外部に設けられる表示装置などのグラフィカルユーザインタフェース（ＧＵＩ）を介して入力される。

　次いで文章データから検索ワードの抽出を行う（ステップＳ１５）。このステップＳ１５における検索ワードの抽出フローについては、後述する図５を用いて説明する。

　次いで検索データの作成を行う（ステップＳ１６）。検索データの作成は、検索ワード、重み辞書データ、および類似語辞書データを参照して行われる。このステップＳ１６における検索データについては、後述する図７等を参照して説明する。

　次いで検索データに基づく検索データの表示を行う（ステップＳ１７）。当該表示は、検索データが文書検索システム１０の外部に設けられる表示装置などのＧＵＩに出力されることで行われる。

　次いで、ステップＳ１７で表示された検索データの修正を行う（ステップＳ１８）。この修正は、ユーザが文書検索システム１０の外部に設けられる表示装置に表示された検索データが有する重みデータの値を修正することで行われる。

　次いで、修正された検索データをもとにして、検索を実行する（ステップＳ１９）。このステップＳ１９における検索実行のフローについては、後述する図１１を用いて説明する。

　ステップＳ１８で修正された検索データは、記憶部等に保存される（ステップＳ２０）。

　ステップＳ１９で検索を実行した後は、検索を終了するか否かの判断を行う（ステップＳ２１）。継続する場合、ステップＳ１４に戻り、再度文章データの入力を行う。終了の場合、検索終了となる。

　ステップＳ２０で修正された検索データの保存後は、類義語辞書データの更新を行う（ステップＳ２２）。つまりステップＳ１３で示す類義語辞書データ作成で作成されたデータを更新する。このステップＳ２２における類義語辞書データの更新フローについては、後述する図１０等を参照して説明する。

　図２のフロー図によれば、本発明の一態様の文書検索方法では、ユーザによって修正された検索データを用いて類義語辞書データの更新を行うことができる。そのため、高い精度で文書を検索できる文書検索方法を提供できる。あるいは簡単な入力方法で、精度の高い文書検索、特に知的財産に係る文書の検索を実現できる。

　図３は、図２で説明したステップＳ１２に示す重み辞書データを生成するためのフローを示す図である。

　まず複数の参照用文書データ（以下文書データＴＤ_ＲＥＦ）が入力部２０を介して処理部３０に入力される（ステップＳ４１）。ステップＳ４１は、上記説明したステップＳ１１に相当する。

　次いで文書データＴＤ_ＲＥＦに対して、分かち書き処理を行う（ステップＳ４２）。その後不要な分かち書き処理を修正する処理を行うことが好ましい。

　次いで、分かち書き処理を行った文書データＴＤ_ＲＥＦに対して、形態素解析を行う（ステップＳ４３）。

　次いで、形態素解析を行ったデータに対して、文章解析データＡＤ_ＲＥＦ（参照用文章解析データ）の生成を行う（ステップＳ４４）。形態素解析では、自然言語で書かれた文章を、形態素（言語として意味を持つ最小単位）に分割し、形態素の品詞などを判別することができる。これにより、例えば、分かち書き処理をおこなった文書データＴＤ_ＲＥＦから名詞のみを抽出した文章解析データＡＤ_ＲＥＦとすることができる。

　次いで文章解析データＡＤ_ＲＥＦに対して、当該文章解析データＡＤ_ＲＥＦに含まれる単語のＩＤＦを計算し、ＩＤＦデータＩＤを生成する（ステップＳ４５）。ＩＤＦデータＩＤは、単語（Ｗｏｒｄ）と規格化されたＩＤＦを含む。ＩＤＦデータＩＤは、キーワードとなる単語（Ｗｏｒｄ）と、規格化されたＩＤＦと、を含む。

　ある単語ｔのＩＤＦ（ｔ）は、式（１）のｉｄｆ（ｔ）を規格化することで求められる。規格化の方法は特に限定されず、例えば、式（２）により、ｉｄｆ（ｔ）を規格化できる。式（１）において、Ｎは全文書数（参照用文章解析データＡＤ_ｒｅｆの数）であり、ｄｆ（ｔ）はある単語ｔが出現する文書数（参照用文章解析データＡＤ_ｒｅｆの数）である。式（２）において、ｉｄｆ_ＭＡＸは、参照用文章解析データＡＤ_ｒｅｆに含まれる単語のｉｄｆ（ｔ）の最大値であり、ｉｄｆ_ＭＩＮは、参照用文章解析データＡＤ_ｒｅｆに含まれる単語のｉｄｆ（ｔ）の最小値である。

　ＩＤＦが高いワードは、文章解析データＡＤ_ＲＥＦに現れにくい特徴的な単語であるといえる。そのため単語ごとに規格化されたＩＤＦデータＩＤを見積もることで、所望の文書を検索するための特徴的なワードであるキーワードおよび規格化されたＩＤＦの抽出を行うことができる。

　次いで、ＩＤＦデータＩＤにおいて、キーワードごとに付されたＩＤＦを重みデータとし、キーワードごとに重みデータが付された重み辞書データを生成する（ステップＳ４６）。上述したようにＩＤＦが高い単語は、参照用文章解析データにおいて特徴的な単語であるといえる。ＩＤＦを抽出することでキーワードごとの出現頻度を見積もることができ、出現頻度に応じた重みデータを各キーワードに紐づけした重み辞書データを生成することができる。生成された重み辞書データは、データベース５０に保存することができる。

　図３のフロー図によれば、データベースに保存された参照用文書データをもとに重み辞書データの生成を行うことができる。文書データ中の特徴的な単語（キーワード）ごとに、ＩＤＦで規格化された数値で見積もることでキーワードごとの重要度（重み）を見積もることができる。そのため、高い精度で文書を検索できる文書検索方法を提供できる。あるいは簡単な入力方法で、精度の高い文書検索、特に知的財産に係る文書の検索を実現できる。

　図４は、図２で説明したステップＳ１２に示す類義語辞書データを生成するためのフローを示す図である。

　まず文書データＴＤ_ＲＥＦが入力部２０を介して処理部３０に入力される（ステップＳ５１）。ステップＳ５１は、上記説明したステップＳ１１に相当する。なお当該ステップＳ５１は、ステップＳ４１と同じ処理に相当する。

　次いで文書データＴＤ_ＲＥＦに対して、分かち書き処理を行う（ステップＳ５２）。その後不要な分かち書き処理を修正する処理を行うことが好ましい。なお当該ステップＳ５２は、ステップＳ４２と同じ処理に相当する。

　次いで、分かち書き処理を行った文書データＴＤ_ＲＥＦに対して、形態素解析を行う（ステップＳ５３）。なお当該ステップＳ５３は、ステップＳ４３と同じ処理に相当する。

　次いで、形態素解析を行ったデータに対して、文章解析データＡＤ_ＲＥＦ（参照用文章解析データ）の生成を行う（ステップＳ５４）。なお当該ステップＳ５４は、ステップＳ４４と同じ処理に相当する。

　次いで文章解析データＡＤ_ＲＥＦに対して、当該文章解析データＡＤ_ＲＥＦに含まれる単語のＩＤＦを計算し、ＩＤＦデータＩＤを生成する（ステップＳ５５）。なお当該ステップＳ５５は、ステップＳ４５と同じ処理に相当する。単語ごとに規格化されたＩＤＦデータＩＤを見積もることで、所望の文書を検索するための特徴的なワードであるキーワードおよび規格化されたＩＤＦの抽出を行うことができる。

　次いで文章解析データＡＤ_ＲＥＦに対して、当該データに含まれる単語を抽出し、単語ごとに分散表現ベクトルを生成し、ベクトルデータＶＤを生成する（ステップＳ５６）。

　単語の分散表現は、単語埋め込みともいわれる。単語の分散表現ベクトルは、単語を、各特徴要素（次元）に対して、定量化した連続値で表現したベクトルである。意味の近い単語同士は、ベクトルも近くなる。

　処理部３０は、ニューラルネットワークを用いて、単語の分散表現ベクトルを生成することが好ましい。ニューラルネットワークの学習は教師あり学習で行う。具体的には、ある単語を入力層に与え、当該単語の周辺語を出力層に与えて、ニューラルネットワークに、ある単語に対するその周辺語の確率を学習させる。中間層（隠れ層）は１０次元以上１０００次元以下の比較的低次元のベクトルを有することが好ましい。学習後の当該ベクトルが、単語の分散表現ベクトルである。

　単語の分散表現は、例えば、オープンソース化されているアルゴリズムのＷｏｒｄ２ｖｅｃを用いて行うことができる。Ｗｏｒｄ２ｖｅｃは、同じ文脈で利用される単語は、同じ意味を持つという仮説に基づき、単語の特徴および意味構造を含めて単語をベクトル化する。

　単語のベクトル化において、単語の分散表現ベクトルを生成することで、ベクトル間の演算で単語間の類似度や距離などを計算することができる。２つのベクトルの類似度が高いとき、当該２つのベクトルは関係性が高いといえる。また、２つのベクトルの距離が近いとき、当該２つのベクトルは関係性が高いといえる。

　また、ｏｎｅ−ｈｏｔ表現が１単語に１次元を割り当てるのに対し、分散表現では単語を低次元の実数値ベクトルで表すことができるため、語彙数が増えても少ない次元数で表現することができる。したがって、コーパスに含まれる単語数が多くても計算量が増加しにくく、膨大なデータを短時間で処理することができる。

　次いで文章解析データＡＤ_ＲＥＦに対して、キーワードに対応する関連語の抽出を行う（ステップＳ５７）。キーワードに対応する関連語の抽出は、キーワードの分散表現ベクトルと、単語の分散表現ベクトルと、の類似度の高さまたは距離の近さに基づいて、キーワードに対応する関連語を抽出する。そして、関連語を類似度の高い順または距離の近い順に並べることで、関連語データを生成する。具体的には、１つのキーワードに対して、関連語を１個以上１０個以下抽出することが好ましく、２個以上５個以下抽出することがより好ましい。関連語は、例えば、類似度が所定の値以上の単語であってもよく、距離が所定の値以下の単語であってもよく、類似度が高い上位の所定の個数の単語であってもよく、距離が近い上位の所定の個数の単語であってもよい。キーワードによって、同義語、類義語、対義語、上位語、下位語などの数は異なる。このため、キーワードによって、関連語の数は異なっていてもよい。文章解析データＡＤ_ＲＥＦに含まれる単語の中からキーワードの関連語を抽出することで、文章解析データＡＤ_ＲＥＦが独特の表記でキーワードを表現している場合であっても、当該表記を関連語として抽出することができる。したがって、表記の揺らぎによる検索漏れが低減でき、好ましい。

　２つのベクトルの類似度は、コサイン類似度、共分散、不偏共分散、ピアソンの積率相関係数などを用いて求めることができる。特に、コサイン類似度を用いることが好ましい。２つのベクトルの距離は、ユークリッド距離、標準（標準化、平均）ユークリッド距離、マハラノビス距離、マンハッタン距離、チェビシェフ距離、ミンコフスキー距離などを用いて求めることができる。

　次いで関連語に対して重みデータの付与を行う（ステップＳ５８）。各関連語に付与される重みデータは、キーワードと関連語の関連性の度合い（類似度）に相当する。したがって関連語に付与される重みデータは、上記類似度の高さもしくは距離の近さを示す値、またはこれらを規格化した値である。関連語に付与される重みデータは、後に検索結果に点数を付与する際に用いる、関連語の重みの算出に利用する。具体的には、キーワードの規格化されたＩＤＦと関連語の重みデータとの積が、関連語の重みに相当する。なお関連語の重みの算出は、積に相当する値であればよく、算出される重みの値に対し、当該積の切片に相当する値が加わっていてもよい。

　上述したＩＤＦデータＩＤ、およびベクトルデータＶＤを用いて、複数のキーワードおよび重みデータが付された関連語で構成される類義語辞書データを生成する（ステップＳ５９）。生成された類義語辞書データは、データベース５０に保存することができる。

　図４のフローによれば、データベースに保存された複数の文書データをもとに類義語辞書データの生成を行うことができる。文書データ中の特徴的な単語（キーワード）に関連する関連語ごとに、ＩＤＦデータＩＤおよびベクトルデータＶＤで規格化された数値で見積もることで関連語ごとの類似度（重み）を見積もることができる。そのため、高い精度で文書を検索できる文書検索方法を提供できる。あるいは簡単な入力方法で、精度の高い文書検索、特に知的財産に係る文書の検索を実現できる。

　図５は、図２で説明したステップＳ１５に示す検索ワードの抽出のためのフローを示す図である。

　まず文章データ（以下文章データＴＤ）が入力部２０を介して処理部３０に入力される（ステップＳ３１）。ステップＳ３１は、上記説明したステップＳ１４に相当する。

　次いで文章データＴＤに対して、分かち書き処理を行う（ステップＳ３２）。その後不要な分かち書き処理を修正するための処理を行うことが好ましい。

　次いで、分かち書き処理を行った文章データＴＤに対して、形態素解析を行う（ステップＳ３３）。

　次いで、形態素解析を行ったデータに対して、文章解析データ（以下、文章解析データＡＤ）の生成を行う（ステップＳ３４）。形態素解析では、自然言語で書かれた文章を、形態素（言語として意味を持つ最小単位）に分割し、形態素の品詞などを判別することができる。これにより、例えば、分かち書き処理を行った文章データＴＤから名詞のみを抽出した文章解析データＡＤとすることができる。

　次いで、重み辞書データまたは類義語辞書データの生成時に算出したＩＤＦデータを参照し、文章解析データＡＤに含まれる単語に応じたＩＤＦデータＩＤを取得する（ステップＳ３５）。単語ごとに規格化されたＩＤＦデータＩＤを取得することで、所望の文書を検索するための特徴的なワードである検索ワードおよび規格化されたＩＤＦの抽出を行うことができる。

　次いで、ＩＤＦをもとに検索ワードを抽出する（ステップＳ３６）。ＩＤＦが高いワードは、文章解析データＡＤに現れにくい特徴的な単語である。

　図５のフローによれば、入力される文章データをもとに検索ワードの抽出を行うことができる。文章データ中の特徴的な単語をＩＤＦで規格化された数値で見積もることで、当該特徴的なワードを検索ワードとして抽出させることができる。そのため、高い精度で文書を検索できる文書検索方法を提供できる。あるいは簡単な入力方法で、精度の高い文書検索、特に知的財産に係る文書の検索を実現できる。

　図６Ａは、上記説明した文章データＴＤから抽出される検索ワード（ＳＷ）のデータを模式的に表す図である。表データ２１ＴＢは、検索ワード（ＳＷ）のデータを模式的に表している。抽出された検索ワードとして、「Ｗｏｒｄ　Ａ」、「Ｗｏｒｄ　Ｂ」、「Ｗｏｒｄ　Ｃ」を例示している。

　図６Ｂは、上記説明した複数の文書データから生成されるキーワード（ＫＷ）ごとに、規格化されたＩＤＦに基づく重みデータを付した重み辞書データを模式的に表す図である。表データ５２ＴＢは、重み辞書データを模式的に表している。キーワードとして、「Ｗｏｒｄ　Ａ」、「Ｗｏｒｄ　Ｂ」、「Ｗｏｒｄ　Ｃ」を例示し、それぞれのキーワードの重みデータとして「０．９」、「０．９」、「０．８」としている。

　図６Ｃは、上記説明した複数の文書データから抽出されるキーワード（ＫＷ）ごとに関連語を抽出し、関連語（ＲＷ）ごとに類似度に相当する重みデータを付した類義語辞書データを模式的に表す図である。表データ５３ＴＢは、類義語辞書データを模式的に表している。

　表５３ＴＢでは、キーワードＫＷとして、「Ｗｏｒｄ　Ａ」、「Ｗｏｒｄ　Ｂ」、「Ｗｏｒｄ　Ｃ」、「Ｗｏｒｄ　Ｄ」、「Ｗｏｒｄ　Ｅ」を例示している。「Ｗｏｒｄ　Ａ」の関連語として、「Ｗｏｒｄ　Ｘ」、「Ｗｏｒｄ　Ｙ」、「Ｗｏｒｄ　Ｚ」、「Ｗｏｒｄ　ａ」を例示し、それぞれの関連語の重みデータとして、「０．９」、「０．８」、「０．６」、「０．５」としている。同様に、「Ｗｏｒｄ　Ｂ」の関連語として、「Ｗｏｒｄ　ｂ」、「Ｗｏｒｄ　ｃ」、「Ｗｏｒｄ　ｄ」、「Ｗｏｒｄ　ｅ」を例示し、それぞれの関連語の重みデータとして、「０．５」、「０．５」、「０．４５」、「０．３」としている。「Ｗｏｒｄ　Ｃ」の関連語として、「Ｗｏｒｄ　ｆ」、「Ｗｏｒｄ　ｇ」、「Ｗｏｒｄ　ｈ」、「Ｗｏｒｄ　ｉ」を例示し、それぞれの関連語の重みデータとして、「０．７５」、「０．７５」、「０．７５」、「０．７５」としている。「Ｗｏｒｄ　Ｄ」の関連語として、「Ｗｏｒｄ　ｊ」、「Ｗｏｒｄ　ｋ」、「Ｗｏｒｄ　ｍ」、「Ｗｏｒｄ　ｎ」を例示し、それぞれの関連語の重みデータとして、「０．５」、「０．３」、「０．３」、「０．１」としている。「Ｗｏｒｄ　Ｅ」の関連語として、「Ｗｏｒｄ　ｐ」、「Ｗｏｒｄ　ｑ」、「Ｗｏｒｄ　ｒ」、「Ｗｏｒｄ　ｓ」を例示し、それぞれの関連語の重みデータとして、「０．７５」、「０．６５」、「０．６５」、「０．６」としている。

　図７は、重み辞書データおよび類似語辞書データを参照して作成される検索データを模式的に示す図である。表データ６１ＴＢには、検索ワードＳＷを有する表データ２１ＴＢに示す「Ｗｏｒｄ　Ａ」、「Ｗｏｒｄ　Ｂ」、「Ｗｏｒｄ　Ｃ」の重みを、表データ５２ＴＢを参照することで「０．９」、「０．９」、「０．８」としている。またキーワードＫＷに対応する関連語として、表データ５３ＴＢを参照することで「Ｗｏｒｄ　Ａ」では「Ｗｏｒｄ　Ｘ」、「Ｗｏｒｄ　Ｙ」、「Ｗｏｒｄ　Ｚ」、「Ｗｏｒｄ　ａ」を例示し、それぞれの関連語の重みとして、「０．９」、「０．８」、「０．６」、「０．５」としている。同様に、「Ｗｏｒｄ　Ｂ」では「Ｗｏｒｄ　ｂ」、「Ｗｏｒｄ　ｃ」、「Ｗｏｒｄ　ｄ」、「Ｗｏｒｄ　ｅ」を例示し、それぞれの関連語の重みとして、「０．５」、「０．５」、「０．４５」、「０．３」としている。「Ｗｏｒｄ　Ｃ」では「Ｗｏｒｄ　ｆ」、「Ｗｏｒｄ　ｇ」、「Ｗｏｒｄ　ｈ」、「Ｗｏｒｄ　ｉ」を例示し、それぞれの関連語の重みとして、「０．７５」、「０．７５」、「０．７５」、「０．７５」としている。

　図７に図示する表データ６１ＴＢは、文書検索システム１０の外部に設けられる表示装置に表示される。ユーザは、表データ６１ＴＢに図示するように、文書検索システム１０の外部に設けられる表示装置に表示される検索データを見て、明らかに関連語として適切ではない単語の重みデータ、あるいは明らかに関連性の高い関連語の重みデータを修正することができる。

　例えば図８に図示するように、図７に図示する表データ６１ＴＢでは、「Ｗｏｒｄ　Ａ」において、「Ｗｏｒｄ　ａ」の関連性がユーザの判断で大きい場合、関連語の重みを「０．５」から「１．０」に修正する。同様に「Ｗｏｒｄ　Ｂ」において、「Ｗｏｒｄ　ｃ」の関連性がユーザの判断で小さい場合、関連語の重みを「０．５」から「０．０」に修正する。同様に「Ｗｏｒｄ　Ｃ」において、「Ｗｏｒｄ　ｈ」の関連性がユーザの判断で大きい場合、関連語の重みを「０．７５」から「１．０」に修正する。なお、重みデータを修正した関連語にハッチングを付している。

　図８に図示する修正をユーザが行うことで、検索データ（第１の検索データ：表データ６１ＴＢに相当）は、修正された検索データ（第２の検索データ：表データ６２ＴＢに相当）となる。

　なお類義語辞書データの更新は、図８で示す例に限らない。例えば、関連語の重みデータを「０．５」から「１．０」に修正する場合、寄与率を考慮した修正としてもよい。例えば修正前の重みデータと修正後の重みデータの差に寄与率を乗じた値を修正前の重みデータに加算することで、修正後の重みデータとする構成でもよい。当該構成の場合、寄与率を０．１とし、修正前の重みデータを０．５とし、修正後の重みデータを１．０とすると、修正後の重みデータは、「０．５＋０．１×（１．０−０．５）」で０．５５に更新される。そのため、類義語辞書データの更新時において、一ユーザの修正内容によらず、複数のユーザの修正に応じた更新を行うことができる。

　また図９では、図８で図示する検索データの修正を行った際に更新される、類義語辞書データを模式的に示す図である。図８で図示する、重みデータを修正した関連語ＲＷ（ハッチングを付した箇所）および対応するキーワードＫＷは、修正される重みデータに基づいて類義語辞書データが修正される。具体的には、図９に図示する、更新前の類義語辞書データを模式的に表す表データ５３ＴＢは、表データ５３ＴＢ＿ｒｅに示すように更新することができる。

　図９に図示するように、重みデータが更新された関連語ＲＷは、キーワードに紐づけされた関連語のランキングが変動する。このように類義語辞書データを更新することで、ユーザの判断基準が加味された文書の検索ができる文書検索方法を提供することができる。また、高い精度で文書を検索できる文書検索方法を提供できる。あるいは簡単な入力方法で、精度の高い文書検索、特に知的財産に係る文書の検索を実現できる。

　図１０は、図２で説明したステップＳ２２に示す類義語辞書データの更新を説明するためのフローを示す図である。

　まずユーザによって修正された検索データが、入力部を介して記憶部に保存される（ステップＳ６１）。ステップＳ６１は、上記図２で説明したステップＳ２０に相当する。

　次いで類義語辞書データの定期的な更新を行うか、否かの判断を行う（ステップＳ６２）。定期的な更新は、タイマー等を利用して行われる。更新するタイミングの場合、類義語辞書データの更新を行う（ステップＳ６３）。更新しない場合、終了となる。ステップＳ６３における類義語辞書データの更新は、ステップＳ６１における検索データの保存がされるか否かにかかわらず行われる。

　図１１は、図２で説明したステップＳ１９に示す検索実行を説明するためのフローを示す図である。

　まず検索ワードに基づく検索データの作成を行う（ステップＳ７１）。ステップＳ７１は、上記説明したステップＳ１６に相当する。

　次いで作成した検索データに対して、検索データの修正を行う（ステップＳ７２）。ステップＳ７２は、上記説明したステップＳ１８に相当する。このようにユーザが重みデータを編集（修正）することで、検索精度の向上を図ることができる。

　次いで参照用文章解析データＡＤ_ｒｅｆに対して検索データに付した重みデータに基づく点数の付与（スコアリング）を行う（ステップＳ７３）。複数の参照用文章解析データＡＤ_ｒｅｆに対するスコアリングの処理については、後述する図１２等を参照して説明する。

　次いで参照用文章解析データＡＤ_ｒｅｆのそれぞれに付されたスコアをもとにランキングデータを作成する（ステップＳ７４）。

　ランキングデータは、順位（Ｒａｎｋ）、参照用文章データＴＤ_ｒｅｆの情報（名称や識別番号など）（Ｄｏｃ）、スコア（Ｓｃｏｒｅ）などを含むことができる。なお、データベース５０などに参照用文章データＴＤ_ｒｅｆが保存されている場合、ランキングデータは、参照用文章データＴＤ_ｒｅｆへのファイルパスを含むことが好ましい。これにより、ユーザは、ランキングデータから、目的の文書に容易にアクセスすることができる。

　参照用文章解析データＡＤ_ｒｅｆのスコアが高いほど、当該文章解析データＡＤ_ｒｅｆは、文章データＴＤと関連または類似しているといえる。

　本発明の一態様の文書検索システムは、文章データをもとに検索ワードを抽出し、当該検索ワードを類似語辞書データおよび重み辞書データを参照することで、キーワードと当該キーワードの関連語とを抽出する機能を有する。そのため、本発明の一態様の文書検索システムのユーザは、検索に用いるキーワードを自ら選定しなくてもよい。ユーザは、キーワードよりも分量の多い文章データ（テキストデータ）をそのまま文書検索システムに入力することができる。また、ユーザ自身がキーワードおよび関連語を選定したい場合も、一から選定する必要はなく、文書検索システムが抽出したキーワードおよび関連語を参照して、キーワードおよび関連語の追加、修正、削除などを行えばよい。したがって、文書検索におけるユーザの負担を軽減し、また、ユーザの技量による検索結果の差を生じにくくできる。

　図１２は、図１１で説明したステップＳ７３に示す、検索データに付した重みデータに基づく参照用文章解析データＡＤ_ｒｅｆのスコアリングを説明するためのフローを示す図である。

　点数づけしていない参照用文章解析データＡＤ_ｒｅｆを１件選択する（ステップＳ８１）。

　次いで参照用文章解析データＡＤ_ｒｅｆにおいて、キーワードＫＷがヒットするか判断する（ステップＳ８２）。ヒットする場合、ステップＳ８５に進む。ヒットしない場合、ステップＳ８３に進む。

　次いで参照用文章解析データＡＤ_ｒｅｆにおいて、キーワードＫＷに対応する関連語ＲＷがヒットするか判断する（ステップＳ８３）。ヒットする場合、ステップＳ８５に進む。ヒットしない場合、ステップＳ８４に進む。

　次いでキーワードＫＷに対応する全ての関連語ＲＷで検索したか判断する（ステップＳ８４）。検索した場合、ステップＳ８６に進む。検索していない場合、ステップＳ８３に進む。例えば、キーワードＫＷの関連語ＲＷが２つあり、先のステップＳ８３で１つ目の関連語ＲＷがヒットするか判断していた場合、ステップＳ８３に戻って２つめの関連語ＲＷがヒットするか判断する。

　ステップＳ８５では、ヒットした単語に対応する重みをスコアに加算する。ステップＳ８２でヒットした場合、キーワードＫＷの重みデータをスコアに加算する。ステップＳ８３でヒットした場合、キーワードＫＷ_ｘの重みデータと、関連語ＲＷの重みデータと、の積をスコアに加算する。

　次に、全てのキーワードＫＷで検索したか判断する（ステップＳ８６）。検索した場合、ステップＳ８７に進む。検索していない場合、ステップＳ８２に進む。例えば、キーワードＫＷが２つあり、先のステップＳ８２で１つ目のキーワードＫＷがヒットするか判断していた場合、ステップＳ８２に戻って２つ目のキーワードＫＷがヒットするか判断する。

　次に、全ての参照用文章解析データＡＤ_ｒｅｆに対して点数づけをしたか判断する（ステップＳ８７）。全ての点数づけが終わった場合、終了となる。終わっていない場合、ステップＳ８１に進む。

　以上により、文書検索システム１０を用いて、検索を行うことができる。

　以上のように、本実施の形態の文書検索システムでは、事前に準備された文書を検索の対象として、入力された文書に関連または類似する文書を検索することができる。検索に用いるキーワードをユーザが選択する必要がなく、キーワードよりも分量の多い文章データを用いて検索することができるため、検索精度の個人差を低減することができ、簡便かつ高精度に、文書を検索できる。また、本実施の形態の文書検索システムは、キーワードの関連語を、事前に準備された文書の中から抽出するため、当該文書に含まれる独特な表記も関連語として抽出することができ、検索漏れを低減できる。また、本実施の形態の文書検索システムは、関連性または類似性の高さで順位づけして検索結果を出力することができるため、ユーザにとっては、検索結果から必要な文書を探しやすく、かつ、見落としにくくなる。

　本実施の形態は、他の実施の形態と適宜組み合わせることができる。また、本明細書において、１つの実施の形態の中に、複数の構成例が示される場合は、構成例を適宜組み合わせることが可能である。

（実施の形態２）
　本実施の形態では、ニューラルネットワークに用いることが可能な半導体装置の構成例について説明する。

　本実施の形態の半導体装置は、例えば、本発明の一態様の文書検索システムの処理部に用いることができる。

　図１３Ａに示すように、ニューラルネットワークＮＮは入力層ＩＬ、出力層ＯＬ、中間層（隠れ層）ＨＬによって構成することができる。入力層ＩＬ、出力層ＯＬ、中間層ＨＬはそれぞれ、１または複数のニューロン（ユニット）を有する。なお、中間層ＨＬは１層であってもよいし２層以上であってもよい。２層以上の中間層ＨＬを有するニューラルネットワークはＤＮＮ（ディープニューラルネットワーク）と呼ぶこともでき、ディープニューラルネットワークを用いた学習は深層学習と呼ぶこともできる。

　入力層ＩＬの各ニューロンには入力データが入力され、中間層ＨＬの各ニューロンには前層または後層のニューロンの出力信号が入力され、出力層ＯＬの各ニューロンには前層のニューロンの出力信号が入力される。なお、各ニューロンは、前後の層の全てのニューロンと結合されていてもよいし（全結合）、一部のニューロンと結合されていてもよい。

　図１３Ｂに、ニューロンによる演算の例を示す。ここでは、ニューロンＮと、ニューロンＮに信号を出力する前層の２つのニューロンを示している。ニューロンＮには、前層のニューロンの出力ｘ_１と、前層のニューロンの出力ｘ_２が入力される。そして、ニューロンＮにおいて、出力ｘ_１と重みｗ_１の乗算結果（ｘ_１ｗ_１）と出力ｘ_２と重みｗ_２の乗算結果（ｘ_２ｗ_２）の総和ｘ_１ｗ_１＋ｘ_２ｗ_２が計算された後、必要に応じてバイアスｂが加算され、値ａ＝ｘ_１ｗ_１＋ｘ_２ｗ_２＋ｂが得られる。そして、値ａは活性化関数ｈによって変換され、ニューロンＮから出力信号ｙ＝ｈ（ａ）が出力される。

　このように、ニューロンによる演算には、前層のニューロンの出力と重みの積を足し合わせる演算、すなわち積和演算が含まれる（上記のｘ_１ｗ_１＋ｘ_２ｗ_２）。この積和演算は、プログラムを用いてソフトウェア上で行ってもよいし、ハードウェアによって行われてもよい。積和演算をハードウェアによって行う場合は、積和演算回路を用いることができる。この積和演算回路としては、デジタル回路を用いてもよいし、アナログ回路を用いてもよい。積和演算回路にアナログ回路を用いる場合、積和演算回路の回路規模の縮小、または、メモリへのアクセス回数の減少による処理速度の向上および消費電力の低減を図ることができる。

　積和演算回路は、チャネル形成領域にシリコン（単結晶シリコンなど）を含むトランジスタ（「Ｓｉトランジスタ」ともいう）によって構成してもよいし、チャネル形成領域に金属酸化物の一種である酸化物半導体を含むトランジスタ（「ＯＳトランジスタ」ともいう）によって構成してもよい。特に、ＯＳトランジスタはオフ電流が極めて小さいため、積和演算回路のメモリを構成するトランジスタとして好適である。なお、ＳｉトランジスタとＯＳトランジスタの両方を用いて積和演算回路を構成してもよい。以下、積和演算回路の機能を備えた半導体装置の構成例について説明する。

＜半導体装置の構成例＞
　図１４に、ニューラルネットワークの演算を行う機能を有する半導体装置ＭＡＣの構成例を示す。半導体装置ＭＡＣは、ニューロン間の結合強度（重み）に対応する第１のデータと、入力データに対応する第２のデータの積和演算を行う機能を有する。なお、第１のデータおよび第２のデータはそれぞれ、アナログデータまたは多値のデジタルデータ（離散的なデータ）とすることができる。また、半導体装置ＭＡＣは、積和演算によって得られたデータを活性化関数によって変換する機能を有する。

　半導体装置ＭＡＣは、セルアレイＣＡ、電流源回路ＣＳ、カレントミラー回路ＣＭ、回路ＷＤＤ、回路ＷＬＤ、回路ＣＬＤ、オフセット回路ＯＦＳＴ、および活性化関数回路ＡＣＴＶを有する。

　セルアレイＣＡは、複数のメモリセルＭＣおよび複数のメモリセルＭＣｒｅｆを有する。図１４には、セルアレイＣＡがｍ行ｎ列（ｍ，ｎは１以上の整数）のメモリセルＭＣ（ＭＣ［１，１］乃至ＭＣ［ｍ，ｎ］）と、ｍ個のメモリセルＭＣｒｅｆ（ＭＣｒｅｆ［１］乃至ＭＣｒｅｆ［ｍ］）を有する構成例を示している。メモリセルＭＣは、第１のデータを格納する機能を有する。また、メモリセルＭＣｒｅｆは、積和演算に用いられる参照データを格納する機能を有する。なお、参照データはアナログデータまたは多値のデジタルデータとすることができる。

　メモリセルＭＣ［ｉ，ｊ］（ｉは１以上ｍ以下の整数、ｊは１以上ｎ以下の整数）は、配線ＷＬ［ｉ］、配線ＲＷ［ｉ］、配線ＷＤ［ｊ］、および配線ＢＬ［ｊ］と接続されている。また、メモリセルＭＣｒｅｆ［ｉ］は、配線ＷＬ［ｉ］、配線ＲＷ［ｉ］、配線ＷＤｒｅｆ、配線ＢＬｒｅｆと接続されている。ここで、メモリセルＭＣ［ｉ，ｊ］と配線ＢＬ［ｊ］間を流れる電流をＩ_{ＭＣ［ｉ，ｊ］}と表記し、メモリセルＭＣｒｅｆ［ｉ］と配線ＢＬｒｅｆ間を流れる電流をＩ_{ＭＣｒｅｆ［ｉ］}と表記する。

　メモリセルＭＣおよびメモリセルＭＣｒｅｆの具体的な構成例を、図１５に示す。図１５には代表例としてメモリセルＭＣ［１，１］、ＭＣ［２，１］およびメモリセルＭＣｒｅｆ［１］、ＭＣｒｅｆ［２］を示しているが、他のメモリセルＭＣおよびメモリセルＭＣｒｅｆにも同様の構成を用いることができる。メモリセルＭＣおよびメモリセルＭＣｒｅｆはそれぞれ、トランジスタＴｒ１１、トランジスタＴｒ１２、容量素子Ｃ１１を有する。ここでは、トランジスタＴｒ１１およびトランジスタＴｒ１２がｎチャネル型のトランジスタである場合について説明する。

　メモリセルＭＣにおいて、トランジスタＴｒ１１のゲートは配線ＷＬと接続され、ソースまたはドレインの一方はトランジスタＴｒ１２のゲート、および容量素子Ｃ１１の第１の電極と接続され、ソースまたはドレインの他方は配線ＷＤと接続されている。トランジスタＴｒ１２のソースまたはドレインの一方は配線ＢＬと接続され、ソースまたはドレインの他方は配線ＶＲと接続されている。容量素子Ｃ１１の第２の電極は、配線ＲＷと接続されている。配線ＶＲは、所定の電位を供給する機能を有する配線である。ここでは一例として、配線ＶＲから低電源電位（接地電位など）が供給される場合について説明する。

　トランジスタＴｒ１１のソースまたはドレインの一方、トランジスタＴｒ１２のゲート、および容量素子Ｃ１１の第１の電極と接続されたノードを、ノードＮＭとする。また、メモリセルＭＣ［１，１］、ＭＣ［２，１］のノードＮＭを、それぞれノードＮＭ［１，１］、ＮＭ［２，１］と表記する。

　メモリセルＭＣｒｅｆも、メモリセルＭＣと同様の構成を有する。ただし、メモリセルＭＣｒｅｆは配線ＷＤの代わりに配線ＷＤｒｅｆと接続され、配線ＢＬの代わりに配線ＢＬｒｅｆと接続されている。また、メモリセルＭＣｒｅｆ［１］、ＭＣｒｅｆ［２］において、トランジスタＴｒ１１のソースまたはドレインの一方、トランジスタＴｒ１２のゲート、および容量素子Ｃ１１の第１の電極と接続されたノードを、それぞれノードＮＭｒｅｆ［１］、ＮＭｒｅｆ［２］と表記する。

　ノードＮＭとノードＮＭｒｅｆはそれぞれ、メモリセルＭＣとメモリセルＭＣｒｅｆの保持ノードとして機能する。ノードＮＭには第１のデータが保持され、ノードＮＭｒｅｆには参照データが保持される。また、配線ＢＬ［１］からメモリセルＭＣ［１，１］、ＭＣ［２，１］のトランジスタＴｒ１２には、それぞれ電流Ｉ_{ＭＣ［１，１］}、Ｉ_{ＭＣ［２，１］}が流れる。また、配線ＢＬｒｅｆからメモリセルＭＣｒｅｆ［１］、ＭＣｒｅｆ［２］のトランジスタＴｒ１２には、それぞれ電流Ｉ_{ＭＣｒｅｆ［１］}、Ｉ_{ＭＣｒｅｆ［２］}が流れる。

　トランジスタＴｒ１１は、ノードＮＭまたはノードＮＭｒｅｆの電位を保持する機能を有するため、トランジスタＴｒ１１のオフ電流は小さいことが好ましい。そのため、トランジスタＴｒ１１としてオフ電流が極めて小さいＯＳトランジスタを用いることが好ましい。これにより、ノードＮＭまたはノードＮＭｒｅｆの電位の変動を抑えることができ、演算精度の向上を図ることができる。また、ノードＮＭまたはノードＮＭｒｅｆの電位をリフレッシュする動作の頻度を低く抑えることが可能となり、消費電力を削減することができる。

　トランジスタＴｒ１２は特に限定されず、例えばＳｉトランジスタまたはＯＳトランジスタなどを用いることができる。トランジスタＴｒ１２にＯＳトランジスタを用いる場合、トランジスタＴｒ１１と同じ製造装置を用いて、トランジスタＴｒ１２を作製することが可能となり、製造コストを抑制することができる。なお、トランジスタＴｒ１２はｎチャネル型であってもｐチャネル型であってもよい。

　電流源回路ＣＳは、配線ＢＬ［１］乃至ＢＬ［ｎ］および配線ＢＬｒｅｆと接続されている。電流源回路ＣＳは、配線ＢＬ［１］乃至ＢＬ［ｎ］および配線ＢＬｒｅｆに電流を供給する機能を有する。なお、配線ＢＬ［１］乃至ＢＬ［ｎ］に供給される電流値と配線ＢＬｒｅｆに供給される電流値は異なっていてもよい。ここでは、電流源回路ＣＳから配線ＢＬ［１］乃至ＢＬ［ｎ］に供給される電流をＩ_Ｃ、電流源回路ＣＳから配線ＢＬｒｅｆに供給される電流をＩ_Ｃｒｅｆと表記する。

　カレントミラー回路ＣＭは、配線ＩＬ［１］乃至ＩＬ［ｎ］および配線ＩＬｒｅｆを有する。配線ＩＬ［１］乃至ＩＬ［ｎ］はそれぞれ配線ＢＬ［１］乃至ＢＬ［ｎ］と接続され、配線ＩＬｒｅｆは、配線ＢＬｒｅｆと接続されている。ここでは、配線ＩＬ［１］乃至ＩＬ［ｎ］と配線ＢＬ［１］乃至ＢＬ［ｎ］の接続箇所をノードＮＰ［１］乃至ＮＰ［ｎ］と表記する。また、配線ＩＬｒｅｆと配線ＢＬｒｅｆの接続箇所をノードＮＰｒｅｆと表記する。

　カレントミラー回路ＣＭは、ノードＮＰｒｅｆの電位に応じた電流Ｉ_ＣＭを配線ＩＬｒｅｆに流す機能と、この電流Ｉ_ＣＭを配線ＩＬ［１］乃至ＩＬ［ｎ］にも流す機能を有する。図１４には、配線ＢＬｒｅｆから配線ＩＬｒｅｆに電流Ｉ_ＣＭが排出され、配線ＢＬ［１］乃至ＢＬ［ｎ］から配線ＩＬ［１］乃至ＩＬ［ｎ］に電流Ｉ_ＣＭが排出される例を示している。また、カレントミラー回路ＣＭから配線ＢＬ［１］乃至ＢＬ［ｎ］を介してセルアレイＣＡに流れる電流を、Ｉ_Ｂ［１］乃至Ｉ_Ｂ［ｎ］と表記する。また、カレントミラー回路ＣＭから配線ＢＬｒｅｆを介してセルアレイＣＡに流れる電流を、Ｉ_Ｂｒｅｆと表記する。

　回路ＷＤＤは、配線ＷＤ［１］乃至ＷＤ［ｎ］および配線ＷＤｒｅｆと接続されている。回路ＷＤＤは、メモリセルＭＣに格納される第１のデータに対応する電位を、配線ＷＤ［１］乃至ＷＤ［ｎ］に供給する機能を有する。また、回路ＷＤＤは、メモリセルＭＣｒｅｆに格納される参照データに対応する電位を、配線ＷＤｒｅｆに供給する機能を有する。回路ＷＬＤは、配線ＷＬ［１］乃至ＷＬ［ｍ］と接続されている。回路ＷＬＤは、データの書き込みを行うメモリセルＭＣまたはメモリセルＭＣｒｅｆを選択するための信号を、配線ＷＬ［１］乃至ＷＬ［ｍ］に供給する機能を有する。回路ＣＬＤは、配線ＲＷ［１］乃至ＲＷ［ｍ］と接続されている。回路ＣＬＤは、第２のデータに対応する電位を、配線ＲＷ［１］乃至ＲＷ［ｍ］に供給する機能を有する。

　オフセット回路ＯＦＳＴは、配線ＢＬ［１］乃至ＢＬ［ｎ］および配線ＯＬ［１］乃至ＯＬ［ｎ］と接続されている。オフセット回路ＯＦＳＴは、配線ＢＬ［１］乃至ＢＬ［ｎ］からオフセット回路ＯＦＳＴに流れる電流量、および／または、配線ＢＬ［１］乃至ＢＬ［ｎ］からオフセット回路ＯＦＳＴに流れる電流の変化量を検出する機能を有する。また、オフセット回路ＯＦＳＴは、検出結果を配線ＯＬ［１］乃至ＯＬ［ｎ］に出力する機能を有する。なお、オフセット回路ＯＦＳＴは、検出結果に対応する電流を配線ＯＬに出力してもよいし、検出結果に対応する電流を電圧に変換して配線ＯＬに出力してもよい。セルアレイＣＡとオフセット回路ＯＦＳＴの間を流れる電流を、Ｉ_α［１］乃至Ｉ_α［ｎ］と表記する。

　オフセット回路ＯＦＳＴの構成例を図１６に示す。図１６に示すオフセット回路ＯＦＳＴは、回路ＯＣ［１］乃至ＯＣ［ｎ］を有する。また、回路ＯＣ［１］乃至ＯＣ［ｎ］はそれぞれ、トランジスタＴｒ２１、トランジスタＴｒ２２、トランジスタＴｒ２３、容量素子Ｃ２１、および抵抗素子Ｒ１を有する。各素子の接続関係は図１６に示す通りである。なお、容量素子Ｃ２１の第１の電極および抵抗素子Ｒ１の第１の端子と接続されたノードを、ノードＮａとする。また、容量素子Ｃ２１の第２の電極、トランジスタＴｒ２１のソースまたはドレインの一方、およびトランジスタＴｒ２２のゲートと接続されたノードを、ノードＮｂとする。

　配線ＶｒｅｆＬは電位Ｖｒｅｆを供給する機能を有し、配線ＶａＬは電位Ｖａを供給する機能を有し、配線ＶｂＬは電位Ｖｂを供給する機能を有する。また、配線ＶＤＤＬは電位ＶＤＤを供給する機能を有し、配線ＶＳＳＬは電位ＶＳＳを供給する機能を有する。ここでは、電位ＶＤＤが高電源電位であり、電位ＶＳＳが低電源電位である場合について説明する。また、配線ＲＳＴは、トランジスタＴｒ２１の導通状態を制御するための電位を供給する機能を有する。トランジスタＴｒ２２、トランジスタＴｒ２３、配線ＶＤＤＬ、配線ＶＳＳＬ、および配線ＶｂＬによって、ソースフォロワ回路が構成される。

　次に、回路ＯＣ［１］乃至ＯＣ［ｎ］の動作例を説明する。なお、ここでは代表例として回路ＯＣ［１］の動作例を説明するが、回路ＯＣ［２］乃至ＯＣ［ｎ］も同様に動作させることができる。まず、配線ＢＬ［１］に第１の電流が流れると、ノードＮａの電位は、第１の電流と抵抗素子Ｒ１の抵抗値に応じた電位となる。また、このときトランジスタＴｒ２１はオン状態であり、ノードＮｂに電位Ｖａが供給される。その後、トランジスタＴｒ２１はオフ状態となる。

　次に、配線ＢＬ［１］に第２の電流が流れると、ノードＮａの電位は、第２の電流と抵抗素子Ｒ１の抵抗値に応じた電位に変化する。このときトランジスタＴｒ２１はオフ状態であり、ノードＮｂはフローティング状態となっているため、ノードＮａの電位の変化に伴い、ノードＮｂの電位は容量結合により変化する。ここで、ノードＮａの電位の変化をΔＶ_Ｎａとし、容量結合係数を１とすると、ノードＮｂの電位はＶａ＋ΔＶ_Ｎａとなる。そして、トランジスタＴｒ２２のしきい値電圧をＶ_ｔｈとすると、配線ＯＬ［１］から電位Ｖａ＋ΔＶ_Ｎａ−Ｖ_ｔｈが出力される。ここで、Ｖａ＝Ｖ_ｔｈとすることにより、配線ＯＬ［１］から電位ΔＶ_Ｎａを出力することができる。

　電位ΔＶ_Ｎａは、第１の電流から第２の電流への変化量、抵抗素子Ｒ１の抵抗値、および電位Ｖｒｅｆに応じて定まる。ここで、抵抗素子Ｒ１の抵抗値と電位Ｖｒｅｆは既知であるため、電位ΔＶ_Ｎａから配線ＢＬに流れる電流の変化量を求めることができる。

　上記のようにオフセット回路ＯＦＳＴによって検出された電流量、および／または電流の変化量に対応する信号は、配線ＯＬ［１］乃至ＯＬ［ｎ］を介して活性化関数回路ＡＣＴＶに入力される。

　活性化関数回路ＡＣＴＶは、配線ＯＬ［１］乃至ＯＬ［ｎ］、および、配線ＮＩＬ［１］乃至ＮＩＬ［ｎ］と接続されている。活性化関数回路ＡＣＴＶは、オフセット回路ＯＦＳＴから入力された信号を、あらかじめ定義された活性化関数に従って変換するための演算を行う機能を有する。活性化関数としては、例えば、シグモイド関数、ｔａｎｈ関数、ｓｏｆｔｍａｘ関数、ＲｅＬＵ関数、しきい値関数などを用いることができる。活性化関数回路ＡＣＴＶによって変換された信号は、出力データとして配線ＮＩＬ［１］乃至ＮＩＬ［ｎ］に出力される。

＜半導体装置の動作例＞
　上記の半導体装置ＭＡＣを用いて、第１のデータと第２のデータの積和演算を行うことができる。以下、積和演算を行う際の半導体装置ＭＡＣの動作例を説明する。

　図１７に半導体装置ＭＡＣの動作例のタイミングチャートを示す。図１７には、図１５における配線ＷＬ［１］、配線ＷＬ［２］、配線ＷＤ［１］、配線ＷＤｒｅｆ、ノードＮＭ［１，１］、ノードＮＭ［２，１］、ノードＮＭｒｅｆ［１］、ノードＮＭｒｅｆ［２］、配線ＲＷ［１］、および配線ＲＷ［２］の電位の推移と、電流Ｉ_Ｂ［１］−Ｉ_α［１］、および電流Ｉ_Ｂｒｅｆの値の推移を示している。電流Ｉ_Ｂ［１］−Ｉ_α［１］は、配線ＢＬ［１］からメモリセルＭＣ［１，１］、ＭＣ［２，１］に流れる電流の総和に相当する。

　なお、ここでは代表例として図１５に示すメモリセルＭＣ［１，１］、ＭＣ［２，１］およびメモリセルＭＣｒｅｆ［１］、ＭＣｒｅｆ［２］に着目して動作を説明するが、他のメモリセルＭＣおよびメモリセルＭＣｒｅｆも同様に動作させることができる。

［第１のデータの格納］
　まず、時刻Ｔ０１−時刻Ｔ０２の期間において、配線ＷＬ［１］の電位がハイレベル（Ｈｉｇｈ）となり、配線ＷＤ［１］の電位が接地電位（ＧＮＤ）よりもＶ_ＰＲ−Ｖ_{Ｗ［１，１］}大きい電位となり、配線ＷＤｒｅｆの電位が接地電位よりもＶ_ＰＲ大きい電位となる。また、配線ＲＷ［１］、および配線ＲＷ［２］の電位が基準電位（ＲＥＦＰ）となる。なお、電位Ｖ_{Ｗ［１，１］}はメモリセルＭＣ［１，１］に格納される第１のデータに対応する電位である。また、電位Ｖ_ＰＲは参照データに対応する電位である。これにより、メモリセルＭＣ［１，１］およびメモリセルＭＣｒｅｆ［１］が有するトランジスタＴｒ１１がオン状態となり、ノードＮＭ［１，１］の電位がＶ_ＰＲ−Ｖ_{Ｗ［１，１］}、ノードＮＭｒｅｆ［１］の電位がＶ_ＰＲとなる。

　このとき、配線ＢＬ［１］からメモリセルＭＣ［１，１］のトランジスタＴｒ１２に流れる電流Ｉ_{ＭＣ［１，１］，０}は、次の式で表すことができる。ここで、ｋはトランジスタＴｒ１２のチャネル長、チャネル幅、移動度、およびゲート絶縁膜の容量などで決まる定数である。また、Ｖ_ｔｈはトランジスタＴｒ１２のしきい値電圧である。

　また、配線ＢＬｒｅｆからメモリセルＭＣｒｅｆ［１］のトランジスタＴｒ１２に流れる電流Ｉ_{ＭＣｒｅｆ［１］，０}は、次の式で表すことができる。

　次に、時刻Ｔ０２−時刻Ｔ０３の期間において、配線ＷＬ［１］の電位がローレベル（Ｌｏｗ）となる。これにより、メモリセルＭＣ［１，１］およびメモリセルＭＣｒｅｆ［１］が有するトランジスタＴｒ１１がオフ状態となり、ノードＮＭ［１，１］およびノードＮＭｒｅｆ［１］の電位が保持される。

　なお、前述の通り、トランジスタＴｒ１１としてＯＳトランジスタを用いることが好ましい。これにより、トランジスタＴｒ１１のリーク電流を抑えることができ、ノードＮＭ［１，１］およびノードＮＭｒｅｆ［１］の電位を正確に保持することができる。

　次に、時刻Ｔ０３−時刻Ｔ０４の期間において、配線ＷＬ［２］の電位がハイレベルとなり、配線ＷＤ［１］の電位が接地電位よりもＶ_ＰＲ−Ｖ_{Ｗ［２，１］}大きい電位となり、配線ＷＤｒｅｆの電位が接地電位よりもＶ_ＰＲ大きい電位となる。なお、電位Ｖ_{Ｗ［２，１］}はメモリセルＭＣ［２，１］に格納される第１のデータに対応する電位である。これにより、メモリセルＭＣ［２，１］およびメモリセルＭＣｒｅｆ［２］が有するトランジスタＴｒ１１がオン状態となり、ノードＮＭ［２，１］の電位がＶ_ＰＲ−Ｖ_{Ｗ［２，１］}、ノードＮＭｒｅｆ［２］の電位がＶ_ＰＲとなる。

　このとき、配線ＢＬ［１］からメモリセルＭＣ［２，１］のトランジスタＴｒ１２に流れる電流Ｉ_{ＭＣ［２，１］，０}は、次の式で表すことができる。

　また、配線ＢＬｒｅｆからメモリセルＭＣｒｅｆ［２］のトランジスタＴｒ１２に流れる電流Ｉ_{ＭＣｒｅｆ［２］，０}は、次の式で表すことができる。

　次に、時刻Ｔ０４−時刻Ｔ０５の期間において、配線ＷＬ［２］の電位がローレベルとなる。これにより、メモリセルＭＣ［２，１］およびメモリセルＭＣｒｅｆ［２］が有するトランジスタＴｒ１１がオフ状態となり、ノードＮＭ［２，１］およびノードＮＭｒｅｆ［２］の電位が保持される。

　以上の動作により、メモリセルＭＣ［１，１］、ＭＣ［２，１］に第１のデータが格納され、メモリセルＭＣｒｅｆ［１］、ＭＣｒｅｆ［２］に参照データが格納される。

　ここで、時刻Ｔ０４−時刻Ｔ０５の期間において、配線ＢＬ［１］および配線ＢＬｒｅｆに流れる電流を考える。配線ＢＬｒｅｆには、電流源回路ＣＳから電流が供給される。また、配線ＢＬｒｅｆを流れる電流は、カレントミラー回路ＣＭ、メモリセルＭＣｒｅｆ［１］、ＭＣｒｅｆ［２］へ排出される。電流源回路ＣＳから配線ＢＬｒｅｆに供給される電流をＩ_Ｃｒｅｆ、配線ＢＬｒｅｆからカレントミラー回路ＣＭへ排出される電流をＩ_ＣＭ，０とすると、次の式が成り立つ。

　配線ＢＬ［１］には、電流源回路ＣＳからの電流が供給される。また、配線ＢＬ［１］を流れる電流は、カレントミラー回路ＣＭ、メモリセルＭＣ［１，１］、ＭＣ［２，１］へ排出される。また、配線ＢＬ［１］からオフセット回路ＯＦＳＴに電流が流れる。電流源回路ＣＳから配線ＢＬ［１］に供給される電流をＩ_Ｃ，０、配線ＢＬ［１］からオフセット回路ＯＦＳＴに流れる電流をＩ_α，０とすると、次の式が成り立つ。

［第１のデータと第２のデータの積和演算］
　次に、時刻Ｔ０５−時刻Ｔ０６の期間において、配線ＲＷ［１］の電位が基準電位よりもＶ_Ｘ［１］大きい電位となる。このとき、メモリセルＭＣ［１，１］、およびメモリセルＭＣｒｅｆ［１］のそれぞれの容量素子Ｃ１１には電位Ｖ_Ｘ［１］が供給され、容量結合によりトランジスタＴｒ１２のゲートの電位が上昇する。なお、電位Ｖ_Ｘ［１］はメモリセルＭＣ［１，１］およびメモリセルＭＣｒｅｆ［１］に供給される第２のデータに対応する電位である。

　トランジスタＴｒ１２のゲートの電位の変化量は、配線ＲＷの電位の変化量に、メモリセルの構成によって決まる容量結合係数を乗じて得た値となる。容量結合係数は、容量素子Ｃ１１の容量、トランジスタＴｒ１２のゲート容量、および寄生容量などによって算出される。以下では便宜上、配線ＲＷの電位の変化量とトランジスタＴｒ１２のゲートの電位の変化量が同じ、すなわち容量結合係数が１であるとして説明する。実際には、容量結合係数を考慮して電位Ｖ_Ｘを決定すればよい。

　メモリセルＭＣ［１，１］およびメモリセルＭＣｒｅｆ［１］の容量素子Ｃ１１に電位Ｖ_Ｘ［１］が供給されると、ノードＮＭ［１，１］およびノードＮＭｒｅｆ［１］の電位がそれぞれＶ_Ｘ［１］上昇する。

　ここで、時刻Ｔ０５−時刻Ｔ０６の期間において、配線ＢＬ［１］からメモリセルＭＣ［１，１］のトランジスタＴｒ１２に流れる電流Ｉ_{ＭＣ［１，１］，１}は、次の式で表すことができる。

　すなわち、配線ＲＷ［１］に電位Ｖ_Ｘ［１］を供給することにより、配線ＢＬ［１］からメモリセルＭＣ［１，１］のトランジスタＴｒ１２に流れる電流は、ΔＩ_{ＭＣ［１，１］}＝Ｉ_{ＭＣ［１，１］，１}−Ｉ_{ＭＣ［１，１］，０}増加する。

　また、時刻Ｔ０５−時刻Ｔ０６の期間において、配線ＢＬｒｅｆからメモリセルＭＣｒｅｆ［１］のトランジスタＴｒ１２に流れる電流Ｉ_{ＭＣｒｅｆ［１］，１}は、次の式で表すことができる。

　すなわち、配線ＲＷ［１］に電位Ｖ_Ｘ［１］を供給することにより、配線ＢＬｒｅｆからメモリセルＭＣｒｅｆ［１］のトランジスタＴｒ１２に流れる電流は、ΔＩ_{ＭＣｒｅｆ［１］}＝Ｉ_{ＭＣｒｅｆ［１］，１}−Ｉ_{ＭＣｒｅｆ［１］，０}増加する。

　また、配線ＢＬ［１］および配線ＢＬｒｅｆに流れる電流について考える。配線ＢＬｒｅｆには、電流源回路ＣＳから電流Ｉ_Ｃｒｅｆが供給される。また、配線ＢＬｒｅｆを流れる電流は、カレントミラー回路ＣＭ、メモリセルＭＣｒｅｆ［１］、ＭＣｒｅｆ［２］へ排出される。配線ＢＬｒｅｆからカレントミラー回路ＣＭへ排出される電流をＩ_ＣＭ，１とすると、次の式が成り立つ。

　配線ＢＬ［１］には、電流源回路ＣＳから電流Ｉ_Ｃが供給される。また、配線ＢＬ［１］を流れる電流は、カレントミラー回路ＣＭ、メモリセルＭＣ［１，１］、ＭＣ［２，１］へ排出される。さらに、配線ＢＬ［１］からオフセット回路ＯＦＳＴにも電流が流れる。配線ＢＬ［１］からオフセット回路ＯＦＳＴに流れる電流をＩ_α，１とすると、次の式が成り立つ。

　そして、式（Ｅ１）乃至式（Ｅ１０）から、電流Ｉ_α，０と電流Ｉ_α，１の差（差分電流ΔＩ_α）は次の式で表すことができる。

　このように、差分電流ΔＩ_αは、電位Ｖ_{Ｗ［１，１］}とＶ_Ｘ［１］の積に応じた値となる。

　その後、時刻Ｔ０６−時刻Ｔ０７の期間において、配線ＲＷ［１］の電位は基準電位となり、ノードＮＭ［１，１］およびノードＮＭｒｅｆ［１］の電位は時刻Ｔ０４−時刻Ｔ０５の期間と同様になる。

　次に、時刻Ｔ０７−時刻Ｔ０８の期間において、配線ＲＷ［１］の電位が基準電位よりもＶ_Ｘ［１］大きい電位となり、配線ＲＷ［２］の電位が基準電位よりもＶ_Ｘ［２］大きい電位となる。これにより、メモリセルＭＣ［１，１］、およびメモリセルＭＣｒｅｆ［１］のそれぞれの容量素子Ｃ１１に電位Ｖ_Ｘ［１］が供給され、容量結合によりノードＮＭ［１，１］およびノードＮＭｒｅｆ［１］の電位がそれぞれＶ_Ｘ［１］上昇する。また、メモリセルＭＣ［２，１］、およびメモリセルＭＣｒｅｆ［２］のそれぞれの容量素子Ｃ１１に電位Ｖ_Ｘ［２］が供給され、容量結合によりノードＮＭ［２，１］およびノードＮＭｒｅｆ［２］の電位がそれぞれＶ_Ｘ［２］上昇する。

　ここで、時刻Ｔ０７−時刻Ｔ０８の期間において、配線ＢＬ［１］からメモリセルＭＣ［２，１］のトランジスタＴｒ１２に流れる電流Ｉ_{ＭＣ［２，１］，１}は、次の式で表すことができる。

　すなわち、配線ＲＷ［２］に電位Ｖ_Ｘ［２］を供給することにより、配線ＢＬ［１］からメモリセルＭＣ［２，１］のトランジスタＴｒ１２に流れる電流は、ΔＩ_{ＭＣ［２，１］}＝Ｉ_{ＭＣ［２，１］，１}−Ｉ_{ＭＣ［２，１］，０}増加する。

　また、時刻Ｔ０７−時刻Ｔ０８の期間において、配線ＢＬｒｅｆからメモリセルＭＣｒｅｆ［２］のトランジスタＴｒ１２に流れる電流Ｉ_{ＭＣｒｅｆ［２］，１}は、次の式で表すことができる。

　すなわち、配線ＲＷ［２］に電位Ｖ_Ｘ［２］を供給することにより、配線ＢＬｒｅｆからメモリセルＭＣｒｅｆ［２］のトランジスタＴｒ１２に流れる電流は、ΔＩ_{ＭＣｒｅｆ［２］}＝Ｉ_{ＭＣｒｅｆ［２］，１}−Ｉ_{ＭＣｒｅｆ［２］，０}増加する。

　また、配線ＢＬ［１］および配線ＢＬｒｅｆに流れる電流について考える。配線ＢＬｒｅｆには、電流源回路ＣＳから電流Ｉ_Ｃｒｅｆが供給される。また、配線ＢＬｒｅｆを流れる電流は、カレントミラー回路ＣＭ、メモリセルＭＣｒｅｆ［１］、ＭＣｒｅｆ［２］へ排出される。配線ＢＬｒｅｆからカレントミラー回路ＣＭへ排出される電流をＩ_ＣＭ，２とすると、次の式が成り立つ。

　配線ＢＬ［１］には、電流源回路ＣＳから電流Ｉ_Ｃが供給される。また、配線ＢＬ［１］を流れる電流は、カレントミラー回路ＣＭ、メモリセルＭＣ［１，１］、ＭＣ［２，１］へ排出される。さらに、配線ＢＬ［１］からオフセット回路ＯＦＳＴにも電流が流れる。配線ＢＬ［１］からオフセット回路ＯＦＳＴに流れる電流をＩ_α，２とすると、次の式が成り立つ。

　そして、式（Ｅ１）乃至式（Ｅ８）、および、式（Ｅ１２）乃至式（Ｅ１５）から、電流Ｉ_α，０と電流Ｉ_α，２の差（差分電流ΔＩ_α）は次の式で表すことができる。

　このように、差分電流ΔＩ_αは、電位Ｖ_{Ｗ［１，１］}と電位Ｖ_Ｘ［１］の積と、電位Ｖ_{Ｗ［２，１］}と電位Ｖ_Ｘ［２］の積と、を足し合わせた結果に応じた値となる。

　その後、時刻Ｔ０８−時刻Ｔ０９の期間において、配線ＲＷ［１］、［２］の電位は基準電位となり、ノードＮＭ［１，１］、ＮＭ［２，１］およびノードＮＭｒｅｆ［１］、ＮＭｒｅｆ［２］の電位は時刻Ｔ０４−時刻Ｔ０５の期間と同様になる。

　式（Ｅ１１）および式（Ｅ１６）に示されるように、オフセット回路ＯＦＳＴに入力される差分電流ΔＩ_αは、第１のデータ（重み）に対応する電位Ｖ_Ｗと、第２のデータ（入力データ）に対応する電位Ｖ_Ｘの積の項を有する式から算出することができる。すなわち、差分電流ΔＩ_αをオフセット回路ＯＦＳＴで計測することにより、第１のデータと第２のデータの積和演算の結果を得ることができる。

　なお、上記では特にメモリセルＭＣ［１，１］、ＭＣ［２，１］およびメモリセルＭＣｒｅｆ［１］、ＭＣｒｅｆ［２］に着目したが、メモリセルＭＣおよびメモリセルＭＣｒｅｆの数は任意に設定することができる。メモリセルＭＣおよびメモリセルＭＣｒｅｆの行数ｍを任意の数ｉとした場合の差分電流ΔＩαは、次の式で表すことができる。

　また、メモリセルＭＣおよびメモリセルＭＣｒｅｆの列数ｎを増やすことにより、並列して実行される積和演算の数を増やすことができる。

　以上のように、半導体装置ＭＡＣを用いることにより、第１のデータと第２のデータの積和演算を行うことができる。なお、メモリセルＭＣおよびメモリセルＭＣｒｅｆとして図１５に示す構成を用いることにより、少ないトランジスタ数で積和演算回路を構成することができる。そのため、半導体装置ＭＡＣの回路規模の縮小を図ることができる。

　半導体装置ＭＡＣをニューラルネットワークにおける演算に用いる場合、メモリセルＭＣの行数ｍは一のニューロンに供給される入力データの数に対応させ、メモリセルＭＣの列数ｎはニューロンの数に対応させることができる。例えば、図１３Ａに示す中間層ＨＬにおいて半導体装置ＭＡＣを用いた積和演算を行う場合を考える。このとき、メモリセルＭＣの行数ｍは、入力層ＩＬから供給される入力データの数（入力層ＩＬのニューロンの数）に設定し、メモリセルＭＣの列数ｎは、中間層ＨＬのニューロンの数に設定することができる。

　なお、半導体装置ＭＡＣを適用するニューラルネットワークの構造は特に限定されない。例えば半導体装置ＭＡＣは、畳み込みニューラルネットワーク（ＣＮＮ）、再帰型ニューラルネットワーク（ＲＮＮ）、オートエンコーダ、ボルツマンマシン（制限ボルツマンマシンを含む）などに用いることもできる。

　以上のように、半導体装置ＭＡＣを用いることにより、ニューラルネットワークの積和演算を行うことができる。さらに、セルアレイＣＡに図１５に示すメモリセルＭＣおよびメモリセルＭＣｒｅｆを用いることにより、演算精度の向上、消費電力の削減、または回路規模の縮小を図ることが可能な集積回路を提供することができる。

　本実施の形態は、他の実施の形態と適宜組み合わせることができる。

（本明細書等の記載に関する付記）
　以上の実施の形態、および実施の形態における各構成の説明について、以下に付記する。

　各実施の形態に示す構成は、他の実施の形態あるいは実施例に示す構成と適宜組み合わせて、本発明の一態様とすることができる。また、１つの実施の形態の中に、複数の構成例が示される場合は、構成例を適宜組み合わせることが可能である。

　なお、ある一つの実施の形態の中で述べる内容（一部の内容でもよい）は、その実施の形態で述べる別の内容（一部の内容でもよい）、および／または、一つ若しくは複数の別の実施の形態で述べる内容（一部の内容でもよい）に対して、適用、組み合わせ、または置き換えなどを行うことが出来る。

　なお、実施の形態の中で述べる内容とは、各々の実施の形態において、様々な図を用いて述べる内容、または明細書に記載される文章を用いて述べる内容のことである。

　なお、ある一つの実施の形態において述べる図（一部でもよい）は、その図の別の部分、その実施の形態において述べる別の図（一部でもよい）、および／または、一つ若しくは複数の別の実施の形態において述べる図（一部でもよい）に対して、組み合わせることにより、さらに多くの図を構成させることが出来る。

　また本明細書等において、ブロック図では、構成要素を機能毎に分類し、互いに独立したブロックとして示している。しかしながら実際の回路等においては、構成要素を機能毎に切り分けることが難しく、一つの回路に複数の機能が係わる場合や、複数の回路にわたって一つの機能が関わる場合があり得る。そのため、ブロック図のブロックは、明細書で説明した構成要素に限定されず、状況に応じて適切に言い換えることができる。

　また、図面において、大きさ、層の厚さ、または領域は、説明の便宜上任意の大きさに示したものである。よって、必ずしもそのスケールに限定されない。なお図面は明確性を期すために模式的に示したものであり、図面に示す形状または値などに限定されない。例えば、ノイズによる信号、電圧、若しくは電流のばらつき、または、タイミングのずれによる信号、電圧、若しくは電流のばらつきなどを含むことが可能である。

　また、図面等において図示する構成要素の位置関係は、相対的である。従って、図面を参照して構成要素を説明する場合、位置関係を示す「上に」、「下に」等の語句は便宜的に用いられる場合がある。構成要素の位置関係は、本明細書の記載内容に限定されず、状況に応じて適切に言い換えることができる。

　本明細書等において、トランジスタの接続関係を説明する際、「ソースまたはドレインの一方」（または第１電極、または第１端子）、ソースとドレインとの他方を「ソースまたはドレインの他方」（または第２電極、または第２端子）という表記を用いる。これは、トランジスタのソースとドレインは、トランジスタの構造または動作条件等によって変わるためである。なおトランジスタのソースとドレインの呼称については、ソース（ドレイン）端子や、ソース（ドレイン）電極等、状況に応じて適切に言い換えることができる。

　また、本明細書等において「電極」や「配線」の用語は、これらの構成要素を機能的に限定するものではない。例えば、「電極」は「配線」の一部として用いられることがあり、その逆もまた同様である。さらに、「電極」や「配線」の用語は、複数の「電極」や「配線」が一体となって形成されている場合なども含む。

　また、本明細書等において、電圧と電位は、適宜言い換えることができる。電圧は、基準となる電位からの電位差のことであり、例えば基準となる電位をグラウンド電圧（接地電圧）とすると、電圧を電位に言い換えることができる。グラウンド電位は必ずしも０Ｖを意味するとは限らない。なお電位は相対的なものであり、基準となる電位によっては、配線等に与える電位を変化させる場合がある。

　また本明細書等において、ノードは、回路構成やデバイス構造等に応じて、端子、配線、電極、導電層、導電体、不純物領域等と言い換えることが可能である。また、端子、配線等をノードと言い換えることが可能である。

　本明細書等において、ＡとＢとが接続されている、とは、ＡとＢとが電気的に接続されているものをいう。ここで、ＡとＢとが電気的に接続されているとは、ＡとＢとの間で対象物（スイッチ、トランジスタ素子、またはダイオード等の素子、あるいは当該素子および配線を含む回路等を指す）が存在する場合にＡとＢとの電気信号の伝達が可能である接続をいう。なおＡとＢとが電気的に接続されている場合には、ＡとＢとが直接接続されている場合を含む。ここで、ＡとＢとが直接接続されているとは、上記対象物を介することなく、ＡとＢとの間で配線（または電極）等を介してＡとＢとの電気信号の伝達が可能である接続をいう。換言すれば、直接接続とは、等価回路で表した際に同じ回路図として見なせる接続をいう。

　本明細書等において、スイッチとは、導通状態（オン状態）、または、非導通状態（オフ状態）になり、電流を流すか流さないかを制御する機能を有するものをいう。または、スイッチとは、電流を流す経路を選択して切り替える機能を有するものをいう。

　本明細書等において、チャネル長とは、例えば、トランジスタの上面図において、半導体（またはトランジスタがオン状態のときに半導体の中で電流の流れる部分）とゲートとが重なる領域、またはチャネルが形成される領域における、ソースとドレインとの間の距離をいう。

　本明細書等において、チャネル幅とは、例えば、半導体（またはトランジスタがオン状態のときに半導体の中で電流の流れる部分）とゲート電極とが重なる領域、またはチャネルが形成される領域における、ソースとドレインとが向かい合っている部分の長さをいう。

　なお本明細書等において、「膜」、「層亅などの語句は、場合によっては、または、状況に応じて、互いに入れ替えることが可能である。例えば、「導電層」という用語を、「導電膜」という用語に変更することが可能な場合がある。または、例えば、「絶縁膜」という用語を、「絶縁層」という用語に変更することが可能な場合がある。

Ｃ１１：容量素子、Ｃ２１：容量素子、Ｒ１：抵抗素子、Ｔｒ１１：トランジスタ、Ｔｒ１２：トランジスタ、Ｔｒ２１：トランジスタ、Ｔｒ２２：トランジスタ、Ｔｒ２３：トランジスタ、１０：文書検索システム、２０：入力部、２１：文章データ、２１ＴＢ：表データ、３０：処理部、４０：記憶部、５０：データベース、５１：参照用文書データ、５２：重み辞書データ、５２ＴＢ：表データ、５３：類似語検索データ、５３ＴＢ：表データ、５３ＴＢ＿ｒｅ：表データ、６０：出力部、６１：検索データ、６１ＴＢ：表データ、６２：検索データ、６２ＴＢ：表データ、７０：伝送路

Claims

　入力部と、データベースと、記憶部と、処理部と、を有し、
　前記データベースは、複数の参照用文書データと、重み辞書データと、類義語辞書データと、を記憶する機能を有し、
　前記処理部は、
　前記参照用文書データに基づいて、前記重み辞書データおよび前記類義語辞書データを生成する機能と、
　前記入力部に入力された文章データから文章解析データを生成する機能と、
　前記文章解析データに含まれる単語の中から検索ワードを抽出する機能と、
　前記検索ワードから、前記重み辞書データおよび前記類義語辞書データに基づいて、第１の検索データを生成する機能と、を有し、
　前記記憶部は、前記第１の検索データがユーザに修正されることで生成される、第２の検索データを記憶する機能を有し、
　前記処理部は、前記第２の検索データに応じて、前記類義語辞書データの更新を行う機能を有する、文書検索システム。
　請求項１において、
　前記処理部は、
　前記参照用文書データから参照用文章解析データを生成する機能と、
　前記参照用文章解析データに含まれる単語の中から複数のキーワードおよび前記キーワードに対応する関連語を抽出する機能と、を有する、文書検索システム。
　請求項２において、
　前記重み辞書データは、
　前記参照用文章解析データに含まれる単語の中から、前記キーワードの出現頻度を抽出し、
　前記キーワードのそれぞれに対して、前記出現頻度に応じた第１の重みを付与して生成されるデータである、文書検索システム。
　請求項３において、
　前記第１の重みは、前記キーワードの、前記参照用文章解析データにおける逆文書頻度に基づいた値である、文書検索システム。
　請求項２乃至４のいずれか一において、
　前記類義語辞書データは、
　前記関連語のそれぞれに対して、第２の重みを付与して生成されるデータである、文書検索システム。
　請求項５において、
　前記第２の重みは、前記関連語の分散表現ベクトルと前記キーワードの分散表現ベクトルとの類似度または距離に基づいた値と、前記キーワードの前記第１の重みと、の積である、文書検索システム。
　請求項６において、
　前記分散表現ベクトルは、ニューラルネットワークを用いて生成されたベクトルである、文書検索システム。
　請求項１乃至７のいずれか一において、
　前記処理部は、トランジスタを有し、
　前記トランジスタは、チャネル形成領域に金属酸化物を有する、文書検索システム。
　請求項１乃至７のいずれか一において、
　前記処理部は、トランジスタを有し、
　前記トランジスタは、チャネル形成領域にシリコンを有する、文書検索システム。
　複数の参照用文書データに基づいて、重み辞書データおよび類義語辞書データを生成し、
　文章データから文章解析データを生成し、
　前記文章解析データに含まれる単語の中から検索ワードを抽出し、
　前記検索ワードから、前記重み辞書データおよび前記類義語辞書データに基づいて、第１の検索データを生成し、
　前記第１の検索データがユーザに修正されることで生成される第２の検索データに応じて、前記類義語辞書データの更新を行い、
　前記第２の検索データに基づいて前記参照用文書データに点数を付与し、前記点数に基づいて複数の前記参照用文書データを順位づけすることで、ランキングデータを生成する、文書検索方法。
　請求項１０において、
　前記参照用文書データから参照用文章解析データを生成し、
　前記参照用文章解析データに含まれる単語の中から複数のキーワードおよび前記キーワードの関連語を抽出する、文書検索方法。
　請求項１１において、
　前記重み辞書データは、
　前記参照用文章解析データに含まれる単語の中から、前記キーワードの出現頻度を抽出し、
　前記複数のキーワードのそれぞれに対して、前記出現頻度に応じた第１の重みを付与して生成されるデータである、文書検索方法。
　請求項１２において、
　前記第１の重みは、前記キーワードの、前記参照用文章解析データにおける逆文書頻度に基づいた値である、文書検索方法。
　請求項１１乃至１３のいずれか一において、
　前記類義語辞書データは、
　前記関連語のそれぞれに対して、第２の重みを付与して生成されるデータである、文書検索方法。
　請求項１４において、
　前記第２の重みは、前記関連語の分散表現ベクトルと前記キーワードの分散表現ベクトルとの類似度または距離に基づいた値と、前記キーワードの前記第１の重みと、の積である、文書検索方法。
　請求項１５において、
　前記分散表現ベクトルは、ニューラルネットワークを用いて生成されたベクトルである、文書検索方法。