JP2008181188A

JP2008181188A - 健康関連情報提供システム

Info

Publication number: JP2008181188A
Application number: JP2007012412A
Authority: JP
Inventors: Kazuaki Takamatsu; 和明高松
Original assignee: KOKUSAI RES ACADEMY KK; KOKUSAI RESEARCH ACADEMY KK
Current assignee: KOKUSAI RES ACADEMY KK; KOKUSAI RESEARCH ACADEMY KK
Priority date: 2007-01-23
Filing date: 2007-01-23
Publication date: 2008-08-07

Abstract

【課題】複数の専門分野の健康関連情報を横断的にその効果と共に提供する。
【解決手段】通信ネットワーク上に存在する膨大な数の健康関連情報に関する臨床学術研究論文をデジタルデータとして取り込んだデータサーバが取り込んだ各論文についてタグの主要情報及びタグのサンプル情報を抽出してタグ情報として記憶し、分析サーバがタグのサンプル情報に基づいて当該論文の信頼性および論文に記載された有用性に対する効果確率を計算してタグ情報に付加してランク分け情報とし、当該ランク分け情報を研究対象及び有用性毎に一覧表として作成し記憶することで、ユーザが利用者端末から照合サーバを通じて健康関連情報に関する論文から抽出され、加工、分析された情報を検索可能としている。
【選択図】図１

Description

本発明は、健康関連情報提供システムに関する。さらに詳述すると、学際的な健康関連情報を収集、分析し、ユーザの目的に応じて提供する健康関連情報提供システムに関する。

個人の健康維持が大きな関心の的になり、医学・食品学・栄養学・環境学・統合医療学・漢方学・スポーツ科学など多岐に渡り人間の健康維持のための臨床学術研究が盛んに行われている。

しかしながら、それぞれの専門分野の知識はそれぞれの専門家の間でのみ交換され、興味を持って調べない限り個人に伝わることがないという情報の非対称性が存在する。２０世紀には、健康維持に関する特定の研究情報が専門家の間でのみ交換され、個人が学際的な情報を入手することができないという意味で、情報の非対称性が認められたが、２１世紀に入るとインターネット等の情報技術の発展と情報公開が進むことにより、情報量が多すぎるという意味で情報の非対称性が発生している。尚、健康維持に関する分野のみならず、経営学・法学・工学などの他の分野でも同様の問題が発生している。

このような専門的な研究内容であっても、一般のユーザから簡単にアクセスすることを可能とする技術として、例えば、複数の学会等が発行する論文の要約及び全文を利用者端末からキーワードにより検索することが可能な文献検索システムが提案されている（特許文献１）。

特開２００２−６３１７１号公報

しかしながら、特許文献１に記載の技術は、論文の要約及び全文が検索結果として表示されるだけであり、特定のキーワードに合致した論文を発見できたとしても、要約や全文からでは、個人が論文の専門的な内容を理解することは極めて困難であり、また、内容を理解することができたとしても、ユーザ個々が必要な情報を取捨選択することは困難であるという問題がある。

また、上述の特許文献１では、特に論文の分野は限られていないが、例えば、あるユーザが心配している疾病について、医学・食品学・栄養学・環境学・統合医療学・漢方学・スポーツ科学など人間の健康維持のための情報全般（以下、健康関連情報という）を取得するために論文の検索を行ったとしても、その検索結果は少なくとも数百件以上にものぼり情報量が多すぎることが想定されるため、個人がこれらの全ての検索結果を基に適切に情報の分析を行い、情報の取捨選択を行うことは不可能である。

そこで、本発明は、多岐に渡る膨大な人間の健康維持のための臨床学術研究を収集し、収集された臨床学術研究を分析し、分析結果として、ユーザの種々の健康維持の目的に応じた健康関連情報提供を提供することを目的とする。

かかる目的を達成するため、請求項１記載の健康関連情報提供システムは、利用者端末および論文データベースに通信ネットワークを介して接続されたデータサーバ、分析サーバ及び照合サーバを備えた人間の健康維持のための情報全般である健康関連情報を提供するシステムであって、データサーバは、論文データベースから論文を取得して記憶する論文取込手段及び論文から少なくとも論文タイトル及び研究対象をタグの主要情報として抽出し、かつ論文に含まれる少なくとも有用性についてのサンプリングによる統計情報をタグのサンプル情報として抽出し、タグの主要情報及びタグのサンプル情報をタグ情報として記憶するタグ情報付加手段とを備え、分析サーバは、タグ情報を取得し、タグのサンプル情報に基に統計学的手法により信頼性をランク化し、タグのサンプル情報から効果確率を計算し、ランク化された信頼性及び効果確率をタグ情報に付加したランク分け情報を作成し、かつ研究対象毎のランク分け情報を研究対象一覧として記憶するランク分け手段及びランク分け情報を読み出して、有用性毎のランク分け情報を有用性一覧として記憶するクロスセクショナルリンク手段とを備え、照合サーバは、利用者端末から入力された検索条件に合致する検索結果を研究対象一覧及び有用性一覧のいずれか一方または双方から抽出し、検索結果一覧として利用者端末に出力する照会手段を備えるものである。

したがって、通信ネットワーク上に存在する膨大な数の健康関連情報を含んだ臨床学術研究論文をデジタルデータとして取り込み記憶するデータサーバが存在し、かつそのデータサーバは、取り込んだ各論文についてタグの主要情報及びタグのサンプル情報を抽出してタグ情報として記憶し、更に、分析サーバは、タグのサンプル情報に基づいて当該論文の信頼性および論文に記載された有用性に対する効果確率を計算してタグ情報に付加してランク分け情報とし、当該ランク分け情報を研究対象及び有用性毎に一覧表として作成し記憶することで、ユーザが、健康関連情報を含んだ論文から抽出され、加工、分析された情報を利用者端末から照合サーバを通じて検索可能としている。尚、研究対象とは、研究成果として挙げられている対象（例えば、食品名、生活環境、栄養素名、運動名、サプリメント名、漢方薬名等）をいい、有用性とは、研究対象が効果を有する疾病名（例えば、心筋梗塞）およびそのカテゴリー（例えば、心臓疾患）をいう。

また、請求項２に記載の発明は、請求項１に記載の健康関連情報提供システムにおいて、タグの主要情報は、ロボット検索のアルゴリズムにより、論文からデータサーバに記憶されている辞書データベース内の用語を照合し、抽出するものである。したがって、既存のロボット検索のアルゴリズムにより論文中から、予め辞書データベースに記憶されている疾病名一覧、食品名一覧、その他の検索用語一覧等に存在する用語を抽出し、これをタグの主要情報としている。

また、請求項３に記載の発明は、請求項１または２のいずれかに記載の健康関連情報提供システムにおいて、統計学的手法としてカイ二乗検定を用い、信頼性としてフィットネス値を用いるものである。

また、請求項４に記載の発明は、請求項３に記載の健康関連情報提供システムにおいて、ランク分け手段は研究対象一覧を、クロスセクショナルリンク手段は有用性一覧をフィットネス値によりソートするものである。

また、請求項５に記載の発明は、請求項１から４までのいずれかに記載の健康関連情報提供システムにおいて、照会手段は、検索結果を更に主要情報から抽出するものである。したがって、照合サーバは、検索結果の抽出に際し、分析サーバの検索対象一覧及び有用性一覧に加えて、データサーバへアクセスし、記憶されている主要情報を抽出している。

本発明にかかる健康関連情報提供システムによれば、通信ネットワーク上に存在する膨大な数の健康関連情報に関する臨床学術研究論文から複数の研究分野（医学・食品学・栄養学・環境学・統合医療学・漢方学・スポーツ科学等）の健康関連情報をユーザに対し横断的に提供することが可能となる。例えば、ある疾患について効果のある食品、栄養素等を一覧表示させることが可能となる。

また、ユーザは、健康関連情報の研究対象及び有用性をキーとして、研究対象から及び有用性からの両面から相互に情報の検索が可能となる。更に、ユーザの種々の健康維持の目的に応じた健康関連情報を提供することができる。

更に、請求項２に記載の健康関連情報提供システムによれば、ロボット検索のアルゴリズムを用いることで、論文中からタグの主要情報に該当する箇所を正確に抽出することができる。

更に、請求項３に記載の健康関連情報提供システムによれば、カイ二乗検定のフィットネス値（χ^２値）により、サンプル情報の適合度の検定を行うことができる。

更に、請求項４に記載の健康関連情報提供システムによれば、研究対象一覧、有用性一覧は信頼性（フィットネス値）が大きい順に並べられるので、ユーザは信頼性の高い健康関連情報を一目で認識することができる。

更に、請求項５に記載の健康関連情報提供システムによれば、ユーザは検索結果として表示された健康関連情報の情報源となった論文のタグの主要情報を検索、閲覧することができる。

以下、本発明の構成を図面に示す実施の形態に基づいて詳細に説明する。

本実施形態の健康関連情報提供システム１は、利用者端末７および論文データベース６に通信ネットワーク５を介して接続されたデータサーバ２、分析サーバ３及び照合サーバ４を備えた人間の健康維持のための情報全般である健康関連情報を提供するシステムであって、データサーバ２は、論文データベース６から論文を取得して記憶する論文取込手段２０及び論文から少なくとも論文タイトル及び研究対象をタグの主要情報として抽出し、かつ論文に含まれる少なくとも有用性についてのサンプリングによる統計情報をタグのサンプル情報として抽出し、タグの主要情報及びタグのサンプル情報をタグ情報として記憶するタグ情報付加手段２１とを備え、分析サーバ３は、タグ情報を取得し、タグのサンプル情報に基に統計学的手法により信頼性をランク化し、タグのサンプル情報から効果確率を計算し、ランク化された信頼性及び効果確率をタグ情報に付加したランク分け情報を作成し、かつ研究対象毎のランク分け情報を研究対象一覧として記憶するランク分け手段３９及びランク分け情報を読み出して、有用性毎のランク分け情報を有用性一覧として記憶するクロスセクショナルリンク手段４０とを備え、照合サーバ４は、利用者端末７から入力された検索条件に合致する検索結果を研究対象一覧及び有用性一覧のいずれか一方または双方から抽出し、検索結果一覧として利用者端末７に出力する照会手段５８を備えるものである。

本実施形態の健康関連情報提供システム１によりユーザに提供される健康関連情報とは、臨床学術研究論文から抽出可能な情報をいう。尚、本実施形態では、臨床学術研究論文（以下、単に論文ともいう）は、信頼性を重視して当該分野の専門家の査読により論文の掲載が決定される仕組み（レフリー付き）の各種学会や大学・企業内紀要に研究論文や研究レポートだけを対象としている。尚、これらのレフリー付きの論文には、通常サンプリングによる統計情報が含まれており、本実施形態では、統計情報が含まれた論文を対象としている。しかしながら、対象とする論文は適宜選択可能なものであり、特に限られるものではない。

次に、本実施形態の健康関連情報提供システム１のハードウェア構成を図１を用いて説明する。健康関連情報提供システム１は、臨床学術研究論文が記録されている論文データベース６から論文を取得して記憶し、併せて、論文内のタグの主要情報及びタグのサンプル情報を抽出してタグ情報一覧を作成し記憶するデータサーバ２、データサーバ２に記憶された各論文のサンプル情報を基準として論文の信頼性を判断し、研究対象と有用性による階層的なランク分け行い各論文間を相互にリンクさせる分析サーバ３、利用者端末７からの検索条件に従って分析サーバ３に記憶されたランク分けされた階層的な全ての論文から、目的に適した健康関連情報を検索結果一覧として利用者端末７に返す照合サーバ４の３つのサーバから構成される。

データサーバ２、分析サーバ３及び照合サーバ４には、出力装置、入力装置、中央処理演算装置（ＣＰＵ）、主記憶装置（ＲＡＭ）、ハードディスク、通信インタフェース等を備えたパーソナルコンピュータ、ワークステーション、専用機等が用いられる。また、データサーバ２、分析サーバ３及び照合サーバ４は、必ずしも異なるハードウェアで構成される必要はなく、複数のサーバ機能を一つのハードウェアで実現させるようにしても良い。

また、健康関連情報提供システム１は、インターネット等の通信ネットワーク５を通じて、臨床学術論文が記録された論文データベース６（６ａ，６ｂ，６ｃ．．．）へのアクセスを可能としている。更に、インターネットまたは専用回線等の通信ネットワーク（図示せず）を介して利用者端末７に接続され、利用者端末７から、健康関連情報提供システム１にアクセスすることを可能としている。尚、利用者端末７には、例えば、インターネットを介して健康関連情報提供システム１にアクセスすることが可能な、即ち、Ｗｅｂブラウザプログラム等がインストールされたパーソナルコンピュータを用いることができる。

以下、本実施形態の健康関連情報提供システム１が実行する処理について、各サーバの処理の詳細を説明することにより解説する。また、図１１にデータサーバ２がある論文Ｘを取り込み、タグ情報一覧を作成し、分析サーバ３がタグ情報を取り込んでランク分け情報を作成し、更新するまでの処理の概略シークエンスを示す。

先ず、データサーバ２について説明する。データサーバ２のハードウェア構成の一例を図２に示す。データサーバ２は、ディスプレイ等の出力装置１１と、キーボード、マウス等の入力装置１２と、演算処理を行う中央処理演算装置（ＣＰＵ）１３と、計算中のデータ、パラメータ等が記憶される主記憶装置（ＲＡＭ）１４と、計算結果等が記録される補助記憶装置としてのハードディスク１５、他のサーバ３，４、通信ネットワーク５等と通信を行うための通信インタフェース１６等を備えている。上記のハードウェア資源は例えばバス１７を通じて電気的に接続されている。

また、データサーバ２の補助記憶装置１５には、論文を取り込む処理を実行する論文取込プログラム１８、取り込んだ論文からタグ情報を抽出し保存する処理を行うタグ情報付加プログラム１９が記憶されており、当該プログラムがＣＰＵ１３に読み込まれ実行されることによって、コンピュータが論文取込手段２０、タグ情報付加手段２１として機能する。その実行の際に必要なデータ、パラメータ等は、ＲＡＭ１４のテンポラリーエリア２２にロードされる。

また、補助記憶装置１５には、ダウンロードした論文の電子データを記憶する内部論文データベース２３、タグ番号をキーとして、論文タイトル、研究者名、発行機関名、発行年度、要約、研究対象、有用性、効果、データ数、性別別・年代別のデータ数等のタグ情報一覧（図３参照）を記憶するタグ一覧データベース２４、論文名一覧、疾病名一覧、食品名一覧、栄養素一覧、統合医療一覧、漢方薬一覧、スポーツ一覧、その他の検索用語一覧などが予め記憶された辞書データベース２５が構築される。

本実施形態では、タグ一覧データベース２４には、タグ番号が順に記憶されており、当該タグ番号に該当するタグ情報を記憶する際に、予め記憶されたタグ番号に関連づけて記憶するようにしている。また、日本語による論文に限らず、英語、仏語等の他の言語によるものも対象とすることが好ましいため、辞書データベース２５には、各用語につき対応する英訳、仏訳等を記憶した翻訳データも併せて記憶させておくことが好ましい。または、各国語間の翻訳プログラムを実行可能とすることが好ましい。尚、上記タグ一覧データベース２４のフィールド名及び辞書データベース２５のデータ例は一例であってこれには限られないのは勿論である。

本実施形態のデータサーバ２の論文取込手段２０及びタグ情報付加手段２１が実行する処理の一例を図４のフローチャートに示す。尚、Ｓ２０１は論文取込手段２０、Ｓ２０２〜Ｓ２０６はタグ情報付加手段２１により実行されるものである。

先ず、論文Ｘの内容の取り込みを行う（Ｓ２０１）。

論文取込手段２０は、論文Ｘの電子データを通信ネットワーク５を介して論文データベース６からダウンロードし、内部論文データベース２３に記憶させるものである。本実施形態での論文データベース６には、臨床学術論文がデジタルデータ化されデータベース化されており、それらの論文には、例えば、キーワード検索によりアクセスし、ダウンロードすることが可能である。本実施形態では、例えば、初期設定時に対象となる全ての論文をダウンロードしておき、以降は、論文取込手段２０は、論文データベース６に一定時間おきにアクセスして、新たに更新された論文を自動ダウンロードし、内部論文データベース２３に記憶するものである。

論文データベース６としては、例えば、米国国立医学図書館（ＮＬＭ）の国立バイオテクノロジー情報センター（ＮＣＢＩ）が運営するＰｕｂｍｅｄや国内外の大学等において公開されているデータベースを用いることができるが、その運営主体およびその利用数は、特に限られるものではなく、多くの運営主体の論文データベース６から論文を取得しておくことにより、多くの論文を対象とした健康関連情報提供システム１を構築することが可能となる。

尚、専門誌等に掲載された論文であって電子データが存在しない場合は、予め、発刊された論文をスキャナーなどで読み取りデジタル化し、更に、公知または新規の自動文字認識技術を用いて文字認識を行った上で、内部論文データベース２３に記憶するようにすれば良い。

データサーバ２に読み込まれた論文は、タグ番号が付加されてテンポラリーエリア２２に記憶される。本実施形態では、タグ番号は、データサーバ２に取り込まれた順にタグ番号を連番で付加するようにしているが、付与方法は、特に限られるものではない。

次情報？（Ｓ２０２）とは、取り込むべき論文が他に存在しているかどうかを判断するステップである。他に論文があれば（Ｓ２０２：Ｙｅｓ）Ｓ２０３へ移り、他に論文がなければ（Ｓ２０２：Ｎｏ）、処理は終了する。１回目のループ処理においては、当該判断はされず、そのままＳ２０３へ移るものとしている。尚、ループ処理を行った回数は、例えば別途カウンタを設けてカウントすればよい。

次に、取り込まれた論文の中からタグの主要情報の読み取り処理（Ｓ２０３）を行う。タグの主要情報とは、論文タイトル、研究者、発行機関名、発行年度、論文内容の要約、研究成果として挙げられている研究対象等をいう。タグの主要情報の一例を表１に示す。

ここで論文のタイトルページには、冒頭に論文タイトルと研究者名が、その後に要約をキーワードとして要約内容が、ヘッダーの右側または左側に発行機関名、発行年数及びＶｏｌナンバーが記載されている。タグの主要情報は、このような上記タイトルページの位置の指定を基に検索され抽出される。

本実施形態では、更に、公知または新規のロボット検索のアルゴリズムを用いて、論文全体からタグの主要情報及び有用性等を検索するようにしている。

ロボット検索のアルゴリズムは、予め記憶された辞書データベース２５に存在する情報と照合し、該当する用語が論文内に存在する場合は、タグの主要情報の該当するフィールド名に入力する。このようにして検索された情報は、タグの主要情報としてテンポラリーエリア２２に記憶される。更に、本実施形態では、有用性の項目が見つかったパラグラフについては、パラグラフ全体を抽出してテンポラリーエリア２２に一時記憶させる。尚、当該パラグラフを別途データベースを構成して記憶し、利用者端末７からパラグラフの閲覧を可能とするようにしても良い。また、パラグラフの抽出の際、前後のパラグラフも併せて抽出するようにすることも好ましい。

次に、タグのサンプル情報の読み取り処理（Ｓ２０４）を行う。

本実施形態では、テンポラリーエリア２２に一時記憶された有用性の項目を含むパラグラフに対して、公知又は新規の言語解析のアルゴリズムを用いて有用性及びそれに付属する情報（タグのサンプル情報）を読み取り記憶するものである。

タグのサンプル情報とは、例えば、論文に含まれているサンプリングによる統計情報（総サンプル数や総サンプルの中から有効を示した人数や割合）、サンプル属性（研究対象となった性別、年代別、人種別、対象症状別、地域別、統計年数等）及びサンプル属性ごとのサンプル数と効果の度合いを指す。尚、効果には、実際のサンプル数又は割合（効果のあったサンプル数／総サンプル数）のいずれかの値が入力される。更に、有用性の項目への効果の度合いを表す言葉を抽出し、それらの言葉と有効割合との対応関係を予め作成しておいて効果の度合い（％）を算出するようにしても良い。

タグのサンプル情報の一例を表２に示す。例えば、表２に示すタグのサンプル情報では、論文Ｘについての研究対象（表１のコーヒー）の有用性は、糖尿病だけが検索されたので、有用性（１）には糖尿病が記載されている。複数の有用性に該当する項目が検索された場合は、有用性（２）欄に入力される。尚、有用性の欄は２つに限られず、複数設ければよい。また、表２に示すサンプル情報の項目は、一例であり上述のようにこれには限られない。

また表２は、コーヒーの糖尿病への効果を示す文章を言語解析アルゴリズムにより解析した結果の例である。例えば、コーヒーが糖尿病に効果が見られたのは、総サンプル数２，１００人（データ数フィールド）中の５５０人（効果（１）フィールド）であることを示している。尚、有用性が複数存在しないので、対応する効果（２）は、空欄である。

また、同様に総サンプル数２，１００人のサンプル属性として、性別（男・女）や年代別（１０代から７０代）のデータ数とコーヒーの有効性が見られた人数が検索され、表２のそれぞれの欄に記載されている。

このようにテンポラリーエリア２２に一時記憶されたタグの主要情報およびタグのサンプル情報を、タグ一覧データベース２４から読み出したタグ番号に関連づけてタグ情報としてタグ情報一覧のレコードを作成し（図３参照、Ｓ２０５）、タグ番号を付加した論文Ｘを内部論文データベース２３に、タグ番号をキーとしたタグ情報一覧をタグ一覧データベース２４に記憶し（Ｓ２０６）、Ｓ２０２の終了判断に移る。以上の処理をデータサーバ２は、取り込むすべての論文について実行する。

次に、分析サーバ３について説明する。分析サーバ３のハードウェア構成の一例を図５に示す。分析サーバ３は、ディスプレイ等の出力装置３０と、キーボード、マウス等の入力装置３１と、演算処理を行う中央処理演算装置（ＣＰＵ）３２と、計算中のデータ、パラメータ等が記憶される主記憶装置（ＲＡＭ）３３と、計算結果等が記録される補助記憶装置としてのハードディスク３４、他のサーバ２，４、通信ネットワーク５等と通信を行うための通信インタフェース３５等を備えている。上記のハードウェア資源は例えばバス３６を通じて電気的に接続されている。

また、分析サーバ３の補助記憶装置３４には、データサーバ２から論文のタグ情報を取り込んで、タグ情報を基に論文間をランク分けしリンクを張る処理を実行するランク分けプログラム３７、リンク間の関連付け情報を記録する処理を行うクロスセクショナルリンクプログラム３８が記憶されており、当該プログラムがＣＰＵ３２に読み込まれ実行されることによって、コンピュータがランク分け手段３９、クロスセクショナルリンク手段４０として機能する。その実行の際に必要なデータ、パラメータ等は、ＲＡＭ３３のランク分けエリア４１またはクロスセクショナルリンクエリア４２にロードされる。

また、補助記憶装置３４には、論文Ｘのタグ情報にフィットネス値及び効果確率を付加した情報（以下、ランク分け情報という）を研究対象毎にフィットネス値順にソートし、一覧としたもの（以下、研究対象一覧）を記憶するランク分けデータベース４３、ランク分け情報を有用性毎にフィットネス値順にソートし、一覧としたもの（有用性一覧）を記憶するクロスセクショナルリンクデータベース４４が記憶されている。

本実施形態では、ランク分けエリア４１の中には、図６に示すように、研究対象のカテゴリー分野別に分割されたスロット８ａが読み出される。各分野のスロットは細分化されたスロット８ｂを含み、更に、その中には、研究対象一覧のスロット（図示せず）が用意される。尚、スロットは、予め補助記憶装置３４に記憶させておくものである。本実施形態では、例えば、疾病分野、食品分野、栄養素分野等のスロット８ａのうち、例えば、大分野を食品分野とした場合であれば、野菜分野、肉分野、嗜好品分野等の中分類、更に嗜好品分野であれば、コーヒー、紅茶、酒等の小分類に分類している。

以下に、本実施形態の分析サーバ３のランク分け手段３９が実行する処理の一例を図７のフローチャートに示す。

先ず、論文Ｘのタグ情報の取込を行う（Ｓ３０１）。本処理は、データサーバ２のタグ一覧データベース２４に記憶されたタグ情報一覧をランク分けエリア４１に読み出すものである。

次情報？（Ｓ３０２）とは、タグ情報を取り込むべき論文が他に存在しているかどうかを判断するステップである。他に論文があれば（Ｓ３０２：Ｙｅｓ）Ｓ３０３へ移り、他に論文がなければ（Ｓ３０２：Ｎｏ）、処理は終了する。

次に、分析サーバ３に読み込まれた論文のタグ情報のサンプル総数とサンプル属性ごとの分布数に基づいて、フィットネス値を計算する（Ｓ３０３）。

フィットネス値の計算は、例えば、サンプル総数とサンプル属性ごとの分布数に対する一様分布におけるχ^２テスト（カイ二乗検定）を行う。尚、フィットネス値とは、小数点第２位までのχ^２値である。尚、カイ二乗検定とは、帰無仮説が正しければ検定統計量がカイ二乗分布に従うような統計学的検定法であり、適合度検定および独立性検定に用いられる。本実施形態では、信頼性のランク化に際し、フィットネス値を用いているが特に限られるものではなく、カイ二乗検定とは別の統計学的検定法により信頼性のランク化を行うようにしても良い。

更に、研究対象の効果確率を計算する（Ｓ３０４）。効果確率は、論文Ｘのタグ情報の中の有用性の効果の数値を用いて計算される。例えば、効果確率には、その効果の数値が、既に割合（効果のあったサンプル数／総サンプル数）で表示（小数点表示）されているものはそのままの数値を、効果が認められた度合の数字（効果のあったサンプル数）の場合は総サンプル数で割った数値を用いることができる。

例えば、上記表２に示した研究対象コーヒーの場合、効果（１）欄の糖尿病の効果サンプル（＝５５０）は実数であるので、この数値を総サンプル数（＝２１００）で割った数値がコーヒーの糖尿病への効果確率となる。

同様に、サンプル属性の効果確率は、それぞれの属性のカテゴリー別の分布の数値をそれぞれの属性のサンプル数で割り求める（Ｓ３０５）。以下、論文Ｘのタグ情報に、フィットネス値及び効果確率を付加した情報をランク分け情報という。

このようにして作成されるランク分け情報の一例を表３に示す。

次に、ランク分けデータベース４３にすでに記憶されている論文Ｘの研究対象と一致する研究対象一覧を読み出して（Ｓ３０６）、更に、論文Ｘのランク分け情報を研究対象一覧に追加したうえで、フィットネス値が大きい順にソートを行う（Ｓ３０７）。これらの処理は、ランク分けエリア４１において実行される。本実施形態では、研究対象一覧は、フィットネス値について昇順に並べられ記憶されているが、特に限られるものではない。

このようにして作成される研究対象一覧の一例を表４に示す。本実施形態では、研究対象一覧は、情報として表４のデータ項目を有しているが、ランク分け情報と同じデータ内容をすべて有するようにしても良い。

ここで本実施形態では、同等数のフィットネス値（例えば、±０．１以内）を示すランク分け情報が存在する場合（Ｓ３０８：Ｙｅｓ）には、サンプル総数が多い方の信頼性を高く評価し、高いランクとするようにしている（Ｓ３０９）が、値を同等であると見なす範囲等は、処理の一例であって特に限られるものではない。

論文Ｘのランク分け情報の追加によりアップデートされた研究対象一覧は、ＲＡＭ３３のランク分けエリア４１から補助記憶装置３４のランク分けデータベース４３に記憶し（Ｓ３１０）、Ｓ３０２へ戻るものである。以上でランク分け手段３９による処理は終了する。

次に、クロスセクショナルリンク手段４０について説明する。上述のランク分けエリア４１においてアップデートされた研究対象一覧に基づき、次のクロスセクショナルリンクエリア４２において情報がアップデートされる。

本実施形態では、クロスセクショナルリンクエリア４２の中には、図８に示すように、有用性のカテゴリー分野別に分割されたスロット８ａが読み出される。各分野のスロットは細分化されたスロット８ｂを含み、更に、その中には、有用性一覧のスロット（図示せず）が用意される。例えば、大分野を内蔵、中分野を腎臓、小分野を糖尿病とすることができる。

以下に、本実施形態の分析サーバ３のクロスセクショナルリンク手段４０が実行する処理の一例を図９のフローチャートに示す。

先ず、ランク分けデータベース４３から論文Ｘについてのランク分け情報をクロスセクショナルリンクエリア４２に読み出す（Ｓ４０１）。

次情報？（Ｓ４０２）とは、ランク分け情報を取り込むべき論文が他に存在しているかどうかを判断するステップである。他に論文があれば（Ｓ４０２：Ｙｅｓ）Ｓ４０３へ移り、他に論文がなければ（Ｓ４０２：Ｎｏ）、処理は終了する。

次に、クロスセクショナルリンクデータベース４４にすでに記憶されている論文Ｘの有用性項目と一致する有用性一覧を読み出して（Ｓ４０３）、更に、論文Ｘのランク分け情報を有用性一覧に追加したうえで、フィットネス値が大きい順にソートを行う（Ｓ４０４）。

このようにして作成される有用性一覧の一例を表５に示す。本実施形態では、有用性一覧は、情報として表５のデータ項目を有しているが、ランク分け情報と同じデータ内容をすべて有するようにしても良い。

ここで本実施形態では、同等数のフィットネス値（例えば、±０．１以内）を示すランク分け情報が存在する場合（Ｓ４０５：Ｙｅｓ）には、サンプル総数が多い方の信頼性を高く評価し、高いランクとするようにしている（Ｓ４０６）。

論文Ｘのランク分け情報の追加によりアップデートされた有用性一覧は、ＲＡＭ３３のクロスセクショナルリンクエリア４２から補助記憶装置３４のクロスセクショナルリンクデータベース４４に記憶し（Ｓ４０７）、Ｓ４０２へ戻るものである。以上でクロスセクショナルリンク手段４０による処理は終了する。

以上の処理を分析サーバ３は、データサーバ２に取り込まれたすべての論文について実行するものである（Ｓ３０２，Ｓ４０２）。

次に、照合サーバ４について説明する。照合サーバ４のハードウェア構成の一例を図１０に示す。照合サーバ４は、ディスプレイ等の出力装置５０と、キーボード、マウス等の入力装置５１と、演算処理を行う中央処理演算装置（ＣＰＵ）５２と、計算中のデータ、パラメータ等が記憶される主記憶装置（ＲＡＭ）５３と、計算結果等が記録される補助記憶装置としてのハードディスク５４、他のサーバ２，３、通信ネットワーク５等と通信を行うための通信インタフェース５５等を備えている。上記のハードウェア資源は例えばバス５６を通じて電気的に接続されている。

また、照合サーバ４の補助記憶装置５４には、利用者端末７から入力されたキーワードを分析サーバ３に照会する処理を実行する照会プログラム５７が記憶されており、当該プログラムがＣＰＵ５２に読み込まれ実行されることによって、コンピュータが照会手段５８として機能する。その実行の際に必要なデータ、パラメータ等は、ＲＡＭ５３にロードされる。

照合サーバ４は、ユーザにより利用者端末７から入力されたキーワードを分析サーバ３に照会し、該当する情報が存在するかどうかを検索するものである。

照会手段５８は、利用者端末７から入力されたキーワード等の検索内容に該当する情報をランク分けデータベース４３やクロスセクショナルリンクデータベース４４から検索し、情報を抽出して利用者端末７の出力装置に、例えば検索結果一覧として表示させるものである。ユーザは、当該検索結果一覧を利用者端末７に接続されたプリンター等の印刷装置により印刷することができる。

また、ランク分けデータベース４３やクロスセクショナルリンクデータベース４４で検索されたタグ番号をキーとして、更に、データサーバ２に対して論文の主要情報や論文の全文を照会し、抽出することが可能である。

また、利用者端末７の出力装置には、例えば、検索条件としてキーワードを指定するフィールド、検索対象として、研究対象一覧とするのか有用性一覧とするのかを選択するラジオボタン、医学・食品学・栄養学・環境学・統合医療学・漢方学・スポーツ科学などのどの分野について検索するのかを選択するラジオボタン等が、ＧＵＩ表示され、ユーザはキーワード検索等の種々の検索方法により自己の必要な健康関連情報を検索することができるものである。

図１２に示す本実施形態の健康関連情報提供システム１による検索処理の概略シークエンスを用いて、検索処理の概要を説明する。

先ず、ユーザは、利用者端末７からキーワード検索や種々の検索条件を指定して検索を実行する（Ｓ１０１）。これを受信した照合サーバ４は、照会プログラム５７を実行（Ｓ１０２）して、ランク分けデータベース４３及びクロスセクショナルリンクデータベース４４から、検索条件に応じた検索結果一覧を作成する（Ｓ１０３）。

これを利用者端末７の出力装置に表示させる。また、ユーザが検索結果として表示された情報の情報源である論文の全文等の照会を希望する場合は、例えば、論文の全文検索を実行し（Ｓ１０４）、照合サーバ４は、データサーバ２の内部論文データベース２３から論文の全文を抽出し、出力装置に結果を表示させるものである（Ｓ１０５）。

以下に、本発明の健康関連情報提供システム１による検索処理について検索方法および検索結果一覧を具体的な例を挙げる。

ユーザが利用者端末７から、研究対象としてコーヒーをキーワード検索し、検索対象として研究対象一覧が選択されている場合は、例えば、上記表４に示したような研究対象一覧が検索結果として利用者端末７の出力装置に表示される。

これによりユーザは表示される検索結果（表４）からは、コーヒーの有用性としては、糖尿病、心筋症、肺気腫、脳梗塞に関する論文があることがわかり、また、糖尿病には６３％の効果確率があること、脳梗塞には３２％の効果確率があることがわかる。また、同時に、心筋症には−４６％、肺気腫には−２０％と健康へのマイナス効果が報告されている論文があることがわかり、複数の論文からの内容を横断的に一目で認識することができるものである。

また、例えば、上記表４のタグ番号に論文の主要情報及び論文の全文へのハイパーリンクが貼られており、ユーザはタグ番号欄をクリックすることで論文の主要情報、論文の全文の確認することが可能となる。

また、ユーザは、研究対象のある分野（例えば、食品分野）と有用性のある分野（例えば、疾病分野）を検索条件として指定することが可能である。本実施形態では、利用者端末７の検索画面から、該当分野（医学・食品学・栄養学・環境学・統合医療学・漢方学・スポーツ科学）のうちどの分野を表示させるか等が選択可能としている。

この場合、表６に示すように、食品と疾病のリンク上の研究対象に関して有用性が認められた特定疾病の一覧と、その効果確率が一覧表として出力される。本実施形態では、表６のコーヒーの行の脳障害、心臓障害、腎臓障害などへの効果確率である３２％、−４６％、６３％などの数値は、各有用性について最もフィットネス値の大きいレコードの効果確率を参照している。表示される一覧表からユーザは、例えば、どの食品がどの疾病に効果的で、どの疾病に悪い影響を及ぼすかを一目で確認することが可能となる。また、表７には、生活環境と疾病のリンク上の研究対象に関して有用性が認められた特定疾病の一覧と、その効果確率が一覧表を示す。

このように、本発明の健康関連情報提供システム１では、研究対象と有用性の間にクロスしたリンクの存在、即ち、ランク分けデータベース４３に記憶された研究対象一覧及びクロスセクショナルリンクデータベース４４に記憶された有用性一覧とのリンクにより、研究対象からと有用性からの両面から相互に情報の検索が可能となる。

また、本発明の健康関連情報提供システム１は、ユーザにより検索対象として複数の研究対象（例えば、たばこ、酒、朝食）及び複数の有用性（例えば、脳障害、心臓障害、腎臓障害）が同時に選択された場合に、選択した項目を行、列とする一覧表を出力することも可能である。

また、例えば、あるユーザがＤＮＡ分析を行い、その分析の結果、潜在疾患として消化器系疾患の中の糖尿病及び肝臓がん、循環器系疾患の心筋梗塞、血管血栓及び脳血栓、そしてアレルギー系疾患の花粉症に注意すべきであるとの診断がなされているとする場合において、ユーザは、健康関連情報提供システム１を利用して利用者端末７から、それらの疾患に対する有効な処方を照会することができる。この際に、種々の検索を行うことを可能としている。

例えば、表８は、潜在疾患をキーとして、各分野の中から最も高い効果確率が報告されている研究対象項目や有用性項目とそれらの効果確率の検索結果一覧の一例である。

例えば、糖尿病に関して調べると、上記表６の腎臓疾患の列から、最も高い効果確率を示した食品はコーヒーであり、その効果確率は６３％であることがわかる。また、上記表７の腎臓疾患の列から、最も高い効果確率を示した生活環境は朝食（朝食をとること）であり、その効果確率は２５％であることがわかる。

更に、他の分野と疾病とのリンクを照会し、それぞれの分野で最も高い効果確率を照会し、上記表８に示す糖尿病の列の一覧が作成される。

また、表９は、ユーザが日頃悩んでいる疾患全てに対して、それぞれの分野の中から、当該疾患の症状改善に適した療法と適さない療法のベスト３を検索した場合の検索結果一覧の一例である。

更に、ユーザが表示された検索結果一覧のうちある情報の情報源となる論文を参照したい場合は、当該項目を選択することにより、例えば、表１０に示すような論文詳細情報一覧が表示される。本実施形態では、論文の詳細情報に併せて、内部論文データベース２３の該当論文へのリンクも表示されるので、ユーザは、各論文の全文を確認することも可能である。

以上述べたように本実施形態の健康関連情報提供システム１は、研究対象と有用性の間にリンクを有し、研究対象と有用性の双方の観点から検索することが可能である。

尚、本発明の健康関連情報提供システム１は、以上述べた検索方法に限られず、データサーバ２及び分析サーバ３が備える情報を、各データベースが有するリンクを活用し、種々の検索方法により検索することが可能である。

上述の実施形態は本発明の好適な実施の例ではあるがこれに限定されるものではなく、本発明の要旨を逸脱しない範囲において種々変形実施可能である。

例えば、検索結果の一覧表の作成における効果確率の参照は、各有用性毎に最もフィットネス値の高いレコードの効果確率を抽出するようにしているが、これには限らず、例えば、各有用性毎にフィットネス値の高い予め設定された数のレコード（例えば、上位５つ）のまたは、すべてのレコードの効果確率を平均化して効果確率を算出するようにしても良い。このようにすることで、各有用性について複数の論文内容を反映した効果確率を算出することが可能となる。

本発明の健康関連情報提供システムのハードウェア構成の一例を示す図である。データサーバのハードウェア構成の一例を示す図である。データサーバのタグ一覧データベースに記憶されるタグ情報一覧の一例を示す図である。データサーバの論文取込手段及びタグ番号付加手段が実行する処理の一例を示すフローチャートである。分析サーバのハードウェア構成の一例を示す図である。ランク分けエリアに構成されるスロットのイメージ図及び各分野内の研究対象一覧を示す図である。分析サーバのランク分け手段が実行する処理の一例を示すフローチャートである。クロスセクショナルリンクエリアに構成されるスロットのイメージ図及び各分野内の有用性一覧を示す図である。分析サーバのクロスセクショナルリンク手段が実行する処理の一例を示すフローチャートである。照合サーバのハードウェア構成の一例を示す図である。データサーバ、分析サーバが実行する処理の概略シークエンスの一例を示す図である。検索処理の概略シークエンスの一例を示す図である。

符号の説明

１健康関連情報提供システム
２データサーバ
３分析サーバ
４照合サーバ
５通信ネットワーク
６論文データベース
７利用者端末

Claims

利用者端末および論文データベースに通信ネットワークを介して接続されたデータサーバ、分析サーバ及び照合サーバを備えた人間の健康維持のための情報全般である健康関連情報を提供するシステムであって、前記データサーバは、前記論文データベースから論文を取得して記憶する論文取込手段及び前記論文から少なくとも論文タイトル及び研究対象をタグの主要情報として抽出し、かつ前記論文に含まれる少なくとも有用性についてのサンプリングによる統計情報をタグのサンプル情報として抽出し、前記タグの主要情報及び前記タグのサンプル情報をタグ情報として記憶するタグ情報付加手段とを備え、前記分析サーバは、前記タグ情報を取得し、前記タグのサンプル情報に基に統計学的手法により信頼性をランク化し、前記タグのサンプル情報から効果確率を計算し、ランク化された前記信頼性及び前記効果確率を前記タグ情報に付加したランク分け情報を作成し、かつ前記研究対象毎の前記ランク分け情報を研究対象一覧として記憶するランク分け手段及び前記ランク分け情報を読み出して、前記有用性毎の前記ランク分け情報を有用性一覧として記憶するクロスセクショナルリンク手段とを備え、前記照合サーバは、前記利用者端末から入力された検索条件に合致する検索結果を前記研究対象一覧及び前記有用性一覧のいずれか一方または双方から抽出し、検索結果一覧として前記利用者端末に出力する照会手段を備えることを特徴とする健康関連情報提供システム。
前記タグの主要情報は、ロボット検索のアルゴリズムにより、前記論文から前記データサーバに記憶されている辞書データベース内の用語を照合し、抽出することを特徴とする請求項１に記載の健康関連情報提供システム。
前記統計学的手法としてカイ二乗検定を用い、前記信頼性としてフィットネス値を用いることを特徴とする請求項１または２のいずれかに記載の健康関連情報提供システム。
前記ランク分け手段は前記研究対象一覧を、前記クロスセクショナルリンク手段は前記有用性一覧を前記フィットネス値によりソートすることを特徴とする請求項３に記載の健康関連情報提供システム。
前記照会手段は、前記検索結果を更に前記主要情報から抽出することを特徴とする請求項１から４までのいずれかに記載の健康関連情報提供システム。