JP2008181188A - 健康関連情報提供システム - Google Patents
健康関連情報提供システム Download PDFInfo
- Publication number
- JP2008181188A JP2008181188A JP2007012412A JP2007012412A JP2008181188A JP 2008181188 A JP2008181188 A JP 2008181188A JP 2007012412 A JP2007012412 A JP 2007012412A JP 2007012412 A JP2007012412 A JP 2007012412A JP 2008181188 A JP2008181188 A JP 2008181188A
- Authority
- JP
- Japan
- Prior art keywords
- information
- paper
- tag
- list
- health
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
【課題】複数の専門分野の健康関連情報を横断的にその効果と共に提供する。
【解決手段】通信ネットワーク上に存在する膨大な数の健康関連情報に関する臨床学術研究論文をデジタルデータとして取り込んだデータサーバが取り込んだ各論文についてタグの主要情報及びタグのサンプル情報を抽出してタグ情報として記憶し、分析サーバがタグのサンプル情報に基づいて当該論文の信頼性および論文に記載された有用性に対する効果確率を計算してタグ情報に付加してランク分け情報とし、当該ランク分け情報を研究対象及び有用性毎に一覧表として作成し記憶することで、ユーザが利用者端末から照合サーバを通じて健康関連情報に関する論文から抽出され、加工、分析された情報を検索可能としている。
【選択図】図1
【解決手段】通信ネットワーク上に存在する膨大な数の健康関連情報に関する臨床学術研究論文をデジタルデータとして取り込んだデータサーバが取り込んだ各論文についてタグの主要情報及びタグのサンプル情報を抽出してタグ情報として記憶し、分析サーバがタグのサンプル情報に基づいて当該論文の信頼性および論文に記載された有用性に対する効果確率を計算してタグ情報に付加してランク分け情報とし、当該ランク分け情報を研究対象及び有用性毎に一覧表として作成し記憶することで、ユーザが利用者端末から照合サーバを通じて健康関連情報に関する論文から抽出され、加工、分析された情報を検索可能としている。
【選択図】図1
Description
本発明は、健康関連情報提供システムに関する。さらに詳述すると、学際的な健康関連情報を収集、分析し、ユーザの目的に応じて提供する健康関連情報提供システムに関する。
個人の健康維持が大きな関心の的になり、医学・食品学・栄養学・環境学・統合医療学・漢方学・スポーツ科学など多岐に渡り人間の健康維持のための臨床学術研究が盛んに行われている。
しかしながら、それぞれの専門分野の知識はそれぞれの専門家の間でのみ交換され、興味を持って調べない限り個人に伝わることがないという情報の非対称性が存在する。20世紀には、健康維持に関する特定の研究情報が専門家の間でのみ交換され、個人が学際的な情報を入手することができないという意味で、情報の非対称性が認められたが、21世紀に入るとインターネット等の情報技術の発展と情報公開が進むことにより、情報量が多すぎるという意味で情報の非対称性が発生している。尚、健康維持に関する分野のみならず、経営学・法学・工学などの他の分野でも同様の問題が発生している。
このような専門的な研究内容であっても、一般のユーザから簡単にアクセスすることを可能とする技術として、例えば、複数の学会等が発行する論文の要約及び全文を利用者端末からキーワードにより検索することが可能な文献検索システムが提案されている(特許文献1)。
しかしながら、特許文献1に記載の技術は、論文の要約及び全文が検索結果として表示されるだけであり、特定のキーワードに合致した論文を発見できたとしても、要約や全文からでは、個人が論文の専門的な内容を理解することは極めて困難であり、また、内容を理解することができたとしても、ユーザ個々が必要な情報を取捨選択することは困難であるという問題がある。
また、上述の特許文献1では、特に論文の分野は限られていないが、例えば、あるユーザが心配している疾病について、医学・食品学・栄養学・環境学・統合医療学・漢方学・スポーツ科学など人間の健康維持のための情報全般(以下、健康関連情報という)を取得するために論文の検索を行ったとしても、その検索結果は少なくとも数百件以上にものぼり情報量が多すぎることが想定されるため、個人がこれらの全ての検索結果を基に適切に情報の分析を行い、情報の取捨選択を行うことは不可能である。
そこで、本発明は、多岐に渡る膨大な人間の健康維持のための臨床学術研究を収集し、収集された臨床学術研究を分析し、分析結果として、ユーザの種々の健康維持の目的に応じた健康関連情報提供を提供することを目的とする。
かかる目的を達成するため、請求項1記載の健康関連情報提供システムは、利用者端末および論文データベースに通信ネットワークを介して接続されたデータサーバ、分析サーバ及び照合サーバを備えた人間の健康維持のための情報全般である健康関連情報を提供するシステムであって、データサーバは、論文データベースから論文を取得して記憶する論文取込手段及び論文から少なくとも論文タイトル及び研究対象をタグの主要情報として抽出し、かつ論文に含まれる少なくとも有用性についてのサンプリングによる統計情報をタグのサンプル情報として抽出し、タグの主要情報及びタグのサンプル情報をタグ情報として記憶するタグ情報付加手段とを備え、分析サーバは、タグ情報を取得し、タグのサンプル情報に基に統計学的手法により信頼性をランク化し、タグのサンプル情報から効果確率を計算し、ランク化された信頼性及び効果確率をタグ情報に付加したランク分け情報を作成し、かつ研究対象毎のランク分け情報を研究対象一覧として記憶するランク分け手段及びランク分け情報を読み出して、有用性毎のランク分け情報を有用性一覧として記憶するクロスセクショナルリンク手段とを備え、照合サーバは、利用者端末から入力された検索条件に合致する検索結果を研究対象一覧及び有用性一覧のいずれか一方または双方から抽出し、検索結果一覧として利用者端末に出力する照会手段を備えるものである。
したがって、通信ネットワーク上に存在する膨大な数の健康関連情報を含んだ臨床学術研究論文をデジタルデータとして取り込み記憶するデータサーバが存在し、かつそのデータサーバは、取り込んだ各論文についてタグの主要情報及びタグのサンプル情報を抽出してタグ情報として記憶し、更に、分析サーバは、タグのサンプル情報に基づいて当該論文の信頼性および論文に記載された有用性に対する効果確率を計算してタグ情報に付加してランク分け情報とし、当該ランク分け情報を研究対象及び有用性毎に一覧表として作成し記憶することで、ユーザが、健康関連情報を含んだ論文から抽出され、加工、分析された情報を利用者端末から照合サーバを通じて検索可能としている。尚、研究対象とは、研究成果として挙げられている対象(例えば、食品名、生活環境、栄養素名、運動名、サプリメント名、漢方薬名等)をいい、有用性とは、研究対象が効果を有する疾病名(例えば、心筋梗塞)およびそのカテゴリー(例えば、心臓疾患)をいう。
また、請求項2に記載の発明は、請求項1に記載の健康関連情報提供システムにおいて、タグの主要情報は、ロボット検索のアルゴリズムにより、論文からデータサーバに記憶されている辞書データベース内の用語を照合し、抽出するものである。したがって、既存のロボット検索のアルゴリズムにより論文中から、予め辞書データベースに記憶されている疾病名一覧、食品名一覧、その他の検索用語一覧等に存在する用語を抽出し、これをタグの主要情報としている。
また、請求項3に記載の発明は、請求項1または2のいずれかに記載の健康関連情報提供システムにおいて、統計学的手法としてカイ二乗検定を用い、信頼性としてフィットネス値を用いるものである。
また、請求項4に記載の発明は、請求項3に記載の健康関連情報提供システムにおいて、ランク分け手段は研究対象一覧を、クロスセクショナルリンク手段は有用性一覧をフィットネス値によりソートするものである。
また、請求項5に記載の発明は、請求項1から4までのいずれかに記載の健康関連情報提供システムにおいて、照会手段は、検索結果を更に主要情報から抽出するものである。したがって、照合サーバは、検索結果の抽出に際し、分析サーバの検索対象一覧及び有用性一覧に加えて、データサーバへアクセスし、記憶されている主要情報を抽出している。
本発明にかかる健康関連情報提供システムによれば、通信ネットワーク上に存在する膨大な数の健康関連情報に関する臨床学術研究論文から複数の研究分野(医学・食品学・栄養学・環境学・統合医療学・漢方学・スポーツ科学等)の健康関連情報をユーザに対し横断的に提供することが可能となる。例えば、ある疾患について効果のある食品、栄養素等を一覧表示させることが可能となる。
また、ユーザは、健康関連情報の研究対象及び有用性をキーとして、研究対象から及び有用性からの両面から相互に情報の検索が可能となる。更に、ユーザの種々の健康維持の目的に応じた健康関連情報を提供することができる。
更に、請求項2に記載の健康関連情報提供システムによれば、ロボット検索のアルゴリズムを用いることで、論文中からタグの主要情報に該当する箇所を正確に抽出することができる。
更に、請求項3に記載の健康関連情報提供システムによれば、カイ二乗検定のフィットネス値(χ2値)により、サンプル情報の適合度の検定を行うことができる。
更に、請求項4に記載の健康関連情報提供システムによれば、研究対象一覧、有用性一覧は信頼性(フィットネス値)が大きい順に並べられるので、ユーザは信頼性の高い健康関連情報を一目で認識することができる。
更に、請求項5に記載の健康関連情報提供システムによれば、ユーザは検索結果として表示された健康関連情報の情報源となった論文のタグの主要情報を検索、閲覧することができる。
以下、本発明の構成を図面に示す実施の形態に基づいて詳細に説明する。
本実施形態の健康関連情報提供システム1は、利用者端末7および論文データベース6に通信ネットワーク5を介して接続されたデータサーバ2、分析サーバ3及び照合サーバ4を備えた人間の健康維持のための情報全般である健康関連情報を提供するシステムであって、データサーバ2は、論文データベース6から論文を取得して記憶する論文取込手段20及び論文から少なくとも論文タイトル及び研究対象をタグの主要情報として抽出し、かつ論文に含まれる少なくとも有用性についてのサンプリングによる統計情報をタグのサンプル情報として抽出し、タグの主要情報及びタグのサンプル情報をタグ情報として記憶するタグ情報付加手段21とを備え、分析サーバ3は、タグ情報を取得し、タグのサンプル情報に基に統計学的手法により信頼性をランク化し、タグのサンプル情報から効果確率を計算し、ランク化された信頼性及び効果確率をタグ情報に付加したランク分け情報を作成し、かつ研究対象毎のランク分け情報を研究対象一覧として記憶するランク分け手段39及びランク分け情報を読み出して、有用性毎のランク分け情報を有用性一覧として記憶するクロスセクショナルリンク手段40とを備え、照合サーバ4は、利用者端末7から入力された検索条件に合致する検索結果を研究対象一覧及び有用性一覧のいずれか一方または双方から抽出し、検索結果一覧として利用者端末7に出力する照会手段58を備えるものである。
本実施形態の健康関連情報提供システム1によりユーザに提供される健康関連情報とは、臨床学術研究論文から抽出可能な情報をいう。尚、本実施形態では、臨床学術研究論文(以下、単に論文ともいう)は、信頼性を重視して当該分野の専門家の査読により論文の掲載が決定される仕組み(レフリー付き)の各種学会や大学・企業内紀要に研究論文や研究レポートだけを対象としている。尚、これらのレフリー付きの論文には、通常サンプリングによる統計情報が含まれており、本実施形態では、統計情報が含まれた論文を対象としている。しかしながら、対象とする論文は適宜選択可能なものであり、特に限られるものではない。
次に、本実施形態の健康関連情報提供システム1のハードウェア構成を図1を用いて説明する。健康関連情報提供システム1は、臨床学術研究論文が記録されている論文データベース6から論文を取得して記憶し、併せて、論文内のタグの主要情報及びタグのサンプル情報を抽出してタグ情報一覧を作成し記憶するデータサーバ2、データサーバ2に記憶された各論文のサンプル情報を基準として論文の信頼性を判断し、研究対象と有用性による階層的なランク分け行い各論文間を相互にリンクさせる分析サーバ3、利用者端末7からの検索条件に従って分析サーバ3に記憶されたランク分けされた階層的な全ての論文から、目的に適した健康関連情報を検索結果一覧として利用者端末7に返す照合サーバ4の3つのサーバから構成される。
データサーバ2、分析サーバ3及び照合サーバ4には、出力装置、入力装置、中央処理演算装置(CPU)、主記憶装置(RAM)、ハードディスク、通信インタフェース等を備えたパーソナルコンピュータ、ワークステーション、専用機等が用いられる。また、データサーバ2、分析サーバ3及び照合サーバ4は、必ずしも異なるハードウェアで構成される必要はなく、複数のサーバ機能を一つのハードウェアで実現させるようにしても良い。
また、健康関連情報提供システム1は、インターネット等の通信ネットワーク5を通じて、臨床学術論文が記録された論文データベース6(6a,6b,6c...)へのアクセスを可能としている。更に、インターネットまたは専用回線等の通信ネットワーク(図示せず)を介して利用者端末7に接続され、利用者端末7から、健康関連情報提供システム1にアクセスすることを可能としている。尚、利用者端末7には、例えば、インターネットを介して健康関連情報提供システム1にアクセスすることが可能な、即ち、Webブラウザプログラム等がインストールされたパーソナルコンピュータを用いることができる。
以下、本実施形態の健康関連情報提供システム1が実行する処理について、各サーバの処理の詳細を説明することにより解説する。また、図11にデータサーバ2がある論文Xを取り込み、タグ情報一覧を作成し、分析サーバ3がタグ情報を取り込んでランク分け情報を作成し、更新するまでの処理の概略シークエンスを示す。
先ず、データサーバ2について説明する。データサーバ2のハードウェア構成の一例を図2に示す。データサーバ2は、ディスプレイ等の出力装置11と、キーボード、マウス等の入力装置12と、演算処理を行う中央処理演算装置(CPU)13と、計算中のデータ、パラメータ等が記憶される主記憶装置(RAM)14と、計算結果等が記録される補助記憶装置としてのハードディスク15、他のサーバ3,4、通信ネットワーク5等と通信を行うための通信インタフェース16等を備えている。上記のハードウェア資源は例えばバス17を通じて電気的に接続されている。
また、データサーバ2の補助記憶装置15には、論文を取り込む処理を実行する論文取込プログラム18、取り込んだ論文からタグ情報を抽出し保存する処理を行うタグ情報付加プログラム19が記憶されており、当該プログラムがCPU13に読み込まれ実行されることによって、コンピュータが論文取込手段20、タグ情報付加手段21として機能する。その実行の際に必要なデータ、パラメータ等は、RAM14のテンポラリーエリア22にロードされる。
また、補助記憶装置15には、ダウンロードした論文の電子データを記憶する内部論文データベース23、タグ番号をキーとして、論文タイトル、研究者名、発行機関名、発行年度、要約、研究対象、有用性、効果、データ数、性別別・年代別のデータ数等のタグ情報一覧(図3参照)を記憶するタグ一覧データベース24、論文名一覧、疾病名一覧、食品名一覧、栄養素一覧、統合医療一覧、漢方薬一覧、スポーツ一覧、その他の検索用語一覧などが予め記憶された辞書データベース25が構築される。
本実施形態では、タグ一覧データベース24には、タグ番号が順に記憶されており、当該タグ番号に該当するタグ情報を記憶する際に、予め記憶されたタグ番号に関連づけて記憶するようにしている。また、日本語による論文に限らず、英語、仏語等の他の言語によるものも対象とすることが好ましいため、辞書データベース25には、各用語につき対応する英訳、仏訳等を記憶した翻訳データも併せて記憶させておくことが好ましい。または、各国語間の翻訳プログラムを実行可能とすることが好ましい。尚、上記タグ一覧データベース24のフィールド名及び辞書データベース25のデータ例は一例であってこれには限られないのは勿論である。
本実施形態のデータサーバ2の論文取込手段20及びタグ情報付加手段21が実行する処理の一例を図4のフローチャートに示す。尚、S201は論文取込手段20、S202〜S206はタグ情報付加手段21により実行されるものである。
先ず、論文Xの内容の取り込みを行う(S201)。
論文取込手段20は、論文Xの電子データを通信ネットワーク5を介して論文データベース6からダウンロードし、内部論文データベース23に記憶させるものである。本実施形態での論文データベース6には、臨床学術論文がデジタルデータ化されデータベース化されており、それらの論文には、例えば、キーワード検索によりアクセスし、ダウンロードすることが可能である。本実施形態では、例えば、初期設定時に対象となる全ての論文をダウンロードしておき、以降は、論文取込手段20は、論文データベース6に一定時間おきにアクセスして、新たに更新された論文を自動ダウンロードし、内部論文データベース23に記憶するものである。
論文データベース6としては、例えば、米国国立医学図書館(NLM)の国立バイオテクノロジー情報センター(NCBI)が運営するPubmedや国内外の大学等において公開されているデータベースを用いることができるが、その運営主体およびその利用数は、特に限られるものではなく、多くの運営主体の論文データベース6から論文を取得しておくことにより、多くの論文を対象とした健康関連情報提供システム1を構築することが可能となる。
尚、専門誌等に掲載された論文であって電子データが存在しない場合は、予め、発刊された論文をスキャナーなどで読み取りデジタル化し、更に、公知または新規の自動文字認識技術を用いて文字認識を行った上で、内部論文データベース23に記憶するようにすれば良い。
データサーバ2に読み込まれた論文は、タグ番号が付加されてテンポラリーエリア22に記憶される。本実施形態では、タグ番号は、データサーバ2に取り込まれた順にタグ番号を連番で付加するようにしているが、付与方法は、特に限られるものではない。
次情報?(S202)とは、取り込むべき論文が他に存在しているかどうかを判断するステップである。他に論文があれば(S202:Yes)S203へ移り、他に論文がなければ(S202:No)、処理は終了する。1回目のループ処理においては、当該判断はされず、そのままS203へ移るものとしている。尚、ループ処理を行った回数は、例えば別途カウンタを設けてカウントすればよい。
次に、取り込まれた論文の中からタグの主要情報の読み取り処理(S203)を行う。タグの主要情報とは、論文タイトル、研究者、発行機関名、発行年度、論文内容の要約、研究成果として挙げられている研究対象等をいう。タグの主要情報の一例を表1に示す。
ここで論文のタイトルページには、冒頭に論文タイトルと研究者名が、その後に要約をキーワードとして要約内容が、ヘッダーの右側または左側に発行機関名、発行年数及びVolナンバーが記載されている。タグの主要情報は、このような上記タイトルページの位置の指定を基に検索され抽出される。
本実施形態では、更に、公知または新規のロボット検索のアルゴリズムを用いて、論文全体からタグの主要情報及び有用性等を検索するようにしている。
ロボット検索のアルゴリズムは、予め記憶された辞書データベース25に存在する情報と照合し、該当する用語が論文内に存在する場合は、タグの主要情報の該当するフィールド名に入力する。このようにして検索された情報は、タグの主要情報としてテンポラリーエリア22に記憶される。更に、本実施形態では、有用性の項目が見つかったパラグラフについては、パラグラフ全体を抽出してテンポラリーエリア22に一時記憶させる。尚、当該パラグラフを別途データベースを構成して記憶し、利用者端末7からパラグラフの閲覧を可能とするようにしても良い。また、パラグラフの抽出の際、前後のパラグラフも併せて抽出するようにすることも好ましい。
次に、タグのサンプル情報の読み取り処理(S204)を行う。
本実施形態では、テンポラリーエリア22に一時記憶された有用性の項目を含むパラグラフに対して、公知又は新規の言語解析のアルゴリズムを用いて有用性及びそれに付属する情報(タグのサンプル情報)を読み取り記憶するものである。
タグのサンプル情報とは、例えば、論文に含まれているサンプリングによる統計情報(総サンプル数や総サンプルの中から有効を示した人数や割合)、サンプル属性(研究対象となった性別、年代別、人種別、対象症状別、地域別、統計年数等)及びサンプル属性ごとのサンプル数と効果の度合いを指す。尚、効果には、実際のサンプル数又は割合(効果のあったサンプル数/総サンプル数)のいずれかの値が入力される。更に、有用性の項目への効果の度合いを表す言葉を抽出し、それらの言葉と有効割合との対応関係を予め作成しておいて効果の度合い(%)を算出するようにしても良い。
タグのサンプル情報の一例を表2に示す。例えば、表2に示すタグのサンプル情報では、論文Xについての研究対象(表1のコーヒー)の有用性は、糖尿病だけが検索されたので、有用性(1)には糖尿病が記載されている。複数の有用性に該当する項目が検索された場合は、有用性(2)欄に入力される。尚、有用性の欄は2つに限られず、複数設ければよい。また、表2に示すサンプル情報の項目は、一例であり上述のようにこれには限られない。
また表2は、コーヒーの糖尿病への効果を示す文章を言語解析アルゴリズムにより解析した結果の例である。例えば、コーヒーが糖尿病に効果が見られたのは、総サンプル数2,100人(データ数フィールド)中の550人(効果(1)フィールド)であることを示している。尚、有用性が複数存在しないので、対応する効果(2)は、空欄である。
また、同様に総サンプル数2,100人のサンプル属性として、性別(男・女)や年代別(10代から70代)のデータ数とコーヒーの有効性が見られた人数が検索され、表2のそれぞれの欄に記載されている。
このようにテンポラリーエリア22に一時記憶されたタグの主要情報およびタグのサンプル情報を、タグ一覧データベース24から読み出したタグ番号に関連づけてタグ情報としてタグ情報一覧のレコードを作成し(図3参照、S205)、タグ番号を付加した論文Xを内部論文データベース23に、タグ番号をキーとしたタグ情報一覧をタグ一覧データベース24に記憶し(S206)、S202の終了判断に移る。以上の処理をデータサーバ2は、取り込むすべての論文について実行する。
次に、分析サーバ3について説明する。分析サーバ3のハードウェア構成の一例を図5に示す。分析サーバ3は、ディスプレイ等の出力装置30と、キーボード、マウス等の入力装置31と、演算処理を行う中央処理演算装置(CPU)32と、計算中のデータ、パラメータ等が記憶される主記憶装置(RAM)33と、計算結果等が記録される補助記憶装置としてのハードディスク34、他のサーバ2,4、通信ネットワーク5等と通信を行うための通信インタフェース35等を備えている。上記のハードウェア資源は例えばバス36を通じて電気的に接続されている。
また、分析サーバ3の補助記憶装置34には、データサーバ2から論文のタグ情報を取り込んで、タグ情報を基に論文間をランク分けしリンクを張る処理を実行するランク分けプログラム37、リンク間の関連付け情報を記録する処理を行うクロスセクショナルリンクプログラム38が記憶されており、当該プログラムがCPU32に読み込まれ実行されることによって、コンピュータがランク分け手段39、クロスセクショナルリンク手段40として機能する。その実行の際に必要なデータ、パラメータ等は、RAM33のランク分けエリア41またはクロスセクショナルリンクエリア42にロードされる。
また、補助記憶装置34には、論文Xのタグ情報にフィットネス値及び効果確率を付加した情報(以下、ランク分け情報という)を研究対象毎にフィットネス値順にソートし、一覧としたもの(以下、研究対象一覧)を記憶するランク分けデータベース43、ランク分け情報を有用性毎にフィットネス値順にソートし、一覧としたもの(有用性一覧)を記憶するクロスセクショナルリンクデータベース44が記憶されている。
本実施形態では、ランク分けエリア41の中には、図6に示すように、研究対象のカテゴリー分野別に分割されたスロット8aが読み出される。各分野のスロットは細分化されたスロット8bを含み、更に、その中には、研究対象一覧のスロット(図示せず)が用意される。尚、スロットは、予め補助記憶装置34に記憶させておくものである。本実施形態では、例えば、疾病分野、食品分野、栄養素分野等のスロット8aのうち、例えば、大分野を食品分野とした場合であれば、野菜分野、肉分野、嗜好品分野等の中分類、更に嗜好品分野であれば、コーヒー、紅茶、酒等の小分類に分類している。
以下に、本実施形態の分析サーバ3のランク分け手段39が実行する処理の一例を図7のフローチャートに示す。
先ず、論文Xのタグ情報の取込を行う(S301)。本処理は、データサーバ2のタグ一覧データベース24に記憶されたタグ情報一覧をランク分けエリア41に読み出すものである。
次情報?(S302)とは、タグ情報を取り込むべき論文が他に存在しているかどうかを判断するステップである。他に論文があれば(S302:Yes)S303へ移り、他に論文がなければ(S302:No)、処理は終了する。
次に、分析サーバ3に読み込まれた論文のタグ情報のサンプル総数とサンプル属性ごとの分布数に基づいて、フィットネス値を計算する(S303)。
フィットネス値の計算は、例えば、サンプル総数とサンプル属性ごとの分布数に対する一様分布におけるχ2テスト(カイ二乗検定)を行う。尚、フィットネス値とは、小数点第2位までのχ2値である。尚、カイ二乗検定とは、帰無仮説が正しければ検定統計量がカイ二乗分布に従うような統計学的検定法であり、適合度検定および独立性検定に用いられる。本実施形態では、信頼性のランク化に際し、フィットネス値を用いているが特に限られるものではなく、カイ二乗検定とは別の統計学的検定法により信頼性のランク化を行うようにしても良い。
更に、研究対象の効果確率を計算する(S304)。効果確率は、論文Xのタグ情報の中の有用性の効果の数値を用いて計算される。例えば、効果確率には、その効果の数値が、既に割合(効果のあったサンプル数/総サンプル数)で表示(小数点表示)されているものはそのままの数値を、効果が認められた度合の数字(効果のあったサンプル数)の場合は総サンプル数で割った数値を用いることができる。
例えば、上記表2に示した研究対象コーヒーの場合、効果(1)欄の糖尿病の効果サンプル(=550)は実数であるので、この数値を総サンプル数(=2100)で割った数値がコーヒーの糖尿病への効果確率となる。
同様に、サンプル属性の効果確率は、それぞれの属性のカテゴリー別の分布の数値をそれぞれの属性のサンプル数で割り求める(S305)。以下、論文Xのタグ情報に、フィットネス値及び効果確率を付加した情報をランク分け情報という。
このようにして作成されるランク分け情報の一例を表3に示す。
次に、ランク分けデータベース43にすでに記憶されている論文Xの研究対象と一致する研究対象一覧を読み出して(S306)、更に、論文Xのランク分け情報を研究対象一覧に追加したうえで、フィットネス値が大きい順にソートを行う(S307)。これらの処理は、ランク分けエリア41において実行される。本実施形態では、研究対象一覧は、フィットネス値について昇順に並べられ記憶されているが、特に限られるものではない。
このようにして作成される研究対象一覧の一例を表4に示す。本実施形態では、研究対象一覧は、情報として表4のデータ項目を有しているが、ランク分け情報と同じデータ内容をすべて有するようにしても良い。
ここで本実施形態では、同等数のフィットネス値(例えば、±0.1以内)を示すランク分け情報が存在する場合(S308:Yes)には、サンプル総数が多い方の信頼性を高く評価し、高いランクとするようにしている(S309)が、値を同等であると見なす範囲等は、処理の一例であって特に限られるものではない。
論文Xのランク分け情報の追加によりアップデートされた研究対象一覧は、RAM33のランク分けエリア41から補助記憶装置34のランク分けデータベース43に記憶し(S310)、S302へ戻るものである。以上でランク分け手段39による処理は終了する。
次に、クロスセクショナルリンク手段40について説明する。上述のランク分けエリア41においてアップデートされた研究対象一覧に基づき、次のクロスセクショナルリンクエリア42において情報がアップデートされる。
本実施形態では、クロスセクショナルリンクエリア42の中には、図8に示すように、有用性のカテゴリー分野別に分割されたスロット8aが読み出される。各分野のスロットは細分化されたスロット8bを含み、更に、その中には、有用性一覧のスロット(図示せず)が用意される。例えば、大分野を内蔵、中分野を腎臓、小分野を糖尿病とすることができる。
以下に、本実施形態の分析サーバ3のクロスセクショナルリンク手段40が実行する処理の一例を図9のフローチャートに示す。
先ず、ランク分けデータベース43から論文Xについてのランク分け情報をクロスセクショナルリンクエリア42に読み出す(S401)。
次情報?(S402)とは、ランク分け情報を取り込むべき論文が他に存在しているかどうかを判断するステップである。他に論文があれば(S402:Yes)S403へ移り、他に論文がなければ(S402:No)、処理は終了する。
次に、クロスセクショナルリンクデータベース44にすでに記憶されている論文Xの有用性項目と一致する有用性一覧を読み出して(S403)、更に、論文Xのランク分け情報を有用性一覧に追加したうえで、フィットネス値が大きい順にソートを行う(S404)。
このようにして作成される有用性一覧の一例を表5に示す。本実施形態では、有用性一覧は、情報として表5のデータ項目を有しているが、ランク分け情報と同じデータ内容をすべて有するようにしても良い。
ここで本実施形態では、同等数のフィットネス値(例えば、±0.1以内)を示すランク分け情報が存在する場合(S405:Yes)には、サンプル総数が多い方の信頼性を高く評価し、高いランクとするようにしている(S406)。
論文Xのランク分け情報の追加によりアップデートされた有用性一覧は、RAM33のクロスセクショナルリンクエリア42から補助記憶装置34のクロスセクショナルリンクデータベース44に記憶し(S407)、S402へ戻るものである。以上でクロスセクショナルリンク手段40による処理は終了する。
以上の処理を分析サーバ3は、データサーバ2に取り込まれたすべての論文について実行するものである(S302,S402)。
次に、照合サーバ4について説明する。照合サーバ4のハードウェア構成の一例を図10に示す。照合サーバ4は、ディスプレイ等の出力装置50と、キーボード、マウス等の入力装置51と、演算処理を行う中央処理演算装置(CPU)52と、計算中のデータ、パラメータ等が記憶される主記憶装置(RAM)53と、計算結果等が記録される補助記憶装置としてのハードディスク54、他のサーバ2,3、通信ネットワーク5等と通信を行うための通信インタフェース55等を備えている。上記のハードウェア資源は例えばバス56を通じて電気的に接続されている。
また、照合サーバ4の補助記憶装置54には、利用者端末7から入力されたキーワードを分析サーバ3に照会する処理を実行する照会プログラム57が記憶されており、当該プログラムがCPU52に読み込まれ実行されることによって、コンピュータが照会手段58として機能する。その実行の際に必要なデータ、パラメータ等は、RAM53にロードされる。
照合サーバ4は、ユーザにより利用者端末7から入力されたキーワードを分析サーバ3に照会し、該当する情報が存在するかどうかを検索するものである。
照会手段58は、利用者端末7から入力されたキーワード等の検索内容に該当する情報をランク分けデータベース43やクロスセクショナルリンクデータベース44から検索し、情報を抽出して利用者端末7の出力装置に、例えば検索結果一覧として表示させるものである。ユーザは、当該検索結果一覧を利用者端末7に接続されたプリンター等の印刷装置により印刷することができる。
また、ランク分けデータベース43やクロスセクショナルリンクデータベース44で検索されたタグ番号をキーとして、更に、データサーバ2に対して論文の主要情報や論文の全文を照会し、抽出することが可能である。
また、利用者端末7の出力装置には、例えば、検索条件としてキーワードを指定するフィールド、検索対象として、研究対象一覧とするのか有用性一覧とするのかを選択するラジオボタン、医学・食品学・栄養学・環境学・統合医療学・漢方学・スポーツ科学などのどの分野について検索するのかを選択するラジオボタン等が、GUI表示され、ユーザはキーワード検索等の種々の検索方法により自己の必要な健康関連情報を検索することができるものである。
図12に示す本実施形態の健康関連情報提供システム1による検索処理の概略シークエンスを用いて、検索処理の概要を説明する。
先ず、ユーザは、利用者端末7からキーワード検索や種々の検索条件を指定して検索を実行する(S101)。これを受信した照合サーバ4は、照会プログラム57を実行(S102)して、ランク分けデータベース43及びクロスセクショナルリンクデータベース44から、検索条件に応じた検索結果一覧を作成する(S103)。
これを利用者端末7の出力装置に表示させる。また、ユーザが検索結果として表示された情報の情報源である論文の全文等の照会を希望する場合は、例えば、論文の全文検索を実行し(S104)、照合サーバ4は、データサーバ2の内部論文データベース23から論文の全文を抽出し、出力装置に結果を表示させるものである(S105)。
以下に、本発明の健康関連情報提供システム1による検索処理について検索方法および検索結果一覧を具体的な例を挙げる。
ユーザが利用者端末7から、研究対象としてコーヒーをキーワード検索し、検索対象として研究対象一覧が選択されている場合は、例えば、上記表4に示したような研究対象一覧が検索結果として利用者端末7の出力装置に表示される。
これによりユーザは表示される検索結果(表4)からは、コーヒーの有用性としては、糖尿病、心筋症、肺気腫、脳梗塞に関する論文があることがわかり、また、糖尿病には63%の効果確率があること、脳梗塞には32%の効果確率があることがわかる。また、同時に、心筋症には−46%、肺気腫には−20%と健康へのマイナス効果が報告されている論文があることがわかり、複数の論文からの内容を横断的に一目で認識することができるものである。
また、例えば、上記表4のタグ番号に論文の主要情報及び論文の全文へのハイパーリンクが貼られており、ユーザはタグ番号欄をクリックすることで論文の主要情報、論文の全文の確認することが可能となる。
また、ユーザは、研究対象のある分野(例えば、食品分野)と有用性のある分野(例えば、疾病分野)を検索条件として指定することが可能である。本実施形態では、利用者端末7の検索画面から、該当分野(医学・食品学・栄養学・環境学・統合医療学・漢方学・スポーツ科学)のうちどの分野を表示させるか等が選択可能としている。
この場合、表6に示すように、食品と疾病のリンク上の研究対象に関して有用性が認められた特定疾病の一覧と、その効果確率が一覧表として出力される。本実施形態では、表6のコーヒーの行の脳障害、心臓障害、腎臓障害などへの効果確率である32%、−46%、63%などの数値は、各有用性について最もフィットネス値の大きいレコードの効果確率を参照している。表示される一覧表からユーザは、例えば、どの食品がどの疾病に効果的で、どの疾病に悪い影響を及ぼすかを一目で確認することが可能となる。また、表7には、生活環境と疾病のリンク上の研究対象に関して有用性が認められた特定疾病の一覧と、その効果確率が一覧表を示す。
このように、本発明の健康関連情報提供システム1では、研究対象と有用性の間にクロスしたリンクの存在、即ち、ランク分けデータベース43に記憶された研究対象一覧及びクロスセクショナルリンクデータベース44に記憶された有用性一覧とのリンクにより、研究対象からと有用性からの両面から相互に情報の検索が可能となる。
また、本発明の健康関連情報提供システム1は、ユーザにより検索対象として複数の研究対象(例えば、たばこ、酒、朝食)及び複数の有用性(例えば、脳障害、心臓障害、腎臓障害)が同時に選択された場合に、選択した項目を行、列とする一覧表を出力することも可能である。
また、例えば、あるユーザがDNA分析を行い、その分析の結果、潜在疾患として消化器系疾患の中の糖尿病及び肝臓がん、循環器系疾患の心筋梗塞、血管血栓及び脳血栓、そしてアレルギー系疾患の花粉症に注意すべきであるとの診断がなされているとする場合において、ユーザは、健康関連情報提供システム1を利用して利用者端末7から、それらの疾患に対する有効な処方を照会することができる。この際に、種々の検索を行うことを可能としている。
例えば、表8は、潜在疾患をキーとして、各分野の中から最も高い効果確率が報告されている研究対象項目や有用性項目とそれらの効果確率の検索結果一覧の一例である。
例えば、糖尿病に関して調べると、上記表6の腎臓疾患の列から、最も高い効果確率を示した食品はコーヒーであり、その効果確率は63%であることがわかる。また、上記表7の腎臓疾患の列から、最も高い効果確率を示した生活環境は朝食(朝食をとること)であり、その効果確率は25%であることがわかる。
更に、他の分野と疾病とのリンクを照会し、それぞれの分野で最も高い効果確率を照会し、上記表8に示す糖尿病の列の一覧が作成される。
また、表9は、ユーザが日頃悩んでいる疾患全てに対して、それぞれの分野の中から、当該疾患の症状改善に適した療法と適さない療法のベスト3を検索した場合の検索結果一覧の一例である。
更に、ユーザが表示された検索結果一覧のうちある情報の情報源となる論文を参照したい場合は、当該項目を選択することにより、例えば、表10に示すような論文詳細情報一覧が表示される。本実施形態では、論文の詳細情報に併せて、内部論文データベース23の該当論文へのリンクも表示されるので、ユーザは、各論文の全文を確認することも可能である。
以上述べたように本実施形態の健康関連情報提供システム1は、研究対象と有用性の間にリンクを有し、研究対象と有用性の双方の観点から検索することが可能である。
尚、本発明の健康関連情報提供システム1は、以上述べた検索方法に限られず、データサーバ2及び分析サーバ3が備える情報を、各データベースが有するリンクを活用し、種々の検索方法により検索することが可能である。
上述の実施形態は本発明の好適な実施の例ではあるがこれに限定されるものではなく、本発明の要旨を逸脱しない範囲において種々変形実施可能である。
例えば、検索結果の一覧表の作成における効果確率の参照は、各有用性毎に最もフィットネス値の高いレコードの効果確率を抽出するようにしているが、これには限らず、例えば、各有用性毎にフィットネス値の高い予め設定された数のレコード(例えば、上位5つ)のまたは、すべてのレコードの効果確率を平均化して効果確率を算出するようにしても良い。このようにすることで、各有用性について複数の論文内容を反映した効果確率を算出することが可能となる。
1 健康関連情報提供システム
2 データサーバ
3 分析サーバ
4 照合サーバ
5 通信ネットワーク
6 論文データベース
7 利用者端末
2 データサーバ
3 分析サーバ
4 照合サーバ
5 通信ネットワーク
6 論文データベース
7 利用者端末
Claims (5)
- 利用者端末および論文データベースに通信ネットワークを介して接続されたデータサーバ、分析サーバ及び照合サーバを備えた人間の健康維持のための情報全般である健康関連情報を提供するシステムであって、前記データサーバは、前記論文データベースから論文を取得して記憶する論文取込手段及び前記論文から少なくとも論文タイトル及び研究対象をタグの主要情報として抽出し、かつ前記論文に含まれる少なくとも有用性についてのサンプリングによる統計情報をタグのサンプル情報として抽出し、前記タグの主要情報及び前記タグのサンプル情報をタグ情報として記憶するタグ情報付加手段とを備え、前記分析サーバは、前記タグ情報を取得し、前記タグのサンプル情報に基に統計学的手法により信頼性をランク化し、前記タグのサンプル情報から効果確率を計算し、ランク化された前記信頼性及び前記効果確率を前記タグ情報に付加したランク分け情報を作成し、かつ前記研究対象毎の前記ランク分け情報を研究対象一覧として記憶するランク分け手段及び前記ランク分け情報を読み出して、前記有用性毎の前記ランク分け情報を有用性一覧として記憶するクロスセクショナルリンク手段とを備え、前記照合サーバは、前記利用者端末から入力された検索条件に合致する検索結果を前記研究対象一覧及び前記有用性一覧のいずれか一方または双方から抽出し、検索結果一覧として前記利用者端末に出力する照会手段を備えることを特徴とする健康関連情報提供システム。
- 前記タグの主要情報は、ロボット検索のアルゴリズムにより、前記論文から前記データサーバに記憶されている辞書データベース内の用語を照合し、抽出することを特徴とする請求項1に記載の健康関連情報提供システム。
- 前記統計学的手法としてカイ二乗検定を用い、前記信頼性としてフィットネス値を用いることを特徴とする請求項1または2のいずれかに記載の健康関連情報提供システム。
- 前記ランク分け手段は前記研究対象一覧を、前記クロスセクショナルリンク手段は前記有用性一覧を前記フィットネス値によりソートすることを特徴とする請求項3に記載の健康関連情報提供システム。
- 前記照会手段は、前記検索結果を更に前記主要情報から抽出することを特徴とする請求項1から4までのいずれかに記載の健康関連情報提供システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007012412A JP2008181188A (ja) | 2007-01-23 | 2007-01-23 | 健康関連情報提供システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007012412A JP2008181188A (ja) | 2007-01-23 | 2007-01-23 | 健康関連情報提供システム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2008181188A true JP2008181188A (ja) | 2008-08-07 |
Family
ID=39725068
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007012412A Pending JP2008181188A (ja) | 2007-01-23 | 2007-01-23 | 健康関連情報提供システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2008181188A (ja) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014021723A (ja) * | 2012-07-18 | 2014-02-03 | Hitachi Solutions Ltd | 食事メニュー提供方法及びプログラム |
JP2014228907A (ja) * | 2013-05-20 | 2014-12-08 | 株式会社日立製作所 | 情報構造化システム |
JP2016033795A (ja) * | 2014-07-31 | 2016-03-10 | 株式会社DeNAライフサイエンス | 情報処理装置、プログラム、および、記録媒体 |
JP2016162222A (ja) * | 2015-03-02 | 2016-09-05 | 東芝テック株式会社 | 栄養データ閲覧システム、閲覧サーバおよびその制御プログラム |
CN106777338A (zh) * | 2017-01-13 | 2017-05-31 | 深圳市深黑科技有限公司 | 一种网络公众号动态传播力综合指数统计方法及其系统 |
JP2020030804A (ja) * | 2018-08-20 | 2020-02-27 | OmoiFoods株式会社 | 健康管理システム、健康管理方法、および健康管理プログラム。 |
JP2020144751A (ja) * | 2019-03-08 | 2020-09-10 | 株式会社日立製作所 | 計算機システム及びデータのアクセス制御方法 |
KR20230083759A (ko) * | 2021-12-03 | 2023-06-12 | 서울대학교병원 | 약물-식품 상호작용 정보 추출 장치 및 방법 |
WO2023145983A1 (ko) * | 2022-01-25 | 2023-08-03 | 차라투 주식회사 | 맞춤형 통계 분석 서비스를 제공하는 시스템 및 시스템의 동작 방법 |
-
2007
- 2007-01-23 JP JP2007012412A patent/JP2008181188A/ja active Pending
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014021723A (ja) * | 2012-07-18 | 2014-02-03 | Hitachi Solutions Ltd | 食事メニュー提供方法及びプログラム |
JP2014228907A (ja) * | 2013-05-20 | 2014-12-08 | 株式会社日立製作所 | 情報構造化システム |
JP2016033795A (ja) * | 2014-07-31 | 2016-03-10 | 株式会社DeNAライフサイエンス | 情報処理装置、プログラム、および、記録媒体 |
JP2016162222A (ja) * | 2015-03-02 | 2016-09-05 | 東芝テック株式会社 | 栄養データ閲覧システム、閲覧サーバおよびその制御プログラム |
CN106777338A (zh) * | 2017-01-13 | 2017-05-31 | 深圳市深黑科技有限公司 | 一种网络公众号动态传播力综合指数统计方法及其系统 |
JP2022123042A (ja) * | 2018-08-20 | 2022-08-23 | ベジタブルテック株式会社 | 健康管理システム、健康管理方法、および健康管理プログラム。 |
JP7094560B2 (ja) | 2018-08-20 | 2022-07-04 | ベジタブルテック株式会社 | 健康管理システム、健康管理方法、および健康管理プログラム。 |
JP2020030804A (ja) * | 2018-08-20 | 2020-02-27 | OmoiFoods株式会社 | 健康管理システム、健康管理方法、および健康管理プログラム。 |
JP7185365B2 (ja) | 2018-08-20 | 2022-12-07 | ベジタブルテック株式会社 | 健康管理システム、健康管理方法、および健康管理プログラム。 |
JP2020144751A (ja) * | 2019-03-08 | 2020-09-10 | 株式会社日立製作所 | 計算機システム及びデータのアクセス制御方法 |
WO2020183758A1 (ja) * | 2019-03-08 | 2020-09-17 | 株式会社日立製作所 | 計算機システム及びデータのアクセス制御方法 |
JP7245079B2 (ja) | 2019-03-08 | 2023-03-23 | 株式会社日立製作所 | 計算機システム及びデータのアクセス制御方法 |
KR20230083759A (ko) * | 2021-12-03 | 2023-06-12 | 서울대학교병원 | 약물-식품 상호작용 정보 추출 장치 및 방법 |
KR102630941B1 (ko) * | 2021-12-03 | 2024-01-30 | 서울대학교병원 | 약물-식품 상호작용 정보 추출 장치 및 방법 |
WO2023145983A1 (ko) * | 2022-01-25 | 2023-08-03 | 차라투 주식회사 | 맞춤형 통계 분석 서비스를 제공하는 시스템 및 시스템의 동작 방법 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
López-Illescas et al. | Coverage and citation impact of oncological journals in the Web of Science and Scopus | |
US8046368B2 (en) | Document retrieval system and document retrieval method | |
Zhao et al. | Analysis and visualization of citation networks | |
JP2008181188A (ja) | 健康関連情報提供システム | |
JP6101563B2 (ja) | 情報構造化システム | |
Natarajan et al. | An analysis of clinical queries in an electronic health record search utility | |
US20070282940A1 (en) | Thread-ranking apparatus and method | |
US20060179051A1 (en) | Methods and apparatus for steering the analyses of collections of documents | |
US20110167068A1 (en) | Categorized document bases | |
CN111465990A (zh) | 用于医疗保健临床试验的方法和系统 | |
US20050203889A1 (en) | System and computer software program for visibly processing an observed information's relationship with knowledge accumulations | |
de Herrera et al. | Comparing fusion techniques for the ImageCLEF 2013 medical case retrieval task | |
US6757676B1 (en) | Text mining method and apparatus allowing a user to analyze contents of a document set from plural analysis axes | |
JP2005122231A (ja) | 画面表示システム及び画面表示方法 | |
JP2002269114A (ja) | 知識データベース及び知識データベースの構築方法 | |
Hearst et al. | Exploring the efficacy of caption search for bioscience journal search interfaces | |
JP2006155556A (ja) | テキストマイニング方法及びテキストマイニングサーバ | |
Porter et al. | The long COVID research literature | |
CN113946647A (zh) | 基于医学实体向量的DDIs搜索引擎及其构建方法 | |
Denecke | Chapter 6 Diversity-Aware Search: New Possibilities and Challenges for Web Search | |
JP4169618B2 (ja) | テキスト情報管理装置 | |
Eikvil et al. | Multi-focus cluster labeling | |
Rosell et al. | Revealing Relations between Open and Closed Answers in Questionnaires through Text Clustering Evaluation. | |
Sondhi et al. | Question processing and clustering in INDOC: a biomedical question answering system | |
Kite et al. | Aboriginal and Torres Strait Islander peoples' perceptions of quality of life and wellbeing and how they are measured: a systematic review protocol |