JP7234622B2 - Document retrieval program, document retrieval method and document retrieval system - Google Patents
Document retrieval program, document retrieval method and document retrieval system Download PDFInfo
- Publication number
- JP7234622B2 JP7234622B2 JP2018240065A JP2018240065A JP7234622B2 JP 7234622 B2 JP7234622 B2 JP 7234622B2 JP 2018240065 A JP2018240065 A JP 2018240065A JP 2018240065 A JP2018240065 A JP 2018240065A JP 7234622 B2 JP7234622 B2 JP 7234622B2
- Authority
- JP
- Japan
- Prior art keywords
- negative
- document
- positive
- index value
- search
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Description
本発明は、文書検索プログラム、文書検索方法および文書検索システムに関する。 The present invention relates to a document search program, document search method and document search system.
従来、患者の診療を行うにあたり、医師が、過去のカルテの記載を参考にして、今後の治療方針を検討することがある。例えば、医師は、通院歴の長い患者について、その患者の過去のカルテの記載を参考にして、選択すべき治療法や薬剤などを判断することがある。カルテの検索には、例えば、キーワード検索が用いられる。 2. Description of the Related Art Conventionally, when treating a patient, a doctor sometimes considers a future treatment policy by referring to past medical records. For example, for a patient who has a long history of hospital visits, a doctor may refer to the patient's past medical record to determine the treatment method or drug to be selected. A keyword search, for example, is used to search for medical charts.
先行技術としては、例えば、ポジティブワードの一覧とネガティブワードの一覧とを記憶する記憶部に記憶されたポジティブワードおよびネガティブワードに基づいて、連絡情報に対するネガティブ・ポジティブ判定を実行するものがある。また、分類わけされた要素がポジティブなものかネガティブなものかを解析して、要素をポジティブ辞書、ネガティブ辞書に蓄積し、ポジティブ辞書の要素とネガティブ辞書の要素とを比較して、同一の場合、該同一の要素をポジティブ辞書およびネガティブ辞書から削除する技術がある。 As a prior art, for example, there is a technique that performs negative/positive judgment on contact information based on positive words and negative words stored in a storage unit that stores a list of positive words and a list of negative words. In addition, it analyzes whether the classified elements are positive or negative, accumulates the elements in positive and negative dictionaries, compares the elements in the positive dictionary and the elements in the negative dictionary, and determines if they are the same. , there are techniques to remove the same elements from the positive and negative dictionaries.
しかしながら、従来技術では、文書検索を行うにあたり、単語が持つポジティブまたはネガティブの意味合いを判断することができない場合がある。単語が持つポジティブまたはネガティブの意味合いを判断できなければ、ポジティブまたはネガティブの条件を加味した文書検索を行うことは難しい。 However, with the conventional technology, there are cases in which it is not possible to determine the positive or negative connotations of words when searching for documents. If it is not possible to determine the positive or negative connotations of words, it is difficult to perform a document search that takes positive or negative conditions into consideration.
一つの側面では、本発明は、単語が持つポジティブまたはネガティブの意味合いの傾向を特定可能にし、ひいては、ポジティブまたはネガティブの条件を加味した文書検索を実現することを目的とする。 In one aspect, the present invention aims to make it possible to identify the tendency of positive or negative connotations of words, and to realize a document search taking positive or negative conditions into consideration.
1つの実施態様では、ポジティブまたはネガティブに分類可能な文書を登録した第1の記憶部を参照して、処理対象となる単語について、前記ポジティブまたはネガティブに分類可能な文書それぞれにおける前記単語の出現頻度に基づき、前記単語が持つポジティブまたはネガティブな意味合いの傾向を示す指標値を算出し、算出した前記指標値を前記単語と対応付けて第2の記憶部に登録する、文書検索プログラムが提供される。 In one embodiment, with reference to a first storage unit in which documents that can be classified as positive or negative are registered, for a word to be processed, the frequency of appearance of the word in each of the documents that can be classified as positive or negative. A document search program is provided for calculating an index value indicating the tendency of the positive or negative connotation of the word based on the above, and registering the calculated index value in a second storage unit in association with the word. .
本発明の一側面によれば、単語が持つポジティブまたはネガティブの意味合いの傾向を特定可能にし、ひいては、ポジティブまたはネガティブの条件を加味した文書検索を実現することができる。 According to one aspect of the present invention, it is possible to identify the tendency of positive or negative connotations of words, and to realize document retrieval that takes positive or negative conditions into consideration.
以下に図面を参照して、本発明にかかる文書検索プログラム、文書検索方法および文書検索システムの実施の形態を詳細に説明する。 Exemplary embodiments of a document search program, a document search method, and a document search system according to the present invention will be described below in detail with reference to the drawings.
(実施の形態)
図1は、実施の形態にかかる文書検索方法の一実施例を示す説明図である。図1において、情報処理装置101は、文書の検索を支援するコンピュータである。文書は、キーワード検索が可能な電子情報である。キーワード検索は、キーワードに対応する文書を検索する機能であり、キーワードとして入力された文字や文字列を含む文書を検索する。
(Embodiment)
FIG. 1 is an explanatory diagram showing an example of a document retrieval method according to an embodiment. In FIG. 1, an
検索対象の文書は、例えば、医療機関において作成されるカルテ(診療記録)の記事や、研究開発において作成される報告書などである。カルテには、患者の主訴、医師の所見(評価)、診断結果、治療計画(治療方針)などが記載される。研究開発における報告書には、研究者の所見や研究結果などが記載される。 Documents to be searched include, for example, articles on medical charts (medical records) created in medical institutions, reports created in research and development, and the like. The patient's chief complaint, doctor's findings (evaluation), diagnosis results, treatment plan (treatment policy), and the like are described in the chart. A research and development report includes the researcher's observations and research results.
これらの文書には、ポジティブな内容の文書もあれば、ネガティブな内容の文書もある。ポジティブとは、例えば、肯定的、積極的、前向き、好転などの意味である。ネガティブとは、否定的、消極的、後ろ向き、悪化などの意味である。例えば、カルテの記事には、症状が改善されたときの記事(ポジティブ)もあれば、症状が悪化したときの記事(ネガティブ)もある。 Some of these documents have positive content, and some have negative content. Positive means, for example, affirmative, positive, forward-looking, improvement, and the like. Negative means negative, negative, negative, aggravating, and so on. For example, medical record articles include articles (positive) when symptoms have improved and articles (negative) when symptoms have worsened.
ここで、文書を検索するにあたり、ネガティブまたはポジティブの条件を加味した文書検索を行いたい場合がある。例えば、「発熱」の症状がある患者の診療を行う際に、医師が、患者にとって不向きな治療法や薬剤を判断するために、その患者の症状が悪化したときの過去のカルテの記事が欲しい場合がある。 Here, in searching for documents, there are cases where it is desired to perform document searches with negative or positive conditions added. For example, when treating a patient with symptoms of "fever", doctors want past medical record articles when the patient's symptoms worsened in order to judge unsuitable treatment methods and drugs for the patient. Sometimes.
しかし、キーワード検索を用いた文書検索では、キーワードとして入力された文字列が単純に一致するかどうかで検索を行うため、本来欲しい情報がヒットしない、あるいは、欲しい情報を見つけ出すのに時間がかかる場合がある。例えば、「発熱」というキーワードで文書検索を行うと、「発熱が治まった」という本来必要でない情報もヒットして、欲しい情報が埋もれてしまうことがある。 However, in document retrieval using keyword search, since the search is performed simply by whether or not the character string entered as the keyword matches, the originally desired information may not be hit, or it may take a long time to find the desired information. There is For example, if a document search is performed using the keyword "fever", the information "fever has subsided", which is not originally necessary, may be hit, and the desired information may be buried.
このため、単語が持つポジティブまたはネガティブな意味合いの傾向から、その単語を含む文書のポジティブまたはネガティブな意味合いを判断し、ネガティブまたはポジティブの条件を加味した文書検索を行うことが考えられる。この場合、様々な単語について、ポジティブまたはネガティブな意味合いの傾向を特定する情報を予め保持しておくことになる。 Therefore, it is conceivable to determine the positive or negative connotation of the document containing the word based on the tendency of the word to have a positive or negative connotation, and perform a document search with the negative or positive condition added. In this case, information specifying tendencies of positive or negative connotations is stored in advance for various words.
ところが、様々な単語について、人手により単語の意味合いを一つ一つ確認し、ポジティブまたはネガティブの意味合いの傾向を示す情報をデータベース等に予め登録することは、時間や手間がかかり現実的ではない。また、単語によっては、ポジティブまたはネガティブの意味合いの傾向を人手で判断しにくいものもある。 However, manually confirming the meanings of various words one by one and registering information indicating tendencies of positive or negative meanings in a database or the like in advance is time-consuming and laborious and unrealistic. Also, depending on the word, it is difficult to manually determine the tendency of positive or negative connotations.
そこで、本実施の形態では、単語が持つポジティブまたはネガティブの意味合いの傾向を特定可能にし、ひいては、ポジティブまたはネガティブの条件を加味した文書検索を実現する文書検索方法について説明する。以下、情報処理装置101の処理例について説明する。
Therefore, in the present embodiment, a document retrieval method that makes it possible to specify the tendency of positive or negative connotations of words and realizes document retrieval that takes into account positive or negative conditions will be described. A processing example of the
(1)情報処理装置101は、処理対象となる単語を受け付ける。ここで、処理対象となる単語は、単語が持つポジティブまたはネガティブな意味合いの傾向を示す指標値を算出する対象の単語である。ポジティブな意味合いの傾向とは、どの程度ポジティブな意味を有しているかをあらわす。ネガティブな意味合いの傾向とは、どの程度ネガティブな意味を有しているかをあらわす。
(1) The
具体的には、例えば、情報処理装置101は、ユーザの操作入力により、または、外部のコンピュータから受信することにより、処理対象となる単語を受け付けることにしてもよい。また、情報処理装置101は、文書から単語を抽出することにより、抽出した単語を処理対象となる単語として受け付けることにしてもよい。
Specifically, for example, the
図1の例では、処理対象となる単語として、単語「xxx」を受け付けた場合を想定する。 In the example of FIG. 1, it is assumed that the word "xxx" is accepted as the word to be processed.
(2)情報処理装置101は、第1の記憶部110を参照して、処理対象となる単語について、ポジティブまたはネガティブに分類可能な文書それぞれにおける単語の出現頻度に基づき、単語が持つポジティブまたはネガティブな意味合いの傾向を示す指標値を算出する。
(2) The
第1の記憶部110は、ポジティブまたはネガティブに分類可能な文書を登録した記憶部である。ポジティブまたはネガティブに分類可能な文書とは、ポジティブな内容、結果の文書であるか、または、ネガティブな内容、結果の文書であるかを分類可能な文書である。第1の記憶部110には、例えば、文書に対応付けて、当該文書がポジティブまたはネガティブのいずれの文書であるかを分類するための情報が記憶されている。
A
ここで、ポジティブに分類された文書における出現頻度が高い単語ほど、ポジティブな意味合いが強い単語であるといえる。一方、ネガティブに分類された文書における出現頻度が高い単語ほど、ネガティブな意味合いが強い単語であるといえる。ただし、ポジティブに分類された文書に出現した単語が、ネガティブに分類された文書に出現することもある。また、ネガティブに分類された文書に出現した単語が、ポジティブに分類された文書に出現することもある。 Here, it can be said that a word with a higher appearance frequency in positively classified documents has a stronger positive connotation. On the other hand, it can be said that a word with a higher appearance frequency in negatively classified documents has a stronger negative connotation. However, words that appear in positively classified documents may also appear in negatively classified documents. Also, words that appear in negatively classified documents may appear in positively classified documents.
このため、情報処理装置101は、処理対象となる単語について、ポジティブに分類された文書における出現頻度と、ネガティブに分類された文書における出現頻度とに基づいて、その単語の指標値を算出する。文書における単語の出現頻度は、例えば、その単語が文書中に出現した回数を、文書に含まれる単語の総数(全単語数)で除算することにより求めることができる。
Therefore, the
図1の例では、第1の記憶部110には、ポジティブに分類された文書111と、ネガティブに分類された文書112とが記憶されているとする。また、ポジティブに分類された文書111における単語「xxx」の出現頻度を「出現頻度f1」とし、ネガティブに分類された文書112における単語「xxx」の出現頻度を「出現頻度f2」とする。
In the example of FIG. 1, the
この場合、情報処理装置101は、単語「xxx」について、ポジティブに分類された文書111における出現頻度f1と、ネガティブに分類された文書112における出現頻度f2とに基づいて、単語「xxx」の指標値v1を算出する。より具体的には、例えば、指標値v1は、出現頻度f1と出現頻度f2との差分(例えば、f1-f2)によって表されることにしてもよい。
In this case, the
ここでは、指標値v1を、出現頻度f1から出現頻度f2を引いた値とする。この場合、指標値v1が大きいほど、単語「xxx」が持つポジティブな意味合いの傾向が強いといえる。また、指標値v1が小さいほど、単語「xxx」が持つネガティブな意味合いの傾向が強いといえる。 Here, the index value v1 is a value obtained by subtracting the appearance frequency f2 from the appearance frequency f1. In this case, it can be said that the larger the index value v1, the stronger the tendency of the word "xxx" to have a positive connotation. Also, it can be said that the smaller the index value v1, the stronger the tendency of the word "xxx" to have a negative connotation.
なお、ここではポジティブ(または、ネガティブ)に分類された文書が1つの場合を例に挙げて説明したが、複数の文書が存在する場合は、情報処理装置101は、複数の文書全体における単語の出現頻度を算出することにしてもよい。
Here, the case where there is one document classified positively (or negatively) has been described as an example, but when there are a plurality of documents, the
(3)情報処理装置101は、算出した指標値を、単語と対応付けて第2の記憶部120に登録する。ここで、第2の記憶部120は、単語と対応付けて、その単語が持つポジティブまたはネガティブな意味合いの傾向を示す指標値を記憶する記憶部である。
(3) The
図1の例では、情報処理装置101は、算出した指標値v1を、単語「xxx」と対応付けて第2の記憶部120に登録する。
In the example of FIG. 1, the
このように、情報処理装置101によれば、処理対象となる単語が持つポジティブまたはネガティブの意味合いの傾向を特定可能な指標値を求めて登録しておくことができる。これにより、単語が持つポジティブまたはネガティブの意味合いの傾向から、その単語を含む文書が持つポジティブまたはネガティブの意味合いの傾向を推定可能となり、ひいては、ポジティブまたはネガティブの条件を加味した文書検索を実現することができる。
As described above, according to the
図1の例では、単語「xxx」が持つポジティブまたはネガティブの意味合いの傾向を特定可能な指標値v1を登録しておくことができる。これにより、文書検索を行うにあたり、単語「xxx」の指標値v1を用いて、単語「xxx」を含む文書が持つポジティブまたはネガティブの意味合いの傾向を推定することが可能となる。 In the example of FIG. 1, an index value v1 that can identify the positive or negative connotation tendency of the word "xxx" can be registered. As a result, when performing a document search, it is possible to use the index value v1 of the word "xxx" to estimate the tendency of positive or negative connotations of documents containing the word "xxx".
(文書検索システム200のシステム構成例)
つぎに、図1に示した情報処理装置101を含む文書検索システム200のシステム構成例について説明する。文書検索システム200は、例えば、医療機関の電子カルテシステムに適用される。医療機関は、病院、診療所などである。
(System Configuration Example of Document Search System 200)
Next, an example system configuration of the
図2は、文書検索システム200のシステム構成例を示す説明図である。図2において、文書検索システム200は、情報処理装置101と、クライアント装置201と、を含む。文書検索システム200において、情報処理装置101およびクライアント装置201は、有線または無線のネットワーク210を介して接続される。ネットワーク210は、例えば、LAN(Local Area Network)、WAN(Wide Area Network)、インターネットなどである。
FIG. 2 is an explanatory diagram showing a system configuration example of the
ここで、情報処理装置101は、病名DB(Database)220、カルテDB230およびネガポジDB240を有する。情報処理装置101は、例えば、電子カルテシステムのサーバである。なお、各種DB220,230,240の記憶内容については、図4~図6を用いて後述する。
Here, the
クライアント装置201は、文書検索システム200のユーザが使用するコンピュータである。文書検索システム200のユーザは、例えば、医療機関の医師、看護師などの医療従事者である。クライアント装置201は、例えば、PC(Personal Computer)、タブレット型PCなどである。
A
なお、上述した説明では、情報処理装置101とクライアント装置201とが別体に設けられることにしたが、これに限らない。例えば、情報処理装置101は、クライアント装置201により実現されることにしてもよい。
In the above description, the
(情報処理装置101のハードウェア構成例)
図3は、情報処理装置101のハードウェア構成例を示すブロック図である。図3において、情報処理装置101は、CPU(Central Processing Unit)301と、メモリ302と、ディスクドライブ303と、ディスク304と、通信I/F(Interface)305と、可搬型記録媒体I/F306と、可搬型記録媒体307と、を有する。また、各構成部は、バス300によってそれぞれ接続される。
(Hardware Configuration Example of Information Processing Device 101)
FIG. 3 is a block diagram showing a hardware configuration example of the
ここで、CPU301は、情報処理装置101の全体の制御を司る。CPU301は、複数のコアを有していてもよい。メモリ302は、例えば、ROM(Read Only Memory)、RAM(Random Access Memory)およびフラッシュROMなどを有する。具体的には、例えば、フラッシュROMがOS(Operating System)のプログラムを記憶し、ROMがアプリケーションプログラムを記憶し、RAMがCPU301のワークエリアとして使用される。メモリ302に記憶されるプログラムは、CPU301にロードされることで、コーディングされている処理をCPU301に実行させる。
Here, the
ディスクドライブ303は、CPU301の制御に従ってディスク304に対するデータのリード/ライトを制御する。ディスク304は、ディスクドライブ303の制御で書き込まれたデータを記憶する。ディスク304としては、例えば、磁気ディスク、光ディスクなどが挙げられる。
The
通信I/F305は、通信回線を通じてネットワーク210に接続され、ネットワーク210を介して外部のコンピュータ(例えば、図2に示したクライアント装置201)に接続される。そして、通信I/F305は、ネットワーク210と装置内部とのインターフェースを司り、外部のコンピュータからのデータの入出力を制御する。通信I/F305には、例えば、モデムやLANアダプタなどを採用することができる。
The communication I/
可搬型記録媒体I/F306は、CPU301の制御に従って可搬型記録媒体307に対するデータのリード/ライトを制御する。可搬型記録媒体307は、可搬型記録媒体I/F306の制御で書き込まれたデータを記憶する。可搬型記録媒体307としては、例えば、CD(Compact Disc)-ROM、DVD(Digital Versatile Disk)、USB(Universal Serial Bus)メモリなどが挙げられる。
A portable recording medium I/
なお、情報処理装置101は、上述した構成部のほかに、例えば、SSD(Solid State Drive)、入力装置、ディスプレイ等を有することにしてもよい。また、情報処理装置101は、上述した構成部のうち、例えば、ディスクドライブ303、ディスク304、可搬型記録媒体I/F306、可搬型記録媒体307を有していなくてもよい。また、図2に示したクライアント装置201についても、情報処理装置101と同様のハードウェア構成により実現することができる。ただし、クライアント装置201は、上述した構成部のほかに、入力装置、ディスプレイなどを有する。
Note that the
(各種DB220,230,240の記憶内容)
つぎに、図4~図6を用いて、情報処理装置101が有する各種DB220,230,240の記憶内容について説明する。各種DB220,230,240は、例えば、図3に示したメモリ302、ディスク304などの記憶装置により実現される。
(Stored contents of
Next, the storage contents of the
図4は、病名DB220の記憶内容の一例を示す説明図である。図4において、病名DB220は、患者ID、病名コード、病名、主病名区分、病名開始日、転帰および転帰日のフィールドを有し、各フィールドに情報を設定することで、病名情報(例えば、病名情報400-1~400-8)をレコードとして記憶する。
FIG. 4 is an explanatory diagram showing an example of the contents stored in the
ここで、患者IDは、患者を一意に識別する識別子である。患者は、例えば、文書検索システム200が導入される医療機関における患者である。病名コードは、患者につけられた病名を一意に識別する識別子である。病名は、病気の名称である。病名には、主病名や疑い病名などがある。主病名は、主たる病名である。疑い病名は、疑いのある病名である。
Here, the patient ID is an identifier that uniquely identifies a patient. A patient is, for example, a patient at a medical institution where the
主病名区分は、主病名であるか否かを示すフラグである。主病名区分「1」は、主病名であることを示す。主病名区分「0」は、主病名ではないことを示す。病名開始日は、病名がつけられた日付である。転帰は、病気が進行または改善した結果、どのような状態にいたったのかを示す。転帰日は、転帰が記載された日付である。 The main disease name classification is a flag indicating whether or not it is the main disease name. The main disease name category "1" indicates that it is the main disease name. The main disease name category "0" indicates that it is not the main disease name. The disease name start date is the date when the disease name was given. Outcome indicates what kind of condition the patient has developed as a result of progression or improvement of the disease. Outcome date is the date the outcome was described.
例えば、病名情報400-1は、患者ID「P1」の患者の病名コード「12345」、病名「胃腫瘍」、主病名区分「1」、病名開始日「2018/10/1」、転帰「死亡」および転帰日「2018/11/1」を示す。 For example, the disease name information 400-1 includes the disease name code "12345", the disease name "stomach tumor", the main disease category "1", the disease name start date "2018/10/1", and the outcome "death" of the patient with the patient ID "P1". ” and the outcome date “2018/11/1”.
図5は、カルテDB230の記憶内容の一例を示す説明図である。図5において、カルテDB230は、患者ID、記載日、SOAP区分および記事のフィールドを有し、各フィールドに情報を設定することで、カルテ情報(例えば、カルテ情報500-1~500-8)をレコードとして記憶する。
FIG. 5 is an explanatory diagram showing an example of the contents stored in the
ここで、患者IDは、患者を一意に識別する識別子である。記載日は、カルテの記事を記載した日付である。SOAP区分は、SOAP形式で記載されたカルテのいずれの情報についての記事であるかを示す。SOAP区分「S」は、患者の主訴を示す。「S」は、Subjectiveの頭文字である。 Here, the patient ID is an identifier that uniquely identifies a patient. The entry date is the date when the article in the medical chart was entered. The SOAP section indicates which information in the medical record described in SOAP format is the article. The SOAP category "S" indicates the chief complaint of the patient. "S" is an acronym for Subjective.
SOAP区分「O」は、患者の検査結果等を示す。「O」は、Objectiveの頭文字である。SOAP区分「A」は、医師の所見(評価)を示す。「A」は、Assessmentの頭文字である。SOAP区分「P」は、治療計画を示す。「P」は、Planの頭文字である。記事は、カルテの記載内容である。 The SOAP section “O” indicates patient test results and the like. "O" is an acronym for Objective. The SOAP section "A" indicates the doctor's findings (evaluation). "A" is an acronym for Assessment. SOAP section "P" indicates a treatment plan. "P" is an acronym for Plan. The article is the description content of the chart.
例えば、カルテ情報500-1は、患者ID「P1」、記載日「2018/10/1」、SOAP区分「S」および記事「1週間前から下腹部に痛みがある」を示す。 For example, the chart information 500-1 indicates patient ID "P1", entry date "2018/10/1", SOAP category "S", and article "lower abdominal pain since 1 week ago".
図6は、ネガポジDB240の記憶内容の一例を示す説明図である。図6において、ネガポジDB240は、要素、病名コード、病名、ポジティブ件数、ポジティブ出現頻度、ネガティブ件数、ネガティブ出現頻度およびネガポジ度数のフィールドを有する。各フィールドに情報を設定することで、ネガポジ情報(例えば、ネガポジ情報600-1~600-10)がレコードとして記憶される。
FIG. 6 is an explanatory diagram showing an example of the contents stored in the negative/
ここで、要素は、文書で使用された単語である。文書は、例えば、カルテ情報の記事である。病名コードは、病名を一意に識別する識別子である。病名は、病気の名称である。ポジティブ件数は、ポジティブに分類された文書に単語が出現した回数である。ポジティブ出現頻度は、ポジティブに分類された文書における単語の出現頻度を示す。 Here, the elements are the words used in the document. The document is, for example, an article of medical record information. A disease name code is an identifier that uniquely identifies a disease name. A disease name is a name of a disease. The positive count is the number of times the word appears in positively classified documents. The positive frequency of occurrence indicates the frequency of occurrence of the word in positively classified documents.
ネガティブ件数は、ネガティブに分類された文書に単語が出現した回数である。ネガティブ出現頻度は、ネガティブに分類された文書における単語の出現頻度を示す。ネガポジ度数は、単語が持つポジティブまたはネガティブな意味合いの傾向を示す指標値である。ここでは、ネガポジ度数は、ポジティブ出現頻度からネガティブ出現頻度を引いた値を示す。 Negative count is the number of times a word appears in documents classified as negative. Negative frequency indicates the frequency of occurrence of words in negatively classified documents. The negative-positive frequency is an index value that indicates the tendency of a word to have a positive or negative connotation. Here, the negative-positive frequency indicates a value obtained by subtracting the negative appearance frequency from the positive appearance frequency.
例えば、ネガポジ情報600-1は、要素「痛み」、病名コード「12345」、病名「胃腫瘍」、ポジティブ件数「5」、ポジティブ出現頻度「0.113636364」、ネガティブ件数「10」、ネガティブ出現頻度「0.263157895」およびネガポジ度数「-0.149521531」を示す。 For example, the negative/positive information 600-1 includes the element "pain", the disease name code "12345", the disease name "stomach tumor", the positive number "5", the positive appearance frequency "0.113636364", the negative number "10", and the negative appearance frequency. "0.263157895" and negative-positive power "-0.149521531" are shown.
(情報処理装置101の機能的構成例)
図7は、情報処理装置101の機能的構成例を示すブロック図である。図7において、情報処理装置101は、第1の受付部701と、算出部702と、登録部703と、第2の受付部704と、検索部705と、決定部706と、出力部707と、第1の記憶部710と、第2の記憶部720と、を含む。具体的には、例えば、第1の受付部701~出力部707は、図3に示したメモリ302、ディスク304などの記憶装置に記憶されたプログラムをCPU301に実行させることにより、または、通信I/F305により、その機能を実現する。各機能部の処理結果は、例えば、メモリ302、ディスク304などの記憶装置に記憶される。第1の記憶部710および第2の記憶部720は、例えば、メモリ302、ディスク304などの記憶装置により実現される。
(Example of functional configuration of information processing apparatus 101)
FIG. 7 is a block diagram showing a functional configuration example of the
第1の記憶部710は、ポジティブまたはネガティブに分類可能な文書を記憶する。具体的には、例えば、第1の記憶部710は、図4に示した病名DB220および図5に示したカルテDB230を記憶する。図1に示した第1の記憶部110は、例えば、第1の記憶部710に相当する。
The first storage unit 710 stores documents that can be classified as positive or negative. Specifically, for example, the first storage unit 710 stores the
第2の記憶部720は、単語と対応付けて、当該単語が持つポジティブまたはネガティブな意味合いの傾向を示す指標値を記憶する。具体的には、例えば、第2の記憶部720は、図6に示したネガポジDB240を記憶する。図1に示した第2の記憶部120は、例えば、第2の記憶部720に相当する。
The
第1の受付部701は、処理対象となる単語を受け付ける。ここで、処理対象となる単語は、単語が持つポジティブまたはネガティブな意味合いの傾向を示す指標値を算出する対象の単語である。処理対象となる単語は、特定の品詞の単語であってもよい。特定の品詞は、任意に設定可能であり、例えば、名詞、動詞、形容詞、形容動詞、副詞などである。
A
具体的には、例えば、第1の受付部701は、文書から抽出された単語を、処理対象となる単語として受け付ける。文書は、例えば、第1の記憶部710に記憶されたポジティブまたはネガティブに分類可能な文書であってもよい。より詳細に説明すると、例えば、第1の受付部701は、図5に示したカルテDB230内のカルテ情報の記事から抽出された特定の品詞の単語を、処理対象となる単語として受け付けることにしてもよい。
Specifically, for example, the
算出部702は、第1の記憶部710を参照して、処理対象となる単語について、ポジティブまたはネガティブに分類可能な文書それぞれにおける単語の出現頻度に基づき、単語が持つポジティブまたはネガティブな意味合いの傾向を示す指標値を算出する。
The
以下の説明では、ポジティブまたはネガティブな意味合いの傾向を示す指標値を「ネガポジ度数」と表記する場合がある。 In the following description, an index value indicating a tendency of positive or negative connotations may be referred to as "negative-positive frequency".
具体的には、例えば、算出部702は、第1の記憶部710に記憶された各文書を、ポジティブまたはネガティブのいずれかに分類する。つぎに、算出部702は、ポジティブに分類された文書における単語の出現頻度を算出する。また、算出部702は、ネガティブに分類された文書における単語の出現頻度を算出する。そして、算出部702は、算出したポジティブに分類された文書における単語の出現頻度と、ネガティブに分類された文書における単語の出現頻度とに基づいて、単語のネガポジ度数を算出する。
Specifically, for example, the
より詳細に説明すると、例えば、算出部702は、図4に示した病名DB220から、病名情報を選択する。つぎに、算出部702は、選択した病名情報の病名開始日から転帰日までの期間Tを特定する。そして、算出部702は、図5に示したカルテDB230から、選択した病名情報の患者IDに対応し、かつ、特定した期間Tに記載日が含まれるカルテ情報を選択する。
More specifically, for example, the
ここで、選択した病名情報の転帰が「死亡」の場合、算出部702は、選択したカルテ情報の記事をネガティブに分類する。一方、選択した病名情報の転帰が「寛解または治癒」の場合、算出部702は、選択したカルテ情報の記事をポジティブに分類する。
Here, if the outcome of the selected disease name information is "death", the
これにより、患者の転帰が「寛解または治癒」であるか、または、「死亡」であるかに応じて、病気の治療中に記載されたカルテ情報の記事を、ポジティブまたはネガティブに分類することができる。 This allows medical chart information articles written during treatment of an illness to be classified as positive or negative, depending on whether the patient's outcome is "remission or cure" or "death". can.
なお、病名DB220内の病名情報のうち、病名開始日が所定期間内の病名情報だけを処理対象とすることにしてもよい。所定期間は、任意に設定可能であり、例えば、直近5年などの期間に設定される。これにより、古いカルテ情報の記事を処理対象から除外することができる。
Of the disease name information in the
また、病名DB220内の病名情報のうち、病名が主病名である病名情報、すなわち、主病名区分「1」の病名情報だけを処理対象とすることにしてもよい。これにより、例えば、病名が確定していないときに記載されたカルテ情報の記事を処理対象から除外することができる。
Further, among the disease name information in the
つぎに、算出部702は、ポジティブに分類されたカルテ情報の記事を形態素解析することにより、当該記事を単語(形態素)単位に分解する。つぎに、算出部702は、分解した単語(形態素)のうち、特定の品詞の単語を抽出する。そして、算出部702は、抽出した各単語について、ポジティブに分類されたカルテ情報の記事における出現回数を算出する。
Next, the
なお、ポジティブに分類されたカルテ情報の記事における出現回数は、例えば、ポジティブに分類されたカルテ情報の記事のうち、全てのカルテ情報の記事を対象として算出されてもよく、また、一部のカルテ情報の記事を対象として算出されてもよい。 The number of appearances in articles of medical record information classified as positive may be calculated, for example, for all articles of medical record information among articles of medical record information classified positively. It may be calculated for articles of medical record information.
また、算出部702は、ネガティブに分類されたカルテ情報の記事を形態素解析することにより、当該記事を単語(形態素)単位に分解する。つぎに、算出部702は、分解した単語(形態素)のうち、特定の品詞の単語を抽出する。そして、算出部702は、抽出した各単語について、ネガティブに分類されたカルテ情報の記事における出現回数を算出する。
In addition, the
なお、ネガティブに分類されたカルテ情報の記事における出現回数は、例えば、ネガティブに分類されたカルテ情報の記事のうち、全てのカルテ情報の記事を対象として算出されてもよく、また、一部のカルテ情報の記事を対象として算出されてもよい。 The number of appearances in articles of medical record information classified as negative may be calculated, for example, for all articles of medical record information among the articles of medical record information classified as negative. It may be calculated for articles of medical record information.
以下の説明では、ポジティブに分類された文書(例えば、カルテ情報の記事)における単語の出現回数を「ポジティブ件数」と表記する場合がある。また、ネガティブに分類された文書(例えば、カルテ情報の記事)における単語の出現回数を「ネガティブ件数」と表記する場合がある。 In the following description, the number of occurrences of a word in positively classified documents (for example, articles of medical chart information) may be referred to as "positive number". Also, the number of occurrences of a word in a negatively classified document (for example, an article in medical record information) may be expressed as "negative number".
算出された単語のポジティブ件数およびネガティブ件数は、例えば、図8に示すようなネガポジ件数テーブル800に記憶される。ネガポジ件数テーブル800は、例えば、メモリ302、ディスク304などの記憶装置により実現される。
The positive counts and negative counts of the calculated words are stored, for example, in a negative-positive count table 800 as shown in FIG. The negative/positive number table 800 is realized by a storage device such as the
図8は、ネガポジ件数テーブル800の記憶内容の一例を示す説明図である。図8において、ネガポジ件数テーブル800は、要素、病名コード、病名、ネガティブ件数およびポジティブ件数のフィールドを有し、各フィールドに情報を設定することで、件数情報(例えば、件数情報800-1~800-6)をレコードとして記憶する。 FIG. 8 is an explanatory diagram showing an example of the contents stored in the negative/positive number table 800. As shown in FIG. In FIG. 8, the negative/positive number table 800 has fields for element, disease name code, disease name, negative number, and positive number. -6) is stored as a record.
ここで、要素は、カルテ情報の記事で使用された単語である。病名コードは、病名を一意に識別する識別子である。病名は、カルテ情報に対応する病名情報、すなわち、カルテ情報を選択するにあたり参照された病名情報から特定される。病名は、病気の名称である。ネガティブ件数は、ネガティブに分類されたカルテ情報の記事における単語の出現回数である。ポジティブ件数は、ポジティブに分類されたカルテ情報の記事における単語の出現回数である。 Here, the elements are the words used in the medical record information article. A disease name code is an identifier that uniquely identifies a disease name. The disease name is specified from the disease name information corresponding to the medical chart information, ie, the disease name information referred to when selecting the medical chart information. A disease name is a name of a disease. The number of negatives is the number of occurrences of a word in articles of medical record information classified as negative. The number of positives is the number of occurrences of a word in articles of medical record information classified as positive.
例えば、件数情報800-1は、要素「痛み」、病名コード「12345」、病名「胃腫瘍」、ネガティブ件数「5」およびポジティブ件数「10」を示す。 For example, the number information 800-1 indicates the element "pain", disease name code "12345", disease name "stomach tumor", negative number "5" and positive number "10".
例えば、算出部702は、ネガポジ件数テーブル800を参照して、各単語のポジティブ件数を積算することにより、合計ポジティブ件数を算出する。合計ポジティブ件数は、ポジティブに分類されたカルテ情報の記事に含まれる単語(例えば、特定の品詞の単語)の総数に相当する。つぎに、算出部702は、各単語のポジティブ件数を合計ポジティブ件数で除算することにより、各単語のポジティブ出現頻度を算出する。ポジティブ出現頻度は、ポジティブに分類されたカルテ情報の記事における単語の出現頻度である。
For example, the
また、算出部702は、ネガポジ件数テーブル800を参照して、各単語のネガティブ件数を積算することにより、合計ネガティブ件数を算出する。合計ネガティブ件数は、ネガティブに分類されたカルテ情報の記事に含まれる単語(例えば、特定の品詞の単語)の総数に相当する。つぎに、算出部702は、各単語のネガティブ件数を合計ネガティブ件数で除算することにより、各単語のネガティブ出現頻度を算出する。ネガティブ出現頻度は、ネガティブに分類されたカルテ情報の記事における単語の出現頻度である。
The
そして、算出部702は、算出した各単語のポジティブ出現頻度とネガティブ出現頻度とに基づいて、各単語のネガポジ度数を算出する。例えば、算出部702は、各単語のポジティブ出現頻度とネガティブ出現頻度との差分を、各単語のネガポジ度数として算出することにしてもよい。
Then, the
ネガポジ度数を、ポジティブ出現頻度からネガティブ出現頻度を引いた値とすると、ネガポジ度数が大きいほど、単語が持つポジティブな意味合いの傾向が強いといえる。一方、ネガポジ度数を、ネガティブ出現頻度からポジティブ出現頻度を引いた値とすると、ネガポジ度数が大きいほど、単語が持つネガティブな意味合いの傾向が強いといえる。ここでは、ネガポジ度数を、ポジティブ出現頻度からネガティブ出現頻度を引いた値とする。 Assuming that the negative-positive frequency is a value obtained by subtracting the negative-appearance frequency from the positive frequency, it can be said that the higher the negative-positive frequency, the stronger the tendency of the word to have a positive connotation. On the other hand, if the negative-positive frequency is a value obtained by subtracting the positive-appearance frequency from the negative frequency, it can be said that the larger the negative-positive frequency, the stronger the negative connotation of the word. Here, the negative-positive frequency is a value obtained by subtracting the negative appearance frequency from the positive appearance frequency.
登録部703は、算出された単語のネガポジ度数を、単語と対応付けて第2の記憶部720に登録する。具体的には、例えば、登録部703は、算出された単語のネガポジ度数を、単語(要素)と対応付けて、図6に示したネガポジDB240に登録する。この際、登録部703は、病名コード、病名、ポジティブ件数、ポジティブ出現頻度、ネガティブ件数およびネガティブ出現頻度をさらに対応付けて、ネガポジDB240に登録する。
The
病名は、単語のネガポジ度数を算出する際に参照されたカルテ情報に対応する病名情報から特定される。ただし、ポジティブ件数、ポジティブ出現頻度、ネガティブ件数およびネガティブ出現頻度については、ネガポジDB240に登録しないようにしてもよい。
The disease name is specified from the disease name information corresponding to the medical record information referred to when calculating the negative-positive frequency of the word. However, the positive number, positive appearance frequency, negative number, and negative appearance frequency may not be registered in the negative/
第2の受付部704は、検索文字列を受け付ける。ここで、検索文字列は、文書を検索する際の検索条件となるキーワード(文字または文字列)を指定するものである。検索文字列には、複数のキーワードが含まれていてもよい。具体的には、例えば、第2の受付部704は、図2に示したクライアント装置201から検索文字列を受信することにより、受信した検索文字列を受け付ける。
A
より詳細に説明すると、例えば、医師が、ある患者の診療を行うにあたり、後述の図9に示すようなキーワード検索画面910において、過去のカルテ記事を検索するために検索文字列を入力する。この場合、クライアント装置201は、入力された検索文字列を、情報処理装置101に送信する。検索文字列には、診療対象の患者の病名を特定する情報が対応付けられていてもよい。
More specifically, for example, when a doctor treats a patient, he enters a search character string to search for past medical record articles on a
検索部705は、文書群から、受け付けた検索文字列に対応する文書を検索する。ここで、文書群は、例えば、第1の記憶部710に記憶された文書群である。また、文書群は、インターネット上のウェブサイトから取得可能な文書群であってもよい。
A
具体的には、例えば、検索部705は、カルテDB230から、検索文字列に対応するカルテ情報の記事を検索する。より詳細に説明すると、例えば、検索部705は、検索文字列に含まれる文字や文字列を含むカルテ情報の記事を検索する。この際、検索部705は、SOAP区分が「S」または「A」のカルテ情報の記事を検索対象としてもよい。
Specifically, for example, the
また、検索部705は、現在の病名(診断対象の患者の病名)と同じ病名の病気を治療中に記載されたカルテ情報の記事を検索対象としてもよい。カルテ情報に対応する病名は、例えば、カルテ情報の患者IDと記載日をもとに病名DB220から特定可能である。ただし、検索アルゴリズムは、既存のいかなるものを用いることにしてもよい。
Further, the
以下の説明では、カルテDB230内のカルテ情報の記事を、単に「カルテ記事」と表記する場合がある。
In the following description, articles of medical chart information in the
決定部706は、検索文字列に対応する1または複数の文書が検索された場合、検索された1または複数の文書の各文書の優先度を決定する。ここで、文書の優先度とは、検索文字列に対する検索結果として文書を出力する際の優先度である。例えば、優先度が高い文書ほど、検索結果として他の文書よりも上位に表示される。
When one or more documents corresponding to the search character string are retrieved, the
具体的には、例えば、決定部706は、第2の記憶部720を参照して、検索された1または複数の文書の各文書に含まれる単語に対応するネガポジ度数に基づき、各文書のネガポジ度数を算出する。また、決定部706は、第2の記憶部720を参照して、検索文字列に含まれる単語に対応するネガポジ度数に基づき、検索文字列のネガポジ度数を算出する。そして、決定部706は、算出した各文書のネガポジ度数と検索文字列のネガポジ度数とに基づいて、各文書の優先度を決定する。
Specifically, for example, the
より詳細に説明すると、例えば、決定部706は、検索されたカルテ記事を形態素解析することにより、当該カルテ記事を単語(形態素)単位に分解する。つぎに、決定部706は、分解した単語(形態素)のうち、特定の品詞の単語を抽出する。
More specifically, for example, the determining
また、決定部706は、診療対象の患者の病名を特定する。診療対象の患者の病名は、例えば、検索文字列に対応付けられた情報から特定されてもよく、また、クライアント装置201や電子カルテシステムに問い合わせることにより特定されることにしてもよい。
The
つぎに、決定部706は、抽出した各単語について、ネガポジDB240を参照して、特定した病名に対応するネガポジ度数を特定する。すなわち、決定部706は、単語と病名との組み合わせに対応するネガポジ度数を特定する。例えば、単語「痛み」と病名「胃腫瘍」との組み合わせに対応するネガポジ度数は「-0.149521531」である。
Next, the
そして、決定部706は、特定した各単語のネガポジ度数を積算することにより、カルテ記事のネガポジ度数を算出する。この際、決定部706は、例えば、各単語のネガポジ度数を積算した値を、カルテ記事から抽出した単語数(あるいは、分解した単語数)で割ることにより正規化することにしてもよい。
Then, the determining
これにより、検索文字列に対応するカルテ記事が持つポジティブまたはネガティブな意味合いの傾向を示す指標値(ネガポジ度数)を得ることができる。 As a result, it is possible to obtain an index value (negative-positive frequency) that indicates the tendency of the positive or negative connotation of the medical record article corresponding to the search character string.
また、決定部706は、検索文字列を形態素解析することにより、当該検索文字列を単語(形態素)単位に分解する。つぎに、決定部706は、分解した単語(形態素)のうち、特定の品詞の単語を抽出する。そして、決定部706は、抽出した各単語について、ネガポジDB240を参照して、特定した診療対象の患者の病名に対応するネガポジ度数を特定する。
The
つぎに、決定部706は、特定した各単語のネガポジ度数を積算することにより、検索文字列のネガポジ度数を算出する。この際、決定部706は、例えば、各単語のネガポジ度数を積算した値を、検索文字列から抽出した単語数(あるいは、分解した単語数)で割ることにより正規化することにしてもよい。
Next, the
これにより、検索文字列が持つポジティブまたはネガティブな意味合いの傾向を示す指標値(ネガポジ度数)を得ることができる。 As a result, it is possible to obtain an index value (negative-positive frequency) that indicates the tendency of the search character string to have a positive or negative connotation.
そして、決定部706は、算出した各カルテ記事のネガポジ度数と検索文字列のネガポジ度数とに基づいて、各カルテ記事の優先度を決定する。ここで、各カルテ記事のネガポジ度数と検索文字列のネガポジ度数とに基づいて、カルテ記事の優先度を決定する第1および第2の決定例について説明する。
Then, the
・第1の決定例
決定部706は、各カルテ記事のネガポジ度数と検索文字列のネガポジ度数とに基づいて、検索された1または複数のカルテ記事のうち、ネガポジ度数が、検索文字列に近いカルテ記事ほど優先度が高くなるように、各カルテ記事の優先度を決定する。これにより、ポジティブまたはネガティブな意味合いの傾向の強さが検索文字列と同程度であるカルテ記事ほど高い優先度とすることができる。
First Determination Example Based on the negative-positive frequency of each medical chart article and the negative-positive frequency of the search character string, the
この際、決定部706は、算出した検索文字列のネガポジ度数に基づいて、検索文字列をポジティブまたはネガティブに分類することにしてもよい。例えば、検索文字列のネガポジ度数が0以上の場合、決定部706は、検索文字列をポジティブに分類する。一方、検索文字列のネガポジ度数が0未満の場合、決定部706は、検索文字列をネガティブに分類する。ただし、ネガポジ度数は、値が大きいほど、ポジティブな意味合いの傾向が強いものとする。
At this time, the determining
ここで、検索文字列がポジティブに分類された場合、検索者は、ネガティブな意味合いの検索結果よりも、ポジティブな意味合いの検索結果を必要としているといえる。一方、検索文字列がネガティブに分類された場合、検索者は、ポジティブな意味合いの検索結果よりも、ネガティブな意味合いの検索結果を必要としているといえる。 Here, when the search character string is classified as positive, it can be said that the searcher needs search results with a positive connotation rather than search results with a negative connotation. On the other hand, if the search character string is classified as negative, it can be said that the searcher needs search results with a negative connotation rather than search results with a positive connotation.
このため、検索文字列がポジティブに分類された場合、決定部706は、ネガポジ度数が0未満のカルテ記事よりも、ネガポジ度数が0以上のカルテ記事の優先度が高くなるように、各カルテ記事の優先度を決定することにしてもよい。これにより、検索文字列がポジティブに分類された場合には、ネガポジ度数が、0以上であって、検索文字列に近いカルテ記事ほど高い優先度とすることができる。
Therefore, when the search character string is classified as positive, the
一方、検索文字列がネガティブに分類された場合、決定部706は、ネガポジ度数が0以上のカルテ記事よりも、ネガポジ度数が0未満のカルテ記事の優先度が高くなるように、各カルテ記事の優先度を決定することにしてもよい。これにより、検索文字列がネガティブに分類された場合には、ネガポジ度数が、0未満であって、検索文字列に近いカルテ記事ほど高い優先度とすることができる。
On the other hand, if the search character string is classified as negative, the determining
・第2の決定例
決定部706は、算出した検索文字列のネガポジ度数に基づいて、検索文字列をポジティブまたはネガティブに分類する。ここで、検索文字列がポジティブに分類された場合、決定部706は、ネガポジ度数が大きいカルテ記事ほど優先度が高くなるように、各カルテ記事の優先度を決定することにしてもよい。これにより、検索文字列がポジティブに分類された場合には、ポジティブな意味合いの傾向が強いカルテ記事ほど高い優先度とすることができる。
Second Determination Example The
一方、ここで、検索文字列がネガティブに分類された場合、決定部706は、ネガポジ度数が小さいカルテ記事ほど優先度が高くなるように、各カルテ記事の優先度を決定することにしてもよい。これにより、検索文字列がネガティブに分類された場合には、ネガティブな意味合いの傾向が強いカルテ記事ほど高い優先度とすることができる。
On the other hand, if the search character string is classified as negative here, the
なお、各カルテ記事の優先度をどのように決定するかは、任意に設定可能である。例えば、情報処理装置101は、クライアント装置201からの指示に応じて、上述した第1または第2の決定例のいずれかの方法により、各カルテ記事の優先度を決定することにしてもよい。
It is possible to arbitrarily set how to determine the priority of each medical chart article. For example, the
また、決定部706は、算出した各カルテ記事のネガポジ度数に基づいて、各カルテ記事の表示態様を決定することにしてもよい。ここで、カルテ記事の表示態様とは、検索結果としてカルテ記事を表示する際の態様であり、カルテ記事の背景色、文字の色、大きさなどによって表される。
Further, the determining
具体的には、例えば、決定部706は、ネガポジ度数が0以上のカルテ記事の表示態様が、ネガポジ度数が0未満のカルテ記事の表示態様と異なるように、各カルテ記事の表示態様を決定する。これにより、ポジティブな意味合いの検索結果と、ネガティブな意味合いの検索結果とを判別可能にすることができる。
Specifically, for example, the determining
なお、決定部706によって決定された表示態様によるカルテ記事の表示例については、図9を用いて後述する。
A display example of medical record articles in the display mode determined by the
出力部707は、決定された各文書の優先度に基づいて、検索文字列に対応する検索結果を出力する。具体的には、例えば、出力部707は、検索された1または複数の文書を、決定された優先度が高い順に並べた文書リスト(あるいは、文書の名称等のリスト)を検索結果として出力することにしてもよい。
The
この際、出力部707は、検索された1または複数の文書のうち、決定された優先度が高い順に上位N個の文書を検索結果として出力することにしてもよい。Nは、任意に設定可能である。また、出力部707は、各文書(あるいは、文書の名称等)を検索結果として出力する際に、決定された表示態様で各文書を出力することにしてもよい。
At this time, the
また、出力部707は、各文書(あるいは、文書の名称等)を出力する際に、各文書と対応付けて、算出された各文書の指標値を出力することにしてもよい。出力部707の出力形式としては、例えば、通信I/F305による他のコンピュータへの送信、メモリ302、ディスク304などの記憶装置への記憶、不図示のディスプレイへの表示、不図示のプリンタへの印刷出力などがある。
Further, when outputting each document (or the name of the document, etc.), the
より詳細に説明すると、例えば、出力部707は、検索文字列に対応するカルテ記事をリスト化して示す検索結果画面を、クライアント装置201に表示することにしてもよい。検索結果画面の画面例については、図9および図10を用いて後述する。
More specifically, for example, the
なお、上述した説明では、検索文字列のネガポジ度数に基づいて、検索文字列をポジティブまたはネガティブに分類することにしたが、これに限らない。例えば、第2の受付部704は、検索文字列とともに、ポジティブまたはネガティブのいずれかの選択を受け付けることにしてもよい。
In the above description, the search character string is classified into positive or negative based on the negative-positive frequency of the search character string, but the classification is not limited to this. For example, the
ポジティブまたはネガティブの選択は、例えば、クライアント装置201に表示される、後述の図11に示すようなキーワード検索画面1100において行われる。この場合、クライアント装置201は、入力された検索文字列とともに、ポジティブまたはネガティブの選択結果を、情報処理装置101に送信する。
Selection of positive or negative is performed, for example, on a
そして、第2の受付部704は、クライアント装置201から検索文字列および選択結果を受信することにより、検索文字列およびポジティブまたはネガティブの選択を受け付ける。決定部706は、ポジティブの選択を受け付けた場合、検索文字列をポジティブに分類する。一方、ネガティブの選択を受け付けた場合、決定部706は、検索文字列をネガティブに分類する。
Then, the
また、上述した説明では、文書検索時に、検索された各文書について、当該各文書のネガポジ度数を算出することにしたが、これに限らない。例えば、情報処理装置101は、第1の記憶部710に記憶された文書について、当該文書のネガポジ度数を予め算出しておくことにしてもよい。
Further, in the above description, the negative-positive frequency of each document is calculated for each document when searching for documents, but the present invention is not limited to this. For example, the
具体的には、例えば、情報処理装置101は、第2の記憶部720を参照して、第1の記憶部710に記憶された各文書に含まれる単語に対応するネガポジ度数に基づき、各文書のネガポジ度数を算出する。そして、情報処理装置101は、算出した各文書のネガポジ度数を、各文書と対応付けて第1の記憶部710に登録しておくことにしてもよい。
Specifically, for example, the
より詳細に説明すると、例えば、情報処理装置101は、カルテDB230に記憶された各カルテ記事に含まれる単語について、ネガポジDB240を参照して、各カルテ記事に対応する病名に対応するネガポジ度数を特定する。つぎに、情報処理装置101は、特定した各カルテ記事に含まれる単語のネガポジ度数に基づき、各カルテ記事のネガポジ度数を算出する。そして、情報処理装置101は、算出した各カルテ記事のネガポジ度数を、各カルテ記事と対応付けて、メモリ302、ディスク304などの記憶装置に登録しておくことにしてもよい。
More specifically, for example, the
これにより、文書検索時に、予め登録した文書(例えば、カルテ記事)のネガポジ度数を読み出すだけでよい、すなわち、各文書のネガポジ度数を算出しなくてもよくなるため、文書検索時の処理負荷を削減して応答性能を高めることができる。 As a result, when retrieving documents, it is only necessary to read out the negative-positive frequencies of documents registered in advance (e.g., medical chart articles). response performance can be improved.
また、情報処理装置101は、例えば、研修医などが記載したカルテ記事などを対象として、カルテ記事のネガポジ度数を求めることにしてもよい。これにより、カルテ記事のネガポジ度数から、カルテ記事の内容がポジティブすぎる、あるいは、ネガティブすぎるといった評価を行うことができ、新人教育に役立てることができる。
Further, the
また、情報処理装置101の各機能部は、文書検索システム200内の情報処理装置101とは異なる他のコンピュータ、例えば、クライアント装置201で実現することにしてもよい。また、情報処理装置101の各機能部は、文書検索システム200内の複数のコンピュータ(例えば、情報処理装置101とクライアント装置201)により実現されることにしてもよい。
Also, each functional unit of the
(クライアント装置201に表示される各種画面の画面例)
つぎに、クライアント装置201のディスプレイ(不図示)に表示される各種画面の画面例について説明する。ここでは、医師が、患者の診療を行うにあたり、その患者の過去のカルテ記事を参考にして、今後の治療方針を検討する場合を想定する。
(Screen examples of various screens displayed on the client device 201)
Next, screen examples of various screens displayed on the display (not shown) of the
以下の説明では、操作画面に表示されているボタン等をユーザが選択する操作として、クリック操作を行う場合を例に挙げて説明する。 In the following description, as an operation for the user to select a button or the like displayed on the operation screen, a case of performing a click operation will be described as an example.
図9は、クライアント装置201の画面遷移例を示す説明図である。図9において、キーワード検索画面910は、検索文字列の入力を受け付ける操作画面である。キーワード検索画面910において、不図示の入力装置を用いたユーザ(医師)の操作入力により、ボックス911をクリックすると、検索文字列を入力することができる。図9の例では、ボックス911に検索文字列「下腹部の痛み」が入力されている。
FIG. 9 is an explanatory diagram showing an example of screen transition of the
また、キーワード検索画面910において、ユーザ(医師)の操作入力により、ボタン912をクリックすると、ボックス911に入力された検索文字列が情報処理装置101に送信される。図9の例では、ボックス911に入力された検索文字列「下腹部の痛み」が情報処理装置101に送信される。
When a user (doctor) clicks a
情報処理装置101は、クライアント装置201から検索文字列「下腹部の痛み」を受け付けると、カルテDB230から検索文字列「下腹部の痛み」に対応するカルテ記事を検索する。つぎに、情報処理装置101は、検索した各カルテ記事の優先度を決定する。ここでは、上述した第1の決定例により、各カルテ記事の優先度を決定する場合を想定する。
When the
具体的には、例えば、情報処理装置101は、検索文字列「下腹部の痛み」のネガポジ度数を算出する。また、情報処理装置101は、検索した各カルテ記事のネガポジ度数を算出する。ここで、検索文字列「下腹部の痛み」のネガポジ度数を算出する場合を例に挙げて、具体的な処理内容について説明する。
Specifically, for example, the
より詳細に説明すると、例えば、情報処理装置101は、検索文字列「下腹部の痛み」を形態素解析して、単語(形態素)単位に分解する。ここでは、「下腹部」と「の」と「痛み」の3単語に分解される。つぎに、情報処理装置101は、ネガポジDB240を参照して、分解した各単語に対応するネガポジ度数を特定する。
More specifically, for example, the
ただし、患者の病名を「胃腫瘍」とする。また、単語「の」は、助詞のため除外する。すなわち、情報処理装置101は、ネガポジDB240を参照して、分解した3単語のうち、単語「下腹部」と単語「痛み」について、病名「胃腫瘍」に対応するネガポジ度数を特定する。
However, the disease name of the patient is assumed to be "stomach tumor". Also, the word "no" is excluded because it is a particle. That is, the
ここでは、単語「下腹部」のネガポジ度数として、病名「胃腫瘍」に対応する「-0.017942584」が特定された場合を想定する。また、単語「痛み」のネガポジ度数として、病名「胃腫瘍」に対応する「-0.149521531」が特定された場合を想定する。 Here, it is assumed that "-0.017942584" corresponding to the disease name "stomach tumor" is specified as the negative-positive frequency of the word "lower abdomen". It is also assumed that "-0.149521531" corresponding to the disease name "stomach tumor" is specified as the negative-positive frequency of the word "pain".
つぎに、情報処理装置101は、特定した各単語のネガポジ度数を積算することにより、検索文字列「下腹部の痛み」のネガポジ度数を算出する。ここでは、検索文字列「下腹部の痛み」のネガポジ度数は「-0.167464115」となる。このため、検索文字列「下腹部の痛み」は、ネガティブに分類される。
Next, the
この場合、情報処理装置101は、検索したカルテ記事のうち、ネガポジ度数が0未満であって、ネガポジ度数が検索文字列に近いカルテ記事ほど高い優先度とする。そして、情報処理装置101は、決定した各カルテ記事の優先度に従って、検索したカルテ記事を並べた検索結果画面920をクライアント装置201に表示する。
In this case, the
検索結果画面920は、検索文字列「下腹部の痛み」に対応するカルテ記事921~924をリスト化して示す操作画面である。検索結果画面920では、ネガポジ度数が0未満であって、ネガポジ度数が検索文字列「下腹部の痛み」に近いカルテ記事が優先して表示(上位に表示)されている。
The
ここで、カルテ記事921のネガポジ度数は、「-0.16755522」である。また、カルテ記事922のネガポジ度数は、「-0.16899999」である。カルテ記事923のネガポジ度数は、「-0.147856321」である。カルテ記事924のネガポジ度数は、「+0.157856561」である。
Here, the negative-positive frequency of the
例えば、カルテ記事921は、ネガポジ度数が0未満であって、ネガポジ度数が検索文字列「下腹部の痛み」に最も近いため、最上位に表示されている。また、カルテ記事924は、ネガポジ度数が0以上のため、ネガポジ度数が0未満である他のカルテ記事921~923よりも下位に表示されている。
For example, the
検索結果画面920によれば、検索文字列「下腹部の痛み」に応じて、ネガティブの条件を加味した検索結果を提示することができる。これにより、医師は、病名「胃腫瘍」の患者の診療を行うにあたり、その患者の過去のカルテ記事から必要な情報を容易に見つけ出すことができる。
According to the
また、検索結果画面920では、ネガポジ度数が0未満のカルテ記事921~923と、ネガポジ度数が0以上のカルテ記事924とが異なる態様(背景の模様が異なる)で表示されている。これにより、医師は、ポジティブな意味合いのカルテ記事と、ネガティブな意味合いのカルテ記事とを容易に判別することができる。
In addition, on the
また、検索結果画面920では、カルテ記事921~924と対応付けて、ネガポジ度数情報931~934がそれぞれ表示されている。各ネガポジ度数情報931~934は、各カルテ記事921~924のネガポジ度数を示す情報である。これにより、医師は、各カルテ記事921~924のネガポジ度数から、各カルテ記事921~924のポジティブまたはネガティブの傾向の強さを判断することができる。
Further, on the
ただし、検索結果画面920において、ネガポジ度数情報931~934は表示されていなくてもよい。
However, the negative-
つぎに、図10を用いて、検索結果画面の他の画面例について説明する。ここでは、上述した第2の決定例により、各カルテ記事の優先度が決定された場合を想定する。この場合、検索文字列「下腹部の痛み」がネガティブに分類されると、ネガティブな意味合いの傾向が強いカルテ記事ほど高い優先度となる。 Next, another screen example of the search result screen will be described with reference to FIG. Here, it is assumed that the priority of each medical record article is determined according to the second determination example described above. In this case, if the search character string “pain in the lower abdomen” is classified as negative, the chart article with a stronger negative connotation tends to have a higher priority.
図10は、検索結果画面の他の画面例を示す説明図である。図10において、検索結果画面1000は、検索文字列「下腹部の痛み」に対応するカルテ記事921~924をリスト化して示す操作画面である。検索結果画面1000では、ネガティブな意味合いの傾向が強いカルテ記事が優先して表示(上位に表示)されている。
FIG. 10 is an explanatory diagram showing another screen example of the search result screen. In FIG. 10, a
これにより、医師は、上位に表示されたものほど、ネガティブな意味合いの傾向が強いことがわかり、過去のカルテ記事から必要な情報を容易に見つけ出すことができる。 As a result, the doctor can see that the higher the displayed information, the stronger the negative connotation, and the doctor can easily find the necessary information from the past medical record articles.
つぎに、図11を用いて、キーワード検索画面の他の画面例について説明する。 Next, another screen example of the keyword search screen will be described with reference to FIG.
図11は、キーワード検索画面の他の画面例を示す説明図である。図11において、キーワード検索画面1100は、検索文字列の入力を受け付ける操作画面である。キーワード検索画面1100において、ユーザ(医師)の操作入力により、ボックス1101をクリックすると、検索文字列を入力することができる。図11の例では、ボックス1101に検索文字列「下腹部の痛み」が入力されている。
FIG. 11 is an explanatory diagram showing another screen example of the keyword search screen. In FIG. 11, a
また、キーワード検索画面1100において、ユーザの操作入力により、ボタン1102,1103のいずれかをクリックすると、ポジティブまたはネガティブのいずれかを選択することができる。図11の例では、ボタン1103がクリックされ、ネガティブが選択されている。
Also, on the
また、キーワード検索画面1100において、ユーザの操作入力により、ボタン1104をクリックすると、ボックス1101に入力された検索文字列、および、ポジティブまたはネガティブの選択結果が情報処理装置101に送信される。図11の例では、ボックス1101に入力された検索文字列「下腹部の痛み」および選択結果「ネガティブ」が情報処理装置101に送信される。
When a user clicks a
これにより、情報処理装置101において、検索文字列「下腹部の痛み」をポジティブまたはネガティブに分類するにあたり、検索文字列「下腹部の痛み」のネガポジ度数を算出することなく、選択結果「ネガティブ」から精度よく分類することができる。
As a result, when classifying the search character string "pain in the lower abdomen" into positive or negative in the
(情報処理装置101のネガポジ登録処理手順)
つぎに、図12~図14を用いて、情報処理装置101のネガポジ登録処理手順について説明する。
(Negative-Positive Registration Processing Procedure of Information Processing Device 101)
Next, negative/positive registration processing procedures of the
図12~図14は、情報処理装置101のネガポジ登録処理手順の一例を示すフローチャートである。図12のフローチャートにおいて、まず、情報処理装置101は、病名DB220から選択されていない未選択の病名情報を選択する(ステップS1201)。つぎに、情報処理装置101は、選択した病名情報の主病名区分を参照して、主病名であるか否かを判断する(ステップS1202)。
12 to 14 are flow charts showing an example of a negative/positive registration processing procedure of the
ここで、主病名ではない場合(ステップS1202:No)、情報処理装置101は、ステップS1208に移行する。一方、主病名の場合には(ステップS1202:Yes)、情報処理装置101は、選択した病名情報の病名開始日が5年以内であるか否かを判断する(ステップS1203)。
Here, if it is not the main disease name (step S1202: No), the
ここで、病名開始日が5年以内ではない場合(ステップS1203:No)、情報処理装置101は、ステップS1208に移行する。一方、病名開始日が5年以内の場合(ステップS1203:Yes)、情報処理装置101は、選択した病名情報の転帰が「死亡」であるか否かを判断する(ステップS1204)。
Here, if the disease name start date is not within five years (step S1203: No), the
ここで、転帰が「死亡」の場合(ステップS1204:Yes)、情報処理装置101は、ネガティブ件数算出処理を実行して(ステップS1205)、ステップS1208に移行する。ネガティブ件数算出処理の具体的な処理手順については、図15を用いて後述する。
Here, if the outcome is "death" (step S1204: Yes), the
一方、転帰が「死亡」ではない場合(ステップS1204:No)、情報処理装置101は、選択した病名情報の転帰が「寛解または治癒」であるか否かを判断する(ステップS1206)。ここで、転帰が「寛解または治癒」ではない場合(ステップS1206:No)、情報処理装置101は、ステップS1208に移行する。
On the other hand, if the outcome is not "death" (step S1204: No), the
一方、転帰が「寛解または治癒」の場合(ステップS1206:Yes)、情報処理装置101は、ポジティブ件数算出処理を実行する(ステップS1207)。ポジティブ件数算出処理の具体的な処理手順については、図16を用いて後述する。そして、情報処理装置101は、病名DB220から選択されていない未選択の病名情報があるか否かを判断する(ステップS1208)。
On the other hand, if the outcome is "remission or cure" (step S1206: Yes), the
ここで、未選択の病名情報がある場合(ステップS1208:Yes)、情報処理装置101は、ステップS1201に戻る。一方、未選択の病名情報がない場合には(ステップS1208:No)、情報処理装置101は、図13に示すステップS1301に移行する。
If there is unselected disease name information (step S1208: Yes), the
図13のフローチャートにおいて、まず、情報処理装置101は、ネガポジ件数テーブル800を参照して、各単語のネガティブ件数を積算することにより、合計ネガティブ件数を算出する(ステップS1301)。つぎに、情報処理装置101は、ネガポジ件数テーブル800を参照して、各単語のポジティブ件数を積算することにより、合計ポジティブ件数を算出する(ステップS1302)。
In the flowchart of FIG. 13, the
そして、情報処理装置101は、ネガポジ件数テーブル800から選択されていない未選択の件数情報を選択する(ステップS1303)。つぎに、情報処理装置101は、選択した件数情報のネガティブ件数が未設定であるか否かを判断する(ステップS1304)。
Then, the
ここで、ネガティブ件数が設定済みの場合(ステップS1304:No)、情報処理装置101は、選択した件数情報のネガティブ件数を、算出した合計ネガティブ件数で除算して、ネガティブ出現頻度を算出し(ステップS1305)、ステップS1307に移行する。
Here, if the number of negatives has already been set (step S1304: No), the
一方、ネガティブ件数が未設定の場合(ステップS1304:Yes)、情報処理装置101は、ネガティブ出現頻度を「0」とする(ステップS1306)。そして、情報処理装置101は、選択した件数情報の要素と病名に対応付けて、ネガティブ出現頻度をネガポジDB240に記憶して(ステップS1307)、図14に示すステップS1401に移行する。
On the other hand, if the number of negatives is not set (step S1304: Yes), the
図14のフローチャートにおいて、まず、情報処理装置101は、選択した件数情報のポジティブ件数が未設定であるか否かを判断する(ステップS1401)。ここで、ポジティブ件数が設定済みの場合(ステップS1401:No)、情報処理装置101は、選択した件数情報のポジティブ件数を、算出した合計ポジティブ件数で除算して、ポジティブ出現頻度を算出し(ステップS1402)、ステップS1404に移行する。
In the flowchart of FIG. 14, first, the
一方、ポジティブ件数が未設定の場合(ステップS1401:Yes)、情報処理装置101は、ポジティブ出現頻度を「0」とする(ステップS1403)。そして、情報処理装置101は、選択した件数情報の要素と病名に対応付けて、ポジティブ出現頻度をネガポジDB240に記憶する(ステップS1404)。
On the other hand, if the number of positives has not been set (step S1401: YES), the
つぎに、情報処理装置101は、ポジティブ出現頻度からネガティブ出現頻度を引くことにより、ネガポジ度数を算出する(ステップS1405)。そして、情報処理装置101は、選択した件数情報の要素と病名に対応付けて、算出したネガポジ度数をネガポジDB240に記憶する(ステップS1406)。
Next, the
つぎに、情報処理装置101は、ネガポジ件数テーブル800から選択されていない未選択の件数情報があるか否かを判断する(ステップS1407)。ここで、未選択の件数情報がある場合(ステップS1407:Yes)、情報処理装置101は、ステップS1303に戻る。
Next, the
一方、未選択の件数情報がない場合(ステップS1407:No)、情報処理装置101は、本フローチャートによる一連の処理を終了する。なお、情報処理装置101は、選択した件数情報の要素と病名に対応付けて、選択した件数情報のネガティブ件数およびポジティブ件数をネガポジDB240に記憶することにしてもよい。
On the other hand, if there is no unselected number information (step S1407: No), the
これにより、カルテで使用される単語が持つポジティブまたはネガティブな意味合いの傾向を示す指標値(ネガポジ度数)を登録することができる。 Thereby, it is possible to register an index value (negative-positive frequency) indicating the tendency of the words used in the medical record to have positive or negative connotations.
つぎに、図15を用いて、図12に示したステップS1205のネガティブ件数算出処理の具体的な処理手順について説明する。 Next, a specific processing procedure of the negative count calculation processing in step S1205 shown in FIG. 12 will be described with reference to FIG.
図15は、ネガティブ件数算出処理の具体的処理手順の一例を示すフローチャートである。図15のフローチャートにおいて、まず、ステップS1201において選択した病名情報の病名開始日から転帰日までの期間Tを特定する(ステップS1501)。つぎに、情報処理装置101は、カルテDB230から、選択した病名情報の患者IDに対応するカルテ情報を抽出する(ステップS1502)。
FIG. 15 is a flow chart showing an example of a specific processing procedure of negative number calculation processing. In the flowchart of FIG. 15, first, a period T from the disease name start date to the outcome date of the disease name information selected in step S1201 is specified (step S1501). Next, the
そして、情報処理装置101は、抽出したカルテ情報のうち、特定した期間Tに記載日が含まれるカルテ情報の中から選択されていない未選択のカルテ情報を選択する(ステップS1503)。つぎに、情報処理装置101は、選択したカルテ情報の記事を形態素解析して、当該記事を単語(形態素)単位に分解する(ステップS1504)。
Then, the
そして、情報処理装置101は、分解した単語(形態素)のうち、特定の品詞の単語を抽出する(ステップS1505)。つぎに、情報処理装置101は、抽出した各単語について、選択したカルテ情報の記事における出現回数を算出する(ステップS1506)。
Then, the
そして、情報処理装置101は、算出した各単語の出現回数を、選択した病名情報の病名に対応するネガポジ件数テーブル800内の各単語のネガティブ件数に加算する(ステップS1507)。なお、ネガポジ件数テーブル800内に、病名情報の病名に対応する単語のレコードが存在しない場合は、情報処理装置101は、病名情報の病名に対応する単語のレコードを新規作成する。
Then, the
つぎに、情報処理装置101は、期間Tに記載日が含まれるカルテ情報の中から選択されていない未選択のカルテ情報があるか否かを判断する(ステップS1508)。ここで、未選択のカルテ情報がある場合(ステップS1508:Yes)、情報処理装置101は、ステップS1503に戻る。
Next, the
一方、未選択のカルテ情報がない場合(ステップS1508:No)、情報処理装置101は、ネガティブ件数算出処理を呼び出したステップに戻る。これにより、ネガティブに分類されたカルテ情報(転帰が「死亡」のカルテ情報)の記事における単語の出現回数をカウントすることができる。
On the other hand, if there is no unselected medical record information (step S1508: No), the
つぎに、図16を用いて、図12に示したステップS1207のポジティブ件数算出処理の具体的な処理手順について説明する。 Next, a specific processing procedure of the number of positives calculation processing in step S1207 shown in FIG. 12 will be described with reference to FIG.
図16は、ポジティブ件数算出処理の具体的処理手順の一例を示すフローチャートである。図16のフローチャートにおいて、まず、ステップS1201において選択した病名情報の病名開始日から転帰日までの期間Tを特定する(ステップS1601)。つぎに、情報処理装置101は、カルテDB230から、選択した病名情報の患者IDに対応するカルテ情報を抽出する(ステップS1602)。
FIG. 16 is a flow chart showing an example of a specific processing procedure of the number-of-positives calculation process. In the flowchart of FIG. 16, first, a period T from the disease name start date to the outcome date of the disease name information selected in step S1201 is specified (step S1601). Next, the
そして、情報処理装置101は、抽出したカルテ情報のうち、特定した期間Tに記載日が含まれるカルテ情報の中から選択されていない未選択のカルテ情報を選択する(ステップS1603)。つぎに、情報処理装置101は、選択したカルテ情報の記事を形態素解析して、当該記事を単語(形態素)単位に分解する(ステップS1604)。
Then, the
そして、情報処理装置101は、分解した単語(形態素)のうち、特定の品詞の単語を抽出する(ステップS1605)。つぎに、情報処理装置101は、抽出した各単語について、選択したカルテ情報の記事における出現回数を算出する(ステップS1606)。
Then, the
そして、情報処理装置101は、算出した各単語の出現回数を、選択した病名情報の病名に対応するネガポジ件数テーブル800内の各単語のポジティブ件数に加算する(ステップS1607)。
Then, the
つぎに、情報処理装置101は、期間Tに記載日が含まれるカルテ情報の中から選択されていない未選択のカルテ情報があるか否かを判断する(ステップS1608)。ここで、未選択のカルテ情報がある場合(ステップS1608:Yes)、情報処理装置101は、ステップS1603に戻る。
Next, the
一方、未選択のカルテ情報がない場合(ステップS1608:No)、情報処理装置101は、ポジティブ件数算出処理を呼び出したステップに戻る。これにより、ポジティブに分類されたカルテ情報(転帰が「寛解または治癒」のカルテ情報)の記事における単語の出現回数をカウントすることができる。
On the other hand, if there is no unselected medical chart information (step S1608: No), the
(情報処理装置101の文書検索処理手順)
つぎに、図17および図18を用いて、情報処理装置101の文書検索処理手順について説明する。
(Document search processing procedure of information processing apparatus 101)
Next, the document search processing procedure of the
図17および図18は、情報処理装置101の文書検索処理手順の一例を示すフローチャートである。図17のフローチャートにおいて、まず、情報処理装置101は、クライアント装置201からの検索文字列を受け付けたか否かを判断する(ステップS1701)。
17 and 18 are flowcharts showing an example of the document search processing procedure of the
ここで、情報処理装置101は、検索文字列を受け付けるのを待つ(ステップS1701:No)。そして、情報処理装置101は、検索文字列を受け付けた場合(ステップS1701:Yes)、診療対象の患者の病名を特定する(ステップS1702)。なお、診療対象の患者の病名を特定する情報は、検索文字列に対応付けられていてもよく、また、クライアント装置201や電子カルテシステムに問い合わせることにしてもよい。
Here, the
つぎに、情報処理装置101は、検索文字列を形態素解析して、当該検索文字列を単語(形態素)単位に分解する(ステップS1703)。そして、情報処理装置101は、分解した単語(形態素)のうち、特定の品詞の単語を抽出する(ステップS1704)。つぎに、情報処理装置101は、抽出した各単語について、ネガポジDB240を参照して、特定した診療対象の患者の病名に対応するネガポジ度数を特定する(ステップS1705)。
Next, the
そして、情報処理装置101は、特定した各単語のネガポジ度数を積算することにより、検索文字列のネガポジ度数を算出する(ステップS1706)。つぎに、情報処理装置101は、カルテDB230から、検索文字列に対応するカルテ情報の記事を検索して(ステップS1707)、図18に示すステップS1801に移行する。
Then, the
なお、ステップS1707において、カルテ情報の記事が検索されなかった場合には、情報処理装置101は、例えば、検索文字列に対応する記事が検索されなかったことを示す検索結果を出力して、本フローチャートによる一連の処理を終了する。
Note that in step S1707, if the article of the chart information is not searched, the
図18のフローチャートにおいて、まず、情報処理装置101は、検索された1または複数のカルテ情報の記事のうち選択されていない未選択の記事を選択する(ステップS1801)。つぎに、情報処理装置101は、選択した記事を形態素解析して、当該記事を単語(形態素)単位に分解する(ステップS1802)。
In the flowchart of FIG. 18, first, the
そして、情報処理装置101は、分解した単語(形態素)のうち、特定の品詞の単語を抽出する(ステップS1803)。つぎに、情報処理装置101は、抽出した各単語について、ネガポジDB240を参照して、特定した診療対象の患者の病名に対応するネガポジ度数を特定する(ステップS1804)。
Then, the
そして、情報処理装置101は、特定した各単語のネガポジ度数を積算した値を、抽出した単語数で割ることにより、選択した記事のネガポジ度数を算出する(ステップS1805)。つぎに、情報処理装置101は、検索された1または複数のカルテ情報の記事のうち選択されていない未選択の記事があるか否かを判断する(ステップS1806)。
Then, the
ここで、未選択の記事がある場合(ステップS1806:Yes)、情報処理装置101は、ステップS1801に戻る。一方、未選択の記事がない場合(ステップS1806:No)、情報処理装置101は、算出した各記事のネガポジ度数と検索文字列のネガポジ度数とに基づいて、各記事の優先度を決定する(ステップS1807)。
Here, if there is an unselected article (step S1806: Yes), the
そして、情報処理装置101は、検索した1または複数のカルテ情報の記事を、決定した優先度が高い順に並べた検索結果をクライアント装置201に出力して(ステップS1808)、本フローチャートによる一連の処理を終了する。これにより、検索文字列に応じて、ポジティブまたはネガティブの条件を加味した検索結果を出力することができる。
Then, the
なお、情報処理装置101は、ステップS1807において、さらに、各記事のネガポジ度数に基づいて、各記事の表示態様を決定することにしてもよい。この場合、情報処理装置101は、ステップS1808において、決定した表示態様で各記事を出力する。
In step S1807, the
以上説明したように、実施の形態にかかる情報処理装置101によれば、ポジティブまたはネガティブに分類可能な文書を登録した第1の記憶部710を参照して、処理対象となる単語について、ポジティブまたはネガティブに分類可能な文書それぞれにおける単語の出現頻度に基づき、単語のネガポジ度数を算出し、算出したネガポジ度数を単語と対応付けて第2の記憶部720に登録することができる。単語のネガポジ度数は、単語が持つポジティブまたはネガティブな意味合いの傾向を示す指標値である。
As described above, according to the
これにより、単語が持つポジティブまたはネガティブの意味合いの傾向を特定することが可能となり、ひいては、ポジティブまたはネガティブの条件を加味した文書検索を実現することができる。 This makes it possible to identify the tendency of positive or negative connotations of words, and furthermore realizes document retrieval taking into account positive or negative conditions.
また、情報処理装置101によれば、検索文字列を受け付け、文書群から検索文字列に対応する文書を検索し、検索文字列に対応する1または複数の文書が検索された場合、第2の記憶部720を参照して、検索された各文書に含まれる単語に対応するネガポジ度数に基づき、各文書のネガポジ度数を算出することができる。また、情報処理装置101によれば、第2の記憶部720を参照して、検索文字列に含まれる単語に対応するネガポジ度数に基づき、検索文字列のネガポジ度数を算出することができる。そして、情報処理装置101によれば、算出した各文書のネガポジ度数と検索文字列のネガポジ度数とに基づいて、検索文字列に対応する検索結果を出力することができる。文書群は、例えば、第1の記憶部710に記憶された文書群である。
Further, according to the
これにより、単語が持つポジティブまたはネガティブの意味合いの傾向から、その単語を含む文書が持つポジティブまたはネガティブの意味合いの傾向を推定して、ポジティブまたはネガティブの条件を加味した文書検索を行うことができる。 As a result, it is possible to estimate the tendency of positive or negative connotations of documents containing the words from the tendency of positive or negative connotations of words, and perform document retrieval with positive or negative conditions added.
また、情報処理装置101によれば、各文書のネガポジ度数と検索文字列のネガポジ度数とに基づいて、検索した1または複数の文書のうち、検索文字列とネガポジ度数が近い文書を優先して検索結果として出力することができる。
Further, according to the
これにより、ポジティブまたはネガティブな意味合いの傾向の強さが検索文字列と同程度である文書(例えば、カルテ記事)を優先して検索結果として出力することができる。 As a result, it is possible to preferentially output documents (for example, medical record articles) that tend to have positive or negative connotations at the same level as the search character string as search results.
また、情報処理装置101によれば、検索文字列のネガポジ度数に基づいて、検索文字列をポジティブまたはネガティブに分類し、検索文字列をポジティブに分類した場合、各文書のネガポジ度数に基づいて、検索した1または複数の文書のうち、ポジティブな意味合いの傾向が強い文書を優先して出力することができる。また、情報処理装置101によれば、検索文字列をネガティブに分類した場合、各文書のネガポジ度数に基づいて、検索した1または複数の文書のうち、ネガティブな意味合いの傾向が強い文書を優先して出力することができる。
Further, according to the
これにより、検索文字列がポジティブまたはネガティブのいずれに分類されたかに応じて、ポジティブまたはネガティブのいずれの傾向が強い文書を優先して出力するのかを決めることができる。 This makes it possible to determine whether documents with a strong positive or negative tendency are preferentially output according to whether the search character string is classified as positive or negative.
また、情報処理装置101によれば、各文書のネガポジ度数に基づいて、各文書の表示態様を決定し、各文書を検索結果として出力する際に、決定した表示態様で各文書を出力することができる。
Further, according to the
これにより、検索文字列に対応する検索結果を表示する際に、ポジティブな意味合いの文書と、ネガティブな意味合いの文書とを判別可能に表示することができる。 As a result, when displaying search results corresponding to a search character string, it is possible to distinguish between documents with positive connotations and documents with negative connotations.
また、情報処理装置101によれば、第1の記憶部710(カルテDB230)に記憶された文書である患者のカルテ情報の記事を、その患者の転帰に応じてポジティブまたはネガティブに分類することができる。
Further, according to the
これにより、例えば、患者の転帰が「寛解または治癒」であるか、または、「死亡」であるかに応じて、病気の治療中に記載されたカルテ記事を、ポジティブまたはネガティブに分類することができる。 This allows, for example, classifying medical record entries written during treatment of an illness as positive or negative depending on whether the patient's outcome is "remission or cure" or "death". can.
また、情報処理装置101によれば、第1の記憶部710(カルテDB230)に記憶された文書(カルテ情報の記事)のうち、各病名に対応する文書それぞれにおける単語の出現頻度に基づき、単語のネガポジ度数を算出することができる。そして、情報処理装置101によれば、算出したネガポジ度数を、単語と各病名とに対応付けて第2の記憶部720(ネガポジDB240)に登録することができる。
Further, according to the
これにより、カルテ記事で使用された単語のネガポジ度数を、病名ごとの単語の使われ方を考慮して求めることができる。例えば、ある病気ではネガティブな意味合いで使う単語であっても、他の病気ではポジティブな意味合いで使うことがある。このような病名ごとの使われ方の特性を考慮することで、単語が持つポジティブまたはネガティブの意味合いの傾向を精度よく特定することが可能となる。 As a result, the negative-positive frequency of words used in medical record articles can be obtained by considering how the words are used for each disease name. For example, a word that is used with a negative connotation in one disease may be used with a positive connotation in another disease. By considering the usage characteristics of each disease name, it is possible to accurately identify the tendency of positive or negative connotations of words.
また、情報処理装置101によれば、第2の記憶部720(ネガポジDB240)を参照して、検索された各文書(カルテ情報の記事)に含まれる単語について、診療対象の患者の病名に対応するネガポジ度数を特定し、特定した各文書に含まれる単語のネガポジ度数に基づき、各文書のネガポジ度数を算出することができる。また、情報処理装置101によれば、第2の記憶部720を参照して、検索文字列に含まれる単語について、診療対象の患者の病名に対応するネガポジ度数を特定し、特定した検索文字列に含まれる単語のネガポジ度数に基づき、検索文字列のネガポジ度数を算出することができる。
Further, according to the
これにより、検索文字列やカルテ記事のネガポジ度数を、病名ごとの単語の使われ方を考慮して求めることができ、検索文字列やカルテ記事が持つポジティブまたはネガティブの意味合いの傾向を精度よく特定することが可能となる。 This makes it possible to determine the frequency of negative positives in search strings and medical record articles by taking into consideration the usage of words for each disease name, and accurately identify trends in positive or negative connotations of search strings and medical chart articles. It becomes possible to
これらのことから、実施の形態にかかる情報処理装置101および文書検索システム200によれば、ポジティブまたはネガティブの条件を加味した文書検索を実現することで、ユーザにとって必要な情報をより早く簡単に見つけ出せるようにして、文書検索を行う際の作業効率を向上させることができる。
For these reasons, according to the
なお、本実施の形態で説明した文書検索方法は、予め用意されたプログラムをパーソナル・コンピュータやワークステーション等のコンピュータで実行することにより実現することができる。本文書検索プログラムは、ハードディスク、フレキシブルディスク、CD-ROM、DVD、USBメモリ等のコンピュータで読み取り可能な記録媒体に記録され、コンピュータによって記録媒体から読み出されることによって実行される。また、本文書検索プログラムは、インターネット等のネットワークを介して配布してもよい。 The document retrieval method described in this embodiment can be realized by executing a prepared program on a computer such as a personal computer or a workstation. The document search program is recorded in a computer-readable recording medium such as a hard disk, flexible disk, CD-ROM, DVD, USB memory, etc., and executed by being read from the recording medium by a computer. Also, the document search program may be distributed via a network such as the Internet.
また、本実施の形態で説明した情報処理装置101は、スタンダードセルやストラクチャードASIC(Application Specific Integrated Circuit)などの特定用途向けICやFPGAなどのPLD(Programmable Logic Device)によっても実現することができる。
Further, the
上述した実施の形態に関し、さらに以下の付記を開示する。 Further, the following additional remarks are disclosed with respect to the above-described embodiment.
(付記1)ポジティブまたはネガティブに分類可能な文書を登録した第1の記憶部を参照して、処理対象となる単語について、前記ポジティブまたはネガティブに分類可能な文書それぞれにおける前記単語の出現頻度に基づき、前記単語が持つポジティブまたはネガティブな意味合いの傾向を示す指標値を算出し、
算出した前記指標値を前記単語と対応付けて第2の記憶部に登録する、
処理をコンピュータに実行させることを特徴とする文書検索プログラム。
(Appendix 1) Referring to a first storage unit in which documents that can be classified as positive or negative are registered, a word to be processed is based on the appearance frequency of the word in each of the documents that can be classified as positive or negative. , calculating an index value indicating the tendency of the positive or negative connotation of the word,
registering the calculated index value in a second storage unit in association with the word;
A document search program characterized by causing a computer to execute processing.
(付記2)検索文字列を受け付け、
文書群から前記検索文字列に対応する文書を検索し、
前記検索文字列に対応する1または複数の文書が検索された場合、前記第2の記憶部を参照して、前記1または複数の文書の各文書に含まれる単語に対応する指標値に基づき、前記各文書の指標値を算出し、
前記第2の記憶部を参照して、前記検索文字列に含まれる単語に対応する指標値に基づき、前記検索文字列の指標値を算出し、
算出した前記各文書の指標値と前記検索文字列の指標値とに基づいて、前記検索文字列に対応する検索結果を出力する、
処理を前記コンピュータに実行させることを特徴とする付記1に記載の文書検索プログラム。
(Appendix 2) Receiving a search string,
searching for a document corresponding to the search string from the group of documents;
when one or more documents corresponding to the search character string are retrieved, referring to the second storage unit, based on index values corresponding to words contained in each of the one or more documents, calculating an index value for each of the documents;
referring to the second storage unit and calculating the index value of the search character string based on the index value corresponding to the word included in the search character string;
outputting a search result corresponding to the search character string based on the calculated index value of each document and the index value of the search character string;
The document search program according to
(付記3)前記出力する処理は、
前記各文書の指標値と前記検索文字列の指標値とに基づいて、前記1または複数の文書のうち、前記検索文字列と指標値が近い文書を優先して検索結果として出力する、ことを特徴とする付記2に記載の文書検索プログラム。
(Appendix 3) The process of outputting
Based on the index value of each document and the index value of the search character string, among the one or more documents, a document having an index value close to the search character string is preferentially output as a search result. A document search program according to
(付記4)前記検索文字列の指標値に基づいて、前記検索文字列をポジティブまたはネガティブに分類する、処理を前記コンピュータに実行させ、
前記出力する処理は、
前記検索文字列をポジティブに分類した場合、前記各文書の指標値に基づいて、前記1または複数の文書のうち、ポジティブな意味合いの傾向が強い文書を優先して出力し、
前記検索文字列をネガティブに分類した場合、前記各文書の指標値に基づいて、前記1または複数の文書のうち、ネガティブな意味合いの傾向が強い文書を優先して出力する、
ことを特徴とする付記2に記載の文書検索プログラム。
(Appendix 4) causing the computer to perform a process of classifying the search string as positive or negative based on the index value of the search string;
The output process is
when the search character string is positively classified, based on the index value of each document, priority is given to a document having a strong positive connotation among the one or more documents, and
when the search character string is classified as negative, preferentially outputs a document having a strong negative connotation among the one or more documents based on the index value of each document;
The document search program according to
(付記5)前記各文書の指標値に基づいて、前記各文書の表示態様を決定する、処理を前記コンピュータに実行させ、
前記出力する処理は、
前記各文書を検索結果として出力する際に、決定した前記表示態様で前記各文書を出力する、ことを特徴とする付記2~4のいずれか一つに記載の文書検索プログラム。
(Appendix 5) causing the computer to execute a process of determining a display mode of each document based on the index value of each document;
The output process is
5. The document retrieval program according to any one of
(付記6)前記第1の記憶部に記憶された文書は、患者のカルテ情報であり、前記患者の転帰に応じてポジティブまたはネガティブに分類可能である、ことを特徴とする付記2~5のいずれか一つに記載の文書検索プログラム。 (Appendix 6) Documents stored in the first storage unit are patient chart information, which can be classified as positive or negative according to the outcome of the patient. A document retrieval program according to any one of the above.
(付記7)前記第1の記憶部に記憶された文書は、前記患者の病名に対応付けられており、
前記単語の指標値を算出する処理は、
前記第1の記憶部に記憶された文書のうち、各病名に対応する文書それぞれにおける前記単語の出現頻度に基づき、前記単語が持つポジティブまたはネガティブな意味合いの傾向を示す指標値を算出し、
前記登録する処理は、
算出した前記指標値を、前記単語と前記各病名とに対応付けて前記第2の記憶部に登録する、ことを特徴とする付記6に記載の文書検索プログラム。
(Appendix 7) The document stored in the first storage unit is associated with the disease name of the patient,
The process of calculating the index value of the word includes:
calculating an index value indicating the tendency of the word to have a positive or negative connotation based on the appearance frequency of the word in each document corresponding to each disease name among the documents stored in the first storage unit;
The process of registering
7. The document search program according to
(付記8)前記各文書の指標値を算出する処理は、
前記第2の記憶部を参照して、検索された前記各文書に含まれる単語について、診療対象の患者の病名に対応する指標値を特定し、
特定した前記各文書に含まれる単語の指標値に基づき、前記各文書の指標値を算出し、
前記検索文字列の指標値を算出する処理は、
前記第2の記憶部を参照して、前記検索文字列に含まれる単語について、前記診療対象の患者の病名に対応する指標値を特定し、
特定した前記検索文字列に含まれる単語の指標値に基づき、前記検索文字列の指標値を算出する、ことを特徴とする付記7に記載の文書検索プログラム。
(Appendix 8) The process of calculating the index value of each document is
identifying an index value corresponding to a disease name of a patient to be treated for a word contained in each of the retrieved documents by referring to the second storage unit;
calculating an index value of each of the documents based on the index values of the words contained in each of the identified documents;
The process of calculating the index value of the search character string includes:
referring to the second storage unit to specify an index value corresponding to the disease name of the patient to be treated for the word included in the search character string;
The document search program according to appendix 7, wherein the index value of the search character string is calculated based on the index value of the specified word included in the search character string.
(付記9)前記文書群は、前記第1の記憶部に記憶された文書群である、ことを特徴とする付記2~8のいずれか一つに記載の文書検索プログラム。
(Appendix 9) The document search program according to any one of
(付記10)前記処理対象となる単語は、前記第1の記憶部に記憶された文書に含まれる単語である、ことを特徴とする付記1~9のいずれか一つに記載の文書検索プログラム。
(Appendix 10) The document search program according to any one of
(付記11)ポジティブまたはネガティブに分類可能な文書を登録した第1の記憶部を参照して、処理対象となる単語について、前記ポジティブまたはネガティブに分類可能な文書それぞれにおける前記単語の出現頻度に基づき、前記単語が持つポジティブまたはネガティブな意味合いの傾向を示す指標値を算出し、
算出した前記指標値を前記単語と対応付けて第2の記憶部に登録する、
処理をコンピュータが実行することを特徴とする文書検索方法。
(Appendix 11) Referring to a first storage unit in which documents that can be classified as positive or negative are registered, a word to be processed is based on the appearance frequency of the word in each of the documents that can be classified as positive or negative. , calculating an index value indicating the tendency of the positive or negative connotation of the word,
registering the calculated index value in a second storage unit in association with the word;
A document retrieval method characterized in that processing is executed by a computer.
(付記12)ポジティブまたはネガティブに分類可能な文書を登録した第1の記憶部を参照して、処理対象となる単語について、前記ポジティブまたはネガティブに分類可能な文書それぞれにおける前記単語の出現頻度に基づき、前記単語が持つポジティブまたはネガティブな意味合いの傾向を示す指標値を算出する算出部と、
前記算出部によって算出された前記指標値を前記単語と対応付けて第2の記憶部に登録する登録部と、
を含むことを特徴とする文書検索システム。
(Appendix 12) Referring to a first storage unit in which documents that can be classified as positive or negative are registered, a word to be processed is based on the appearance frequency of the word in each of the documents that can be classified as positive or negative. , a calculation unit that calculates an index value indicating the tendency of the word to have a positive or negative connotation;
a registration unit that associates the index value calculated by the calculation unit with the word and registers the index value in a second storage unit;
A document retrieval system comprising:
101 情報処理装置
110,710 第1の記憶部
120,720 第2の記憶部
111,112 文書
200 文書検索システム
201 クライアント装置
210 ネットワーク
220 病名DB
230 カルテDB
240 ネガポジDB
300 バス
301 CPU
302 メモリ
303 ディスクドライブ
304 ディスク
305 通信I/F
306 可搬型記録媒体I/F
307 可搬型記録媒体
701 第1の受付部
702 算出部
703 登録部
704 第2の受付部
705 検索部
706 決定部
707 出力部
800 ネガポジ件数テーブル
910,1100 キーワード検索画面
920,1000 検索結果画面
921,922,923,924 カルテ記事
931,932,933,934 ネガポジ度数情報
101 information processing device 110,710 first storage unit 120,720 second storage unit 111,112
230 medical record database
240 negative positive DB
300
302
306 portable recording medium I/F
307
Claims (9)
算出した前記指標値を前記単語と対応付けて第2の記憶部に登録し、
検索文字列を受け付け、
文書群から前記検索文字列に対応する文書を検索し、
前記検索文字列に対応する1または複数の文書が検索された場合、前記第2の記憶部を参照して、前記1または複数の文書の各文書に含まれる単語に対応する指標値に基づき、前記各文書の指標値を算出し、
前記第2の記憶部を参照して、前記検索文字列に含まれる単語に対応する指標値に基づき、前記検索文字列の指標値を算出し、
算出した前記各文書の指標値と前記検索文字列の指標値とに基づいて、前記検索文字列に対応する検索結果を出力する、
処理をコンピュータに実行させることを特徴とする文書検索プログラム。 By referring to a first storage unit in which positively classified documents and negatively classified documents are registered, words included in at least one of the positively classified documents and the negatively classified documents calculating an index value indicating the tendency of the word to have a positive or negative connotation based on the appearance frequency of the word in each of the positively classified documents and the negatively classified documents;
registering the calculated index value in a second storage unit in association with the word;
accepts a search string,
searching for a document corresponding to the search string from the group of documents;
when one or more documents corresponding to the search character string are retrieved, referring to the second storage unit, based on index values corresponding to words contained in each of the one or more documents, calculating an index value for each of the documents;
referring to the second storage unit and calculating the index value of the search character string based on the index value corresponding to the word included in the search character string;
outputting a search result corresponding to the search character string based on the calculated index value of each document and the index value of the search character string;
A document search program characterized by causing a computer to execute processing.
前記各文書の指標値と前記検索文字列の指標値とに基づいて、前記1または複数の文書のうち、前記検索文字列と指標値が近い文書を優先して検索結果として出力する、ことを特徴とする請求項1に記載の文書検索プログラム。 The output process is
Based on the index value of each document and the index value of the search character string, among the one or more documents, a document having an index value close to the search character string is preferentially output as a search result. 2. A document search program according to claim 1.
前記出力する処理は、
前記検索文字列をポジティブに分類した場合、前記各文書の指標値に基づいて、前記1または複数の文書のうち、ポジティブな意味合いの傾向が強い文書を優先して出力し、
前記検索文字列をネガティブに分類した場合、前記各文書の指標値に基づいて、前記1または複数の文書のうち、ネガティブな意味合いの傾向が強い文書を優先して出力する、
ことを特徴とする請求項1に記載の文書検索プログラム。 causing the computer to perform a process of classifying the search string as positive or negative based on the index value of the search string;
The output process is
when the search character string is positively classified, based on the index value of each document, priority is given to a document having a strong positive connotation among the one or more documents, and
when the search character string is classified as negative, preferentially outputs a document having a strong negative connotation among the one or more documents based on the index value of each document;
2. The document search program according to claim 1, characterized by:
前記出力する処理は、
前記各文書を検索結果として出力する際に、決定した前記表示態様で前記各文書を出力する、ことを特徴とする請求項1~3のいずれか一つに記載の文書検索プログラム。 causing the computer to execute a process of determining a display mode of each of the documents based on the index value of each of the documents;
The output process is
4. The document retrieval program according to any one of claims 1 to 3, wherein when outputting each document as a retrieval result, each document is output in the determined display mode.
前記単語の指標値を算出する処理は、
前記第1の記憶部に記憶された文書のうち、各病名に対応する文書それぞれにおける前記単語の出現頻度に基づき、前記単語が持つポジティブまたはネガティブな意味合いの傾向を示す指標値を算出し、
前記登録する処理は、
算出した前記指標値を、前記単語と前記各病名とに対応付けて前記第2の記憶部に登録する、ことを特徴とする請求項5に記載の文書検索プログラム。 The document stored in the first storage unit is associated with the disease name of the patient,
The process of calculating the index value of the word includes:
calculating an index value indicating the tendency of the word to have a positive or negative connotation based on the appearance frequency of the word in each document corresponding to each disease name among the documents stored in the first storage unit;
The process of registering
6. The document retrieval program according to claim 5, wherein the calculated index value is associated with the word and each disease name and registered in the second storage unit.
前記第2の記憶部を参照して、検索された前記各文書に含まれる単語について、診療対象の患者の病名に対応する指標値を特定し、
特定した前記各文書に含まれる単語の指標値に基づき、前記各文書の指標値を算出し、
前記検索文字列の指標値を算出する処理は、
前記第2の記憶部を参照して、前記検索文字列に含まれる単語について、前記診療対象の患者の病名に対応する指標値を特定し、
特定した前記検索文字列に含まれる単語の指標値に基づき、前記検索文字列の指標値を算出する、ことを特徴とする請求項6に記載の文書検索プログラム。 The process of calculating the index value of each document includes:
identifying an index value corresponding to a disease name of a patient to be treated for a word contained in each of the retrieved documents by referring to the second storage unit;
calculating an index value of each of the documents based on the index values of the words contained in each of the identified documents;
The process of calculating the index value of the search character string includes:
referring to the second storage unit to specify an index value corresponding to the disease name of the patient to be treated for the word included in the search character string;
7. The document search program according to claim 6, wherein an index value of said search character string is calculated based on an index value of a word included in said specified search character string.
算出した前記指標値を前記単語と対応付けて第2の記憶部に登録し、
検索文字列を受け付け、
文書群から前記検索文字列に対応する文書を検索し、
前記検索文字列に対応する1または複数の文書が検索された場合、前記第2の記憶部を参照して、前記1または複数の文書の各文書に含まれる単語に対応する指標値に基づき、前記各文書の指標値を算出し、
前記第2の記憶部を参照して、前記検索文字列に含まれる単語に対応する指標値に基づき、前記検索文字列の指標値を算出し、
算出した前記各文書の指標値と前記検索文字列の指標値とに基づいて、前記検索文字列に対応する検索結果を出力する、
処理をコンピュータが実行することを特徴とする文書検索方法。 By referring to a first storage unit in which positively classified documents and negatively classified documents are registered, words included in at least one of the positively classified documents and the negatively classified documents calculating an index value indicating the tendency of the word to have a positive or negative connotation based on the appearance frequency of the word in each of the positively classified documents and the negatively classified documents;
registering the calculated index value in a second storage unit in association with the word;
accepts a search string,
searching for a document corresponding to the search string from the group of documents;
when one or more documents corresponding to the search character string are retrieved, referring to the second storage unit, based on index values corresponding to words contained in each of the one or more documents, calculating an index value for each of the documents;
referring to the second storage unit and calculating the index value of the search character string based on the index value corresponding to the word included in the search character string;
outputting a search result corresponding to the search character string based on the calculated index value of each document and the index value of the search character string;
A document retrieval method characterized in that processing is executed by a computer.
前記算出部によって算出された前記指標値を前記単語と対応付けて第2の記憶部に登録する登録部と、
検索文字列を受け付ける受付部と、
文書群から前記受付部が受け付けた前記検索文字列に対応する文書を検索する検索部と、
前記検索部によって前記検索文字列に対応する1または複数の文書が検索された場合、前記第2の記憶部を参照して、前記1または複数の文書の各文書に含まれる単語に対応する指標値に基づき、前記各文書の指標値を算出し、前記第2の記憶部を参照して、前記検索文字列に含まれる単語に対応する指標値に基づき、前記検索文字列の指標値を算出する算出部と、
前記算出部によって算出された前記各文書の指標値と前記検索文字列の指標値とに基づいて、前記検索文字列に対応する検索結果を出力する出力部と、
を含むことを特徴とする文書検索システム。 By referring to a first storage unit in which positively classified documents and negatively classified documents are registered, words included in at least one of the positively classified documents and the negatively classified documents a calculation unit that calculates an index value indicating a tendency of the positive or negative connotation of the word based on the appearance frequency of the word in each of the positively classified documents and the negatively classified documents;
a registration unit that associates the index value calculated by the calculation unit with the word and registers the index value in a second storage unit;
a reception unit that receives a search string;
a search unit that searches for a document corresponding to the search character string received by the reception unit from a group of documents;
index corresponding to words contained in each of the one or more documents by referring to the second storage unit when one or more documents corresponding to the search character string are retrieved by the search unit; calculating the index value of each document based on the value, referring to the second storage unit, and calculating the index value of the search character string based on the index value corresponding to the word included in the search character string a calculation unit for
an output unit configured to output a search result corresponding to the search character string based on the index value of each document and the index value of the search character string calculated by the calculation unit;
A document retrieval system comprising:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018240065A JP7234622B2 (en) | 2018-12-21 | 2018-12-21 | Document retrieval program, document retrieval method and document retrieval system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018240065A JP7234622B2 (en) | 2018-12-21 | 2018-12-21 | Document retrieval program, document retrieval method and document retrieval system |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020102021A JP2020102021A (en) | 2020-07-02 |
JP7234622B2 true JP7234622B2 (en) | 2023-03-08 |
Family
ID=71139630
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018240065A Active JP7234622B2 (en) | 2018-12-21 | 2018-12-21 | Document retrieval program, document retrieval method and document retrieval system |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7234622B2 (en) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2023056971A (en) * | 2021-10-08 | 2023-04-20 | 大塚化学株式会社 | Content processing method and content processing program |
JP7326400B2 (en) * | 2021-10-08 | 2023-08-15 | 大塚化学株式会社 | Content processing method and content processing program |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011198203A (en) | 2010-03-23 | 2011-10-06 | Dainippon Printing Co Ltd | Document classifying device, document classifying method, program, and storage medium |
-
2018
- 2018-12-21 JP JP2018240065A patent/JP7234622B2/en active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011198203A (en) | 2010-03-23 | 2011-10-06 | Dainippon Printing Co Ltd | Document classifying device, document classifying method, program, and storage medium |
Also Published As
Publication number | Publication date |
---|---|
JP2020102021A (en) | 2020-07-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Suominen et al. | Overview of the CLEF eHealth evaluation lab 2018 | |
US7912830B2 (en) | Knowledge portal for accessing, analyzing and standardizing data | |
Topaz et al. | NimbleMiner: an open-source nursing-sensitive natural language processing system based on word embedding | |
Demino et al. | The sensitivity and specificity of nerve conduction studies for diagnosis of carpal tunnel syndrome: a systematic review | |
Koopman et al. | A test collection for matching patients to clinical trials | |
Wang et al. | Comparison of three information sources for smoking information in electronic health records | |
Pinchi et al. | Comparison of the diagnostic accuracy, sensitivity and specificity of four odontological methods for age evaluation in Italian children at the age threshold of 14 years using ROC curves | |
Thelwall | Do Mendeley reader counts indicate the value of arts and humanities research? | |
JP7234622B2 (en) | Document retrieval program, document retrieval method and document retrieval system | |
Fu et al. | Supporting the annotation of chronic obstructive pulmonary disease (COPD) phenotypes with text mining workflows | |
Lachapelle | COVID-19 preprints and their publishing rate: an improved method | |
Pandey et al. | Adverse event extraction from structured product labels using the event-based text-mining of health electronic records (ETHER) system | |
Chamberlin et al. | Evaluation of patient-level retrieval from electronic health record data for a cohort discovery task | |
Pakhomov et al. | Automatic quality of life prediction using electronic medical records | |
Sabancı Baransel et al. | Mapping publication status and exploring hotspots in a research field: Breastfeeding | |
Khalife et al. | The McGill Thyroid Nodule Score's (MTNS+) role in the investigation of thyroid nodules with benign ultrasound guided fine needle aspiration biopsies: a retrospective review | |
Lai et al. | Sensitivity and specificity of artificial intelligence with Microsoft Azure in detecting pneumothorax in emergency department: a pilot study | |
Alfano et al. | Provision of tailored health information for patient empowerment: an initial study | |
Ma et al. | Feasibility of mean platelet volume as a biomarker for chronic obstructive pulmonary disease: A systematic review and meta-analysis | |
Eppig et al. | Mouse genome informatics (MGI) resources for pathology and toxicology | |
Scanff et al. | ‘Nepotistic journals’: a survey of biomedical journals | |
Coombes | Systematic review research in marketing scholarship: Optimizing rigor | |
Singh | Alternative research bibliometrics: it's about quality and not quantity | |
Al Bulushi et al. | A protocol for a systematic review of clinical guidelines and published systematic reviews on the early detection of oral cancer | |
Jones et al. | Upstage rate of complex sclerosing lesions/radial scars |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210909 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220629 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220719 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220909 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20221011 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221130 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230124 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230206 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7234622 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |