JP6930183B2 - 2つのコーディング標準を整合させる方法とシステム - Google Patents

2つのコーディング標準を整合させる方法とシステム Download PDF

Info

Publication number
JP6930183B2
JP6930183B2 JP2017072507A JP2017072507A JP6930183B2 JP 6930183 B2 JP6930183 B2 JP 6930183B2 JP 2017072507 A JP2017072507 A JP 2017072507A JP 2017072507 A JP2017072507 A JP 2017072507A JP 6930183 B2 JP6930183 B2 JP 6930183B2
Authority
JP
Japan
Prior art keywords
mapping
module
code
case
mappings
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017072507A
Other languages
English (en)
Other versions
JP2017215942A (ja
Inventor
ヒュー・ボ
バット・アイシャ ナスィール
バット・アイシャ ナスィール
ガルシア サリナス・ヘスス
ガルシア サリナス・ヘスス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from GBGB1609520.0A external-priority patent/GB201609520D0/en
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of JP2017215942A publication Critical patent/JP2017215942A/ja
Application granted granted Critical
Publication of JP6930183B2 publication Critical patent/JP6930183B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/907Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Library & Information Science (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Description

本発明は、コーディング標準に関し、例えば、参照を容易にするため、複雑な階層システムにおけるエンティティを分類するコーディング標準に関する。
かかる標準は、少数の例を挙げれば、例えば、病気、薬、製品、サービス、自然現象、輸送、研究分野及び製品システムなどの技術分野に関するものであってもよい。多くのコーディング標準が存在し、同じ分野に二以上のコーディング標準が適用されることが多い。競合する標準があってもよく、及び/又はある標準が他の標準より優先されることもある。このような2つの標準の整合(alignment)には、今日のデータが豊富な世界において、コンピュータシステム間でのファクト(facts)のエクスポート、専門家による利用、又はデータベースの更新などの複数のアプリケーションがある。
一例は、共存するモノとサービスに対する競合する分類(classifications)の標準である。eCl@ssは、現在のところ国内的及び国際的に唯一のISO/IEC(International Organization for Standardization/International Electrotechnical Commission)準拠の産業標準である。41,000の製品クラスと約17,000のプロパティを有し、eCl@ssは流通しているモノとサービスの大部分をカバーしている。多くの産業標準(例えば、電子産業、医療技術、建設エンジニアリング、製紙産業、オフィステクノロジーなど)は、産業間共通のポテンシャルを実現する相互運用性(interoperability)を探しており、eCl@ssはそのような相互運用性を提供するものであると言われている。
競合する分類(classification)として、UN Development Programme(UNDP)のためにGS1 USTMにより管理されているUNSPSC(United Nations Standard Products and Services Code
(外1)
Figure 0006930183
)がある。UNSPSCはモノとサービスの効率的かつ正確な分類のための、オープンかつグローバルなマルチセクタ標準(multi−sector standard)である。UNSPSCは、5レベルの階層的分類コードセットを含み、様々なグルーピングレベルにおける支出分析(expenditure analysis)を可能とする。コードセットを上下して、企業分析に必要な、より多くの又は少ない詳細事項(more or less detail)を見ることができる。
その他の符号化方式(coding systems)には、公的機関の契約の主題を記述する、単一の分類方式によるOfficial Journal of the European Union(OJEU)において公開された入札公告の処理を容易にするために開発されたEuropean Union Common Procurement Vocabulary(CPV)があり、バーコードで用いられる標準を提供するGS1(Global Standards One)がある。
製品とサービスに関するこれらの標準を相互参照することは、特に各標準が別々に考えられ、標準におけるクラスとインスタンス(instances)に直接的な相関がない場合に、有用である。
他の例は医療分野である。現在、多くの医療機関では、2つの国際的な疾病分類システムが、歴史的経緯のため同時に、広く使われている。例えば、様々な診療科が、World Health Organisation(WHO)のInternational Classification of Disease(ICD)システムに移行する途上にあるが、大量のレガシー患者データがまだ古いICDシステムを用いて注釈されているということもあり得る。現在使われている2つのシステムはバージョン9(ICD9)とICD10である。同じ患者に診断コードを付すために2つのシステムが用いられていることがあるため、患者が病院の異なる診療科(departments)を訪れるとき、ICD9/10の間の整合(alignment)が必要になる。
しかし、2つの分類システムの間の整合は、たとえ同じ標準化団体により設計されていたとしても、簡単ではない。例えば、ICD10は以前のバージョンと後方互換性がない。例えば、ICD9にはラテラリティ(身体の左右側)フィーチャがないが、ICD10はラテラリティを含み、豊富なコンビネーションコードにより、複雑な疾病をより良く捉えている。このようなセマンティクスの違いにより、2つのバージョン間の整合は不明確になる。例えば、ICD10コードを複数のICD9コードにマッピングし得る場合がある。同様に、1つのICD9コードを、より良い分類のために精密化すると、複数のICD10コードに分類できる場合がある。また、使われなくなったICD分類や、新しく導入されたコードもある。これらすべてにより、整合を取ることが困難なタスクとなる。こうした問題は、医療分野で発展する他の分類/コーディング標準でも共通である。
同じ分野(又は重複する分野)を参照する2つのコーディングシステムを整合させることが望まれる。
本発明の第1の態様の一実施形態によるシステムは、2つのコーディング標準間でコードを整合させるシステムであって、エキスパートマッピングモジュール、構文マッピングモジュール、事例ベースマッピングモジュールと、モジュール調整ユニットと、整合ユニットとを有し、前記エキスパートマッピングモジュールは、インターネットから、及び/又は機械読み取り可能公表物から、2つのコーディング標準のコードのペアの確立されたマッピングを収集するように構成され、前記構文マッピングモジュールは、各コードの記述を含む2つのコーディング標準にアクセスして、前記記述を用いて前記2つのコーディング標準のコードのペアの類似度を求め、構文マッピングを提供するように構成され、前記事例ベースマッピングモジュールは、両方のコーディング標準で注釈された既存のケース(case)にアクセスして、2つのコーディング標準のコードのペアの事例ベースマッピング(case-based mapping)を求めるように構成され、前記モジュール調整ユニットは、前記モジュールからマッピングを集めるように構成され、前記整合ユニットは、コーディング標準の一つからのコードの入力を受け入れ、前記モジュール調整ユニットからの集めたマッピングを用いて、各入力コードから他のコーディング標準のコードへの一以上の好適なマッピングを抽出するように構成されている。
本発明の実施形態による方法、システム、及びコンピュータプログラムは、2つの分類(classification taxonomies)(コーディング標準)間の整合(alignment)を生成することができ、これを、その間にマッピングを提供し、一つの標準のコードを他の標準の一以上のコードと同一視(equate)することにより行うことができる。本発明の実施形態により、別々のマッピングをエキスパートマッピングモジュール、構文マッピングモジュール及び事例ベースマッピングモジュールにより提供できる。異なるモジュールからのマッピングをモジュール調整ユニットにおいて組み合わせる(combined)(集める(aggregated))ことができる。
マッピングは、データによりサポートされている点で好適であり得る。本発明の実施形態によると、整合の確立は、各々が潜在的に確率/信頼度に関連している複数の異種データ源を統合(integrating)することにより行われる。患者記録または製品やサービスの記録など、未処理記録などのアイテムに注釈をするときに、整合(alignment)を利用できる。
好ましい一実施形態では、コーディング標準は医療コーディング標準であり、事例は患者ケースである。異なる好ましい一実施形態では、コーディング標準は製品及びサービスの標準であり、事例は分類された又は分類されるべき製品/サービスである。
様々なモジュールは、生成されたマッピングに、例えば0から1までの、値を与えることができる。1はマッピングの最高レーティングであり、そのマッピングが正しいことが絶対確実であることを示す
一例では、前記エキスパートマッピングモジュールは、確立されたマッピングを確立する一以上の異なる情報源を反映する確立されたマッピングの信頼度を提供するように構成される。すなわち、コーディングシステムを提供している組織のオフィシャルウェブサイトが、未知のインターネットサイトより高い信頼度(confidence value)を有する。
一例では、構文マッピングモジュールは、構文マッピングが文字列間類似性の形式で構文類似性を反映する類似度(similarity value)を提供するように構成される。他の一例では、構文マッピングモジュールは、階層マッピングが文字列間類似性の形式で構文類似性を反映する類似度(similarity value)を提供するように構成される。これらの類似度は組み合わせて使用してもよい。どんな場合でも、類似性評価(similarity valuation)は、各コードの記述の参照として機能するオントロジーを用いても良い。
事例ベースマッピングモジュールは、両方のコーディング標準で注釈された個々の事例に基づいて事例ベースマッピング(case−based mappings)を発見するように構成されていてもよい。事例ベースマッピングモジュールは、両方のコーディング標準で注釈された事例群(cohort of cases)に基づいて事例ベースマッピングを発見するように構成されていてもよい。事例群は事例のポピュレーションの確定された特徴を有し、各事例は複数のコーディング標準の一つで注釈されている。これらの方法のどちらかまたは両方を使用してもよい。
前記事例ベースマッピングモジュールは、第1のコーディング標準のコードの第2のコーディング標準のコードへのマッピングを確認する事例の、前記第1のコーディング標準のコードで注釈された事例の総数に対する割合を反映する、事例ベースマッピングの確率値を提供するように構成されてもよい。
モジュールのどれか又は全部がそのマッピングを時々更新することもできる。一例では、前記エキスパートマッピングモジュール及び/又は前記構文マッピングモジュール及び/又は事例ベースマッピングモジュールは、定期的に、好ましくは、記憶されたメタデータが外部データ源メタデータと異なる場合に、生成されたマッピングを更新する。メタデータは、タイムスタンプでもよく、差があると言えるのは、例えば、タイムスタンプがある閾値時間よりも大きく異なるときである。
モジュール調整ユニットはマッピングを集める(それらを組み合わせる(combine))。モジュール調整ユニットは、任意の好適な方法(例えば、値が0から1までであれば、足して3で割ること)により信頼度、類似度及び確率値を蓄積(accumulate)するように構成されていてもよい。
前記モジュール調整ユニットは、各モジュールからのマッピングにモジュール加重を割り当てるように構成される。すなわち、あるモジュールからの各マッピングは、同じモジュール加重を受けてもよい。これは、次のように、信頼度が低いマッピングを排除するためにシグモイド関数を用いて、モジュールマッピング値と組み合わせられる。例えば:
Figure 0006930183
ここでsim(a,b)はaとbの間の全体的な類似度であり、wはi番目のモジュールの加重であり、simはi番目のモジュールからのマッピング(a,b)の値であり、sigは出力0または1を与えるシグモイド関数であり、nはシグモイド関数のバイアスである。ランクアグリゲーション(rank aggregation)などのさらに別の方法を適用することもできる。
モジュール加重はエンドユーザフィードバック(好ましくは、分野のエキスパートからのもの)に基づいても良い。あるいは、モジュールは、そのモジュールの個々の出力の標準マッピングとの比較に基づいても良い。加重調整は自動化を進めるため機械学習に基づいてもよい。この場合、様々なモジュールの出力は、ユーザフィードバック又はマニュアル生成された整合(標準マッピング)などの基準に対して比較できる。等しい加重値から始めて、整合ユニットは徐々に個々の加重を調整し、ユーザフィードバックまたはラベルされた結果に対する、集めた結果の適合性(fitness of aggregation results)を最大化する。これは典型的な機械学習アプローチである。
整合モジュールについて、このパーツは集められたマッピングから、マッピング結果を抽出する。例えば、整合モジュールは、すべてのマッピングを用いる必要がある入力を受け入れるように構成されていてもよい。
前記整合モジュールは、現在の事例から1つのコードの入力を受け入れ、対応する一以上のコードへの一以上の好適なマッピングを抽出するように構成されてもよい。
前記整合モジュールは、好適なマッピングが見つからなければ、現在のケースに類似した以前のケースに属するマッピングを検索して、候補コードとして、類似した以前のケースのコードを提示するように構成されてもよい。
幾つかのマッピングは、システムにより発見されたものであっても、非常に強いものではないかも知れない。例えば、間違っているかも、または基づくエビデンスが乏しいかも知れない。かかるマッピングは、閾値化を用いて、整合段階(alignment stage)で除外し得る。
例えば、前記整合モジュールは、一以上の好適なマッピングを抽出する候補マッピングのモジュール加重、信頼度、類似度又は確率値のどれか、又はその任意の組み合わせに閾値を適用するように構成されてもよい。一実施形態では、各マッピングに対して、モジュール加重と値の積を、閾値と、及び/又はその他のマッピングと比較されるエンド加重(end weighting)として用いる。マッピングが1より多いモジュールによりサポートされているとき、モジュールごとのエンド加重は合計され、閾値と比較される。集められた複数のモジュールの加重が所定閾値より大きくなければ、マッピング/整合は、破棄されるか、他のものが考慮又は処理されるまで、低い優先度が与えられる。
本発明の第2の態様の一実施形態による方法は、2つのコーディング標準間でコードを整合する、コンピュータ実施の方法であって、インターネットから、及び/又は機械読み取り可能公表物から、2つのコーディング標準のコードのペアの確立されたマッピングを収集することと、各コードの記述を含む2つのコーディング標準にアクセスして、前記記述を用いて前記2つのコーディング標準のコードのペアの類似度を求め、構文マッピングを提供することと、両方のコーディング標準で注釈された既存のケースにアクセスして、2つのコーディング標準のコードのペアの事例ベースマッピングを求めることと、各モジュールからマッピングを集めることと、コーディング標準の一つからのコードの入力を受け入れ、前記モジュール調整ユニットからの集めたマッピングを用いて、各入力コードから他のコーディング標準のコードへの一以上の好適なマッピングを抽出することとを含む。
注釈された事例がほんの少ししかない場合、事例ベースマッピングモジュールにはより低い加重(weighting)を与えるだけでもよい。
本発明の第3の態様の一実施形態による方法は、計算デバイスで実行されたとき、前記計算デバイスに上記の方法を実行させるコンピュータプログラムであり得る。
本発明の好ましい実施形態による装置又はコンピュータプログラムは、システムの態様の任意の組み合わせを含み得る。さらに別の実施形態による方法又はコンピュータ製品は、処理及びメモリ機能を要するという点でコンピュータにより実装されたものと言える。
好ましい実施形態による装置は、特定の機能を実行するように構成されているか、または単に実行することになっているとして説明することができる。この構成または配置は、ハードウェアまたはミドルウェアまたは任意の他の適切なシステムの使用によって行うことができる。好ましい実施形態では、構成または配置はソフトウェアによるものである。
したがって、1つの態様によれば、少なくとも1つのコンピュータにロードされると、先行する装置定義のいずれかまたはそれらの任意の組み合わせに従って装置となるようにそのコンピュータを構成するプログラムが提供される。
さらなる態様によれば、少なくとも1つのコンピュータにロードされたときに、前述の方法定義のいずれかまたはそれらの任意の組み合わせにしたがって方法ステップを実行するように少なくとも1つのコンピュータを構成するプログラムが提供される。
一般に、コンピュータは、定義された機能を提供するように構成または配置されているとして列挙された要素を含むことができる。例えば、このコンピュータは、メモリ、処理、およびネットワークインターフェースを含むことができる。
本発明は、デジタル電子回路、またはコンピュータハードウェア、ファームウェア、ソフトウェア、またはそれらの組み合わせで実施することができる。本発明は、1つ以上のハードウェアモジュールを実行する、またはその動作を制御する、コンピュータプログラムまたはコンピュータプログラム製品、すなわち、例えば機械可読記憶装置または伝搬信号などの非一時的情報担体に有形的に具現化されたコンピュータプログラムとして実施することができる。
コンピュータプログラムは、スタンドアロンプログラム、コンピュータプログラム部分または複数のコンピュータプログラムの形式であってもよく、コンパイルまたはインタプリタされた言語を含む任意の形式のプログラミング言語で記述することができ、スタンドアロンプログラムとして、またはモジュール、コンポーネント、サブルーチン、またはデータ処理環境での使用に適した他のユニットを含む任意の形式で展開することができる。コンピュータプログラムは、1つのモジュール上で、または1つのサイトの複数のモジュール上で実行されるように、または複数のサイトにわたって分散され、通信ネットワークによって相互接続されるように展開することができる。
本発明の方法ステップは、コンピュータプログラムを実行して、入力データに作用して出力を生成することにより本発明の機能を実行する一以上のプログラム可能プロセッサにより実行できる。本発明の装置は、プログラムされたハードウェアとして、または例えばFPGA(フィールドプログラマブルゲートアレイ)またはASIC(特定用途向け集積回路)を含む特殊用途論理回路として実施することができる。
コンピュータプログラムの実行に適したプロセッサは、例えば、特定目的及び汎用のマイクロプロセッサと、任意種類のデジタルコンピュータの任意一以上のプロセッサとを両方とも含む。一般的に、プロセッサは読み取り専用メモリまたはランダムアクセスメモリから命令またはデータまたはその両方を受け取る。コンピュータの必須要素は、命令及びデータを記憶する一以上のメモリデバイスに結合した、命令を実行するプロセッサである。
本発明は、特定の実施形態に関して説明される。他の実施形態も下記の請求項の範囲に入る。例えば、本発明のステップは、異なる順序で実行されても、依然として望ましい結果を達成することができる。オブジェクト指向プログラミング技術を使用せずに、複数のテストスクリプトバージョンを1つのユニットとして編集して呼び出すことができる。例えば、スクリプトオブジェクトの要素を構造化データベースまたはファイルシステムに編成することができ、スクリプトオブジェクトによって実行されると説明される動作を、テスト制御プログラムによって実行することができる。
本発明の要素は、用語「モジュール」および「ユニット」を使用して記載されており、同様に「手段」として説明することができる。当業者には言うまでもなく、このような機能的用語およびそれらの均等物は、空間的に分離されているが、結合して、確定された機能を果たすシステムの部分を指すことができる。同様に、システムの同じ物理的部分は、確定された二以上の機能を提供することができる。
例えば、別個に確定された手段は、必要に応じて同じメモリおよび/またはプロセッサを使用して実装することができる。
添付した図面を参照して、単なる例示により、本発明の好ましい特徴をここに説明する。
本発明の一般的な実施形態におけるメインシステムコンポーネントを示すブロック図である。 一般的な実施形態における方法を示すフローチャートである。 本発明の一実施形態により生成される、ICD9とICD10との間のm−mマッピングを示す図である。 本発明の医療関係の実施形態におけるメインシステムコンポーネントを示すブロック図である。 構文整合(syntactical alignment)からから得られる候補をどう微調整(refine)できるかの一例を示す図である。 図5の例における処理のフローの一例を示す図である。 整合部における処理を示すフロー図である。 本発明の実施形態を実装する好適なハードウェアを示す図である。
図1は、様々なデータ源からのマッピングを提供する3つのモジュールを含むシステム10を示す図である。
エキスパートマッピングモジュール20は、文献60から、及びインターネットから、マッピングを読み出す。例えば、製品とサービスの実施形態の場合、エキスパートマッピングモジュールが、http://www.cmap.euなどの情報源を参照してもよい。
構文マッピング(syntactical mapping)30は、分類80、90自体からマッピングを読み出す。事例ベースマッピング40は、履歴事例/記録データベースからマッピングを読み出す。例えば、同じ製品と、2以上のコーディングシステムにおけるその分類(classification)とを含むデータベースが設けても良い。
これらのモジュールは、計算資源が許容すれば、新しいマッピングをシステムに含めるため、定期的に実行されてもよいし、所定間隔で実行されてもよい。
一般的に、各モジュールに対してデーモンサブモジュール(daemon submodule)を設け、データを(必要に応じて)「臨機応変に(on the fly)」更新することもできる。デーモンサブモジュールは、選択されたデータ源のリストからメタデータを定期的に収集する。デーモンサブモジュールは、最新のメタデータをローカルキャッシュと比較して、差分を検出し、差分があるとき、又は(例えば、前の更新から経過した時間)差分が大きいとき、外部データ源にクエリ(query)し、新しく読み出したマッピングデータをローカルストレージに記憶し、ローカルキャッシュを更新し、新しい更新を登録(register)することができる。デーモンサブモジュールは、自分のモジュール内の他のサブモジュール及びその他のモジュール及び/又はユニットに、かかる更新について通知できる。
これらのモジュールはすべて結果をモジュール調整ユニットに供給する。モジュール調整ユニットは、マッピングを集め、例えば、様々なデータ源から見つけたマッピングを追加する。マッピングの確実性を示す値が提供される場合、それを組み合わせて、異なるモジュールに同じマッピングが見つかったときの全体的な値を与えても良い。あるいは、値を別々に扱ってもよい。この段階において、3つの異なるモジュールのマッピングは、異なる加重を与えられてもよい。例えば、幾つかの場合には、前に付されたラベルが不正確であった可能性もあり、事例ベースマッピングに与えられるモジュール加重は低い場合がある。
整合ユニット(alignment unit)110において、マッピングは、モジュール加重及び/又は個々のマッピングの値に基づいて、有意な(significant)マッピングのみを保持する閾値を用いて、または最も有意な1つのマッピングを保持する比較を用いて、個別に、又はブロックとして、又は全マッピングとして、必要に応じて抽出される。
情報源情報システムISへの任意的リンクにより、(ある製品の記録などの)ケースの他の複数のケースとの直接的な比較ができ、その製品に関連する1つのシステムにおけるコードと、その情報源情報システム中の、同様の製品に関連する他の標準のコードとの間のマッピングが見つかる場合がある。マッピングモジュールが十分な結果を生成しない場合、かかる比較がされる。
履歴事例データベース100と情報源(source)情報システム120は別々に示したが、同じシステム/データベースであってもよい。
130は、コンピュータを介した、コードなどのユーザ入力を表す。入力コンピュータは離れたところにあってもよい。
図2は一般的な方法の実施形態を示す。ステップS10において、確立されたマッピングが、例えば文献/インターネットから収集される。ステップS20において、2つの標準がアクセスされ、構文マッピング(syntactic mapping)を与える構文の類似度(syntactic similarity)が発見される。ステップS30において、既存の事例データを用いて、事例ベースマッピングを生成する。ステップS40において、これらのマッピングが集められる。最後に、ステップS50において、一以上の入力コードに基づいて、マッピングが抽出される。
図3は、ICD9の一部とICD10の一部との間のマッピングを示し、これらは抽出され、表示されたものである。これはインターラクティブなユーザインターフェースとして提供されてもよく、2つの標準間の完全なマッピングの一部または全部を表示する。例えば、コード上でマウスを動かすと、他のコーディング標準の対応するコードがハイライトされる。
図4に示した具体的な実施形態は、様々な情報源からエビデンスを収集することを試み、2つの医療分類システムICD9とICD10との間の最も正確かつ最も新しい整合を提供する。これは詳細な例として受け取られ、当業者には言うまでもなく、他のコーディングシステムの整合システム(alignment system)は、具体的な分野に必要な適合をすれば、基本的に同じ方法を用い、同じ構成を有する。
このシステムは次のコンポーネントよりなる:
A. 3つのモジュール、すなわちエキスパートマッピング取り込み(expert mapping ingestion)モジュール20、構文マッピング(syntactical mapping)モジュール30、及び事例ベースマッピングモジュール40を含む入力データ処理ユニット。
B. 様々な入力モジュールの加重を学習する加重調整モジュール50。
C. ICD9コードで注釈(annotated)された患者事例に、可能性のあるICD10コードをプロンプト(prompt)する整合割当モジュール(alignment assignment module)110。
データ源は、左に、文献60及びWWW70を含み、右に、履歴患者データベース100及び病院情報120を含む。簡単のため、図4において、右の2つのデータ源は結合され(merge)、1つのデータ源として設けられてもよい。すなわち、履歴患者データベースと病院ISを1つの病院情報システムとしてもよい。
《医療分類整合システムの詳細》
一般に、この実施形態のシステムは、データ取込モジュール(data ingestion module)、加重調整モジュール、及び整合微調整ユニット(alignment refinement unit)を含み、すべて医療分野に適合されている。詳細は以下の通りである。
《データ源》
他の実施形態と同様に、目的は異種情報源からのデータの収集であり、可能性として次を含む:
i. 専門家の意見として公表された医療文献。コード整合をマイニング(mining)するときに、PubMedなどの出版リポジトリを用いることができる。かかる結果は、ジャーナルの評判及びその出版物がピアレビューされているかなどの事実に基づいて計算される信頼度に関連付けることができる。
ii. 確立された医療オントロジー。そのようなオントロジーは、普通は、大規模な国際的コラボレーションの結果である。すでに、ある程度、セマンティクス(semantics)と表現に関して、実施者間の合意を反映している。直接的なマッピング/整合は必ずしも得られないが、そのようなオントロジーは、両方のICDバージョンを投影して間接的な整合を推測する基準として機能し得る。
iii. 専門家の意見の補助的情報源としてのWorld Wide Web。マッピングを利用するとき、考慮しなければならない、様々な権威による、資金提供された又は自主的な努力として、マッピング結果を公表しているウェブサイトがある。
iv. 構文マッピング(syntactical mapping)計算への入力としてのICD9とICD10分類システム。説明を伴う完全なコーディングシステムが必要である。
v. 両方のコーディングシステムで注釈された患者事例のみを提供するように、すでに処理された可能性を有する患者履歴事例(historical patient cases)。これは、1つの組織で、又は1つのケースに関して複数の組織にわたって、複数のコーディングシステムが同時に用いられる場合である。このマッピングにより、1つの診断コーディングシステムにおける患者ケースが、他のコーディングシステムで注釈され得る。
《A. データ入力ユニット》
マッピング構成モジュールは、さらに3つの専用サブコンポーネントであって各々が特定タイプのデータ源にフォーカスしたサブコンポーネントにさらに分割できる。この区別は主に、データ源の性質と、かかるデータ源を処理するのに必要な技術とによる。サブコンポーネントは、エキスパートマッピング取込モジュール、構文マッピングモジュール(syntactical mapping module)、及び事例ベースマッピングモジュールである。
1. エキスパートマッピング取込モジュールは、主に、既存の文献から、又はインターネットから、理論的に確立されたマッピングを収集する(上記の(i)、(ii)及び(iii))。ICD10の公表以来、それを以前のバージョンと整合(align)させる努力が為されてきた。これは依然として継続中の作業であるが、初期の結果は活用できる。ICD9/10の整合に関する研究は為されているが、問題が容易に解決することを意味するものではない。エキスパートマッピングは非常に主観的であり議論の余地があり、長期にわたる精査が必要である。
基本的なテキスト分析手法を適用して、かかるエキスパートマッピングからコンピュータが理解可能なフォーミュラ(formulae)を抽出することができる。例えば、ICD9コードとICD10コードを用いてマッピングを確立することができ、他方、データ源の評判(reputation)と認証(authentication)を用いて、抽出されたマッピングに信頼値を付与することができる。
幾つかの公式なウェブサイトは、かかる情報を、分野の専門家(domain experts)により為されたマニュアルマッピング/整合として公表している。これらがどのタイプの公表であるかに関して制約はない。通常、抽出には、一定の、所定言語パターン(linguistic patterns)を用いる。
かかるモジュールの結果は三つ組(triple)
Figure 0006930183
であり、ICD9とICD10はそれぞれ異なる分類システムのコードであり、cはかかる対応を肯定または否定する異なる情報源(ウェブサイト、研究論文など)を考慮した集約された信頼値(aggregated confidence value)である。
ある具体的な例は図3のマッピングを用いる。中間結果は(291.0, F10.231, c1)または(291.0, F10.233, c2)であり、それぞれは使用した情報源に基づき集約された信頼値を含む。これは、モジュール加重調整において、後述のように、他のモジュールからの結果により、さらに微調整(refinement)される。
2. 構文マッピング(syntactical mapping)は、文字列間類似度尺度(string similarity measures)を適用して、分類自体から任意のICD9/10コードの類似度を比較する(上記の(iv))。各ICDコードにはコード説明(code descriptions)が付されている。かかる説明はコード整合(code alignment)の貴重な手がかりとなり得る。実際、広い範囲で使われているテキスト類似度尺度、例えばSimple Edit Distance、Jaro−Winkler Distanceなどを用いることができる。文字列間類似度/距離ソフトウェアは多数あり、当業者には知られている。かかる尺度(measurements)を改良/微調整するために、様々な言語のICDコード説明を入力の一部として用いることもできる。一方、ICDコードの階層構造は、子レベルに明示されている親に関する記述を見なければならない。例えば、ICD9 011.01の記述は
Figure 0006930183
の通りである。
各コーディングレベルについて、ショートコード(short codes)に関連する記述がある。構文類似性(syntactical similarity)を計算する時は、(下位レベルの記述を上位レベルの記述に付加することにより)すべての記述を単に連結して、分類階層(taxonomy hierarchies)を保持できる。
かかる情報の多くが半構造化データフォーマットで公表されている(その一部は、XMLフォーマットまたはRDFフォーマットの機械が理解できるタグで適宜ラベルされてさえいる)。一例を挙げると
Figure 0006930183
の通りである。
連結されると、拡張された記述の類似度は、診断コードの幾つかの階層的セマンティックス(hierarchical semantics)を反映し得る。実際の文字列間類似度をマッピングの信頼度として計算することができる。
一方、その他の技術、例えば階層ベースの類似度伝搬(hierarchy−based similarity propagation)などを適用することもできる。例えば、ICDコードの2つのトップレベル(aとb)が類似度スコアxで整合されるとき、2つのサブコード(a’とb’)の類似度は
Figure 0006930183
として計算できる。ここで、dep()はコード階層におけるコードの深さを与える。
また、セマンティック改良された整合(semantic enriched alignment)のため、確立されたオントロジーモデル(例えば、UMLS)を活用することも可能である。例えば、構文整合(syntactical alignment)から得られた候補を、図5及び図6に示すように、オントロジーモデルを中間言語(interlingua)または基準として用いて、精密化することができる。
これらの図において、医療オントロジー中の概念は、両方のICDバージョンの診断コードをアンカリング(anchor)する基準として機能し得る。
ICD9コードは、好適な候補をスクリーニングするため、ステップS100において、選択されたICD10コードのセットに対してシンタックス整合(syntax alignments)される。これらの候補は、ステップS120において、オントロジーベースの微調整(refinement)にかけられ、ステップS130で微調整(refine)される。同様に、ICD10コードから始めて、ステップS130の前に、ステップS100と、ステップS110のオントロジーベースの微調整を用いる。
このモジュールの出力は、類似度を有する整合
Figure 0006930183
であってもよく、sは類似度(similarlity value)である。
3. 事例ベースマッピングは、両方のコーディングシステムで注釈された既存の患者ケースから類似度を引き出す(上記リストの(v))。前述の通り、1つの医療機関で両方のコーディングシステムが使われているという現象はよくあることである。それらは、以前はICD9コードに割当られたが、今はICD10コードを付されたケースである。これは、患者が同じ症状を訴えて再入院または再通院することにより、又は患者が同じ疾患(disorder episode)のレビューまたは再評価を受けた場合であり得る。患者の進行タイムラインを、その患者のすべての来院にわたり、各来院で割り当てられたICDコードとともに確立できるとき、事例ベース整合(case−based alignment)を確立できる。例えば、患者が、その最初の来院中に011.01と分類され、その後、ICD10を用いてA15.0を割り当てられた場合、整合〈〈ICD9:011.01〉,〈ICD10:A15.0〉,p〉のエビデンスが得られた(established)と言える。かかる整合の信頼または確率レベルpは、かかる整合の確率に基づいて得られ、その整合を確認する事例の数の、そのICD9コードにより注釈された事例の総数に対する比率を計算して得られる。この場合、確率には方向性があり、ICD9からICD10へのマッピングの場合には〈〈ICD9:011.01〉,〈ICD10:A15.0〉,p〉であり、逆の場合には〈〈ICD10:A15.0〉,〈ICD9:011.01〉,p’〉であり、p=p’は保証されない。
例えば、ICD9 xxxで注釈された100事例のうち、60事例がICD10 A15.0で注釈された場合、ICD9 xxxからICD10 A15.0へのマッピングの確率は0.6であると結論できるが、その逆は言えない。
しかし、事例ベースマッピングには幾つかの制約がある。両方のコードが、同じ疾患に対して、又は長期の病気の同一の発現(same episode)に対して用いられなければならない。何回かの試行錯誤(heuristics)を用いて決定を導くことができる。第1に、ICD9コードとICD10コードの期間が、好ましくは同じ来院であり、例えば同じケースリファレンス又は同じ(電子的)医療記録インスタンスであることが好ましい。幾つかのLTC(長期疾患(Long Term Condition))の場合は長期スパンをカバーできることに留意されたい。第2に、コードが同様の症状に割り当てられないとならない。あるグループの症状が他のグループの症状と互換であるか決定するとき、症状オントロジーが役に立つ。
1人の患者の整合に対する制約を、より多くの亜母集団ベースの整合(more sub−population based alignment)に緩和することが可能である。すなわち、整合を1人の患者にアンカリング(anchoring)する替わりに、同じ人口学的特徴(demographic characteristics)を有する患者の群(cohort)を用いることもできる。これは個々の患者のデータが少ない又は歪曲されているときに特に有用である。年齢、性別、学歴、経済的背景、主症状などの主特性を用いて患者の類似度を計算できる。類似した人口学的特徴と類似した症状を有する二人の患者が、それぞれICD9とICD10で注釈(annotated)されているとき、2つのコードの間には何らかの対応関係があると推測できる。
《B. モジュール加重調整》
個々のマッピングツールからの出力としての整合候補(alignment candidates)は、モジュール加重調整モジュールにより集められる。モジュール加重調整ユニットは、どのマッピングツールがより信頼できるかも決定する。加重は、同じ初期値が自動的に割り当てられてもよいし、異なる初期値が分野の専門家により割り当てられてもよい。加重(weight)は、前出の信頼度、確率、類似度の値とは異なる。
加重は様々な方法で調整できる。可能性として、機械学習を用い、3つのモジュールすべてに対して同じ加重値(weight value)から始め:
1. 加重調整はエンドユーザからのフィードバックに基づいてもよい。すべての候補のうち、ヒトのその分野の専門家(human domain experts)は、自分の個人的選択(personal preference)に基づいて最良のものを選択できる。単純な多数決原理、またはボルダ方式などの他の投票集約方法(vote aggregation methods)に基づき、人数ベースの決定をすることもできる。
2. 加重は、その分野の専門家によりマニュアル生成された標準的マッピングを用いて学習することもできる。調整モジュールは、どのモジュールが他のモジュールよりも高い加重を割り当てられるか、このモジュールの出力が専門家の選択にどれだけ近いかに基づき、決定できる。
《C. 整合割当モジュール》
このモジュールは、前段のモジュールからのマッピングを利用して、患者記録に適用する。このモジュールは、閾値を適用して、入力診断コードに対して、最も有望なマッピング候補を抽出できる。これは、図7に示したように、簡単に行え、HIS(病院情報システム)におけるケースのマッピングを生成できる。これは、病院データベースからの患者データ、ほとんどが患者事例データと注釈データを指す。
最初にステップS140においてコードが抽出され、ステップS150においてマッピングを用いて候補を検索する。ステップS160において、少なくとも1つの好適なマッピングがあれば、ステップS170において、最良の候補が出力される。
強く整合した候補(strong alignment candidates)がなければ(ステップS160でNO)、システムはまず代替的なソリューションを検索することができる(S180)。類似した状況(類似した人口学的特徴と、同じ症状又は非常に互換性のある症状(再び、症状オントロジーに基づく))であり、ICDコードを有する患者を特定するように試みる。仮定として、このように類似した患者を特定することにより(S190でYES)、ステップS200で、患者のコードを、異なるバージョンからのICDコードの対応として、「借りる」ことができる。類似した患者事例はメモリ又は一時的ディスクファイルに記憶できる。基本的に、ステップS140における「コードを抽出」は、患者事例から他の情報も読み出せる。ロードされたこれらの事例は、HIS(病院情報システム)中の事例と比較される。
このプロセスが失敗すると(S190でNO)、システムは、対応が見つからず、ヒトによる入力が必要であると結論する。
本システムはマッピング方法(mapping methodology)を生成する。何らかのダイナミズムが望ましく、1つのコーディングシステムから他のコーディングシステムへの、事前に計算された完全なマッピングは静的であり、それゆえ理想的ではない。また、一対一の厳密なマッピングは無い。これらの場合に、最上位にランクされたもの、又は加重閾値より上の一群の候補を、ユーザに(例えば、整合されたコードの(マッピング)ペアのRDFグラフから取った三組(triple)の、個々のモジュールの信頼度を平均した、又は別々にリストしたフォーマットで)提示してもよい。
ユーザクエリは次の形式を取ることができる:
a. すべてのマッピングを読み出す:この場合、(例えば、信頼値と一緒の、2つの標準中のすべてのコード間の)現在集められているマッピングは、整合のスナップショットとなり、プレインテキストフォーマット「icd9x, icd10y, confidence」または図3に示したように、インターラクティブなユーザインターフェース(UI)として、ユーザに配信される。
b. 個々のマッピングを読み出す:この場合、UIは患者記録を表示できる。ユーザは、例えば、診断コード(例えば、ICD9コード)を右クリックして、コンテキストメニュー(context menu)を表示させ、例えば、「ICD10コードで(In ICD10 Code)」メニューアイテムを選択する。個々の変換のため、その他の無関係のコード整合も更新され得る。
図8は、データストレージサーバなどの計算デバイスを示すブロック図である。この計算デバイスは本発明を具現化し、一実施形態によるコードシステム間のマッピング方法を実装するのに使われても良い。計算デバイスは、プロセッサ993と、ここに説明するモジュールの機能をプロセッサ993に実行させるメモリ994とを有する。任意的に、計算デバイスは、他の計算デバイスと、例えば本発明の実施形態の計算デバイスと通信するネットワークインターフェース997も含む。
例えば、一実施形態は、かかる計算デバイスのネットワークより構成されていてもよい。任意的に、計算デバイスは、キーボードとマウス996などの一以上の入力メカニズムと、一以上のモニタ995などのディスプレイユニットとも含む。コンポーネントはバス992を介して互いに接続可能である。
メモリ994はコンピュータ読み取り可能媒体を含む。この用語は、例えば、コンピュータ実行可能命令を担い、又はその中にデータ構造を格納するように構成された1つの媒体又は複数の媒体(例えば、集中型または分散型データベース及び/又は関連するキャッシュ及びサーバ)を指す。コンピュータ実行可能命令は、例えば、命令とデータであって、汎用コンピュータ、特殊用途コンピュータ、又は特殊用途プロセッサデバイス(例えば、一以上のプロセッサ)によりアクセス可能であり、これらに一以上の機能又は動作を実行させ、かつ本発明の実施形態のマッピングを実行させるものを含んでもよい。このように、「コンピュータ読み取り可能記憶媒体」との用語は、そのマシンにより実行される一組の命令を記憶、エンコード、または担うことができ、そのマシンに、本開示の方法のいずれかを実行させる任意の媒体を含む。したがって、「コンピュータ読み取り可能記憶媒体」との用語は、固体メモリ、光媒体及び磁気媒体を含むが、これらに限定されない。限定ではなく例として、かかるコンピュータ読み取り可能媒体は、非一時的コンピュータ読み取り可能記憶媒体を含む、ランダムアクセスメモリ(RAM)、リードオンリーメモリ(ROM)、電気的消去可能プログラマブルリードオンリーメモリ(EEPROM)、コンパクトディスクリードオンリーメモリ(CD−ROM)又はその他の光ディスク記憶媒体、磁気ディスク記憶媒体又はその他の磁気記憶デバイス、フラッシュメモリデバイス(例えば、固体メモリデバイス)を含む。
プロセッサ993は、計算デバイスを制御し、処理動作を実行し、例えば、本明細書と特許請求の範囲に説明し、図1ないし4に示した、エキスパートマッピングモジュール、構文マッピングモジュール、事例ベースマッピングモジュール、モジュール加重調整ユニット、及び整合ユニットなどの様々な機能を実装するようにメモリに記憶されたコードを実行するように構成されている。メモリ994はプロセッサ993により読み書きされるデータを格納する。本明細書に説明するように、プロセッサは、マイクロプロセッサ、中央処理装置などの一以上の汎用処理デバイスを含んでも良い。プロセッサは、例えば、CISC(complex instruction set computing)マイクロプロセッサ、RISC(reduced instruction set computing)マイクロプロセッサ、VLIW(very long instruction word)マイクロプロセッサ、他の命令セットを実装したプロセッサ、又は複数の命令セットの組み合わせを実装したプロセッサを含む。プロセッサは、例えば、一以上の特殊用途処理デバイス、例えば特定用途集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、デジタル信号プロセッサ(DSP)、ネットワークプロセッサなどを含む。一以上の実施形態では、プロセッサは、本明細書で説明される動作及びステップを実行する命令を実行するように構成されている。
ディスプレイユニット997は、例えば、中間マッピングや最終的マッピングなどの、計算デバイスにより記憶されたデータを、信頼度(confidence values)と共に、又はそれ無しに、又は図3に示したようにグラフ形式で、表示する。また、ディスプレイユニットは、例えば、カーソル及びダイアローグボックス及びスクリーンを表示して、ユーザと、計算デバイスに記憶されたプログラム及びデータとの間のインターラクションを可能にする。入力メカニズム996は、例えば、ユーザが計算デバイスにデータ及び命令を入力できるようにする。
ネットワークインターフェース(ネットワークI/F)997は、例えば、インターネットなどのネットワークに接続され、図1ないし4に示したようにデータベースへの接続を提供する。ネットワークインターフェース997は、ネットワークを介して他の計算デバイスに接続可能である。ネットワークI/F997は、例えば、ネットワークを介して他の装置との間でのデータ入出力を制御する。マイクロホン、スピーカ、プリンタ、パワーサプライ、ファン、ケース、スキャナー、トラッカーボールなどの他の周辺デバイスが計算デバイスに含まれても良い。
エキスパートマッピング取込モジュールは、例えば、メモリ994の一部に格納された処理命令を含み、プロセッサ993がその処理命令を実行し、処理命令の実行中、メモリ994の一部が、例えば、信頼度(confidence values)を有する三つ組(triples)の形式で、中間結果を記憶する。エキスパートマッピング取込モジュールの出力は、例えば、各々が確立されたマッピングを具現化し、信頼度(confidence values)を含む三つ組であり、メモリ994及び/又は接続された記憶ユニットに記憶され、加重調整モジュールに転送される。
構文マッピングモジュール(syntactical mapping module)は、例えば、メモリ994の一部に格納された処理命令を含み、プロセッサ993がその処理命令を実行し、処理命令の実行中、メモリ994の一部が、例えば、類似度(similarity values)を有する三つ組(triples)の形式で、中間結果を記憶する。構文モジュールの出力は、例えば、各々が事例ベースのマッピングを具現化し、類似度(similarity values)を含む三つ組であり、メモリ994及び/又は接続された記憶ユニットに記憶され、加重調整モジュールに転送される。
事例ベースマッピングモジュールは、例えば、メモリ994の一部に格納された処理命令を含み、プロセッサ993がその処理命令を実行し、処理命令の実行中、メモリ994の一部が、例えば、確率値(probability values)を有する三つ組(triples)の形式で、中間結果を記憶する。事例ベースマッピングモジュールの出力は、例えば、各々が事例ベースのマッピングを具現化し、確率値(probability values)を含む三つ組であり、メモリ994及び/又は接続された記憶ユニットに記憶され、加重調整モジュールに転送される。
モジュール加重調整ユニットは、例えば、メモリ994の一部に格納された処理命令を含み、プロセッサ993がその処理命令を実行し、処理命令の実行中、メモリ994の一部が、例えば、複数のモジュールからの信頼度/類似度/確率値と三つ組(triples)を記憶する。2つの標準のコードのペアと、潜在的に組み合わせられた加重との形式の、集められた整合候補は、例えば、メモリ994及び/又は接続された記憶ユニットに格納され、整合ユニットに転送されてもよい。
整合ユニットは、例えば、メモリ994の一部に格納された処理命令を含み、プロセッサ993がその処理命令を実行し、処理命令の実行中、メモリ994の一部が、例えば、最終的マッピング候補を記憶する。最も見込みのあるマッピング候補は、メモリ994及び/又は接続された記憶ユニットに格納されてもよく、ディスプレイ995でユーザに表示されてもよい。
本発明を具現化する方法は、図2及び図7に示した方法のように、図8に示すような計算デバイスにおいて実行されてもよい。かかる計算デバイスは、図8に示したすべてのコンポーネントを有する必要はなく、それらのコンポーネントの一部により構成されてもよい。本発明を実施する方法は、ネットワークを介して一以上のデータ記憶サーバと通信する1つの計算デバイスにより実行されてもよい。計算デバイスは、結果のマッピング及び中間結果を記憶するデータストレージ自体であってもよい。
本発明を具現化する方法は、互いに協働する複数の計算デバイスにより実行されてもよい。複数の計算デバイスのうちの一以上は、結果として得られるマッピングの少なくとも一部を記憶するデータストレージサーバであってもよい。
2より多いコーディングシステム間のマッピングは、ペアごとの整合により得ることができる。すなわち、2より多いコーディングシステムの場合、同じ手順を適用でき、異なるコーディングシステム間のマッピングは大部分が独立である。
《発明の実施形態の主な特徴》
実施形態は、多くの医療機関で同時に大規模に使われているICD9システムとICD10システムなどの2つのコーディングシステム間の、包括的な事例ベースの整合を提供することを目的とする。本システムは、異種の情報源からのデータを収集して、機械利用可能(machine consumable)な知識を抽出し、かかる整合を確立する。かかる整合は、2つの技術、すなわち、最新のオンライン情報源及びオンライン公表から臨機応変にマッピングを抽出すること、及び使用ベース整合(usage−based alignment)として、注釈された患者ケース/記録からマッピングを求める(emerging)ことで最新のものに保たれる。
《主な利点》
2つのICDコーディングシステム間のマッピングはもともと複雑である。これは、医療分野以外にも広く使われているコーディングシステム間のマッピング/整合についても言える。実施形態は次の主利益を有する:
1. 広い範囲で使われる2つの(潜在的には2より多い)コーディングシステム間の最新の整合。
2. 使用セマンティックス(usage semantics)、構文特徴(syntactic features)、及び確立された理論を用いて、異種の情報源からのエビデンスを用いる整合。
本発明の実施形態の方法は、2つの異なるコーディングシステムにより注釈された十分なデータセットが取得でき、(事例ベースマッピングモジュールによる)使用ベースマッピングをサポートできる限り、コーディングシステムの整合に適用できる。
なお、以下に付記する。
(付記1) 2つのコーディング標準間でコードを整合させるシステムであって、
エキスパートマッピングモジュール、構文マッピングモジュール、事例ベースマッピングモジュールと、
モジュール調整ユニットと、
整合ユニットとを有し、
前記エキスパートマッピングモジュールは、インターネットから、及び/又は機械読み取り可能公表物から、2つのコーディング標準のコードのペアの確立されたマッピングを収集するように構成され、
前記構文マッピングモジュールは、各コードの記述を含む2つのコーディング標準にアクセスして、前記記述を用いて前記2つのコーディング標準のコードのペアの類似度を求め、構文マッピングを提供するように構成され、
前記事例ベースマッピングモジュールは、両方のコーディング標準で注釈された既存のケースにアクセスして、2つのコーディング標準のコードのペアの事例ベースマッピングを求めるように構成され、
前記モジュール調整ユニットは、エキスパートマッピングモジュール、構文マッピングモジュール、事例ベースマッピングモジュールからマッピングを集めるように構成され、
前記整合ユニットは、コーディング標準の一つからのコードの入力を受け入れ、前記モジュール調整ユニットからの集めたマッピングを用いて、各入力コードから他のコーディング標準のコードへの一以上の好適なマッピングを抽出するように構成されている、
システム。
(付記2) 前記エキスパートマッピングモジュールは、確立されたマッピングを確立する一以上の異なる情報源を反映する確立されたマッピングの信頼度を提供するように構成される、
付記1に記載のシステム。
(付記3) 前記構文マッピングモジュールは、構文マッピングの類似度を提供し、文字列間類似度の形式で構文類似度を反映する、及び/又は各コードの記述の参照として機能するオントロジーを用いる、付記1または2に記載のシステム。
(付記4) 前記構文マッピングモジュールは、構文マッピングの類似度を提供し、階層類似度の形式で構文類似度を反映する、及び/又は各コードの記述の参照として機能するオントロジーを用いる、
付記1ないし3いずれか一項に記載のシステム。
(付記5) 前記事例ベースマッピングモジュールは、両方のコーディング標準で注釈された個々のケースに基づき、及び/又は、各ケースがコーディング標準の一つで注釈された、ケースのポピュレーションの確定された特徴を有する両方のコーディング標準で注釈されたケース群に基づき、事例ベースマッピングを探すように構成される、
付記1ないし4いずれか一項に記載のシステム。
(付記6) 前記事例ベースマッピングモジュールは、第1のコーディング標準のコードの第2のコーディング標準のコードへのマッピングを確認する事例の、前記第1のコーディング標準のコードで注釈された事例の総数に対する割合を反映する、事例ベースマッピングの確率値を提供するように構成される、
付記1ないし5いずれか一項に記載のシステム。
(付記7) 前記エキスパートマッピングモジュール及び/又は前記構文マッピングモジュール及び/又は事例ベースマッピングモジュールは、定期的に、好ましくは、記憶されたメタデータが外部データ源メタデータと異なる場合に、生成されたマッピングを更新する、
付記1ないし6いずれか一項に記載のシステム。
(付記8) 前記モジュール調整ユニットは、信頼度、類似度、及び確率値を集めるように構成される、
付記1ないし7いずれか一項に記載のシステム。
(付記9) 前記モジュール調整ユニットは、各モジュールからのマッピングにモジュール加重を割り当てるように構成される、付記1ないし8いずれか一項に記載のシステム。
(付記10) モジュール加重は、エンドユーザフィードバック、好ましくは分野の専門家からのフィードバックに基づき、及び/又はモジュール加重は、前記モジュールの個々の出力の、標準的マッピングとの比較に基づく、付記1ないし9いずれか一項に記載のシステム。
(付記11) 前記整合ユニットは、現在の事例から1つのコードの入力を受け入れ、対応する一以上のコードへの一以上の好適なマッピングを抽出するように構成される、
付記1ないし10いずれか一項に記載のシステム。
(付記12) 前記整合ユニットは、好適なマッピングが見つからなければ、現在のケースに類似した以前のケースに属するマッピングを検索して、候補コードとして、類似した以前のケースのコードを提示するように構成される、付記11に記載のシステム。
(付記13) 前記整合ユニットは、一以上の好適なマッピングを抽出する候補マッピングのモジュール加重、信頼度、類似度又は確率値のどれか、又はその任意の組み合わせに閾値を適用するように構成される、付記1ないし12いずれか一項に記載のシステム。
(付記14) 2つのコーディング標準間でコードを整合する方法であって、
インターネットから、及び/又は機械読み取り可能公表物から、2つのコーディング標準のコードのペアの確立されたマッピングを収集することと、
各コードの記述を含む2つのコーディング標準にアクセスして、前記記述を用いて前記2つのコーディング標準のコードのペアの類似度を求め、構文マッピングを提供することと、
両方のコーディング標準で注釈された既存のケースにアクセスして、2つのコーディング標準のコードのペアの事例ベースマッピングを求めることと、
各モジュールからマッピングを集めることと、
コーディング標準の一つからのコードの入力を受け入れ、各モジュールから集めたマッピングを用いて、各入力コードから他のコーディング標準のコードへの一以上の好適なマッピングを抽出することを含む、
方法。
(付記15) 計算デバイスで実行されたとき、前記計算デバイスに付記14に記載の方法を実行させるコンピュータプログラム。
20 エキスパートマッピング
30 構文マッピング
40 事例ベースマッピング
50 モジュール調整ユニット
60 文献
80 標準1
90 標準2
100 事例履歴データベース
110 整合
120 情報源IS

Claims (15)

  1. 2つのコーディング標準間でコードを整合させるシステムであって、
    エキスパートマッピングモジュール、構文マッピングモジュール、事例ベースマッピングモジュールと、
    モジュール調整ユニットと、
    整合ユニットとを有し、
    前記エキスパートマッピングモジュールは、インターネットから、及び/又は機械読み取り可能公表物から、2つのコーディング標準のコードのペアの確立されたマッピングを収集するように構成され、
    前記構文マッピングモジュールは、各コードの記述を含む2つのコーディング標準にアクセスして、前記記述を用いて前記2つのコーディング標準のコードのペアの類似度を求め、構文マッピングを提供するように構成され、
    前記事例ベースマッピングモジュールは、両方のコーディング標準で注釈された既存のケースにアクセスして、2つのコーディング標準のコードのペアの事例ベースマッピングを求めるように構成され、
    前記モジュール調整ユニットは、エキスパートマッピングモジュール、構文マッピングモジュール、事例ベースマッピングモジュールからマッピングを集めるように構成され、
    前記整合ユニットは、コーディング標準の一つからのコードの入力を受け入れ、前記モジュール調整ユニットからの集めたマッピングを用いて、各入力コードから他のコーディング標準のコードへの一以上の好適なマッピングを抽出するように構成されている、
    システム。
  2. 前記エキスパートマッピングモジュールは、確立されたマッピングを確立する一以上の異なる情報源を反映する確立されたマッピングの信頼度を提供するように構成される、
    請求項1に記載のシステム。
  3. 前記構文マッピングモジュールは、構文マッピングの類似度を提供し、文字列間類似度の形式で構文類似度を反映する、及び/又は各コードの記述の参照として機能するオントロジーを用いる、請求項1または2に記載のシステム。
  4. 前記構文マッピングモジュールは、構文マッピングの類似度を提供し、階層類似度の形式で構文類似度を反映する、及び/又は各コードの記述の参照として機能するオントロジーを用いる、
    請求項1ないし3いずれか一項に記載のシステム。
  5. 前記事例ベースマッピングモジュールは、両方のコーディング標準で注釈された個々のケースに基づき、及び/又は、各ケースがコーディング標準の一つで注釈された、ケースのポピュレーションの確定された特徴を有する両方のコーディング標準で注釈されたケース群に基づき、事例ベースマッピングを探すように構成される、
    請求項1ないし4いずれか一項に記載のシステム。
  6. 前記事例ベースマッピングモジュールは、第1のコーディング標準のコードの第2のコーディング標準のコードへのマッピングを確認する事例の、前記第1のコーディング標準のコードで注釈された事例の総数に対する割合を反映する、事例ベースマッピングの確率値を提供するように構成される、
    請求項1ないし5いずれか一項に記載のシステム。
  7. 前記エキスパートマッピングモジュール及び/又は前記構文マッピングモジュール及び/又は事例ベースマッピングモジュールは、定期的に、好ましくは、記憶されたメタデータが外部データ源メタデータと異なる場合に、生成されたマッピングを更新する、
    請求項1ないし6いずれか一項に記載のシステム。
  8. 前記モジュール調整ユニットは、信頼度、類似度、及び確率値を集めるように構成される、
    請求項1ないし7いずれか一項に記載のシステム。
  9. 前記モジュール調整ユニットは、各モジュールからのマッピングにモジュール加重を割り当てるように構成される、請求項1ないし8いずれか一項に記載のシステム。
  10. 前記モジュール加重は、エンドユーザフィードバック、好ましくは分野の専門家からのフィードバックに基づき、及び/又はモジュールの個々の出力の、標準的マッピングとの比較に基づく、請求項に記載のシステム。
  11. 前記整合ユニットは、現在の事例から1つのコードの入力を受け入れ、対応する一以上のコードへの一以上の好適なマッピングを抽出するように構成される、
    請求項1ないし10いずれか一項に記載のシステム。
  12. 前記整合ユニットは、好適なマッピングが見つからなければ、現在のケースに類似した以前のケースに属するマッピングを検索して、候補コードとして、類似した以前のケースのコードを提示するように構成される、請求項11に記載のシステム。
  13. 前記整合ユニットは、一以上の好適なマッピングを抽出する候補マッピングのモジュール加重、信頼度、類似度又は確率値のどれか、又はその任意の組み合わせに閾値を適用するように構成される、請求項1ないし12いずれか一項に記載のシステム。
  14. 2つのコーディング標準間でコードを整合させるシステムにおける方法であって、前記システムは、エキスパートマッピングモジュールと、構文マッピングモジュールと、事例ベースマッピングモジュールと、モジュール調整ユニットと、整合ユニットとを有し、
    前記エキスパートマッピングモジュールが、インターネットから、及び/又は機械読み取り可能公表物から、2つのコーディング標準のコードのペアの確立されたマッピングを収集することと、
    前記構文マッピングモジュールが、各コードの記述を含む2つのコーディング標準にアクセスして、前記記述を用いて前記2つのコーディング標準のコードのペアの類似度を求め、構文マッピングを提供することと、
    前記事例ベースマッピングモジュールが、両方のコーディング標準で注釈された既存のケースにアクセスして、2つのコーディング標準のコードのペアの事例ベースマッピングを求めることと、
    前記モジュール調整ユニットが、各モジュールからマッピングを集めることと、
    前記整合ユニットが、コーディング標準の一つからのコードの入力を受け入れ、各モジュールから集めたマッピングを用いて、各入力コードから他のコーディング標準のコードへの一以上の好適なマッピングを抽出することを含む、
    方法。
  15. 計算デバイスで実行されたとき、前記計算デバイスに請求項14に記載の方法を実行させるコンピュータプログラム。
JP2017072507A 2016-05-31 2017-03-31 2つのコーディング標準を整合させる方法とシステム Active JP6930183B2 (ja)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
GB1609520.0 2016-05-31
GBGB1609520.0A GB201609520D0 (en) 2016-05-31 2016-05-31 A method and system to align two coding standards
DE102016209492 2016-05-31
DE102016209492.0 2016-05-31
EP16203859.0A EP3252620A1 (en) 2016-05-31 2016-12-13 A method and system to align two coding standards
EP16203859.0 2016-12-13

Publications (2)

Publication Number Publication Date
JP2017215942A JP2017215942A (ja) 2017-12-07
JP6930183B2 true JP6930183B2 (ja) 2021-09-01

Family

ID=57569939

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017072507A Active JP6930183B2 (ja) 2016-05-31 2017-03-31 2つのコーディング標準を整合させる方法とシステム

Country Status (3)

Country Link
US (1) US10650030B2 (ja)
EP (1) EP3252620A1 (ja)
JP (1) JP6930183B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108629046B (zh) * 2018-05-14 2023-08-18 平安科技(深圳)有限公司 一种字段匹配方法及终端设备
KR102021782B1 (ko) * 2019-01-09 2019-09-17 한국과학기술정보연구원 건축물 용도 코드 맵핑 장치 및 그 방법
CN113723056B (zh) * 2021-08-19 2024-07-16 杭州火树科技有限公司 Icd编码转化方法、装置、计算设备和存储介质

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3130285B2 (ja) * 1998-04-10 2001-01-31 株式会社亀田医療情報研究所 医療用コード変換装置及びプログラムを記録した機械読み取り可能な媒体
JP2002230342A (ja) * 2000-12-01 2002-08-16 Portal Corp 電子商取引仲介方法、システム、記録媒体、データベースおよびコンピュータプログラム
US20020198739A1 (en) * 2001-01-05 2002-12-26 Lau Lee Min Matching and mapping clinical data to a standard
US20050091200A1 (en) 2003-10-23 2005-04-28 Microsoft Corporation System and method for taxonomy branch matching
US7822769B2 (en) 2006-08-31 2010-10-26 Rivet Software, Inc. Analysis of financial and business information based on interactive data
US8732197B2 (en) 2007-02-02 2014-05-20 Musgrove Technology Enterprises Llc (Mte) Method and apparatus for aligning multiple taxonomies
US20100274821A1 (en) 2009-04-22 2010-10-28 Microsoft Corporation Schema Matching Using Clicklogs
US20110010195A1 (en) * 2009-07-08 2011-01-13 Steven Charles Cohn Medical history system
US8346804B2 (en) * 2010-11-03 2013-01-01 General Electric Company Systems, methods, and apparatus for computer-assisted full medical code scheme to code scheme mapping
US8452773B1 (en) 2011-08-05 2013-05-28 EMC Corporations Mapping terms between multiple taxonomies
US9262506B2 (en) 2012-05-18 2016-02-16 International Business Machines Corporation Generating mappings between a plurality of taxonomies
US9898582B2 (en) * 2013-06-14 2018-02-20 Syntel, Inc. System and method for analyzing an impact of a software code migration
US10133727B2 (en) 2013-10-01 2018-11-20 A-Life Medical, Llc Ontologically driven procedure coding
US10554990B2 (en) * 2013-10-14 2020-02-04 Nokia Technologies Oy Apparatus, a method and a computer program for video coding and decoding
US10205965B2 (en) * 2013-10-15 2019-02-12 Nokia Technologies Oy Video encoding and decoding
US11488690B2 (en) 2014-02-21 2022-11-01 Intelligent Medical Objects, Inc. System and method for problem list reconciliation in an electronic medical record

Also Published As

Publication number Publication date
US20170344623A1 (en) 2017-11-30
US10650030B2 (en) 2020-05-12
JP2017215942A (ja) 2017-12-07
EP3252620A1 (en) 2017-12-06

Similar Documents

Publication Publication Date Title
US12080429B2 (en) Methods and apparatus for providing guidance to medical professionals
MacLean et al. Identifying medical terms in patient-authored text: a crowdsourcing-based approach
US20200265931A1 (en) Systems and methods for coding health records using weighted belief networks
del Carmen Legaz-García et al. A semantic web based framework for the interoperability and exploitation of clinical models and EHR data
Wright et al. A method and knowledge base for automated inference of patient problems from structured data in an electronic medical record
US10176541B2 (en) Medical information navigation engine (MINE) system
Goeuriot et al. Overview of the CLEF eHealth evaluation lab 2020
US20170235888A1 (en) Systems and Methods for Creating Contextualized Summaries of Patient Notes from Electronic Medical Record Systems
US8666785B2 (en) Method and system for semantically coding data providing authoritative terminology with semantic document map
US20140365239A1 (en) Methods and apparatus for facilitating guideline compliance
US10372822B2 (en) Automated timeline completion using event progression knowledge base
US10755197B2 (en) Rule-based feature engineering, model creation and hosting
US10936962B1 (en) Methods and systems for confirming an advisory interaction with an artificial intelligence platform
US20240053307A1 (en) Identifying Repetitive Portions of Clinical Notes and Generating Summaries Pertinent to Treatment of a Patient Based on the Identified Repetitive Portions
JP6930183B2 (ja) 2つのコーディング標準を整合させる方法とシステム
US20210272038A1 (en) Healthcare Decision Platform
Fang et al. Combining human and machine intelligence for clinical trial eligibility querying
US11308128B2 (en) Refining classification results based on glossary relationships
US20190333612A1 (en) Identifying Repetitive Portions of Clinical Notes and Generating Summaries Pertinent to Treatment of a Patient Based on the Identified Repetitive Portions
Sedghi et al. Mining clinical text for stroke prediction
Alvarez et al. Application of the spreading activation technique for recommending concepts of well-known ontologies in medical systems
Naseer et al. An improved hybrid model for cardiovascular disease detection using machine learning in IoT
Afzal et al. KnowledgeButton: an evidence adaptive tool for CDSS and clinical research
Fenz et al. De-identification of unstructured paper-based health records for privacy-preserving secondary use
Tang et al. A clustering algorithm based on document embedding to identify clinical note templates

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200115

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20201207

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210112

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210312

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210713

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210726

R150 Certificate of patent or registration of utility model

Ref document number: 6930183

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150