JP6930183B2

JP6930183B2 - ２つのコーディング標準を整合させる方法とシステム

Info

Publication number: JP6930183B2
Application number: JP2017072507A
Authority: JP
Inventors: ヒュー・ボ; バット・アイシャナスィール; ガルシアサリナス・ヘスス
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2016-05-31
Filing date: 2017-03-31
Publication date: 2021-09-01
Anticipated expiration: 2037-03-31
Also published as: US20170344623A1; US10650030B2; JP2017215942A; EP3252620A1

Description

本発明は、コーディング標準に関し、例えば、参照を容易にするため、複雑な階層システムにおけるエンティティを分類するコーディング標準に関する。

かかる標準は、少数の例を挙げれば、例えば、病気、薬、製品、サービス、自然現象、輸送、研究分野及び製品システムなどの技術分野に関するものであってもよい。多くのコーディング標準が存在し、同じ分野に二以上のコーディング標準が適用されることが多い。競合する標準があってもよく、及び／又はある標準が他の標準より優先されることもある。このような２つの標準の整合（ａｌｉｇｎｍｅｎｔ）には、今日のデータが豊富な世界において、コンピュータシステム間でのファクト（ｆａｃｔｓ）のエクスポート、専門家による利用、又はデータベースの更新などの複数のアプリケーションがある。

一例は、共存するモノとサービスに対する競合する分類（ｃｌａｓｓｉｆｉｃａｔｉｏｎｓ）の標準である。ｅＣｌ＠ｓｓは、現在のところ国内的及び国際的に唯一のＩＳＯ／ＩＥＣ（ＩｎｔｅｒｎａｔｉｏｎａｌＯｒｇａｎｉｚａｔｉｏｎｆｏｒＳｔａｎｄａｒｄｉｚａｔｉｏｎ／ＩｎｔｅｒｎａｔｉｏｎａｌＥｌｅｃｔｒｏｔｅｃｈｎｉｃａｌＣｏｍｍｉｓｓｉｏｎ）準拠の産業標準である。４１，０００の製品クラスと約１７，０００のプロパティを有し、ｅＣｌ＠ｓｓは流通しているモノとサービスの大部分をカバーしている。多くの産業標準（例えば、電子産業、医療技術、建設エンジニアリング、製紙産業、オフィステクノロジーなど）は、産業間共通のポテンシャルを実現する相互運用性（ｉｎｔｅｒｏｐｅｒａｂｉｌｉｔｙ）を探しており、ｅＣｌ＠ｓｓはそのような相互運用性を提供するものであると言われている。

競合する分類（ｃｌａｓｓｉｆｉｃａｔｉｏｎ）として、ＵＮＤｅｖｅｌｏｐｍｅｎｔＰｒｏｇｒａｍｍｅ（ＵＮＤＰ）のためにＧＳ１ＵＳ^ＴＭにより管理されているＵＮＳＰＳＣ（ＵｎｉｔｅｄＮａｔｉｏｎｓＳｔａｎｄａｒｄＰｒｏｄｕｃｔｓａｎｄＳｅｒｖｉｃｅｓＣｏｄｅ
（外１）

）がある。ＵＮＳＰＳＣはモノとサービスの効率的かつ正確な分類のための、オープンかつグローバルなマルチセクタ標準（ｍｕｌｔｉ−ｓｅｃｔｏｒｓｔａｎｄａｒｄ）である。ＵＮＳＰＳＣは、５レベルの階層的分類コードセットを含み、様々なグルーピングレベルにおける支出分析（ｅｘｐｅｎｄｉｔｕｒｅａｎａｌｙｓｉｓ）を可能とする。コードセットを上下して、企業分析に必要な、より多くの又は少ない詳細事項（ｍｏｒｅｏｒｌｅｓｓｄｅｔａｉｌ）を見ることができる。

その他の符号化方式（ｃｏｄｉｎｇｓｙｓｔｅｍｓ）には、公的機関の契約の主題を記述する、単一の分類方式によるＯｆｆｉｃｉａｌＪｏｕｒｎａｌｏｆｔｈｅＥｕｒｏｐｅａｎＵｎｉｏｎ（ＯＪＥＵ）において公開された入札公告の処理を容易にするために開発されたＥｕｒｏｐｅａｎＵｎｉｏｎＣｏｍｍｏｎＰｒｏｃｕｒｅｍｅｎｔＶｏｃａｂｕｌａｒｙ（ＣＰＶ）があり、バーコードで用いられる標準を提供するＧＳ１（ＧｌｏｂａｌＳｔａｎｄａｒｄｓＯｎｅ）がある。

製品とサービスに関するこれらの標準を相互参照することは、特に各標準が別々に考えられ、標準におけるクラスとインスタンス（ｉｎｓｔａｎｃｅｓ）に直接的な相関がない場合に、有用である。

他の例は医療分野である。現在、多くの医療機関では、２つの国際的な疾病分類システムが、歴史的経緯のため同時に、広く使われている。例えば、様々な診療科が、ＷｏｒｌｄＨｅａｌｔｈＯｒｇａｎｉｓａｔｉｏｎ（ＷＨＯ）のＩｎｔｅｒｎａｔｉｏｎａｌＣｌａｓｓｉｆｉｃａｔｉｏｎｏｆＤｉｓｅａｓｅ（ＩＣＤ）システムに移行する途上にあるが、大量のレガシー患者データがまだ古いＩＣＤシステムを用いて注釈されているということもあり得る。現在使われている２つのシステムはバージョン９（ＩＣＤ９）とＩＣＤ１０である。同じ患者に診断コードを付すために２つのシステムが用いられていることがあるため、患者が病院の異なる診療科（ｄｅｐａｒｔｍｅｎｔｓ）を訪れるとき、ＩＣＤ９／１０の間の整合（ａｌｉｇｎｍｅｎｔ）が必要になる。

しかし、２つの分類システムの間の整合は、たとえ同じ標準化団体により設計されていたとしても、簡単ではない。例えば、ＩＣＤ１０は以前のバージョンと後方互換性がない。例えば、ＩＣＤ９にはラテラリティ（身体の左右側）フィーチャがないが、ＩＣＤ１０はラテラリティを含み、豊富なコンビネーションコードにより、複雑な疾病をより良く捉えている。このようなセマンティクスの違いにより、２つのバージョン間の整合は不明確になる。例えば、ＩＣＤ１０コードを複数のＩＣＤ９コードにマッピングし得る場合がある。同様に、１つのＩＣＤ９コードを、より良い分類のために精密化すると、複数のＩＣＤ１０コードに分類できる場合がある。また、使われなくなったＩＣＤ分類や、新しく導入されたコードもある。これらすべてにより、整合を取ることが困難なタスクとなる。こうした問題は、医療分野で発展する他の分類／コーディング標準でも共通である。

同じ分野（又は重複する分野）を参照する２つのコーディングシステムを整合させることが望まれる。

本発明の第１の態様の一実施形態によるシステムは、２つのコーディング標準間でコードを整合させるシステムであって、エキスパートマッピングモジュール、構文マッピングモジュール、事例ベースマッピングモジュールと、モジュール調整ユニットと、整合ユニットとを有し、前記エキスパートマッピングモジュールは、インターネットから、及び／又は機械読み取り可能公表物から、２つのコーディング標準のコードのペアの確立されたマッピングを収集するように構成され、前記構文マッピングモジュールは、各コードの記述を含む２つのコーディング標準にアクセスして、前記記述を用いて前記２つのコーディング標準のコードのペアの類似度を求め、構文マッピングを提供するように構成され、前記事例ベースマッピングモジュールは、両方のコーディング標準で注釈された既存のケース（case）にアクセスして、２つのコーディング標準のコードのペアの事例ベースマッピング（case-based mapping）を求めるように構成され、前記モジュール調整ユニットは、前記モジュールからマッピングを集めるように構成され、前記整合ユニットは、コーディング標準の一つからのコードの入力を受け入れ、前記モジュール調整ユニットからの集めたマッピングを用いて、各入力コードから他のコーディング標準のコードへの一以上の好適なマッピングを抽出するように構成されている。

本発明の実施形態による方法、システム、及びコンピュータプログラムは、２つの分類（ｃｌａｓｓｉｆｉｃａｔｉｏｎｔａｘｏｎｏｍｉｅｓ）（コーディング標準）間の整合（ａｌｉｇｎｍｅｎｔ）を生成することができ、これを、その間にマッピングを提供し、一つの標準のコードを他の標準の一以上のコードと同一視（ｅｑｕａｔｅ）することにより行うことができる。本発明の実施形態により、別々のマッピングをエキスパートマッピングモジュール、構文マッピングモジュール及び事例ベースマッピングモジュールにより提供できる。異なるモジュールからのマッピングをモジュール調整ユニットにおいて組み合わせる（ｃｏｍｂｉｎｅｄ）（集める（ａｇｇｒｅｇａｔｅｄ））ことができる。

マッピングは、データによりサポートされている点で好適であり得る。本発明の実施形態によると、整合の確立は、各々が潜在的に確率／信頼度に関連している複数の異種データ源を統合（ｉｎｔｅｇｒａｔｉｎｇ）することにより行われる。患者記録または製品やサービスの記録など、未処理記録などのアイテムに注釈をするときに、整合（ａｌｉｇｎｍｅｎｔ）を利用できる。

好ましい一実施形態では、コーディング標準は医療コーディング標準であり、事例は患者ケースである。異なる好ましい一実施形態では、コーディング標準は製品及びサービスの標準であり、事例は分類された又は分類されるべき製品／サービスである。

様々なモジュールは、生成されたマッピングに、例えば０から１までの、値を与えることができる。１はマッピングの最高レーティングであり、そのマッピングが正しいことが絶対確実であることを示す
一例では、前記エキスパートマッピングモジュールは、確立されたマッピングを確立する一以上の異なる情報源を反映する確立されたマッピングの信頼度を提供するように構成される。すなわち、コーディングシステムを提供している組織のオフィシャルウェブサイトが、未知のインターネットサイトより高い信頼度（ｃｏｎｆｉｄｅｎｃｅｖａｌｕｅ）を有する。

一例では、構文マッピングモジュールは、構文マッピングが文字列間類似性の形式で構文類似性を反映する類似度（ｓｉｍｉｌａｒｉｔｙｖａｌｕｅ）を提供するように構成される。他の一例では、構文マッピングモジュールは、階層マッピングが文字列間類似性の形式で構文類似性を反映する類似度（ｓｉｍｉｌａｒｉｔｙｖａｌｕｅ）を提供するように構成される。これらの類似度は組み合わせて使用してもよい。どんな場合でも、類似性評価（ｓｉｍｉｌａｒｉｔｙｖａｌｕａｔｉｏｎ）は、各コードの記述の参照として機能するオントロジーを用いても良い。

事例ベースマッピングモジュールは、両方のコーディング標準で注釈された個々の事例に基づいて事例ベースマッピング（ｃａｓｅ−ｂａｓｅｄｍａｐｐｉｎｇｓ）を発見するように構成されていてもよい。事例ベースマッピングモジュールは、両方のコーディング標準で注釈された事例群（ｃｏｈｏｒｔｏｆｃａｓｅｓ）に基づいて事例ベースマッピングを発見するように構成されていてもよい。事例群は事例のポピュレーションの確定された特徴を有し、各事例は複数のコーディング標準の一つで注釈されている。これらの方法のどちらかまたは両方を使用してもよい。

前記事例ベースマッピングモジュールは、第１のコーディング標準のコードの第２のコーディング標準のコードへのマッピングを確認する事例の、前記第１のコーディング標準のコードで注釈された事例の総数に対する割合を反映する、事例ベースマッピングの確率値を提供するように構成されてもよい。

モジュールのどれか又は全部がそのマッピングを時々更新することもできる。一例では、前記エキスパートマッピングモジュール及び／又は前記構文マッピングモジュール及び／又は事例ベースマッピングモジュールは、定期的に、好ましくは、記憶されたメタデータが外部データ源メタデータと異なる場合に、生成されたマッピングを更新する。メタデータは、タイムスタンプでもよく、差があると言えるのは、例えば、タイムスタンプがある閾値時間よりも大きく異なるときである。

モジュール調整ユニットはマッピングを集める（それらを組み合わせる（ｃｏｍｂｉｎｅ））。モジュール調整ユニットは、任意の好適な方法（例えば、値が０から１までであれば、足して３で割ること）により信頼度、類似度及び確率値を蓄積（ａｃｃｕｍｕｌａｔｅ）するように構成されていてもよい。

前記モジュール調整ユニットは、各モジュールからのマッピングにモジュール加重を割り当てるように構成される。すなわち、あるモジュールからの各マッピングは、同じモジュール加重を受けてもよい。これは、次のように、信頼度が低いマッピングを排除するためにシグモイド関数を用いて、モジュールマッピング値と組み合わせられる。例えば：

ここでｓｉｍ（ａ，ｂ）はａとｂの間の全体的な類似度であり、ｗ_ｉはｉ番目のモジュールの加重であり、ｓｉｍ_ｉはｉ番目のモジュールからのマッピング（ａ，ｂ）の値であり、ｓｉｇ_ｉは出力０または１を与えるシグモイド関数であり、ｎはシグモイド関数のバイアスである。ランクアグリゲーション（ｒａｎｋａｇｇｒｅｇａｔｉｏｎ）などのさらに別の方法を適用することもできる。

モジュール加重はエンドユーザフィードバック（好ましくは、分野のエキスパートからのもの）に基づいても良い。あるいは、モジュールは、そのモジュールの個々の出力の標準マッピングとの比較に基づいても良い。加重調整は自動化を進めるため機械学習に基づいてもよい。この場合、様々なモジュールの出力は、ユーザフィードバック又はマニュアル生成された整合（標準マッピング）などの基準に対して比較できる。等しい加重値から始めて、整合ユニットは徐々に個々の加重を調整し、ユーザフィードバックまたはラベルされた結果に対する、集めた結果の適合性（ｆｉｔｎｅｓｓｏｆａｇｇｒｅｇａｔｉｏｎｒｅｓｕｌｔｓ）を最大化する。これは典型的な機械学習アプローチである。

整合モジュールについて、このパーツは集められたマッピングから、マッピング結果を抽出する。例えば、整合モジュールは、すべてのマッピングを用いる必要がある入力を受け入れるように構成されていてもよい。

前記整合モジュールは、現在の事例から１つのコードの入力を受け入れ、対応する一以上のコードへの一以上の好適なマッピングを抽出するように構成されてもよい。

前記整合モジュールは、好適なマッピングが見つからなければ、現在のケースに類似した以前のケースに属するマッピングを検索して、候補コードとして、類似した以前のケースのコードを提示するように構成されてもよい。

幾つかのマッピングは、システムにより発見されたものであっても、非常に強いものではないかも知れない。例えば、間違っているかも、または基づくエビデンスが乏しいかも知れない。かかるマッピングは、閾値化を用いて、整合段階（ａｌｉｇｎｍｅｎｔｓｔａｇｅ）で除外し得る。

例えば、前記整合モジュールは、一以上の好適なマッピングを抽出する候補マッピングのモジュール加重、信頼度、類似度又は確率値のどれか、又はその任意の組み合わせに閾値を適用するように構成されてもよい。一実施形態では、各マッピングに対して、モジュール加重と値の積を、閾値と、及び／又はその他のマッピングと比較されるエンド加重（ｅｎｄｗｅｉｇｈｔｉｎｇ）として用いる。マッピングが１より多いモジュールによりサポートされているとき、モジュールごとのエンド加重は合計され、閾値と比較される。集められた複数のモジュールの加重が所定閾値より大きくなければ、マッピング／整合は、破棄されるか、他のものが考慮又は処理されるまで、低い優先度が与えられる。

本発明の第２の態様の一実施形態による方法は、２つのコーディング標準間でコードを整合する、コンピュータ実施の方法であって、インターネットから、及び／又は機械読み取り可能公表物から、２つのコーディング標準のコードのペアの確立されたマッピングを収集することと、各コードの記述を含む２つのコーディング標準にアクセスして、前記記述を用いて前記２つのコーディング標準のコードのペアの類似度を求め、構文マッピングを提供することと、両方のコーディング標準で注釈された既存のケースにアクセスして、２つのコーディング標準のコードのペアの事例ベースマッピングを求めることと、各モジュールからマッピングを集めることと、コーディング標準の一つからのコードの入力を受け入れ、前記モジュール調整ユニットからの集めたマッピングを用いて、各入力コードから他のコーディング標準のコードへの一以上の好適なマッピングを抽出することとを含む。

注釈された事例がほんの少ししかない場合、事例ベースマッピングモジュールにはより低い加重（ｗｅｉｇｈｔｉｎｇ）を与えるだけでもよい。

本発明の第３の態様の一実施形態による方法は、計算デバイスで実行されたとき、前記計算デバイスに上記の方法を実行させるコンピュータプログラムであり得る。

本発明の好ましい実施形態による装置又はコンピュータプログラムは、システムの態様の任意の組み合わせを含み得る。さらに別の実施形態による方法又はコンピュータ製品は、処理及びメモリ機能を要するという点でコンピュータにより実装されたものと言える。

好ましい実施形態による装置は、特定の機能を実行するように構成されているか、または単に実行することになっているとして説明することができる。この構成または配置は、ハードウェアまたはミドルウェアまたは任意の他の適切なシステムの使用によって行うことができる。好ましい実施形態では、構成または配置はソフトウェアによるものである。

したがって、１つの態様によれば、少なくとも１つのコンピュータにロードされると、先行する装置定義のいずれかまたはそれらの任意の組み合わせに従って装置となるようにそのコンピュータを構成するプログラムが提供される。

さらなる態様によれば、少なくとも１つのコンピュータにロードされたときに、前述の方法定義のいずれかまたはそれらの任意の組み合わせにしたがって方法ステップを実行するように少なくとも１つのコンピュータを構成するプログラムが提供される。

一般に、コンピュータは、定義された機能を提供するように構成または配置されているとして列挙された要素を含むことができる。例えば、このコンピュータは、メモリ、処理、およびネットワークインターフェースを含むことができる。

本発明は、デジタル電子回路、またはコンピュータハードウェア、ファームウェア、ソフトウェア、またはそれらの組み合わせで実施することができる。本発明は、１つ以上のハードウェアモジュールを実行する、またはその動作を制御する、コンピュータプログラムまたはコンピュータプログラム製品、すなわち、例えば機械可読記憶装置または伝搬信号などの非一時的情報担体に有形的に具現化されたコンピュータプログラムとして実施することができる。

コンピュータプログラムは、スタンドアロンプログラム、コンピュータプログラム部分または複数のコンピュータプログラムの形式であってもよく、コンパイルまたはインタプリタされた言語を含む任意の形式のプログラミング言語で記述することができ、スタンドアロンプログラムとして、またはモジュール、コンポーネント、サブルーチン、またはデータ処理環境での使用に適した他のユニットを含む任意の形式で展開することができる。コンピュータプログラムは、１つのモジュール上で、または１つのサイトの複数のモジュール上で実行されるように、または複数のサイトにわたって分散され、通信ネットワークによって相互接続されるように展開することができる。

本発明の方法ステップは、コンピュータプログラムを実行して、入力データに作用して出力を生成することにより本発明の機能を実行する一以上のプログラム可能プロセッサにより実行できる。本発明の装置は、プログラムされたハードウェアとして、または例えばＦＰＧＡ（フィールドプログラマブルゲートアレイ）またはＡＳＩＣ（特定用途向け集積回路）を含む特殊用途論理回路として実施することができる。

コンピュータプログラムの実行に適したプロセッサは、例えば、特定目的及び汎用のマイクロプロセッサと、任意種類のデジタルコンピュータの任意一以上のプロセッサとを両方とも含む。一般的に、プロセッサは読み取り専用メモリまたはランダムアクセスメモリから命令またはデータまたはその両方を受け取る。コンピュータの必須要素は、命令及びデータを記憶する一以上のメモリデバイスに結合した、命令を実行するプロセッサである。

本発明は、特定の実施形態に関して説明される。他の実施形態も下記の請求項の範囲に入る。例えば、本発明のステップは、異なる順序で実行されても、依然として望ましい結果を達成することができる。オブジェクト指向プログラミング技術を使用せずに、複数のテストスクリプトバージョンを１つのユニットとして編集して呼び出すことができる。例えば、スクリプトオブジェクトの要素を構造化データベースまたはファイルシステムに編成することができ、スクリプトオブジェクトによって実行されると説明される動作を、テスト制御プログラムによって実行することができる。

本発明の要素は、用語「モジュール」および「ユニット」を使用して記載されており、同様に「手段」として説明することができる。当業者には言うまでもなく、このような機能的用語およびそれらの均等物は、空間的に分離されているが、結合して、確定された機能を果たすシステムの部分を指すことができる。同様に、システムの同じ物理的部分は、確定された二以上の機能を提供することができる。

例えば、別個に確定された手段は、必要に応じて同じメモリおよび／またはプロセッサを使用して実装することができる。

添付した図面を参照して、単なる例示により、本発明の好ましい特徴をここに説明する。

本発明の一般的な実施形態におけるメインシステムコンポーネントを示すブロック図である。一般的な実施形態における方法を示すフローチャートである。本発明の一実施形態により生成される、ＩＣＤ９とＩＣＤ１０との間のｍ−ｍマッピングを示す図である。本発明の医療関係の実施形態におけるメインシステムコンポーネントを示すブロック図である。構文整合（ｓｙｎｔａｃｔｉｃａｌａｌｉｇｎｍｅｎｔ）からから得られる候補をどう微調整（ｒｅｆｉｎｅ）できるかの一例を示す図である。図５の例における処理のフローの一例を示す図である。整合部における処理を示すフロー図である。本発明の実施形態を実装する好適なハードウェアを示す図である。

図１は、様々なデータ源からのマッピングを提供する３つのモジュールを含むシステム１０を示す図である。

エキスパートマッピングモジュール２０は、文献６０から、及びインターネットから、マッピングを読み出す。例えば、製品とサービスの実施形態の場合、エキスパートマッピングモジュールが、ｈｔｔｐ：／／ｗｗｗ．ｃｍａｐ．ｅｕなどの情報源を参照してもよい。

構文マッピング（ｓｙｎｔａｃｔｉｃａｌｍａｐｐｉｎｇ）３０は、分類８０、９０自体からマッピングを読み出す。事例ベースマッピング４０は、履歴事例／記録データベースからマッピングを読み出す。例えば、同じ製品と、２以上のコーディングシステムにおけるその分類（ｃｌａｓｓｉｆｉｃａｔｉｏｎ）とを含むデータベースが設けても良い。

これらのモジュールは、計算資源が許容すれば、新しいマッピングをシステムに含めるため、定期的に実行されてもよいし、所定間隔で実行されてもよい。

一般的に、各モジュールに対してデーモンサブモジュール（ｄａｅｍｏｎｓｕｂｍｏｄｕｌｅ）を設け、データを（必要に応じて）「臨機応変に（ｏｎｔｈｅｆｌｙ）」更新することもできる。デーモンサブモジュールは、選択されたデータ源のリストからメタデータを定期的に収集する。デーモンサブモジュールは、最新のメタデータをローカルキャッシュと比較して、差分を検出し、差分があるとき、又は（例えば、前の更新から経過した時間）差分が大きいとき、外部データ源にクエリ（ｑｕｅｒｙ）し、新しく読み出したマッピングデータをローカルストレージに記憶し、ローカルキャッシュを更新し、新しい更新を登録（ｒｅｇｉｓｔｅｒ）することができる。デーモンサブモジュールは、自分のモジュール内の他のサブモジュール及びその他のモジュール及び／又はユニットに、かかる更新について通知できる。

これらのモジュールはすべて結果をモジュール調整ユニットに供給する。モジュール調整ユニットは、マッピングを集め、例えば、様々なデータ源から見つけたマッピングを追加する。マッピングの確実性を示す値が提供される場合、それを組み合わせて、異なるモジュールに同じマッピングが見つかったときの全体的な値を与えても良い。あるいは、値を別々に扱ってもよい。この段階において、３つの異なるモジュールのマッピングは、異なる加重を与えられてもよい。例えば、幾つかの場合には、前に付されたラベルが不正確であった可能性もあり、事例ベースマッピングに与えられるモジュール加重は低い場合がある。

整合ユニット（ａｌｉｇｎｍｅｎｔｕｎｉｔ）１１０において、マッピングは、モジュール加重及び／又は個々のマッピングの値に基づいて、有意な（ｓｉｇｎｉｆｉｃａｎｔ）マッピングのみを保持する閾値を用いて、または最も有意な１つのマッピングを保持する比較を用いて、個別に、又はブロックとして、又は全マッピングとして、必要に応じて抽出される。

情報源情報システムＩＳへの任意的リンクにより、（ある製品の記録などの）ケースの他の複数のケースとの直接的な比較ができ、その製品に関連する１つのシステムにおけるコードと、その情報源情報システム中の、同様の製品に関連する他の標準のコードとの間のマッピングが見つかる場合がある。マッピングモジュールが十分な結果を生成しない場合、かかる比較がされる。

履歴事例データベース１００と情報源（ｓｏｕｒｃｅ）情報システム１２０は別々に示したが、同じシステム／データベースであってもよい。

１３０は、コンピュータを介した、コードなどのユーザ入力を表す。入力コンピュータは離れたところにあってもよい。

図２は一般的な方法の実施形態を示す。ステップＳ１０において、確立されたマッピングが、例えば文献／インターネットから収集される。ステップＳ２０において、２つの標準がアクセスされ、構文マッピング（ｓｙｎｔａｃｔｉｃｍａｐｐｉｎｇ）を与える構文の類似度（ｓｙｎｔａｃｔｉｃｓｉｍｉｌａｒｉｔｙ）が発見される。ステップＳ３０において、既存の事例データを用いて、事例ベースマッピングを生成する。ステップＳ４０において、これらのマッピングが集められる。最後に、ステップＳ５０において、一以上の入力コードに基づいて、マッピングが抽出される。

図３は、ＩＣＤ９の一部とＩＣＤ１０の一部との間のマッピングを示し、これらは抽出され、表示されたものである。これはインターラクティブなユーザインターフェースとして提供されてもよく、２つの標準間の完全なマッピングの一部または全部を表示する。例えば、コード上でマウスを動かすと、他のコーディング標準の対応するコードがハイライトされる。

図４に示した具体的な実施形態は、様々な情報源からエビデンスを収集することを試み、２つの医療分類システムＩＣＤ９とＩＣＤ１０との間の最も正確かつ最も新しい整合を提供する。これは詳細な例として受け取られ、当業者には言うまでもなく、他のコーディングシステムの整合システム（ａｌｉｇｎｍｅｎｔｓｙｓｔｅｍ）は、具体的な分野に必要な適合をすれば、基本的に同じ方法を用い、同じ構成を有する。

このシステムは次のコンポーネントよりなる：
Ａ．３つのモジュール、すなわちエキスパートマッピング取り込み（ｅｘｐｅｒｔｍａｐｐｉｎｇｉｎｇｅｓｔｉｏｎ）モジュール２０、構文マッピング（ｓｙｎｔａｃｔｉｃａｌｍａｐｐｉｎｇ）モジュール３０、及び事例ベースマッピングモジュール４０を含む入力データ処理ユニット。
Ｂ．様々な入力モジュールの加重を学習する加重調整モジュール５０。
Ｃ．ＩＣＤ９コードで注釈（ａｎｎｏｔａｔｅｄ）された患者事例に、可能性のあるＩＣＤ１０コードをプロンプト（ｐｒｏｍｐｔ）する整合割当モジュール（ａｌｉｇｎｍｅｎｔａｓｓｉｇｎｍｅｎｔｍｏｄｕｌｅ）１１０。

データ源は、左に、文献６０及びＷＷＷ７０を含み、右に、履歴患者データベース１００及び病院情報１２０を含む。簡単のため、図４において、右の２つのデータ源は結合され（ｍｅｒｇｅ）、１つのデータ源として設けられてもよい。すなわち、履歴患者データベースと病院ＩＳを１つの病院情報システムとしてもよい。

《医療分類整合システムの詳細》
一般に、この実施形態のシステムは、データ取込モジュール（ｄａｔａｉｎｇｅｓｔｉｏｎｍｏｄｕｌｅ）、加重調整モジュール、及び整合微調整ユニット（ａｌｉｇｎｍｅｎｔｒｅｆｉｎｅｍｅｎｔｕｎｉｔ）を含み、すべて医療分野に適合されている。詳細は以下の通りである。

《データ源》
他の実施形態と同様に、目的は異種情報源からのデータの収集であり、可能性として次を含む：
ｉ．専門家の意見として公表された医療文献。コード整合をマイニング（ｍｉｎｉｎｇ）するときに、ＰｕｂＭｅｄなどの出版リポジトリを用いることができる。かかる結果は、ジャーナルの評判及びその出版物がピアレビューされているかなどの事実に基づいて計算される信頼度に関連付けることができる。
ｉｉ．確立された医療オントロジー。そのようなオントロジーは、普通は、大規模な国際的コラボレーションの結果である。すでに、ある程度、セマンティクス（ｓｅｍａｎｔｉｃｓ）と表現に関して、実施者間の合意を反映している。直接的なマッピング／整合は必ずしも得られないが、そのようなオントロジーは、両方のＩＣＤバージョンを投影して間接的な整合を推測する基準として機能し得る。
ｉｉｉ．専門家の意見の補助的情報源としてのＷｏｒｌｄＷｉｄｅＷｅｂ。マッピングを利用するとき、考慮しなければならない、様々な権威による、資金提供された又は自主的な努力として、マッピング結果を公表しているウェブサイトがある。
ｉｖ．構文マッピング（ｓｙｎｔａｃｔｉｃａｌｍａｐｐｉｎｇ）計算への入力としてのＩＣＤ９とＩＣＤ１０分類システム。説明を伴う完全なコーディングシステムが必要である。
ｖ．両方のコーディングシステムで注釈された患者事例のみを提供するように、すでに処理された可能性を有する患者履歴事例（ｈｉｓｔｏｒｉｃａｌｐａｔｉｅｎｔｃａｓｅｓ）。これは、１つの組織で、又は１つのケースに関して複数の組織にわたって、複数のコーディングシステムが同時に用いられる場合である。このマッピングにより、１つの診断コーディングシステムにおける患者ケースが、他のコーディングシステムで注釈され得る。

《Ａ．データ入力ユニット》
マッピング構成モジュールは、さらに３つの専用サブコンポーネントであって各々が特定タイプのデータ源にフォーカスしたサブコンポーネントにさらに分割できる。この区別は主に、データ源の性質と、かかるデータ源を処理するのに必要な技術とによる。サブコンポーネントは、エキスパートマッピング取込モジュール、構文マッピングモジュール（ｓｙｎｔａｃｔｉｃａｌｍａｐｐｉｎｇｍｏｄｕｌｅ）、及び事例ベースマッピングモジュールである。

１．エキスパートマッピング取込モジュールは、主に、既存の文献から、又はインターネットから、理論的に確立されたマッピングを収集する（上記の（ｉ）、（ｉｉ）及び（ｉｉｉ））。ＩＣＤ１０の公表以来、それを以前のバージョンと整合（ａｌｉｇｎ）させる努力が為されてきた。これは依然として継続中の作業であるが、初期の結果は活用できる。ＩＣＤ９／１０の整合に関する研究は為されているが、問題が容易に解決することを意味するものではない。エキスパートマッピングは非常に主観的であり議論の余地があり、長期にわたる精査が必要である。

基本的なテキスト分析手法を適用して、かかるエキスパートマッピングからコンピュータが理解可能なフォーミュラ（ｆｏｒｍｕｌａｅ）を抽出することができる。例えば、ＩＣＤ９コードとＩＣＤ１０コードを用いてマッピングを確立することができ、他方、データ源の評判（ｒｅｐｕｔａｔｉｏｎ）と認証（ａｕｔｈｅｎｔｉｃａｔｉｏｎ）を用いて、抽出されたマッピングに信頼値を付与することができる。

幾つかの公式なウェブサイトは、かかる情報を、分野の専門家（ｄｏｍａｉｎｅｘｐｅｒｔｓ）により為されたマニュアルマッピング／整合として公表している。これらがどのタイプの公表であるかに関して制約はない。通常、抽出には、一定の、所定言語パターン（ｌｉｎｇｕｉｓｔｉｃｐａｔｔｅｒｎｓ）を用いる。

かかるモジュールの結果は三つ組（ｔｒｉｐｌｅ）

であり、ＩＣＤ９とＩＣＤ１０はそれぞれ異なる分類システムのコードであり、ｃはかかる対応を肯定または否定する異なる情報源（ウェブサイト、研究論文など）を考慮した集約された信頼値（ａｇｇｒｅｇａｔｅｄｃｏｎｆｉｄｅｎｃｅｖａｌｕｅ）である。

ある具体的な例は図３のマッピングを用いる。中間結果は（２９１．０，Ｆ１０．２３１，ｃ１）または（２９１．０，Ｆ１０．２３３，ｃ２）であり、それぞれは使用した情報源に基づき集約された信頼値を含む。これは、モジュール加重調整において、後述のように、他のモジュールからの結果により、さらに微調整（ｒｅｆｉｎｅｍｅｎｔ）される。

２．構文マッピング（ｓｙｎｔａｃｔｉｃａｌｍａｐｐｉｎｇ）は、文字列間類似度尺度（ｓｔｒｉｎｇｓｉｍｉｌａｒｉｔｙｍｅａｓｕｒｅｓ）を適用して、分類自体から任意のＩＣＤ９／１０コードの類似度を比較する（上記の（ｉｖ））。各ＩＣＤコードにはコード説明（ｃｏｄｅｄｅｓｃｒｉｐｔｉｏｎｓ）が付されている。かかる説明はコード整合（ｃｏｄｅａｌｉｇｎｍｅｎｔ）の貴重な手がかりとなり得る。実際、広い範囲で使われているテキスト類似度尺度、例えばＳｉｍｐｌｅＥｄｉｔＤｉｓｔａｎｃｅ、Ｊａｒｏ−ＷｉｎｋｌｅｒＤｉｓｔａｎｃｅなどを用いることができる。文字列間類似度／距離ソフトウェアは多数あり、当業者には知られている。かかる尺度（ｍｅａｓｕｒｅｍｅｎｔｓ）を改良／微調整するために、様々な言語のＩＣＤコード説明を入力の一部として用いることもできる。一方、ＩＣＤコードの階層構造は、子レベルに明示されている親に関する記述を見なければならない。例えば、ＩＣＤ９０１１．０１の記述は

の通りである。

各コーディングレベルについて、ショートコード（ｓｈｏｒｔｃｏｄｅｓ）に関連する記述がある。構文類似性（ｓｙｎｔａｃｔｉｃａｌｓｉｍｉｌａｒｉｔｙ）を計算する時は、（下位レベルの記述を上位レベルの記述に付加することにより）すべての記述を単に連結して、分類階層（ｔａｘｏｎｏｍｙｈｉｅｒａｒｃｈｉｅｓ）を保持できる。

かかる情報の多くが半構造化データフォーマットで公表されている（その一部は、ＸＭＬフォーマットまたはＲＤＦフォーマットの機械が理解できるタグで適宜ラベルされてさえいる）。一例を挙げると

の通りである。

連結されると、拡張された記述の類似度は、診断コードの幾つかの階層的セマンティックス（ｈｉｅｒａｒｃｈｉｃａｌｓｅｍａｎｔｉｃｓ）を反映し得る。実際の文字列間類似度をマッピングの信頼度として計算することができる。

一方、その他の技術、例えば階層ベースの類似度伝搬（ｈｉｅｒａｒｃｈｙ−ｂａｓｅｄｓｉｍｉｌａｒｉｔｙｐｒｏｐａｇａｔｉｏｎ）などを適用することもできる。例えば、ＩＣＤコードの２つのトップレベル（ａとｂ）が類似度スコアｘで整合されるとき、２つのサブコード（ａ’とｂ’）の類似度は

として計算できる。ここで、ｄｅｐ（）はコード階層におけるコードの深さを与える。

また、セマンティック改良された整合（ｓｅｍａｎｔｉｃｅｎｒｉｃｈｅｄａｌｉｇｎｍｅｎｔ）のため、確立されたオントロジーモデル（例えば、ＵＭＬＳ）を活用することも可能である。例えば、構文整合（ｓｙｎｔａｃｔｉｃａｌａｌｉｇｎｍｅｎｔ）から得られた候補を、図５及び図６に示すように、オントロジーモデルを中間言語（ｉｎｔｅｒｌｉｎｇｕａ）または基準として用いて、精密化することができる。

これらの図において、医療オントロジー中の概念は、両方のＩＣＤバージョンの診断コードをアンカリング（ａｎｃｈｏｒ）する基準として機能し得る。

ＩＣＤ９コードは、好適な候補をスクリーニングするため、ステップＳ１００において、選択されたＩＣＤ１０コードのセットに対してシンタックス整合（ｓｙｎｔａｘａｌｉｇｎｍｅｎｔｓ）される。これらの候補は、ステップＳ１２０において、オントロジーベースの微調整（ｒｅｆｉｎｅｍｅｎｔ）にかけられ、ステップＳ１３０で微調整（ｒｅｆｉｎｅ）される。同様に、ＩＣＤ１０コードから始めて、ステップＳ１３０の前に、ステップＳ１００と、ステップＳ１１０のオントロジーベースの微調整を用いる。

このモジュールの出力は、類似度を有する整合

であってもよく、ｓは類似度（ｓｉｍｉｌａｒｌｉｔｙｖａｌｕｅ）である。

３．事例ベースマッピングは、両方のコーディングシステムで注釈された既存の患者ケースから類似度を引き出す（上記リストの（ｖ））。前述の通り、１つの医療機関で両方のコーディングシステムが使われているという現象はよくあることである。それらは、以前はＩＣＤ９コードに割当られたが、今はＩＣＤ１０コードを付されたケースである。これは、患者が同じ症状を訴えて再入院または再通院することにより、又は患者が同じ疾患（ｄｉｓｏｒｄｅｒｅｐｉｓｏｄｅ）のレビューまたは再評価を受けた場合であり得る。患者の進行タイムラインを、その患者のすべての来院にわたり、各来院で割り当てられたＩＣＤコードとともに確立できるとき、事例ベース整合（ｃａｓｅ−ｂａｓｅｄａｌｉｇｎｍｅｎｔ）を確立できる。例えば、患者が、その最初の来院中に０１１．０１と分類され、その後、ＩＣＤ１０を用いてＡ１５．０を割り当てられた場合、整合〈〈ＩＣＤ９：０１１．０１〉，〈ＩＣＤ１０：Ａ１５．０〉，ｐ〉のエビデンスが得られた（ｅｓｔａｂｌｉｓｈｅｄ）と言える。かかる整合の信頼または確率レベルｐは、かかる整合の確率に基づいて得られ、その整合を確認する事例の数の、そのＩＣＤ９コードにより注釈された事例の総数に対する比率を計算して得られる。この場合、確率には方向性があり、ＩＣＤ９からＩＣＤ１０へのマッピングの場合には〈〈ＩＣＤ９：０１１．０１〉，〈ＩＣＤ１０：Ａ１５．０〉，ｐ〉であり、逆の場合には〈〈ＩＣＤ１０：Ａ１５．０〉，〈ＩＣＤ９：０１１．０１〉，ｐ’〉であり、ｐ＝ｐ’は保証されない。

例えば、ＩＣＤ９ｘｘｘで注釈された１００事例のうち、６０事例がＩＣＤ１０Ａ１５．０で注釈された場合、ＩＣＤ９ｘｘｘからＩＣＤ１０Ａ１５．０へのマッピングの確率は０．６であると結論できるが、その逆は言えない。

しかし、事例ベースマッピングには幾つかの制約がある。両方のコードが、同じ疾患に対して、又は長期の病気の同一の発現（ｓａｍｅｅｐｉｓｏｄｅ）に対して用いられなければならない。何回かの試行錯誤（ｈｅｕｒｉｓｔｉｃｓ）を用いて決定を導くことができる。第１に、ＩＣＤ９コードとＩＣＤ１０コードの期間が、好ましくは同じ来院であり、例えば同じケースリファレンス又は同じ（電子的）医療記録インスタンスであることが好ましい。幾つかのＬＴＣ（長期疾患（ＬｏｎｇＴｅｒｍＣｏｎｄｉｔｉｏｎ））の場合は長期スパンをカバーできることに留意されたい。第２に、コードが同様の症状に割り当てられないとならない。あるグループの症状が他のグループの症状と互換であるか決定するとき、症状オントロジーが役に立つ。

１人の患者の整合に対する制約を、より多くの亜母集団ベースの整合（ｍｏｒｅｓｕｂ−ｐｏｐｕｌａｔｉｏｎｂａｓｅｄａｌｉｇｎｍｅｎｔ）に緩和することが可能である。すなわち、整合を１人の患者にアンカリング（ａｎｃｈｏｒｉｎｇ）する替わりに、同じ人口学的特徴（ｄｅｍｏｇｒａｐｈｉｃｃｈａｒａｃｔｅｒｉｓｔｉｃｓ）を有する患者の群（ｃｏｈｏｒｔ）を用いることもできる。これは個々の患者のデータが少ない又は歪曲されているときに特に有用である。年齢、性別、学歴、経済的背景、主症状などの主特性を用いて患者の類似度を計算できる。類似した人口学的特徴と類似した症状を有する二人の患者が、それぞれＩＣＤ９とＩＣＤ１０で注釈（ａｎｎｏｔａｔｅｄ）されているとき、２つのコードの間には何らかの対応関係があると推測できる。

《Ｂ．モジュール加重調整》
個々のマッピングツールからの出力としての整合候補（ａｌｉｇｎｍｅｎｔｃａｎｄｉｄａｔｅｓ）は、モジュール加重調整モジュールにより集められる。モジュール加重調整ユニットは、どのマッピングツールがより信頼できるかも決定する。加重は、同じ初期値が自動的に割り当てられてもよいし、異なる初期値が分野の専門家により割り当てられてもよい。加重（ｗｅｉｇｈｔ）は、前出の信頼度、確率、類似度の値とは異なる。

加重は様々な方法で調整できる。可能性として、機械学習を用い、３つのモジュールすべてに対して同じ加重値（ｗｅｉｇｈｔｖａｌｕｅ）から始め：
１．加重調整はエンドユーザからのフィードバックに基づいてもよい。すべての候補のうち、ヒトのその分野の専門家（ｈｕｍａｎｄｏｍａｉｎｅｘｐｅｒｔｓ）は、自分の個人的選択（ｐｅｒｓｏｎａｌｐｒｅｆｅｒｅｎｃｅ）に基づいて最良のものを選択できる。単純な多数決原理、またはボルダ方式などの他の投票集約方法（ｖｏｔｅａｇｇｒｅｇａｔｉｏｎｍｅｔｈｏｄｓ）に基づき、人数ベースの決定をすることもできる。
２．加重は、その分野の専門家によりマニュアル生成された標準的マッピングを用いて学習することもできる。調整モジュールは、どのモジュールが他のモジュールよりも高い加重を割り当てられるか、このモジュールの出力が専門家の選択にどれだけ近いかに基づき、決定できる。

《Ｃ．整合割当モジュール》
このモジュールは、前段のモジュールからのマッピングを利用して、患者記録に適用する。このモジュールは、閾値を適用して、入力診断コードに対して、最も有望なマッピング候補を抽出できる。これは、図７に示したように、簡単に行え、ＨＩＳ（病院情報システム）におけるケースのマッピングを生成できる。これは、病院データベースからの患者データ、ほとんどが患者事例データと注釈データを指す。

最初にステップＳ１４０においてコードが抽出され、ステップＳ１５０においてマッピングを用いて候補を検索する。ステップＳ１６０において、少なくとも１つの好適なマッピングがあれば、ステップＳ１７０において、最良の候補が出力される。

強く整合した候補（ｓｔｒｏｎｇａｌｉｇｎｍｅｎｔｃａｎｄｉｄａｔｅｓ）がなければ（ステップＳ１６０でＮＯ）、システムはまず代替的なソリューションを検索することができる（Ｓ１８０）。類似した状況（類似した人口学的特徴と、同じ症状又は非常に互換性のある症状（再び、症状オントロジーに基づく））であり、ＩＣＤコードを有する患者を特定するように試みる。仮定として、このように類似した患者を特定することにより（Ｓ１９０でＹＥＳ）、ステップＳ２００で、患者のコードを、異なるバージョンからのＩＣＤコードの対応として、「借りる」ことができる。類似した患者事例はメモリ又は一時的ディスクファイルに記憶できる。基本的に、ステップＳ１４０における「コードを抽出」は、患者事例から他の情報も読み出せる。ロードされたこれらの事例は、ＨＩＳ（病院情報システム）中の事例と比較される。

このプロセスが失敗すると（Ｓ１９０でＮＯ）、システムは、対応が見つからず、ヒトによる入力が必要であると結論する。

本システムはマッピング方法（ｍａｐｐｉｎｇｍｅｔｈｏｄｏｌｏｇｙ）を生成する。何らかのダイナミズムが望ましく、１つのコーディングシステムから他のコーディングシステムへの、事前に計算された完全なマッピングは静的であり、それゆえ理想的ではない。また、一対一の厳密なマッピングは無い。これらの場合に、最上位にランクされたもの、又は加重閾値より上の一群の候補を、ユーザに（例えば、整合されたコードの（マッピング）ペアのＲＤＦグラフから取った三組（ｔｒｉｐｌｅ）の、個々のモジュールの信頼度を平均した、又は別々にリストしたフォーマットで）提示してもよい。

ユーザクエリは次の形式を取ることができる：
ａ．すべてのマッピングを読み出す：この場合、（例えば、信頼値と一緒の、２つの標準中のすべてのコード間の）現在集められているマッピングは、整合のスナップショットとなり、プレインテキストフォーマット「ｉｃｄ９ｘ，ｉｃｄ１０ｙ，ｃｏｎｆｉｄｅｎｃｅ」または図３に示したように、インターラクティブなユーザインターフェース（ＵＩ）として、ユーザに配信される。
ｂ．個々のマッピングを読み出す：この場合、ＵＩは患者記録を表示できる。ユーザは、例えば、診断コード（例えば、ＩＣＤ９コード）を右クリックして、コンテキストメニュー（ｃｏｎｔｅｘｔｍｅｎｕ）を表示させ、例えば、「ＩＣＤ１０コードで（ＩｎＩＣＤ１０Ｃｏｄｅ）」メニューアイテムを選択する。個々の変換のため、その他の無関係のコード整合も更新され得る。

図８は、データストレージサーバなどの計算デバイスを示すブロック図である。この計算デバイスは本発明を具現化し、一実施形態によるコードシステム間のマッピング方法を実装するのに使われても良い。計算デバイスは、プロセッサ９９３と、ここに説明するモジュールの機能をプロセッサ９９３に実行させるメモリ９９４とを有する。任意的に、計算デバイスは、他の計算デバイスと、例えば本発明の実施形態の計算デバイスと通信するネットワークインターフェース９９７も含む。

例えば、一実施形態は、かかる計算デバイスのネットワークより構成されていてもよい。任意的に、計算デバイスは、キーボードとマウス９９６などの一以上の入力メカニズムと、一以上のモニタ９９５などのディスプレイユニットとも含む。コンポーネントはバス９９２を介して互いに接続可能である。

メモリ９９４はコンピュータ読み取り可能媒体を含む。この用語は、例えば、コンピュータ実行可能命令を担い、又はその中にデータ構造を格納するように構成された１つの媒体又は複数の媒体（例えば、集中型または分散型データベース及び／又は関連するキャッシュ及びサーバ）を指す。コンピュータ実行可能命令は、例えば、命令とデータであって、汎用コンピュータ、特殊用途コンピュータ、又は特殊用途プロセッサデバイス（例えば、一以上のプロセッサ）によりアクセス可能であり、これらに一以上の機能又は動作を実行させ、かつ本発明の実施形態のマッピングを実行させるものを含んでもよい。このように、「コンピュータ読み取り可能記憶媒体」との用語は、そのマシンにより実行される一組の命令を記憶、エンコード、または担うことができ、そのマシンに、本開示の方法のいずれかを実行させる任意の媒体を含む。したがって、「コンピュータ読み取り可能記憶媒体」との用語は、固体メモリ、光媒体及び磁気媒体を含むが、これらに限定されない。限定ではなく例として、かかるコンピュータ読み取り可能媒体は、非一時的コンピュータ読み取り可能記憶媒体を含む、ランダムアクセスメモリ（ＲＡＭ）、リードオンリーメモリ（ＲＯＭ）、電気的消去可能プログラマブルリードオンリーメモリ（ＥＥＰＲＯＭ）、コンパクトディスクリードオンリーメモリ（ＣＤ−ＲＯＭ）又はその他の光ディスク記憶媒体、磁気ディスク記憶媒体又はその他の磁気記憶デバイス、フラッシュメモリデバイス（例えば、固体メモリデバイス）を含む。

プロセッサ９９３は、計算デバイスを制御し、処理動作を実行し、例えば、本明細書と特許請求の範囲に説明し、図１ないし４に示した、エキスパートマッピングモジュール、構文マッピングモジュール、事例ベースマッピングモジュール、モジュール加重調整ユニット、及び整合ユニットなどの様々な機能を実装するようにメモリに記憶されたコードを実行するように構成されている。メモリ９９４はプロセッサ９９３により読み書きされるデータを格納する。本明細書に説明するように、プロセッサは、マイクロプロセッサ、中央処理装置などの一以上の汎用処理デバイスを含んでも良い。プロセッサは、例えば、ＣＩＳＣ（ｃｏｍｐｌｅｘｉｎｓｔｒｕｃｔｉｏｎｓｅｔｃｏｍｐｕｔｉｎｇ）マイクロプロセッサ、ＲＩＳＣ（ｒｅｄｕｃｅｄｉｎｓｔｒｕｃｔｉｏｎｓｅｔｃｏｍｐｕｔｉｎｇ）マイクロプロセッサ、ＶＬＩＷ（ｖｅｒｙｌｏｎｇｉｎｓｔｒｕｃｔｉｏｎｗｏｒｄ）マイクロプロセッサ、他の命令セットを実装したプロセッサ、又は複数の命令セットの組み合わせを実装したプロセッサを含む。プロセッサは、例えば、一以上の特殊用途処理デバイス、例えば特定用途集積回路（ＡＳＩＣ）、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、デジタル信号プロセッサ（ＤＳＰ）、ネットワークプロセッサなどを含む。一以上の実施形態では、プロセッサは、本明細書で説明される動作及びステップを実行する命令を実行するように構成されている。

ディスプレイユニット９９７は、例えば、中間マッピングや最終的マッピングなどの、計算デバイスにより記憶されたデータを、信頼度（ｃｏｎｆｉｄｅｎｃｅｖａｌｕｅｓ）と共に、又はそれ無しに、又は図３に示したようにグラフ形式で、表示する。また、ディスプレイユニットは、例えば、カーソル及びダイアローグボックス及びスクリーンを表示して、ユーザと、計算デバイスに記憶されたプログラム及びデータとの間のインターラクションを可能にする。入力メカニズム９９６は、例えば、ユーザが計算デバイスにデータ及び命令を入力できるようにする。

ネットワークインターフェース（ネットワークＩ／Ｆ）９９７は、例えば、インターネットなどのネットワークに接続され、図１ないし４に示したようにデータベースへの接続を提供する。ネットワークインターフェース９９７は、ネットワークを介して他の計算デバイスに接続可能である。ネットワークＩ／Ｆ９９７は、例えば、ネットワークを介して他の装置との間でのデータ入出力を制御する。マイクロホン、スピーカ、プリンタ、パワーサプライ、ファン、ケース、スキャナー、トラッカーボールなどの他の周辺デバイスが計算デバイスに含まれても良い。

エキスパートマッピング取込モジュールは、例えば、メモリ９９４の一部に格納された処理命令を含み、プロセッサ９９３がその処理命令を実行し、処理命令の実行中、メモリ９９４の一部が、例えば、信頼度（ｃｏｎｆｉｄｅｎｃｅｖａｌｕｅｓ）を有する三つ組（ｔｒｉｐｌｅｓ）の形式で、中間結果を記憶する。エキスパートマッピング取込モジュールの出力は、例えば、各々が確立されたマッピングを具現化し、信頼度（ｃｏｎｆｉｄｅｎｃｅｖａｌｕｅｓ）を含む三つ組であり、メモリ９９４及び／又は接続された記憶ユニットに記憶され、加重調整モジュールに転送される。

構文マッピングモジュール（ｓｙｎｔａｃｔｉｃａｌｍａｐｐｉｎｇｍｏｄｕｌｅ）は、例えば、メモリ９９４の一部に格納された処理命令を含み、プロセッサ９９３がその処理命令を実行し、処理命令の実行中、メモリ９９４の一部が、例えば、類似度（ｓｉｍｉｌａｒｉｔｙｖａｌｕｅｓ）を有する三つ組（ｔｒｉｐｌｅｓ）の形式で、中間結果を記憶する。構文モジュールの出力は、例えば、各々が事例ベースのマッピングを具現化し、類似度（ｓｉｍｉｌａｒｉｔｙｖａｌｕｅｓ）を含む三つ組であり、メモリ９９４及び／又は接続された記憶ユニットに記憶され、加重調整モジュールに転送される。

事例ベースマッピングモジュールは、例えば、メモリ９９４の一部に格納された処理命令を含み、プロセッサ９９３がその処理命令を実行し、処理命令の実行中、メモリ９９４の一部が、例えば、確率値（ｐｒｏｂａｂｉｌｉｔｙｖａｌｕｅｓ）を有する三つ組（ｔｒｉｐｌｅｓ）の形式で、中間結果を記憶する。事例ベースマッピングモジュールの出力は、例えば、各々が事例ベースのマッピングを具現化し、確率値（ｐｒｏｂａｂｉｌｉｔｙｖａｌｕｅｓ）を含む三つ組であり、メモリ９９４及び／又は接続された記憶ユニットに記憶され、加重調整モジュールに転送される。

モジュール加重調整ユニットは、例えば、メモリ９９４の一部に格納された処理命令を含み、プロセッサ９９３がその処理命令を実行し、処理命令の実行中、メモリ９９４の一部が、例えば、複数のモジュールからの信頼度／類似度／確率値と三つ組（ｔｒｉｐｌｅｓ）を記憶する。２つの標準のコードのペアと、潜在的に組み合わせられた加重との形式の、集められた整合候補は、例えば、メモリ９９４及び／又は接続された記憶ユニットに格納され、整合ユニットに転送されてもよい。

整合ユニットは、例えば、メモリ９９４の一部に格納された処理命令を含み、プロセッサ９９３がその処理命令を実行し、処理命令の実行中、メモリ９９４の一部が、例えば、最終的マッピング候補を記憶する。最も見込みのあるマッピング候補は、メモリ９９４及び／又は接続された記憶ユニットに格納されてもよく、ディスプレイ９９５でユーザに表示されてもよい。

本発明を具現化する方法は、図２及び図７に示した方法のように、図８に示すような計算デバイスにおいて実行されてもよい。かかる計算デバイスは、図８に示したすべてのコンポーネントを有する必要はなく、それらのコンポーネントの一部により構成されてもよい。本発明を実施する方法は、ネットワークを介して一以上のデータ記憶サーバと通信する１つの計算デバイスにより実行されてもよい。計算デバイスは、結果のマッピング及び中間結果を記憶するデータストレージ自体であってもよい。

本発明を具現化する方法は、互いに協働する複数の計算デバイスにより実行されてもよい。複数の計算デバイスのうちの一以上は、結果として得られるマッピングの少なくとも一部を記憶するデータストレージサーバであってもよい。

２より多いコーディングシステム間のマッピングは、ペアごとの整合により得ることができる。すなわち、２より多いコーディングシステムの場合、同じ手順を適用でき、異なるコーディングシステム間のマッピングは大部分が独立である。

《発明の実施形態の主な特徴》
実施形態は、多くの医療機関で同時に大規模に使われているＩＣＤ９システムとＩＣＤ１０システムなどの２つのコーディングシステム間の、包括的な事例ベースの整合を提供することを目的とする。本システムは、異種の情報源からのデータを収集して、機械利用可能（ｍａｃｈｉｎｅｃｏｎｓｕｍａｂｌｅ）な知識を抽出し、かかる整合を確立する。かかる整合は、２つの技術、すなわち、最新のオンライン情報源及びオンライン公表から臨機応変にマッピングを抽出すること、及び使用ベース整合（ｕｓａｇｅ−ｂａｓｅｄａｌｉｇｎｍｅｎｔ）として、注釈された患者ケース／記録からマッピングを求める（ｅｍｅｒｇｉｎｇ）ことで最新のものに保たれる。

《主な利点》
２つのＩＣＤコーディングシステム間のマッピングはもともと複雑である。これは、医療分野以外にも広く使われているコーディングシステム間のマッピング／整合についても言える。実施形態は次の主利益を有する：
１．広い範囲で使われる２つの（潜在的には２より多い）コーディングシステム間の最新の整合。
２．使用セマンティックス（ｕｓａｇｅｓｅｍａｎｔｉｃｓ）、構文特徴（ｓｙｎｔａｃｔｉｃｆｅａｔｕｒｅｓ）、及び確立された理論を用いて、異種の情報源からのエビデンスを用いる整合。

本発明の実施形態の方法は、２つの異なるコーディングシステムにより注釈された十分なデータセットが取得でき、（事例ベースマッピングモジュールによる）使用ベースマッピングをサポートできる限り、コーディングシステムの整合に適用できる。

なお、以下に付記する。
（付記１）２つのコーディング標準間でコードを整合させるシステムであって、
エキスパートマッピングモジュール、構文マッピングモジュール、事例ベースマッピングモジュールと、
モジュール調整ユニットと、
整合ユニットとを有し、
前記エキスパートマッピングモジュールは、インターネットから、及び／又は機械読み取り可能公表物から、２つのコーディング標準のコードのペアの確立されたマッピングを収集するように構成され、
前記構文マッピングモジュールは、各コードの記述を含む２つのコーディング標準にアクセスして、前記記述を用いて前記２つのコーディング標準のコードのペアの類似度を求め、構文マッピングを提供するように構成され、
前記事例ベースマッピングモジュールは、両方のコーディング標準で注釈された既存のケースにアクセスして、２つのコーディング標準のコードのペアの事例ベースマッピングを求めるように構成され、
前記モジュール調整ユニットは、エキスパートマッピングモジュール、構文マッピングモジュール、事例ベースマッピングモジュールからマッピングを集めるように構成され、
前記整合ユニットは、コーディング標準の一つからのコードの入力を受け入れ、前記モジュール調整ユニットからの集めたマッピングを用いて、各入力コードから他のコーディング標準のコードへの一以上の好適なマッピングを抽出するように構成されている、
システム。
（付記２）前記エキスパートマッピングモジュールは、確立されたマッピングを確立する一以上の異なる情報源を反映する確立されたマッピングの信頼度を提供するように構成される、
付記１に記載のシステム。
（付記３）前記構文マッピングモジュールは、構文マッピングの類似度を提供し、文字列間類似度の形式で構文類似度を反映する、及び／又は各コードの記述の参照として機能するオントロジーを用いる、付記１または２に記載のシステム。
（付記４）前記構文マッピングモジュールは、構文マッピングの類似度を提供し、階層類似度の形式で構文類似度を反映する、及び／又は各コードの記述の参照として機能するオントロジーを用いる、
付記１ないし３いずれか一項に記載のシステム。
（付記５）前記事例ベースマッピングモジュールは、両方のコーディング標準で注釈された個々のケースに基づき、及び／又は、各ケースがコーディング標準の一つで注釈された、ケースのポピュレーションの確定された特徴を有する両方のコーディング標準で注釈されたケース群に基づき、事例ベースマッピングを探すように構成される、
付記１ないし４いずれか一項に記載のシステム。
（付記６）前記事例ベースマッピングモジュールは、第１のコーディング標準のコードの第２のコーディング標準のコードへのマッピングを確認する事例の、前記第１のコーディング標準のコードで注釈された事例の総数に対する割合を反映する、事例ベースマッピングの確率値を提供するように構成される、
付記１ないし５いずれか一項に記載のシステム。
（付記７）前記エキスパートマッピングモジュール及び／又は前記構文マッピングモジュール及び／又は事例ベースマッピングモジュールは、定期的に、好ましくは、記憶されたメタデータが外部データ源メタデータと異なる場合に、生成されたマッピングを更新する、
付記１ないし６いずれか一項に記載のシステム。
（付記８）前記モジュール調整ユニットは、信頼度、類似度、及び確率値を集めるように構成される、
付記１ないし７いずれか一項に記載のシステム。
（付記９）前記モジュール調整ユニットは、各モジュールからのマッピングにモジュール加重を割り当てるように構成される、付記１ないし８いずれか一項に記載のシステム。
（付記１０）モジュール加重は、エンドユーザフィードバック、好ましくは分野の専門家からのフィードバックに基づき、及び／又はモジュール加重は、前記モジュールの個々の出力の、標準的マッピングとの比較に基づく、付記１ないし９いずれか一項に記載のシステム。
（付記１１）前記整合ユニットは、現在の事例から１つのコードの入力を受け入れ、対応する一以上のコードへの一以上の好適なマッピングを抽出するように構成される、
付記１ないし１０いずれか一項に記載のシステム。
（付記１２）前記整合ユニットは、好適なマッピングが見つからなければ、現在のケースに類似した以前のケースに属するマッピングを検索して、候補コードとして、類似した以前のケースのコードを提示するように構成される、付記１１に記載のシステム。
（付記１３）前記整合ユニットは、一以上の好適なマッピングを抽出する候補マッピングのモジュール加重、信頼度、類似度又は確率値のどれか、又はその任意の組み合わせに閾値を適用するように構成される、付記１ないし１２いずれか一項に記載のシステム。
（付記１４）２つのコーディング標準間でコードを整合する方法であって、
インターネットから、及び／又は機械読み取り可能公表物から、２つのコーディング標準のコードのペアの確立されたマッピングを収集することと、
各コードの記述を含む２つのコーディング標準にアクセスして、前記記述を用いて前記２つのコーディング標準のコードのペアの類似度を求め、構文マッピングを提供することと、
両方のコーディング標準で注釈された既存のケースにアクセスして、２つのコーディング標準のコードのペアの事例ベースマッピングを求めることと、
各モジュールからマッピングを集めることと、
コーディング標準の一つからのコードの入力を受け入れ、各モジュールから集めたマッピングを用いて、各入力コードから他のコーディング標準のコードへの一以上の好適なマッピングを抽出することを含む、
方法。
（付記１５）計算デバイスで実行されたとき、前記計算デバイスに付記１４に記載の方法を実行させるコンピュータプログラム。

２０エキスパートマッピング
３０構文マッピング
４０事例ベースマッピング
５０モジュール調整ユニット
６０文献
８０標準１
９０標準２
１００事例履歴データベース
１１０整合
１２０情報源ＩＳ

Claims

２つのコーディング標準間でコードを整合させるシステムであって、
エキスパートマッピングモジュール、構文マッピングモジュール、事例ベースマッピングモジュールと、
モジュール調整ユニットと、
整合ユニットとを有し、
前記エキスパートマッピングモジュールは、インターネットから、及び／又は機械読み取り可能公表物から、２つのコーディング標準のコードのペアの確立されたマッピングを収集するように構成され、
前記構文マッピングモジュールは、各コードの記述を含む２つのコーディング標準にアクセスして、前記記述を用いて前記２つのコーディング標準のコードのペアの類似度を求め、構文マッピングを提供するように構成され、
前記事例ベースマッピングモジュールは、両方のコーディング標準で注釈された既存のケースにアクセスして、２つのコーディング標準のコードのペアの事例ベースマッピングを求めるように構成され、
前記モジュール調整ユニットは、エキスパートマッピングモジュール、構文マッピングモジュール、事例ベースマッピングモジュールからマッピングを集めるように構成され、
前記整合ユニットは、コーディング標準の一つからのコードの入力を受け入れ、前記モジュール調整ユニットからの集めたマッピングを用いて、各入力コードから他のコーディング標準のコードへの一以上の好適なマッピングを抽出するように構成されている、
システム。
前記エキスパートマッピングモジュールは、確立されたマッピングを確立する一以上の異なる情報源を反映する確立されたマッピングの信頼度を提供するように構成される、
請求項１に記載のシステム。
前記構文マッピングモジュールは、構文マッピングの類似度を提供し、文字列間類似度の形式で構文類似度を反映する、及び／又は各コードの記述の参照として機能するオントロジーを用いる、請求項１または２に記載のシステム。
前記構文マッピングモジュールは、構文マッピングの類似度を提供し、階層類似度の形式で構文類似度を反映する、及び／又は各コードの記述の参照として機能するオントロジーを用いる、
請求項１ないし３いずれか一項に記載のシステム。
前記事例ベースマッピングモジュールは、両方のコーディング標準で注釈された個々のケースに基づき、及び／又は、各ケースがコーディング標準の一つで注釈された、ケースのポピュレーションの確定された特徴を有する両方のコーディング標準で注釈されたケース群に基づき、事例ベースマッピングを探すように構成される、
請求項１ないし４いずれか一項に記載のシステム。
前記事例ベースマッピングモジュールは、第１のコーディング標準のコードの第２のコーディング標準のコードへのマッピングを確認する事例の、前記第１のコーディング標準のコードで注釈された事例の総数に対する割合を反映する、事例ベースマッピングの確率値を提供するように構成される、
請求項１ないし５いずれか一項に記載のシステム。
前記エキスパートマッピングモジュール及び／又は前記構文マッピングモジュール及び／又は事例ベースマッピングモジュールは、定期的に、好ましくは、記憶されたメタデータが外部データ源メタデータと異なる場合に、生成されたマッピングを更新する、
請求項１ないし６いずれか一項に記載のシステム。
前記モジュール調整ユニットは、信頼度、類似度、及び確率値を集めるように構成される、
請求項１ないし７いずれか一項に記載のシステム。
前記モジュール調整ユニットは、各モジュールからのマッピングにモジュール加重を割り当てるように構成される、請求項１ないし８いずれか一項に記載のシステム。
前記モジュール加重は、エンドユーザフィードバック、好ましくは分野の専門家からのフィードバックに基づき、及び／又は各モジュールの個々の出力の、標準的マッピングとの比較に基づく、請求項９に記載のシステム。
前記整合ユニットは、現在の事例から１つのコードの入力を受け入れ、対応する一以上のコードへの一以上の好適なマッピングを抽出するように構成される、
請求項１ないし１０いずれか一項に記載のシステム。
前記整合ユニットは、好適なマッピングが見つからなければ、現在のケースに類似した以前のケースに属するマッピングを検索して、候補コードとして、類似した以前のケースのコードを提示するように構成される、請求項１１に記載のシステム。
前記整合ユニットは、一以上の好適なマッピングを抽出する候補マッピングのモジュール加重、信頼度、類似度又は確率値のどれか、又はその任意の組み合わせに閾値を適用するように構成される、請求項１ないし１２いずれか一項に記載のシステム。
２つのコーディング標準間でコードを整合させるシステムにおける方法であって、前記システムは、エキスパートマッピングモジュールと、構文マッピングモジュールと、事例ベースマッピングモジュールと、モジュール調整ユニットと、整合ユニットとを有し、
前記エキスパートマッピングモジュールが、インターネットから、及び／又は機械読み取り可能公表物から、２つのコーディング標準のコードのペアの確立されたマッピングを収集することと、
前記構文マッピングモジュールが、各コードの記述を含む２つのコーディング標準にアクセスして、前記記述を用いて前記２つのコーディング標準のコードのペアの類似度を求め、構文マッピングを提供することと、
前記事例ベースマッピングモジュールが、両方のコーディング標準で注釈された既存のケースにアクセスして、２つのコーディング標準のコードのペアの事例ベースマッピングを求めることと、
前記モジュール調整ユニットが、各モジュールからマッピングを集めることと、
前記整合ユニットが、コーディング標準の一つからのコードの入力を受け入れ、各モジュールから集めたマッピングを用いて、各入力コードから他のコーディング標準のコードへの一以上の好適なマッピングを抽出することを含む、
方法。
計算デバイスで実行されたとき、前記計算デバイスに請求項１４に記載の方法を実行させるコンピュータプログラム。