JP2009510639A - 医療用語の曖昧性を判定するシステム、方法およびソフトウェア - Google Patents
医療用語の曖昧性を判定するシステム、方法およびソフトウェア Download PDFInfo
- Publication number
- JP2009510639A JP2009510639A JP2008533783A JP2008533783A JP2009510639A JP 2009510639 A JP2009510639 A JP 2009510639A JP 2008533783 A JP2008533783 A JP 2008533783A JP 2008533783 A JP2008533783 A JP 2008533783A JP 2009510639 A JP2009510639 A JP 2009510639A
- Authority
- JP
- Japan
- Prior art keywords
- term
- medical
- terms
- information database
- ambiguity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 18
- 230000006870 function Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 206010047313 Verbigeration Diseases 0.000 description 1
- 206010047700 Vomiting Diseases 0.000 description 1
- 208000027418 Wounds and injury Diseases 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 208000014674 injury Diseases 0.000 description 1
- 210000004185 liver Anatomy 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008673 vomiting Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/3332—Query translation
- G06F16/3338—Query expansion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/93—Document management systems
- G06F16/94—Hypermedia
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Business, Economics & Management (AREA)
- General Business, Economics & Management (AREA)
- Medical Treatment And Welfare Office Work (AREA)
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
本願の一部は、著作権保護の対象となる記述を含む。著作権所有者は、特許商標庁の保管する特許ファイルまたは記録に記載がある場合、何者かによる本特許文献または本特許開示の複製に異議はないが、それ以外はいかなる場合も全著作権を所有する。以下の表示は本願に適用される:
本願は、2005年10月4日に申請された米国仮特許第60/723,483号に対して優先権を主張する。前記仮特許は、引用することにより本願に援用される。
本発明の多様な実施例は、文書の医療的文脈を判別し、前記医療的文脈に基づき文書を別の文書にリンクさせるシステム、方法およびソフトウェアに関する。
インターネットやその他のコンピュータネットワークの目覚ましい発展により、こうしたネットワークを通してデータへのアクセスが容易になった。データにアクセスする有効な形態の1つは、電子文書内のハイパーリンクの使用である。
多くのハイパーリンクは手動で作成され文書に挿入されるが、近年、文書テキストの種類を判別し、判別したテキストをハイパーリンクにより別の関連する文書へリンクする自動化技術が開発されている。例えば、法律関連のリサーチを円滑にするために、ウェストロー・リーガル・リサーチシステム(the Westlaw legal research system)は、テキスト内の法律の引用や弁護士の名前を判別し、引用に関してはデータベース内の対応する法律文書に、弁護士の名前はオンラインディレクトリ内の人名索引にリンクする。詳細は、特許文献1および特許文献2を参照。両出願は、引用することにより本願に援用される。
従って、本発明者は用語が医療用語であるか、非医療用語であるかを判別する方法を自動化する必要性を認識している。
図1と図2を参照および引用する以下の詳細な説明は、本発明の1つ以上の典型的実施例を説明し図示する。実施例は、本発明を典型的に示し解説するために提供されるがこれに限らず、当業者が本発明を利用するに足り得るに十分なだけ詳細に図示、解説される。従って、本発明を不明瞭にすることを避けるために、当業者に周知の内容に関する解説を省くこともある。
図1は、医療用語など用語の曖昧性を判定するためのシステム、方法およびソフトウェアを使用した典型的コンピュータシステム100の図である。この典型的システムは、分離した別のコンポーネントを相互接続したアンサンブルとして表されているが、別の実施例ではより多くのまたはより少ない数のコンポーネントを用いてその機能性を提供する。さらに、いくつかの実施例では、有線またはワイヤレスの、ローカルまたはワイドエリアネットワークを通して、1つ以上のコンポーネントを相互接続する。いくつかの実施例は、1つ以上の大型凡用コンピュータまたはサーバを利用して、システム100の1つ以上の部位を実行する。従って、本発明は特定の機能分割に限るものではない。
曖昧性スコアは、例えばある用語を含む文書内にその用語に関連するULMS文書に戻るリンクを挿入することが適切であるかを判断するなど、様々な目的で使用される。例えば、1.5以上の曖昧性スコアを有する用語を示す出力用語は明らかに医療用語であると判定されてもよく、従って高い信頼度を持って、関連するULMS文書にリンクされてよい。一方、低値のスコアを有する「言葉のサラダ」や「先行嘔吐」などの用語は一般的に、文脈的な裏付けなしに関連するULMS文書にリンクされるべきではない。
図2は、オペーレーティングシステム100の典型的方法を図示するフローチャート200を示す。フローチャート200は、プロセスブロック210−230を含む。
これらのブロック(および本願の別のフローチャートに記載されるブロック)は、典型的実施例において直列に配列されているが、別の実施例においては、複数のプロセッサ、または2つ以上のバーチャルマシンまたはサブプロセッサとして編成される単一プロセッサを使用して、2つ以上のブロックを再配列したり、1つ以上のブロックを削除したり、および/または2つ以上のブロックを並列に実行することもある。さらに、また別の実施例では、1つ以上の、特定の相互接続されたハードウェア、またはモジュール間でおよびモジュールを通して関連するコントロールおよびデータ信号を伝達する集積回路モジュールとして、ブロックを実行する。従って、本願におけるこの典型的プロセスおよび別の典型的プロセスは、ソフトウェア、ファームウェア、ハードウェアおよびその他の種類の実装に適応できる。
上記実施例は本発明を実施または実行する1つ以上の方法を図示および解説することを目的とするもので、幅や範囲を限定するものではない。本発明を実施または実行する全ての方法を含んだ本発明の実際の範囲は、以下の請求項およびその相当物によってのみ定義される。
Claims (6)
- 用語を受け取るステップと、第一および第二言語モデルに基づく前記用語の曖昧性スコアを判定するステップと、前記曖昧性スコアを出力するステップとを含む、コンピュータを使用した方法。
- 前記第一言語モデルが文書の医療情報データベースに基づき、前記第二言語モデルが文書の法律関連または一般のニュース関連情報データベースに基づいている、請求項1に記載のコンピュータを使用した方法。
- 前記曖昧性スコアは、医療情報データベースに基づく前記用語の確率に対する、非医療情報データベースに基づく前記用語の確率の比率である、請求項1に記載のコンピュータを使用した方法。
- 2つ以上の用語の組み合わせを提供する手段と、第一および第二言語モデルに基づく、前記用語のそれぞれに対する曖昧性スコアを判定する手段と、前記用語のそれぞれの前記曖昧性スコアを出力する手段とを含む、コンピュータシステム。
- 前記第一言語モデルが文書の医療情報データベースに基づき、前記第二言語モデルが文書の法律関連または一般のニュース関連の情報データベースに基づいている、請求項4のコンピュータシステム。
- それぞれの曖昧性スコアは、医療情報データベースに基づく前記用語の確率に対する、非医療情報データベースに基づく前記用語の確率の比率である、請求項4のシステム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US72348305P | 2005-10-04 | 2005-10-04 | |
PCT/US2006/038671 WO2007044350A2 (en) | 2005-10-04 | 2006-10-04 | Systems, methods, and software for assessing ambiguity of medical terms |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011158491A Division JP5399450B2 (ja) | 2005-10-04 | 2011-07-19 | 医療用語の曖昧性を判定するシステム、方法およびソフトウェア |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2009510639A true JP2009510639A (ja) | 2009-03-12 |
Family
ID=37831729
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008533783A Pending JP2009510639A (ja) | 2005-10-04 | 2006-10-04 | 医療用語の曖昧性を判定するシステム、方法およびソフトウェア |
JP2011158491A Expired - Fee Related JP5399450B2 (ja) | 2005-10-04 | 2011-07-19 | 医療用語の曖昧性を判定するシステム、方法およびソフトウェア |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011158491A Expired - Fee Related JP5399450B2 (ja) | 2005-10-04 | 2011-07-19 | 医療用語の曖昧性を判定するシステム、方法およびソフトウェア |
Country Status (9)
Country | Link |
---|---|
US (1) | US9317601B2 (ja) |
EP (1) | EP1934843A2 (ja) |
JP (2) | JP2009510639A (ja) |
CN (1) | CN101351794B (ja) |
AR (1) | AR056123A1 (ja) |
AU (2) | AU2006302523A1 (ja) |
BR (1) | BRPI0616809B1 (ja) |
CA (1) | CA2624816C (ja) |
WO (1) | WO2007044350A2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPWO2014083835A1 (ja) * | 2012-11-27 | 2017-01-05 | 日本電気株式会社 | 文書分析装置、文書分析方法及び文書分析プログラム |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1934843A2 (en) | 2005-10-04 | 2008-06-25 | Thomson Global Resources | Systems, methods, and software for assessing ambiguity of medical terms |
US9501467B2 (en) | 2007-12-21 | 2016-11-22 | Thomson Reuters Global Resources | Systems, methods, software and interfaces for entity extraction and resolution and tagging |
US10049100B2 (en) | 2008-01-30 | 2018-08-14 | Thomson Reuters Global Resources Unlimited Company | Financial event and relationship extraction |
JP5128328B2 (ja) * | 2008-03-13 | 2013-01-23 | 日本放送協会 | 曖昧性評価装置およびプログラム |
US20130253910A1 (en) * | 2012-03-23 | 2013-09-26 | Sententia, LLC | Systems and Methods for Analyzing Digital Communications |
US9064492B2 (en) | 2012-07-09 | 2015-06-23 | Nuance Communications, Inc. | Detecting potential significant errors in speech recognition results |
US11152084B2 (en) * | 2016-01-13 | 2021-10-19 | Nuance Communications, Inc. | Medical report coding with acronym/abbreviation disambiguation |
EP3223179A1 (en) * | 2016-03-24 | 2017-09-27 | Fujitsu Limited | A healthcare risk extraction system and method |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000194696A (ja) * | 1998-12-23 | 2000-07-14 | Xerox Corp | サンプルテキスト基調言語自動識別方法 |
JP2002535779A (ja) * | 1999-01-25 | 2002-10-22 | ウエスト パブリッシング カンパニー,ディー.ビー.エー.ウエスト グループ | 文書へハイパーリンクを挿入するシステム |
WO2003060767A2 (en) * | 2001-12-21 | 2003-07-24 | West Publishing Company, Dba West Group | System, method and software for automatic hyperlinking of persons’ names in documents to professional directories |
US20030154208A1 (en) * | 2002-02-14 | 2003-08-14 | Meddak Ltd | Medical data storage system and method |
US20050080613A1 (en) * | 2003-08-21 | 2005-04-14 | Matthew Colledge | System and method for processing text utilizing a suite of disambiguation techniques |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3040945B2 (ja) * | 1995-11-29 | 2000-05-15 | 松下電器産業株式会社 | 文書検索装置 |
JP3347088B2 (ja) * | 1999-02-12 | 2002-11-20 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 関連情報検索方法およびシステム |
US7124031B1 (en) * | 2000-05-11 | 2006-10-17 | Medco Health Solutions, Inc. | System for monitoring regulation of pharmaceuticals from data structure of medical and labortory records |
GB2364814A (en) * | 2000-07-12 | 2002-02-06 | Canon Kk | Speech recognition |
US20030105638A1 (en) * | 2001-11-27 | 2003-06-05 | Taira Rick K. | Method and system for creating computer-understandable structured medical data from natural language reports |
US20040210443A1 (en) * | 2003-04-17 | 2004-10-21 | Roland Kuhn | Interactive mechanism for retrieving information from audio and multimedia files containing speech |
GB0322600D0 (en) * | 2003-09-26 | 2003-10-29 | Univ Ulster | Thematic retrieval in heterogeneous data repositories |
US7240049B2 (en) * | 2003-11-12 | 2007-07-03 | Yahoo! Inc. | Systems and methods for search query processing using trend analysis |
US8024128B2 (en) * | 2004-09-07 | 2011-09-20 | Gene Security Network, Inc. | System and method for improving clinical decisions by aggregating, validating and analysing genetic and phenotypic data |
US7630947B2 (en) * | 2005-08-25 | 2009-12-08 | Siemens Medical Solutions Usa, Inc. | Medical ontologies for computer assisted clinical decision support |
EP1934843A2 (en) | 2005-10-04 | 2008-06-25 | Thomson Global Resources | Systems, methods, and software for assessing ambiguity of medical terms |
-
2006
- 2006-10-04 EP EP06825408A patent/EP1934843A2/en not_active Withdrawn
- 2006-10-04 AU AU2006302523A patent/AU2006302523A1/en not_active Abandoned
- 2006-10-04 JP JP2008533783A patent/JP2009510639A/ja active Pending
- 2006-10-04 CN CN200680037240.2A patent/CN101351794B/zh not_active Expired - Fee Related
- 2006-10-04 CA CA2624816A patent/CA2624816C/en active Active
- 2006-10-04 BR BRPI0616809A patent/BRPI0616809B1/pt not_active IP Right Cessation
- 2006-10-04 WO PCT/US2006/038671 patent/WO2007044350A2/en active Application Filing
- 2006-10-04 AR ARP060104375A patent/AR056123A1/es not_active Application Discontinuation
- 2006-10-04 US US11/538,583 patent/US9317601B2/en active Active
-
2011
- 2011-05-18 AU AU2011202308A patent/AU2011202308A1/en not_active Abandoned
- 2011-07-19 JP JP2011158491A patent/JP5399450B2/ja not_active Expired - Fee Related
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000194696A (ja) * | 1998-12-23 | 2000-07-14 | Xerox Corp | サンプルテキスト基調言語自動識別方法 |
JP2002535779A (ja) * | 1999-01-25 | 2002-10-22 | ウエスト パブリッシング カンパニー,ディー.ビー.エー.ウエスト グループ | 文書へハイパーリンクを挿入するシステム |
WO2003060767A2 (en) * | 2001-12-21 | 2003-07-24 | West Publishing Company, Dba West Group | System, method and software for automatic hyperlinking of persons’ names in documents to professional directories |
JP2005539283A (ja) * | 2001-12-21 | 2005-12-22 | ウエスト パブリッシング カンパニー,ディー.ビー.エー.ウエスト グループ | 名前をハイパーリンクするためのシステム、方法、及びソフトウェア |
US20030154208A1 (en) * | 2002-02-14 | 2003-08-14 | Meddak Ltd | Medical data storage system and method |
US20050080613A1 (en) * | 2003-08-21 | 2005-04-14 | Matthew Colledge | System and method for processing text utilizing a suite of disambiguation techniques |
Non-Patent Citations (1)
Title |
---|
藤井敦、外1名: "World Wide Webを用いた事典知識情報の抽出と組織化", 電子情報通信学会論文誌, vol. 第J85-D-II巻,第2号, JPN6011001923, 1 February 2002 (2002-02-01), JP, pages 300 - 307, ISSN: 0001827590 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPWO2014083835A1 (ja) * | 2012-11-27 | 2017-01-05 | 日本電気株式会社 | 文書分析装置、文書分析方法及び文書分析プログラム |
Also Published As
Publication number | Publication date |
---|---|
CN101351794A (zh) | 2009-01-21 |
AU2006302523A1 (en) | 2007-04-19 |
BRPI0616809A2 (pt) | 2011-07-05 |
WO2007044350A2 (en) | 2007-04-19 |
WO2007044350A3 (en) | 2007-06-21 |
US20070156674A1 (en) | 2007-07-05 |
JP5399450B2 (ja) | 2014-01-29 |
AU2011202308A1 (en) | 2011-06-09 |
BRPI0616809B1 (pt) | 2018-10-23 |
JP2011233162A (ja) | 2011-11-17 |
CA2624816A1 (en) | 2007-04-19 |
CA2624816C (en) | 2016-01-26 |
CN101351794B (zh) | 2016-02-10 |
AR056123A1 (es) | 2007-09-19 |
US9317601B2 (en) | 2016-04-19 |
EP1934843A2 (en) | 2008-06-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5399450B2 (ja) | 医療用語の曖昧性を判定するシステム、方法およびソフトウェア | |
US8788260B2 (en) | Generating snippets based on content features | |
Van Hooland et al. | Exploring entity recognition and disambiguation for cultural heritage collections | |
US9245009B2 (en) | Detecting and executing data re-ingestion to improve accuracy in a NLP system | |
US8972413B2 (en) | System and method for matching comment data to text data | |
JP5229226B2 (ja) | 情報共有システム、情報共有方法、および情報共有プログラム | |
US8661035B2 (en) | Content management system and method | |
US10387468B2 (en) | Identifying a stale data source to improve NLP accuracy | |
US9830391B1 (en) | Query modification based on non-textual resource context | |
US20160188569A1 (en) | Generating a Table of Contents for Unformatted Text | |
JP2013061951A (ja) | カテゴリ化によるホスト・コンテンツとゲスト・コンテンツの自動マッチングのための機構 | |
US20130275438A1 (en) | Disambiguating authors in social media communications | |
Lu et al. | Spell checker for consumer language (CSpell) | |
US20150012806A1 (en) | Method and apparatus for determining the relevancy of hyperlinks | |
US9811592B1 (en) | Query modification based on textual resource context | |
CN109657043B (zh) | 自动生成文章的方法、装置、设备及存储介质 | |
CN113127776A (zh) | 面包屑路径生成方法、装置及终端设备 | |
US8892596B1 (en) | Identifying related documents based on links in documents | |
CN113609271A (zh) | 基于知识图谱的业务处理方法、装置、设备及存储介质 | |
JP2009070222A (ja) | 通信装置、そのmmi方法およびプログラム | |
Adesina et al. | Text messaging and retrieval techniques for a mobile health information system | |
JP4791169B2 (ja) | 関連語抽出装置、関連語抽出方法 | |
JP6796337B2 (ja) | 評釈データベース作成装置、評釈データベース作成方法、評釈データベース作成プログラム | |
US20150169526A1 (en) | Heuristically determining key ebook terms for presentation of additional information related thereto | |
Formanek | Exploring the potential of large language models and generative artificial intelligence (GPT): Applications in Library and Information Science |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110119 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20110418 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20110425 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20110518 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20110525 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20110617 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20110624 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110719 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20110816 |