JP2009265758A - 用語入力支援装置及び方法、並びにプログラム - Google Patents
用語入力支援装置及び方法、並びにプログラム Download PDFInfo
- Publication number
- JP2009265758A JP2009265758A JP2008111615A JP2008111615A JP2009265758A JP 2009265758 A JP2009265758 A JP 2009265758A JP 2008111615 A JP2008111615 A JP 2008111615A JP 2008111615 A JP2008111615 A JP 2008111615A JP 2009265758 A JP2009265758 A JP 2009265758A
- Authority
- JP
- Japan
- Prior art keywords
- term
- character string
- input
- dictionary
- candidate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
Abstract
【解決手段】予め、専門用語辞書と、読みに変換したパターンと、構成要素に展開したパターンについて、全ての部分文字列の頻度を計算した部分文字列辞書を作成する。そして入力段階で、通常の文字(カタカナひらがな漢字、アルファベット、数字)に加えて、判別できない文字を任意文字として指定する手段と、漢字を構成する偏・旁の並びを指定する手段を用意する。最後に、変換対象となる入力文章に含まれる全ての部分文字列を特徴素とし、各部分文字列の頻度の逆数を基に計算される値を特徴量とする特徴ベクトルを生成し、入力と専門用語間の距離を計算して、予め定められた上限数だけ類似度の高い順に候補を返す。
【選択図】図1
Description
図2は、本発明において対象とする入力サンプル例を示している。即ち、オペレータがその入力サンプルを見てサンプルの記載内容をコンピュータに入力する。図2は、契約(予定)者から保険会社に提出される診断書の一例200である。
図1は、本発明の実施形態による文字列入力支援装置(診断書入力システム)の概略構成を示す図である。診断書入力システムは、入力装置110と、画像入力装置111と、表示装置12と、CPU13と、印刷手段14と、ワークエリア15と、情報保持手段16と、を備えている。
図4は、IME(input method editor)と連携して、専門用語の入力を支援する場合の処理概略を説明するためのフローチャートである。当該フローチャートの動作主体は、特に断らない限り、CPU13である。
図5は、IME(input method editor)等により入力されたかな部首混在文字列を入力として受け取り、専門用語候補を出力として返す処理の詳細を説明するためのフローチャートである。ここでも各ステップの処理の動作主体は、特に断らない限り、CPU13である。
図6は、専門用語変換で用いる部分文字列辞書を生成するための処理(図5の用語辞書の前処理)を説明するためのフローチャートである。上述同様、各ステップの処理の動作主体は、特に断らない限り、CPU13である。
以上のようにして、図11のテーブル1130に示されるような部分文字列頻度辞書(図1における162)が生成される。
図7は診断書の入力を行う場合のGUIの一例を示す図である。図7のGUI例は、入力対象の診断書を表示する表示部701と、診断書を見ながらオペレータが対応する項目を入力する入力部702と、を含んでいる。例示した診断書703には、氏名、生年月日、主病名、主病名の原因、合併症、診療期間、入院期間、傷病発生年月日、所見、実施した手術といった項目が含まれている。
図8は、以上説明した処理を時系列順に並べて示した図である。系列811は、かな入力モードにおける時系列処理ステップを表す。また、系列812は、部首入力モードにおける時系列処理ステップを表す。さらに、系列813は、専門用語変換モードにおける時系列処理ステップを表す。
図16は、部首指定を、かな入力モードの中で実施する場合の処理を説明するためのフローチャートである。ここでは、あらかじめ決められた記号が頭にあるかないかで、部首用のかなと、通常のかなを区別するようにしている。
図11は、本発明における、専門用語変換を実現するための各辞書の構成を示す図である。テーブル1100(専門用語辞書)は、専門用語と使用頻度を格納したテーブルであり、用語ID1101、用語名1102、読み1103、使用頻度1104から構成される。テーブル1110(用語使用日時辞書)は、用語変換確定日時を格納したテーブルであり、用語ID1111、使用日時1112から構成される。テーブル1110(用語使用日時辞書)は、用語ID1111によってテーブル1100(専門用語辞書)と結び付けられている。
図12は、本発明の実施形態において専門用語変換を実現するための入力文脈辞書の内容を示す図である。テーブル1200(入力文脈辞書)は、既に入力済みの項目がある時に、現在入力中の項目の確信度を制御するための同時出現確率を格納している。
本発明の実施形態では、テーブル1100(専門用語辞書)およびデーブル1130(部分文字列頻度辞書)を参照して、入力文字列から、部分文字列を特徴素とする特徴ベクトルを構成する(図5参照)。但し、全ての部分文字列をそのまま用いる場合は、ベクトルの次元数が爆発するため、計算量が増大する。また部分文字列同士は厳密には独立ではなく、依存関係があるため、間違った候補の部分文字列の重みを重複してカウントすることがある。
本発明の別の態様として、候補優先度演算を省略する場合について説明する。
本発明のさらに別の態様として、使用頻度と入力履歴を組み合わせた優先度計算方法について説明する。本演算は、テーブル1100および1110を参照する。まず、図5の部分文字列辞書引き処理(ステップS501)を実行した後、候補にあがった各専門用語用語について、テーブル1110の使用日時1112の新しい順にソートする。その順位をOrdertime(term)とする。次に、専門用語辞書1100の使用頻度1104の値の大きい順にソートする。その順位をOrderfreq(term)とする。以上を用いて、候補優先度を以下の式2を用いて演算する。
本発明は、金融機関、生・損保等において、契約者が持ち込む文書データの入力を行う場面などで有効に適用することができる。
Claims (20)
- 難読な又は判別困難な文字を含む対象用語の手入力作業を支援する用語入力支援装置であって、
前記対象用語は少なくとも第1の文字列と第2の文字列を有し、前記第1の文字列を入力されたかな情報から漢字変換して確定する確定手段と、
入力された前記第2の文字列の一部を構成する部首名と、前記確定された第1の文字列との組み合せから、前記第2の文字列の候補を特定し、前記対象用語の候補を提示する候補提示手段と、
入力された指示に従って前記候補の中から前記対象用語を決定する用語決定手段と、
を備えることを特徴とする用語入力支援装置。 - 前記候補提示手段は、前記第1の文字列と前記第2の文字列との組み合せにおいて連続する複数の文字で構成される部分文字列と、複数の用語を格納する用語辞書の各用語との類似度を計算して、類似度の高い順に所定数の候補を提示することを特徴とする請求項1に記載の用語入力支援装置。
- さらに、前記複数の用語の構成文字及びそれらの組み合せのそれぞれについて、前記用語辞書における出現頻度と、対応する元の用語の情報とを対応付けて格納する部分文字列辞書と、を備え、
前記候補提示手段は、前記部分文字列の前記出現頻度を前記部分文字列辞書から取得し、前記出現頻度の逆数を基に特徴量を計算し、各部分文字列の特徴量と前記用語辞書に含まれる各用語の特徴量とを比較して前記類似度を計算することを特徴とする請求項2に記載の用語入力支援装置。 - 複数の文字で構成される用語の手入力作業を支援する用語入力支援装置であって、
前記用語は少なくとも第1の文字列と第2の文字列を有し、前記第1の文字列を入力された情報から確定する確定手段と、
入力された、前記第2の文字列を構成する一部の情報である一部構成情報と、前記確定された第1の文字列とから、前記第2の文字列の候補を提示する候補提示手段と、
前記第2の文字列の候補を確定し、前記用語を決定する用語決定手段と、
を備えることを特徴とする用語入力支援装置。 - 前記第1の文字列は第1の入力モードによって入力され、前記一部構成情報は前記第1の入力モードとは異なる第2の入力モードによって入力されることを特徴とする請求項4に記載の用語入力支援装置。
- 前記第1の文字列と前記第2の文字列とは、オペレータの指定によって区別されることを特徴とする請求項4に記載の用語入力支援装置。
- 前記候補提示手段は、前記第1の文字列と前記一部構成情報との組み合せにおいて連続する複数の文字で構成される部分文字列と、複数の用語を格納する用語辞書の各用語との類似度を計算して、類似度の高い順に所定数の候補を提示することを特徴とする請求項4に記載の用語入力支援装置。
- さらに、前記複数の用語の構成文字及びそれらの組み合せのそれぞれについて、前記用語辞書における出現頻度と、対応する元の用語の情報とを対応付けて格納する部分文字列辞書と、を備え、
前記候補提示手段は、前記部分文字列の前記出現頻度を前記部分文字列辞書から取得し、前記出現頻度を用いて特徴量を計算し、各部分文字列の特徴量と前記用語辞書に含まれる各用語の特徴量とを比較して前記類似度を計算することを特徴とする請求項7に記載の用語入力支援装置。 - 前記候補提示手段は、前記部分文字列の特徴量を計算する際に、同一用語から派生する複数の部分文字列に関し、包含関係にある文字数の少ない部分文字列を前記特徴量の計算対象から除外することを特徴とする請求項8に記載の用語入力支援装置。
- 前記候補提示手段は、前記部分文字列を含む用語の数の最小値が予め設定された上限候補以下である場合には、当該部分文字列を含む用語をそのまま提示することを特徴とする請求項7に記載の用語入力支援装置。
- さらに、前記用語辞書に含まれる用語同士が組み合される確率を意味する同時出現確率を格納する文脈辞書を備え、
前記候補提示手段は、既に入力して確定済の用語と前記候補との前記同時出現確率を考慮して前記類似度の高さを計算することを特徴とする請求項7に記載の用語入力支援装置。 - コンピュータを用いて複数の文字で構成される用語の手入力作業を支援する用語入力支援方法であって、
前記コンピュータが、
前記用語は少なくとも第1の文字列と第2の文字列を有し、前記第1の文字列を入力された情報から確定する工程と、
入力された、前記第2の文字列を構成する一部の情報である一部構成情報と、前記確定された第1の文字列とから、前記第2の文字列の候補を提示する工程と、
前記第2の文字列の候補を確定し、前記用語を決定する工程と、
を実行することを特徴とする用語入力支援方法。 - 前記第1の文字列は第1の入力モードによって入力され、前記一部構成情報は前記第1の入力モードとは異なる第2の入力モードによって入力されることを特徴とする請求項12に記載の用語入力支援方法。
- 前記第1の文字列と前記第2の文字列とは、オペレータの指定によって区別されることを特徴とする請求項12に記載の用語入力支援方法。
- 前記候補を提示する工程で、前記コンピュータは、前記第1の文字列と前記一部構成情報との組み合せにおいて連続する複数の文字で構成される部分文字列と、複数の用語を格納する用語辞書の各用語との類似度を計算して、類似度の高い順に所定数の候補を提示することを特徴とする請求項12に記載の用語入力支援方法。
- 前記候補を提示する工程で、前記コンピュータは、前記複数の用語の構成文字及びそれらの組み合せのそれぞれについて、前記用語辞書における出現頻度と、対応する元の用語の情報とを対応付けて格納する部分文字列辞書を用い、
前記部分文字列の前記出現頻度を前記部分文字列辞書から取得し、前記出現頻度を用いて特徴量を計算し、各部分文字列の特徴量と前記用語辞書に含まれる各用語の特徴量とを比較して前記類似度を計算することを特徴とする請求項15に記載の用語入力支援方法。 - 前記候補を提示する工程で、前記コンピュータは、前記部分文字列の特徴量を計算する際に、同一用語から派生する複数の部分文字列に関し、包含関係にある文字数の少ない部分文字列を前記特徴量の計算対象から除外することを特徴とする請求項16に記載の用語入力支援方法。
- 前記候補を提示する工程で、前記コンピュータは、前記部分文字列を含む用語の数の最小値が予め設定された上限候補以下である場合には、当該部分文字列を含む用語をそのまま提示することを特徴とする請求項17に記載の用語入力支援方法。
- 前記候補を提示する工程で、コンピュータは、前記用語辞書に含まれる用語同士が組み合される確率を意味する同時出現確率を格納する文脈辞書を用い、
既に入力して確定済の用語と前記候補との前記同時出現確率を考慮して前記類似度の高さを計算することを特徴とする請求項15に記載の用語入力支援方法。 - コンピュータに請求項12に記載の用語入力支援方法を実行させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008111615A JP5207810B2 (ja) | 2008-04-22 | 2008-04-22 | 用語入力支援装置及び方法、並びにプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008111615A JP5207810B2 (ja) | 2008-04-22 | 2008-04-22 | 用語入力支援装置及び方法、並びにプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009265758A true JP2009265758A (ja) | 2009-11-12 |
JP5207810B2 JP5207810B2 (ja) | 2013-06-12 |
Family
ID=41391569
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008111615A Expired - Fee Related JP5207810B2 (ja) | 2008-04-22 | 2008-04-22 | 用語入力支援装置及び方法、並びにプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5207810B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020008994A (ja) * | 2018-07-04 | 2020-01-16 | 株式会社医療情報技術研究所 | 医療文書管理システム |
JP2021012738A (ja) * | 2020-10-22 | 2021-02-04 | 株式会社医療情報技術研究所 | 医療文書管理システム |
WO2021199246A1 (ja) * | 2020-03-31 | 2021-10-07 | 株式会社Peco | 動物医療用語の入力支援システム |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS62245365A (ja) * | 1986-04-16 | 1987-10-26 | Nec Corp | 漢字入力方式 |
JPH01259448A (ja) * | 1988-04-08 | 1989-10-17 | Matsushita Graphic Commun Syst Inc | 漢字入力方式 |
JPH0512257A (ja) * | 1991-02-25 | 1993-01-22 | Toshiba Corp | 文書作成装置 |
JPH08297664A (ja) * | 1995-04-27 | 1996-11-12 | Sharp Corp | 文字列処理装置 |
JPH1011431A (ja) * | 1996-06-19 | 1998-01-16 | Okinawa Nippon Denki Software Kk | 漢字検索装置および方法 |
JP2007034871A (ja) * | 2005-07-29 | 2007-02-08 | Sanyo Electric Co Ltd | 文字入力装置および文字入力装置プログラム |
-
2008
- 2008-04-22 JP JP2008111615A patent/JP5207810B2/ja not_active Expired - Fee Related
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS62245365A (ja) * | 1986-04-16 | 1987-10-26 | Nec Corp | 漢字入力方式 |
JPH01259448A (ja) * | 1988-04-08 | 1989-10-17 | Matsushita Graphic Commun Syst Inc | 漢字入力方式 |
JPH0512257A (ja) * | 1991-02-25 | 1993-01-22 | Toshiba Corp | 文書作成装置 |
JPH08297664A (ja) * | 1995-04-27 | 1996-11-12 | Sharp Corp | 文字列処理装置 |
JPH1011431A (ja) * | 1996-06-19 | 1998-01-16 | Okinawa Nippon Denki Software Kk | 漢字検索装置および方法 |
JP2007034871A (ja) * | 2005-07-29 | 2007-02-08 | Sanyo Electric Co Ltd | 文字入力装置および文字入力装置プログラム |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020008994A (ja) * | 2018-07-04 | 2020-01-16 | 株式会社医療情報技術研究所 | 医療文書管理システム |
WO2021199246A1 (ja) * | 2020-03-31 | 2021-10-07 | 株式会社Peco | 動物医療用語の入力支援システム |
JP6964378B1 (ja) * | 2020-03-31 | 2021-11-10 | 株式会社Peco | 動物医療用語の入力支援システム |
JP2021012738A (ja) * | 2020-10-22 | 2021-02-04 | 株式会社医療情報技術研究所 | 医療文書管理システム |
JP7008939B2 (ja) | 2020-10-22 | 2022-01-25 | 株式会社医療情報技術研究所 | 医療文書管理システム |
Also Published As
Publication number | Publication date |
---|---|
JP5207810B2 (ja) | 2013-06-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2006276911A (ja) | 電子機器およびプログラム | |
JP2011513810A (ja) | 用語識別方法および装置 | |
JP6529254B2 (ja) | 情報処理装置、情報処理方法、プログラムおよび記憶媒体 | |
JP5207810B2 (ja) | 用語入力支援装置及び方法、並びにプログラム | |
JPH1153394A (ja) | 文書処理装置、文書処理プログラムが記憶された記憶媒体、及び文書処理方法 | |
JPH1145289A (ja) | 文書処理装置、文書処理プログラムが記憶された記憶媒体、及び文書処理方法 | |
JPH1145290A (ja) | 文書処理装置、文書処理プログラムが記憶された記憶媒体、及び文書処理方法 | |
US11508139B2 (en) | Information processing apparatus and non-transitory computer readable medium | |
US8335680B2 (en) | Electronic apparatus with dictionary function background | |
JP2011107966A (ja) | 文書処理装置 | |
US11163785B2 (en) | Document search result presentation apparatus and non-transitory computer readable medium | |
US20200301952A1 (en) | Document search assist apparatus and non-transitory computer readable medium, and document search assist system | |
JP7315420B2 (ja) | テキストの適合および修正の方法 | |
JP2009026007A (ja) | 辞書機能を備えた電子装置および制御プログラム | |
WO2015004787A1 (ja) | 入力支援装置 | |
JP5348964B2 (ja) | 情報処理装置、情報処理方法、情報処理システム、およびプログラム | |
US20140111438A1 (en) | System, method and apparatus for the transcription of data using human optical character matching (hocm) | |
JP7491022B2 (ja) | 書類識別装置、書類識別方法及びコンピュータプログラム | |
JP4922030B2 (ja) | 文字列検索装置、方法及びプログラム | |
JP2013182459A (ja) | 情報処理装置、情報処理方法及びプログラム | |
US20220309272A1 (en) | Information processing apparatus and non-transitory computer readable medium storing program | |
JP5233424B2 (ja) | 検索装置およびプログラム | |
JP2003323441A (ja) | イメージカルテ管理システム | |
JP2005208687A (ja) | 多言語文書処理装置及びプログラム | |
JP2016062442A (ja) | 情報表示装置、情報表示プログラムおよび情報表示方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110228 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121016 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121217 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130205 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130219 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160301 Year of fee payment: 3 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 5207810 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160301 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |