JP5696280B1 - 用語統一システム及び用語統一プログラム、並びに用語統一方法 - Google Patents

用語統一システム及び用語統一プログラム、並びに用語統一方法 Download PDF

Info

Publication number
JP5696280B1
JP5696280B1 JP2014079125A JP2014079125A JP5696280B1 JP 5696280 B1 JP5696280 B1 JP 5696280B1 JP 2014079125 A JP2014079125 A JP 2014079125A JP 2014079125 A JP2014079125 A JP 2014079125A JP 5696280 B1 JP5696280 B1 JP 5696280B1
Authority
JP
Japan
Prior art keywords
conversion
term
company
conversion rule
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014079125A
Other languages
English (en)
Other versions
JP2015201024A (ja
Inventor
幸治 松村
幸治 松村
Original Assignee
幸治 松村
幸治 松村
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 幸治 松村, 幸治 松村 filed Critical 幸治 松村
Priority to JP2014079125A priority Critical patent/JP5696280B1/ja
Application granted granted Critical
Priority to PCT/JP2015/061034 priority patent/WO2015156336A1/ja
Publication of JP5696280B1 publication Critical patent/JP5696280B1/ja
Publication of JP2015201024A publication Critical patent/JP2015201024A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/247Thesauruses; Synonyms

Abstract

【課題】 企業ごと及び文書の属性ごとに用語を統一させることができ、しかも、変換対象用語と統一用語の対応関係に影響を受けにくい用語統一システムを提供する。【解決手段】 用語統一システム100は、変換の対象となる変換対象用語、変換を行って統一すべき統一用語、文書のカテゴリ、種別及び分類、並びに変換を行う優先度を含む変換ルールを1又は複数登録した変換ルールテーブル400を企業ごとに記憶する参照用DB116を備える。そして、文書の取り扱い先となる企業の企業ID、文書、カテゴリ、種別及び分類をそれぞれ入力し、入力した企業IDに対応する変換ルールテーブル400から、入力したカテゴリ、種別及び分類に対応する変換ルールを検索し、索出した変換ルールに基づいて、優先度が高い順に、文書における変換対象用語を統一用語に変換する。【選択図】 図4

Description

本発明は、文書における同一内容で異なる表記の用語を統一させるシステム及びプログラム、並びに方法に係り、特に、企業ごと及び文書の属性ごとに用語を統一させることができ、しかも、変換対象用語と統一用語の対応関係に影響を受けにくい用語統一システム及び用語統一プログラム、並びに用語統一方法に関する。
企業が製品に添付するマニュアル等の文書を複数の執筆者が分担して作成する場合に、執筆者によっては、表記にバラツキが生じることがある。例えば、同一内容の用語につき「モニター」「画面」「モニタ」とか、「ユーザー」「ユーザ」「利用者」「使用者」というように異なる表記がなされてしまい、ルールを決めてもなかなか徹底するのが難しい。
従来、文書における同一内容で異なる表記の用語を統一させる技術としては、例えば、特許文献1、2記載の技術が広く知られている。
特許文献1記載の技術は、不統一に使用されやすい用字・用語に対応させて、予め統一すべき用字・用語とした「用字・用語リスト」を作成し、文書中の用語が「用字・用語リスト」にあるかどうかをチェックし、変換が必要であれば、該当の用語を「統一用字・用語」に変換する(特許文献1〔0007〕、〔0008〕)。
特許文献2記載の技術は、標準表記の用語と、これに対応する複数の異表記の用語とを登録して構成され、予め作成された文書内の用語が、用語辞書内の標準表記の用語及びこれに対応する複数の異表記の用語と一致するか否かを検索し、異表記の用語と一致する文書内の用語を標準表記の用語に置換する(特許文献2〔0016〕)。
特開平7−146867号公報 特開平9−259125号公報
しかしながら、特許文献1、2記載の技術にあっては、次の3つの技術的課題があった。
第1に、複数の企業の文書を作成する場合は、同一内容の用語であっても、企業によって統一すべき用語が異なることがある。例えば、「ユーザ」という用語について、企業Aからは「利用者」と統一するように要請されるのに対し、企業Bからは「使用者」と統一するように要請されることがある。特許文献1、2記載の技術にあっては、これに対応することができない。
第2に、同一企業の文書を作成する場合、同一内容の用語であっても、文書の属性によって統一すべき用語が異なることがある。例えば、「テクノロジー」という用語について、機械系の文書では「技術」に統一するように要請されるのに対し、電子系の文書では「テクノロジ」に統一するように要請されることがある。特許文献1、2記載の技術にあっては、これに対応することができない。
第3に、特許文献1、2記載の技術のように、変換対象用語と統一用語を対応づけて予め辞書等に登録する構成にあっては、ある対応関係にある統一用語と、他の対応関係における変換対象用語が同一である場合に、不適切な変換が生じることがある。例えば、変換対象用語「テクノロジー」と統一用語「技術」を対応づけ、変換対象用語「技術」と統一用語「テクニック」を対応づけて辞書等に登録した場合、文書「当社のテクノロジーは、技術者の高い技術によって実現されています。」は、「当社の技術は、技術者の高いテクニックによって実現されています。」が所望の変換結果であるところ、変換対象用語「テクノロジー」を統一用語「技術」に変換し、その後、変換対象用語「技術」を統一用語「テクニック」に変換すると、「当社のテクニックは、技術者の高いテクニックによって実現されています。」が変換結果として得られてしまう。
そこで、本発明は、このような従来の技術の有する未解決の課題に着目してなされたものであって、企業ごと及び文書の属性ごとに用語を統一させることができ、しかも、変換対象用語と統一用語の対応関係に影響を受けにくい用語統一システム及び用語統一プログラム、並びに用語統一方法を提供することを目的としている。
〔発明1〕 上記目的を達成するために、発明1の用語統一システムは、文書における同一内容で異なる表記の用語を統一させる用語統一システムであって、変換の対象となる変換対象用語、変換を行って統一すべき統一用語、前記文書の属性に関する属性情報、及び変換を行う優先度を含む変換ルールを1又は複数登録した変換ルールテーブルを企業ごとに記憶する記憶手段と、前記企業を特定するための企業情報を取得する企業情報取得手段と、前記文書を取得する文書取得手段と、前記属性情報を取得する属性情報取得手段と、前記企業情報取得手段で取得した企業情報に対応する変換ルールテーブルから、前記属性情報取得手段で取得した属性情報に対応する変換ルールを検索する変換ルール検索手段と、前記変換ルール検索手段で索出した変換ルールに基づいて、前記優先度が高い順に、前記文書取得手段で取得した文書における前記変換対象用語を前記統一用語に変換する用語変換手段とを備える。
このような構成であれば、企業情報取得手段により企業情報が、文書取得手段により文書が、属性情報取得手段により属性情報がそれぞれ取得されると、変換ルール検索手段により、取得された企業情報に対応する変換ルールテーブルから、取得された属性情報に対応する変換ルールが検索される。そして、用語変換手段により、索出された変換ルールに基づいて、優先度が高い順に、取得された文書における変換対象用語が統一用語に変換される。
ここで、企業とは、経済活動を継続して営む主体をいい、法人及び個人事業者が含まれる。以下、発明3の用語統一プログラム、及び発明4の用語統一方法において同じである。
また、企業情報取得手段は、例えば、入力装置等から企業情報を入力してもよいし、外部の端末等から企業情報を獲得又は受信してもよいし、記憶装置や記憶媒体等から企業情報を読み出してもよいし、情報処理等により企業情報を生成し又は算出してもよい。したがって、取得には、少なくとも入力、獲得、受信、読出(検索を含む。)、生成及び算出が含まれる。文書取得手段における取得及び属性情報取得手段における取得についても同様であるが、企業情報取得手段、文書取得手段及び属性情報取得手段の取得方法が同一であることを要しない。以下、取得の概念については同じである。
また、記憶手段において複数の情報を対応づけて記憶することとしては、(1)例えば、情報A及び情報Bを同一のレコードに登録するなど、直接対応づけて記憶すること、(2)例えば、情報A及び中間情報を対応づけて登録するテーブルと、情報B及び中間情報を対応づけて登録するテーブルを設けるなど、中間に1又は複数の情報を介して記憶することが含まれる。すなわち、情報Aから情報Bを辿ることができる態様であれば、あらゆるデータ構造を採用することができる。以下、情報を対応づけて記憶する概念については同じである。
また、記憶手段は、変換ルールテーブルをあらゆる手段で且つあらゆる時期に記憶するものであり、変換ルールテーブルを予め記憶してあるものであってもよいし、変換ルールテーブルを予め記憶することなく、本システムの動作時に外部からの入力等によって変換ルールテーブルを記憶するようになっていてもよい。
また、本システムは、単一の装置、端末その他の機器として実現するようにしてもよいし、複数の装置、端末その他の機器を通信可能に接続したネットワークシステムとして実現するようにしてもよい。後者の場合、各構成要素は、それぞれ通信可能に接続されていれば、複数の機器等のうちいずれに属していてもよい。
〔発明2〕 さらに、発明2の用語統一システムは、発明1の用語統一システムにおいて、前記記憶手段は、前記変換ルールテーブルを企業ごとに記憶する更新用記憶手段と、前記更新用記憶手段と同一の記憶内容を保持するための参照用記憶手段とを有し、前記変換ルールの更新要求に応じて前記更新用記憶手段の変換ルールを更新する変換ルール更新手段と、前記変換ルールの参照要求に応じて前記参照用記憶手段の変換ルールを参照する変換ルール参照手段と、前記変換ルール更新手段による更新後の前記更新用記憶手段の記憶内容を前記参照用記憶手段に反映する記憶内容反映手段とを備える。
このような構成であれば、変換ルール更新手段により、変換ルールの更新要求に応じて更新用記憶手段の変換ルールが更新される。更新用記憶手段の更新中は、変換ルール参照手段により、変換ルールの参照要求に応じて参照用記憶手段の変換ルールが参照される。そして、更新用記憶手段の更新完了後は、記憶内容反映手段により、更新後の更新用記憶手段の記憶内容が参照用記憶手段に反映される。
〔発明3〕 一方、上記目的を達成するために、発明3の用語統一プログラムは、文書における同一内容で異なる表記の用語を統一させる用語統一プログラムであって、企業を特定するための企業情報を取得する企業情報取得ステップと、前記文書を取得する文書取得ステップと、前記文書の属性に関する属性情報を取得する属性情報取得ステップと、変換の対象となる変換対象用語、変換を行って統一すべき統一用語、前記属性情報、及び変換を行う優先度を含む変換ルールを1又は複数登録した変換ルールテーブルを企業ごとに記憶する記憶手段の変換ルールテーブルのうち前記企業情報取得ステップで取得した企業情報に対応する変換ルールテーブルから、前記属性情報取得ステップで取得した属性情報に対応する変換ルールを検索する変換ルール検索ステップと、前記変換ルール検索ステップで索出した変換ルールに基づいて、前記優先度が高い順に、前記文書取得ステップで取得した文書における前記変換対象用語を前記統一用語に変換する用語変換ステップとを含む処理をコンピュータに実行させるためのプログラムである。
このような構成であれば、コンピュータによってプログラムが読み取られ、読み取られたプログラムに従ってコンピュータが処理を実行すると、発明1の用語統一システムと同等の作用が得られる。
〔発明4〕 一方、上記目的を達成するために、発明4の用語統一方法は、文書における同一内容で異なる表記の用語を統一させる用語統一方法であって、企業情報取得手段が、企業を特定するための企業情報を取得する企業情報取得ステップと、文書取得手段が、前記文書を取得する文書取得ステップと、属性情報取得手段が、前記文書の属性に関する属性情報を取得する属性情報取得ステップと、変換ルール検索手段が、変換の対象となる変換対象用語、変換を行って統一すべき統一用語、前記属性情報、及び変換を行う優先度を含む変換ルールを1又は複数登録した変換ルールテーブルを企業ごとに記憶する記憶手段の変換ルールテーブルのうち前記企業情報取得ステップで取得した企業情報に対応する変換ルールテーブルから、前記属性情報取得ステップで取得した属性情報に対応する変換ルールを検索する変換ルール検索ステップと、用語変換手段が、前記変換ルール検索ステップで索出した変換ルールに基づいて、前記優先度が高い順に、前記文書取得ステップで取得した文書における前記変換対象用語を前記統一用語に変換する用語変換ステップとを含む。
以上説明したように、発明1の用語統一システム、発明3の用語統一プログラム、又は発明4の用語統一方法によれば、企業情報に対応する変換ルールに基づいて変換が行われるので、企業ごとに統一すべき用語が異なる場合でも、企業ごとの統一用語に変換することができる。また、属性情報に対応する変換ルールに基づいて変換が行われるので、文書の属性ごとに統一すべき用語が異なる場合でも、文書の属性ごとの統一用語に変換することができる。特に、企業及び属性が多数に及んでも、変換ルールテーブルに変換ルールをまとめて登録する構成を採用しているので、データ構造を簡素化することができる。さらに、優先度が高い順に変換が行われるので、ある対応関係にある統一用語と、他の対応関係における変換対象用語が同一である場合に、不適切な変換が生じる可能性を低減することができる。
さらに、発明2の用語統一システムによれば、変換ルールの更新中に変換ルールの参照要求があった場合は、参照用記憶手段の変換ルールテーブルが参照されるので、処理負荷が大きい更新要求があっても、参照処理に与える影響を低減することができる。
ネットワークシステムの構成を示すブロック図である。 更新用データベース(以下、データベースのことを単にDBと略記する。)156に記憶されている変換ルールテーブル400のデータ構造を示す図である。 用語変換処理時の用語統一システム100及びユーザ端末200の動作を示すシーケンスフローである。 用語変換処理部154で実行する用語変換処理を示すフローチャートである。 データベースの更新及び参照時の用語統一システム100及びユーザ端末200の動作を示すシーケンスフローである。
以下、本発明の実施の形態を説明する。図1乃至図5は、本実施の形態を示す図である。
まず、本発明を適用するネットワークシステムの構成を説明する。
図1は、ネットワークシステムの構成を示すブロック図である。
インターネット等のネットワーク199には、図1に示すように、用語統一システム100と、複数のユーザ端末200とが接続されている。
用語統一システム100は、ウェブサーバ110と、内部サーバ150とを有して構成されている。ウェブサーバ110はネットワーク199に、内部サーバ150はウェブサーバ110にそれぞれ接続されている。
ウェブサーバ110は、ユーザ端末200とのインターフェースとなるインターフェース部112を有して構成されている。インターフェース部112は、ユーザ端末200に対して文書の入出力を媒介するための用語変換画面を表示する用語変換画面表示部114と、更新用DB156と同一の記憶内容を保持するための参照用DB116とを有して構成されている。
インターフェース部112は、変換対象又は変換後の文書をXML(eXtensible Markup Language)で構造化し、XMLファイル170として保持する。また、ユーザ端末200からの要求に応じて、変換後の文書をPDF(Portable Document Format)ファイル172としても出力する。
内部サーバ150は、文書中の用語を変換する用語変換処理部154と、企業ごとに変換ルールテーブルを記憶する更新用DB156とを有して構成されている。
ユーザ端末200は、例えば、CPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)及びI/F等をバス接続した一般的なコンピュータと同一機能を有して構成されている。I/Fには、HDD(Hard Disk Drive)等の記憶装置、ディスプレイ等の表示装置、ネットワークアダプタその他の装置が接続されている。ウェブサーバ110及び内部サーバ150のハードウェア構成も同様である。
次に、更新用DB156のデータ構造を説明する。なお、参照用DB116のデータ構造については、更新用DB156と同様であるので説明を省略する。
図2は、更新用DB156に記憶されている変換ルールテーブル400のデータ構造を示す図である。
更新用DB156は、図2に示すように、企業ごとに変換ルールテーブル400を記憶している。各変換ルールテーブル400は、企業IDにより特定することができる。
変換ルールテーブル400には、変換ルールごとに1つのレコードが登録されている。すなわち、1つのレコードが1つの変換ルールを構成する。各レコードは、変換ルールに対して一意に割り当てられたIDを登録するフィールド402と、変換の対象となる変換対象用語を登録するフィールド404と、変換を行って統一すべき統一用語を登録するフィールド406と、文書のカテゴリを登録するフィールド408と、文書の種別を登録するフィールド410と、文書における項目の分類を登録するフィールド412と、変換を行う優先度を登録するフィールド414とを含んで構成されている。
優先度は、優先度が高く設定されている変換対象用語ほど他の変換対象用語よりも先に変換が行われることを制御するための指標であって、値が小さいほど優先度は高いと定義する。優先度の設定は、例えば、次の基準により行う。
第1に、図2の例では、ID「1」のレコードに含まれる統一用語「技術」と、ID「6」のレコードに含まれる変換対象用語「技術」が同一であるので、ID「6」の変換対象用語「技術」は、ID「6」の変換対象用語「テクノロジー」よりも先に変換を行う必要がある。変換順序が逆になった場合は、変換対象用語「テクノロジー」が統一用語「テクニック」に変換されてしまうという不適切な変換が生じるからである。そこで、ID「6」のレコードの優先度をID「1」のレコードの優先度よりも高く設定する。
第2に、図2の例では、ID「3」〜「5」のレコードのように、変換対象用語が複合語で構成されている場合は、変換対象用語のバイト数や文字列の長さが大きいものほど先に変換を行う必要がある。そこで、変換対象用語のバイト数や文字列の長さが大きいものほど優先度を高く設定する。
次に、本実施の形態の動作を説明する。
まず、用語変換処理時の動作を説明する。
図3は、用語変換処理時の用語統一システム100及びユーザ端末200の動作を示すシーケンスフローである。
ユーザ端末200が用語変換処理の実行をリクエストすると(ステップS100)、ウェブサーバ110では、用語変換画面表示部114がリクエストを受け内部処理を開始する(ステップS102)。内部サーバ150では、内部処理が開始されると、用語変換処理部154が、文書のロックを用語統一システム100から取得し(ステップS104)、文書のファイルであるXMLファイル170に対して用語変換処理を開始する(ステップS106)。
ウェブサーバ110では、用語変換処理を開始した時点でユーザ端末200にレスポンスを返す(ステップS108)。ユーザ端末200では、このレスポンスを受けることにより、レスポンス待ちでブラウザが停止することが防止される(ステップS110)。用語変換処理が実行されている間は、文書がロックされているので、ユーザ端末200では、文書を編集することはできない(ステップS112)。
内部サーバ150では、用語変換処理が完了すると(ステップS114)、用語変換処理部154が文書のロックを用語統一システム100から解放する(ステップS116)。ロックが解放されると、ユーザ端末200では、文書を編集することができるようになる(ステップS118)。
用語変換処理部154では、具体的に、図4のフローチャートに示す用語変換処理が実行される。
図4は、用語変換処理部154で実行する用語変換処理を示すフローチャートである。
用語変換処理は、文書における同一内容で異なる表記の用語を統一させる処理であって、用語変換処理部154において実行されると、図4に示すように、まず、ステップS200に移行する。
ステップS200では、文書の取り扱い先となる企業の企業IDを入力し、ステップS202に移行する。企業IDは、ユーザ端末200から入力してもよいし、データベース(不図示)やセッション情報等から入力してもよい。
ステップS202では、XMLファイル170から文書(内容)を入力し、ステップS204に移行して、XMLファイル170から文書のカテゴリを入力し、ステップS206に移行して、XMLファイル170から文書の種別を入力し、ステップS208に移行し、XMLファイル170から文書における対象項目の分類を入力し、ステップS210に移行する。
ステップS210では、ステップS200で入力した企業IDに対応する変換ルールテーブル400から、ステップS204〜S208で入力したカテゴリ、種別及び分類に対応する変換ルールを検索し、ステップS212に移行する。
ステップS212では、索出した変換ルールのうち優先度が最も高く設定されている変換ルールを選択し、選択した変換ルールに含まれる変換対象用語と同一の用語を文書中から検索し、ステップS214に移行する。
ステップS214では、該当の変換対象用語を索出したか否かを判定し、該当の変換対象用語を索出したと判定した場合(YES)は、ステップS216に移行して、索出した変換対象用語を、選択した変換ルールに含まれる統一用語に変換し、ステップS218に移行する。
ステップS218では、ステップS210で索出したすべての変換ルールについて処理が終了したか否かを判定し、すべての変換ルールについて処理が終了したと判定した場合(YES)は、ステップS220に移行する。
ステップS220では、文書におけるすべての項目について処理が終了したか否かを判定し、すべての項目について処理が終了したと判定した場合(YES)は、一連の処理を終了して元の処理に復帰させる。
一方、ステップS220で、すべての項目について処理が終了していないと判定した場合(NO)は、ステップS208に移行する。
一方、ステップS218で、すべての変換ルールについて処理が終了していないと判定した場合(NO)は、ステップS222に移行して、ステップS210で索出した変換ルールのうち優先度が次に高く設定されている変換ルールを選択し、選択した変換ルールに含まれる変換対象用語と同一の用語を文書中から検索し、ステップS214に移行する。
一方、ステップS214で、該当の変換対象用語を索出しないと判定した場合(NO)は、ステップS218に移行する。
例えば、文書の属性としてカテゴリ「機械A」及び種別「取扱説明書」が設定され、著作権情報に「A社」を、本文に「当社のテクノロジーは、最先端のIT技術であり、技術者の高い技術によって実現されています。」を含む文書が与えられた場合、図2の変換ルールテーブル400によれば、ID「1」「3」「5」「6」のレコードが検索され、優先度が高いID「5」「6」「1」「3」の順に変換が行われる。その結果、著作権情報「株式会社A」及び本文「当社の技術は、最先端のITテクノロジーであり、技術者の高いテクニックによって実現されています。」が得られる。
次に、データベースの更新及び参照時の動作を説明する。
図5は、データベースの更新及び参照時の用語統一システム100及びユーザ端末200の動作を示すシーケンスフローである。
ユーザ端末200が変換ルールの更新要求を行うと(ステップS300)、ウェブサーバ110では、用語変換画面表示部114が更新用DB156に対する更新要求を行う(ステップS302)。内部サーバ150では、更新要求を受けると、更新用DB156に対して、変換ルールの内容を更新すべく書き込みを行う。
更新用DB156の更新中に、他のユーザ端末200が変換ルールの参照要求を行うと(ステップS304)、ウェブサーバ110では、用語変換画面表示部114が、参照用DB116に対する参照要求を行い(ステップS306)、参照用DB116から変換ルールを検索し(ステップS308)、検索結果をユーザ端末200に返す(ステップS310)。
更新用DB156の更新が完了すると(ステップS312)、ウェブサーバ110では、ユーザ端末200にレスポンスを返す(ステップS314)。また、内部サーバ150では、更新後の更新用DB156の記憶内容を参照用DB116に非同期で反映する(ステップS316)。
このようにして、本実施の形態では、変換の対象となる変換対象用語、変換を行って統一すべき統一用語、文書のカテゴリ、種別及び分類、並びに変換を行う優先度を含む変換ルールを1又は複数登録した変換ルールテーブル400を企業ごとに記憶する参照用DB116を備え、文書の取り扱い先となる企業の企業ID、文書、カテゴリ、種別及び分類をそれぞれ入力し、入力した企業IDに対応する変換ルールテーブル400から、入力したカテゴリ、種別及び分類に対応する変換ルールを検索し、索出した変換ルールに基づいて、優先度が高い順に、文書における変換対象用語を統一用語に変換する。
これにより、企業IDに対応する変換ルールに基づいて変換が行われるので、企業ごとに統一すべき用語が異なる場合でも、企業ごとの統一用語に変換することができる。また、カテゴリ、種別及び分類に対応する変換ルールに基づいて変換が行われるので、文書のカテゴリ、種別及び分類ごとに統一すべき用語が異なる場合でも、文書のカテゴリ、種別及び分類ごとの統一用語に変換することができる。特に、企業並びにカテゴリ、種別及び分類が多数に及んでも、変換ルールテーブル400に変換ルールをまとめて登録する構成を採用しているので、データ構造を簡素化することができる。さらに、優先度が高い順に変換が行われるので、ある対応関係にある統一用語と、他の対応関係における変換対象用語が同一である場合に、不適切な変換が生じる可能性を低減することができる。
さらに、本実施の形態では、変換ルールの更新要求に応じて更新用DB156の変換ルールを更新し、更新用DB156の更新中は、変換ルールの参照要求に応じて参照用DB116の変換ルールを参照し、更新用DB156の更新完了後は、更新後の更新用DB156の記憶内容を参照用DB116に反映する。
これにより、変換ルールの更新中に変換ルールの参照要求があった場合は、参照用DB116の変換ルールテーブル400が参照されるので、処理負荷が大きい更新要求があっても、参照処理に与える影響を低減することができる。
本実施の形態において、企業IDは、発明1、3又は4の企業情報に対応し、カテゴリ、種別及び分類は、発明1、3又は4の属性情報に対応し、ウェブサーバ110は、発明2の変換ルール参照手段に対応し、参照用DB116は、発明1乃至4の記憶手段、又は発明2の参照用記憶手段に対応している。また、内部サーバ150は、発明2の変換ルール更新手段、又は発明2の記憶内容反映手段に対応し、更新用DB156は、発明2の更新用記憶手段に対応し、ステップS200は、発明1若しくは4の企業情報取得手段、又は発明3若しくは4の企業情報取得ステップに対応している。
また、本実施の形態において、ステップS202は、発明1若しくは4の文書取得手段、又は発明3若しくは4の文書取得ステップに対応し、ステップS204〜S208は、発明1若しくは4の属性情報取得手段、又は発明3若しくは4の属性情報取得ステップに対応している。また、ステップS210、S222は、発明1若しくは4の変換ルール検索手段、又は発明3若しくは4の変換ルール検索ステップに対応し、ステップS212〜S216は、発明1若しくは4の用語変換手段、又は発明3若しくは4の用語変換ステップに対応している。
〔その他の変形例〕
なお、上記実施の形態において、優先度は、値が小さいほど高いと定義したが、値が大きいほど高いと定義することもできる。また、非優先度を設定して変換順序を制御することもできるが、これは、優先度を設定して変換順序を制御することと技術的に同義であり、本発明の技術的思想に包摂されるものである。
また、上記実施の形態及びその変形例においては、企業ごとに変換ルールテーブル400を記憶しているので、例えば、次のような応用も考えられる。
第1に、企業Aについて、企業Aの変換ルールテーブル400と、1又は複数の他社の変換ルールテーブル400を比較し、変換対象用語が同一で表記が異なる統一用語を抽出し、抽出結果をファイル等に出力する。これにより、企業Aは、企業Aが採用している統一用語のうち、同一内容につき他社で採用している統一用語とは異なるものを把握することができるので、他社との関係で統一用語の見直しを検討することができる。
第2に、企業Aについて、企業Aの変換ルールテーブル400と、1又は複数の他社の変換ルールテーブル400を比較し、統一用語が同一で他社の変換ルールテーブル400にのみ登録されている変換対象用語を抽出し、抽出結果をファイル等に出力する。これにより、企業A又は企業Aの文書の執筆者は、ある統一用語につき登録していない変換対象用語を把握することができるので、これを企業Aの変換ルールテーブル400に登録することにより、その統一用語について表記のバラツキを低減することができる。
第3に、上記第1及び第2の構成は、異なる企業間について適用したが、異なるカテゴリ間についても同様に適用することもできる。
第4に、上記第1及び第2の構成は、異なる企業間について適用したが、異なる種別間についても同様に適用することもできる。
第5に、上記第1及び第2の構成は、異なる企業間について適用したが、異なる分類間についても同様に適用することもできる。
100…用語統一システム、 110…ウェブサーバ、 112…インターフェース部、 114…用語変換画面表示部、 116…参照用DB、 150…内部サーバ、 154…用語変換処理部、 156…更新用DB、 170…XMLファイル、 172…PDFファイル、 199…ネットワーク、 200…ユーザ端末、 400…変換ルールテーブル

Claims (6)

  1. 文書における同一内容で異なる表記の用語を統一させる用語統一システムであって、
    変換の対象となる変換対象用語、変換を行って統一すべき統一用語、前記文書の属性に関する属性情報、及び当該変換対象用語が複合語で構成されている場合は当該変換対象用語のバイト数又は文字列の長さが大きいほど高く設定された優先度を含む変換ルールを複数登録した変換ルールテーブルを企業ごとに記憶する記憶手段と、
    前記企業を特定するための企業情報を取得する企業情報取得手段と、
    前記文書を取得する文書取得手段と、
    前記属性情報を取得する属性情報取得手段と、
    前記企業情報取得手段で取得した企業情報に対応する変換ルールテーブルから、前記属性情報取得手段で取得した属性情報に対応する変換ルールを検索する変換ルール検索手段と、
    前記変換ルール検索手段で索出した変換ルールに基づいて、前記優先度が高い順に、前記文書取得手段で取得した文書における前記変換対象用語を前記統一用語に変換する用語変換手段とを備えることを特徴とする用語統一システム。
  2. 請求項1において、
    前記記憶手段は、前記変換ルールテーブルを企業ごとに記憶する更新用記憶手段と、前記更新用記憶手段と同一の記憶内容を保持するための参照用記憶手段とを有し、
    前記変換ルールの更新要求に応じて前記更新用記憶手段の変換ルールを更新する変換ルール更新手段と、
    前記変換ルールの参照要求に応じて前記参照用記憶手段の変換ルールを参照する変換ルール参照手段と、
    前記変換ルール更新手段による更新後の前記更新用記憶手段の記憶内容を前記参照用記憶手段に反映する記憶内容反映手段とを備えることを特徴とする用語統一システム。
  3. 請求項1及び2のいずれか1項において、
    対象の前記企業について、当該企業に係る前記変換ルールテーブルと、当該企業以外の他の前記企業に係る前記変換ルールテーブルを比較し、前記変換対象用語が同一で表記が異なる前記統一用語を抽出する統一用語抽出手段を備えることを特徴とする用語統一システム。
  4. 請求項1乃至3のいずれか1項において、
    対象の前記企業について、当該企業に係る前記変換ルールテーブルと、当該企業以外の他の前記企業に係る前記変換ルールテーブルを比較し、前記統一用語が同一で当該他の企業に係る変換ルールテーブルにのみ登録されている前記変換対象用語を抽出する変換対象用語抽出手段を備えることを特徴とする用語統一システム。
  5. 文書における同一内容で異なる表記の用語を統一させる用語統一プログラムであって、
    企業を特定するための企業情報を取得する企業情報取得ステップと、
    前記文書を取得する文書取得ステップと、
    前記文書の属性に関する属性情報を取得する属性情報取得ステップと、
    変換の対象となる変換対象用語、変換を行って統一すべき統一用語、前記属性情報、及び当該変換対象用語が複合語で構成されている場合は当該変換対象用語のバイト数又は文字列の長さが大きいほど高く設定された優先度を含む変換ルールを複数登録した変換ルールテーブルを企業ごとに記憶する記憶手段の変換ルールテーブルのうち前記企業情報取得ステップで取得した企業情報に対応する変換ルールテーブルから、前記属性情報取得ステップで取得した属性情報に対応する変換ルールを検索する変換ルール検索ステップと、
    前記変換ルール検索ステップで索出した変換ルールに基づいて、前記優先度が高い順に、前記文書取得ステップで取得した文書における前記変換対象用語を前記統一用語に変換する用語変換ステップとを含む処理をコンピュータに実行させるためのプログラムであることを特徴とする用語統一プログラム。
  6. 文書における同一内容で異なる表記の用語を統一させる用語統一方法であって、
    企業情報取得手段が、企業を特定するための企業情報を取得する企業情報取得ステップと、
    文書取得手段が、前記文書を取得する文書取得ステップと、
    属性情報取得手段が、前記文書の属性に関する属性情報を取得する属性情報取得ステップと、
    変換ルール検索手段が、変換の対象となる変換対象用語、変換を行って統一すべき統一用語、前記属性情報、及び当該変換対象用語が複合語で構成されている場合は当該変換対象用語のバイト数又は文字列の長さが大きいほど高く設定された優先度を含む変換ルールを複数登録した変換ルールテーブルを企業ごとに記憶する記憶手段の変換ルールテーブルのうち前記企業情報取得ステップで取得した企業情報に対応する変換ルールテーブルから、前記属性情報取得ステップで取得した属性情報に対応する変換ルールを検索する変換ルール検索ステップと、
    用語変換手段が、前記変換ルール検索ステップで索出した変換ルールに基づいて、前記優先度が高い順に、前記文書取得ステップで取得した文書における前記変換対象用語を前記統一用語に変換する用語変換ステップとを含むことを特徴とする用語統一方法。
JP2014079125A 2014-04-08 2014-04-08 用語統一システム及び用語統一プログラム、並びに用語統一方法 Active JP5696280B1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2014079125A JP5696280B1 (ja) 2014-04-08 2014-04-08 用語統一システム及び用語統一プログラム、並びに用語統一方法
PCT/JP2015/061034 WO2015156336A1 (ja) 2014-04-08 2015-04-08 用語統一システム及び用語統一プログラム、並びに用語統一方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014079125A JP5696280B1 (ja) 2014-04-08 2014-04-08 用語統一システム及び用語統一プログラム、並びに用語統一方法

Publications (2)

Publication Number Publication Date
JP5696280B1 true JP5696280B1 (ja) 2015-04-08
JP2015201024A JP2015201024A (ja) 2015-11-12

Family

ID=52836993

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014079125A Active JP5696280B1 (ja) 2014-04-08 2014-04-08 用語統一システム及び用語統一プログラム、並びに用語統一方法

Country Status (2)

Country Link
JP (1) JP5696280B1 (ja)
WO (1) WO2015156336A1 (ja)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06176018A (ja) * 1992-12-07 1994-06-24 Fuji Xerox Co Ltd 校正支援装置
JPH0785040A (ja) * 1993-09-13 1995-03-31 Hitachi Ltd 表記不統一検出方法およびかな漢字変換方法
JPH07325826A (ja) * 1994-05-31 1995-12-12 Meidensha Corp 日本語処理システム
JPH09259125A (ja) * 1996-03-27 1997-10-03 Hitachi Kokusai Business:Kk 文書作成支援システム及び用語辞書
JP2002157241A (ja) * 2000-09-06 2002-05-31 Fujitsu Ltd 辞書作成装置
JP2003141108A (ja) * 2001-11-08 2003-05-16 Canon Inc 異表記変換方法、異表記変換装置及び記録媒体
JP2009277187A (ja) * 2008-05-19 2009-11-26 Nomura Research Institute Ltd データベースシステム及びデータベースシステムにおける差分コピーの遅延自動復旧方法
JP2011198077A (ja) * 2010-03-19 2011-10-06 Fujitsu Ltd 管理装置、修正候補出力方法および修正候補出力プログラム
JP2012256197A (ja) * 2011-06-08 2012-12-27 Toshiba Corp 表記ゆれ検出装置及び表記ゆれ検出プログラム

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07129577A (ja) * 1993-10-29 1995-05-19 Fuji Xerox Co Ltd 文書校正支援装置

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06176018A (ja) * 1992-12-07 1994-06-24 Fuji Xerox Co Ltd 校正支援装置
JPH0785040A (ja) * 1993-09-13 1995-03-31 Hitachi Ltd 表記不統一検出方法およびかな漢字変換方法
JPH07325826A (ja) * 1994-05-31 1995-12-12 Meidensha Corp 日本語処理システム
JPH09259125A (ja) * 1996-03-27 1997-10-03 Hitachi Kokusai Business:Kk 文書作成支援システム及び用語辞書
JP2002157241A (ja) * 2000-09-06 2002-05-31 Fujitsu Ltd 辞書作成装置
JP2003141108A (ja) * 2001-11-08 2003-05-16 Canon Inc 異表記変換方法、異表記変換装置及び記録媒体
JP2009277187A (ja) * 2008-05-19 2009-11-26 Nomura Research Institute Ltd データベースシステム及びデータベースシステムにおける差分コピーの遅延自動復旧方法
JP2011198077A (ja) * 2010-03-19 2011-10-06 Fujitsu Ltd 管理装置、修正候補出力方法および修正候補出力プログラム
JP2012256197A (ja) * 2011-06-08 2012-12-27 Toshiba Corp 表記ゆれ検出装置及び表記ゆれ検出プログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JPN6014020833; 'Topページ > よくある質問 > 統一用語集・参考辞書・ 参考対訳書・無視単語帳' [online] [検索日2014.5.16],インターネット, 20100514, インターネットアーカイブ *

Also Published As

Publication number Publication date
JP2015201024A (ja) 2015-11-12
WO2015156336A1 (ja) 2015-10-15

Similar Documents

Publication Publication Date Title
US11354493B2 (en) Table cell editing in a spreadsheet constrained to unbounded and searchable lists of values from web service
US8392465B2 (en) Dependency graphs for multiple domains
JP4879580B2 (ja) ユーザ・インタフェースに自動探索メニューを与えるシステムおよび方法
JP5710851B2 (ja) 影響分析のためのシステムおよび方法
US9146955B2 (en) In-memory, columnar database multidimensional analytical view integration
US9336184B2 (en) Representation of an interactive document as a graph of entities
US20090043778A1 (en) Generating etl packages from template
KR101083563B1 (ko) 데이터베이스 관리 방법 및 시스템
JP6070936B2 (ja) 情報処理装置、情報処理方法及びプログラム
KR101355273B1 (ko) 컴퓨팅 시스템 및 그 실행 제어 방법과, 그 실행 제어 프로그램을 기록한 기록 매체
US20100251227A1 (en) Binary resource format and compiler
US7562286B2 (en) Apparatus, system, method and computer program product for document management
US9053450B2 (en) Automated business process modeling
US8433729B2 (en) Method and system for automatically generating a communication interface
US9489459B2 (en) Single point metadata driven search configuration, indexing and execution
CN110704432A (zh) 数据索引的建立方法和装置、可读存储介质、电子设备
US20080059429A1 (en) Integrated search processing method and device
US7475090B2 (en) Method and apparatus for moving data from an extensible markup language format to normalized format
US20120136881A1 (en) Exchanging data using data transformation
US8938715B2 (en) Using the z/OS load module system status index to distinguish product tag files
US11157506B2 (en) Multiform persistence abstraction
KR101828466B1 (ko) 파일시스템을 기반으로 하는 저장장치에서 객체기반 스토리지 인터페이스를 제공하는 방법 및 장치
JP5696280B1 (ja) 用語統一システム及び用語統一プログラム、並びに用語統一方法
US20130218928A1 (en) Information processing device
JP7381290B2 (ja) 計算機システム及びデータの管理方法

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20141202

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20141217

R150 Certificate of patent or registration of utility model

Ref document number: 5696280

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250