JP2009048408A - ドキュメント作成システム、ユーザ端末、サーバ装置、およびプログラム - Google Patents

ドキュメント作成システム、ユーザ端末、サーバ装置、およびプログラム Download PDF

Info

Publication number
JP2009048408A
JP2009048408A JP2007213803A JP2007213803A JP2009048408A JP 2009048408 A JP2009048408 A JP 2009048408A JP 2007213803 A JP2007213803 A JP 2007213803A JP 2007213803 A JP2007213803 A JP 2007213803A JP 2009048408 A JP2009048408 A JP 2009048408A
Authority
JP
Japan
Prior art keywords
term
user terminal
search
document
versatility
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007213803A
Other languages
English (en)
Other versions
JP5026192B2 (ja
Inventor
Stejic Zoran
ゾラン ステイチ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2007213803A priority Critical patent/JP5026192B2/ja
Priority to US12/194,795 priority patent/US20090063959A1/en
Publication of JP2009048408A publication Critical patent/JP2009048408A/ja
Application granted granted Critical
Publication of JP5026192B2 publication Critical patent/JP5026192B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/253Grammatical analysis; Style critique

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

【課題】ドキュメント中に使用する用語の妥当性を通知するドキュメント作成システム、ユーザ端末、サーバ装置およびプログラムを提供すること。
【解決手段】ドキュメント作成システム100は、ドキュメントを作成し、用語を選択してネットワークを介して用語チェック要求を発行し、用語および用語に意味的に関連する関連語のそれぞれの汎用度を登録する汎用性登録手段を含み、選択した前記用語の妥当性を通知するユーザ端末104と、ユーザ端末からの用語チェック要求を受領し、用語または関連語をそれぞれ含むコンテンツについて検索空間(108、110、112)を検索し、検索空間(108、110、112)内のコンテンツの表現の出現頻度を取得してユーザ端末104に各出現頻度を通知するサーバ装置106とを含んでいる。
【選択図】図1

Description

本発明は、ドキュメント作成に関し、より詳細には、ドキュメントに出現する用語表現の妥当性を通知するドキュメント作成システム、ユーザ端末、サーバ装置およびプログラムに関する。
近年、種々のアプリケーションソフトウェアを使用し、パーソナルコンピュータなどの端末装置からテキスト、イメージなどを含むドキュメントを作成することが普及している。作成されたドキュメントは、個人的に使用されたり、また社内文書などとして使用される他、個人的な目的でデスクトップパブリッシングなど小規模印刷などが行われる。
さらに、近年では、ドキュメントをHTML(Hyper Text Markup Language)やXML(eXtensive Markup Language)などの構造化文書として、ホームページなどにアップされる。このような情報は、ネットワークを介して公表され、種々の目的での情報発信が行われている。
特に業務用途に使用されるドキュメントは、ドキュメントの主要な読者が使用する用語を使用して記述することが好ましい。ところが、アプリケーションを使用して作成するドキュメントが多様化するにつれ、ドキュメントの主要な読者が通常使用する用語を都度検索して作成するのではドキュメント作成の効率が低下してしまうという問題がある。また、ドキュメントの内容に精通したオペレータを多数配置しておけば、そのような問題は解消される可能性もある。しかしながら、オペレータを多数配置することは、作業効率、コスト面からも現実的ではない。
また、インターネットサービスプロバイダが提供するデータベースと、企業や団体が管理する限られた範囲内で公式に利用されるデータベースと、ユーザが個人的に作成または管理する、さらに他のデータベースやホームページなどとの間で、特定の用語の出現割合が異なる可能性がある。このため、ドキュメントの作成者が用語表現を選択する場合、ドキュメントの利用範囲も考慮して適切な用語表現を選択する必要があった。
上述した観点から、例えば、特開2005−209071号公報(特許文献1)では、複数の文書データを参照して見出しを抽出し、出現頻度の高い見出しをテンプレートに登録する技術が開示されている。しかしながら、作成されるドキュメントの種類や内容は千差万別であり、ユーザにとって関連のないテンプレートが増えるだけでは、ドキュメントにおける用語表現を提示する目的として充分ではない。
また、特開2002−297583号公報(特許文献2)では、入力された仮の文字が含まれる同型文字グループを検索し、同型文字グループの一覧に表示された文字が選択されると、仮の文字を選択した文字に置換して表示する技術が開示されている。しかしながら、特許文献2で開示された技術は外形的な類似をもって文字を選択するのであり、用語表現を選択することを課題とするものではない。
特開2005−209071号公報 特開2002−297583号公報
上記従来技術が存在するものの、これまで、アプリケーションを利用して作成するドキュメントの種類が増加するにつれ、ドキュメントの内容に適合した用語表現などを効率的に検索し、最も適合した用語表現を利用することが必要とされていた。また、人的なグローバル化の下、ユーザは、ドキュメントを自国語でない言語で記述するような場合もある。この様な場合にも、ユーザは、同様の意味を有していながら、最も適切な表現を与える用語を効率に選択することも必要とされていた。
本発明は、上記従来技術の問題点に鑑みてなされたものであり、ドキュメントを作成する際に、ドキュメントに記載した用語と同義的な用語であって、対象とする言語で、より適切な用語を効率的に選択させる、ドキュメント作成システム、ユーザ端末、サーバ装置、およびプログラムを提供することを目的とする。
本発明では、ユーザが作成したドキュメントで使用した用語は、ユーザ選択に応答して用語チェック要求としてサーバ装置に送信される。サーバ装置は、用語チェック要求すると、用語から見出し語を作成し、見出し語を使用して関連語テーブルを検索し、受信した用語に意味的に関連する表現を与える関連語を取得する。取得された関連語は、受信した用語と共に、WWW、社内データベース、またはプライベートなデータベースなどの検索空間に検索クエリーとして送信され、それぞれの検索空間で、用語または関連語をメタデータとして含むコンテンツが抽出される。
抽出されたコンテンツの数は、用語または関連語それぞれの出現数または出現割合などの出現頻度として処理され、それぞれの表現ごとに出現頻度がユーザ端末に応答データとして送信される。
ユーザ端末は、応答データを受領すると、用語チェックリストに応答データを登録して、用語チェックの結果を累積的に蓄積させ、用語チェックリストを進化させる。受領した応答データは、ユーザ端末のデスクトップ上で、ポップアップウィンドウ、ポップアップメニューなどとして、表現とその出現頻度とが対応して表示され、ユーザに表現の選択を可能とさせている。
すなわち、本実施形態によれば、作成したドキュメントのカテゴリおよび検索空間の相違に対応した用語の妥当性をユーザに通知することが可能となるため、ドキュメントの内容に対してより関連性のある関連語検索が可能となる。また、作成されたドキュメントは、より汎用的な用語を使用して作成されるので、検索性の向上およびドキュメントの質の統一化を行うことが可能となる。
また、本発明によれば、人材のグローバル化に伴い、自国語以外でドキュメントを作成しなければならないユーザが、作成するべき他国語での汎用性のある表現を容易に取得することが可能となり、ドキュメントの品質をさらに向上させることができる。
さらに、本発明によれば、ユーザ端末104は、当初まったく関連語についての情報がない場合でも、サーバ装置106が提供する関連語およびその検索結果を、用語チェックリストに蓄積してゆくことが可能となる。この結果、一旦検索した履歴がある場合や、用語チェックリストに用語が登録されている場合、サーバ装置106にアクセスせずとも用語の選択が可能となり、使用すれば使用するほど効率的な用語選択によるドキュメント作成が可能となる。
すなわち、本発明によれば、ドキュメントが含む用語について適切な表現を提供するドキュメント作成システムであって、前記ドキュメント作成システムは、
前記ドキュメントを作成し、前記用語を選択してネットワークを介して用語チェック要求を発行し、前記用語および前記用語に意味的に関連する関連語のそれぞれの汎用度を登録する汎用度登録手段を含み、選択した前記用語の汎用度を提供するユーザ端末と、
前記ユーザ端末からの用語チェック要求を受領し、前記用語または前記関連語をそれぞれ含むコンテンツについて検索空間を検索し、前記検索空間内の前記コンテンツの表現として出現する前記用語または前記関連語それぞれの出現頻度を取得して前記ユーザ端末に前記各出現頻度を通知するサーバ装置とを含む、ドキュメント作成システムが提供される。
前記汎用度登録手段は、前記ユーザ端末により選択された前記用語についての前記表現の出現頻度を累積的に蓄積することができる。前記ユーザ端末は、前記ドキュメントのカテゴリを指定するカテゴリ指定手段を含み、前記カテゴリ指定手段により指定される前記カテゴリでの前記表現を取得して、前記汎用度登録手段に登録することができる。前記ユーザ端末は、汎用度決定手段を含み、前記汎用度登録手段に登録された前記用語および前記関連語の前記汎用度をランク付けすることができる。
前記サーバ装置は、
前記ネットワークを介して受領した前記用語チェック要求から前記用語の品詞および種類を解析して見出し語を作成し、作成した見出し語を使用して前記関連語を抽出する関連語処理部と、
前記用語および前記関連語を検索クエリーとして前記検索空間の前記コンテンツを検索し、検索結果から出現頻度を計算して前記ユーザ端末への応答データを作成する検索処理部と
を含むことができる。
前記検索処理部は、メタデータに前記用語および前記関連語を含む前記コンテンツを前記検索空間から検索し、出現頻度を計算することができる。前記サーバ装置は、複数の前記検索空間を登録しており、前記検索空間を指定して前記用語および前記関連語の出現頻度を計算することができる。
本発明によれば、作成したドキュメントが含む用語の適切な表現を選択させるユーザ端末であって、前記ユーザ端末は、
前記ドキュメントを作成するためのアプケーション実行部と、
前記アプリケーションが含む前記用語の用語チェック要求を作成し、前記用語チェック要求の結果を処理する用語チェック処理部と、
前記用語に意味的に関連する関連語のそれぞれの汎用度についての応答データを受領して登録する汎用度登録手段と、
前記用語の表示位置に関連して前記汎用度要録手段に登録された前記表現を、前記関連語の出現頻度に対応付けて表示させる表示手段とを含み、
前記汎用度登録手段は、前記ユーザ端末により選択された前記用語および前記用語に関連する前記関連語の各出現頻度を累積的に蓄積する
ユーザ端末が提供される。
本発明の前記ユーザ端末は、前記表示手段に表示された前記関連語の選択に対応して、前記用語を前記選択した関連語に置換する置換手段を含むことができる。前記用語チェック処理部は、前記アプリケーション実行部のプラグインプログラム、アドインプログラムまたはマクロオブジェクトとして実装されることができる。前記用語チェック処理部は、選択された前記用語を受領して、前記用語の検索履歴を判断し、前記用語がすでに検索されていると判断した場合、前記汎用度登録手段から取得した前記用語の表現を表示することができる。
前記ユーザ端末は、
指定されるカテゴリでの前記用語の前記表現を取得して、前記汎用度登録手段に登録するためのカテゴリ指定手段と、
前記汎用度登録手段に登録された前記表現の出現頻度から汎用度をランク付けするための汎用度決定手段とを含むことができる。
さらに、本発明によれば、ネットワークを介して受領した用語の適切な表現を提供するサーバ装置であって、
前記ネットワークを介して受領した用語チェック要求から前記用語の品詞および種類を解析して見出し語を作成し、作成した見出し語を使用して前記用語に意味的に関連する関連語を抽出する関連語処理部と、
前記用語および前記関連語とを検索クエリーとして前記検索空間のコンテンツを検索し、検索結果から前記用語および前記関連語の前記検索空間での各出現頻度を計算して前記用語チェック要求の送信元に送信する応答データを作成する検索処理部と
を含む、サーバ装置が提供される。
前記検索処理部は、メタデータに前記用語および前記関連語を含む前記コンテンツを前記検索空間から検索し、出現頻度を計算することができる。前記サーバ装置は、複数の前記検索空間を登録しており、前記検索空間を指定して前記表現の出現頻度を計算することができる。前記サーバ装置は、前記用語に意味的に関連する前記関連語を、前記用語についての見出し語と対応付けて登録する、関連語登録手段を含むことができる。
本発明では、ユーザ端末を上記いずれか記載の各手段として機能させるためのコンピュータ実行可能なプログラムが提供される。
本発明では、サーバ装置を上記いずれか記載の各手段として機能させるためのコンピュータ実行可能なプログラムが提供される。
以下、本発明を実施形態を用いて説明するが、本発明は実施形態に限定されるものではない。図1は、ドキュメント作成システム100の実施形態を示す。ドキュメント作成システム100は、ローカルエリアネットワーク(LAN)、ワイドエリアネットワーク(WAN)、インターネット(INET)などのネットワーク102を介して、ユーザ端末104と、サーバ装置106とが相互接続されている。ユーザ端末104は、ワードプロセッサアプリケーションやプレゼンテーションアプリケーションなどを使用して公共提供用、社内提供用、または個人用途など種々のカテゴリのドキュメントを作成する。
ユーザ端末104のユーザは、作成しようとするドキュメントの対象や、カテゴリに対して必ずしも精通しているわけではない。このため、使用するべき用語などについて、その用語の汎用性がどの程度あるのか、についてチェックすることを希望している。この目的のため、本実施形態でユーザは、ユーザ端末104で作成したドキュメントから、用語チェックすることを希望する用語を選択し、サーバ装置106に問い合わせる。ユーザは、サーバ装置106からの用語表現の汎用度を取得し、表現をチェックしながらドキュメントの作成を行っている。なお、用語チェックとは、選択した用語に関連し、設定された検索空間での汎用性の高い表現を与える用語自体および関連語を取得する処理を意味する。
サーバ装置106は、ユーザが用語チェックを希望する場合に送信される、ユーザ端末104から用語チェック要求を受領して、用語チェックを実行する。サーバ装置106は、図1に示した実施形態では、検索空間DB_A108、DB_B110、DB_C112を検索する。検索空間DB_A108、DB_B110、DB_C112は、本実施形態では、単一のデータベース(DB)または複数のサイトにおいて管理されたデータベースとして構成することができる。また、他の実施形態では検索を担当するサーバの他、専用のデータベースサーバを使用して検索空間のメンテナンスされるデータベースとすることができる。
より具体的には、DB_A108は、例えばインターネットサービスプロバイダが提供するコンテンツデータベースであり、WWWでアクセス可能な検索空間に対応するデータベースである。DB_B110は、社内データベースなどを管理しており、DB_A108が提供する検索空間よりも小さいが、より専門的なコンテンツを管理するデータベースである。さらに、DB_C112は、よりプライベート性が強く、例えばユーザ個人が作成したホームページやデータベースなどに登録されるコンテンツを管理する。
なお、図1に示した実施形態では、サーバ装置106は、DB_A108、DB_B110、DB_C112の3つの検索空間を検索するものとして示している。他の実施形態では、サーバ装置106は、それぞれDB_A108、DB_B110、DB_C112を独立して検索する独立したサーバ装置とすることができる。サーバ装置106は、ユーザ端末104から用語チェック要求を受領すると、DB_A108、DB_B110、DB_C112と検索し、用語の出現回数または出現頻度をそれぞれの検索空間について取得する。取得した用語チェックの結果は、用語チェック要求を発行したユーザ端末104に送付され、ユーザ端末104のユーザによる表現修正のために利用される。
図2は、サーバ装置106の機能ブロック200を示す。サーバ装置106は、用語チェックを行うための関連語処理部202と、検索処理部204とを含んで構成されている。さらにサーバ装置106は、要求解析部206を含んでいる。要求解析部206は、ネットワーク222を介してユーザ端末104から用語チェック要求を受領し、受領した要求を解析して処理モジュール呼出し処理を実行する。説明した実施形態では、要求解析部206は、用語チェック要求であると判断すると、関連語処理部202を呼び出して、受領した用語を引数として関連語処理部202に渡す。
関連語処理部202は、用語を受領すると用語解析部210を呼出す。用語解析部210は、受領した用語を、例えば用語辞書を使用して解析、用語中に含まれる前置詞、冠詞などを削除し、名詞、形容詞、副詞などを分離する。さらに、用語解析部210により前置詞、冠詞などを削除された用語は、名詞について単数形に統一し、見出し語が作成される。作成された見出し語は、さらに関連語取得部212に渡される。上述したサーバ装置106は、用語解析部210、関連語取得部212、コンテンツ検索部214、検索結果解析部216などについては、Servletなどのサーバプログラムを使用して実装することができる。
関連語取得部212は、生成された見出し語を使用して関連語DB218を検索し、用語に関連する関連語を抽出する。抽出された関連語は、検索キーワードとして検索処理部204に通知される。検索処理部204は、検索するべきドキュメントの検索空間を提供する検索空間220にアクセスして、用語および関連語が、検索空間220でどのように出現するかについての情報を取得する。
検索処理部204は、コンテンツ検索部214と、検索結果解析部216とを含んでいる。コンテンツ検索部214は、これまでに知られている検索エンジンやSQL(Structured Query Language)を使用するリレーショナルデータベースとして実装することができる。外部検索エンジンを使用する場合、コンテンツ検索部214は、中継サーバとして機能してもよい。この実施形態の場合、コンテンツ検索部214は、検索キーワードを受領し、例えば、google(商標)、yahoo!(商標)などの検索サービスプロバイダが提供する検索エンジンへと検索キーワードを送信する。なお、コンテンツ検索部214は、用語チェック要求内にドキュメントのカテゴリ項目が含まれている場合、カテゴリ項目に対応する検索空間のURI(Uniform
Resource Identifier)を選択し、選択した検索空間に対してクエリーを送付する。また、カテゴリ項目が含まれていない場合、登録された複数の検索空間に対してクエリーを送付する。
コンテンツ検索部214は、検索エンジンからの応答を受領して検索結果解析部216に渡す処理を実行する。また、検索結果解析部216は、実装するリレーショナルデータベースやオブジェクト指向データベースなどを使用する場合、データベースが使用することができる検索処理を使用して検索結果を作成することができる。サーバ装置106が中継サーバとして機能する場合、検索結果をXMLなどの構造化文書値して受領し、DOM、SAXなどを使用して検索結果を生成することもできる。検索結果解析部216が作成した検索結果は、応答データとして応答処理部208へと送られる。応答処理部208は、ネットワーク222を介して用語チェック要求を発行したユーザ端末へと送付され、ユーザによる用語チェックのために用いられる。
図3は、関連語DB218が格納する関連語テーブル300の実施形態を示す。関連語テーブル300は、見出し語302を登録するフィールドと、見出し語に関連付けられた関連語を登録するフィールド304とを含んでおり、関連語登録手段として機能する。関連語は、単数または複数の相違を除外し同一の見出し語を含む複数品詞を含む表現として定義することができる。関連語取得部212は、見出し語を受領すると、関連語DB218を検索し、見出し語に対応して登録された関連語を抽出して、関連語の検索結果を作成する。作成された関連語は、ユーザから送付された用語と共にコンテンツ検索部214が検索するための検索クエリーとして使用される。なお、用語チェック要求に含まれる用語自体は、検索空間に対する検索クエリーとして別途使用され、関連語テーブル300にエントリされている必要はない。
図3に示した関連語テーブル300は、見出し語に関連する類義語を登録しておくことができる。また、見出し語が複数の品詞から構成される場合、複数の品詞に関連する類義語推定から得られる類義語を登録しておくことができる。関連語DB218は、ユーザが選択した用語について、その関連語の範囲まで拡張して、ドキュメントのカテゴリに適切な表現を、ユーザ端末に対して提供することを可能とする。また、図3に示した関連語テーブル300は、サーバ装置300が、処理オーバーヘットが少ない時間帯やメンテナンス期間中に、検索対象として登録する検索空間のメタデータを定期的に回収し、見出し語を追加または修正するなどにより作成および更新することができる。
図4は、検索空間220に登録されるコンテンツ400の実施形態を示す。なお、図4では、データ構造をテーブル構造として説明しているが、HTMLやXMLなどの構造化文書として構成されていてもよい。サーバ装置106は、インターネットまたは社内的に利用される場合でも、近年では、HTTP(Hyper Text Transfer Protocol)プロトコルを使用するウェブサーバとして実装される場合が多い。図4に示したコンテンツ400は、サーバ106がウェブサーバとして構成される場合の実施形態であり、コンテンツ400は、コンテンツ識別値を登録するフィールド402と、メタデータを登録するフィールド404とを含む構成とされている。
なお、図4に示した実施形態のテーブルとしてではなく、各フィールドは、OODB(Object Oriented DataBase)のインスタンスとして登録しておくこともできる。コンテンツ識別値を登録するフィールド402には、コンテンツ識別値として、RFC3986などに規定されるURI(Uniform
Resource Identifier)の形式で、コンテンツ400が指定されている。また、コンテンツ400には、フィールド404にメタデータが登録されていて、検索エンジンが検索する場合の検索対象とされている。
例えば、http://www.relational_term.index.htmlで指定されるドキュメントについては、メタデータとして、relational、term、inspection、searchなどのメタデータが登録されている。本実施形態では、メタデータは、コンテンツの内容自体を検索することなく、効率的な検索を行い、かつ関連するコンテンツを効率的にフィルタリングするために利用される。フィールド404に記述されたメタデータは、コンテンツ400の内容を代表するために選択されたキーワードまたはキーワード列である。本実施形態で、例えば社内データベースなどの場合、フィールド404には、コンテンツのカテゴリを記述しておくこともできる。
図5は、ドキュメント作成システム100を構成するユーザ端末の処理の実施形態のフローチャートを示す。処理は、ステップS500から開始し、ステップS501でユーザ端末104で用語を選択する。用語の選択は、ユーザがデスクトップ画面上で、用語範囲をクリック/アンクリックした範囲として行われる。選択した用語は、一旦クエリーキューまたは待ち行列などに登録され、以後の検索処理のために利用される。ステップS502では、選択された用語についてすでに検索した履歴があるか否かを、例えばcookieを参照するか、または後述する用語チェックリストのリスト項目を参照して判断する。用語についてすでに検索している場合、処理をステップS506に分岐させ、すでに検索した用語および関連語についての検索結果をデスクトップ上にポップアップ表示させるための処理を行い、ユーザに通知する。
また、ステップS502で用語についてまだ検索していない場合(no)、ステップS503で用語を含む用語チェック要求を作成し、ネットワークを介してサーバ装置106に送信する。ステップS504でサーバ装置106からのレスポンスとして応答パケットを受領したか否かを判断する。サーバ装置106からのレスポンスを受領した場合(yes)、処理をステップS505に分岐させる。また、サーバ装置106からのレスポンスを受領しない場合(no)、タイムアップが満了するまで処理をステップS504に戻し、レスポンス受領を待機させる。
ステップS505では、受領したレスポンスから応答データを抽出し、用語チェックリストとして用語に対応付けて登録する。なお、説明する実施形態では、用語チェックリストは、テーブル形式として構成される。しかしながら、用語チェックリストは、他の実施形態では、XMLなどの構造化文書の形式で作成することができる。
ステップS506では、用語チェックリストを参照し、対応するデスクトップ上の用語を設定するフィールドにハイパーリンク、ポップアップウィンドウ、ポップアップメニューなどとして用語チェックリストのデータを関連付ける。その後、ユーザが用語指定範囲のクリックまたは右クリックなどに応答して、用語の汎用性についてのデータは、ハイパーリンクしたファイルまたはポップアップウィンドウ、ポップアップメニューなどとしてユーザに表示される。ステップS507では、ユーザが用語の出現頻度のデータを参照して指定したテキストストリング列で当該テキストストリング列で選択範囲の用語を置換して、より汎用性の高い用語のドキュメントを作成する。
ステップS508では、クエリーキューまたは待ち行列を参照し、ユーザが選択した用語について検索を終了したか否かを判断する。選択した用語について検索が終了していない場合(no)処置をステップS509に分岐させ、指定された次の用語を選択し、処理をステップS502に分岐させ、次の用語についての検索を実行させる。また、用語全部について検索が終了した場合(yes)、処理をステップS510に分岐させ、ユーザ端末におけるドキュメントの用語チェック処理を終了する。
図6は、サーバ装置106が実行する処理の実施形態についてのフローチャートである。サーバ装置106の処理を実行するサーバプログラムは、デーモンまたはバックグラウンドサービスとして実行されており、好ましい実施形態では、CGIプログラムを使用して実装することができる。さらに、用語チェックのための対象用語などの各値は、ユーザ端末104からフォームを使用して送信することができる。サーバ装置106が実行する処理は、ステップS600から開始し、ステップS601で受信パケットを解析する。
ステップS602では、受信パケットが用語チェック要求である場合(yes)処理をステップS603に分岐させる。一方、受信パケットが用語チェック要求ではない場合(no)、処理をステップS602に分岐させ、用語チェック要求を受領するまで処理を待機させる。ステップS603では、受信した用語チェック要求から取得した用語に対して解析を行い、見出し語を作成し、関連語DB218に見出し語を照会して関連語を抽出する。
ステップS604では、受信した用語および抽出した関連語をコンテンツ検索部214に通知し、用語および関連語ごとに異なるコンテンツDBに登録されたコンテンツのメタデータを検索し、用語および関連語を含むコンテンツ抽出する。抽出されたコンテンツは、用語または関連語ごとに統計処理され、それぞれの出現頻度を取得する。ステップS605では、用語、関連語について抽出されたコンテンツの数から応答データを作成し、ステップS606で、応答データを送信元のユーザ端末104に送付して処理をステップS602に戻し、処理を終了する。
図7は、ユーザ端末104の機能ブロック700を示す。ユーザ端末104は、パーソナルコンピュータやワークステーションとして構成され、情報処理部702を備えている。情報処理装置702は、各種アプリケーションなどを実行しユーザに対してドキュメントの作成を可能とする。またユーザ端末104は、ディスプレイ装置720、キーボード716、マウス718などの周辺装置を備えていて、ユーザからの指令を受領し、ディスプレイ装置720に表示されるデスクトップ画面から用語のチェック要求を行い、また用語の修正を実行する。なお、ユーザ端末104は、ウェブサーバにアクセスするために、Internet Explorer、Mozilla、Opera、Netscape Navigatorなどのウェブブラウザを実装する。
情報処理部702は、さらにアプリケーション実行部704と、用語チェック処理部706とを含んで実装される。アプリケーション実行部704は、中央処理装置(図示せず)を機能させ、アプリケーションプログラムを実行し、ドキュメントの作成を行い、ハードディスク装置、MO、CD−ROM、DVDなどの記憶媒体に作成したドキュメントを格納する。また、作成したドキュメントは、ネットワークを介してサーバ装置106などの検索空間220に特定形式またはHTML形式などで登録されてもよい。
用語チェック処理部706は、特定の実施形態では、アプリケーションプログラムのプラグインプログラム、アドインプログラムまたはマクロオブジェクトとして実装される。用語チェック処理部706は、ユーザがアプリケーションプログラムから行う用語選択指令や用語チェック指令を処理する。また、用語チェック処理部706は、用語チェック指令を受領して、それぞれの指令に対応する処理を実行する。さらに、用語チェック処理部706は、用語チェックリスト710、汎用度リスト712、カテゴリリスト714などを管理している。用語チェックリスト710は、用語の汎用性を登録する汎用性登録手段として機能しており、サーバ装置106から取得した用語チェック結果を蓄積して、ユーザに対して用語の汎用度を通知するために利用される。
また、汎用度リスト712は、汎用度決定手段として機能し、検索の結果取得された用語の出現頻度や出現回数などの出現情報が、汎用度の高いレベルにあるか、またはほとんど使用されないレベルのものか、またはドキュメントまたはカテゴリに依存するものであるかをユーザに通知するための参照データを格納する。さらにカテゴリリスト714は、作成したドキュメントのカテゴリを指定するカテゴリ指定手段として機能する。
カテゴリリスト714は、ユーザが作成したドキュメントの内容に対応して用語を検索する検索空間などを、例えばWWW空間、社内データベース空間、またはプライベートデータベースなどの検索空間を指定するために使用される。ユーザは、カテゴリを選択する場合、プルダウンメニューなどとして表示するカテゴリ項目を選択する。選択されたカテゴリ項目は、サーバ装置106に送られて、検索空間を指定するURI(Uniform Resource Identifier)を選択するために使用される。なお、ユーザは、カテゴリを選択しない場合、カテゴリ項目をブランクとしたまま用語チェック要求を作成し、サーバ装置106に送信することができる。
さらに、情報処理部702は、ネットワークインタフェース708を実装していて、ユーザからの用語チェック要求を、ネットワーク722を介してサーバ装置106に送信する。また、ネットワークインタフェース708は、さらにネットワーク222を介してサーバ装置106からのレスポンスを受領して、用語チェック処理部706に応答データを渡す処理を実行する。
図8は、用語チェックリスト800のデータ構造の実施形態を示す。図8に示す用語チェックリスト800は、ユーザが選択した用語であって、フィールド802に登録された「survey of competitors」に対して、当該選択された用語の他、サーバ装置106が関連語DB218に登録されている関連語を登録したフィールド804と、検索結果を登録したフィールド806、808、810とを含む構成とされている。例えば、ユーザが選択した「survey
of competitors」は、インターネットなどの検索空間に対応するDB_Aについての検索件数を登録するフィールド806では、165件がヒットしている。
また、関連語である、「competitors analysis」について、DB_Bの検索空間について10401件がヒットし、さらに他の関連語である「competitor
analysis」については、5601件ヒットしたことが登録されている。また、同様に用語およびそれぞれの関連語について、例えば社内データベースに対応する検索空間を与えるDB_B110については、それぞれのヒット件数が、7件、90件、20件であることが登録され、さらにプライベートデータベースに対応する検索空間を与えるDB_C112については、それぞれ0件、2件、1件という検索結果が登録されている。
なお、検索空間のサイズに応じて、例えばDB_A108については、用語および関連語がそれぞれ含むコンテンツのヒット件数自体を出現頻度の尺度として提供する。また、例えばDB_B110およびDB_C112については、用語および関連語についてヒットしたコンテンツ数と、用語または関連語についてヒットしたコンテンツ数とを個別的に取得して尺度として汎用度を提示することができる。なお、汎用度をどの尺度として表現するかについては、検索空間の大きさ、コンテンツカテゴリの汎用度などを使用して特定の用途に適合するように、設定することができる。
図9は、本実施形態で使用する用語または関連語の汎用性の指標を与える汎用度リスト900のデータ構造を示す。図9に示す実施形態では、用語または関連語の出現回数に対して汎用度が登録されている。例えば、出現回数が1−50については、汎用的ではないことが設定され、出現回数が51−2000のものについてはドキュメントカテゴリなどの特定のカテゴリに強く依存し、また、出現回数が2000を超える表現については、無条件に汎用性があることが指定されている。なお、汎用度がドキュメントカテゴリに依存すると判定される場合、さらに、用語および関連語を検索クエリーとして検索されたコンテンツ全体に対する出現率などを使用してさらに詳細な汎用度を割当てることもできる。
図10は、本実施形態でユーザ端末104がデスクトップ画面上に表示するグラフィカルユーザインタフェース(Graphical User Interface: GUI)1000の実施形態を示す。図10に示すように、ユーザ端末104のデスクトップ画面上には、ウィンドウ1002が表示されている。ウィンドウ1002には、さらに、ドキュメントを作成するための入力フィールド1004が表示されている。ユーザは、入力フィールド1004内にテキストストリングを入力し、ドキュメントを作成する。
ユーザが一定以上のドキュメント入力を行った段階で用語チェックを希望する場合、メニュー項目1008から「用語選択」メニュー1012を選択して、プラグインプログラムなどを起動し、用語選択モードに設定する。用語選択モードを起動させた段階で、ユーザは入力フィールド1004に表示されたテキストストリングから用語1006をクリック/アンクリックで指定される範囲などで指定する。指定が受け付けられると、図10に示されるように、選択した用語1006の範囲がカラー表示される。なお、図10に示した実施形態では、ユーザは表示されたドキュメント範囲内で3つの用語を一度に選択している。
なお、選択された用語は、クエリーキューまたは待ち行列に一旦登録され、ユーザからの検索指令を受領して、用語単位でサーバ装置106に送信される。なお、他の実施形態で、サーバ装置106の処理能力およびネットワークの通信帯域幅が充分に保証され、ユーザに対して予測不能な時間遅延を与えない限り、選択された用語全部を一括してサーバ装置106に送信し、全選択用語に対しての応答データを一括して受信および処理して、デスクトップ上に表示させてもよい。
また、図10のメニュー項目1008には、「カテゴリ設定」メニュー1010と、「用語チェック」メニュー1014とが配置されている。カテゴリ設定メニュー1010は、ユーザが用語の出現回数などについての情報を得る際にコンテンツを検索するためのカテゴリを設定するためのメニューである。ユーザが「カテゴリ設定」メニュー1010をクリックすると、カテゴリリスト714に登録されたカテゴリ項目が表示され、ユーザが特定のカテゴリを選択すると、選択されたカテゴリの値が、用語と共に検索クエリーとしてサーバ装置106に送信される。サーバ装置106は、受領したカテゴリの値を使用して図4に示したデータ構造の検索空間220を検索し、カテゴリに対応した汎用度を計算した後、ユーザ端末104に返す。
なお、検索空間がWWW空間のような場合には、カテゴリ設定がなされていた場合であっても、コンテンツ検索部214は、カテゴリの値を含ませずにWWW空間の検索を実行することができる。また、「用語チェック」メニュー1014は、ユーザが検索の実行を指令するためのメニュー項目である。ユーザはすべての設定を完了した後、「用語チェック」メニュー1014をクリックすることにより、プルダウンメニューとして例えば「検索を実行する」または「選択をリセットする」などのメニュー項目が表示され、ユーザが希望する処理を指令することが可能とされる。
ユーザ端末104は、サーバ装置106からの応答データを受領すると、受領した応答データに対応する用語の選択範囲に対応して応答データを表示させるためのHTMLまたはXMLなどのファイルにリンクさせるためのハイパーリンクを設定する。また、好ましい実施形態では、応答パケットを受領した段階で選択範囲に表示された用語の文字色などを変更するなどして検索が終了したことをユーザに通知する。その後、ユーザ端末104は、用語の表示された位置座標に関連付けたポップアップウィンドウまたはポップアップメニューを自動的に、またはユーザ指令により表示する。
以下、図11〜図13を使用して、ユーザ端末104のデスクトップでの用語チェック結果の表示および用語修正の実施形態を説明する。図11は、用語チェック結果を、プルダウンメニューの形式で表示する場合のウィンドウ表示1100の実施形態である。ウィンドウ1102には、入力フィールド1104内に作成したドキュメントが表示され、選択した用語1106が背景色などを変更した形式で表示されている。ユーザ端末104は、サーバ装置106からの応答データを受領すると、選択した用語の領域にハイパーリンクを作成し、ユーザにアンダーラインなどを示して用語チェック結果が参照可能となったことを通知するか、または、背景色の変更、点滅などのインタフェースを使用して用語チェック結果がポップアップメニューまたはポップアップウィンドウとして使用可能を通知する。
ユーザは、ドキュメントの選択した用語につき、用語チェック結果が利用可能となったと判断すると、用語を表示した入力フィールド1104の領域にマウスカーソルを重ね合わせ、さらに右クリックを行う。他の形態では、ハイパーリンクなどの場合、用語をダブルクリックすることもできる。図11に示した実施形態では、ユーザが用語「survey of competitors」にマウスカーソルを一致させ、右クリックを行うことにより、ポップアップメニュー1108が表示される。ポップアップメニュー1108は、例えば、JAVA(登録商標)の場合、PopuMenuクラスとして定義され、マウス右クリックにより、show()メソッドが実行されて、表示が行われる。また、Java(登録商標)Scriptの場合についても類似の機能を有するコードを使用することができる。
ポップアップメニュー1108内には、出現頻度の尺度となる値がコメントとして読み込まれ、メニュー項目として「Accept」および「Replace」が表示されている。このポップアップメニュー1108は、用語の置換手段として機能する。ユーザは、出現頻度のコメントを参照し、当該用語を許容する場合には、「Accept」をクリックし、置換したい場合には、「Alternatives」として置換候補を表示したメニューから用語を選択し、さらにポップアップメニュー1110に表示された、選択した用語の出現頻度を参考に、メニュー項目である、「Accept」または「Replace」をクリックし、用語をそのまま利用するか、または新たに選択した関連語である「competitors
analysis」に置換する。置換処理は、選択範囲の用語「survey of competitors」をカットし、当該位置にバッファリングされた「competitor
analysis」をペーストするなどの処理により実行される。
図12は、ユーザに対して用語チェックの結果を表示するための第2の実施形態のウィンドウ表示1200を示す。図12に示した実施形態では、ユーザが、選択した用語1206にマウスカーソルを一致させ、右クリックなどを行うことにより、ポップアップウィンドウ1208が表示される。ポップアップウィンドウ1208の表示は、例えばJAVA(登録商標)では、Windowクラスを使用して実装することができ、他のオブジェクト指向プログラミング技術でも同等の機能を提供するコードが利用できる。
図12に示した実施形態では、ポップアップウィンドウ1208内に、サーバ装置106からの当該用語についての出現頻度が表示されている。さらに、当該選択された用語について検索された関連語についての検索結果のうち、最も出現頻度の高い関連語が選択され、ポップアップウィンドウ1208内に表示されている。ユーザは、ポップアップウィンドウ1208内に表示された関連語である、「competitors analysis」を確認し、「survey of competitors」の箇所に記述することにより、表現置換を行う。
図12に示した実施形態では、入力フィールド1204内に表示されるポップアップウィンドウ1208の面積を小さくでき、さらに、ユーザが置換を希望する関連語が直接表示されるので、より効率的な関連語の選択が可能となる。また、ユーザが他の用語である「stockholders identification」にマウスカーソルを一致させた場合、異なるポップアップウィンドウ1210が表示される。なお、これらのポップアップウィンドウ1208、1210は、ユーザがマウスカーソルを用語からずらした場合には、自動的に消去され、再度用語にマウスカーソルを重ね合わせて右クリックなどをすることにより、必要に応じて表示・消去することができる。なお、用語に対してパイパーリンクを設定する場合についても、ハイパーリンクを表示させるポップアップウィンドウを用意しておき、当該ポップアップウィンドウに表示された検索結果を使用して表現の選択および修正を行うことができる。
図13は、ユーザに対して用語選択を行わせるための、他の実施形態のウィンドウ表示1300を示す。図13に示した実施形態では、ポップアプウィンドウ1308内に、リストボックス1310が表示され、リストボックス1310で選択された関連語の出現頻度がテーブル1312として表示されている。ユーザは、リストボックス1310で関連語を選択すると、選択した関連語に対応する検索結果が読み込まれ、テーブル1312として表示される。ユーザは、ポップアップウィンドウ1308の表示を参考にしながら、用語1306などを修正する。修正後、ポップアップウィンドウ1308を消去することにより、用語の修正を終了させることが可能となる。
図14は、図13に示した出現頻度を表示させるための検索結果をXML形式で作成する場合の実施形態である。図14に示されたXMLは、適切なスタイルシートを用意しておき、図14に示したXMLドキュメントとして登録した検索結果を表示させる。なお、図14に示したXMLは、関連語「competitors analysis」についての検索結果を示しているが、本実施形態では、関連語すべてについて同一のXMLドキュメントとして作成しておき、図13に示した関連語の選択結果をDOMなどを使用して検索し、検索された範囲のデータをテーブルとして表示することもできる。
以上説明したように、本実施形態によれば、ドキュメントを作成する際に、ドキュメントに記載した用語と同義的な用語であって、対象とする言語でより適切な表現を効率的に選択させる、ドキュメント作成システム、ユーザ端末、サーバ装置およびプログラムが提供できる。さらに本実施形態によれば、作成したドキュメントのカテゴリおよび検索空間の相違に対応した用語の妥当性をユーザに通知することが可能となるため、ドキュメントの内容に対してより関連性のある関連語検索が可能となる。また、作成されたドキュメントは、より汎用的な用語を使用して作成されるので、検索性の向上およびドキュメントの質の統一化を行うことが可能となる。
また、本発明によれば、人材のグローバル化に伴い、自国語以外でドキュメントを作成しなければならないユーザが、作成するべき他国語での汎用性のある表現を容易に取得することが可能となり、ドキュメントの品質をさらに向上させることができる。
また、本実施形態では、ユーザ端末104は、当初まったく関連語についての情報がない場合でも、サーバ装置106が提供する関連語およびその検索結果を、用語チェックリストに蓄積してゆくことが可能となる。この結果、一旦検索した履歴がある場合や、用語チェックリストに用語が登録されている場合、サーバ装置106にアクセスせずとも用語の選択が可能となり、使用すれば使用するほど効率的な用語選択によるドキュメント作成が可能となる。
本発明の上記機能は、C++、Java(登録商標)、Java(登録商標)Beans、Java(登録商標)Applet、Java(登録商標)Script、Perl、Rubyなどのオブジェクト指向プログラミング言語などで記述された装置実行可能なプログラムにより実現でき、CD−ROM、CD−RW、DVD、MOなど、装置可読な記録媒体に格納して頒布することができる。
これまで本発明について実施形態をもって説明してきたが、本発明は実施形態に限定されるものではなく、他の実施形態、追加、変更、削除など、当業者が想到することができる範囲内で変更することができ、いずれの態様においても本発明の作用・効果を奏する限り、本発明の範囲に含まれるものである。
ドキュメント作成システムの実施形態を示した図。 サーバ装置の機能ブロックの実施形態を示した図。 関連語DBが格納する関連語テーブルの実施形態を示した図。 検索空間に登録されるコンテンツの実施形態を示した図。 ドキュメント作成システムを構成するユーザ端末の処理の実施形態のフローチャート。 サーバ装置が実行する処理の実施形態についてのフローチャート。 ユーザ端末の機能ブロックの実施形態を示した図。 用語チェックリストのデータ構造の実施形態を示した図。 本実施形態で使用する用語または関連語の汎用性の指標を与える汎用度リストのデータ構造を示した図。 本実施形態でユーザ端末104がデスクトップ画面上に表示させるGUIの実施形態を示した図。 ユーザに対して用語選択を行わせるための、ウィンドウ表示の実施形態を示した図。 ユーザに対して用語選択を行わせるための、他の実施形態のウィンドウ表示を示した図。 ユーザに対して用語選択を行わせるための、他の実施形態のウィンドウ表示を示した図。 図13に示した出現頻度を表示させるための検索結果をXML形式で作成する場合の実施形態を示した図。
符号の説明
100…ドキュメント作成システム、102ネットワーク、104…ユーザ端末、106…サーバ装置、108、110、112…検索空間、200…機能ブロック、202…関連語処理部、204…検索処理部、206…要求解析部、208…応答処理部、210…用語解析部、212…関連語取得部、214…コンテンツ検索部、216…検索結果解析部、218…関連語DB、220…検索空間、222…ネットワーク、300…関連語テーブル、400…コンテンツ、700…ユーザ端末、702…情報処理部、704…アプリケーション実行部、706…用語チェック処理部、708…ネットワークインタフェース、710…用語チェックリスト、712…汎用度リスト、714…カテゴリリスト、716…キーボード、718…マウス、720…ディスプレイ装置、800…用語チェックリスト、900…汎用度リスト、1000、1100、1200、1300…ウィンドウ(GUI表示)

Claims (18)

  1. ドキュメントが含む用語について適切な表現を提供するドキュメント作成システムであって、前記ドキュメント作成システムは、
    前記ドキュメントを作成し、前記用語を選択してネットワークを介して用語チェック要求を発行し、前記用語および前記用語に意味的に関連する関連語のそれぞれの汎用度を登録する汎用度登録手段を含み、選択した前記用語の汎用度を提供するユーザ端末と、
    前記ユーザ端末からの用語チェック要求を受領し、前記用語または前記関連語をそれぞれ含むコンテンツについて検索空間を検索し、前記検索空間内の前記コンテンツの表現として出現する前記用語および前記関連語それぞれの出現頻度を取得して前記ユーザ端末に前記各出現頻度を通知するサーバ装置とを含む、ドキュメント作成システム。
  2. 前記汎用度登録手段は、前記ユーザ端末により選択された前記用語についての前記表現の出現頻度を累積的に蓄積する、請求項1に記載のドキュメント作成システム。
  3. 前記ユーザ端末は、前記ドキュメントのカテゴリを指定するカテゴリ指定手段を含み、前記カテゴリ指定手段により指定される前記カテゴリでの前記表現を取得して、前記汎用度登録手段に登録する、請求項1または2に記載のドキュメント作成システム。
  4. 前記ユーザ端末は、汎用度決定手段を含み、前記汎用度登録手段に登録された前記用語および前記関連語の前記汎用度をランク付けする、請求項1〜3のいずれか1項に記載のドキュメント作成システム。
  5. 前記サーバ装置は、
    前記ネットワークを介して受領した前記用語チェック要求から前記用語の品詞および種類を解析して見出し語を作成し、作成した見出し語を使用して前記関連語を抽出する関連語処理部と、
    前記用語および前記関連語を検索クエリーとして前記検索空間の前記コンテンツを検索し、検索結果から出現頻度を計算して前記ユーザ端末への応答データを作成する検索処理部と
    を含む、請求項1〜4のいずれか1項に記載のドキュメント作成システム。
  6. 前記検索処理部は、メタデータに前記用語および前記関連語を含む前記コンテンツを前記検索空間から検索し、出現頻度を計算する、請求項5に記載のドキュメント作成システム。
  7. 前記サーバ装置は、複数の前記検索空間を登録しており、前記検索空間を指定して前記用語および前記関連語の出現頻度を計算する、請求項5または6に記載のドキュメント検索システム。
  8. 作成したドキュメントが含む用語の適切な表現を選択させるユーザ端末であって、前記ユーザ端末は、
    前記ドキュメントを作成するためのアプケーション実行部と、
    前記アプリケーションが含む前記用語の用語チェック要求を作成し、前記用語チェック要求の結果を処理する用語チェック処理部と、
    前記用語に意味的に関連する関連語のそれぞれの汎用度についての応答データを受領して登録する汎用度登録手段と、
    前記用語の表示位置に関連して前記汎用度要録手段に登録された前記表現を、前記関連語の出現頻度に対応付けて表示させる表示手段とを含み、
    前記汎用度登録手段は、前記ユーザ端末により選択された前記用語および前記用語に関連する前記関連語の各出現頻度を累積的に蓄積する
    ユーザ端末。
  9. 前記ユーザ端末は、前記表示手段に表示された前記関連語の選択に対応して、前記用語を前記選択した関連語に置換する置換手段を含む、請求項8に記載のユーザ端末。
  10. 前記用語チェック処理部は、前記アプリケーション実行部のプラグインプログラム、アドインプログラムまたはマクロオブジェクトとして実装される、請求項8または9に記載のユーザ端末。
  11. 前記用語チェック処理部は、選択された前記用語を受領して、前記用語の検索履歴を判断し、前記用語がすでに検索されていると判断した場合、前記汎用度登録手段から取得した前記用語の表現を表示する、請求項8〜10のいずれか1項に記載のユーザ端末。
  12. 前記ユーザ端末は、
    指定されるカテゴリでの前記用語の前記表現を取得して、前記汎用度登録手段に登録するためのカテゴリ指定手段と、
    前記汎用度登録手段に登録された前記表現の出現頻度から汎用度をランク付けするための汎用度決定手段とを含む、請求項8〜11に記載のユーザ端末。
  13. ネットワークを介して受領した用語の適切な表現を提供するサーバ装置であって、
    前記ネットワークを介して受領した用語チェック要求から前記用語の品詞および種類を解析して見出し語を作成し、作成した見出し語を使用して前記用語に意味的に関連する関連語を抽出する関連語処理部と、
    前記用語および前記関連語とを検索クエリーとして前記検索空間のコンテンツを検索し、検索結果から前記用語および前記関連語の前記検索空間での各出現頻度を計算して前記用語チェック要求の送信元に送信する応答データを作成する検索処理部と
    を含む、サーバ装置。
  14. 前記検索処理部は、メタデータに前記用語および前記関連語を含む前記コンテンツを前記検索空間から検索し、出現頻度を計算する、請求項13に記載のサーバ装置。
  15. 前記サーバ装置は、複数の前記検索空間を登録しており、前記検索空間を指定して前記表現の出現頻度を計算する、請求項13または14に記載のサーバ装置。
  16. 前記用語に意味的に関連する前記関連語を、前記用語についての見出し語と対応付けて登録する、関連語登録手段を含む、請求項13〜15のいずれか1項に記載のサーバ装置。
  17. 請求項8〜12のいずれか1項に記載の各手段としてコンピュータを機能させるためのコンピュータ実行可能なプログラム。
  18. 請求項13〜16のいずれか1項に記載の各手段としてコンピュータを機能させるためのコンピュータ実行可能なプログラム。
JP2007213803A 2007-08-20 2007-08-20 ドキュメント作成システム、ユーザ端末、サーバ装置、およびプログラム Expired - Fee Related JP5026192B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2007213803A JP5026192B2 (ja) 2007-08-20 2007-08-20 ドキュメント作成システム、ユーザ端末、サーバ装置、およびプログラム
US12/194,795 US20090063959A1 (en) 2007-08-20 2008-08-20 Document creation support system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007213803A JP5026192B2 (ja) 2007-08-20 2007-08-20 ドキュメント作成システム、ユーザ端末、サーバ装置、およびプログラム

Publications (2)

Publication Number Publication Date
JP2009048408A true JP2009048408A (ja) 2009-03-05
JP5026192B2 JP5026192B2 (ja) 2012-09-12

Family

ID=40409417

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007213803A Expired - Fee Related JP5026192B2 (ja) 2007-08-20 2007-08-20 ドキュメント作成システム、ユーザ端末、サーバ装置、およびプログラム

Country Status (2)

Country Link
US (1) US20090063959A1 (ja)
JP (1) JP5026192B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012123603A (ja) * 2010-12-08 2012-06-28 Yahoo Japan Corp 検索支援装置
US11252296B2 (en) 2020-03-16 2022-02-15 Ricoh Company, Ltd. Facsimile for displaying address confirmation, control method, and non-transitory recording medium

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8965926B2 (en) 2008-12-17 2015-02-24 Microsoft Corporation Techniques for managing persistent document collections
US8452765B2 (en) * 2010-04-23 2013-05-28 Eye Level Holdings, Llc System and method of controlling interactive communication services by responding to user query with relevant information from content specific database
CN102622363A (zh) * 2011-01-28 2012-08-01 鸿富锦精密工业(深圳)有限公司 关联词汇搜索系统及方法
US8903712B1 (en) * 2011-09-27 2014-12-02 Nuance Communications, Inc. Call steering data tagging interface with automatic semantic clustering
CN103106214B (zh) * 2011-11-14 2016-02-24 索尼爱立信移动通讯有限公司 一种候选词组输出方法和电子设备
CN106649334B (zh) * 2015-10-29 2020-09-15 北京国双科技有限公司 关联词语集合的处理方法及装置
JP7183600B2 (ja) 2018-07-20 2022-12-06 株式会社リコー 情報処理装置、システム、方法およびプログラム

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6484368A (en) * 1987-09-26 1989-03-29 Toshiba Corp Document checking device
JPH03122760A (ja) * 1989-10-05 1991-05-24 Ricoh Co Ltd 文章作成装置
JPH04280359A (ja) * 1991-03-08 1992-10-06 Canon Inc 文書処理装置
JPH05266009A (ja) * 1992-03-23 1993-10-15 Toshiba Corp 文書作成装置及び文書作成方法
JPH06348691A (ja) * 1993-06-03 1994-12-22 Fujitsu Ltd 文章作成装置における単語選択方法
JPH07210565A (ja) * 1994-01-21 1995-08-11 Canon Inc 情報検索方法及び装置
JPH08101847A (ja) * 1994-09-30 1996-04-16 Canon Inc 文書処理装置
JPH09245038A (ja) * 1996-03-07 1997-09-19 Just Syst Corp 文章作成装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5742834A (en) * 1992-06-24 1998-04-21 Canon Kabushiki Kaisha Document processing apparatus using a synonym dictionary
US5826261A (en) * 1996-05-10 1998-10-20 Spencer; Graham System and method for querying multiple, distributed databases by selective sharing of local relative significance information for terms related to the query
US7548863B2 (en) * 2002-08-06 2009-06-16 Apple Inc. Adaptive context sensitive analysis
US7493322B2 (en) * 2003-10-15 2009-02-17 Xerox Corporation System and method for computing a measure of similarity between documents
US7890533B2 (en) * 2006-05-17 2011-02-15 Noblis, Inc. Method and system for information extraction and modeling
US8881004B2 (en) * 2007-03-30 2014-11-04 Blackberry Limited Use of multiple data sources for spell check function, and associated handheld electronic device

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6484368A (en) * 1987-09-26 1989-03-29 Toshiba Corp Document checking device
JPH03122760A (ja) * 1989-10-05 1991-05-24 Ricoh Co Ltd 文章作成装置
JPH04280359A (ja) * 1991-03-08 1992-10-06 Canon Inc 文書処理装置
JPH05266009A (ja) * 1992-03-23 1993-10-15 Toshiba Corp 文書作成装置及び文書作成方法
JPH06348691A (ja) * 1993-06-03 1994-12-22 Fujitsu Ltd 文章作成装置における単語選択方法
JPH07210565A (ja) * 1994-01-21 1995-08-11 Canon Inc 情報検索方法及び装置
JPH08101847A (ja) * 1994-09-30 1996-04-16 Canon Inc 文書処理装置
JPH09245038A (ja) * 1996-03-07 1997-09-19 Just Syst Corp 文章作成装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012123603A (ja) * 2010-12-08 2012-06-28 Yahoo Japan Corp 検索支援装置
US11252296B2 (en) 2020-03-16 2022-02-15 Ricoh Company, Ltd. Facsimile for displaying address confirmation, control method, and non-transitory recording medium

Also Published As

Publication number Publication date
US20090063959A1 (en) 2009-03-05
JP5026192B2 (ja) 2012-09-12

Similar Documents

Publication Publication Date Title
JP5026192B2 (ja) ドキュメント作成システム、ユーザ端末、サーバ装置、およびプログラム
US10929487B1 (en) Customization of search results for search queries received from third party sites
US9348871B2 (en) Method and system for assessing relevant properties of work contexts for use by information services
US7895595B2 (en) Automatic method and system for formulating and transforming representations of context used by information services
JP5264892B2 (ja) 多言語情報検索
US9355185B2 (en) Infinite browse
US8037041B2 (en) System for dynamic keyword aggregation, search query generation and submission to third-party information search utilities
KR101191531B1 (ko) 인라인 문맥 질의들을 사용하는 검색 시스템들 및 방법들
JP2007122513A (ja) コンテンツ検索方法、及び、コンテンツ検索サーバ
US20110238662A1 (en) Method and system for searching a wide area network
CN101180625A (zh) 多个查询修订模型的集成
WO2006051297A1 (en) System and method for formulating and refining queries on structured data
US20090204602A1 (en) Apparatus and methods for presenting linking abstracts for search results
JP2012037920A (ja) 広告マッチング装置、方法及びプログラム
CN107622125B (zh) 一种信息爬取方法和装置、电子设备
JP2008112310A (ja) 検索装置、情報検索システム、検索方法、検索プログラム、及び記録媒体
JP2012138109A (ja) 検索装置、検索システム、情報処理装置、検索結果受信方法、及び情報受信プログラム
WO2019218151A1 (zh) 一种资料搜寻方法
JP3604069B2 (ja) 文書間関連度計算装置、その方法およびその記録媒体
JP2003296342A (ja) メタデータ生成方法および装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100222

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120417

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120530

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120619

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120620

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150629

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5026192

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees