JP2005025642A - Message processing device and method - Google Patents

Message processing device and method Download PDF

Info

Publication number
JP2005025642A
JP2005025642A JP2003192412A JP2003192412A JP2005025642A JP 2005025642 A JP2005025642 A JP 2005025642A JP 2003192412 A JP2003192412 A JP 2003192412A JP 2003192412 A JP2003192412 A JP 2003192412A JP 2005025642 A JP2005025642 A JP 2005025642A
Authority
JP
Japan
Prior art keywords
message
expression
specific expression
destination
notation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003192412A
Other languages
Japanese (ja)
Inventor
Shoichi Tateno
昌一 舘野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2003192412A priority Critical patent/JP2005025642A/en
Publication of JP2005025642A publication Critical patent/JP2005025642A/en
Pending legal-status Critical Current

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To process sensitive information while shielding from electronically transmitted messages such as inquiries and complaints. <P>SOLUTION: A customer transmits a message to a consultation center clerk (X1). The message is relayed by a message processor 10, and each process of sensitivity expression extraction (X2), unique expression extraction (X3), ranking (X4), destination candidate discrimination (X5), and markup process (X6) is executed thereto. The message is transferred to a person in charge of development through a consultation center clerk. At this time, the message processor 10 performs shielding process of a unique expression (X9). An answer message is relayed by the message processor 10 and transmitted to the consultation center clerk. At this time, the shielded part in the message is restored to the unique expression (X12 and X13). The consultation center clerk prepares a message for the customer and transmits it to the customer (X14). <P>COPYRIGHT: (C)2005,JPO&NCIPI

Description

【0001】
【発明の属する技術分野】
この発明は、メール送信、HTTP送信、FTP送信等、電子的に送信されてくる問い合わせ、苦情等のメッセージ(テキスト)を、感性に触れる表現の有無等に基づいて解析して処理するメッセージ処理技術に関し、とくに、センシティブな情報を遮蔽できるようにしたものである。
【0002】
【従来の技術】
お客様からの問い合わせや苦情等に含まれる重要な情報をいかに引き出すかは、企業にとって死活問題である。このような問い合わせ等は近年メール等の電子的な手法により送られるようになってきており、このような電子的な手法で送られてきた問い合わせ等を不満や怒り等が含まれるかどうかに応じて分類し、また、製品等の応じて所望の宛先、例えば製品の開発元(同一企業内部、あるいは、OEM製品の場合OEM製造業者)に分配する必要がある。しかしながら、このような問い合わせ等のメッセージにはセンシティブな情報も含まれることが多く(問い合わせ等を行ったものは問い合わせ先が機密を保持して処理することを期待することが多いからセンシティブな内容がそのまま含まれることになることが多い)、そのまま分配先に送った場合、問題が生じる。
【0003】
なお、この発明と関連する特許文献としては、アンケート回答を電子メールで受取り、苦情文を含む回答を苦情辞書を用いて検出して統計的な処理を行うことものがある(例えば特許文献1)。
【特許文献1】
特開2000−181926
【0004】
【発明が解決する課題】
この発明は、以上の事情を考慮してなされたものであり、電子的に送信されてくる問い合わせ、苦情等のメッセージから、センシティブな情報を遮蔽して処理するメッセージ処理技術を提供することを目的としている。
【0005】
【課題を解決するための手段】
この発明によれば、上述の目的を達成するために、特許請求の範囲に記載のとおりの構成を採用している。ここでは、発明を詳細に説明するのに先だって、特許請求の範囲の記載について補充的に説明を行なっておく。
【0006】
すなわち、この発明の一側面によれば、上述の目的を達成するために、メッセージ処理装置に:メッセージを受信するメッセージ受信手段と;受信した上記メッセージに含まれる固有表現を抽出する固有表現抽出手段と;受信した上記メッセージにおいて所定の固有表現をその固有表現の内容がわからない他の表記に置換する置換手段と;上記固有表現を上記他の表記に置換した上記メッセージを所定の宛先に転送するメッセージ転送手段と;上記宛先から転送されてきたメッセージに含まれる上記他の表記を対応する固有表現に復元する復元手段とを設けるようにしている。
【0007】
固有表現は、人名、地名、組織名、日時、価格等、特定の事物を表す表現(固有名ともいう)である。
【0008】
この構成において、置換手段により所定の固有表現を他の表記に置き換えて所定の宛先に転送するので、当該固有表現がセンシティブな情報自体であっても、宛先で問題が生じることがない。所定の固有表現は、例えば、抽出されたすべての固有表現であってもよいし、抽出された固有表現かた所定の基準により選別されたものでもよい。固有表現の内容がわからない他の表記は、連続番号や、意味のない記号の羅列、それらの組み合わせ等、種々のものを採用できる。XMLやHTMLを用いてメッセージを表記する場合にはタグによって当該固有表現を特定する識別番号を埋め込み、無意味な記号例えば黒丸や白丸を表記するようにしてもよい。
【0009】
宛先から戻ってきたメッセージは、当初のメッセージの全文またはその一部を含み、当該戻ってきたメッセージ中の上記他の表記は復元手段により元の固有表現に復元される。当該戻ってきたメッセージは、当該宛先から直接転送されてもよいし、いずれかの中継点を介して転送されてもよい。
【0010】
メッセージは、基本的には問い合わせや苦情等のテキストのメッセージであるが、音声データであってもよい。音声データはテキストに変換される。メッセージは、例えば、メール転送手法やHTTP転送手法やFTP転送手法等により転送されるが、これに限定されない。
【0011】
また、この発明の他の側面によれば、メッセージ処理装置に:メッセージを受信するメッセージ受信手段と;受信した上記メッセージに含まれる感性に触れる表現を抽出する感性表現抽出手段と;受信した上記メッセージに含まれる固有表現を抽出する固有表現抽出手段と;抽出された上記感性に触れる表現に基づいて重要度を判別する重要度判別手段と;判別された上記重要度に基づいて上記メッセージをランク付けしたうえで上記メッセージを上記感性に触れる表現および上記固有表現を強調表示して提示する手段と;受信した上記メッセージにおいて所定の固有表現をその固有表現の内容がわからない他の表記に置換する置換手段と;上記固有表現を上記他の表記に置換した上記メッセージを所定の宛先に転送するメッセージ転送手段とを設けるようにしている。
【0012】
この構成においては、重要度判別手段を用いメッセージに含まれる感性に触れる表現に基づいてメッセージの重要度を判別し、そのランク付けを行い、また感性に触れる表現や固有表現を強調表示するので、メッセージの重要度に応じた処理を確実に行うことができる。
【0013】
なお、強調表示は、当該部分を他の部分と異なる態様で表示することを広く意味し、ハイライト、アンダーライン等、種々の態様で行うことができる。
【0014】
なお、この発明は装置またはシステムとして実現できるのみでなく、方法としても実現可能である。また、そのような発明の一部をソフトウェアとして構成することができることはもちろんである。またそのようなソフトウェアをコンピュータに実行させるために用いるソフトウェア製品もこの発明の技術的な範囲に含まれることも当然である。
【0015】
この発明の上述の側面および他の側面は特許請求の範囲に記載され以下実施例を用いて詳述される。
【0016】
【発明の実施の形態】
以下、この発明の実施例について説明する。
【0017】
図1は、この発明の実施例のメッセージ処理装置の原理的な構成を示しており、この図において、メッセージ処理装置10はその送受信部101を用いて顧客ホスト装置20、管理者ホスト装置21、回答者ホスト装置22等をメッセージの送受信を行う。この実施例では、お客様が顧客ホスト装置20を用いてお客様相談センター担当者宛に苦情や問い合わせ等のメッセージを送信し、お客様相談センター担当者は例えば管理者ホスト装置21を用いてこのメッセージをメッセージ処理装置10経由で受取る。お客様相談センター担当者は、適宜、社内の開発担当者が外部提携会社の担当者にこのメッセージを回送して対処するように依頼する。この際、センシティブな情報を隠遮(以下ではマスクということもある)して転送する。社内の開発担当者が外部提携会社の担当者は、例えば回答者ホスト装置22を用いて回答のメッセージをメッセージ処理装置10経由でお客様相談センター担当者に返信する。この際、隠遮された情報は復元されている。お客様相談センター担当者は、回答のメッセージを参照してお客様へ所定のメッセージを送信する。
【0018】
メッセージ処理装置10は、送受信部101、感性表現抽出部102、固有表現抽出部103、メッセージ評価部104、隠遮部105、復元用データ記憶部106、復元処理部107等を含んで構成されている。メッセージ記憶部108は各部でやりとりされるメッセージを保管管理する。
【0019】
感性表現抽出部102は感性に触れる表現(以下、感性表現ということもある)を検出するものである。その具体例については図19〜図24を参照して後に詳述する。
【0020】
固有表現抽出部103は固有表現を検出するものであり、その具体例については図25以降の図面を参照して後に詳述する。
【0021】
メッセージ評価部104は、感性表現抽出部102や固有表現抽出部103により検出された感性表現や固有表現に基づいてメッセージを評価して所望の処理を行うものであり、例えば、図2に示すように、ランク付け部110、宛先候補決定部111、マークアップ部112等を含んで構成される。
【0022】
ランク付け部110は、例えば、ランク付けテーブル113(例えば図3参照)を参照して、メッセージに含まれる感性表現のポイントの累積値や最高ポイント値を取得し、これに基づいて各メッセージのランク付けを行う。ランク付けによりメッセージのおおよその重要度、緊急度を判別することができる。高いランクのメッセージから先に処理を行うように制御したり、色表記を変えたり、警告表示を付加したりすることができる。
【0023】
宛先候補決定部111は、宛先テーブル114(例えば図4参照)を参照して宛先の候補を判別してお客様相談センター担当者に提示する。宛先として単一のものを提示してもよいし、複数の選択肢を提示してもよい。また、利用者(お客様相談センター担当者)が、候補以外の宛先を手入力できるようにすることも好ましい。
【0024】
マークアップ部112はマークアップテーブル115(例えば図5参照)を参照して感性表現や固有表現の文字列の色属性を変えるものである。HTMLによりメッセージを表記する場合にはフォントの色や大きさをタグにより選択する。ここでは、色属性を変えることにより該当部分をハイライトするようにしたが、他の種々の態様で該当部分を他の部分と異なるように表示させることができる(強調表示)。例えば、下線やボールド文字、斜体文字等を用いてもよい。
【0025】
隠遮部105は、管理者ホスト装置21から回答者ホスト装置22にメッセージを送る際にメッセージ中の固有表現をマスクするものである(図10参照)。この例では、メッセージごとに固有表現の出現順に識別番号(3桁)を割り当てその前後に黒い四角のマークを付けて当該固有表現に代えている。置き換え結果は図6に示すように復元用データ記憶部106の復元テーブルに記憶される。副現用データはこれに限定されない。
【0026】
復元処理部107は、回答者ホスト装置22から管理者ホスト装置21にメッセージが回送される際にメッセージ中の隠遮部分を元の固有表現に復元するものである。復元は復元用データ記憶部106の復元テーブル(図6)を用いて行われる。
【0027】
図7は、実施例の動作を示しており、この図において、お客様が顧客ホスト装置20からメッセージをお客様相談センター担当者へ送信する(X1)。このメッセージは例えば図8に示すような苦情を内容とするものである。このメッセージはメッセージ処理装置10により中継され、感性表現抽出(X2)、固有表現抽出(X3)、ランク付け(X4)、宛先候補判別(X5)、マークアップ処理(X6)の各処理を実行され、この後、例えば管理者ホスト装置21を用いてお客様相談センター担当者に受け取られる(X7)。マークアップされた状態は例えば図9に示すようなものである。お客様相談センター担当者は、宛先候補に従ってあるいは自ら手入力した宛先情報により、メッセージを例えば回答者ホスト装置22を用いて開発担当者に転送する。この転送の際、メッセージ処理装置10がメッセージを中継し(X8)、固有表現の隠遮処理を行い(X9)、開発担当者に転送する(X10)。隠遮後のメッセージは例えば図10に示すようなものである。開発担当者は固有表現が隠遮されたメッセージ(図10)を例えば回答者ホスト装置22で閲覧し、回答のメッセージを作成する(図11)。この際センシティブな固有表現が隠遮されているので問題が生じない。回答のメッセージはメッセージ処理装置10を中継してお客様相談センター担当者宛送信される(X11)。このメッセージ中の隠遮部分は固有表現に復元されている(X12、X13)。復元後のメッセージは図12に示すようなものである。お客様相談センター担当者はこのメッセージに基づいてお客様宛のメッセージ(図13)を準備しお客様宛に送信する(X14)。
【0028】
なお、隠遮部105により画一的にまたは所定の規則に則して固有表現をマスクした場合、本来マスクしたくないものがマスクされ、また逆にマスクしたいものがマスクされないということも起こり得る。このような場合に対処するために、例えば図14に示すように、利用者(お客様相談センター担当者)が隠遮を解除したり、新たに隠遮対象とするものを選択できるように制御指示を管理者ホスト装置21から隠遮制御入力部116を介して隠遮部105に入力するようにしてもよい。例えば、自動的に図15に示すようにマスクが行われた場合、商品名が不明であると目的が達成されないことがあり、また「いい加減にしろ!!」というような表現は伝送したくないとする。その場合、「003隠遮解除」の制御信号を管理者ホスト装置21から隠遮制御入力部107を介して隠遮部105に送る。また「いい加減にしろ!!」という領域を範囲指定して「隠遮指示」を行う。このような指示の結果、図16に示すように、商品名「さしすせそ」が表記され、また「いい加減にしろ!!」が「E001」としてマスク対象として復元用データ記憶部106に登録されて文面上マスクされる。
【0029】
図17は、上述の実施例をメールサーバを用いて実現した構成例を示しており、図17において図1と対応する箇所には対応する符号を付す。
【0030】
図17においては、POPサーバ30、SMTPサーバ31、管理者ホスト装置21、ルータ32等がLAN33に接続されている。POPサーバ30のフロントエンド・モジュールとしてメッセージ処理部301が設けられている。このメッセージ処理部301は図1のメッセージ処理装置10に対応するものであり、POPサーバ30の入出力メッセージの発信元・宛先の組により指定される規則に基づいて図1のメッセージ処理装置10に対応する処理を行う。例えば、顧客ホスト装置20(回答者ホスト装置等、関連するホスト装置のほかのホスト装置)から管理者ホスト装置21に送られるメール(メッセージ)については感性表現抽出、固有表現抽出、ランク付け、宛先候補選定、マークアップ処理等を行う。管理者ホスト装置21から回答者ホスト装置22へ送られるメールについては隠遮処理を行う。回答者ホスト装置22から管理者ホスト装置21へ送られるメールについては復元処理を行う。
【0031】
この例では、インターネット33を用いて顧客ホスト装置20、回答者ホスト装置22をメッセージ処理システム(メールシステム)に接続するようにしているが、インターネット33以外の通信資源を用いることができることはもちろんであり、また、管理者ホスト装置21をインターネット33に接続するようにしてもよい。
【0032】
図18は、上述の実施例を主にウェブサーバを用いて実現した他の構成例を示しており、図18において図1または図17と対応する箇所には対応する符号を付す。
【0033】
図18においては、ウェブサーバ34、アプリケーションサーバ35を用いる。利用者はウェブサーバ34を用いて例えばURLを指定してシステムにアクセスする。利用者はウェブページを用いてメッセージの送受信を行える。アプリケーションサーバ35のメッセージ処理アプリケーション351が図1のメッセージ処理装置10と同様な処理を行う。ウェブ生成アプリケーション352が必要なウェブページを動的に生成する。もちろん静的なウェブページを予め準備して用いてもよい。また、アクセス用のURLを利用者に通知するために当該URLを埋め込んだメールをアプリケーションサーバ35で生成しこれをSMTPサーバ31で所定の宛先にメール送信するようにしてもよい。また、アプリケーションサーバ35にかえてウェブサーバ34のCGIプログラム等を用いてもよい。
【0034】
つぎに、図1の感性表現抽出部102の具体的な例について説明する。
【0035】
まず、以下で用いる文法用語について整理しておく。
(1)文節:自立語だけ、または自立語で始まり、付属語で終わる。
(2)自立語:名詞、代名詞、動詞、形容詞、形容動詞、接続詞、感動詞、連体詞、副詞。
(3)付属語:助詞、助動詞。
(4)用言:動詞、形容詞、形容動詞を指す。
(5)体言:名詞、代名詞を指す。
(6)係り受け(修飾・被修飾):文節同士が意味の上で結びついているとき、前の文節が後の文節に係るといい、後の文節が前の文節を受けるという。係る方が修飾で、受ける方が被修飾である。
【0036】
図19は、この発明の実施例の感性表現抽出装置を全体として示しており、この図において、感性表現抽出装置はテキスト入力部200、重要用言節特定部201、重要連用節特定部202、文種別決定部203、感性表現判定部204、抽出結果記憶部205、ユーザインタフェース部206、文種別決定用情報記憶部207、感性表現判定用情報記憶部208等を含んで構成されている。
【0037】
テキスト入力部200は、データファイル、文字認識結果、音声認識結果から等からテキストを1文章ずつ入力するものである。
【0038】
重要用言節特定部201は、入力された文中でもっとも重要と思われる用言節を特定する。形態素解析および係り受け解析を行い、文末の用言節を選択する方法を採用できる。さらに、用言節を複数抽出する方法も採用できる。さらに、それらの間に重要度順位をつける方法も採用できる。
【0039】
重要用言節特定部201は、例えば図20に示すように、形態素解析部2010、構文解析部2011、係り受け解析部2012、主用言節選択部2013等を含んで構成されている。形態素解析部2010は例えば図21に示すように形態素解析を行う。構文解析部2011は例えば図22に示すような構文解析木を出力する。主用言節選択部2013は、例えば文末の用言節を主要用言節として選択する。
【0040】
図19に戻る。重要連用節特定部202は、重要用言節特定部201で特定された用言節と係り受け関係にある連用節の内もっとも重要と評価される連用節を重要連用節として特定する。例えば、係り受け解析のうち、中心となる用言節に近い連用節を選択する。あるいは、「は」格、「が」格、「を」格、「に」格の順で重要度を割り振り、重要度に基づいて選択を行える。近さと、格の種類に基づいて重要度を付与してもよい。
【0041】
文種別決定部203は、重要用言節および重要連用節からなる文に対して文種別決定用情報記憶部207を参照して当該文の種別を決定する。文種別決定用情報記憶部207の文種別決定用情報は例えば図5に示すような用言分類表の情報である。図23に示す例では、用言と体言の組合せ毎に種別や感性値が保持されている。例えば「〜は使える」という文の場合、図23の例の一番上のエントリが該当し、「感想」の種別であることがわかる。また感性値が「+2」であることがわかる。図23の例では、上位概念語に対して種別が割り当てられている。すなわち、用言ごとに上位概念語を割当て、これに基づいて用言を含む文の種別が決定される。もちろん、上位概念語を介在させることなく、用言毎に種別を割り当てるようにしてもよい。種別としては、例えば、意見、感想、背景、質問、要求、状況説明、苦情などがある。もちろん、どのような目的に利用するかにより種別を選定してもよい。
【0042】
感性表現判定部204は、感性表現判定用情報記憶部208の感性表現判定用情報を用いて感性表現の判定を行う。例えば、所定の種別の用言を含む文は感性表現と判断する。そして、例えば図23に示した用言分類表の感性値をあわせて出力するようにできる。用言ごと文種別と独立に感性表現であるかどうかのフラグ等を割当て、これを用いて感性表現かどうかの判別を行ってもよい。感性値がある場合には感性表現と判断してもよい。感性値は、例えば、肯定・否定の度合いを表す。図23の例では、5段階評価(−2,−1,0,1,2)を採用する。
【0043】
文種別決定部203の決定結果や、感性表現判定部204の判定結果は抽出結果記憶部205に保持される。種別や感性表現の感性値に基づいて種々の情報を取得し、もとのテキストに含まれる重要な情報を取得したり、定量化したりすることが可能となる。
【0044】
ユーザインタフェース部206は、ユーザからの各種入力を受け取るものであり、具体的にはディスプレイ、キーボード、マウス装置等から構成される。この例ではリモートのホスト装置から入力を受ける。
【0045】
つぎにこの感性表現抽出部102の構成例の動作について説明する。
【0046】
図24は構成例の動作を示しており、この図においては以下のような処理が行われる。
【0047】
[ステップS10]:テキストの文章が1つずつ入力される。
[ステップS11]:文章中の重要用言節が特定される。
[ステップS12]:重要用言節に対応する重要連用節が特定される
[ステップS13]:用言分類表を表引きする。
[ステップS14]:対応する用言のエントリが存在する場合にはステップS16へ進む。対応する用言のエントリが存在しない場合にはステップS15へ進む。
[ステップS15]:所定のユーザインタフェースを用いて分類名(種別)を入力し、また感性値を入力する。上位概念語を入力するようにしてもよい。入力結果を新たなエントリとして用言分類表(図22)に登録する。この後ステップS16へ進む。
[ステップS16]:用言分類表の内容(あるいはユーザが入力した内容)に従って文種別を決定する。
[ステップS17]:文種別等にしたがって感性表現かどうかを判別する。感性値を取得できた場合には感性値を出力する。
【0048】
つぎに、図1の固有表現抽出部103の具体的な例について説明する。
【0049】
図25は、この固有表現抽出部103の構成例を全体として示しており、この図において、固有表現抽出部103はテキスト入力部400、形態素解析部401、形態素解析辞書記憶部402、固有表現情報解析部403、固有表現構成要素候補辞書記憶部404、固有表現特定部405、固有表現抽出規則記憶部406および出力部407等を含んで構成されている。
【0050】
図26は、図25の固有表現抽出部103で行われる処理(ステップS20〜S24)を説明している。
【0051】
図25および図26において、テキスト入力部400は、日本語テキストを入力する(S20)。形態素解析部401は、形態素解析辞書記憶部402を参照してテキストを形態素解析する(S21)。形態素解析結果は例えば図28に示すようなものである。この例では「米カリフォルニアのオレンジ群が・・・」を形態素解析している。固有表現情報解析部403は、固有表現構成要素候補辞書記憶部404を参照して形態素解析結果に対して素性(固有表現構成要素候補に関する属性)を付与する(S22)。固有表現構成要素候補辞書記憶部404は、例えば図27に示すような、形態素と、それが構成する固有表現における位置とを関連づけた情報からなる固有表現構成要素候補辞書を記憶している。固有表現が「日本国」であれば、「日本国」は左端形態素であり、「国」は右端形態素である。「日本国憲法」であれば、「日本国」は左端形態素、「国」は中間形態素、「憲法」は右端形態素である。この場合、「国」は左端形態素でもあるし、中間形態素でもある。
【0052】
固有表現情報解析部403が形態素に付与する素性は例えば図29に示すようなものである。この例では、固有表現自体の属性と、固有表現を構成する形態素の位置に関する属性とから素性が決定される。
【0053】
形態素解析結果の形態素が、図29中に矢印Aで示した、固有表現の「単語」自体、「左端」形態素自体、「中間」形態素自体、「右端」形態素自体である場合には、その形態素にそろぞれの素性を付与する。例えば、「場所」の「右端」形態素であれば(例えば「日本国」の「国」)、「prb」を付与する。
【0054】
また形態素解析結果の形態素の一部が、固有表現の「単語」、「左端」形態素、「中間」形態素、「右端」形態素と一致する場合には、図29中矢印Bで示すような素性を付与する。例えば、「・・・韓国軍人・・」を形態素解析して「韓国」、「軍人」の形態素列を得た場合には、形態素「軍人」中の「軍」は「組織」の「右端」形態素でもあり得るから、「に右端を含む」という位置情報を有し、「orbl」の素性が「軍人」に割り当てられる。「軍人」中の「軍」のような形態素の一部に個別に素性を割りあてられる記述手法を採用した場合には、形態素の一部にかかる素性を割り当ててもよい。
【0055】
このようにして、形態素解析結果の形態素またはその一部に関して固有表現構成要素候補辞書を参照して解析を行い形態素に素性を割り当てる。
【0056】
図30は、図27の形態素解析結果に素性を割り当てた例を示す。この例では下線を付した部分が素性として新たに割り当てられている。
【0057】
固有表現特定部405は、固有表現特定規則記憶部406を参照して規則に合致する形態素列を一まとめにして固有表現として特定する(S23)。
【0058】
固有表現特定規則記憶部406の固有特定規則(チャンキングルールともいう)は例えば図31に示すようなものであり、最終的には固有表現の属性(姓、名、組織、場所等)が付与される。そして図32に示すように固有表現の属性を有する形態素列が固有表現として抽出される。図32の例では、「場所」の属性を有するものが、「location()」として抽出される。図31中、「*」はその直前の形態素が0回以上繰り返すことを表し、「+」はその直前の形態素が0回以上繰り返すことを表す。「?」は任意の形態素を表す。
【0059】
図33は、先の「米カリフォルニア州のオレンジ郡が・・・」の形態素解析結果に固有表現特定規則を適用して固有表現およびその属性を特定した例を示し、図34はこの結果から固有表現を抽出した例を示す。この例では、形態素解析結果の形態素は固有表現構成要素候補(左端、中間、右端、単語)自体である。
【0060】
図35は、形態素解析結果の形態素の一部が固有姪構成要素候補をなす例を示している。この例では、先に述べたように、「・・韓国軍人・・」の形態素解析結果に含まれる「韓国」、「軍人」の形態素列中の「軍人」の左部分が右端形態素になり得るので「軍人」に「組織」の「に右端を含む」素性である「orbl」を付与している。
【0061】
抽出された固有表現はテキストにおいて強調や隠蔽されて出力部407から出力される。出力は、表示、印刷、メール送出、音声出力等種々の形態を用いることができる。後段の各種処理装置へ、固有表現情報を付加したテキスト等として出力する。
【0062】
固有表現抽出部103の他の構成例としては、本件出願人が特願2002−266227において提案したものを用いることもできる。
【0063】
なお、この発明は上述の実施例に限定されるものではなくその趣旨を逸脱しない範囲で種々変更が可能である。例えば、上述の実施例では、固有表現を主に隠遮するようにしたが、これに限らず種々の表現の隠遮・復元にこの発明を適用できる。
【0064】
【発明の効果】
以上説明したように、この発明によれば、電子的に送信されてくる問い合わせ、苦情等のメッセージから、センシティブな情報を遮蔽して処理することができる。
【図面の簡単な説明】
【図1】この発明の実施例の原理的な構成を説明するブロック図である。
【図2】図1のメッセージ評価部104の構成例を説明するブロック図である。
【図3】図2のランク付け部110の構成例を説明する図である。
【図4】図2の宛先候補決定部111の構成例を説明する図である。
【図5】図2のマークアップ部112の構成例を説明する図である。
【図6】図1の復元処理部107の処理を説明する図である。
【図7】図1の実施例の動作を説明する図である。
【図8】図1の実施例におけるメッセージ(お客様から送られたメッセージ)の態様の例を説明する図である。
【図9】図1の実施例におけるメッセージ(お客様相談センター担当者が処理中のメッセージ)の態様の例を説明する図である。
【図10】図1の実施例におけるメッセージ(開発担当者へ送られたメッセージ)の態様の例を説明する図である。
【図11】図1の実施例におけるメッセージ(開発担当者から送られるメッセージ)の態様の例を説明する図である。
【図12】図1の実施例におけるメッセージ(開発担当者から送られるメッセージをお客様相談センター担当者が閲覧している状態)の態様の例を説明する図である。
【図13】図1の実施例におけるメッセージ(お客様相談センター担当者からお客様へ送られるメッセージ)の態様の例を説明する図である。
【図14】隠遮を制御できる変形例を説明するブロック図である。
【図15】隠遮を制御の前の状態の例を説明する図である。
【図16】隠遮を制御の後の状態の例を説明する図である。
【図17】図1の実施例を主にメールシステムで構築した構成例を示す図である。
【図18】図1の実施例を主にウェブシステムで構築した構成例を示す図である。
【図19】図1の実施例の感性表現抽出部102の構成例を示すブロック図である。
【図20】上述構成例の重要用言節特定部201の構成例を説明するブロック図である。
【図21】上述構成例の形態素解析の例を説明する図である。
【図22】上述構成例の構文解析の例を説明する図である。
【図23】上述構成例において文の種別の決定や感性表現の判別に用いることが可能な用言分類表を説明する図である。
【図24】上述構成例の動作を説明するフローチャートである。
【図25】図1の実施例の固有表現抽出部103の構成例を示すブロック図である。
【図26】図25の構成例の動作を説明するフローチャートである。
【図27】図25の構成例の固有表現構成要素候補辞書を説明する図である。
【図28】図25の構成例の形態素解析結果を説明する図である。
【図29】図25の構成例で用いる素性を説明する図である。
【図30】図25の構成例で形態素解析結果に素性を反映させた結果を説明する図である。
【図31】図25の構成例実施例の固有表現特定部におけるチャンキング規則を説明する図である。
【図32】図25の構成例の固有表現特定部における抽出規則を説明する図である。
【図33】図25の構成例のチャンキング規則適用後の解析結果の例を示す図である。
【図34】図33の解析結果に図32の抽出規則を適用した抽出結果の例を示す図である。
【図35】図25の構成例のチャンキング規則適用後の解析結果の他の例を示す図である。
【符号の説明】
10 メッセージ処理装置
20 顧客ホスト装置
21 管理者ホスト装置
22 回答者ホスト装置
30 POPサーバ
31 SMTPサーバ
32 ルータ
33 インターネット
34 ウェブサーバ
35 アプリケーションサーバ
101 送受信部
102 感性表現抽出部
103 固有表現抽出部
104 メッセージ評価部
105 隠遮部
106 復元用データ記憶部
107 隠遮制御入力部
107 復元処理部
108 メッセージ記憶部
110 ランク付け部
111 宛先候補決定部
112 マークアップ部
113 ランク付けテーブル
114 宛先テーブル
115 マークアップテーブル
116 隠遮制御入力部
200 テキスト入力部
201 重要用言節特定部
202 重要連用節特定部
203 文種別決定部
204 感性表現判定部
205 抽出結果記憶部
206 ユーザインタフェース部
207 文種別決定用情報記憶部
208 感性表現判定用情報記憶部
301 メッセージ処理部
351 メッセージ処理アプリケーション
352 ウェブ生成アプリケーション
400 テキスト入力部
401 形態素解析部
402 形態素解析辞書記憶部
403 固有表現情報解析部
404 固有表現構成要素候補辞書記憶部
405 固有表現特定部
406 固有表現抽出規則記憶部
406 固有表現特定規則記憶部
407 出力部
2010 形態素解析部
2011 構文解析部
2012 係り受け解析部
2013 主用言節選択部
[0001]
BACKGROUND OF THE INVENTION
The present invention is a message processing technique for analyzing and processing messages (text) such as inquiries and complaints sent electronically, such as mail transmission, HTTP transmission, FTP transmission, etc. based on the presence or absence of expressions that touch sensibility. In particular, it is intended to shield sensitive information.
[0002]
[Prior art]
How to extract important information included in inquiries and complaints from customers is a matter of life and death for companies. In recent years, such inquiries have been sent by electronic methods such as e-mails. Depending on whether the inquiries sent by such electronic methods include dissatisfaction or anger. In addition, it is necessary to distribute it to a desired destination such as a product developer (inside the same company or in the case of an OEM product, an OEM manufacturer). However, such inquiries and other messages often contain sensitive information (the contents of the inquiries are sensitive because the inquiries often expect the inquires to be kept confidential) In many cases, it is included as is), and if sent directly to the distribution destination, a problem occurs.
[0003]
In addition, as patent documents related to the present invention, there is a method in which a questionnaire response is received by e-mail, a response including a complaint sentence is detected using a complaint dictionary, and statistical processing is performed (for example, Patent Document 1). .
[Patent Document 1]
JP2000-181926
[0004]
[Problems to be solved by the invention]
The present invention has been made in view of the above circumstances, and an object thereof is to provide a message processing technique that shields and processes sensitive information from electronically transmitted messages such as inquiries and complaints. It is said.
[0005]
[Means for Solving the Problems]
According to this invention, in order to achieve the above-mentioned object, the configuration as described in the claims is adopted. Here, prior to describing the invention in detail, supplementary explanations of the claims will be given.
[0006]
That is, according to one aspect of the present invention, in order to achieve the above-described object, the message processing apparatus includes: a message receiving unit that receives a message; and a specific expression extracting unit that extracts a specific expression included in the received message. A replacement means for replacing a predetermined specific expression in the received message with another notation in which the content of the specific expression is unknown; a message for transferring the message in which the specific expression is replaced with the other expression to a predetermined destination Transfer means; and restoration means for restoring the other notations included in the message transferred from the destination into corresponding specific expressions are provided.
[0007]
The specific expression is an expression (also referred to as a specific name) that represents a specific thing such as a person name, a place name, an organization name, a date, and a price.
[0008]
In this configuration, since the predetermined specific expression is replaced with another notation by the replacing means and transferred to the predetermined destination, no problem occurs in the destination even if the specific expression is sensitive information itself. The predetermined specific expression may be, for example, all the extracted specific expressions, or may be selected according to a predetermined standard from the extracted specific expressions. As other notations in which the content of the unique expression is unknown, various things such as a serial number, a list of meaningless symbols, and combinations thereof can be adopted. When a message is expressed using XML or HTML, an identification number for specifying the specific expression may be embedded by a tag, and a meaningless symbol such as a black circle or a white circle may be expressed.
[0009]
The message returned from the destination includes the entire text of the original message or a part thereof, and the other notation in the returned message is restored to the original unique expression by the restoring means. The returned message may be directly transferred from the destination or may be transferred via any relay point.
[0010]
The message is basically a text message such as an inquiry or complaint, but may be voice data. Voice data is converted to text. The message is transferred by, for example, a mail transfer method, an HTTP transfer method, an FTP transfer method, or the like, but is not limited thereto.
[0011]
According to another aspect of the present invention, the message processing device includes: a message receiving unit that receives a message; a sensitivity expression extracting unit that extracts a feeling touched in the received message; and the received message Specific expression extraction means for extracting the specific expression included in the message; importance level determination means for determining the importance level based on the extracted expression touching the sensitivity; ranking the messages based on the determined importance level And means for highlighting and presenting the message touching the sensibility and the specific expression; and replacing means for replacing the predetermined specific expression in the received message with another expression whose content of the specific expression is unknown. And message transfer means for transferring the message obtained by replacing the unique expression with the other notation to a predetermined destination The are to be provided.
[0012]
In this configuration, the importance level determination means is used to determine the importance level of the message based on the expression touching the sensibility included in the message, the ranking is performed, and the expression that touches the sensitivity and the specific expression are highlighted. Processing according to the importance of the message can be reliably performed.
[0013]
Note that highlighting broadly means that the part is displayed in a mode different from other parts, and can be performed in various modes such as highlighting and underlining.
[0014]
The present invention can be realized not only as an apparatus or a system but also as a method. Of course, a part of the invention can be configured as software. Of course, software products used to cause a computer to execute such software are also included in the technical scope of the present invention.
[0015]
These and other aspects of the invention are set forth in the appended claims and will be described in detail below with reference to examples.
[0016]
DETAILED DESCRIPTION OF THE INVENTION
Examples of the present invention will be described below.
[0017]
FIG. 1 shows the basic configuration of a message processing apparatus according to an embodiment of the present invention. In this figure, the message processing apparatus 10 uses a transmission / reception unit 101 for a customer host device 20, an administrator host device 21, The respondent host device 22 and the like send and receive messages. In this embodiment, the customer sends a message such as a complaint or inquiry to the customer consultation center staff using the customer host device 20, and the customer consultation center staff sends this message to the manager host device 21, for example. It is received via the processing device 10. The Customer Consultation Center representative will request that the in-house development staff forward the message to the staff of the external partner company as appropriate. At this time, sensitive information is transferred while being concealed (hereinafter also referred to as a mask). An in-house development staff member in charge of an external partner company returns a reply message to a customer consultation center staff member via the message processing device 10 using, for example, the respondent host device 22. At this time, the hidden information is restored. The person in charge of the customer consultation center refers to the reply message and sends a predetermined message to the customer.
[0018]
The message processing apparatus 10 includes a transmission / reception unit 101, a sentiment expression extraction unit 102, a specific expression extraction unit 103, a message evaluation unit 104, a concealment unit 105, a restoration data storage unit 106, a restoration processing unit 107, and the like. Yes. The message storage unit 108 stores and manages messages exchanged between the units.
[0019]
The sensibility expression extraction unit 102 detects an expression that touches sensibility (hereinafter also referred to as sensibility expression). Specific examples thereof will be described later in detail with reference to FIGS.
[0020]
The specific expression extraction unit 103 detects a specific expression, and a specific example thereof will be described in detail later with reference to FIG.
[0021]
The message evaluation unit 104 evaluates a message based on the emotional expression and the specific expression detected by the emotional expression extraction unit 102 and the specific expression extraction unit 103 and performs a desired process. For example, as shown in FIG. In addition, it includes a ranking unit 110, a destination candidate determination unit 111, a markup unit 112, and the like.
[0022]
The ranking unit 110 refers to, for example, the ranking table 113 (see, for example, FIG. 3) to obtain the cumulative value or the highest point value of the emotional expression included in the message, and based on this, rank of each message To do. The approximate importance and urgency of the message can be determined by ranking. It is possible to control to process a message of higher rank first, change the color notation, and add a warning display.
[0023]
The destination candidate determination unit 111 determines destination candidates with reference to the destination table 114 (see, for example, FIG. 4) and presents them to the customer consultation center staff. A single destination may be presented, or a plurality of options may be presented. It is also preferable that the user (person in charge of the customer consultation center) can manually input a destination other than the candidate.
[0024]
The markup unit 112 refers to a markup table 115 (for example, see FIG. 5) to change the color attribute of the character string of the emotional expression or the unique expression. When a message is written in HTML, the font color and size are selected by a tag. Here, the corresponding portion is highlighted by changing the color attribute, but the corresponding portion can be displayed differently from the other portions in various other forms (highlighted display). For example, an underline, a bold character, an italic character, or the like may be used.
[0025]
The concealment unit 105 masks the unique expression in the message when sending a message from the administrator host device 21 to the respondent host device 22 (see FIG. 10). In this example, an identification number (three digits) is assigned to each message in the order of appearance of the unique expression, and black square marks are attached before and after that to replace the unique expression. The replacement result is stored in the restoration table of the restoration data storage unit 106 as shown in FIG. The secondary data is not limited to this.
[0026]
The restoration processing unit 107 restores the concealed portion in the message to the original unique expression when the message is forwarded from the respondent host device 22 to the administrator host device 21. The restoration is performed using the restoration table (FIG. 6) of the restoration data storage unit 106.
[0027]
FIG. 7 shows the operation of the embodiment. In this figure, the customer transmits a message from the customer host device 20 to the customer consultation center staff (X1). This message contains a complaint as shown in FIG. 8, for example. This message is relayed by the message processing device 10, and each process of sensitivity expression extraction (X2), specific expression extraction (X3), ranking (X4), destination candidate determination (X5), and markup processing (X6) is executed. Thereafter, it is received by the person in charge of the customer consultation center using, for example, the administrator host device 21 (X7). The marked up state is as shown in FIG. 9, for example. The person in charge of the customer consultation center transfers the message to the person in charge of development using, for example, the respondent host device 22 according to the destination information according to the destination candidates or manually input by himself / herself. At the time of this transfer, the message processing device 10 relays the message (X8), performs the concealment process of the specific expression (X9), and transfers it to the developer (X10). The message after concealment is, for example, as shown in FIG. The person in charge of development browses the message (FIG. 10) in which the unique expression is concealed, for example, on the respondent host device 22, and creates a reply message (FIG. 11). At this time, no problem arises because the sensitive specific expressions are hidden. The reply message is relayed through the message processing apparatus 10 and transmitted to the customer consultation center staff (X11). The hidden part in this message is restored to a specific expression (X12, X13). The message after restoration is as shown in FIG. Based on this message, the customer consultation center staff prepares a message for the customer (FIG. 13) and transmits it to the customer (X14).
[0028]
Note that when the hidden expression is masked uniformly or in accordance with a predetermined rule by the concealment unit 105, it is possible that what is not originally masked is masked, and conversely, what is desired to be masked is not masked. . In order to deal with such a case, as shown in FIG. 14, for example, a control instruction is given so that the user (person in charge of the customer consultation center) can cancel the concealment or select a new concealment target. May be input from the administrator host device 21 to the hidden shielding unit 105 via the hidden shielding control input unit 116. For example, when masking is automatically performed as shown in FIG. 15, the purpose may not be achieved if the product name is unknown, and it is not desirable to transmit an expression such as “Let's go wrong!” And In that case, a control signal of “003 concealment cancellation” is sent from the administrator host device 21 to the concealment unit 105 via the concealment control input unit 107. Also, specify the area of “Let's make a difference!” And give “Hidden Intercept”. As a result of such an instruction, as shown in FIG. 16, the product name “Sashisuseso” is written, and “Need to change!” Is registered as a mask object in the restoration data storage unit 106 as “E001”, Masked up.
[0029]
FIG. 17 shows a configuration example in which the above-described embodiment is realized using a mail server. In FIG. 17, portions corresponding to those in FIG.
[0030]
In FIG. 17, a POP server 30, an SMTP server 31, an administrator host device 21, a router 32, and the like are connected to the LAN 33. A message processing unit 301 is provided as a front-end module of the POP server 30. This message processing unit 301 corresponds to the message processing device 10 in FIG. 1, and is based on the rule specified by the source / destination pair of the input / output message of the POP server 30 in the message processing device 10 in FIG. Perform the corresponding process. For example, for mail (message) sent from the customer host device 20 (another host device such as a respondent host device) to the administrator host device 21, sensitivity expression extraction, unique expression extraction, ranking, destination Candidate selection, markup processing, etc. Concealment processing is performed on mail sent from the administrator host device 21 to the respondent host device 22. The mail sent from the respondent host device 22 to the administrator host device 21 is restored.
[0031]
In this example, the customer host device 20 and the respondent host device 22 are connected to the message processing system (mail system) using the Internet 33. Of course, communication resources other than the Internet 33 can be used. Yes, the administrator host device 21 may be connected to the Internet 33.
[0032]
FIG. 18 shows another configuration example in which the above-described embodiment is realized mainly using a web server. In FIG. 18, portions corresponding to FIG. 1 or FIG.
[0033]
In FIG. 18, a web server 34 and an application server 35 are used. The user uses the web server 34 to access the system by specifying a URL, for example. Users can send and receive messages using web pages. The message processing application 351 of the application server 35 performs the same processing as that of the message processing device 10 of FIG. The web generation application 352 dynamically generates a necessary web page. Of course, a static web page may be prepared and used in advance. Further, in order to notify the user of the URL for access, a mail in which the URL is embedded may be generated by the application server 35 and sent to a predetermined destination by the SMTP server 31. Further, the CGI program of the web server 34 may be used instead of the application server 35.
[0034]
Next, a specific example of the sensibility expression extraction unit 102 in FIG. 1 will be described.
[0035]
First, the grammatical terms used below are organized.
(1) Sentences: Independent words only, or start with independent words and end with attached words.
(2) Autonomous words: nouns, pronouns, verbs, adjectives, adjective verbs, conjunctions, impression verbs, conjunctions, adverbs.
(3) Adjunct: particle, auxiliary verb.
(4) Precautions: Verbs, adjectives, adjective verbs.
(5) Body language: Refers to nouns and pronouns.
(6) Dependency (modification / substitution): When clauses are connected in meaning, it is said that the previous clause relates to the subsequent clause, and the subsequent clause receives the previous clause. The person who receives it is a modification, and the person who receives it is a modification.
[0036]
FIG. 19 shows an entire Kansei expression extracting apparatus according to an embodiment of the present invention. In this figure, the Kansei expression extracting apparatus includes a text input unit 200, an important phrase specifying unit 201, an important continuous clause specifying unit 202, The sentence type determination unit 203, the sensitivity expression determination unit 204, the extraction result storage unit 205, the user interface unit 206, the sentence type determination information storage unit 207, and the sensitivity expression determination information storage unit 208 are configured.
[0037]
The text input unit 200 inputs text one sentence at a time from data files, character recognition results, speech recognition results, and the like.
[0038]
The important phrase specifying unit 201 specifies a phrase that seems to be the most important in the input sentence. A method of selecting a phrase at the end of a sentence by performing morphological analysis and dependency analysis can be adopted. Furthermore, a method of extracting a plurality of prescriptive phrases can also be adopted. Furthermore, a method of assigning importance ranking between them can also be adopted.
[0039]
The important phrase specifying unit 201 includes, for example, as shown in FIG. 20, a morphological analysis unit 2010, a syntax analysis unit 2011, a dependency analysis unit 2012, a main phrase selection unit 2013, and the like. The morpheme analysis unit 2010 performs morpheme analysis as shown in FIG. 21, for example. The syntax analysis unit 2011 outputs a syntax analysis tree as shown in FIG. 22, for example. The main phrase selector 2013 selects, for example, a phrase at the end of the sentence as a main phrase.
[0040]
Returning to FIG. The important continuous clause specifying unit 202 specifies the continuous clause evaluated as the most important among the continuous clauses having a dependency relationship with the clause specified by the important phrase specifying unit 201 as the important consecutive clause. For example, in the dependency analysis, a continuous clause that is close to the central phrase is selected. Alternatively, importance is assigned in the order of “ha”, “ga”, “wo”, and “ni”, and selection can be made based on the importance. You may give importance based on proximity and the kind of case.
[0041]
The sentence type determining unit 203 determines the type of the sentence by referring to the sentence type determining information storage unit 207 for the sentence including the important phrase and the important continuous phrase. The sentence type determination information in the sentence type determination information storage unit 207 is, for example, information of a prescription classification table as shown in FIG. In the example shown in FIG. 23, a type and a sensitivity value are held for each combination of a precaution and a body. For example, in the case of a sentence “can be used”, the top entry in the example of FIG. 23 corresponds to the type of “impression”. It can also be seen that the sensitivity value is “+2”. In the example of FIG. 23, a type is assigned to the broader concept word. That is, a high-level concept word is assigned to each prescription, and the type of sentence including the prescription is determined based on this. Of course, a type may be assigned to each predicate without interposing a broader concept word. Types include, for example, opinions, impressions, backgrounds, questions, requests, situation explanations, complaints, and the like. Of course, the type may be selected depending on what purpose is used.
[0042]
The emotional expression determination unit 204 determines the emotional expression using the emotional expression determination information stored in the emotional expression determination information storage unit 208. For example, a sentence including a predetermined type of predicate is determined as an emotional expression. Then, for example, the sensitivity values of the prescription classification table shown in FIG. 23 can be output together. A flag or the like indicating whether the expression is a Kansei expression can be assigned independently from the sentence type, and it can be determined whether the expression is a Kansei expression. If there is a sensitivity value, it may be determined as a sensitivity expression. The sensitivity value represents, for example, a positive / negative degree. In the example of FIG. 23, a five-level evaluation (-2, -1, 0, 1, 2) is adopted.
[0043]
The determination result of the sentence type determination unit 203 and the determination result of the sentiment expression determination unit 204 are held in the extraction result storage unit 205. It is possible to acquire various information based on the type and the sensitivity value of the sensitivity expression and acquire or quantify important information included in the original text.
[0044]
The user interface unit 206 receives various inputs from the user, and specifically includes a display, a keyboard, a mouse device, and the like. In this example, input is received from a remote host device.
[0045]
Next, the operation of the configuration example of the sensitivity expression extraction unit 102 will be described.
[0046]
FIG. 24 shows the operation of the configuration example. In this figure, the following processing is performed.
[0047]
[Step S10]: Text sentences are input one by one.
[Step S11]: Important phrases in the sentence are specified.
[Step S12]: An important continuous clause corresponding to the important clause is identified.
[Step S13]: A prescriptive classification table is drawn.
[Step S14]: If there is an entry for the corresponding word, the process proceeds to step S16. If there is no corresponding prescriptive entry, the process proceeds to step S15.
[Step S15]: A classification name (type) is input using a predetermined user interface, and a sensitivity value is input. A broad concept word may be input. The input result is registered as a new entry in the prescription classification table (FIG. 22). Thereafter, the process proceeds to step S16.
[Step S16]: The sentence type is determined according to the contents of the prescription classification table (or the contents input by the user).
[Step S17]: It is determined whether or not the emotional expression is in accordance with the sentence type or the like. When the sensitivity value is acquired, the sensitivity value is output.
[0048]
Next, a specific example of the specific expression extraction unit 103 in FIG. 1 will be described.
[0049]
FIG. 25 shows a configuration example of the specific expression extraction unit 103 as a whole. In FIG. 25, the specific expression extraction unit 103 includes a text input unit 400, a morpheme analysis unit 401, a morpheme analysis dictionary storage unit 402, and specific expression information. It includes an analysis unit 403, a specific expression component candidate dictionary storage unit 404, a specific expression specifying unit 405, a specific expression extraction rule storage unit 406, an output unit 407, and the like.
[0050]
FIG. 26 illustrates processing (steps S20 to S24) performed by the specific expression extraction unit 103 in FIG.
[0051]
25 and 26, the text input unit 400 inputs Japanese text (S20). The morpheme analysis unit 401 refers to the morpheme analysis dictionary storage unit 402 and performs morpheme analysis on the text (S21). The morphological analysis result is, for example, as shown in FIG. In this example, morphological analysis is performed on "Orange group of California, USA ...". The specific expression information analysis unit 403 refers to the specific expression component candidate dictionary storage unit 404 and assigns a feature (an attribute related to the specific expression component candidate) to the morphological analysis result (S22). The specific expression component candidate dictionary storage unit 404 stores, for example, a specific expression component candidate dictionary including information associating morphemes with positions in the specific expressions formed by the morphemes as illustrated in FIG. If the proper expression is “Japan”, “Japan” is the leftmost morpheme and “country” is the rightmost morpheme. In the case of the “Constitution of Japan”, “Japan” is the leftmost morpheme, “Country” is the intermediate morpheme, and “Constitution” is the rightmost morpheme. In this case, “country” is both a leftmost morpheme and an intermediate morpheme.
[0052]
The features given to the morpheme by the specific expression information analysis unit 403 are as shown in FIG. 29, for example. In this example, the feature is determined from the attribute of the specific expression itself and the attribute related to the position of the morpheme constituting the specific expression.
[0053]
If the morpheme of the morpheme analysis result is the “word” itself, “leftmost” morpheme itself, “intermediate” morpheme itself, or “rightmost” morpheme itself as indicated by arrow A in FIG. Give each element a unique feature. For example, if it is the “right end” morpheme of “place” (for example, “country” of “Japan”), “prb” is assigned.
[0054]
In addition, when a part of the morpheme of the morpheme analysis result matches the “word”, “left end” morpheme, “intermediate” morpheme, and “right end” morpheme of the specific expression, the feature as shown by an arrow B in FIG. Give. For example, if a morphological analysis of “... Korean soldiers ...” was performed to obtain a morpheme sequence of “Korea” and “military”, the “army” in the morpheme “military” was the “right end” of “organization”. Because it can be a morpheme, left The position information of “orbl” is assigned to “military”. In the case of adopting a description method in which a feature is individually assigned to a part of a morpheme such as “military” in “military”, a feature related to a part of the morpheme may be assigned.
[0055]
In this way, the morpheme of the morpheme analysis result or a part thereof is analyzed with reference to the specific expression component candidate dictionary, and the feature is assigned to the morpheme.
[0056]
FIG. 30 shows an example in which features are assigned to the morphological analysis results of FIG. In this example, the underlined part is newly assigned as a feature.
[0057]
The specific expression specifying unit 405 refers to the specific expression specifying rule storage unit 406 and specifies a morpheme string that matches the rule as a specific expression (S23).
[0058]
The specific identification rules (also referred to as chunking rules) in the specific expression specific rule storage unit 406 are as shown in FIG. Is done. Then, as shown in FIG. 32, a morpheme string having a specific expression attribute is extracted as a specific expression. In the example of FIG. 32, the item having the attribute “location” is extracted as “location ()”. In FIG. 31, “*” indicates that the morpheme immediately before is repeated 0 or more times, and “+” indicates that the morpheme immediately before is repeated 0 or more times. “?” Represents an arbitrary morpheme.
[0059]
FIG. 33 shows an example in which a specific expression and its attributes are specified by applying a specific expression specifying rule to the morphological analysis result of “Orange County in California, USA ...”. FIG. The example which extracted expression is shown. In this example, the morpheme of the morpheme analysis result is the specific expression component candidate (left end, middle, right end, word) itself.
[0060]
FIG. 35 shows an example in which a part of the morpheme obtained as a result of the morpheme analysis constitutes a unique eaves component candidate. In this example, as described above, the left part of “military” in the morpheme sequence of “Korea” and “military” included in the morphological analysis result of “... Korean soldier ...” can be the rightmost morpheme. So “military” “organization” “ left "Orbl" which is a feature including the right end is given.
[0061]
The extracted specific expression is output from the output unit 407 after being emphasized or concealed in the text. For output, various forms such as display, printing, mail transmission, and voice output can be used. The text is output as text or the like with specific expression information to various processing devices in the subsequent stage.
[0062]
As another configuration example of the specific expression extraction unit 103, the one proposed by the applicant in Japanese Patent Application No. 2002-266227 may be used.
[0063]
The present invention is not limited to the above-described embodiments, and various modifications can be made without departing from the spirit of the invention. For example, in the above-described embodiment, the specific expression is mainly hidden, but the present invention is not limited to this and can be applied to the hidden / restoration of various expressions.
[0064]
【The invention's effect】
As described above, according to the present invention, sensitive information can be shielded and processed from electronically transmitted messages such as inquiries and complaints.
[Brief description of the drawings]
FIG. 1 is a block diagram illustrating the basic configuration of an embodiment of the present invention.
FIG. 2 is a block diagram illustrating a configuration example of a message evaluation unit 104 in FIG.
3 is a diagram illustrating a configuration example of a ranking unit 110 in FIG.
4 is a diagram for explaining a configuration example of a destination candidate determination unit 111 in FIG. 2; FIG.
5 is a diagram illustrating a configuration example of a markup unit 112 in FIG.
6 is a diagram illustrating processing of the restoration processing unit 107 in FIG. 1. FIG.
FIG. 7 is a diagram for explaining the operation of the embodiment of FIG. 1;
FIG. 8 is a diagram for explaining an example of a mode of a message (message sent from a customer) in the embodiment of FIG. 1;
9 is a diagram for explaining an example of a mode of a message (message being processed by a customer consultation center staff) in the embodiment of FIG. 1; FIG.
10 is a diagram for explaining an example of a mode of a message (message sent to a developer in charge) in the embodiment of FIG. 1; FIG.
11 is a diagram for explaining an example of a mode of a message (message sent from a developer in charge) in the embodiment of FIG. 1; FIG.
12 is a diagram for explaining an example of a mode of a message (a state in which a customer consultation center person is browsing a message sent from a development person in charge) in the embodiment of FIG. 1;
13 is a diagram for explaining an example of a mode of a message (a message sent from a customer consultation center person in charge to a customer) in the embodiment of FIG. 1;
FIG. 14 is a block diagram illustrating a modified example in which concealment and shielding can be controlled.
FIG. 15 is a diagram for explaining an example of a state before the concealment is controlled.
FIG. 16 is a diagram for explaining an example of a state after the concealment is controlled.
FIG. 17 is a diagram showing a configuration example in which the embodiment of FIG. 1 is mainly constructed by a mail system.
18 is a diagram showing a configuration example in which the embodiment of FIG. 1 is mainly constructed by a web system.
FIG. 19 is a block diagram illustrating a configuration example of a sensitivity expression extraction unit 102 according to the embodiment of FIG. 1;
FIG. 20 is a block diagram illustrating a configuration example of an important phrase specifying unit 201 in the above configuration example.
FIG. 21 is a diagram describing an example of morphological analysis of the above configuration example.
FIG. 22 is a diagram illustrating an example of syntax analysis of the configuration example described above.
FIG. 23 is a diagram illustrating a prescription classification table that can be used for determination of sentence type and determination of emotional expression in the above configuration example.
FIG. 24 is a flowchart illustrating the operation of the above configuration example.
FIG. 25 is a block diagram illustrating a configuration example of a specific expression extraction unit 103 in the embodiment of FIG. 1;
26 is a flowchart for explaining the operation of the configuration example of FIG. 25;
FIG. 27 is a diagram for explaining a specific expression component candidate dictionary in the configuration example of FIG. 25;
FIG. 28 is a diagram for explaining the morphological analysis result of the configuration example of FIG.
29 is a diagram illustrating features used in the configuration example in FIG. 25. FIG.
30 is a diagram for explaining a result of reflecting a feature in a morphological analysis result in the configuration example of FIG. 25;
FIG. 31 is a diagram illustrating a chunking rule in the specific expression specifying unit of the configuration example in FIG. 25;
32 is a diagram for explaining extraction rules in a specific expression specifying unit in the configuration example of FIG. 25;
33 is a diagram illustrating an example of an analysis result after application of the chunking rule in the configuration example of FIG. 25;
34 is a diagram illustrating an example of an extraction result obtained by applying the extraction rule of FIG. 32 to the analysis result of FIG.
35 is a diagram showing another example of the analysis result after application of the chunking rule in the configuration example of FIG. 25. FIG.
[Explanation of symbols]
10 Message processing device
20 Customer host device
21 Administrator host device
22 respondent host device
30 POP server
31 SMTP server
32 routers
33 Internet
34 Web server
35 Application server
101 transceiver
102 Kansei expression extraction unit
103 Named entity extraction unit
104 Message Evaluation Department
105 Concealment block
106 Data storage unit for restoration
107 Concealment control input part
107 Restoration processing unit
108 Message storage
110 Ranking section
111 Destination candidate determination unit
112 Markup Club
113 ranking table
114 Destination table
115 Markup table
116 Concealment control input part
200 Text input part
201 Important phrase identification part
202 Important consecutive clause identification part
203 sentence type determination part
204 Kansei expression determination unit
205 Extraction result storage
206 User interface section
207 Information storage unit for sentence type determination
208 Information storage unit for sensitivity expression determination
301 Message processor
351 Message Processing Application
352 Web generation application
400 Text input part
401 Morphological analyzer
402 Morphological analysis dictionary storage unit
403 Specific expression information analysis unit
404 Specific expression component candidate dictionary storage unit
405 Specific expression specifying part
406 Specific expression extraction rule storage unit
406 Specific expression specifying rule storage unit
407 Output section
2010 Morphological Analysis Department
2011 Parsing section
2012 Dependency Analysis Department
2013 Main phrase selector

Claims (9)

メッセージを受信するメッセージ受信手段と、
受信した上記メッセージに含まれる固有表現を抽出する固有表現抽出手段と、
受信した上記メッセージにおいて所定の固有表現をその固有表現の内容がわからない他の表記に置換する置換手段と、
上記固有表現を上記他の表記に置換した上記メッセージを所定の宛先に転送するメッセージ転送手段と、
上記宛先から転送されてきたメッセージに含まれる上記他の表記を対応する固有表現に復元する復元手段とを有することを特徴とするメッセージ処理装置。
Message receiving means for receiving a message;
A named entity extracting means for extracting a named entity included in the received message;
Replacement means for replacing a predetermined specific expression in the received message with another notation that does not know the content of the specific expression;
Message transfer means for transferring the message obtained by replacing the specific expression with the other notation to a predetermined destination;
A message processing apparatus comprising: a restoring unit that restores the other notation included in the message transferred from the destination to a corresponding specific expression.
上記メッセージから抽出された固有表現に基づいて上記所定の宛先を判別する手段をさらに有することを特徴とするメッセージ処理装置。The message processing apparatus further comprising means for discriminating the predetermined destination based on the specific expression extracted from the message. 上記メッセージから抽出された固有表現に基づいて上記メッセージの固有表現の部分を強調表示するメッセージ表示手段と、
上記所定の宛先の候補を表示する宛先候補表示手段と、
表示された上記宛先の候補から1の宛先を選択する選択入力を受け付ける選択入力受付手段とをさらに有する請求項1記載のメッセージ処理装置。
Message display means for highlighting a portion of the specific expression of the message based on the specific expression extracted from the message;
Destination candidate display means for displaying the predetermined destination candidates;
The message processing apparatus according to claim 1, further comprising selection input receiving means for receiving a selection input for selecting one destination from the displayed destination candidates.
メッセージを受信するメッセージ受信手段と、
受信した上記メッセージにおいて所定の表現をその表現の内容がわからない他の表記に置換する置換手段と、
上記所定の表現と上記他の表現とを関連づけて記憶する対応づけ記憶手段と、
上記所定の表現を上記他の表記に置換した上記メッセージを所定の宛先に転送するメッセージ転送手段と、
上記宛先から転送されてきたメッセージに含まれる上記他の表記を、上記対応づけ記憶手段を参照して対応する表現に復元する復元手段とを有することを特徴とするメッセージ処理装置。
Message receiving means for receiving a message;
Replacement means for replacing the predetermined expression in the received message with another notation that does not know the content of the expression;
Association storage means for associating and storing the predetermined expression and the other expression;
Message transfer means for transferring the message obtained by replacing the predetermined expression with the other notation to a predetermined destination;
A message processing apparatus comprising: a restoring unit that restores the other notation included in the message transferred from the destination into a corresponding expression with reference to the association storage unit.
メッセージを受信するメッセージ受信手段と、
受信した上記メッセージに含まれる感性に触れる表現を抽出する感性表現抽出手段と、
受信した上記メッセージに含まれる固有表現を抽出する固有表現抽出手段と、
抽出された上記感性に触れる表現に基づいて重要度を判別する重要度判別手段と、
判別された上記重要度に基づいて上記メッセージをランク付けしたうえで上記メッセージを上記感性に触れる表現および上記固有表現を強調表示して提示する提示手段と、
受信した上記メッセージにおいて所定の固有表現をその固有表現の内容がわからない他の表記に置換する置換手段と、
上記固有表現を上記他の表記に置換した上記メッセージを所定の宛先に転送するメッセージ転送手段とを有することを特徴とするメッセージ処理装置。
Message receiving means for receiving a message;
Kansei expression extracting means for extracting an expression touching the sensitivity included in the received message,
A named entity extracting means for extracting a named entity included in the received message;
Importance determining means for determining the importance based on the extracted expression touching the sensitivity,
A presenting means that ranks the messages based on the determined importance and highlights and presents the expression touching the sensibility and the specific expression;
Replacement means for replacing a predetermined specific expression in the received message with another notation that does not know the content of the specific expression;
And a message transfer unit configured to transfer the message obtained by replacing the specific expression with the other expression to a predetermined destination.
抽出された上記感性に触れる表現に加え、抽出された固有表現を参照して上記重要度を判別する請求項5記載のメッセージ処理装置。The message processing apparatus according to claim 5, wherein the importance is determined by referring to the extracted specific expression in addition to the extracted expression touching the sensitivity. 上記宛先から転送されてきたメッセージに含まれる上記他の表記を対応する固有表現に復元する復元手段を更に有する請求項6記載のメッセージ処理装置。The message processing apparatus according to claim 6, further comprising a restoration unit that restores the other notation included in the message transferred from the destination to a corresponding specific expression. メッセージを受信するステップと、
受信した上記メッセージに含まれる固有表現を抽出するステップと、
受信した上記メッセージにおいて所定の固有表現をその固有表現の内容がわからない他の表記に置換するステップと、
上記固有表現を上記他の表記に置換した上記メッセージを所定の宛先に転送するステップと、
上記宛先から転送されてきたメッセージに含まれる上記他の表記を対応する固有表現に復元するステップとを有することを特徴とするメッセージ処理方法。
Receiving a message;
Extracting a specific expression included in the received message;
Replacing the predetermined specific expression in the received message with another notation that does not know the content of the specific expression;
Forwarding the message with the unique representation replaced with the other notation to a predetermined destination;
Restoring the other notation included in the message transferred from the destination to a corresponding specific expression.
メッセージを受信するステップと、
受信した上記メッセージに含まれる固有表現を抽出するステップと、
受信した上記メッセージにおいて所定の固有表現をその固有表現の内容がわからない他の表記に置換するステップと、
上記固有表現を上記他の表記に置換した上記メッセージを所定の宛先に転送するステップと、
上記宛先から転送されてきたメッセージに含まれる上記他の表記を対応する固有表現に復元するステップとをコンピュータに実行させるために用いられることを特徴とするメッセージ処理用コンピュータプログラム。
Receiving a message;
Extracting a specific expression included in the received message;
Replacing the predetermined specific expression in the received message with another notation that does not know the content of the specific expression;
Forwarding the message with the unique representation replaced with the other notation to a predetermined destination;
A computer program for message processing, which is used for causing a computer to execute the step of restoring the other notation included in a message transferred from the destination to a corresponding specific expression.
JP2003192412A 2003-07-04 2003-07-04 Message processing device and method Pending JP2005025642A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003192412A JP2005025642A (en) 2003-07-04 2003-07-04 Message processing device and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003192412A JP2005025642A (en) 2003-07-04 2003-07-04 Message processing device and method

Publications (1)

Publication Number Publication Date
JP2005025642A true JP2005025642A (en) 2005-01-27

Family

ID=34189722

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003192412A Pending JP2005025642A (en) 2003-07-04 2003-07-04 Message processing device and method

Country Status (1)

Country Link
JP (1) JP2005025642A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007271655A (en) * 2006-03-30 2007-10-18 Brother Ind Ltd System for adding affective content, and method and program for adding affective content
JP2011113098A (en) * 2009-11-21 2011-06-09 Kddi R & D Laboratories Inc Turned letter correction program and method for correcting text containing turned letter, and text analysis server
JP2021506034A (en) * 2017-12-15 2021-02-18 株式会社ツイニーTWINNY Co., Ltd. Servers and user terminals that support the management of social networks

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007271655A (en) * 2006-03-30 2007-10-18 Brother Ind Ltd System for adding affective content, and method and program for adding affective content
JP2011113098A (en) * 2009-11-21 2011-06-09 Kddi R & D Laboratories Inc Turned letter correction program and method for correcting text containing turned letter, and text analysis server
JP2021506034A (en) * 2017-12-15 2021-02-18 株式会社ツイニーTWINNY Co., Ltd. Servers and user terminals that support the management of social networks

Similar Documents

Publication Publication Date Title
Welbers et al. Text analysis in R
CN110914824B (en) Apparatus and method for removing sensitive content from a document
US11507745B2 (en) System and method for detecting undesirable and potentially harmful online behavior
Derczynski et al. Microblog-genre noise and impact on semantic annotation accuracy
US20130218914A1 (en) System and method for providing recommendations based on information extracted from reviewers&#39; comments
US10552539B2 (en) Dynamic highlighting of text in electronic documents
US8000957B2 (en) English-language translation of exact interpretations of keyword queries
JP6518981B1 (en) Translation apparatus, control program for translation apparatus, and translation method using translation apparatus
JP2012003572A (en) Sensitivity analysis system and program
Kulkarni et al. Exploring and processing text data
US9875232B2 (en) Method and system for generating a definition of a word from multiple sources
JP5438603B2 (en) Kansei dictionary editing support system and program
Kirmani et al. ShortMail: An email summarizer system
JP2020077356A (en) Translation apparatus, control program of translation apparatus, and translation method using translation apparatus
JP2005025642A (en) Message processing device and method
KR20210013991A (en) Apparatus, method, computer program, computer-readable storage device, server and system for drafting patent document
JP2012003573A (en) Sensitivity analyzing system and program
KR101238927B1 (en) Electronic book contents searching service system and electronic book contents searching service method
US11017172B2 (en) Proposition identification in natural language and usage thereof for search and retrieval
JP2020123215A (en) Translation device, control program of translation device, and translation method using translation device
KR100885527B1 (en) Apparatus for making index-data based by context and for searching based by context and method thereof
JP6996190B2 (en) Compound word generator, program and compound word generation method
Shilpa et al. DR: Abs-Sum-Kan: an abstractive text summarization technique for an Indian regional language by induction of Tagging rules
JP2022087934A (en) Translation apparatus, control program of translation apparatus, and translation method using translation apparatus
JP2021026590A (en) Translation device, program for controlling translation device, and translation evaluation method using translation device

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060622

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20071206

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071218

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080218

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080513

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080707

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080930