JP2005285060A - 敬語表現判定装置、及び敬語表現判定プログラム - Google Patents
敬語表現判定装置、及び敬語表現判定プログラム Download PDFInfo
- Publication number
- JP2005285060A JP2005285060A JP2004102126A JP2004102126A JP2005285060A JP 2005285060 A JP2005285060 A JP 2005285060A JP 2004102126 A JP2004102126 A JP 2004102126A JP 2004102126 A JP2004102126 A JP 2004102126A JP 2005285060 A JP2005285060 A JP 2005285060A
- Authority
- JP
- Japan
- Prior art keywords
- honorific
- character
- expression
- absence
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
【課題】第一登場人物が第二登場人物に何かをしたという内容を話者が聞き手に伝聞形式で伝えるという日本語で入力された会話文テキストにおいて用いられる敬語表現の正誤を機械的に判断できるようにする。
【解決手段】コンピュータが、会話文テキストと四者の社会的上下関係を示した入力ラベルとの入力を受け付け、その会話文テキストについて形態素解析を行い、各形態素の部分的並びに基づいて、人物に付与される敬称、動詞を含む形態素の並びが示す敬語の種類、文末表現において用いられる敬語である丁寧語の有無について敬語タイプ辞書を参照して敬語的特徴情報を生成し、この敬語的特徴情報と入力ラベルとについて、四者の社会的上下関係と、第一登場人物及び第二登場人物の敬称の有無、会話文テキストの文末表現における丁寧語の有無、及び前記動詞を含む形態素の並びに該当する敬語の有無又は敬語の種類とを検証する正誤判定ルールに基づいて検証する検証し、その検証結果である正誤判定結果を出力するようにした。
【選択図】図1
【解決手段】コンピュータが、会話文テキストと四者の社会的上下関係を示した入力ラベルとの入力を受け付け、その会話文テキストについて形態素解析を行い、各形態素の部分的並びに基づいて、人物に付与される敬称、動詞を含む形態素の並びが示す敬語の種類、文末表現において用いられる敬語である丁寧語の有無について敬語タイプ辞書を参照して敬語的特徴情報を生成し、この敬語的特徴情報と入力ラベルとについて、四者の社会的上下関係と、第一登場人物及び第二登場人物の敬称の有無、会話文テキストの文末表現における丁寧語の有無、及び前記動詞を含む形態素の並びに該当する敬語の有無又は敬語の種類とを検証する正誤判定ルールに基づいて検証する検証し、その検証結果である正誤判定結果を出力するようにした。
【選択図】図1
Description
本発明は、日本語の会話文において用いられる敬語の正誤を判定することができる敬語表現判定装置、及びコンピュータを敬語表現判定装置として動作させるための敬語表現判定プログラムに関するものである。
日本語の会話において敬語が持つ重要な機能の一つは、会話の当事者(話者と聞き手)間、会話における登場人物間、会話の当事者と登場人物との間での社会的な上下関係を、その会話の当事者同士の間で認識させることにより、円滑なコミュニケーションを促進することである。ところが近年では、種々の敬語が本来の機能や意味にそぐわない態様で誤用される事態が増加しており、日本語表現の乱れの要因の一つとして問題となってきている。
これまで、日本語会話形式の通信文における送り手(話者)と受け手(聞き手)との社会的上下関係と当該通信文とに基づいて待遇度(丁寧さ加減)を解析し、待遇度に応じた表現を記憶させた辞書(待遇度表現辞書)を生成したり、その待遇度表現辞書を利用して入力された文章に対応する適切な表現の文章の候補を出力する、という待遇表現蓄積装置及び待遇表現生成装置が考えられている(例えば、特許文献1参照)。斯かる技術の他にも、入力文中の表現における敬意の大きさを数値化して当該入力文をユーザが指定した大きさの敬意を持つ文に修正するという敬語表現敬意評価装置(例えば、特許文献2参照)や、入力文中に含まれる敬語を抽出してその敬語が適切か否かを出力するという敬語検出訂正装置(例えば、特許文献3参照)等も考えられている。
特許第2785045号公報
特開平7−160708号公報
特開平5−94435号公報
ところが、上述のような従来技術のうち、待遇表現蓄積装置や敬語表現生成装置では、通信文に関係する人物が2人のみに限定されているうえ、待遇度表現辞書を生成するために用いられる通信文や、入力される文章において敬語表現が誤用されているか否かを判断することはできない。また、敬語表現敬意評価装置や敬語検出訂正装置においても敬語の誤用を取り扱うことができず、しかも登場人物の上下関係と敬語表現との整合性をチェックすることもできない。すなわち、以上のような従来の技術は、会話形式の入力文に登場する人物や、当該入力文において想定される話者と聞き手の社会的な上下関係を考慮した敬語表現の正誤を取り扱うことができないことから、日本語の敬語表現を学習するために活用するには十分なものとは言い難いものであった。
そこで本発明は、以上のような問題に鑑みて、日本語の敬語表現の的確な学習に資するべく、4人が登場する会話形式の日本語入力文においてそれら人物間の社会的な上下関係を考慮して当該入力文で用いられる敬語表現の正誤を自動的に判断できるようにする技術を提供しようとするものである。
すなわち、本発明は、入力された会話文テキストと当該会話文テキストに関連する四人の人物の社会的上下関係を示す入力ラベルとに基づいて、その会話文テキストに含まれる敬語表現の正誤を自動的に判断することができるコンピュータからなる敬語表現判定装置、及び当該コンピュータに格納することでそのコンピュータを敬語表現判定装置として機能させることができる敬語表現判定プログラムである。ここで、本発明における会話文テキストは、第一登場人物を主語とする一つの動詞を含み当該動詞の対象が第二登場人物であることを話者が聞き手に伝える態様の伝聞形式からなるデータである。一方、入力ラベルは、前記会話文テキストの話者、聞き手、第一登場人物及び第二登場人物の合計四者に係る社会的上下関係が記述されたデータである。
詳述すれば、前記敬語表現判定プログラムにしたがってコンピュータが動作することにより、本発明に係る敬語表現判定装置Xは、図1に概略的な機能構成図を示すように、コンピュータが、前記会話文テキスト及び入力ラベルとの入力を受け付ける入力受付手段1と、この入力受付手段1で受け付けた会話文テキストに対して形態素解析を行う形態素解析手段2と、形態素解析手段2によって得られた各形態素の部分的並びに基づいて、人物に付与される一つ以上の敬称群、及び動詞を含む形態素の並びが示す敬語の種類群、及び文末表現において用いられる敬語である丁寧語群からなるデータベースである敬語タイプ辞書10を参照することによって、第一登場人物の敬称の有無、第二登場人物の敬称の有無、動詞を含む形態素の並びに該当する敬語の有無又は敬語が有る場合にはその種類、会話文テキストの文末表現における丁寧語の有無、の情報からなる敬語的特徴情報を生成する敬語的特徴情報生成手段3と、敬語的特徴生成手段3により生成された敬語的特徴情報と、入力受付手段1で受け付けた入力ラベルとについて、前記四者の社会的上下関係と、当該第一登場人物及び第二登場人物の敬称の有無、会話文テキストの文末表現における丁寧語の有無、及び動詞を含む形態素の並びに該当する敬語の有無又は敬語の種類とを検証する正誤判定ルールに基づいて検証する検証手段4と、検証手段4による会話文テキストにおける敬語表現の正誤判定結果を出力する判定結果出力手段5とを具備してなることを特徴とするものである。
なお、入力受付手段1は、この敬語表現判定装置Xを構成するコンピュータと情報通信可能に接続された入力機器からのデータ入力を受け付けるものであり、入力機器にはキーボードやマウス、音声入力機器や他のコンピュータ等の外部装置が含まれる。また、判定結果出力手段5は、この敬語表現判定装置Xを構成するコンピュータと情報通信可能に接続された出力機器へデータ出力を行うものであり、出力機器にはディスプレイやプリンタ、音声出力機器や他のコンピュータ等の外部装置が含まれる。
このような構成によれば、入力された会話文テキストにおいて、「適切な敬称が用いられているか」、「動詞が適切な敬語表現で用いられているか」、「文末表現が適切な敬語表現となっているか」ということが、当該会話文テキストと共に入力された入力ラベルで定義づけられた前記四者すなわち話者、聞き手、第一登場人物及び第二登場人物の社会的上下関係に照らして判断され、その判定結果を出力することが可能となる。すなわち、入力文における敬語表現の正誤判断はこれまでの技術では不可能であったが、本発明によりこの問題を解決することができ、しかも本発明は入力文(会話文テキスト)に関係する合計四者の社会的な上下関係まで考慮した敬語表現の正誤判断が可能であるという格段に優れたものであるといえる。従って、本発明を例えば日本語の敬語表現学習プログラムに適用することで、従来ではなし得なかった高度な敬語表現の学習等に寄与できることとなる。
以上のような本発明はさらに、検証手段4を、会話文テキストにおける話者と第一登場人物との社会的上下関係及び会話文テキストにおける第一登場人物の敬称の有無、話者と第二登場人物との社会的上下関係及び会話文テキストにおける第二登場人物の敬称の有無、話者と聞き手との社会的上下関係及び会話文テキストの文末表現における丁寧語の有無、並びに前記話者と第一登場人物と第二登場人物の三者間の社会的上下関係及び会話文テキストの動詞を含む形態素の並びに該当する敬語の種類又は敬語の有無を検証する正誤判断ルールに基づいて、敬語的特徴情報と入力ラベルとを検証するものとした場合に、より具体的且つ適切に会話文テキストにおける敬語表現の正誤判断を行い得るものとすることが可能となる。
また、判定結果出力手段5は、単に会話文テキストの正誤判定結果を出力するに留まらず、敬語表現の正誤判定結果が誤りである場合には、会話文テキストにおける敬語表現の誤用箇所を抽出して出力するものとすることもできる。またこの場合、判定結果出力手段5は、敬語表現の正誤判定結果が誤りである場合には、判定結果及び誤用箇所と共に、当該誤用箇所における敬語表現の誤用の種類を出力するものとすることもできる。このように構成することで、会話文テキストにおける具体的な誤用箇所やその誤った用法をユーザに提供することができることとなり、さらに高度な敬語表現の学習に役立つものとなる。
本発明によれば、入力される会話文テキストが二名の登場人物とそのうち一方を主語とする一つのみの動詞を含む伝聞形式のものであれば、それら二名の登場人物と当該会話文の話者及び聞き手の合計四者間の社会的上下関係に基づいて、その会話文テキストで用いられている敬語表現、すなわち登場人物に付される敬称、動詞を含む敬語表現、文末における敬語表現が正しいか否かを自動的に判別することができる。このことは、従来の技術では入力文の登場人物が二名の場合に限られていたこと、敬語表現の正誤判断が不可能であったことに鑑みれば、本発明が極めて高度なものであることを意味している。また、会話文テキストにおける敬語表現の正誤判断結果のみならず、誤用箇所や誤用の種類をも自動出力することで、とりわけ難しいとされる日本語の敬語表現の学習に対する好適且つ高度な支援が可能である。
以下、本発明の一実施形態を、図面を参照して説明する。
本実施形態は、コンピュータに格納された敬語表現判定プログラムに従って当該コンピュータが敬語表現判定装置X(図1参照)として機能し、入力された会話文テキストにおける敬語表現の正誤を判定するものである。具体的に本実施形態では前記コンピュータとして、図2に示すようなCPU101、内部メモリ102、ハードディスク等のストレージデバイス103、各種通信インタフェース104等の内部機器を相互に通信線で接続してなる一般的なパーソナルコンピュータを適用している。このパーソナルコンピュータには、キーボードやマウス等の入力デバイス105、ディスプレイやプリンタ等の出力デバイス106、CD-ROM等の記憶媒体に対応したメディアドライブ107等の外部機器を接続している。なお、本発明のコンピュータには、前述のようなパーソナルコンピュータの他にも、より大型のワークステーションや、より小型の携帯端末機等を適用することも可能である。
ここで、敬語表現判定装置Xは、前記コンピュータにおける前記ストレージデバイス103にインストールされた敬語表現判定プログラムを所要時に起動させ、メモリ102に読み込ませてそれに従ってCPU101が各種内部及び外部機器を作動させることにより、入力受付手段1、形態素解析手段2、敬語的特徴情報生成手段3、検証手段4、判定結果出力手段5としての機能を発揮する。なお、前記ストレージデバイス103には、敬語タイプ辞書10がデータベースとして、及び正誤判定ルールが所定の内部プログラムとして予め格納されており、CPU101の指令に基づいて適宜これらが読み出される。なお、敬語タイプ辞書10及び正誤判定ルールは、ストレージデバイス103に限らず、このコンピュータと通信可能なその他のデータベース装置や記憶媒体に格納しておくことも可能である。
入力受付手段1は、入力デバイス105を利用してコンピュータに入力された会話文テキストと入力ラベルとを受け付ける。ここで、会話文テキストには、話者が聞き手に話題を伝える伝聞形式のテキストであり、当該テキスト中にはある者(第一登場人物)が他の者(第二登場人物)に何かを行ったという動詞を1つのみ含むという制限が加えられる。また、入力ラベルは、会話文テキストの話者、聞き手、第一登場人物及び第二登場人物の合計4名に関する社会的地位の順位を規定したデータであり、例えばこの4名を社会的地位の高い順又は低い順に並べた態様や、不等号で社会的地位の上下関係を表してこの4名を並べた態様や、4名の社会的地位の順位を数値の大小で表したもの等で規定される。
形態素解析手段2は、前記入力受付手段1で入力を受け付けた会話文テキストに対して形態素解析を実行するものである。この形態素解析手段2には、汎用又は専用の形態素解析プログラムに基づく機能を適用することができる。斯かる形態素解析プログラムの具体例としては、「茶筅(http//chasen.aist-nara.ac.jp/ ,奈良先端科学技術大学院大学)」等を挙げることができる。
敬語的特徴情報生成手段3は、形態素解析手段2によって形態素解析された会話文テキストの敬語的特徴情報を生成する処理を実行する。この敬語的特徴情報は、第一登場人物の敬称の有無、第二登場人物の敬称の有無、動詞を含む形態素の並びに該当する敬語の種類又は敬語の有無、文末表現における丁寧語の有無の、情報から構成される。この敬語的特徴情報の生成に際し、敬語的特徴情報生成手段3は、敬語タイプ辞書10にアクセスしてそれに格納されている情報を参照する。ここで敬語タイプ辞書10に格納される情報とは、図3にごく一例を示すように、人物に付与される一つ以上の敬称群11、及び動詞を含む形態素の並びが示す敬語の種類群12、文末表現において用いられる敬語である丁寧語群13、を含むものである。
検証手段4は、敬語的特徴情報生成手段3によって得られた敬語的特徴情報及び前記入力ラベルに関し、正誤判定ルールに基づいて、四者(話者、聞き手、第一登場人物、第二登場人物)の社会的上下関係と、第一登場人物及び第二登場人物の敬称の有無、会話文テキストの文末表現における丁寧語の有無又は敬語の種類、及び動詞を含む形態素の並びに該当する敬語の有無又は敬語の種類とを検証する処理を実行する。ここで、正誤判定ルールは、前述の社会的上下関係、敬称の有無、丁寧語の有無、敬語の有無又はその種類を検証するための内部プログラムからなるものであり、その処理手順の詳細については後述する。
判定結果出力手段5は、検証手段による検証結果を出力デバイス106へアウトプットするものであるが、本実施形態ではその一例として、検証結果をディスプレイに表示する態様を採用している。斯かる検証結果には、入力ラベルに基づいた会話文テキストの敬語表現に係る用法の正誤のみならず、「誤」の場合はその誤用箇所と誤用の種類をも出力してディスプレイに表示させる。
以上のような各手段1〜5における処理をコンピュータに実行させることで、当該コンピュータを敬語表現判定装置Xとして機能させるのであるが、この敬語表現判定装置Xによる入力から出力までの処理プロセスを概括してまとめると、図4に示すように、入力受付手段1による入力受付ステップS1、形態素解析手段2による形態素解析ステップS2、敬語的特徴情報生成手段3による敬語的特徴情報生成ステップS3、検証手段4による検証ステップS4、判定結果出力手段5による判定結果出力ステップS5の順に処理が進行することになる。以下、具体的に説明する。
まず、ユーザがキーボード等の入力デバイス105を利用して入力した入力ラベル及び会話文テキストは、入力受付ステップS1においてコンピュータがその入力を受け付け、メモリ102に一時的に記憶する。次に、この会話文テキストに対して形態素解析ステップS2において形態素解析を実行して単語ごとに分解し、それを当該会話文テキストにおける並び順で区切る。このようにして得られた形態素解析結果は、メモリ102に一時的に記憶される。
次に、敬語的特徴情報生成ステップS3においては、図5により詳細なサブルートを示すように、形態素解析結果に基づいて1〜4つ程度の部分的な形態素の並びを抽出し、それらと敬語タイプ辞書10とを比較することにより、まず形態素「第一登場人物」の後に形態素「敬称」があるか否かを判断して(S31)、「有」の場合にはその情報と当該敬称の種類とをメモリ102に一時的に記憶し(S32a)、「無」の場合にはその情報をメモリ102に一時的に記憶する(S32b)。続いて同様に、形態素「第二登場人物」の後に形態素「敬称」があるか否かを判断して(S33)、「有」の場合にはその情報と当該敬称の種類とをメモリ102に一時的に記憶し(S34a)、「無」の場合にはその情報をメモリ102に一時的に記憶する(S34b)。次に、形態素「動詞」を含む前後の形態素の並びについて、敬語タイプ辞書10中に該当するものがあるか否かを判断して(S35)、「有」の場合には該当する「敬語の種類」をメモリ102に一時的に記憶し(S36a)、「無」の場合には「その他」の情報をメモリ102に一時的に記憶する(S36b)。さらに、文末の区点「。」の前にある形態素に基づいて敬語タイプ辞書10中に該当する形態素「丁寧語」があるか否かを判断して(S37)、「有」の場合にはその情報をメモリ102に一時的に記憶し(S38a)、「無」の場合には「その他」の情報をメモリ102に一時的に記憶する(S38b)。最後に、以上のサブルートにおける工程でメモリ102に一時的に記憶した情報を纏めて「敬語的特徴情報」を生成してそれをメモリ102に記憶する(S39)ことで、このサブルートを終了する。
次に、検証ステップS4においては、入力ラベルを解析するとともに敬語的特徴情報から得られる情報に基づき、当該会話文テキストにおいて用いられた敬語表現の正誤を検証する。その検証のための「正誤判定ルール」は、図6〜図11に示すサブルートに従ったものである。すなわち、検証ステップS4は図6に示すように大別して、第一登場人物敬語タイプチェックルールS41、第二登場人物敬語タイプチェックルールS42、文末敬語タイプチェックルールS43、動詞敬語タイプチェックルールS44、総合判定ルールS45から構成される。なお、以下の説明では便宜上、話者を「S」、聞き手を「L」、第一登場人物を「A」、第二登場人物を「B」という各記号で表すものとする。また、以下の説明及び図中において用いる不等号「>」は、その左辺の人物が右辺の人物よりも社会的地位が上であることを示している。但し、本実施形態においては、人物間の社会的地位が等しい場合も不等号「>」を用いて表すものとし、この「>」とその左辺又は右辺に位置付けられる人物との関係は、以下の取り決めに従うものとする。すなわち、まず、「S」と「L」、「S」と「A」、「S」と「B」の社会的地位が等しい場合は、「S」を「>」の左辺に置き、「L」「A」「B」を右辺に置く。次に、「A」と「B」、「A」と「L」の社会的地位が等しい場合は、「A」を「>」の左辺に置き、「B」「L」を右辺に置く。そして、これらの何れにも該当しない場合は、何れの人物を「>」の左右どちら側においても構わない。なお、以上の取り決めは、入力ラベルの入力に際しても適用するものとする。
まず、図7に示す第一登場人物敬語タイプチェックルールS41のサブルートにおいては、入力ラベルにおけるAとSとの社会的上下関係と、会話文テキスト中のAに敬称が付されているか否かを判断する。すなわちまず、入力ラベルが「A>S」である(すなわち「S>A」でない)場合(S411;Y)、敬語的特徴情報においてAに敬称が有るか否かを判断し(S412a)、敬称が「有」の場合は入力ラベルと敬語表現の用法が正しいと判断して「OK」をメモリ102に一時的に記憶し(S413a)、敬称が「無」の場合は誤用であると判断して「ELSE」をメモリ102に一時的に記憶する(S413b)。一方、入力ラベルが「A>S」ではない(すなわち「S>Aである」場合(S411;N)、敬語的特徴情報においてAに敬称が無いか否かを判断し(S412b)、敬称が「無」の場合は入力ラベルと敬語表現の用法が正しいと判断して「OK」をメモリ102に一時的に記憶し(S413c)、敬称が「有」の場合は誤用であると判断して「ELSE」をメモリ102に一時的に記憶する(S413d)。
また、図8に示す第二登場人物敬語タイプチェックルールS42のサブルートにおいては、第一登場人物敬語タイプチェックルールS41と同様に、入力ラベルにおけるBとSとの社会的上下関係と、会話文テキスト中のBに敬称が付されているか否かを判断する。すなわちまず、入力ラベルが「B>S」である(すなわち「S>B」でない)場合(S421;Y)、敬語的特徴情報においてBに敬称が有るか否かを判断し(S422a)、敬称が「有」の場合は入力ラベルと敬語表現の用法が正しいと判断して「OK」をメモリ102に一時的に記憶し(S423a)、敬称が「無」の場合は誤用であると判断して「ELSE」をメモリ102に一時的に記憶する(S423b)。一方、入力ラベルが「B>S」ではない(すなわち「S>Bである」場合(S421;N)、敬語的特徴情報においてBに敬称が無いか否かを判断し(S422b)、敬称が「無」の場合は入力ラベルと敬語表現の用法が正しいと判断して「OK」をメモリ102に一時的に記憶し(S423c)、敬称が「有」の場合は誤用であると判断して「ELSE」をメモリ102に一時的に記憶する(S423d)。
さらに、図9に示す文末敬語タイプチェックルールS43のサブルートにおいては、入力ラベルにおけるLとSとの社会的上下関係と、会話文テキストの文末に丁寧語が用いられているか否かを判断する。すなわちまず、入力ラベルが「L>S」である場合(S431;Y)、敬語的特徴情報において丁寧語が有るか否かを判断し(S432a)、「有」の場合は入力ラベルと敬語表現の用法が正しいと判断して「OK」をメモリ102に一時的に記憶し(S433a)、敬称が無く「その他」の場合は誤用であると判断して「ELSE」をメモリ102に一時的に記憶する(S433b)。一方、入力ラベルが「L>S」ではない(すなわち「S>Lである」場合(S431;N)、敬語的特徴情報において丁寧語が無いか否かを判断し(S432b)、丁寧語が無く「その他」の場合は入力ラベルと敬語表現の用法が正しいと判断して「OK」をメモリ102に一時的に記憶し(S433c)、「有」の場合は誤用であると判断して「ELSE」をメモリ102に一時的に記憶する(S433d)。
さらにまた、図10に示す動詞敬語タイプチェックルールS44のサブルートにおいては、入力ラベルにおけるSとA、SとB、AとBのそれぞれの社会的上下関係と、会話文テキスト中の動詞を含む前後の形態素の並びから尊敬語や謙譲語が用いられているか否かを判断する。すなわちまず、入力ラベルが「S>A」であり(S441;Y)、且つ「S>B」である場合(S442a;Y)、敬語的特徴情報において尊敬語が無く「その他」であって(S443a;Y)且つ謙譲語も無く「その他」であれば(S444a;Y)、動詞の用法が正しいと判断して「OK」をメモリ102に一時的に記憶し(S445a)、尊敬語が「有」の場合(S443a;N)又は謙譲語が「有」の場合(S444a;N)の場合は誤用であるとして「ELSE」をメモリ102に一時的に記憶する(S445b)。一方、入力ラベルが「S>A」であり(S441;Y)、且つ「S>B」でない(すなわち「B>S」である)場合(S442a;N)、敬語的特徴情報において尊敬語が無く「その他」であって(S443b;Y)且つ謙譲語が「有」であれば(S444b;Y)、動詞の用法が正しいと判断して「OK」をメモリ102に一時的に記憶し(S445c)、尊敬語が「有」の場合(S443b;N)又は謙譲語が無く「その他」の場合(S444b;N)の場合は誤用であるとして「ELSE」をメモリ102に一時的に記憶する(S445d)。
また、入力ラベルが「S>A」でなく(すなわち「A>S」であり)(S441;N)、且つ「A>B」である場合(S442b;Y)、敬語的特徴情報において尊敬語が「有」であって(S443c;Y)且つ謙譲語が無く「その他」であれば(S444c;Y)、動詞の用法が正しいと判断して「OK」をメモリ102に一時的に記憶し(S445e)、尊敬語が無く「その他」の場合(S443c;N)又は謙譲語が「有」の場合(S444c;N)の場合は誤用であるとして「ELSE」をメモリ102に一時的に記憶する(S445f)。一方、入力ラベルが「S>A」でなく(すなわち「A>S」であり)(S441;N)、且つ「A>B」でない(すなわち「B>A」である)場合(S442b;N)、敬語的特徴情報において尊敬語が「有」であれば(S443d;Y)、謙譲語が「有」であっても(S444d;Y)謙譲語が無く「その他」であっても(S444d;N)、動詞の用法が正しいと判断して「OK」をメモリ102に一時的に記憶し(S445g、S445h)、尊敬語が無く「その他」の場合(S443d;N)、謙譲語が「有」であれば(S444e;N)動詞の用法が正しいと判断して「OK」をメモリ102に一時的に記憶し(S445i)、謙譲語が無く「その他」であれば(S444e;N)の場合は誤用であるとして「ELSE」をメモリ102に一時的に記憶する(S445j)。なお、上述したステップS444dを省略して謙譲語の有無については判断することなく、S443dにおいて尊敬語が「有」(S443d;Y)と判断された場合には、動詞の用法が正しいとして「OK」をメモリ102に記憶(S445g又はS445h)するようにすることもできる。
そして、図11に示す総合判断ルールS45のサブルートにおいては、以上の第一登場人物敬語タイプチェックルールS41、第二登場人物敬語タイプチェックルールS42、文末敬語タイプチェックルールS43、動詞敬語タイプチェックルールS44それぞれにおいて「ELSE」があるか否かを検証する。すなわち、S41〜S44において「ELSE」が無いかをメモリ102から呼び出して検証し(S451)、全て「OK」であったならば最終的に入力ラベルに対応して会話文テキストにおける敬語表現の用法が正しいと判断して「OK」をメモリ102に一時的に記憶する(S452a)。一方、一つでも「ELSE」があれば、入力ラベルに対応して会話文テキスト中で敬語表現が誤用されていると判断して最終的に「ELSE」をメモリ102に一時的に記憶し(S452b)、その「ELSE」に至ったステップ、すなわち誤用箇所及び誤用された敬語表現の種類をメモリ102に一時的に記憶する(S453)。
最後に、判定結果出力ステップS5では、メモリ102に記憶された上記の判定結果を出力デバイス106へ出力する。すなわち、S452aにおいて「OK」が記憶されている場合は、ディスプレイに敬語表現の用法が「正しい」旨を表示させ、S452bにおいて「ELSE」が記憶されている場合には、ディスプレイに敬語表現が「誤用」である旨と、その誤用箇所及び誤用の種類を表示させる。
以下、具体的な一入力例を上述のフローチャートに当てはめて、最終的に得られる出力例を示す。ここでは、図12(a)に示すように、入力例として、入力ラベルが「A>B>L>S」であり(すなわち、社会的上下関係が、第一登場人物A、第二登場人物B、聞き手L、話者S、の順である)、会話文テキストが「AさんがBさんに申し上げたそうです。」という場合について説明する。まず、敬語表現判定装置Xは、この入力ラベルと会話文テキストを入力受付手段1で受け付け、形態素解析手段2において会話文テキストを形態素解析する。次に、敬語的特徴情報生成手段3において、図12(b)に示すような敬語的特徴情報を生成する。ここでは、人物A及び人物Bに敬称「さん」が付されているのでいずれの敬称も「有」であり、人物Aを主語とする動詞を含む形態素の部分的並びが「申す+上げる」であるので「謙譲語」であり、文末に「です。」が用いられているので「丁寧語」が「有」となる。以上を検証ステップS4に適用すると、まず第一登場人物敬語タイプチェックルールS41は、S411→S412a→S413aの順で処理し、「OK」となる。次に、第二登場人物敬語タイプチェックルールS42は、S421→S422a→S423aの順で処理し、「OK」となる。また、文末敬語タイプチェックルールS43は、S431→S432a→S433aの順で処理し、「OK」となる。さらに、動詞敬語タイプチェックルールS44は、S441→S442b→S433c→S445fの順で処理し、「ELSE」となる。すなわち、「ELSE」が一つ含まれているので最終的にこの会話文テキストは「ELSE」であると判断され、図12(c)に示すような出力例として「判定:誤用」、「誤用箇所及び種類:『A>B』で謙譲語『申し上げ』」がディスプレイに表示されることになる。
このように、本実施形態を利用することで、話者、聞き手、第一登場人物、第二登場人物の四者からなる会話文テキストの入力と、これら四者の社会的上下関係を示す入力ラベルの入力とが必要であり、会話文テキストには第一登場人物を主語とする動詞を一つのみ含むという制限の下で、入力ラベルに基づいた会話文テキストにおける敬語表現の用法の正誤を自動的に検証することができる。したがって本実施形態は、日本語の敬語表現の習熟のための好適な支援アイテムとなり、また本実施形態に係る敬語表現判定プログラムを別途の日本語入力プログラム等に組み込むことで、正しい日本語の入力支援を行うことができる。
なお、本発明は上述した実施形態に限られるものではない。すなわち、敬語表現判定プログラムによる処理手順や処理方法などは適宜の変更が可能であり、敬語表現判定装置の具体的構成についても本発明の趣旨を逸脱しない範囲で種々変形が可能である。
1…入力受付手段
2…形態素解析手段
3…敬語的特徴情報生成手段
4…検証手段
5…判定結果出力手段
X…敬語表現判定装置
2…形態素解析手段
3…敬語的特徴情報生成手段
4…検証手段
5…判定結果出力手段
X…敬語表現判定装置
Claims (8)
- 第一登場人物を主語とする一つの動詞を含み当該動詞の対象が第二登場人物であることを話者が聞き手に伝える態様の伝聞形式の会話文テキストと、前記話者、聞き手、第一登場人物及び第二登場人物の合計四者に係る社会的上下関係が記述された入力ラベルとの入力を受け付ける入力受付手段と、
前記入力受付手段で受け付けた会話文テキストに対して形態素解析を行う形態素解析手段と、
前記形態素解析手段によって得られた各形態素の部分的並びに基づいて、人物に付与される一つ以上の敬称群、及び動詞を含む形態素の並びが示す敬語の種類群、及び文末表現において用いられる敬語である丁寧語群からなるデータベースである敬語タイプ辞書を参照することによって、前記第一登場人物の敬称の有無、前記第二登場人物の敬称の有無、前記動詞を含む形態素の並びに該当する敬語の有無又は敬語が有る場合にはその種類、前記会話文テキストの文末表現における丁寧語の有無、の情報からなる敬語的特徴情報を生成する敬語的特徴情報生成手段と、
前記敬語的特徴生成手段により生成された敬語的特徴情報と、前記入力受付手段で受け付けた入力ラベルとについて、前記四者の社会的上下関係と、当該第一登場人物及び第二登場人物の敬称の有無、前記会話文テキストの文末表現における丁寧語の有無、及び前記動詞を含む形態素の並びに該当する敬語の有無又は敬語の種類とを検証する正誤判定ルールに基づいて検証する検証手段と、
前記検証手段による前記会話文テキストにおける敬語表現の正誤判定結果を出力する判定結果出力手段と
を具備してなることを特徴とする敬語表現判定装置。 - 前記検証手段は、
前記話者と前記第一登場人物との社会的上下関係及び前記会話文テキストにおける第一登場人物の敬称の有無、
前記話者と第二登場人物との社会的上下関係及び前記会話文テキストにおける第二登場人物の敬称の有無、
前記話者と聞き手との社会的上下関係及び前記会話文テキストの文末表現における丁寧語の有無、
前記話者と第一登場人物と第二登場人物の三者間の社会的上下関係及び前記会話文テキストの動詞を含む形態素の並びに該当する敬語の種類又は敬語の有無
を検証する前記正誤判断ルールに基づいて、前記敬語的特徴情報と前記入力ラベルとを検証するものである請求項1記載の敬語表現判定装置。 - 前記判定結果出力手段が、敬語表現の正誤判定結果が誤りである場合に、当該判定結果と共に、前記会話文テキストにおける敬語表現の誤用箇所を抽出して出力するものである請求項1又は2記載の敬語表現判定装置。
- 前記判定結果出力手段が、敬語表現の正誤判定結果が誤りである場合に、当該判定結果及び誤用箇所と共に、当該誤用箇所における敬語表現の誤用の種類を出力するものである請求項3記載の敬語表現判定装置。
- コンピュータに格納され、当該コンピュータを敬語表現判定装置として機能させるものであって、前記コンピュータを、
当該コンピュータに接続された入力機器から出力された、第一登場人物を主語とする一つの動詞を含み当該動詞の対象が第二登場人物であることを話者が聞き手に伝える態様の伝聞形式の会話文テキストと、前記話者、聞き手、第一登場人物及び第二登場人物の合計四者に係る社会的上下関係が記述された入力ラベルとの入力を受け付ける入力受付手段と、
前記入力受付手段で受け付けた会話文テキストに対して形態素解析を行う形態素解析手段と、
前記形態素解析手段によって得られた各形態素の部分的並びに基づいて、人物に付与される一つ以上の敬称群、及び動詞を含む形態素の並びが示す敬語の種類群、及び文末表現において用いられる敬語である丁寧語群からなるデータベースである敬語タイプ辞書を参照することによって、前記第一登場人物の敬称の有無、前記第二登場人物の敬称の有無、前記動詞を含む形態素の並びに該当する敬語の有無又は敬語が有る場合にはその種類、前記会話文テキストの文末表現における丁寧語の有無、の情報からなる敬語的特徴情報を生成する敬語的特徴情報生成手段と、
前記敬語的特徴生成手段により生成された敬語的特徴情報と、前記入力受付手段で受け付けた入力ラベルとについて、前記四者の社会的上下関係と、当該第一登場人物及び第二登場人物の敬称の有無、前記会話文テキストの文末表現における丁寧語の有無、及び前記動詞を含む形態素の並びに該当する敬語の有無又は敬語の種類とを検証する正誤判定ルールに基づいて検証する検証手段と、
前記検証手段による前記会話文テキストにおける敬語表現の正誤判定結果を前記コンピュータに接続された出力機器へ出力する判定結果出力手段
として動作させることを特徴とする敬語表現判定プログラム。 - 前記検証手段が、
前記話者と前記第一登場人物との社会的上下関係及び前記会話文テキストにおける第一登場人物の敬称の有無、
前記話者と第二登場人物との社会的上下関係及び前記会話文テキストにおける第二登場人物の敬称の有無、
前記話者と聞き手との社会的上下関係及び前記会話文テキストの文末表現における丁寧語の有無、
前記話者と第一登場人物と第二登場人物の三者間の社会的上下関係及び前記会話文テキストの動詞を含む形態素の並びに該当する敬語の種類又は敬語の有無
を検証する前記正誤判断ルールに基づいて、前記敬語的特徴情報と前記入力ラベルとを検証するように前記コンピュータを動作させる請求項5記載の敬語表現判定プログラム。 - 前記判定結果出力手段が、敬語表現の正誤判定結果が誤りである場合に、当該判定結果と共に、前記会話文テキストにおける敬語表現の誤用箇所を抽出して前記出力機器へ出力するように前記コンピュータを動作させる請求項5又は6記載の敬語表現判定プログラム。
- 前記判定結果出力手段が、敬語表現の正誤判定結果が誤りである場合に、当該判定結果及び誤用箇所と共に、当該誤用箇所における敬語表現の誤用の種類を前記出力機器へ出力するように前記コンピュータを動作させる請求項7記載の敬語表現判定プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004102126A JP2005285060A (ja) | 2004-03-31 | 2004-03-31 | 敬語表現判定装置、及び敬語表現判定プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004102126A JP2005285060A (ja) | 2004-03-31 | 2004-03-31 | 敬語表現判定装置、及び敬語表現判定プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005285060A true JP2005285060A (ja) | 2005-10-13 |
Family
ID=35183326
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004102126A Pending JP2005285060A (ja) | 2004-03-31 | 2004-03-31 | 敬語表現判定装置、及び敬語表現判定プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2005285060A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017003017A1 (ko) * | 2015-07-02 | 2017-01-05 | 엘지전자 주식회사 | 모바일 디바이스 및 그 제어 방법 |
-
2004
- 2004-03-31 JP JP2004102126A patent/JP2005285060A/ja active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017003017A1 (ko) * | 2015-07-02 | 2017-01-05 | 엘지전자 주식회사 | 모바일 디바이스 및 그 제어 방법 |
KR20170004426A (ko) * | 2015-07-02 | 2017-01-11 | 엘지전자 주식회사 | 모바일 디바이스 및 그 제어 방법 |
US10587740B2 (en) | 2015-07-02 | 2020-03-10 | Lg Electronics Inc. | Mobile device and method for controlling same |
KR102344064B1 (ko) * | 2015-07-02 | 2021-12-28 | 엘지전자 주식회사 | 모바일 디바이스 및 그 제어 방법 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI437449B (zh) | 多重模式輸入方法及輸入方法編輯器系統 | |
US9484034B2 (en) | Voice conversation support apparatus, voice conversation support method, and computer readable medium | |
US8346537B2 (en) | Input apparatus, input method and input program | |
US20140316764A1 (en) | Clarifying natural language input using targeted questions | |
JP2016218995A (ja) | 機械翻訳方法、機械翻訳装置及びプログラム | |
JP2009140466A (ja) | 使用者製作問答データに基づいた会話辞書サービスの提供方法及びシステム | |
Glass et al. | A naive salience-based method for speaker identification in fiction books | |
Mahlow et al. | 12 Production media: Writing as using tools in media convergent environments | |
JP6678545B2 (ja) | 修正システム、修正方法及びプログラム | |
JP4423004B2 (ja) | テキストマイニング装置、テキストマイニング方法およびテキストマイニングプログラム | |
KR20170009486A (ko) | 청크 기반 언어 학습용 데이터베이스 구축 방법 및 이를 수행하는 전자 기기 | |
JP2008176630A (ja) | 文書データ処理装置 | |
JP2011154590A (ja) | プログラムおよび情報処理装置 | |
JP2005285060A (ja) | 敬語表現判定装置、及び敬語表現判定プログラム | |
KR102072708B1 (ko) | 텍스트 콘텐츠의 장르를 추론하는 방법 및 컴퓨터 프로그램 | |
Alnfiai et al. | Improved Singeltapbraille: Developing a Single Tap Text Entry Method Based on Grade 1 and 2 Braille Encoding. | |
JP2003162524A (ja) | 言語処理装置 | |
JP4437778B2 (ja) | 上下関係判定方法、上下関係判定装置、上下関係判定プログラムおよび記録媒体 | |
JP4371080B2 (ja) | 自然言語学習支援装置及び方法 | |
US11935425B2 (en) | Electronic device, pronunciation learning method, server apparatus, pronunciation learning processing system, and storage medium | |
JP2007171275A (ja) | 言語処理装置及び現後処理方法 | |
JP2006039461A (ja) | 音声合成支援システム、音声合成支援方法および音声合成支援プログラム | |
Johnston | Multimodal Integration | |
JP5331964B2 (ja) | 翻訳支援装置、翻訳支援方法および翻訳支援プログラム | |
Makhetha | UmobiTalk: Ubiquitous Mobile Speech Based Learning Language Translator for Sesotho Language |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20060317 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060328 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060526 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20060627 |