JP2005285060A

JP2005285060A - 敬語表現判定装置、及び敬語表現判定プログラム

Info

Publication number: JP2005285060A
Application number: JP2004102126A
Authority: JP
Inventors: Tamotsu Shirato; 保白土; Hitoshi Isahara; 均井佐原
Original assignee: National Institute of Information and Communications Technology
Current assignee: National Institute of Information and Communications Technology
Priority date: 2004-03-31
Filing date: 2004-03-31
Publication date: 2005-10-13

Abstract

【課題】第一登場人物が第二登場人物に何かをしたという内容を話者が聞き手に伝聞形式で伝えるという日本語で入力された会話文テキストにおいて用いられる敬語表現の正誤を機械的に判断できるようにする。
【解決手段】コンピュータが、会話文テキストと四者の社会的上下関係を示した入力ラベルとの入力を受け付け、その会話文テキストについて形態素解析を行い、各形態素の部分的並びに基づいて、人物に付与される敬称、動詞を含む形態素の並びが示す敬語の種類、文末表現において用いられる敬語である丁寧語の有無について敬語タイプ辞書を参照して敬語的特徴情報を生成し、この敬語的特徴情報と入力ラベルとについて、四者の社会的上下関係と、第一登場人物及び第二登場人物の敬称の有無、会話文テキストの文末表現における丁寧語の有無、及び前記動詞を含む形態素の並びに該当する敬語の有無又は敬語の種類とを検証する正誤判定ルールに基づいて検証する検証し、その検証結果である正誤判定結果を出力するようにした。
【選択図】図１

Description

本発明は、日本語の会話文において用いられる敬語の正誤を判定することができる敬語表現判定装置、及びコンピュータを敬語表現判定装置として動作させるための敬語表現判定プログラムに関するものである。

日本語の会話において敬語が持つ重要な機能の一つは、会話の当事者（話者と聞き手）間、会話における登場人物間、会話の当事者と登場人物との間での社会的な上下関係を、その会話の当事者同士の間で認識させることにより、円滑なコミュニケーションを促進することである。ところが近年では、種々の敬語が本来の機能や意味にそぐわない態様で誤用される事態が増加しており、日本語表現の乱れの要因の一つとして問題となってきている。

これまで、日本語会話形式の通信文における送り手（話者）と受け手（聞き手）との社会的上下関係と当該通信文とに基づいて待遇度（丁寧さ加減）を解析し、待遇度に応じた表現を記憶させた辞書（待遇度表現辞書）を生成したり、その待遇度表現辞書を利用して入力された文章に対応する適切な表現の文章の候補を出力する、という待遇表現蓄積装置及び待遇表現生成装置が考えられている（例えば、特許文献１参照）。斯かる技術の他にも、入力文中の表現における敬意の大きさを数値化して当該入力文をユーザが指定した大きさの敬意を持つ文に修正するという敬語表現敬意評価装置（例えば、特許文献２参照）や、入力文中に含まれる敬語を抽出してその敬語が適切か否かを出力するという敬語検出訂正装置（例えば、特許文献３参照）等も考えられている。
特許第２７８５０４５号公報特開平７−１６０７０８号公報特開平５−９４４３５号公報

ところが、上述のような従来技術のうち、待遇表現蓄積装置や敬語表現生成装置では、通信文に関係する人物が２人のみに限定されているうえ、待遇度表現辞書を生成するために用いられる通信文や、入力される文章において敬語表現が誤用されているか否かを判断することはできない。また、敬語表現敬意評価装置や敬語検出訂正装置においても敬語の誤用を取り扱うことができず、しかも登場人物の上下関係と敬語表現との整合性をチェックすることもできない。すなわち、以上のような従来の技術は、会話形式の入力文に登場する人物や、当該入力文において想定される話者と聞き手の社会的な上下関係を考慮した敬語表現の正誤を取り扱うことができないことから、日本語の敬語表現を学習するために活用するには十分なものとは言い難いものであった。

そこで本発明は、以上のような問題に鑑みて、日本語の敬語表現の的確な学習に資するべく、４人が登場する会話形式の日本語入力文においてそれら人物間の社会的な上下関係を考慮して当該入力文で用いられる敬語表現の正誤を自動的に判断できるようにする技術を提供しようとするものである。

すなわち、本発明は、入力された会話文テキストと当該会話文テキストに関連する四人の人物の社会的上下関係を示す入力ラベルとに基づいて、その会話文テキストに含まれる敬語表現の正誤を自動的に判断することができるコンピュータからなる敬語表現判定装置、及び当該コンピュータに格納することでそのコンピュータを敬語表現判定装置として機能させることができる敬語表現判定プログラムである。ここで、本発明における会話文テキストは、第一登場人物を主語とする一つの動詞を含み当該動詞の対象が第二登場人物であることを話者が聞き手に伝える態様の伝聞形式からなるデータである。一方、入力ラベルは、前記会話文テキストの話者、聞き手、第一登場人物及び第二登場人物の合計四者に係る社会的上下関係が記述されたデータである。

詳述すれば、前記敬語表現判定プログラムにしたがってコンピュータが動作することにより、本発明に係る敬語表現判定装置Ｘは、図１に概略的な機能構成図を示すように、コンピュータが、前記会話文テキスト及び入力ラベルとの入力を受け付ける入力受付手段１と、この入力受付手段１で受け付けた会話文テキストに対して形態素解析を行う形態素解析手段２と、形態素解析手段２によって得られた各形態素の部分的並びに基づいて、人物に付与される一つ以上の敬称群、及び動詞を含む形態素の並びが示す敬語の種類群、及び文末表現において用いられる敬語である丁寧語群からなるデータベースである敬語タイプ辞書１０を参照することによって、第一登場人物の敬称の有無、第二登場人物の敬称の有無、動詞を含む形態素の並びに該当する敬語の有無又は敬語が有る場合にはその種類、会話文テキストの文末表現における丁寧語の有無、の情報からなる敬語的特徴情報を生成する敬語的特徴情報生成手段３と、敬語的特徴生成手段３により生成された敬語的特徴情報と、入力受付手段１で受け付けた入力ラベルとについて、前記四者の社会的上下関係と、当該第一登場人物及び第二登場人物の敬称の有無、会話文テキストの文末表現における丁寧語の有無、及び動詞を含む形態素の並びに該当する敬語の有無又は敬語の種類とを検証する正誤判定ルールに基づいて検証する検証手段４と、検証手段４による会話文テキストにおける敬語表現の正誤判定結果を出力する判定結果出力手段５とを具備してなることを特徴とするものである。

なお、入力受付手段１は、この敬語表現判定装置Ｘを構成するコンピュータと情報通信可能に接続された入力機器からのデータ入力を受け付けるものであり、入力機器にはキーボードやマウス、音声入力機器や他のコンピュータ等の外部装置が含まれる。また、判定結果出力手段５は、この敬語表現判定装置Ｘを構成するコンピュータと情報通信可能に接続された出力機器へデータ出力を行うものであり、出力機器にはディスプレイやプリンタ、音声出力機器や他のコンピュータ等の外部装置が含まれる。

このような構成によれば、入力された会話文テキストにおいて、「適切な敬称が用いられているか」、「動詞が適切な敬語表現で用いられているか」、「文末表現が適切な敬語表現となっているか」ということが、当該会話文テキストと共に入力された入力ラベルで定義づけられた前記四者すなわち話者、聞き手、第一登場人物及び第二登場人物の社会的上下関係に照らして判断され、その判定結果を出力することが可能となる。すなわち、入力文における敬語表現の正誤判断はこれまでの技術では不可能であったが、本発明によりこの問題を解決することができ、しかも本発明は入力文（会話文テキスト）に関係する合計四者の社会的な上下関係まで考慮した敬語表現の正誤判断が可能であるという格段に優れたものであるといえる。従って、本発明を例えば日本語の敬語表現学習プログラムに適用することで、従来ではなし得なかった高度な敬語表現の学習等に寄与できることとなる。

以上のような本発明はさらに、検証手段４を、会話文テキストにおける話者と第一登場人物との社会的上下関係及び会話文テキストにおける第一登場人物の敬称の有無、話者と第二登場人物との社会的上下関係及び会話文テキストにおける第二登場人物の敬称の有無、話者と聞き手との社会的上下関係及び会話文テキストの文末表現における丁寧語の有無、並びに前記話者と第一登場人物と第二登場人物の三者間の社会的上下関係及び会話文テキストの動詞を含む形態素の並びに該当する敬語の種類又は敬語の有無を検証する正誤判断ルールに基づいて、敬語的特徴情報と入力ラベルとを検証するものとした場合に、より具体的且つ適切に会話文テキストにおける敬語表現の正誤判断を行い得るものとすることが可能となる。

また、判定結果出力手段５は、単に会話文テキストの正誤判定結果を出力するに留まらず、敬語表現の正誤判定結果が誤りである場合には、会話文テキストにおける敬語表現の誤用箇所を抽出して出力するものとすることもできる。またこの場合、判定結果出力手段５は、敬語表現の正誤判定結果が誤りである場合には、判定結果及び誤用箇所と共に、当該誤用箇所における敬語表現の誤用の種類を出力するものとすることもできる。このように構成することで、会話文テキストにおける具体的な誤用箇所やその誤った用法をユーザに提供することができることとなり、さらに高度な敬語表現の学習に役立つものとなる。

本発明によれば、入力される会話文テキストが二名の登場人物とそのうち一方を主語とする一つのみの動詞を含む伝聞形式のものであれば、それら二名の登場人物と当該会話文の話者及び聞き手の合計四者間の社会的上下関係に基づいて、その会話文テキストで用いられている敬語表現、すなわち登場人物に付される敬称、動詞を含む敬語表現、文末における敬語表現が正しいか否かを自動的に判別することができる。このことは、従来の技術では入力文の登場人物が二名の場合に限られていたこと、敬語表現の正誤判断が不可能であったことに鑑みれば、本発明が極めて高度なものであることを意味している。また、会話文テキストにおける敬語表現の正誤判断結果のみならず、誤用箇所や誤用の種類をも自動出力することで、とりわけ難しいとされる日本語の敬語表現の学習に対する好適且つ高度な支援が可能である。

以下、本発明の一実施形態を、図面を参照して説明する。

本実施形態は、コンピュータに格納された敬語表現判定プログラムに従って当該コンピュータが敬語表現判定装置Ｘ（図１参照）として機能し、入力された会話文テキストにおける敬語表現の正誤を判定するものである。具体的に本実施形態では前記コンピュータとして、図２に示すようなＣＰＵ１０１、内部メモリ１０２、ハードディスク等のストレージデバイス１０３、各種通信インタフェース１０４等の内部機器を相互に通信線で接続してなる一般的なパーソナルコンピュータを適用している。このパーソナルコンピュータには、キーボードやマウス等の入力デバイス１０５、ディスプレイやプリンタ等の出力デバイス１０６、CD-ROM等の記憶媒体に対応したメディアドライブ１０７等の外部機器を接続している。なお、本発明のコンピュータには、前述のようなパーソナルコンピュータの他にも、より大型のワークステーションや、より小型の携帯端末機等を適用することも可能である。

ここで、敬語表現判定装置Ｘは、前記コンピュータにおける前記ストレージデバイス１０３にインストールされた敬語表現判定プログラムを所要時に起動させ、メモリ１０２に読み込ませてそれに従ってＣＰＵ１０１が各種内部及び外部機器を作動させることにより、入力受付手段１、形態素解析手段２、敬語的特徴情報生成手段３、検証手段４、判定結果出力手段５としての機能を発揮する。なお、前記ストレージデバイス１０３には、敬語タイプ辞書１０がデータベースとして、及び正誤判定ルールが所定の内部プログラムとして予め格納されており、ＣＰＵ１０１の指令に基づいて適宜これらが読み出される。なお、敬語タイプ辞書１０及び正誤判定ルールは、ストレージデバイス１０３に限らず、このコンピュータと通信可能なその他のデータベース装置や記憶媒体に格納しておくことも可能である。

入力受付手段１は、入力デバイス１０５を利用してコンピュータに入力された会話文テキストと入力ラベルとを受け付ける。ここで、会話文テキストには、話者が聞き手に話題を伝える伝聞形式のテキストであり、当該テキスト中にはある者（第一登場人物）が他の者（第二登場人物）に何かを行ったという動詞を１つのみ含むという制限が加えられる。また、入力ラベルは、会話文テキストの話者、聞き手、第一登場人物及び第二登場人物の合計４名に関する社会的地位の順位を規定したデータであり、例えばこの４名を社会的地位の高い順又は低い順に並べた態様や、不等号で社会的地位の上下関係を表してこの４名を並べた態様や、４名の社会的地位の順位を数値の大小で表したもの等で規定される。

形態素解析手段２は、前記入力受付手段１で入力を受け付けた会話文テキストに対して形態素解析を実行するものである。この形態素解析手段２には、汎用又は専用の形態素解析プログラムに基づく機能を適用することができる。斯かる形態素解析プログラムの具体例としては、「茶筅（http//chasen.aist-nara.ac.jp/ ，奈良先端科学技術大学院大学）」等を挙げることができる。

敬語的特徴情報生成手段３は、形態素解析手段２によって形態素解析された会話文テキストの敬語的特徴情報を生成する処理を実行する。この敬語的特徴情報は、第一登場人物の敬称の有無、第二登場人物の敬称の有無、動詞を含む形態素の並びに該当する敬語の種類又は敬語の有無、文末表現における丁寧語の有無の、情報から構成される。この敬語的特徴情報の生成に際し、敬語的特徴情報生成手段３は、敬語タイプ辞書１０にアクセスしてそれに格納されている情報を参照する。ここで敬語タイプ辞書１０に格納される情報とは、図３にごく一例を示すように、人物に付与される一つ以上の敬称群１１、及び動詞を含む形態素の並びが示す敬語の種類群１２、文末表現において用いられる敬語である丁寧語群１３、を含むものである。

検証手段４は、敬語的特徴情報生成手段３によって得られた敬語的特徴情報及び前記入力ラベルに関し、正誤判定ルールに基づいて、四者（話者、聞き手、第一登場人物、第二登場人物）の社会的上下関係と、第一登場人物及び第二登場人物の敬称の有無、会話文テキストの文末表現における丁寧語の有無又は敬語の種類、及び動詞を含む形態素の並びに該当する敬語の有無又は敬語の種類とを検証する処理を実行する。ここで、正誤判定ルールは、前述の社会的上下関係、敬称の有無、丁寧語の有無、敬語の有無又はその種類を検証するための内部プログラムからなるものであり、その処理手順の詳細については後述する。

判定結果出力手段５は、検証手段による検証結果を出力デバイス１０６へアウトプットするものであるが、本実施形態ではその一例として、検証結果をディスプレイに表示する態様を採用している。斯かる検証結果には、入力ラベルに基づいた会話文テキストの敬語表現に係る用法の正誤のみならず、「誤」の場合はその誤用箇所と誤用の種類をも出力してディスプレイに表示させる。

以上のような各手段１〜５における処理をコンピュータに実行させることで、当該コンピュータを敬語表現判定装置Ｘとして機能させるのであるが、この敬語表現判定装置Ｘによる入力から出力までの処理プロセスを概括してまとめると、図４に示すように、入力受付手段１による入力受付ステップＳ１、形態素解析手段２による形態素解析ステップＳ２、敬語的特徴情報生成手段３による敬語的特徴情報生成ステップＳ３、検証手段４による検証ステップＳ４、判定結果出力手段５による判定結果出力ステップＳ５の順に処理が進行することになる。以下、具体的に説明する。

まず、ユーザがキーボード等の入力デバイス１０５を利用して入力した入力ラベル及び会話文テキストは、入力受付ステップＳ１においてコンピュータがその入力を受け付け、メモリ１０２に一時的に記憶する。次に、この会話文テキストに対して形態素解析ステップＳ２において形態素解析を実行して単語ごとに分解し、それを当該会話文テキストにおける並び順で区切る。このようにして得られた形態素解析結果は、メモリ１０２に一時的に記憶される。

次に、敬語的特徴情報生成ステップＳ３においては、図５により詳細なサブルートを示すように、形態素解析結果に基づいて１〜４つ程度の部分的な形態素の並びを抽出し、それらと敬語タイプ辞書１０とを比較することにより、まず形態素「第一登場人物」の後に形態素「敬称」があるか否かを判断して（Ｓ３１）、「有」の場合にはその情報と当該敬称の種類とをメモリ１０２に一時的に記憶し（Ｓ３２ａ）、「無」の場合にはその情報をメモリ１０２に一時的に記憶する（Ｓ３２ｂ）。続いて同様に、形態素「第二登場人物」の後に形態素「敬称」があるか否かを判断して（Ｓ３３）、「有」の場合にはその情報と当該敬称の種類とをメモリ１０２に一時的に記憶し（Ｓ３４ａ）、「無」の場合にはその情報をメモリ１０２に一時的に記憶する（Ｓ３４ｂ）。次に、形態素「動詞」を含む前後の形態素の並びについて、敬語タイプ辞書１０中に該当するものがあるか否かを判断して（Ｓ３５）、「有」の場合には該当する「敬語の種類」をメモリ１０２に一時的に記憶し（Ｓ３６ａ）、「無」の場合には「その他」の情報をメモリ１０２に一時的に記憶する（Ｓ３６ｂ）。さらに、文末の区点「。」の前にある形態素に基づいて敬語タイプ辞書１０中に該当する形態素「丁寧語」があるか否かを判断して（Ｓ３７）、「有」の場合にはその情報をメモリ１０２に一時的に記憶し（Ｓ３８ａ）、「無」の場合には「その他」の情報をメモリ１０２に一時的に記憶する（Ｓ３８ｂ）。最後に、以上のサブルートにおける工程でメモリ１０２に一時的に記憶した情報を纏めて「敬語的特徴情報」を生成してそれをメモリ１０２に記憶する（Ｓ３９）ことで、このサブルートを終了する。

次に、検証ステップＳ４においては、入力ラベルを解析するとともに敬語的特徴情報から得られる情報に基づき、当該会話文テキストにおいて用いられた敬語表現の正誤を検証する。その検証のための「正誤判定ルール」は、図６〜図１１に示すサブルートに従ったものである。すなわち、検証ステップＳ４は図６に示すように大別して、第一登場人物敬語タイプチェックルールＳ４１、第二登場人物敬語タイプチェックルールＳ４２、文末敬語タイプチェックルールＳ４３、動詞敬語タイプチェックルールＳ４４、総合判定ルールＳ４５から構成される。なお、以下の説明では便宜上、話者を「Ｓ」、聞き手を「Ｌ」、第一登場人物を「Ａ」、第二登場人物を「Ｂ」という各記号で表すものとする。また、以下の説明及び図中において用いる不等号「＞」は、その左辺の人物が右辺の人物よりも社会的地位が上であることを示している。但し、本実施形態においては、人物間の社会的地位が等しい場合も不等号「＞」を用いて表すものとし、この「＞」とその左辺又は右辺に位置付けられる人物との関係は、以下の取り決めに従うものとする。すなわち、まず、「Ｓ」と「Ｌ」、「Ｓ」と「Ａ」、「Ｓ」と「Ｂ」の社会的地位が等しい場合は、「Ｓ」を「＞」の左辺に置き、「Ｌ」「Ａ」「Ｂ」を右辺に置く。次に、「Ａ」と「Ｂ」、「Ａ」と「Ｌ」の社会的地位が等しい場合は、「Ａ」を「＞」の左辺に置き、「Ｂ」「Ｌ」を右辺に置く。そして、これらの何れにも該当しない場合は、何れの人物を「＞」の左右どちら側においても構わない。なお、以上の取り決めは、入力ラベルの入力に際しても適用するものとする。

まず、図７に示す第一登場人物敬語タイプチェックルールＳ４１のサブルートにおいては、入力ラベルにおけるＡとＳとの社会的上下関係と、会話文テキスト中のＡに敬称が付されているか否かを判断する。すなわちまず、入力ラベルが「Ａ＞Ｓ」である（すなわち「Ｓ＞Ａ」でない）場合（Ｓ４１１；Ｙ）、敬語的特徴情報においてＡに敬称が有るか否かを判断し（Ｓ４１２ａ）、敬称が「有」の場合は入力ラベルと敬語表現の用法が正しいと判断して「ＯＫ」をメモリ１０２に一時的に記憶し（Ｓ４１３ａ）、敬称が「無」の場合は誤用であると判断して「ＥＬＳＥ」をメモリ１０２に一時的に記憶する（Ｓ４１３ｂ）。一方、入力ラベルが「Ａ＞Ｓ」ではない（すなわち「Ｓ＞Ａである」場合（Ｓ４１１；Ｎ）、敬語的特徴情報においてＡに敬称が無いか否かを判断し（Ｓ４１２ｂ）、敬称が「無」の場合は入力ラベルと敬語表現の用法が正しいと判断して「ＯＫ」をメモリ１０２に一時的に記憶し（Ｓ４１３ｃ）、敬称が「有」の場合は誤用であると判断して「ＥＬＳＥ」をメモリ１０２に一時的に記憶する（Ｓ４１３ｄ）。

また、図８に示す第二登場人物敬語タイプチェックルールＳ４２のサブルートにおいては、第一登場人物敬語タイプチェックルールＳ４１と同様に、入力ラベルにおけるＢとＳとの社会的上下関係と、会話文テキスト中のＢに敬称が付されているか否かを判断する。すなわちまず、入力ラベルが「Ｂ＞Ｓ」である（すなわち「Ｓ＞Ｂ」でない）場合（Ｓ４２１；Ｙ）、敬語的特徴情報においてＢに敬称が有るか否かを判断し（Ｓ４２２ａ）、敬称が「有」の場合は入力ラベルと敬語表現の用法が正しいと判断して「ＯＫ」をメモリ１０２に一時的に記憶し（Ｓ４２３ａ）、敬称が「無」の場合は誤用であると判断して「ＥＬＳＥ」をメモリ１０２に一時的に記憶する（Ｓ４２３ｂ）。一方、入力ラベルが「Ｂ＞Ｓ」ではない（すなわち「Ｓ＞Ｂである」場合（Ｓ４２１；Ｎ）、敬語的特徴情報においてＢに敬称が無いか否かを判断し（Ｓ４２２ｂ）、敬称が「無」の場合は入力ラベルと敬語表現の用法が正しいと判断して「ＯＫ」をメモリ１０２に一時的に記憶し（Ｓ４２３ｃ）、敬称が「有」の場合は誤用であると判断して「ＥＬＳＥ」をメモリ１０２に一時的に記憶する（Ｓ４２３ｄ）。

さらに、図９に示す文末敬語タイプチェックルールＳ４３のサブルートにおいては、入力ラベルにおけるＬとＳとの社会的上下関係と、会話文テキストの文末に丁寧語が用いられているか否かを判断する。すなわちまず、入力ラベルが「Ｌ＞Ｓ」である場合（Ｓ４３１；Ｙ）、敬語的特徴情報において丁寧語が有るか否かを判断し（Ｓ４３２ａ）、「有」の場合は入力ラベルと敬語表現の用法が正しいと判断して「ＯＫ」をメモリ１０２に一時的に記憶し（Ｓ４３３ａ）、敬称が無く「その他」の場合は誤用であると判断して「ＥＬＳＥ」をメモリ１０２に一時的に記憶する（Ｓ４３３ｂ）。一方、入力ラベルが「Ｌ＞Ｓ」ではない（すなわち「Ｓ＞Ｌである」場合（Ｓ４３１；Ｎ）、敬語的特徴情報において丁寧語が無いか否かを判断し（Ｓ４３２ｂ）、丁寧語が無く「その他」の場合は入力ラベルと敬語表現の用法が正しいと判断して「ＯＫ」をメモリ１０２に一時的に記憶し（Ｓ４３３ｃ）、「有」の場合は誤用であると判断して「ＥＬＳＥ」をメモリ１０２に一時的に記憶する（Ｓ４３３ｄ）。

さらにまた、図１０に示す動詞敬語タイプチェックルールＳ４４のサブルートにおいては、入力ラベルにおけるＳとＡ、ＳとＢ、ＡとＢのそれぞれの社会的上下関係と、会話文テキスト中の動詞を含む前後の形態素の並びから尊敬語や謙譲語が用いられているか否かを判断する。すなわちまず、入力ラベルが「Ｓ＞Ａ」であり（Ｓ４４１；Ｙ）、且つ「Ｓ＞Ｂ」である場合（Ｓ４４２ａ；Ｙ）、敬語的特徴情報において尊敬語が無く「その他」であって（Ｓ４４３ａ；Ｙ）且つ謙譲語も無く「その他」であれば（Ｓ４４４ａ；Ｙ）、動詞の用法が正しいと判断して「ＯＫ」をメモリ１０２に一時的に記憶し（Ｓ４４５ａ）、尊敬語が「有」の場合（Ｓ４４３ａ；Ｎ）又は謙譲語が「有」の場合（Ｓ４４４ａ；Ｎ）の場合は誤用であるとして「ＥＬＳＥ」をメモリ１０２に一時的に記憶する（Ｓ４４５ｂ）。一方、入力ラベルが「Ｓ＞Ａ」であり（Ｓ４４１；Ｙ）、且つ「Ｓ＞Ｂ」でない（すなわち「Ｂ＞Ｓ」である）場合（Ｓ４４２ａ；Ｎ）、敬語的特徴情報において尊敬語が無く「その他」であって（Ｓ４４３ｂ；Ｙ）且つ謙譲語が「有」であれば（Ｓ４４４ｂ；Ｙ）、動詞の用法が正しいと判断して「ＯＫ」をメモリ１０２に一時的に記憶し（Ｓ４４５ｃ）、尊敬語が「有」の場合（Ｓ４４３ｂ；Ｎ）又は謙譲語が無く「その他」の場合（Ｓ４４４ｂ；Ｎ）の場合は誤用であるとして「ＥＬＳＥ」をメモリ１０２に一時的に記憶する（Ｓ４４５ｄ）。

また、入力ラベルが「Ｓ＞Ａ」でなく（すなわち「Ａ＞Ｓ」であり）（Ｓ４４１；Ｎ）、且つ「Ａ＞Ｂ」である場合（Ｓ４４２ｂ；Ｙ）、敬語的特徴情報において尊敬語が「有」であって（Ｓ４４３ｃ；Ｙ）且つ謙譲語が無く「その他」であれば（Ｓ４４４ｃ；Ｙ）、動詞の用法が正しいと判断して「ＯＫ」をメモリ１０２に一時的に記憶し（Ｓ４４５ｅ）、尊敬語が無く「その他」の場合（Ｓ４４３ｃ；Ｎ）又は謙譲語が「有」の場合（Ｓ４４４ｃ；Ｎ）の場合は誤用であるとして「ＥＬＳＥ」をメモリ１０２に一時的に記憶する（Ｓ４４５ｆ）。一方、入力ラベルが「Ｓ＞Ａ」でなく（すなわち「Ａ＞Ｓ」であり）（Ｓ４４１；Ｎ）、且つ「Ａ＞Ｂ」でない（すなわち「Ｂ＞Ａ」である）場合（Ｓ４４２ｂ；Ｎ）、敬語的特徴情報において尊敬語が「有」であれば（Ｓ４４３ｄ；Ｙ）、謙譲語が「有」であっても（Ｓ４４４ｄ；Ｙ）謙譲語が無く「その他」であっても（Ｓ４４４ｄ；Ｎ）、動詞の用法が正しいと判断して「ＯＫ」をメモリ１０２に一時的に記憶し（Ｓ４４５ｇ、Ｓ４４５ｈ）、尊敬語が無く「その他」の場合（Ｓ４４３ｄ；Ｎ）、謙譲語が「有」であれば（Ｓ４４４ｅ；Ｎ）動詞の用法が正しいと判断して「ＯＫ」をメモリ１０２に一時的に記憶し（Ｓ４４５ｉ）、謙譲語が無く「その他」であれば（Ｓ４４４ｅ；Ｎ）の場合は誤用であるとして「ＥＬＳＥ」をメモリ１０２に一時的に記憶する（Ｓ４４５ｊ）。なお、上述したステップＳ４４４ｄを省略して謙譲語の有無については判断することなく、Ｓ４４３ｄにおいて尊敬語が「有」（Ｓ４４３ｄ；Ｙ）と判断された場合には、動詞の用法が正しいとして「ＯＫ」をメモリ１０２に記憶（Ｓ４４５ｇ又はＳ４４５ｈ）するようにすることもできる。

そして、図１１に示す総合判断ルールＳ４５のサブルートにおいては、以上の第一登場人物敬語タイプチェックルールＳ４１、第二登場人物敬語タイプチェックルールＳ４２、文末敬語タイプチェックルールＳ４３、動詞敬語タイプチェックルールＳ４４それぞれにおいて「ＥＬＳＥ」があるか否かを検証する。すなわち、Ｓ４１〜Ｓ４４において「ＥＬＳＥ」が無いかをメモリ１０２から呼び出して検証し（Ｓ４５１）、全て「ＯＫ」であったならば最終的に入力ラベルに対応して会話文テキストにおける敬語表現の用法が正しいと判断して「ＯＫ」をメモリ１０２に一時的に記憶する（Ｓ４５２ａ）。一方、一つでも「ＥＬＳＥ」があれば、入力ラベルに対応して会話文テキスト中で敬語表現が誤用されていると判断して最終的に「ＥＬＳＥ」をメモリ１０２に一時的に記憶し（Ｓ４５２ｂ）、その「ＥＬＳＥ」に至ったステップ、すなわち誤用箇所及び誤用された敬語表現の種類をメモリ１０２に一時的に記憶する（Ｓ４５３）。

最後に、判定結果出力ステップＳ５では、メモリ１０２に記憶された上記の判定結果を出力デバイス１０６へ出力する。すなわち、Ｓ４５２ａにおいて「ＯＫ」が記憶されている場合は、ディスプレイに敬語表現の用法が「正しい」旨を表示させ、Ｓ４５２ｂにおいて「ＥＬＳＥ」が記憶されている場合には、ディスプレイに敬語表現が「誤用」である旨と、その誤用箇所及び誤用の種類を表示させる。

以下、具体的な一入力例を上述のフローチャートに当てはめて、最終的に得られる出力例を示す。ここでは、図１２（ａ）に示すように、入力例として、入力ラベルが「Ａ＞Ｂ＞Ｌ＞Ｓ」であり（すなわち、社会的上下関係が、第一登場人物Ａ、第二登場人物Ｂ、聞き手Ｌ、話者Ｓ、の順である）、会話文テキストが「ＡさんがＢさんに申し上げたそうです。」という場合について説明する。まず、敬語表現判定装置Ｘは、この入力ラベルと会話文テキストを入力受付手段１で受け付け、形態素解析手段２において会話文テキストを形態素解析する。次に、敬語的特徴情報生成手段３において、図１２（ｂ）に示すような敬語的特徴情報を生成する。ここでは、人物Ａ及び人物Ｂに敬称「さん」が付されているのでいずれの敬称も「有」であり、人物Ａを主語とする動詞を含む形態素の部分的並びが「申す＋上げる」であるので「謙譲語」であり、文末に「です。」が用いられているので「丁寧語」が「有」となる。以上を検証ステップＳ４に適用すると、まず第一登場人物敬語タイプチェックルールＳ４１は、Ｓ４１１→Ｓ４１２ａ→Ｓ４１３ａの順で処理し、「ＯＫ」となる。次に、第二登場人物敬語タイプチェックルールＳ４２は、Ｓ４２１→Ｓ４２２ａ→Ｓ４２３ａの順で処理し、「ＯＫ」となる。また、文末敬語タイプチェックルールＳ４３は、Ｓ４３１→Ｓ４３２ａ→Ｓ４３３ａの順で処理し、「ＯＫ」となる。さらに、動詞敬語タイプチェックルールＳ４４は、Ｓ４４１→Ｓ４４２ｂ→Ｓ４３３ｃ→Ｓ４４５ｆの順で処理し、「ＥＬＳＥ」となる。すなわち、「ＥＬＳＥ」が一つ含まれているので最終的にこの会話文テキストは「ＥＬＳＥ」であると判断され、図１２（ｃ）に示すような出力例として「判定：誤用」、「誤用箇所及び種類：『Ａ＞Ｂ』で謙譲語『申し上げ』」がディスプレイに表示されることになる。

このように、本実施形態を利用することで、話者、聞き手、第一登場人物、第二登場人物の四者からなる会話文テキストの入力と、これら四者の社会的上下関係を示す入力ラベルの入力とが必要であり、会話文テキストには第一登場人物を主語とする動詞を一つのみ含むという制限の下で、入力ラベルに基づいた会話文テキストにおける敬語表現の用法の正誤を自動的に検証することができる。したがって本実施形態は、日本語の敬語表現の習熟のための好適な支援アイテムとなり、また本実施形態に係る敬語表現判定プログラムを別途の日本語入力プログラム等に組み込むことで、正しい日本語の入力支援を行うことができる。

なお、本発明は上述した実施形態に限られるものではない。すなわち、敬語表現判定プログラムによる処理手順や処理方法などは適宜の変更が可能であり、敬語表現判定装置の具体的構成についても本発明の趣旨を逸脱しない範囲で種々変形が可能である。

本発明に係る敬語表現判定装置の概略的な機能構成図。同敬語表現判定装置の概略的な機器構成図。同実施形態において利用される敬語タイプ辞書の例を示す図。同敬語表現判定装置における処理手順を示すフローチャート。同フローチャートの一部（Ｓ３）をさらに詳細に示すフローチャート。同フローチャートの一部（Ｓ４）をさらに詳細に示すフローチャート。同フローチャートの一部（Ｓ４１）をさらに詳細に示すフローチャート。同フローチャートの一部（Ｓ４２）をさらに詳細に示すフローチャート。同フローチャートの一部（Ｓ４３）をさらに詳細に示すフローチャート。同フローチャートの一部（Ｓ４４）をさらに詳細に示すフローチャート。同フローチャートの一部（Ｓ４５）をさらに詳細に示すフローチャート。同実施形態を適用した入力例、敬語的特徴情報例、出力例を示す図。

符号の説明

１…入力受付手段
２…形態素解析手段
３…敬語的特徴情報生成手段
４…検証手段
５…判定結果出力手段
Ｘ…敬語表現判定装置

Claims

第一登場人物を主語とする一つの動詞を含み当該動詞の対象が第二登場人物であることを話者が聞き手に伝える態様の伝聞形式の会話文テキストと、前記話者、聞き手、第一登場人物及び第二登場人物の合計四者に係る社会的上下関係が記述された入力ラベルとの入力を受け付ける入力受付手段と、
前記入力受付手段で受け付けた会話文テキストに対して形態素解析を行う形態素解析手段と、
前記形態素解析手段によって得られた各形態素の部分的並びに基づいて、人物に付与される一つ以上の敬称群、及び動詞を含む形態素の並びが示す敬語の種類群、及び文末表現において用いられる敬語である丁寧語群からなるデータベースである敬語タイプ辞書を参照することによって、前記第一登場人物の敬称の有無、前記第二登場人物の敬称の有無、前記動詞を含む形態素の並びに該当する敬語の有無又は敬語が有る場合にはその種類、前記会話文テキストの文末表現における丁寧語の有無、の情報からなる敬語的特徴情報を生成する敬語的特徴情報生成手段と、
前記敬語的特徴生成手段により生成された敬語的特徴情報と、前記入力受付手段で受け付けた入力ラベルとについて、前記四者の社会的上下関係と、当該第一登場人物及び第二登場人物の敬称の有無、前記会話文テキストの文末表現における丁寧語の有無、及び前記動詞を含む形態素の並びに該当する敬語の有無又は敬語の種類とを検証する正誤判定ルールに基づいて検証する検証手段と、
前記検証手段による前記会話文テキストにおける敬語表現の正誤判定結果を出力する判定結果出力手段と
を具備してなることを特徴とする敬語表現判定装置。
前記検証手段は、
前記話者と前記第一登場人物との社会的上下関係及び前記会話文テキストにおける第一登場人物の敬称の有無、
前記話者と第二登場人物との社会的上下関係及び前記会話文テキストにおける第二登場人物の敬称の有無、
前記話者と聞き手との社会的上下関係及び前記会話文テキストの文末表現における丁寧語の有無、
前記話者と第一登場人物と第二登場人物の三者間の社会的上下関係及び前記会話文テキストの動詞を含む形態素の並びに該当する敬語の種類又は敬語の有無
を検証する前記正誤判断ルールに基づいて、前記敬語的特徴情報と前記入力ラベルとを検証するものである請求項１記載の敬語表現判定装置。
前記判定結果出力手段が、敬語表現の正誤判定結果が誤りである場合に、当該判定結果と共に、前記会話文テキストにおける敬語表現の誤用箇所を抽出して出力するものである請求項１又は２記載の敬語表現判定装置。
前記判定結果出力手段が、敬語表現の正誤判定結果が誤りである場合に、当該判定結果及び誤用箇所と共に、当該誤用箇所における敬語表現の誤用の種類を出力するものである請求項３記載の敬語表現判定装置。
コンピュータに格納され、当該コンピュータを敬語表現判定装置として機能させるものであって、前記コンピュータを、
当該コンピュータに接続された入力機器から出力された、第一登場人物を主語とする一つの動詞を含み当該動詞の対象が第二登場人物であることを話者が聞き手に伝える態様の伝聞形式の会話文テキストと、前記話者、聞き手、第一登場人物及び第二登場人物の合計四者に係る社会的上下関係が記述された入力ラベルとの入力を受け付ける入力受付手段と、
前記入力受付手段で受け付けた会話文テキストに対して形態素解析を行う形態素解析手段と、
前記形態素解析手段によって得られた各形態素の部分的並びに基づいて、人物に付与される一つ以上の敬称群、及び動詞を含む形態素の並びが示す敬語の種類群、及び文末表現において用いられる敬語である丁寧語群からなるデータベースである敬語タイプ辞書を参照することによって、前記第一登場人物の敬称の有無、前記第二登場人物の敬称の有無、前記動詞を含む形態素の並びに該当する敬語の有無又は敬語が有る場合にはその種類、前記会話文テキストの文末表現における丁寧語の有無、の情報からなる敬語的特徴情報を生成する敬語的特徴情報生成手段と、
前記敬語的特徴生成手段により生成された敬語的特徴情報と、前記入力受付手段で受け付けた入力ラベルとについて、前記四者の社会的上下関係と、当該第一登場人物及び第二登場人物の敬称の有無、前記会話文テキストの文末表現における丁寧語の有無、及び前記動詞を含む形態素の並びに該当する敬語の有無又は敬語の種類とを検証する正誤判定ルールに基づいて検証する検証手段と、
前記検証手段による前記会話文テキストにおける敬語表現の正誤判定結果を前記コンピュータに接続された出力機器へ出力する判定結果出力手段
として動作させることを特徴とする敬語表現判定プログラム。
前記検証手段が、
前記話者と前記第一登場人物との社会的上下関係及び前記会話文テキストにおける第一登場人物の敬称の有無、
前記話者と第二登場人物との社会的上下関係及び前記会話文テキストにおける第二登場人物の敬称の有無、
前記話者と聞き手との社会的上下関係及び前記会話文テキストの文末表現における丁寧語の有無、
前記話者と第一登場人物と第二登場人物の三者間の社会的上下関係及び前記会話文テキストの動詞を含む形態素の並びに該当する敬語の種類又は敬語の有無
を検証する前記正誤判断ルールに基づいて、前記敬語的特徴情報と前記入力ラベルとを検証するように前記コンピュータを動作させる請求項５記載の敬語表現判定プログラム。
前記判定結果出力手段が、敬語表現の正誤判定結果が誤りである場合に、当該判定結果と共に、前記会話文テキストにおける敬語表現の誤用箇所を抽出して前記出力機器へ出力するように前記コンピュータを動作させる請求項５又は６記載の敬語表現判定プログラム。
前記判定結果出力手段が、敬語表現の正誤判定結果が誤りである場合に、当該判定結果及び誤用箇所と共に、当該誤用箇所における敬語表現の誤用の種類を前記出力機器へ出力するように前記コンピュータを動作させる請求項７記載の敬語表現判定プログラム。