JP2017037513A - 言語処理装置、言語処理プログラム及び言語処理方法 - Google Patents

言語処理装置、言語処理プログラム及び言語処理方法 Download PDF

Info

Publication number
JP2017037513A
JP2017037513A JP2015158894A JP2015158894A JP2017037513A JP 2017037513 A JP2017037513 A JP 2017037513A JP 2015158894 A JP2015158894 A JP 2015158894A JP 2015158894 A JP2015158894 A JP 2015158894A JP 2017037513 A JP2017037513 A JP 2017037513A
Authority
JP
Japan
Prior art keywords
attribute information
search
language processing
unit
dictionary data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2015158894A
Other languages
English (en)
Inventor
中野 貴之
Takayuki Nakano
貴之 中野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2015158894A priority Critical patent/JP2017037513A/ja
Publication of JP2017037513A publication Critical patent/JP2017037513A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)

Abstract

【課題】辞書テーブルのうち参照すべきデータを適切に特定する。
【解決手段】検索部13は、辞書テーブル20を参照して、検索語に対応する意味と地域を取得し、複数の検索語に対応する共通地域に基づいて、辞書テーブル20のうち参照すべきデータを特定する。これにより、オペレータが問い合わせ者に出身地や居住地を質問しなくても、複数の検索語に対応する共通地域を、問い合わせ者がしゃべる方言に対応する地域として特定することができる。また、特定した地域に基づいて辞書テーブルのうち参照すべきデータを適切に特定することができる。
【選択図】図2

Description

本発明は、言語処理装置、言語処理プログラム及び言語処理方法に関する。
コールセンターなど電話での問い合わせに対応する対応者(オペレータ)は、問い合わせの内容を理解して適切に対応する必要がある。この場合、問い合わせ者の中には、方言を用いる人もいるため、オペレータは問い合わせ者が使う方言を正確に理解する必要がある。
従来、方言辞書ソフトを用いて方言を調べる方法が知られている。しかしながら、例えば、方言辞書ソフトが、地域ごとに方言をまとめたものである場合、問い合わせ者の居住地等が分からないと、検索した言葉が全くヒットしないことがある。また、全地域の方言を一纏めにした方言辞書ソフトの場合、検索した言葉の意味として複数地域の意味が表示されることがあるため、方言を正確に理解することができないことがある。
最近では、被発話者が発呼者と同じ言語を話さない場合、位置検出又は電話番号分析のいずれかを介して、ネイティブの方言を特定する技術が知られている(例えば、特許文献1等参照)。また、階層化された辞書を用いて機械翻訳を行うことで、翻訳対象文書の分類やジャンルに拘わらず、訳質が良好な翻訳結果を得る技術が知られている(例えば、特許文献2等参照)。
特表2009−506400号公報 特開2002−91965号公報
方言をしゃべる人は、居住地域のみならず出身地域の影響を受けていることも多い。このため、従来のように位置検出又は電話番号分析を用いたとしても正確に方言の意味を特定できない可能性がある。
なお、方言のみならず、専門用語などを検索する場合においても、分野やジャンルの特定は重要である。
1つの側面では、本発明は、辞書データのうち参照すべきデータを適切に特定することが可能な言語処理装置、言語処理プログラム及び言語処理方法を提供することを目的とする。
一つの態様では、言語処理装置は、単語の属性情報と、該属性情報に対応する単語に関連する情報とを複数格納する辞書データを参照して、入力された検索対象用語に関連する情報及び属性情報を取得する取得部と、前記取得部が取得した複数の前記検索対象用語の属性情報の共通部分に基づいて、前記辞書データのうち参照すべきデータを特定する特定部と、を備えている。
辞書データのうち参照すべきデータを適切に特定することができる。
一実施形態に係る言語処理システムのハードウェア構成を概略的に示す図である。 言語処理システムの機能ブロック図である。 辞書テーブルのデータ構造の一例を示す図である。 地域を階層化した状態を示す図である。 検索履歴DBのデータ構造の一例を示す図である。 言語処理システムの一連の処理を示すフローチャートである。 図6のステップS28の具体的処理を示すフローチャートである。 図6のステップS18の具体的処理を示すフローチャートである。 方言辞書の画面の一例を示す図である。 図6〜図8の処理の具体例を説明するための図である。 図11(a)、図11(b)は、方言辞書の画面の表示例を示す図(その1)である。 方言辞書の画面の表示例を示す図(その2)である。 確認表示を示す図である。 図14(a)、図14(b)は、変形例1について説明するための図である。 図15(a)、図15(b)は、変形例2について説明するための図である。 変形例3について説明するための図である。
以下、言語処理装置の一実施形態である言語処理システム10について、図1〜図13に基づいて詳細に説明する。本実施形態の言語処理システム10は、方言の意味を検索するためのシステムであり、例えばコールセンターのオペレータ(対応者)が利用するものである。
図1には、言語処理システム10のハードウェア構成図が示されている。言語処理システム10は、PC(Personal Computer)などの情報処理装置であり、図1に示すように、CPU(Central Processing Unit)90、ROM(Read Only Memory)92、RAM(Random Access Memory)94、記憶部(ここではHDD(Hard Disk Drive))96、入出力インタフェース97、可搬型記憶媒体用ドライブ99、表示部93、及び入力部95等を備えている。これら言語処理システム10の構成各部は、バス98に接続されている。表示部93は、液晶ディスプレイ等を含み、入力部95は、キーボードやマウス、タッチパネル等を含む。入出力インタフェース97には、例えば電話回線が接続されているものとする。
CPU90が、ROM92あるいはHDD96に格納されているプログラム(言語処理プログラムを含む)、或いは可搬型記憶媒体用ドライブ99が可搬型記憶媒体91から読み取ったプログラム(言語処理プログラムを含む)を実行することにより、言語処理システム10は、図2に示す各部として機能する。
図2には、言語処理システム10の機能ブロック図が示されている。図2に示すように、言語処理システム10は、CPU90がプログラムを実行することにより、検索語受付部11、検索部13、電話番号受付部15、発信地情報処理部17、及び出力部19、として機能する。なお、図2には、HDD96等に格納されている辞書データとしての辞書テーブル20及び検索履歴DB22も図示されている。
検索語受付部11は、オペレータが入力部95を介して入力した検索対象用語(以下、検索語と呼ぶ)を受け付け、検索部13に送信する。検索部13は、辞書テーブル20を参照して、検索語受付部11から受信した検索語(方言)の意味と、検索語(方言)が使われる地域とを検索する。
ここで、辞書テーブル20について、図3、図4に基づいて説明する。辞書テーブル20においては、図3に示すように、「方言」と、方言に関連する情報としての方言の「意味」と、方言の属性情報として方言が用いられる「地域」と、が対応付けて格納されている。例えば、辞書テーブル20の上から1つ目には、方言「なおす」が、「西日本」で用いられる方言であり、その意味が「片付ける」であるという内容が格納されている。また、辞書テーブルには、1つの方言に対して複数の意味や地域が対応付けて格納される場合もある。例えば、方言「こわい」に対しては、北海道で用いられる場合の意味「疲れてきつい」、美濃、飛騨で用いられる場合の意味「恥ずかしい」、長野で用いられる場合の意味「濃い」、が格納されている。ここで、「地域」の欄には、様々な広さの地域名称が格納されるが、地域名称は、図4に示すように階層化されているものとする。図4においては上方に位置するほど広い地域(広域地域)を意味し、下方に位置するほど狭い地域(詳細地域)を意味する。
図2に戻り、電話番号受付部15は、問い合わせ者からの入電があった場合に、入出力インタフェース97に電話回線から入力された問い合わせ者の電話番号の情報を取得し、発信地情報処理部17に対して送信する。発信地情報処理部17は、受信した電話番号の情報に基づいて、相手先の発信地を特定し、検索部13に対して送信する。なお、検索部13では、方言の意味を検索する際に、受信した相手先の発信地を利用する場合があるが、この点については、後に詳述する。
出力部19は、検索部13で検索された検索語の意味等を表示する画面(図9参照)を、表示部93を介して出力する。なお、検索部13は、検索履歴を検索履歴DB22に格納する。ここで、検索履歴DB22について、図5に基づいて説明する。
図5には、検索履歴DB22のデータ構造の一例が示されている。図5に示すように、検索履歴DB22は、方言を発話した人(電話の相手先である問い合わせ者)の識別情報である「発話者ID」と、検索した「方言」と、検索した方言が用いられる「地域」と、検索した「日時」とが関連付けられた状態で格納される。例えば、図5の上から1つ目のレコードには、2015年5月5日の10時0分30秒に、オペレータが発話者ID「10001」の人と話している間に、地域「西日本」で用いられる方言「なおす」を検索したことが格納されている。
(言語処理システム10の処理について)
次に、本実施形態の言語処理システム10が実行する処理について、図6〜図8のフローチャートに沿って、その他図面を適宜参照しつつ詳細に説明する。なお、図6〜図8の処理の前提として、オペレータにより、方言辞書のアプリケーションが起動されており、表示部93上には、図9に示すような方言辞書の画面が表示されているものとする。
図6の処理では、ステップS10において、電話番号受付部15が、入電があるまで待機する。問い合わせ者からの入電があった場合(S10:肯定)、ステップS11に移行し、電話番号受付部15は、電話回線から入力される電話番号の情報を取得し、発信地情報処理部17に送信する。
次いで、ステップS12では、発信地情報処理部17が、電話番号の情報に基づいて、発信地が判明したか否かを判断する。このステップS12の判断が否定された場合、すなわち、電話番号の情報が得られなかった場合や電話番号の情報からは発信地が特定できなかった場合(例えば携帯電話からの入電の場合など)には、ステップS16に移行する。一方、ステップS12の判断が肯定された場合には、ステップS14に移行する。
ステップS14に移行すると、発信地情報処理部17は、検索部13に発信地の情報を送信し、検索部13が出力部19を介して発信地を表示部93上に表示させる。この場合、図9に示す方言辞書の画面の「発信地」の欄に、特定された発信地(例えば、札幌市、大阪市など)が表示されるようになっている。ステップS14の後は、ステップS16に移行する。
なお、この段階で、検索部13は、電話番号の情報から問い合わせ者を特定できる場合には、当該問い合わせ者に対して割り当てられている発話者IDを読み込んだり、新規の発話者IDを問い合わせ者に割り当てるなどする。また、オペレータが問い合わせ者から発話者IDを聞き出した場合には、オペレータは入力部95を介して発話者IDを入力するので、検索部13は、入力された発話者IDを取得する。なお、以降の処理は、問い合わせ者の発話者IDが特定された状態で実行されるものとする。
ステップS16に移行すると、検索部13は、オペレータによって発信地反映ボタンが押されたか否かを判断する。ここで、図9の方言辞書の画面においては、発信地反映ボタンは、「発信地」の表示欄の右側に設けられているボタンである。入力部95を介してオペレータが発信地反映ボタンを押したという情報を検索部13が受け付けた場合、検索部13はステップS18に移行するが、受け付けていない場合には、ステップS20に移行する。
ステップS20に移行すると、検索部13は、図9の画面においてオペレータによって検索語が入力されたか否かを判断する。具体的には、検索部13は、図9の方言辞書の画面の「検索語」の入力欄に、入力部95を介してオペレータにより何らかの単語が入力され、その後に「Enter」キーなどが押されたか否かを判断する。このステップS20の判断が否定された場合には、ステップS16に戻るが、肯定された場合には、ステップS22に移行する。なお、本実施形態では、図10に示すように、1回目の検索として検索語「きーひん」が入力されたものとする。
ステップS22に移行すると、検索部13は、辞書テーブル20を参照して、検索を実行する。図10の例では、「検索」の欄に示すように、「来ない:大阪、奈良」が検索されたものとする。
次いで、ステップS24では、検索部13が、検索履歴DB22を参照し、次のステップS26では、同一の発話者IDの問い合わせ者との会話中に、複数の検索が実行されたか否かを判断する。ステップS26の判断が肯定された場合、すなわち、現在の問い合わせ者が発話した方言の検索履歴が検索履歴DB22に存在する場合には、ステップS28に移行する。一方、1回目の検索の場合には、ステップS26の判断が否定され、検索部13はステップS32に移行する。
ステップS32に移行すると、検索部13は、検索履歴を検索履歴DB22に蓄積する。図10の例では、「履歴」の欄に示すように、「きーひん:大阪、奈良」が検索履歴DB22に格納される。
次いで、ステップS34では、検索部13が、出力部19を介して検索結果を表示部93上に表示する。この場合、図10の「結果」の欄に示すような検索結果「来ない:大阪、奈良」が、図11(a)に示すように方言辞書の画面上に表示される。その後は、検索部13は、ステップS16に戻る。なお、例えば、1回目の検索において、図3の辞書テーブル20に格納されている方言「こわい」のように、複数の意味、地域が検索される場合がある。このような場合には、全ての意味、地域が検索履歴DB22に格納され、画面に表示されることになる。
次に、オペレータが、2回目の検索において、検索語「あかん」を入力したとする(S20)。この場合、図10に示すように、検索結果として「ダメ、いけない:近畿」が検索される(S22)。そして、ステップS24、S26では、既に同一の問い合わせ者との会話中に1回の検索が実行され、検索結果が検索履歴DB22に格納されているので、ステップS26の判断が肯定され、ステップS28に移行する。
ステップS28に移行すると、検索部13は、履歴に含まれる地域と、今回の検索結果に含まれる地域との共通地域を求める処理(サブルーチン)を実行する。このステップS28の処理では、具体的には、図7のフローチャートに沿った処理が実行される。
(ステップS28(図7)の処理)
図7の処理では、まずステップS70において、検索部13が、広域地域を詳細地域の集合に変換する。例えば、今回の検索結果「ダメ、いけない:近畿」の地域は「近畿」であるので、図4において近畿よりも詳細な地域「大阪」、「奈良」、「京」…のような地域の集合に変換する。一方、履歴に含まれる地域は、「大阪」と「奈良」であり、それ以上詳細な地域とすることはできないので、そのままとする。
次いで、ステップS72では、検索部13が、各集合の共通地域を求める。この場合、両集合を比較し、共通する「大阪」と「奈良」が共通地域として求められる。
次いで、ステップS74では、検索部13が、共通地域があるか否かを判断する。このステップS74の判断が肯定されると、ステップS76に移行し、検索部13は、共通地域として「大阪」と「奈良」を特定し、図7の全処理を終了し、図6のステップS30に移行する。
なお、例えば、今回の検索結果に含まれる地域が「九州」であった場合には、その詳細地域の集合「薩隅」、「豊日」、「肥筑」…と、履歴に含まれる地域「大阪」、「奈良」との間には、共通地域が存在しない。このような場合には、ステップS74の判断が否定され、ステップS78に移行し、検索部13は、各地域を広域地域(上位概念)に変換する。具体的には、今回の検索結果に含まれる地域が「九州」と変換され、履歴に含まれる地域が「近畿」に変換される。次いで、ステップS80では、検索部13が、変換後の地域が全国又は本土かを判断するが、ここでの判断が否定された場合には、ステップS72に戻り、各集合の共通地域を求める。この場合においても、共通地域は存在しないので、ステップS78では、検索部13は、各地域を更に広域地域に変換する。上記例では、今回の検索結果に含まれる地域が「西日本」と変換され、履歴に含まれる地域も「西日本」に変換される。そして、ステップS80の判断が否定されると、ステップS72に戻り、検索部13は、共通地域を「西日本」と特定し(S72、S74:肯定、S76)、図7の全処理が終了する。
なお、例えば、今回の検索結果に含まれる地域が「北海道」であり、履歴に含まれる地域が「大阪」、「奈良」であった場合には、ステップS72〜S80の処理を繰り返した後、ステップS80の判断が肯定される。この場合、ステップS82に移行し、検索部13は、詳細地域の集合の和を共通地域とする。具体的には、「北海道」、「大阪」、「奈良」が共通地域となる。
図6に戻り、ステップS28の後、ステップS30に移行すると、検索部13は、ステップS28の処理で特定された共通地域で検索結果を絞込む。図10の例においては、共通地域が「大阪」、「奈良」と特定されるので、これまでの検索結果を「大阪」、「奈良」を含む地域のもののみに絞り込む。例えば、1回目や2回目の検索結果に、北海道などで用いられる方言の意味が含まれていた場合には、その意味を検索結果や検索履歴から除外する。その後は、検索部13は、ステップS32において2回目の検索履歴を検索履歴DB22に蓄積するとともに(S32)、2回目の検索結果を図11(b)に示すような方言辞書の画面に表示する(S34)。なお、図11(b)では、共通地域を黒地の白抜き文字にて示している。その後は、ステップS16に戻る。
更に、3回目の検索として、オペレータが検索語「かって」を入力したとする(S20)。この場合、図10に示すように、検索結果として「借りるの音便:大阪」が検索される(S22)。そして、ステップS24、S26では、既に同一の問い合わせ者に関して2回の検索が実行され、検索結果が検索履歴DB22に格納されているので、ステップS26の判断が肯定され、ステップS28に移行する。
ステップS28に移行すると、検索部13は、履歴に含まれる地域と、今回の検索結果に含まれる地域との共通地域を求める処理(サブルーチン)を実行する。このステップS28の処理を経ることで、検索部13は、共通地域として「大阪」を特定する。そして、検索部13は、ステップS30〜S34を同様に実行することで、共通地域による検索結果の絞り込み(S30)、検索履歴DB22への検索履歴の蓄積(S32)、検索結果の表示処理(S34)をそれぞれ実行する。なお、この段階で表示部93に表示される方言辞書の画面は、図12に示すような画面となる。
ところで、オペレータにより発信地反映ボタンが押され、ステップS16の判断が肯定された場合に、ステップS18では、反映処理のサブルーチンが実行される。このステップS18では、図8のフローチャートに沿った処理が実行される。
(ステップS18(図8)の処理)
図8の処理では、まずステップS50において、検索部13が、既に地域の絞込みがされているか否かを判断する。ここでの判断が否定された場合、すなわち、2回以上の検索が行われていない場合には、ステップS62に移行し、検索部13は、発信地を絞り込まれた地域とする。例えば、発信地が「札幌市」であれば、札幌市に対応する地域(図4において、札幌市が含まれる地域であり、例えば「北海道・内陸」)を絞り込まれた地域とし、図8の全処理を終了して、図6のステップS20に移行する。
一方、ステップS50の判断が肯定された場合、すなわち、2回目以降の検索が既に行われている場合には、ステップS52に移行する。ステップS52に移行すると、検索部13が、絞り込まれた地域と発信地とが矛盾するか否かを判断する。例えば、絞り込まれた地域が「大阪」であるにもかかわらず、発信地が「札幌市」である場合には、矛盾すると判断される。一方、絞り込まれた地域が「大阪」で、発信地が「大阪府寝屋川市」であれば、矛盾しないと判断される。
ステップS52の判断が否定された場合(矛盾しない場合)には、ステップS54に移行し、検索部13は、絞り込まれた地域を変更しない。これに対し、ステップS52の判断が肯定された場合(矛盾する場合)には、ステップS56において、検索部13が、絞り込まれた地域を発信地で上書きするかの確認表示を行う。この確認表示は、図13に示すような表示であるものとする。
次いで、ステップS58では、検索部13が、オペレータからの上書きする旨の回答があったか否かを判断する。ここでの判断が肯定された場合、すなわち、オペレータが図13の画面上において「はい」ボタンを押した場合には、ステップS60に移行し、検索部13は、絞り込まれた地域を発信地で上書きする。一方、ステップS58の判断が否定された場合、すなわち、オペレータが図13の画面上において「いいえ」ボタンを押した場合には、検索部13は、発信地で絞り込まれた地域を上書きすることなく、図8の全処理を終了し、図6のステップS20に移行する。
なお、図6の処理は、オペレータと問い合わせ者との会話が終了し、オペレータからの検索終了指示があるまで実行され、検索終了指示があった段階で、図6の処理が終了する。この場合、方言辞書の画面の情報(検索語、履歴、検索結果等)が消去されるものとする。
なお、本実施形態では、検索部13を含んで、辞書テーブル20を参照して検索語の意味と地域を取得する取得部、及び複数の検索語の共通地域に基づいて、辞書テーブル20のうち参照すべきデータ(意味)を特定する特定部、としての機能が実現されている。
以上、詳細に説明したように、本実施形態によると、検索部13は、辞書テーブル20を参照して、検索語の意味と地域を取得し、複数の検索語の共通地域に基づいて、辞書テーブル20のうち参照すべきデータを特定する。これにより、オペレータが問い合わせ者に出身地や居住地を質問しなくても、複数の検索語に対応する共通地域を、問い合わせ者がしゃべる方言に対応する地域として特定することができる。また、特定した地域に基づいて辞書テーブル20のうち参照すべきデータを適切に特定することができるので、方言の意味として適切な意味をオペレータに示すことができる。
また、本実施形態では、検索部13は、複数の検索語の検索結果に含まれる詳細地域に共通部分がない場合に、詳細地域を広域地域とした場合の共通地域を特定する(図7)。これにより、詳細地域同士の比較では、共通地域が存在しない場合であっても、詳細地域を変換した広域地域同士を比較することで、結果的に詳細地域の論理和(和集合)をとることができるので、共通地域の特定を適切に行うことができる。
また、本実施形態では、言語処理システム10が、検索履歴DB22において、問い合わせ者ごとに方言の検索履歴を管理している。このため、2回目以降の問い合わせにおいては、最初から辞書テーブル20のうち参照すべきデータを過去の検索履歴に基づいて絞り込むことができる。
なお、上記実施形態では、検索履歴DB22において検索日時を格納しているので、検索日時から所定時間経過した検索履歴を検索履歴DB22から削除するようにしてもよい。これにより、多数の検索履歴が検索履歴DB22に蓄積され、処理が煩雑になるのを抑制することができる。
なお、上記実施形態では、電話の発信地を用いて、地域を特定する場合について説明したが、これに限られるものではない。例えば、問い合わせ者の電話がGPSセンサを搭載しており、検出された位置情報を言語処理システム10が取得できるような場合には、検出された位置情報を用いて、発信地を特定してもよい。また、上記実施形態では、処理において発信地を利用しないこととしてもよい。この場合、図6のステップS10〜S18の処理を省略することができる。
なお、上記実施形態では、辞書テーブル20は、地域ごとに方言の意味を纏めた複数の地域別辞書テーブルであってもよい。この場合、検索部13は、共通地域に基づいて、参照すべき地域別辞書を特定するようにすればよい。
なお、上記実施形態では、オペレータが入力部95(例えばキーボード)を用いて、検索語を入力する場合について説明したが、これに限られるものではない。例えば、言語処理システム10は、問い合わせ者の発する音声を自動認識し、認識結果から単語を抽出して各単語の意味を表示部93上に表示することとしてもよい。
なお、オペレータが、会話している間において、問い合わせ者のしゃべる方言の地域を特定できた場合(直接聞き出した場合など)には、図9の方言辞書の画面において、オペレータが地域を直接選択してもよい。この場合、検索部13は、辞書テーブル20のうち参照すべきデータを、選択された地域で絞り込むようにすればよい。
(変形例1)
なお、上記実施形態では、言語処理システム10が、方言検索に用いられる場合について説明したが、これに限られるものではなく、専門用語検索に用いられてもよい。この場合、図14(a)に示すように、分野を階層化し、図14(b)に示すようなデータ構造の辞書テーブルを用意する。なお、本変形例1における処理については、電話番号から得られる発信地の情報は用いないものの、上記実施形態とほぼ同様である。例えば、同一の問い合わせ者が発した言葉に「あんどん」や「看板」があり、オペレータがそれらの言葉を検索したような場合には、検索部13は、問い合わせ者の分野が「工場生産」であると判断し、分野「工場生産」の専門用語を中心に検索に用いるようにする。このようにしても、上記実施形態と同様、適切な検索結果(用語の意味)をオペレータに示すことが可能となる。
(変形例2)
なお、方言や専門用語に限らず、例えば、同人誌のデータベース検索においても上記実施形態と同様の処理を適用することができる。例えば、同人誌のジャンルが、図15(a)に示すように階層化できる場合に、図15(b)に示すような同人誌DBを上記実施形態の辞書テーブル20に代えて用意しておく。これにより、例えば、同人誌「しまかぜ大研究」や「2200系」の検索をしたユーザは、これらの同人誌に共通するジャンル「私鉄(関西)」に興味があることを特定することができる。したがって、特定した興味のあるジャンルを利用することで、適切な検索結果をユーザに示すことができるようになる。なお、同人誌に限らず、様々なデータベース検索にも適用可能である。
(変形例3)
なお、上記実施形態及び変形例では、辞書テーブル20(及び同人誌DB)が、言語処理システム10内に格納されている場合について説明したが、これに限られるものではない。例えば、図16に示すサーバ60に辞書テーブル20を格納しておき、サーバ60内の辞書テーブル20にはネットワーク80を介して利用者端末70からアクセスするようにしてもよい。この場合、例えば、Web上の検索サービスのように、サーバ60に図2の検索部13等の機能をもたせ、利用者端末70上からブラウザ等を操作して、検索部13に検索処理を実行させるようにしてもよい。あるいは、利用者端末70に検索部13等の機能を持たせるようにしてもよい。
なお、上記の処理機能は、コンピュータによって実現することができる。その場合、処理装置が有すべき機能の処理内容を記述したプログラムが提供される。そのプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体(ただし、搬送波は除く)に記録しておくことができる。
プログラムを流通させる場合には、例えば、そのプログラムが記録されたDVD(Digital Versatile Disc)、CD−ROM(Compact Disc Read Only Memory)などの可搬型記録媒体の形態で販売される。また、プログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することもできる。
プログラムを実行するコンピュータは、例えば、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、自己の記憶装置に格納する。そして、コンピュータは、自己の記憶装置からプログラムを読み取り、プログラムに従った処理を実行する。なお、コンピュータは、可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することもできる。また、コンピュータは、サーバコンピュータからプログラムが転送されるごとに、逐次、受け取ったプログラムに従った処理を実行することもできる。
上述した実施形態は本発明の好適な実施の例である。但し、これに限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々変形実施可能である。
なお、以上の実施形態及び変形例の説明に関して、更に以下の付記を開示する。
(付記1) 単語の属性情報と、該属性情報に対応する単語に関連する情報とを複数格納する辞書データを参照して、入力された検索対象用語に関連する情報及び属性情報を取得する取得部と、
前記取得部が取得した複数の前記検索対象用語の属性情報の共通部分に基づいて、前記辞書データのうち参照すべきデータを特定する特定部と、を備える言語処理装置。
(付記2) 前記特定部は、
前記取得部が取得した複数の前記検索対象用語の属性情報に共通部分がない場合、各属性情報の上位概念の共通部分に基づいて、前記辞書データのうち参照すべきデータを特定することを特徴とする付記1に記載の言語処理装置。
(付記3) 前記辞書データは、前記属性情報ごとに纏められた複数の属性情報別辞書データを含み、
前記特定部は、前記複数の属性情報別辞書データのいずれを参照するかを特定することを特徴とする付記1又は2に記載の言語処理装置。
(付記4) 前記取得部は、属性情報の外部入力を受け付け、
前記特定部は、前記取得部が受け付けた属性情報と、前記取得部が取得した複数の前記検索対象用語の属性情報の共通部分に基づいて、前記辞書データのうち参照すべきデータを特定する、ことを特徴とする付記1〜3のいずれかに記載の言語処理装置。
(付記5) 前記単語が方言である場合、前記属性情報は地域であり、
前記単語が分野又はジャンルごとに単語に関連する情報が異なる用語である場合、前記属性情報は分野又はジャンルであることを特徴とする付記1〜4のいずれかに記載の言語処理装置。
(付記6) 単語の属性情報と、該属性情報に対応する単語に関連する情報とを複数格納する辞書データを参照して、入力された検索対象用語に関連する情報及び属性情報を取得し、
前記取得する処理で取得した複数の前記検索対象用語の属性情報の共通部分に基づいて、前記辞書データのうち参照すべきデータを特定する、
処理をコンピュータに実行させることを特徴とする言語処理プログラム。
(付記7) 前記特定する処理では、
前記取得する処理で取得した複数の前記検索対象用語の属性情報に共通部分がない場合、各属性情報の上位概念の共通部分に基づいて、前記辞書データのうち参照すべきデータを特定することを特徴とする付記6に記載の言語処理プログラム。
(付記8) 前記辞書データは、前記属性情報ごとに纏められた複数の属性情報別辞書データを含み、
前記特定する処理では、前記複数の属性情報別辞書データのいずれを参照するかを特定することを特徴とする付記6又は7に記載の言語処理プログラム。
(付記9) 前記取得する処理では、属性情報の外部入力を受け付け、
前記特定する処理では、前記取得する処理において受け付けた属性情報と、前記取得する処理において取得した複数の前記検索対象用語の属性情報の共通部分に基づいて、前記辞書データのうち参照すべきデータを特定する、ことを特徴とする付記6〜8のいずれかに記載の言語処理プログラム。
(付記10) 前記単語が方言である場合、前記属性情報は地域であり、
前記単語が分野又はジャンルごとに単語に関連する情報が異なる用語である場合、前記属性情報は分野又はジャンルであることを特徴とする付記6〜9のいずれかに記載の言語処理プログラム。
(付記11) 単語の属性情報と、該属性情報に対応する単語に関連する情報とを複数格納する辞書データを参照して、入力された検索対象用語に関連する情報及び属性情報を取得し、
前記取得する処理で取得した複数の前記検索対象用語の属性情報の共通部分に基づいて、前記辞書データのうち参照すべきデータを特定する、
処理をコンピュータが実行することを特徴とする言語処理方法。
(付記12) 前記特定する処理では、
前記取得する処理で取得した複数の前記検索対象用語の属性情報に共通部分がない場合、各属性情報の上位概念の共通部分に基づいて、前記辞書データのうち参照すべきデータを特定することを特徴とする付記11に記載の言語処理方法。
(付記13) 前記辞書データは、前記属性情報ごとに纏められた複数の属性情報別辞書データを含み、
前記特定する処理では、前記複数の属性情報別辞書データのいずれを参照するかを特定することを特徴とする付記11又は12に記載の言語処理方法。
(付記14) 前記取得する処理では、属性情報の外部入力を受け付け、
前記特定する処理では、前記取得する処理において受け付けた属性情報と、前記取得する処理において取得した複数の前記検索対象用語の属性情報の共通部分に基づいて、前記辞書データのうち参照すべきデータを特定する、ことを特徴とする付記11〜13のいずれかに記載の言語処理方法。
(付記15) 前記単語が方言である場合、前記属性情報は地域であり、
前記単語が分野又はジャンルごとに単語に関連する情報が異なる用語である場合、前記属性情報は分野又はジャンルであることを特徴とする付記11〜14のいずれかに記載の言語処理方法。
10 言語処理システム(言語処理装置)
13 検索部(取得部、特定部)
20 辞書テーブル(辞書データ)

Claims (7)

  1. 単語の属性情報と、該属性情報に対応する単語に関連する情報とを複数格納する辞書データを参照して、入力された検索対象用語に関連する情報及び属性情報を取得する取得部と、
    前記取得部が取得した複数の前記検索対象用語の属性情報の共通部分に基づいて、前記辞書データのうち参照すべきデータを特定する特定部と、を備える言語処理装置。
  2. 前記特定部は、
    前記取得部が取得した複数の前記検索対象用語の属性情報に共通部分がない場合、各属性情報の上位概念の共通部分に基づいて、前記辞書データのうち参照すべきデータを特定することを特徴とする請求項1に記載の言語処理装置。
  3. 前記辞書データは、前記属性情報ごとに纏められた複数の属性情報別辞書データを含み、
    前記特定部は、前記複数の属性情報別辞書データのいずれを参照するかを特定することを特徴とする請求項1又は2に記載の言語処理装置。
  4. 前記取得部は、属性情報の外部入力を受け付け、
    前記特定部は、前記取得部が受け付けた属性情報と、前記取得部が取得した複数の前記検索対象用語の属性情報の共通部分に基づいて、前記辞書データのうち参照すべきデータを特定する、ことを特徴とする請求項1〜3のいずれか一項に記載の言語処理装置。
  5. 前記単語が方言である場合、前記属性情報は地域であり、
    前記単語が分野又はジャンルごとに単語に関連する情報が異なる用語である場合、前記属性情報は分野又はジャンルであることを特徴とする請求項1〜4のいずれか一項に記載の言語処理装置。
  6. 単語の属性情報と、該属性情報に対応する単語に関連する情報とを複数格納する辞書データを参照して、入力された検索対象用語に関連する情報及び属性情報を取得し、
    前記取得する処理で取得した複数の前記検索対象用語の属性情報の共通部分に基づいて、前記辞書データのうち参照すべきデータを特定する、
    処理をコンピュータに実行させることを特徴とする言語処理プログラム。
  7. 単語の属性情報と、該属性情報に対応する単語に関連する情報とを複数格納する辞書データを参照して、入力された検索対象用語に関連する情報及び属性情報を取得し、
    前記取得する処理で取得した複数の前記検索対象用語の属性情報の共通部分に基づいて、前記辞書データのうち参照すべきデータを特定する、
    処理をコンピュータが実行することを特徴とする言語処理方法。

JP2015158894A 2015-08-11 2015-08-11 言語処理装置、言語処理プログラム及び言語処理方法 Pending JP2017037513A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015158894A JP2017037513A (ja) 2015-08-11 2015-08-11 言語処理装置、言語処理プログラム及び言語処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015158894A JP2017037513A (ja) 2015-08-11 2015-08-11 言語処理装置、言語処理プログラム及び言語処理方法

Publications (1)

Publication Number Publication Date
JP2017037513A true JP2017037513A (ja) 2017-02-16

Family

ID=58049421

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015158894A Pending JP2017037513A (ja) 2015-08-11 2015-08-11 言語処理装置、言語処理プログラム及び言語処理方法

Country Status (1)

Country Link
JP (1) JP2017037513A (ja)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05174004A (ja) * 1991-12-26 1993-07-13 Canon Inc 文字処理方法及び装置
JPH07200568A (ja) * 1993-12-29 1995-08-04 Canon Inc 文字処理装置
JPH10222505A (ja) * 1997-01-31 1998-08-21 Just Syst Corp 文書作成装置および仮名漢字変換方法
JPH113331A (ja) * 1997-06-11 1999-01-06 Toshiba Corp 文書作成装置、予測入力方法、及び記録媒体
JP2005159395A (ja) * 2003-11-20 2005-06-16 Fujitsu Support & Service Kk 電話受け付け翻訳システム
JP2005331608A (ja) * 2004-05-18 2005-12-02 Matsushita Electric Ind Co Ltd 情報処理装置および情報処理方法
JP2008077584A (ja) * 2006-09-25 2008-04-03 Oki Electric Ind Co Ltd 訳語検索システム、方法及びプログラム
JP2008077387A (ja) * 2006-09-21 2008-04-03 Sony Corp 情報処理装置および情報処理方法、並びにプログラム
WO2008108061A1 (ja) * 2007-03-01 2008-09-12 Nec Corporation 言語処理システム、言語処理方法、言語処理プログラムおよび記録媒体

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05174004A (ja) * 1991-12-26 1993-07-13 Canon Inc 文字処理方法及び装置
JPH07200568A (ja) * 1993-12-29 1995-08-04 Canon Inc 文字処理装置
JPH10222505A (ja) * 1997-01-31 1998-08-21 Just Syst Corp 文書作成装置および仮名漢字変換方法
JPH113331A (ja) * 1997-06-11 1999-01-06 Toshiba Corp 文書作成装置、予測入力方法、及び記録媒体
JP2005159395A (ja) * 2003-11-20 2005-06-16 Fujitsu Support & Service Kk 電話受け付け翻訳システム
JP2005331608A (ja) * 2004-05-18 2005-12-02 Matsushita Electric Ind Co Ltd 情報処理装置および情報処理方法
JP2008077387A (ja) * 2006-09-21 2008-04-03 Sony Corp 情報処理装置および情報処理方法、並びにプログラム
JP2008077584A (ja) * 2006-09-25 2008-04-03 Oki Electric Ind Co Ltd 訳語検索システム、方法及びプログラム
WO2008108061A1 (ja) * 2007-03-01 2008-09-12 Nec Corporation 言語処理システム、言語処理方法、言語処理プログラムおよび記録媒体

Similar Documents

Publication Publication Date Title
US10922355B2 (en) Method and apparatus for recommending news
US9646609B2 (en) Caching apparatus for serving phonetic pronunciations
JP6618223B2 (ja) 音声処理方法及び装置
KR20180025121A (ko) 메시지 입력 방법 및 장치
JPWO2008114811A1 (ja) 情報検索システム、情報検索方法及び情報検索用プログラム
JP2013521567A (ja) クライアント・コンピューティング・デバイスを含むシステム、メディア・オブジェクトにタグ付けする方法、および音声タグ付きメディア・オブジェクトを含むデジタル・データベースをサーチする方法
CN111984749B (zh) 一种兴趣点排序方法和装置
WO2015196987A1 (zh) 支持自然语言的数据查询方法、开放平台及用户终端
KR20160032564A (ko) 영상표시장치, 영상표시장치의 구동방법 및 컴퓨터 판독가능 기록매체
KR102198424B1 (ko) 통화 녹음 정보 관리방법, 이를 위한 컴퓨터 프로그램
WO2020022079A1 (ja) 音声認識データ処理装置、音声認識データ処理システムおよび音声認識データ処理方法
JP2007323558A (ja) キーワード生成装置、文書検索装置、その方法、およびそのプログラム
US20130304370A1 (en) Method and apparatus to provide location information
KR20220121455A (ko) Stt를 활용한 화자구분 시스템
JP6107003B2 (ja) 辞書更新装置、音声認識システム、辞書更新方法、音声認識方法、および、コンピュータ・プログラム
JP2017037513A (ja) 言語処理装置、言語処理プログラム及び言語処理方法
JP5059080B2 (ja) 音声情報検索システム及び音声情報検索方法
KR20130116128A (ko) 티티에스를 이용한 음성인식 질의응답 시스템 및 그것의 운영방법
JPH11252281A (ja) 電話端末装置
KR101401503B1 (ko) 사용자 음성 기반의 서비스 제공 시스템, 방법 및 장치
CN112951274A (zh) 语音相似度确定方法及设备、程序产品
CN108831473B (zh) 一种音频处理方法及装置
KR20220121456A (ko) 대화 텍스트를 카테고리화하여 저장 가능한 화자구분 시스템
WO2021134592A1 (zh) 语音处理方法、装置、设备以及存储介质
JP7370521B2 (ja) 音声分析装置、音声分析方法、オンラインコミュニケーションシステム、およびコンピュータプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180514

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20180706

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20180711

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20180907

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190215

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190402

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190514

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20190531

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20190614

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20191029