JP5887253B2 - メッセージ処理装置 - Google Patents

メッセージ処理装置 Download PDF

Info

Publication number
JP5887253B2
JP5887253B2 JP2012252240A JP2012252240A JP5887253B2 JP 5887253 B2 JP5887253 B2 JP 5887253B2 JP 2012252240 A JP2012252240 A JP 2012252240A JP 2012252240 A JP2012252240 A JP 2012252240A JP 5887253 B2 JP5887253 B2 JP 5887253B2
Authority
JP
Japan
Prior art keywords
expert
processing
message
text
expert module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012252240A
Other languages
English (en)
Other versions
JP2014102548A (ja
Inventor
誉羽 竹内
誉羽 竹内
祐樹 藤堂
祐樹 藤堂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Honda Motor Co Ltd
Original Assignee
Honda Motor Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Honda Motor Co Ltd filed Critical Honda Motor Co Ltd
Priority to JP2012252240A priority Critical patent/JP5887253B2/ja
Priority to US14/065,480 priority patent/US9653077B2/en
Publication of JP2014102548A publication Critical patent/JP2014102548A/ja
Application granted granted Critical
Publication of JP5887253B2 publication Critical patent/JP5887253B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue

Description

本発明は、ユーザの音声入力に基づいてメッセージを作成し、そのメッセージを処理するメッセージ処理装置に関する。
ツイッター、フェイスブックなどのソーシャル・ネットワーク・サービス(以下、SNSと呼称する)が広く利用されている。SNSは、メッセージ・テキストに基づいているので、ユーザがSNSに参加するには、メッセージ・テキストを作成する必要がある。通常、メッセージ・テキストは、パソコンやスマートフォンなどのキー入力によって作成されている。このため、自動車内のユーザや歩行中のユーザは、SNSに参加するのが困難である。そこで、ハンドフリー、かつアイフリーでメール送信や、あるいはSNSに投稿することが可能な装置が所望されている。
従来、ユーザの音声入力に基づいてメールを作成し、送信するシステムが開発されている(たとえば、特許文献1)。
特開2007―4281号公報
上記のシステムを用いるとメールを送信することはできるものの、キー入力などの操作が必要で、ハンドフリーでメールを作成することはできない。また、メールの送信に特化したシステムであるため、SNSへの投稿にも適用できるようにするためにはシステムが大型化し、さらに複雑となる。
このように、ユーザの音声入力のみに基づいて、手軽にメッセージ・テキストを作成し、メール送信や、あるいはSNSに投稿することが可能な、簡単な構成のメッセージ処理装置は開示されていない。
したがって、本発明は、ユーザの音声入力のみに基づいて、手軽にメッセージ・テキストを作成し、メール送信や、あるいはSNSに投稿することが可能な、簡単な構成のメッセージ処理装置を提供することを目的とする。
本発明によるメッセージ処理装置は、入力された音声を処理して音声認識結果を作成する音声入力認識部と、作成された音声認識結果または指令を含むイベントを処理するイベント処理部と、それぞれ、個別の機能を備え、前記イベント処理部と協働してイベント処理を行う複数のエキスパート・モジュールを含むエキスパート部と、エキスパート・モジュールの実行履歴を管理する実行履歴管理部と、を備えている。前記エキスパート部は、ユーザの発話をメッセージ・テキストとして記録するための発話処理エキスパート・モジュールとしての、定型テキスト・メッセージを作成するための定型テキスト作成用発話処理エキスパート・モジュール及び自由フォーマットテキストメッセージを作成するための自由フォーマットテキスト作成用発話処理エキスパート・モジュールと、記録されたメッセージ・テキストの送信を行うための送信エキスパート・モジュールと、を備えている。
本発明によるメッセージ処理装置は、ユーザの発話をメッセージ・テキストとして記録するための発話処理エキスパート・モジュールとしての、定型テキスト・メッセージを作成するための定型テキスト作成用発話処理エキスパート・モジュール及び自由フォーマットテキストメッセージを作成するための自由フォーマットテキスト作成用発話処理エキスパート・モジュールと、記録されたメッセージ・テキストの送信を行うための送信エキスパート・モジュールと、を備えているので、ユーザの音声入力のみに基づいて、メッセージ・テキストの作成及び送信を行うことができる。特に、手早く定型のテキストを送信したい場合と、自由フォーマットのテキストを送信したい場合の両方に対応することができるため、ユーザビリティの高いシステムを実現することができる。
本発明の第1の実施形態によるメッセージ処理装置において、前記エキスパート部は、前記実行履歴管理部と協働して送信を実施した送信エキスパート・モジュールに対して、取り消し処理またはやり直し処理を実行させる送信制御エキスパート・モジュールを備えるように構成されている。
本実施形態によれば、定型テキスト・メッセージを送信した場合と、自由フォーマットテキストを送信した場合のように、テキストの送信に携わるエキスパート・モジュールが異なる場合でも、同じ送信制御エキスパート・モジュールが処理するため、使い勝手がよく、またシステムを複雑化させずに取り消し処理またはやり直し処理が実行できる。
本発明の第2の実施形態によるメッセージ処理装置において、前記エキスパート部は、テキスト・メッセージの送信先を決定する宛先エキスパート・モジュールを備える。
本実施形態によれば、宛先エキスパート・モジュールを、自由フォーマットテキスト作成用発話処理エキスパート・モジュールとは独立して備えることで、メッセージ・テキストの作成中に宛先をメールからSNSへ変更したい場合にも、スムーズに変更に対応することができる。
本発明の第3の実施形態によるメッセージ処理装置は、第2の実施形態によるメッセージ処理装置であって、前記定型テキスト作成用発話処理エキスパート・モジュールが、所定の時間ごとに場所を含むメッセージを作成するものを含む。
本実施形態によれば、所定の時間ごとに場所を含むメッセージを作成することができるので、自動車や電車などの交通手段で移動しているユーザの位置のメッセージを自動的に送信することができる。
本発明の第4の実施形態によるメッセージ処理装置においては、前記自由フォーマットテキスト作成用発話処理エキスパート・モジュールが、訂正、訂正のやり直し、保存、及び廃棄の機能を備えている。
本実施形態によれば、ユーザは、訂正、訂正のやり直し、保存、及び廃棄の機能を活用することにより、音声のみによるメッセージの作成を効率的に行うことができる。
本発明の第5の実施形態によるメッセージ処理装置においては、メッセージの送信がソーシャルネット・ネットワーク・サービスへの投稿を含む。
本実施形態によれば、ユーザが移動中、作業中などのキー入力が困難な状況であっても、ユーザは、ハンドフリー、かつアイフリーで音声のみによりメール送信や、SNSへの投稿を行うことができる。
本発明の一実施形態によるメッセージ処理装置の構成を示す図である。 音声入力認識部の動作を説明する流れ図である。 イベント処理部の動作を説明するための流れ図である。 イベント処理部及びエキスパート部が、ユーザ対話イベントを処理する動作を説明するための流れ図である。 イベント処理部及びエキスパート部が、エキスパート・イベントを処理する動作を説明するための流れ図である。 特に、イベント処理部及びエキスパート部がメッセージ送信イベントを処理する動作を説明するための流れ図である。 やり直し・取り消しエキスパート・モジュールの動作を説明するための流れ図である。 天候についての定型テキストを処理する天候エキスパート・モジュールを説明するための対話の具体例を示す図である。 場所の繰り返し記録エキスパート・モジュールを説明するための対話の具体例を示す図である。 自由フォーマットテキスト用エキスパート・モジュールを説明するための対話の具体例を示す図である。 送信エキスパート・モジュール及びやり直し・取り消しエキスパート・モジュールを説明するための対話の具体例を示す図である。 入力の記述のフォーマットの例を示す図である。 出力の記述用のXMLフォーマットの例を示す図である。
図1は、本発明の一実施形態によるメッセージ処理装置100の構成を示す図である。メッセージ処理装置100は、音声入力認識部101、イベント・キュー記憶部103と、イベント処理部105と、エキスパート部107と、エキスパート実行履歴管理部109と、エキスパート実行履歴記憶部111と、システム・アクション実行部113と、を備える。音声入力認識部101は、入力されたユーザの音声の音声認識及び言語理解を行う。イベント・キュー記憶部103は、音声入力認識部101によって認識されたユーザによる音声の音声認識結果及び言語理解結果を含むイベント、及びエキスパート部107が作成したイベントを記憶する。ここで、イベントとはシステムに対するタスク(システム・アクション)を特定・実行するための情報を指す。イベント処理部105は、イベント・キュー記憶部103に記憶されたイベントの処理を行う。エキスパート部107は、それぞれが個別の機能を備え、イベント処理部105と協働してイベントの処理を行う複数のエキスパート・モジュールを含む。なお、図1以下の図においてエキスパート・モジュールをエキスパートとも記載する。エキスパート実行履歴管理部109は、エキスパート・モジュールの実行履歴を管理する。エキスパート実行履歴記憶部111は、エキスパート・モジュールの実行履歴を記憶する。システム・アクション実行部113は、イベントの処理結果に基づいてシステム・アクションを実行する。システム・アクションは、ユーザへの情報の表示、及び作成されたメッセージ・テキストのメール送信やSNSへの投稿などを含む。
図2は、音声入力認識部101の動作を説明する流れ図である。
図2のステップS1010において、音声入力認識部101は、音声入力が検出されたかどうか判断する。音声入力が検出されなければ待機する。音声入力が検出されれば、ステップS1020に進む。
図2のステップS1020において、音声入力認識部101は、入力された音声(ユーザ発話)について音声認識を行う。
図2のステップS1030において、音声入力認識部101は、ユーザ発話の音声認識結果の言語理解を行う。
図2のステップS1040において、音声入力認識部101は、ユーザ対話イベント(UserDialogueActEvent)をイベント・キューに入れる。ここで、ユーザ対話イベントとは、ユーザ発話の音声認識結果と言語理解結果を含んだデータ(構造体)である。
図3は、イベント処理部105の動作を説明するための流れ図である。
図3のステップS2010において、イベント処理部105は、イベント・キュー記憶部103のイベント・キューにイベントがあるかどうか判断する。イベントがなければ待機する。イベントがあれば、図3のステップS2020に進む。
図3のステップS2020において、イベント処理部105は、イベント・キュー記憶部103のイベント・キューからイベントを取り出す。
図3のステップS2030において、イベント処理部105は、取り出したイベントに対応する処理を行う。この際、イベント処理部105は、エキスパート部107のエキスパート・モジュールと協働して処理を行う。
エキスパート・モジュールは、それぞれの対話領域ごとに準備されるので、本メッセージ処理装置によって、多数領域の対話を処理することができる。たとえば、携帯型情報端末の場合であれば、電話やスケジュール管理、地図などの機能それぞれにエキスパート・モジュールが準備され、電話に対するユーザ発話が入力された場合には電話に関するエキスパート・モジュールが起動され、入力発話に応じた処理を実行するように構成される。複数のエキスパート・モジュールを使用するこの多数領域処理方法は、実際の多数領域対話を管理する複雑さを大幅に低減する。したがって、ロバストなシステムを構成することができる。たとえば、確認のための発話がシステムによって実行されると、それに対するユーザの発話は多くの場合「はい」または「いいえ」である。全ての領域に共通のこれらの発話を処理することは、対話のそれぞれの領域において条件を伴う。本メッセージ処理装置においては、複数のエキスパート・モジュールを使用することによって、上記のような複雑な条件分岐を効率的に実現することができる。
表1は、本実施形態のメッセージ処理装置で使用されるエキスパート・モジュールの名前と機能とを示す表である。
Figure 0005887253
いくつかのエキスパート・モジュールは、共通のコード(クラス)で実現されている。これらのエキスパート・モジュールは、実行時にその入力および出力を記述することで個別化することができる。エキスパート・モジュールの詳細については後で説明する。
図4は、イベント処理部105及びエキスパート部107が、ユーザ対話イベントを処理する動作を説明するための流れ図である。この流れ図におけるイベント処理部105の動作は、図3のイベント処理部105の動作に対応する。
図4のS3010において、イベント処理部105は、イベント・キュー記憶部103のイベント・キューから取り出したユーザ対話イベントを、該ユーザ対話イベントに関連するエキスパート・モジュールへ送る。各エキスパート・モジュールは、該ユーザ対話イベントを評価して、その結果をスコアとしてイベント処理部105に返す。ここで、スコアは、ユーザ対話イベントとエキスパート・モジュールとの関連の高さを示す指標である。
図4のS3020において、イベント処理部105は、最も高いスコアを送ったエキスパート・モジュールを選択する。
図4のS3030において、イベント処理部105は、選択したエキスパート・モジュールへユーザ対話イベントを送り、該ユーザ対話イベントを処理するように命令する。
図4のS3040において、選択されたエキスパート・モジュールは、該ユーザ対話イベントに対して最も適したシステム・アクションをイベント処理部105へ返す。
図4のS3050において、イベント処理部105は、返されたシステム・アクションをシステム・アクション実行部113へ送り実行させる。
上述のように、どのエキスパート・モジュールが処理を担当するかは、ユーザ発話を検出するたびに決定される。対話領域の望ましくない移行を減少させるために、先行する発話を担当したエキスパート・モジュールが、ユーザの現在の発話を担当することに対して優先権を有する。さらに、自由フォーマットテキスト入力モード用のテキスト編集エキスパート・モジュールが選択されると、このテキスト編集エキスパート・モジュールは、ユーザが「保存」または「廃棄」などの音声指示を行わない限り、他のエキスパート・モジュールに制御を譲ることはない。自由フォーマットテキスト入力モード用のテキスト編集エキスパート・モジュールの指令(指示)については後で説明する。
図5は、イベント処理部105及びエキスパート部107が、一般的にエキスパート・イベントを処理する動作を説明するための流れ図である。この流れ図におけるイベント処理部105の動作は、図3のイベント処理部105の動作に対応する。
ここで、エキスパート・イベントとは、あるエキスパート・モジュールから他のエキスパート・モジュールに向けられた、何らかの指令(コマンド)を含むデータである。エキスパート・イベントは、エキスパート・モジュールによって、イベント・キュー記憶部103のイベント・キューに登録される。
図5のS4010において、イベント処理部105は、イベント・キュー記憶部103のイベント・キューから取り出したエキスパート・イベントから起動させる(処理を行う)エキスパート・モジュールを選択する。
図5のS4020において、イベント処理部105は、選択したエキスパート・モジュールへ該エキスパート・イベントを送る。
図5のS4030において、選択されたエキスパート・モジュールは、該エキスパート・イベントに対して最も適したシステム・アクションをイベント処理部105へ返す。
図5のS4040において、イベント処理部105は、返されたシステム・アクションをシステム・アクション実行部113へ送り実行させる。
図6は、特に、イベント処理部105及びエキスパート部107がメッセージ送信イベントを処理する動作を説明するための流れ図である。
図6のS5010において、イベント処理部105はメッセージ・テキストが保存されているか、もしくはメッセージの宛先が設定されているかを確認する。メッセージ・テキストが保存されていて、宛先が設定されていない場合はS5020において宛先エキスパート・モジュールを起動させる。また、メッセージ・テキストが保存されておらず、宛先が設定されている場合はS5050において自由フォーマットテキスト用のテキスト編集エキスパート・モジュールを起動させる。メッセージ・テキストが保存されており、宛先も設定されている場合はS5080において送信エキスパート・モジュールを起動する(図5のS4010に該当する)。
図6のステップS5030において、起動された宛先エキスパート・モジュールに宛先を設定するエキスパート・イベントが送られる(図5のS4020に該当する)。
図6のステップS5040において、宛先エキスパート・モジュールは宛先を特定するためのシステム・アクションを決定してイベント処理部105に返す(図5のS4030に該当する)。宛先エキスパート・モジュールは、メッセージをメール送信するのか、SNSへ投稿するのかなどの宛先を設定するためのエキスパート・モジュールである。またメール送信の場合は送信先のアドレスを設定する。宛先エキスパート・モジュールが決定するシステム・アクションとしては、例えばユーザにメール送信にするかSNSへの投稿にするかを問い合わせる問い合わせ文出力(システム発話)、または、前回の宛先をエキスパート実行履歴部から読み出して、その宛先に送信しても良いかを問い合わせる問い合わせ文出力などである。
図6のS5050にて自由フォーマットテキスト用のテキスト編集エキスパート・モジュールが起動された場合は、図6のステップS5060において、起動された自由フォーマットテキスト用のテキスト編集エキスパート・モジュールにメッセージ・テキストを入力するエキスパート・イベントが送られる。
図6のステップS5070において、自由フォーマットテキスト用のテキスト編集エキスパート・モジュールは、メッセージ・テキストを入力するためのシステム・アクションを決定する。たとえば、送信用のメッセージをユーザに発話するよう促すためシステム発話などである。
図6のステップS5080において、送信エキスパート・モジュールが起動された場合は、図6のステップS5090において、送信エキスパート・モジュールにメッセージ・テキストを送信するエキスパート・イベントが送られる。
図6のステップS5100において、送信エキスパート・モジュールは、設定された宛先に入力されたメッセージ・テキストを送信するシステム・アクションを決定してイベント処理部105に返す。
図6のステップS5110において、イベント処理部105は返されたシステム・アクションをシステム・アクション実行部113に送り実行させる。
図7は、やり直し・取り消しエキスパート・モジュールの動作を説明するための流れ図である。やり直し・取り消しエキスパート・モジュールは、すでにエキスパート・モジュールによって行われた送信や投稿のやり直し・取り消しを行う。
図7のステップS6010において、やり直し・取り消しエキスパート・モジュールは、イベント処理部105によって選択され処理を開始する。
図7のステップS6020において、やり直し・取り消しエキスパート・モジュールは、エキスパート実行履歴管理部109から、「 直前に起動され実際に送信したエキスパート・モジュール」を取得しようとする。
図7のステップS6030において、やり直し・取り消しエキスパート・モジュールは、対象となるエキスパート・モジュールが存在するかどうか判断する。対象となるエキスパート・モジュールが存在し、やり直しの場合にはステップS6040へ進む。対象となるエキスパート・モジュールが存在し、取り消しの場合にはステップS6050へ進む。対象となるエキスパート・モジュールが存在しない場合にはステップS6060へ進む。
図7のステップS6040において、やり直し・取り消しエキスパート・モジュールは、「 直前に起動され実際に送信したエキスパート・モジュール」宛にやり直しのエキスパート・イベントを、イベント・キュー記憶部103のイベント・キューに入れる。
図7のステップS6050において、やり直し・取り消しエキスパート・モジュールは、「 直前に起動され実際に送信したエキスパート・モジュール」宛に取り消しのエキスパート・イベントを、イベント・キュー記憶部103のイベント・キューに入れる。
図7のステップS6060において、やり直し・取り消しエキスパート・モジュールは、イベント処理部105にやり直しや取り消しができないことを伝える。イベント処理部105は、表示など所定のシステム・アクションをシステム・アクション実行部113に実行させる。
ここで、各エキスパート・モジュールについて、ユーザとの対話の具体例を使用して説明する。
定型テキスト用エキスパート・モジュールは、ユーザとメッセージ処理装置との間の対話に基づいて定型テキストを生成する。定型テキスト用エキスパート・モジュールは、所定の宛先に定型テキストを送信する機能を有するように設定されていてもよい。そうすることで、決定された定型テキストを送信するにあたって一度定型テキスト用エキスパート・モジュールを終了させてから宛先エキスパート・モジュールを起動して宛先を決定し、その後送信エキスパート・モジュールを起動させてメッセージ・テキストを送信するという処理を経ずにメッセージ・テキストを送信できるため素早く送信を行うことができ、使い勝手が向上する。
図8は、天候についての定型テキストを処理する天候エキスパート・モジュールを説明するための対話の具体例を示す図である。たとえば、スマートフォンに話すことによって、その地点における天候情報を投稿することができる。図8に示す対話の結果として、生成される定型テキストは、「天候:雨 2012年5月6日14:30」というものである。上記のテキストのようなものを含む投稿データは、対話が発生した場所ベースの情報を含む。
他の例として、ユーザは、道路工事及び交通状況について投稿することができる。さらに、ユーザは、対話により10分ごとに自分の場所を投稿するように設定することもできる。
図9は、場所の繰り返し記録エキスパート・モジュールを説明するための対話の具体例を示す図である。図9に示した対話の結果として、「私はここにいる」という定型テキストが、10分ごとに場所ベースの情報とともに生成される。
したがって、ユーザは、スクリーンを見て操作する必要なしに、意図したタイミングで定型テキストを生成することにより、ツイッターのようなマイクロ・ブログへ投稿することができる。
なお、本実施例では天候や場所などの領域ごとにそれぞれ定型テキスト用エキスパート・モジュールが設定されている。つまり、自由フォーマットテキストを処理するためのエキスパートはテキスト編集エキスパート・モジュール1つのみで、定型テキスト用エキスパート・モジュールは領域ごとに複数用意されているが、定型テキスト用エキスパート・モジュールも全領域に対して1つだけ用意する構成としてもよい。
つぎに、自由フォーマットテキスト用のテキスト編集エキスパート・モジュールについて説明する。ユーザは、定型テキストを入力するだけではなく、自由フォーマットテキストを入力することを要求することができる。この目的のために、音声指令を使用して自由フォーマットテキストを入力することのできるモードが準備されている。このモードを使用するために、「テキスト(文章)を入力したい」または「テキスト(文章)の入力」のような言葉で明確に指示する必要がある。その後、アプリケーションは、音声による自由フォーマットテキスト入力のモードへ移行する。
図10は、自由フォーマットテキスト用のテキスト編集エキスパート・モジュールを説明するための対話の具体例を示す図である。
この自由フォーマットテキスト入力モードにおいて、テキストをすべて一度に入力するよりも、それぞれの短い文を段階的に入力する。それぞれの文に対して、アプリケーションは、確認のために認識結果を返す。音声認識エラーが発生した場合には、直前に入力した部分に対して、「訂正」ということにより該文を再入力することができる。このモードにおいて、ユーザは、以下の表2に記載した音声指令によって入力したテキストを編集することができる。
表2は、自由フォーマットテキストを生成するために使用される音声指令を示す表である。
Figure 0005887253
最後にユーザが「保存」を発話すると、入力されたテキストは保存され、そのテキストをマイクロ・ブログまたはEメールへ送信することができる。あるいは、アプリケーションからの確認の後で、ユーザが「廃棄」というと、アプリケーションは入力されたテキストを廃棄し、この自由フォーマットテキスト入力モードを終了する。この自由フォーマットテキスト入力モードにおいても、画面を見たり、タッチパネルを操作する必要はない。
上述のように、ユーザは、定型テキスト入力および自由フォーマットテキスト入力の2種類の方法によりテキストを入力することができる。
図11は、送信用エキスパート・モジュール及びやり直し・取り消しエキスパート・モジュールを説明するための対話の具体例を示す図である。これらのモジュールによって、ユーザは、対話だけによって、Gメール経由でツイッターに投稿したりEメールを送信したりすることができる。
上述の、共通のコード(クラス)で実現されているエキスパート・モジュールの入力及び出力の記述について説明する。
入力の記述は、XML文法フォーマット:W3C standard SRGS/SISR (Speech Recognition Grammar Specification Version 1.0: http://www.w3.org/TR/speech-grammar/)による。このアプリケーションは、グーグルによって提供される自動音声認識システム、文法記述を必要としない、いわゆる大語彙音声認識システムを使用する。この文法記述は、言語理解に利用される。言語理解とは、音声認識結果を意味表現へ変換するプロセスを意味する。このアプリケーションは、意味表現への変換プロセスにKytea(G. Neubig,Y. Nakata, S. Mori, “Pointwise prediction for robust, adaptable Japanese morphological analysis”, in Proceedings of the 49th Annual Meeting of the Association for Computational Linguistics: Human Language Technologies: short papers - Volume 2, ser. HLT’11. Stroudsburg, PA, USA: Association for Computational Linguistics, 2011, pp. 529-533 [Online]. Available: http://dl.acm.org/citation.cfm?id=2002736.2002841)と呼ばれる言語解析ツールを使用する。Kyteaは、予め学習モデルを生成することによって、日本語の文を、いずれかの意味表現を付した単語に分離する。Kyteaの学習モデルを生成するためのツールも開発した。このツールは、SRGS/SISRの形式の文法記述からトレーニング・ファイルを自動的に生成する。解析を実行する際に、Kyteaはアンドロイド端末上でも非常に高速で機能する。
図12は、上記の入力の記述のフォーマットの例を示す図である。
図13は、出力の記述用のXMLフォーマットの例を示す図である。ここで、
<generation type=”confirm-record”>
は、”confirm-record”をプログラムにおける引数”id”へ指定することによって実行される、出力のテンプレートを意味する。実際に実行される内容を<madl>エレメントに記述する。このエレメントに
<utterance>hello</utterance>
と書けば、装置の音声合成器が”hello”と発話する。さらに、{longitude}のような記述は変数であり、実行時にプログラムにおいて
longitude=”123.345”
と指定すれば、該変数は与えられた値に置き換わる。
このような柔軟な入力及び出力フォーマットを記述することにより、同じクラスが、エキスパート・モジュールの多数の種類となりうる。入力及び出力の記述を追加することによって容易にシステムを拡張することができる。表1に示した以外の定型テキストを生成するための新たなエキスパート・モジュールを簡単に追加することができる。

Claims (9)

  1. 入力された音声を処理して音声認識結果を作成する音声入力認識部と、
    作成された音声認識結果または指令を含むイベントを処理するイベント処理部と、
    それぞれ、個別の機能を備え、前記イベント処理部と協働してイベント処理を行う複数のエキスパート・モジュールを含むエキスパート部と、
    エキスパート・モジュールの実行履歴を管理する実行履歴管理部と、を備え、
    前記エキスパート部は、ユーザの発話をメッセージ・テキストとして記録するための発話処理エキスパート・モジュールとしての、定型テキスト・メッセージを作成するための定型テキスト作成用発話処理エキスパート・モジュール及び自由フォーマットテキストメッセージを作成するための自由フォーマットテキスト作成用発話処理エキスパート・モジュールと、記録されたメッセージ・テキストの送信を行うための送信エキスパート・モジュールと、前記実行履歴管理部と協働して送信を実施した送信エキスパート・モジュールに対して、取り消し処理またはやり直し処理を実行させる送信制御エキスパート・モジュールとを備えたメッセージ処理装置。
  2. 前記送信制御エキスパート・モジュールは、前記実行履歴管理部と協働して送信を実施した送信エキスパート・モジュールのうち、直前に起動されて送信を実施した送信エキスパート・モジュールに対して、取り消し処理またはやり直し処理を実行させる、請求項1に記載のメッセージ処理装置。
  3. 前記送信制御エキスパート・モジュールは、前記実行履歴管理部と協働して送信を実施した送信エキスパート・モジュールのうち、直前に起動されて送信を実施した送信エキスパート・モジュールが存在する場合に、前記直前に起動されて送信を実施した送信エキスパート・モジュールに対して、取り消し処理またはやり直し処理を実行させ、前記直前に起動されて送信を実施した送信エキスパート・モジュールが存在しない場合に、前記取り消し処理またはやり直し処理を実行させない、請求項1または2に記載のメッセージ処理装置。
  4. 入力された音声を処理して音声認識結果を作成する音声入力認識部と、
    作成された音声認識結果または指令を含むイベントを処理するイベント処理部と、
    それぞれ、個別の機能を備え、前記イベント処理部と協働してイベント処理を行う複数のエキスパート・モジュールを含むエキスパート部と、
    エキスパート・モジュールの実行履歴を管理する実行履歴管理部と、を備え、
    前記エキスパート部は、ユーザの発話をメッセージ・テキストとして記録するための発話処理エキスパート・モジュールとしての、定型テキスト・メッセージを作成するための定型テキスト作成用発話処理エキスパート・モジュール及び自由フォーマットテキストメッセージを作成するための自由フォーマットテキスト作成用発話処理エキスパート・モジュールと、記録されたメッセージ・テキストの送信を行うための送信エキスパート・モジュールとを備え、先行する発話を担当したエキスパート・モジュールが、ユーザの現在の発話を担当することに対して優先権を有するメッセージ処理装置。
  5. 前記自由フォーマットテキスト作成用発話処理エキスパート・モジュールが選択された場合に、前記ユーザによる特定の音声指示が行われなければ前記自由フォーマットテキスト作成用発話処理エキスパート・モジュールによる制御が継続する、請求項4に記載のメッセージ処理装置。
  6. 前記エキスパート部は、テキスト・メッセージの送信先を決定する宛先エキスパート・モジュールを備えた請求項1から5のうちいずれか1項に記載のメッセージ処理装置。
  7. 前記定型テキスト作成用発話処理エキスパート・モジュールが、所定の時間ごとに場所を含むメッセージを作成するものを含む請求項1から6のうちいずれか1項に記載のメッセージ処理装置。
  8. 前記自由フォーマットテキスト作成用発話処理エキスパート・モジュールが、訂正、訂正のやり直し、保存、及び廃棄の機能を備えた請求項1から7のうちいずれか1項に記載のメッセージ処理装置。
  9. メッセージの送信がソーシャルネット・ネットワーク・サービスへの投稿を含む請求項1から8のうちいずれか1項に記載のメッセージ処理装置。
JP2012252240A 2012-11-16 2012-11-16 メッセージ処理装置 Active JP5887253B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2012252240A JP5887253B2 (ja) 2012-11-16 2012-11-16 メッセージ処理装置
US14/065,480 US9653077B2 (en) 2012-11-16 2013-10-29 Message processing device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012252240A JP5887253B2 (ja) 2012-11-16 2012-11-16 メッセージ処理装置

Publications (2)

Publication Number Publication Date
JP2014102548A JP2014102548A (ja) 2014-06-05
JP5887253B2 true JP5887253B2 (ja) 2016-03-16

Family

ID=50728766

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012252240A Active JP5887253B2 (ja) 2012-11-16 2012-11-16 メッセージ処理装置

Country Status (2)

Country Link
US (1) US9653077B2 (ja)
JP (1) JP5887253B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6867964B2 (ja) * 2018-03-08 2021-05-12 日本電信電話株式会社 対話装置、対話方法、データ構造、およびプログラム
JP7163267B2 (ja) * 2019-11-20 2022-10-31 本田技研工業株式会社 車両制御システム
US11189290B2 (en) * 2019-12-04 2021-11-30 International Business Machines Corporation Interactive selection and modification

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69326431T2 (de) * 1992-12-28 2000-02-03 Toshiba Kawasaki Kk Spracherkennungs-Schnittstellensystem, das als Fenstersystem und Sprach-Postsystem verwendbar ist
US7069220B2 (en) * 1999-08-13 2006-06-27 International Business Machines Corporation Method for determining and maintaining dialog focus in a conversational speech system
EP1222655A1 (en) * 1999-10-19 2002-07-17 Sony Electronics Inc. Natural language interface control system
JP3771437B2 (ja) * 2000-10-27 2006-04-26 日本電信電話株式会社 情報交換方法及び情報交換システム
KR100547858B1 (ko) * 2003-07-07 2006-01-31 삼성전자주식회사 음성인식 기능을 이용하여 문자 입력이 가능한 이동통신단말기 및 방법
JP2004288146A (ja) * 2003-08-06 2004-10-14 Matsushita Electric Ind Co Ltd 電子メール作成装置及び電子メール作成方法
JP2007004281A (ja) 2005-06-21 2007-01-11 Mitsubishi Electric Corp 音声メール入力装置
EP1879000A1 (en) * 2006-07-10 2008-01-16 Harman Becker Automotive Systems GmbH Transmission of text messages by navigation systems
US20080065974A1 (en) * 2006-09-08 2008-03-13 Tom Campbell Template-based electronic presence management
JP5089955B2 (ja) * 2006-10-06 2012-12-05 三菱電機株式会社 音声対話装置
US20090024707A1 (en) * 2007-07-18 2009-01-22 Gm Global Technology Operations, Inc. Electronic Messaging System and Method For A Vehicle
US20090070109A1 (en) * 2007-09-12 2009-03-12 Microsoft Corporation Speech-to-Text Transcription for Personal Communication Devices
US8086398B2 (en) * 2007-10-25 2011-12-27 Research In Motion Limited Sending location information from within a communication application
US20100184406A1 (en) * 2009-01-21 2010-07-22 Michael Schrader Total Integrated Messaging
JP5715526B2 (ja) 2010-08-12 2015-05-07 本田技研工業株式会社 対話処理装置、対話処理方法、及び対話処理プログラム
US8914079B2 (en) * 2011-01-19 2014-12-16 Toyota Jidosha Kabushiki Kaisha Mobile information terminal, information management device, and mobile information terminal information management system
US20120259633A1 (en) 2011-04-07 2012-10-11 Microsoft Corporation Audio-interactive message exchange

Also Published As

Publication number Publication date
JP2014102548A (ja) 2014-06-05
US20140142938A1 (en) 2014-05-22
US9653077B2 (en) 2017-05-16

Similar Documents

Publication Publication Date Title
US10489112B1 (en) Method for user training of information dialogue system
KR102418511B1 (ko) 서드 파티 에이전트를 사용하기 위한 호출 요청 생성 및 전송
CN110730953B (zh) 基于创建者提供的内容定制交互式对话应用的方法、系统
Bohus et al. The RavenClaw dialog management framework: Architecture and systems
JP5259020B2 (ja) 音声認識装置
JP2017058673A (ja) 対話処理装置及び方法と知能型対話処理システム
US9111539B1 (en) Editing voice input
US20160163314A1 (en) Dialog management system and dialog management method
CN110050303B (zh) 基于第三方代理内容的语音到文本转换
JP2008506156A (ja) マルチスロット対話システムおよび方法
CN109903770A (zh) 用于校正用户的话语错误的装置及其方法
US9361589B2 (en) System and a method for providing a dialog with a user
CN110998526B (zh) 用户配置的且自定义的交互式对话应用
CN106126157A (zh) 基于医院信息系统的语音输入方法及装置
US9772816B1 (en) Transcription and tagging system
EP2879062A2 (en) A system and a method for providing a dialog with a user
JP5887253B2 (ja) メッセージ処理装置
JP2004333641A (ja) 音声入力処理方法、音声対話用表示制御方法、音声入力処理装置、音声対話用表示制御装置、音声入力処理プログラム、音声対話用表示制御プログラム
Hofmann Intuitive speech interface technology for information exchange tasks
JP2018128577A (ja) 要約文表示装置、要約文表示方法、及びプログラム
Takeuchi et al. A spoken dialogue smartphone application for “text and walk/drive”
JP2003228393A (ja) 音声対話装置及び方法、音声対話プログラム並びにその記録媒体
JP2006003413A (ja) 音声自動応答方法、この方法を実施する装置、音声自動応答プログラムおよびその記録媒体
Paternò et al. Deriving Vocal Interfaces from Logical Descriptions in Multi-device Authoring Environments
Gatius Vila et al. Ontology-driven voiceXML dialogues generation

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20141127

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20150703

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150708

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150826

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20150826

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160126

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160215

R150 Certificate of patent or registration of utility model

Ref document number: 5887253

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150