JP7375409B2 - アドレス検索システム及びプログラム - Google Patents

アドレス検索システム及びプログラム Download PDF

Info

Publication number
JP7375409B2
JP7375409B2 JP2019172515A JP2019172515A JP7375409B2 JP 7375409 B2 JP7375409 B2 JP 7375409B2 JP 2019172515 A JP2019172515 A JP 2019172515A JP 2019172515 A JP2019172515 A JP 2019172515A JP 7375409 B2 JP7375409 B2 JP 7375409B2
Authority
JP
Japan
Prior art keywords
text information
address
voice
information
image forming
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019172515A
Other languages
English (en)
Other versions
JP2021051417A (ja
Inventor
晋平 板谷
祐介 御子柴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Konica Minolta Inc
Original Assignee
Konica Minolta Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Konica Minolta Inc filed Critical Konica Minolta Inc
Priority to JP2019172515A priority Critical patent/JP7375409B2/ja
Priority to US16/999,737 priority patent/US20210092254A1/en
Publication of JP2021051417A publication Critical patent/JP2021051417A/ja
Application granted granted Critical
Publication of JP7375409B2 publication Critical patent/JP7375409B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3337Translation of the query language, e.g. Chinese to English
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N1/32037Automation of particular transmitter jobs, e.g. multi-address calling, auto-dialing
    • H04N1/32096Checking the destination, e.g. correspondence of manual input with stored destination
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/0035User-machine interface; Control console
    • H04N1/00352Input means
    • H04N1/00403Voice input means, e.g. voice commands
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N1/32037Automation of particular transmitter jobs, e.g. multi-address calling, auto-dialing
    • H04N1/32064Multi-address calling
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Automation & Control Theory (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Facsimiles In General (AREA)

Description

本発明は、アドレス検索システム及びプログラムに関し、特に音声入力でアドレスを検索する技術に関する。
近年、スマートスピーカと称される音声入出力装置が開発され、その音声入出力装置をインターネットに接続して、ユーザが音声入出力装置に対して音声で指示を行うことで、様々な装置に対する各種操作が可能になっている。例えば、ユーザが音声入出力装置に対して音声で、「照明をオンにして」と指示することで、音声入出力装置からクラウド環境のサーバを経由して、ユーザが居る室内の照明装置に対してオンの指令が送られ、照明装置がオンになる。
音声入出力装置を使った音声による操作の一つに、電話機やファクシミリ装置(以下、これらの装置を被制御機器と称する)を使った発信操作がある。
被制御機器にはアドレス帳(電話帳)の機能が内蔵され、予め発信先の電話番号などが登録されている。通常、ユーザがボタン操作などで発信操作を行う際には、被制御機器の操作パネルに登録した名前の一覧を表示し、表示された名前の中から、ユーザが発信したい名前をタッチ操作で選択する。
音声入出力装置を使った音声による操作では、例えば、「××さんに送信して」と音声で入力することで、該当する名前がアドレス帳の機能で検索されて、見つかった電話番号への送信処理が、被制御機器で行われる。
特許文献1には、音声入力で宛先検索を行う技術の一例が記載されている。
特開2010-147624号公報
ところで、スマートスピーカと称される音声入出力装置を用いて音声入力を行う場合には、入力された音声情報は、一旦サーバに送られ、そのサーバでAI(人工知能)機能により読みの音声から適切な漢字混じりのテキストに変換される。そして、サーバで変換されたテキスト情報が被制御機器に送られる。
例えば、「ササキさんにソウシンして」と音声で入力したとき、その音声情報を受信したサーバでは、「ササキ」の読みの最も代表的なテキストである「佐々木」の漢字のテキスト情報と、ファクシミリなどを送信する旨の指令が生成され、被制御機器に送られる。
このテキスト情報と指令を受信した被制御機器側では、登録されたアドレス帳から、「佐々木」のテキスト情報と一致する名前の登録があるかを判断する。
ここで、アドレス帳に登録された名前が「佐々木」で、受信したテキスト情報と一致すればよいが、実際には、「ササキ」という読みの漢字には、「笹木」、「佐々城」、「佐々貴」、・・・と様々な漢字が存在する。
したがって、「佐々木」というテキスト情報を受け取った被制御機器には、「笹木」などの異なる漢字のアドレス登録はあるが、「佐々木」というアドレス登録がない場合が考えられる。このような場合には、被制御装置では、該当するアドレスの登録なしとなって、音声入力による送信の指示が実行されない。
このように、代表的な漢字の名前とは異なる漢字の名前がアドレス帳に登録されている場合には、その登録名は、スマートスピーカを使った音声入力では見つけることができないという問題が起こる。
本発明の目的は、漢字などの表語文字で登録されたアドレスを、音声入力で精度良く確
実に検索することが可能なアドレス検索システム及びプログラムを提
供することにある。
上記課題を解決するため、本発明のアドレス検索システムは、使用する地域を設定する制御部と、制御部で設定した地域が漢字を使用する国であるとき、音声認識を行うサーバ又は機器から伝送された、音声認識結果としてのアドレス情報を、表語文字を含むテキスト情報として受け取り、受け取ったテキスト情報を、表語文字から読みの文字のテキスト情報に変換すると共に、変換された読みの文字のテキスト情報を、再度表語文字を含む複数のテキスト情報に変換し、制御部で設定した地域が漢字以外の文字を使用する国であるとき、音声認識を行うサーバ又は機器から伝送された、音声認識結果としてのアドレス情報をテキスト情報とする変換処理部と、変換処理部で変換された表語文字を含む複数のテキスト情報から、登録されたアドレスを検索するアドレス検索部と、アドレス検索部で検索されたアドレスを提示する提示部と、を備える。
また、本発明のプログラムは、アドレス検索をコンピュータに実行させるプログラムであって、使用する地域を設定する制御手順と、制御手順により設定した地域が漢字を使用する国であるとき、音声認識結果としてのアドレス情報を、表語文字を含むテキスト情報としてコンピュータが受け取る受信手順と、受信手順で受け取ったテキスト情報を、コンピュータで表語文字から読みの文字のテキスト情報に変換すると共に、変換された読みの文字のテキスト情報を、コンピュータで再度表語文字を含む複数のテキスト情報に変換し、制御処理により設定した地域が漢字以外の文字を使用する国であるとき、音声認識結果としてのアドレス情報をテキスト情報とする変換手順と、コンピュータが、変換手順で変換された表語文字を含む複数のテキスト情報から、登録されたアドレスを検索するアドレス検索手順と、アドレス検索手順で検索されたアドレスをコンピュータが提示する提示手順と、をコンピュータに実行させるプログラムとしたものである。
本発明によれば、音声入力によるアドレスの検索が、どのような表語文字(漢字)でアドレス登録された場合でも実行できるので、音声入力によるアドレス検索の精度を向上させることができる。
本発明の一実施形態に係るシステムの概略構成図である。 本発明の一実施形態に係るシステムに含まれる各装置の構成例を示すブロック図である。 本発明の一実施形態に係る機器管理サーバでの処理例を示すフローチャートである。 本発明の一実施形態に係るアドレス検索の流れの概要を説明する図である。
以下、本発明を実施するための形態例(以下、「本例」と称する)について、添付図面を参照して説明する。
[画像処理システムの構成]
まず、図1を参照して、本例のシステム構成について説明する。図1は、本例を適用した画像処理システム100の概要構成図である。
図1に示す画像処理システム100は、画像形成装置1と、音声入出力装置2と、音声処理サーバ3と、機器管理サーバ4とを備える。図1に示す画像形成装置1、音声入出力装置2、音声処理サーバ3及び機器管理サーバ4は、公衆交換電話網やIP(Internet Protocol)網などよりなるネットワークNに接続される。
画像形成装置1は、例えば、コピー機能、プリンタ機能、スキャナ機能、ファクシミリ機能等を有する多機能端末(MFP:Multi-Functional Peripherals)で構成される。画像形成装置1は、不図示のプリンタコントローラ等から送信された画像データに基づいて用紙(記録材の一例)に画像形成を行い、該画像が形成された用紙を印刷物として出力する。また、画像形成装置1は、ファクシミリ機能によって、電話回線で相手先に画像データを送信することができ、送信先のリストであるアドレス帳のデータを持つ。
音声入出力装置2は、例えば、スマートスピーカで構成され、不図示のマイクロフォン及びスピーカを備える。音声入出力装置2は、マイクロフォンが集音した音声、例えば、ユーザによって発話された音声による操作指示を音声データ(以下、「音声情報」とも称する)に変換し、この音声情報を音声処理サーバ3に送信する。また、音声入出力装置2は、音声処理サーバ3から送信される音声情報を受信して、スピーカから音声を出力する。この音声入出力装置2のスピーカからの音声の出力で、ユーザによって発話された音声指示の結果である応答の音声をユーザに提示する処理が行われる。したがって、音声入出力装置2は、応答音声の提示部としても機能する。
音声処理サーバ3は、例えば、不図示のクラウド上に設けられ、その機能はクラウドアプリケーションサービスとして提供される。音声処理サーバ3は、音声入出力装置2から送信(入力)された音声情報に対して音声解析処理を行う。そして、音声処理サーバ3は、音声解析処理の結果であるテキスト情報やジョブの指示などの情報を、機器管理サーバ4に送信する。例えば、音声処理サーバ3は、音声解析処理で何らかのジョブを指示する音声を判別したとき、そのジョブの指示を機器管理サーバ4に送信する。また、音声解析処理で名前を判別したとき、音声から判別した名前のテキスト情報を機器管理サーバ4に送信する。
機器管理サーバ4は、音声処理サーバ3と同様にクラウド上に設けられ、画像形成装置1を遠隔で管理するサーバである。
機器管理サーバ4は、音声処理サーバ3から受信したテキスト情報やジョブの指示に基づいて、画像形成装置1を制御するコマンド(指示)を生成し、生成したコマンドを画像形成装置1に送信する。また、機器管理サーバ4が音声処理サーバ3からアドレスに関するテキスト情報を受信したとき、そのテキスト情報の変換処理を行い、変換されたテキスト情報を画像形成装置1に送信する。なお、テキスト情報の変換処理の詳細については図3、図4で後述する。
なお、音声処理サーバ3や機器管理サーバ4は、音声入出力装置2に対して応答音声情報や通知音声情報を送信することもできる。機器管理サーバ4からの応答音声情報は、音声処理サーバ3を経由して音声入出力装置2に送信される。
ここで、応答音声情報は、音声入出力装置2へのユーザの発話による操作指示(音声操作)に対する応答情報を伝える音声であり、通知音声情報は、エラーの発生やジョブの終了などの、画像形成装置1からの通知情報を伝える音声である。画像形成装置1へのコマンドには、例えば、印刷、コピー、スキャン、ファクシミリなどのジョブの設定指示や、ジョブの開始指示などが含まれる。
なお、本実施形態では、音声処理サーバ3や機器管理サーバ4がクラウド上に設けられる例を挙げたが、本発明はこれに限定されない。例えば、音声処理サーバ3と機器管理サーバ4のいずれか一方あるいは両方を、画像形成装置1内に設けるようにしてもよい。また、音声処理サーバ3と機器管理サーバ4は、一つのサーバとして構成してもよい。
[各装置の構成]
次に、図2を参照して、画像処理システム100に含まれる画像形成装置1、音声入出力装置2、音声処理サーバ3及び機器管理サーバ4の構成例について説明する。
[画像形成装置の構成]
まず、画像形成装置1の構成について説明する。図2に示すように、画像形成装置1は、通信部11、制御部12、画像形成部13、音声応答処理部14、音声出力部15及び操作表示部16を備える。
通信部11は、ネットワークNを介して接続される音声処理サーバ3との間で行われる各種データの送受信動作を制御する。
制御部12は、CPU(Central Processing Unit)120、RAM(Random Access Memory)121、ROM(Read Only Memory)122及び記憶部123を含む。
CPU120は、ROM122に記憶されている、システム全体(画像形成装置1全体)を制御するシステムプログラムや画像形成処理プログラムなどの各種処理プログラムを読み出してRAM121に展開し、展開したプログラムに従って画像形成装置1の各部の動作を制御する。
例えば、CPU120は、音声処理サーバ3から入力されるコマンドに対応付けられた画像形成処理を、画像形成部13に実行させる制御を行う。
RAM121は、CPU120により実行される各種プログラム及びこれらプログラムに係るデータを一時的に記憶するワークエリアを形成し、このRAM121のワークエリアにジョブのキュー、各種動作の設定等が記憶される。
ROM122は、半導体メモリ等の不揮発性メモリ等により構成され、このROM122に画像形成装置1に対応するシステムプログラム、及びシステムプログラム上で実行可能な画像形成処理プログラム、音声応答処理プログラム等が記憶される。これらのプログラムは、コンピュータが読取り可能なプログラムコードの形態で格納され、CPU120は、当該プログラムコードに従った動作を逐次実行する。
記憶部123は、HDD(Hard Disk Drive)やSSD(Solid State Drive)などにより構成され、この記憶部123に、画像形成装置1に係る各種の設定データや、CPU120から音声応答処理部14に対して送信される各種指示に対応する音声データ(音声応答情報、音声通知情報等)などが記憶される。
なお、制御部12には、ファクシミリ機能の送信先リストであるアドレス帳機能が構成される。すなわち、ROM122にはアドレス帳の機能を実現するプログラムが記憶され、記憶部123には、アドレス帳のデータである名前、電話番号などが記憶される。そして、CPU120が、アドレス帳のプログラムをROM122から読み出して実行させることで、アドレス帳が操作表示部16に表示され、送信先の選択を行うことができる。本例の場合、アドレス帳は、漢字(表意文字)、ひらがな、カタカナ、アルファベット、数字などの様々な文字で名前を登録することができる。
また、制御部12は、アドレス帳として記憶したアドレスから、入力した検索キーワードと一致するアドレスを検索するアドレス検索処理を実行するアドレス検索部としての機能を有する。
画像形成部13は、不図示のプリンタコントローラ等から送信された画像データに基づいて用紙に画像形成を行い、画像が形成された用紙を印刷物として出力する。画像形成部13は、不図示の帯電装置、感光ドラム、露光装置、転写ベルト及び定着装置を備える。
そして、画像形成部13は、まず、帯電装置により帯電された感光体ドラムに対して、露光装置から画像に応じた光を照射させることにより、感光ドラムの周上に静電潜像を形成する。次いで、画像形成部13は、現像装置から感光体にトナーを供給させることにより、帯電した静電潜像上にトナーを付着させてトナー像を現像する。次いで、画像形成部13は、トナー像を転写ベルトに1次転写するとともに、転写ベルトに転写されたトナー像を用紙に2次転写し、さらに、定着装置を用いて転写されたトナー像を用紙に定着する。
なお、本実施形態では、画像形成部13が電子写真方式を用いて画像形成を行う例を挙げたが、本発明はこれに限定されない。本発明の画像処理システム、画像形成装置では、インクジェット方式等の他の方式で画像形成を行う画像形成部を用いてもよい。
音声応答処理部14は、CPU120から入力される指示に対応する音声情報を、記憶部123等から抽出して生成し、音声出力部15に出力する。CPU120からの指示は、例えば、音声による操作指示に基づく設定において禁則等の設定ミスがあった場合や、動作中にエラーが発生した場合などに行われる。
音声出力部15は、例えば、スピーカで構成され、音声応答処理部14から入力される音声情報を再生して音声として出力する。
操作表示部16は、例えば、LCD(Liquid Crystal Display)や有機EL(Electroluminescence)等よりなる操作画面の表示部と、タッチセンサ等よりなる操作入力部とが一体に形成されたタッチパネルとして構成される。
なお、本実施形態では、表示部及び操作入力部が操作表示部16として一体に形成される例を挙げたが、本発明はこれに限定されない。表示部と、キーボードやマウス等よりなる操作入力部とが、それぞれ別々に構成されてもよい。または、タッチパネルとして構成された操作表示部16に加えて、キーボードやマウス等よりなる操作入力部を備える構成としてもよい。
[音声処理サーバの構成]
次に、同じく図2を参照して、音声処理サーバ3の構成について説明する。図2に示すように、音声処理サーバ3は、制御部31、通信部32及び音声解析部33を備える。
制御部31は、CPU310、RAM311、ROM312及び記憶部313を含む。
CPU310は、ROM312に記憶されているシステムプログラムや音声処理プログラムなどの各種処理プログラムを読み出してRAM311に展開し、展開したプログラムに従って音声処理サーバ3の各部の動作を制御する。
例えば、CPU310は、音声入出力装置2から音声情報が送信された場合に、該音声情報に対応する各種指示や音声から判別したテキスト情報を、通信部32を介して機器管理サーバ4に送信する制御を行う。また、CPU310は、例えば、機器管理サーバ4から応答情報が送信された場合に、該応答情報に対応する音声情報を、通信部32を介して音声入出力装置2に送信する制御を行う。
RAM311には、CPU310により実行される各種プログラム及びこれらプログラムに係るデータを一時的に記憶するワークエリアが形成される。
ROM312は、半導体メモリ等の不揮発性メモリ等により構成され、ROM312に、音声処理サーバ3に対応するシステムプログラム、及びこのシステムプログラム上で実行可能な音声処理プログラム等が記憶される。これらのプログラムは、コンピュータが読取り可能なプログラムコードの形態で格納され、CPU310は、このプログラムコードに従った動作を逐次実行する。
記憶部313は、HDDやSSDなどにより構成され、この記憶部313に、音声処理サーバ3に係る各種の設定データや、音声解析部33による音声解析結果と対応付けられた、画像処理のジョブに関する指示等が記憶される。
通信部32は、ネットワークNを介して接続される音声入出力装置2及び機器管理サーバ4との間で行われる各種データの送受信動作を制御する。
音声解析部33は、音声入出力装置2から送信される音声情報を解析して、音声解析結果に対応するテキスト情報やジョブの指示などを記憶部313から読み出し、制御部31に出力する。
音声解析部33による音声情報の解析で、画像形成装置1のジョブの実行を指示する音声を検出した場合、制御部31は、そのジョブの指示を通信部32から機器管理サーバ4に送信する。
また、音声解析部33による音声情報の解析で、名前を示す音声を検出した場合、制御部31は、名前を示すテキスト情報を通信部32から機器管理サーバ4に送信する。
なお、図2では、音声解析部33は、制御部41とは別の処理部として構成したが、例えばROM312に記憶されたプログラムを実行することにより音声解析部33を構成することもできる。
[機器管理サーバの構成]
次に、同じく図2を参照して、機器管理サーバ4の構成について説明する。図2に示すように、機器管理サーバ4は、制御部41、通信部42及び機器制御部43を備える。
制御部41は、CPU410、RAM411、ROM412及び記憶部413を含む。
CPU410は、ROM412に記憶されているシステムプログラムや音声処理プログラムなどの各種処理プログラムを読み出してRAM411に展開し、展開したプログラムに従って機器管理サーバ4の各部の動作を制御する。
例えば、CPU410は、音声処理サーバ3からジョブの指示が送信された場合に、このジョブに対応する画像形成装置1のコマンドを、通信部42を介して画像形成装置1に送信する制御を行う。なお、画像形成装置1のコマンドは、機器制御部43から取得されるコマンドである。機器制御部43には、画像形成装置1の構成についての情報が記憶され、CPU410は、機器制御部43が記憶した情報に基づいて、画像形成装置1がどのようなコマンドを受け付けるのか等を判断する。
また、CPU410は、テキスト情報の変換部としても機能する。すなわち、CPU410は、音声処理サーバ3から名前のテキスト情報が送信された場合に、受信したテキスト情報を変換処理した後、変換で得られた1つ又は複数のテキスト情報を、通信部42を介して画像形成装置1に送信する制御を行う。テキスト情報の変換処理を行うプログラムも、ROM412に記憶されている。なお、テキスト情報の変換処理の具体例については後述する。
また、CPU410は、例えば、画像形成装置1から応答情報が送信された場合に、この応答情報を、通信部42を介して音声処理サーバ3に送信する制御を行う。
RAM411には、CPU410により実行される各種プログラム及びこれらプログラムに係るデータを一時的に記憶するワークエリアが形成される。
ROM412は、半導体メモリ等の不揮発性メモリ等により構成され、ROM412に、機器管理サーバ4に対応するシステムプログラム、及びこのシステムプログラム上で実行可能な機器制御プログラム等が記憶される。これらのプログラムは、コンピュータが読取り可能なプログラムコードの形態で格納され、CPU410は、このプログラムコードに従った動作を逐次実行する。
記憶部413は、HDDやSSDなどにより構成され、この記憶部413に、機器管理サーバ4に係る各種の設定データや、テキスト情報の変換処理に必要な情報が記憶される。
通信部42は、ネットワークNを介して接続される画像形成装置1、音声入出力装置2及び音声処理サーバ3との間で行われる各種データの送受信動作を制御する。
機器制御部43は、ネットワークNを介して接続される画像形成装置1の構成や機能についての情報を記憶し、画像形成装置1を制御する上で必要な情報を制御部41に提供する。
[音声指示時の処理]
次に、図3のフローチャートを参照して、本態に係る画像処理システム100による音声指示時の処理について説明する。
図3に示す例は、音声入出力装置2に入力した音声が、画像形成装置1のアドレス帳に登録された名前を示すものであり、名前をアドレス帳から検索する処理の流れを示す。
まず、音声入出力装置2に入力した音声が、音声処理サーバ3での音声解析処理で、名前の音声情報であると判別される。そして、音声処理サーバ3で音声情報からテキスト情報に変換され、そのテキスト情報が機器管理サーバ4に伝送される。音声処理サーバ3で変換されるテキスト情報は、音声から最も適切と思われる文字のテキスト情報であり、ここでの文字には漢字が含まれる。
図3のフローチャートに従って説明すると、音声処理サーバ3からテキスト情報を受信した機器管理サーバ4の制御部41は、画像形成装置1を使用する国又は地域が、表意文字である漢字を使用する国又は地域であるか否かを判断する(ステップS11)。
このステップS11で、漢字を使用する国又は地域であると判断したとき(ステップS11のYES)、機器管理サーバ4の制御部41は、受信した漢字を含むテキストを、読みのテキストに変換する(ステップS12)。この読みのテキストへの変換時には、機器管理サーバ4は、例えば記憶部413に記憶されている辞書データを利用する。あるいは、機器管理サーバ4は、ネットワークNを介して外部のサーバに用意された辞書データを利用してもよい。
そして、制御部41は、変換処理を行うための設定として、読みへの変換数の上限の設定があるか否かを判断する(ステップS13)。
このステップS13で、読みへの変換数の上限がn個(nは任意の整数)に制限されていると判断したとき(ステップS13のYES)、制御部41は、ステップS12での変換で得られたテキストの内の、上位n個を漢字から読みへの候補にする(ステップS14)。ここでは、漢字を読みに変換する可能性が高いものを上位の候補とする。すなわち、読みに変換される可能性の高いものが上位になり、変換される可能性が低いものが下位になる。この上位や下位の判断には、例えば辞書データが利用される。
また、ステップS13で、読みへの変換数の制限がないと判断したとき(ステップS13のNO)、制御部41は、ステップS12で変換された全てのテキスト変換結果を、漢字から読みへの変換候補にする(ステップS15)。
次に、制御部41は、ステップS14又はS15で得られた候補の読みのテキストを、それぞれ漢字を含む名前のテキストに変換する(ステップS16)。
ここで、制御部41は、変換処理を行うための設定として、漢字への変換数の上限の設定があるか否かを判断する(ステップS17)。
このステップS17で、漢字への変換数の上限がm個(mは任意の整数)に制限されていると判断したとき(ステップS17のYES)、制御部41は、ステップS16での変換で得られた漢字の名前のテキストの内の、上位m個の漢字への変換結果を、検索キーワードに設定する(ステップS18)。ここでも、辞書データなどを利用して、読みを漢字に変換する可能性が高いものが上位になり、変換される可能性が低いものが下位になる。
また、ステップS17で、漢字への変換数の制限がないと判断したとき(ステップS17のNO)、制御部41は、ステップS16で変換された全ての漢字へのテキスト変換結果を、検索キーワードに設定する(ステップS19)。
次に、制御部41は、ステップS14又はS15で得られた検索キーワードのテキスト情報を、通信部42から画像形成装置1に送信する。検索キーワードのテキスト情報を受信した画像形成装置1では、制御部12の制御により、受信したテキスト情報を検索キーワードとして、アドレス帳に登録された名前の検索を実行する(ステップS20)。
このアドレス帳の検索で見つかった検索結果の名前のテキスト情報は、画像形成装置1から機器管理サーバ4を経由して音声処理サーバ3に送られる(ステップS21)。
音声処理サーバ3は、受信した検索結果の名前のテキスト情報を音声情報に変換し、変換した音声情報を音声入出力装置2に伝送して、音声入出力装置2内のスピーカから音声を出力する。この音声入出力装置2からの応答の音声の出力は、アドレス帳の検索結果の音声による通知処理として行われる。
また、ステップS11で、漢字を使用しない国又は地域と判断したとき(ステップS11のNO)、機器管理サーバ4の制御部41は、受信したテキストを、そのまま検索キーワードに設定する(ステップS22)。ステップS22で検索キーワードが設定されたとき、ステップS20に移り、制御部41は、その検索キーワードを通信部42から画像形成装置1に送信する。
図4は、本例の画像処理システム100内により、図3のフローチャートで説明したアドレス検索が実行される具体的な例を示す。
まず、音声入出力装置2の近傍にいるユーザは、音声により「アドレス帳から佐々貴さんを検索して」と指示を行う(ステップS1)。このとき、音声入出力装置2から入力された音声情報(アドレスチョウからササキさんを検索して)が音声処理サーバ3に伝送される(ステップS2)。
音声処理サーバ3では、受信した「アドレスチョウからササキさんを検索して」の音声情報から、「ササキ」の代表的な名前を示す漢字の「佐々木」のテキスト情報と、指示されたアクションである「アドレス帳検索」の指示とが得られる。この「佐々木」のテキスト情報と、「アドレス帳検索」のアクション情報は、機器管理サーバ4に伝送される(ステップS3)。
「佐々木」のテキスト情報と、「アドレス帳検索」のアクション情報を受信した機器管理サーバ4では、アドレス帳検索用の漢字変換処理が実行される(ステップS4)。
すなわち、機器管理サーバ4では、最初に漢字が読みに変換される。
ここでは、漢字のテキスト情報である「佐々木」が、辞書データを参照して、ひらがな(又はカタカナ)のテキスト情報の「ささき」に変換される。なお、漢字から読みに変換する際の候補が複数ある場合には、その複数の読みのテキスト情報に変換される。但し、図3のステップS14で説明したように、候補数に上限nの設定があるとき、上位n個までのテキスト情報に制限される。
次に、機器管理サーバ4では、読みから漢字に変換される(ステップS5)。
ここで、機器管理サーバ4は、「ささき」のテキスト情報から、辞書データを参照して、「佐々木」、「佐々城」、「佐々貴」、・・・と、同じ読みの複数の漢字のテキスト情報に変換する。ここでも、図3のステップS18で説明したように、候補数に上限mの設定があるとき、上位m個までのテキスト情報に制限される。この例では、機器管理サーバ4は、例えば上限mが3であるとし、上位3つの漢字のテキスト情報「佐々木」と「佐々城」と「佐々貴」とを、それぞれ検索キーワードに設定する。
機器管理サーバ4で得られた3つの検索キーワード「佐々木」、「佐々城」、「佐々貴」のテキスト情報は、「アドレス帳検索」のアクション情報と共に画像形成装置1に伝送される(ステップS6)。
この情報を受信した画像形成装置1は、アドレス帳として登録されたデータの検索を実行し、3つの検索キーワード「佐々木」、「佐々城」、「佐々貴」について検索する。
ここでは、検索により検索キーワード「佐々木」は該当する名前の登録がなく、検索キーワード「佐々城」も該当する名前の登録がなく、「佐々貴」は該当する名前を含むアドレスの登録が1件あったとする。すなわち、「佐々貴太郎」という氏名のアドレス登録が1件あったとする。
このとき、画像形成装置1は、検索された「佐々貴太郎」のテキスト情報を、アドレス帳検索結果として機器管理サーバ4を経由して音声処理サーバ3に伝送する(ステップS7,S8)。
アドレス帳検索結果「佐々貴太郎」を受信した音声処理サーバ3は、アドレス帳検索結果が「佐々貴太郎」であることを示す音声情報を音声入出力装置2に伝送し、音声入出力装置2は、伝送された音声をスピーカから出力する(ステップS9)。
例えば、音声入出力装置2は、検索結果ガイダンスの音声として、「アドレス帳より『佐々貴太郎』さんが見つかりました。宛先に設定しますか?」を出力する。
以上説明したように、本例によると、スマートスピーカと称される音声入出力装置2に対して音声で指示した場合における画像形成装置1でのアドレス検索を、高い精度で行うことができる。
すなわち、例えば図4で説明した例の場合、音声で「ささき」と入力したとき、本例の変換処理を機器管理サーバ4で実行しないとき、「ささき」の代表的な漢字である「佐々木」しか検索されず、同じ読みの別の漢字で登録されたアドレスは検索されなくなってしまう。
一方、本例の場合には、機器管理サーバ4が一旦読みに変換した後、複数の候補に変換するため、同じ読みの別の漢字で登録されたアドレスについても正しく検索できるようになり、検索精度が向上する。
なお、本例の処理は、漢字などの表意文字を使用する場合に効果があるものである。したがって、本例の処理は、漢字(表意文字)を使用する国又は地域以外で画像形成装置1を使用する場合には実行する必要がない。このため、図3のフローチャートのステップS11で説明したように、画像形成装置1を使用する国又は地域を確認した上で、本例の処理を実行するようにしたことで、不要な場合の機器管理サーバ4の負担を軽減できる。
また、図3のフローチャートのステップS18で説明したように、読みのテキストを漢字に変換して検索キーワードを得る際の候補の上限の数を設定できるようにしたことで、機器管理サーバ4での変換処理や画像形成装置1での検索の負担を軽減することができる。
さらに、図3のフローチャートのステップS13、S14、S15で説明したように、漢字のテキストを読みのテキストに変換する際にも、1つ漢字から読みが複数存在する場合の候補の選定を適正に行うことができ、この点からも検索精度の向上につながる。
例えば「渡辺」の名前は、「わたなべ」、「わたべ」、「わたのべ」などと読むことが可能であり、これらの複数の読みを漢字に変換しアドレス帳検索の候補を増やすことでより検索精度の向上が図れる。
この漢字のテキストを読みのテキストに変換する際にも、図3のフローチャートのステップS14で説明したように、候補の上限の数を設定できるようにしたことで、機器管理サーバ4での変換処理の負担を軽減できるようになる。
なお、ステップS18での読みのテキストを漢字に変換する上限の数mや、ステップS14での上限の数nは、例えば画像処理システム100を構成させる際に、システム側で決めて、機器管理サーバ4に登録すればよい。あるいは、画像形成装置1を利用するユーザが、これらの上限の数を設定してもよい。あるいは、画像形成装置1が印字動作中は、検索キーワードを制限して、画像形成装置1の動作状況に応じて切り替えるようにしてもよい。
<各種変形例>
なお、本発明は上述した実施の形態例に限られるものではなく、特許請求の範囲に記載した本発明の要旨を逸脱しない限りにおいて、その他種々の応用例、変形例を取り得る。
例えば、上述した実施の形態例では、音声入出力装置2としてスマートスピーカが用いられる例を挙げたが、本発明はこれに限定されない。音声入出力装置2として、携帯電話端末やスマートフォンなどのユーザが所持した携帯端末装置を用いてもよい。
また、図1や図2に示す構成では、音声処理サーバ3と機器管理サーバ4とを設けるようにしたが、これらのサーバ3,4は1つのサーバとして構成してもよい。
あるいは、音声処理サーバ3で得られた漢字(表意文字)のテキスト情報を、画像形成装置1に送り、画像形成装置1内で漢字から読みへの変換と、読みから複数の漢字の検索キーワードへの変換とを行うようにしてもよい。
画像形成装置1内で変換を行う場合には、画像形成装置1がマイクロフォンと音声認識処理部を備えて、ユーザからの音声を画像形成装置1が入力できるようにして、音声入出力装置2や各サーバ3,4を省略した構成としてもよい。
また、音声入出力装置2を備えるシステム構成の場合でも、応答音声については、画像形成装置1自身が出力するようにしてもよい。あるいは、検索結果については、画像形成装置1が備える操作表示部16が表示でユーザに提示するようにしてもよい。
さらに、アドレス帳からのキーワード検索は、アドレス帳のデータが記憶された画像形成装置1が行うようにしたが、機器管理サーバ4(又は音声処理サーバ3)が、画像形成装置1と通信を行いながら、キーワード検索の処理を実行するようにしてもよい。あるいいは、機器管理サーバ4又は音声処理サーバ3が、画像形成装置1に登録されたアドレス帳の情報を読み出して記憶し、機器管理サーバ4又は音声処理サーバ3の内部でキーワード検索を行うようにしてもよい。
また、上述した実施の形態例では、画像形成装置1を備えたシステムとしたが、電話機などのその他のアドレス帳のデータを記憶した機器やシステムにも本発明は適用が可能である。
また、上述した各実施形態例で説明した各サーバ3,4や画像形成装置1での処理は、その処理手順を実行するプログラムとして構成して、既存のサーバや画像形成装置に実装することで、既存のサーバや画像形成装置を、本発明の画像処理システム100として構成してもよい。プログラムは、半導体メモリや各種ディスクなどの記録媒体に格納することができる。あるいは、インターネット等の伝送媒体を介して、サーバや画像形成装置にプログラムを配布してもよい。
1…画像形成装置、2…音声入出力装置、3…音声処理サーバ、4…機器管理サーバ、11…通信部、12…制御部、13…画像形成部、14…音声応答処理部、15…音声出力部、16…操作表示部、31…制御部、32…通信部、33…音声解析部、41…制御部、42…通信部、43…機器制御部、100…画像処理システム

Claims (3)

  1. 使用する地域を設定する制御部と、
    前記制御部で設定した地域が漢字を使用する国であるとき、音声認識を行うサーバ又は機器から伝送された、音声認識結果としてのアドレス情報を、表語文字を含むテキスト情報として受け取り、受け取ったテキスト情報を、表語文字から読みの文字のテキスト情報に変換すると共に、変換された読みの文字のテキスト情報を、再度表語文字を含む複数のテキスト情報に変換し、前記制御部で設定した地域が漢字以外の文字を使用する国であるとき、音声認識を行うサーバ又は機器から伝送された、音声認識結果としてのアドレス情報をテキスト情報とする変換部と、
    前記変換部で変換された表語文字を含む複数のテキスト情報から、登録されたアドレスを検索する検索部と、
    前記検索部で検索されたアドレスを提示する提示部と、を備える
    アドレス検索システム。
  2. 前記変換部で、受け取ったテキスト情報を、表語文字から読みの文字のテキスト情報に変換する際に、複数の変換パターンで読みの文字のテキスト情報に変換し、表語文字から複数の読みの文字のテキスト情報に変換する際の候補数に上限を持たせると共に、読みの文字のテキスト情報を、表語文字を含む複数のテキスト情報に変換する際の候補数についても上限を持たせるようにした
    請求項1に記載のアドレス検索システム。
  3. アドレス検索をコンピュータに実行させるプログラムであって、
    使用する地域を設定する制御手順と、
    前記制御手順により設定した地域が漢字を使用する国であるとき、音声認識結果としてのアドレス情報を、表語文字を含むテキスト情報として前記コンピュータが受け取る受信手順と、
    前記受信手順で受け取ったテキスト情報を、前記コンピュータで表語文字から読みの文字のテキスト情報に変換すると共に、変換された読みの文字のテキスト情報を、前記コンピュータで再度表語文字を含む複数のテキスト情報に変換し、前記制御手順により設定した地域が漢字以外の文字を使用する国であるとき、音声認識結果としてのアドレス情報をテキスト情報とする変換手順と、
    前記コンピュータが、前記変換手順で変換された表語文字を含む複数のテキスト情報から、登録されたアドレスを検索するアドレス検索手順と、
    前記アドレス検索手順で検索されたアドレスを前記コンピュータが提示する提示手順と、
    をコンピュータに実行させるプログラム。
JP2019172515A 2019-09-24 2019-09-24 アドレス検索システム及びプログラム Active JP7375409B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2019172515A JP7375409B2 (ja) 2019-09-24 2019-09-24 アドレス検索システム及びプログラム
US16/999,737 US20210092254A1 (en) 2019-09-24 2020-08-21 Address search system, address search method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019172515A JP7375409B2 (ja) 2019-09-24 2019-09-24 アドレス検索システム及びプログラム

Publications (2)

Publication Number Publication Date
JP2021051417A JP2021051417A (ja) 2021-04-01
JP7375409B2 true JP7375409B2 (ja) 2023-11-08

Family

ID=74882258

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019172515A Active JP7375409B2 (ja) 2019-09-24 2019-09-24 アドレス検索システム及びプログラム

Country Status (2)

Country Link
US (1) US20210092254A1 (ja)
JP (1) JP7375409B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2023008559A (ja) * 2021-07-06 2023-01-19 ブラザー工業株式会社 通信装置及び通信装置のためのコンピュータプログラム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010147624A (ja) 2008-12-17 2010-07-01 Konica Minolta Business Technologies Inc 通信装置、検索処理方法および検索処理プログラム
US20140222416A1 (en) 2013-02-04 2014-08-07 Business Objects Software Limited Searching and matching of data

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07230472A (ja) * 1994-02-16 1995-08-29 Shisuin Net:Kk 人名誤読補正方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010147624A (ja) 2008-12-17 2010-07-01 Konica Minolta Business Technologies Inc 通信装置、検索処理方法および検索処理プログラム
US20140222416A1 (en) 2013-02-04 2014-08-07 Business Objects Software Limited Searching and matching of data

Also Published As

Publication number Publication date
JP2021051417A (ja) 2021-04-01
US20210092254A1 (en) 2021-03-25

Similar Documents

Publication Publication Date Title
US11210061B2 (en) Non-transitory computer-readable recording medium storing computer-readable instructions for causing information processing device to execute communication processing with image processing program and voice-recognition program, information processing device, and method of controlling information processing device
JP7071098B2 (ja) 音声制御システム、制御方法およびプログラム
US20190304453A1 (en) Information processing apparatus, method of processing information and storage medium
JP7159608B2 (ja) 操作画面の表示装置、画像処理装置及びプログラム
JP2012099030A (ja) 情報処理装置、ワークフロー管理システム、ワークフローの実行方法およびプログラム
CN110609662B (zh) 打印系统、控制方法和服务器
US11023790B2 (en) System, method for controlling the same, and method for controlling server
US11611668B2 (en) Image processing system that generates job setting information based on interaction with user of information processing apparatus using chatbot
CN111327780A (zh) 图像处理系统、图像形成装置、判定方法以及程序
JP7375409B2 (ja) アドレス検索システム及びプログラム
JP2008197229A (ja) 音声認識辞書構築装置及びプログラム
EP3716040A1 (en) Image forming apparatus and job execution method
JP2006235186A (ja) 電子写真装置
US11036441B1 (en) System and method for creation and invocation of predefined print settings via speech input
US11647129B2 (en) Image forming system equipped with interactive agent function, method of controlling same, and storage medium
US20210382883A1 (en) Information processing apparatus, term search method, and program
JP2023045175A (ja) コンピュータープログラム、制御方法及び画像形成システム
JP2018077794A (ja) 画像処理装置、及び画像形成装置
US11769494B2 (en) Information processing apparatus and destination search method
JP2020181044A (ja) 情報処理装置、その制御方法、およびプログラム
JP6225775B2 (ja) 画像形成装置、検索方法、および制御プログラム
US11700338B2 (en) Information processing system that receives audio operations on multifunction peripheral, as well as image processing apparatus and control method therefor
US11816372B2 (en) Control system, server system, control method, and storage medium
US20210075931A1 (en) Information processing apparatus, control method thereof, and storage medium
JP7409135B2 (ja) 処理条件設定システム、処理条件設定方法及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220819

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230607

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230620

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230731

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230926

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20231009

R150 Certificate of patent or registration of utility model

Ref document number: 7375409

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150