JP2004029317A - 情報処理装置及び情報処理システム - Google Patents

情報処理装置及び情報処理システム Download PDF

Info

Publication number
JP2004029317A
JP2004029317A JP2002184569A JP2002184569A JP2004029317A JP 2004029317 A JP2004029317 A JP 2004029317A JP 2002184569 A JP2002184569 A JP 2002184569A JP 2002184569 A JP2002184569 A JP 2002184569A JP 2004029317 A JP2004029317 A JP 2004029317A
Authority
JP
Japan
Prior art keywords
data
conversion
input
voice
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002184569A
Other languages
English (en)
Inventor
Ikuhiro Teramoto
寺元 郁博
Masamichi Oguro
大黒 正道
Hidehiro Takahashi
高橋 英博
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nat Agric & Bio Oriented Res
National Agriculture and Bio Oriented Research Organization NARO
Original Assignee
Nat Agric & Bio Oriented Res
National Agriculture and Bio Oriented Research Organization NARO
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nat Agric & Bio Oriented Res, National Agriculture and Bio Oriented Research Organization NARO filed Critical Nat Agric & Bio Oriented Res
Priority to JP2002184569A priority Critical patent/JP2004029317A/ja
Publication of JP2004029317A publication Critical patent/JP2004029317A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Mobile Radio Communication Systems (AREA)

Abstract

【課題】あるデータに基づいて、関連する領域に入力するための音声データを文字データに変換するため音声認識の精度が向上させるとともに、正確な文書を迅速に作成する。
【解決手段】入力される音声データ(3)を文字データ(2)に変換するためのデータ変換部5、6であって、音声データ(3)と関連する関連データを参照することにより変換の基準を推測することを特徴とするデータ変換部5、6を有する。
【選択図】 図1

Description

【0001】
【発明の属する技術分野】
本発明は、携帯端末を用いて音声入力を行うのに適した情報処理システムに関し、特に、定型的な文書とメモや備考などの自由入力文書とを入力する場合に適した情報処理システムに関する。
【0002】
【従来の技術】
コンピュータなどを用いた情報処理システムが多く開発されており、特に携帯電話機やPDA(Personal Digital Assistant)などの携帯用端末を利用した情報入力技術及び情報通信技術の開発が盛んになってきている。
【0003】
【発明が解決しようとする課題】
最近、コンピュータや情報携帯端末などの情報処理装置を用いた音声入力システムに関する研究・開発が盛んに行われている。特に携帯電話などの携帯情報端末においては、携帯性が重視されるために文字の入力が不自由になりがちである。そこで、音声入力を用いて情報の入力を行うことが出来れば便利である。
【0004】
ところで、音声により入力された情報は、音声認識機能を介して最終的には文字データなどに変換され、プリンタなどに出力したり相手方に送信したりする場合が多い。従って、音声入力された情報をいかに精度良く、かつ、効率良く文字データに変換することができるかが音声認識システムにおける1つの大きなポイントになってくる。例えば、音声認識用の辞書の選択が重要になる。
【0005】
特に、携帯情報端末を用いて、種々の作業記録文書やナレッジマネジメント文書など専門性の強い分野における文書を作成する場合には、ユーザにとって自然な入力を行うことができ、かつ簡単な手続きで入力できることが要求される。また、専門用語が多用されるために、音声認識用の辞書として一般的な用語辞書だけでは対処できない場合がある。音声認識精度の向上だけを主眼においた手続きとして、例えば1ワード毎に音声入力し、そのたびに音声−文字変換及び確認を行うといった方法が考えられるが、入力に非常に手間が掛かり、かつ複数の単語からなる文の入力には対応できないため、音声入力のメリットが十分に生かせるとはいえない。
【0006】
例えば、特開2001−159896号公報には、音声認識精度を向上させるために、補助的に文字入力を行う方法が提案されている。この公報に記載された技術では、例えば、作業記録文書の作成など記録すべき文書が多い場合には、認識語絞り込みを補助するために新たな文字入力を行う必要がある。また、認識辞書の語彙体系が絞り込まれているため、自由文の入力にはなじまない。
本発明の目的は、音声認識に関する精度を向上させることを目的とする。
【0007】
【課題を解決するための手段】
本発明の一観点によれば、入力される音声データを文字データに変換するためのデータ変換部であって、前記音声データと関連する関連データを参照することにより前記変換の基準を推測することを特徴とするデータ変換部を有する情報処理装置が提供される。
【0008】
また、入力される音声データを文字データに変換するための変換辞書を有するデータ変換部であって、前記変換辞書における変換候補順位又は変換辞書の種類を、前記音声データと関連する関連データを参照することにより選択することを特徴とするデータ変換部を有するデータ変換装置が提供される。
上記データ変換装置を用いると、音声入力されたデータが、関連データと密接な関係にあるデータであることを前提として変換を行うため、変換効率が向上する。
【0009】
本発明の他の観点によれば、第1種の情報データを受信する第1種データ受信部と、音声データを受信する音声データ受信部と、前記音声データ受信部から受信された音声データを文字データに変換するための変換辞書を有するデータ変換部であって、前記変換辞書における変換候補順位又は変換辞書の種類を、前記音声データと関連し前記第1種データ受信部から受信された関連データを参照することにより選択するデータ変換部とを有するデータ変換システムが提供される。
【0010】
上記データ変換システムを用いると、文書内で互いに関連すると推測される2以上の情報のうちの少なくとも一方を、音声入力により入力した場合の音声認識の精度が向上する。
【0011】
【発明の実施の形態】
本発明の実施の形態について説明する前に、まず、発明者の行った考察について説明する。
発明者は、ある文書などを作成する際に、定型的な文書、すなわち、選択肢から選択できるなど簡単なボタン操作で済む項目については、例えば入力キーなどを用いて文字データを確実に入力し、「メモ」、「備考」などのボタン入力が煩雑な例えば自由文的な文書に関しては、音声で入力する技術を思い付いた。
【0012】
発明者は、例えばある1つの文書内において、作業内容など特に記録の核心となる項目であって通常は定型的な文書として記載される項目の内容と、それに対応して記載される「メモ」、「備考」などの自由文的な文書の内容とは密接に関連している(定型的な文書の内容に強く依存している)場合が多いことに着目した。
【0013】
すなわち、定型的な文書に関する内容を分析(解析)した結果に基づいて、或いは、定型文の内容を参照して、自由文を音声により入力する際の、音声認識に用いる辞書の内容又は辞書における変換入力対象の優先順位を定型文との関連性をより高めた方向に変更することで、音声認識の精度を高めることができると考えた。
【0014】
以上の考察に基づき、以下に本発明の第1の実施の形態による情報処理システムについて、図面を参照して説明する。図1(A)は本発明の一実施の形態による情報処理システムの構成を示す図であり、図1(B)は、図1(A)に示される情報処理システムに用いられる携帯端末の概略構成図である。
【0015】
図1(A)に示すように、本発明の第1の実施の形態による情報処理システムは、端末(携帯電話)1と、文字データ受信部2と、音声データ受信部3と、辞書切り替え部5と、音声認識部6と、データベース7と、を有している。辞書切り替え部5は、例えば、辞書5−1、辞書5−2から辞書5−n(nは2以上の整数)までの複数の辞書(辞書データベース)を有している。
【0016】
図1(B)に示すように、端末は、例えば携帯電話11である。携帯電話11は、通信用のアンテナ12と、液晶表示部14と、文字データ入力部(ボタン)17と、音声データ入力部(マイク)21とを有している。図1から図4までを参照して、上記情報処理システムの動作について説明する。図2は、情報処理システムの流れを示すフローチャート図である。図3及び図4は、文字入力と音声入力とによりそれぞれ入力された定型文と自由文とを有する文書例である。
【0017】
まず、図3を参照して、文字入力による定型文と音声入力による自由文との関係を簡単に説明する。図3は、定型文内に記載されている関連文字情報の内容(単語)と、自由文を作成するために音声入力された音声の対応例である音声メモ例と、自由文内において関連文字情報を参照することにより文字−音声変換辞書における変換候補の優先順位が高くなった単語の例である。
【0018】
図3に示すように、関連文字情報として作業「摘房」が入力されているとする。この際、音声情報として「いろつきがよくないためじっし」と発声すると、「摘房」を参照し、音声入力された情報も摘房に関連する情報であると推測し、音声入力情報「いろつき」を「色つき」と変換する優先順位が高まる。従って、「色つきがよくないため実施」というように、ユーザの意図に沿った音声−文字変換が行われる。
【0019】
同様に、関連文字情報が「草刈」であり、音声入力情報が「かりはらいきでおこなう」であるとすると、「かりはらいき」が優先的に「刈り払い機」と変換される。関連文字情報が「収穫」であり、音声入力情報が「はちじゅっきろしゅうかく」である場合、数字キロが重さであると認識され、「80キロ収穫」と変換される。同様に、音声入力情報が「へいねんよりおおきめか」である場合、「収穫」と「平年」及び「大きめ」とが関連性が高いため、「平年より大きめか」と変換される。関連文字情報が「8月」であり、音声入力情報が「よとうむしがすこしはっせい」である場合、「8月」と「ヨトウムシ(害虫)」とが関連性が高いため、「ヨトウムシが少し発生」と変換される。
【0020】
以下、具体的な文書作成例について、図1、2及び図4を参照して説明する。
【0021】
ステップS1において、作業が開始され、ステップS2において、端末1のユーザは、例えば、選択肢入力又は定型数字入力領域において、対象圃場を「ナス園1」と、作業日を「8月○日」と、作業内容を「収穫」と、を文字入力する。これらの入力は、農業関係者にとってみれば定型的な文書入力といえる。
【0022】
次に、音声入力領域にメモなどを音声入力する。まず、ステップS3において、「きょうは、はちじゅっきろをしゅうかくしました。へいねんよりすこしおおきめです。すこし、よとうむしがはっせいしています。」と音声入力する。この音声入力の開始に応じて、文字入力によって入力された定型文(文字入力領域)の文字データの解析を行う。或いは、文字入力作業と並行して文字データの解析を開始しておいても良い。図4に示す例では、作業内容は、「ナス園1」における収穫作業であることが推定される。この推定に基づいて、図1に示す辞書切り替え部5は、「なす」、「収穫」などの用語を抽出し、これらの用語と関連性の高い辞書を、辞書5−1から5−nのうちから選択する。或いは、辞書におけるナスの収穫作業に関連した用語に関する変換候補の優先順位を上げる。
【0023】
ステップS5において、ステップS3で音声入力された音声と、ステップS4で選択又は変換候補の優先順位が変更された辞書と、に基づいて音声認識処理を行う。ステップS6において、音声認識処理を行った結果得られた文字データへの変換候補中から実際にユーザが入力したい文字データを選択し、または変換した文字データをボタン入力で訂正することで、文字データに変換された入力データとユーザが意図したデータとを完全に合致させるための確定作業を行うことも可能である。
【0024】
その結果、上記音声入力は、「今日は80キロ収穫しました。平年より少し大きめです。少しヨトウムシが発生しています。」と、ユーザが意図した文字データに変換される。以上の工程により、音声入力による自由入力文書の作成を終了することができる(ステップS7)。ユーザは文ごとではなく、文節ごとに適切な用語を選択し、入力を確定することもできる。上記作業において用いられた文字データと音声データとは、関連付けされてデータベース7内に蓄積され、次回の変換作業の際に役立てられる。
【0025】
以上の処理により、音声入力の際に、音声−文字変換の精度が高められたユーザ辞書を用いて、音声入力−文字データへの変換作業を行うことが出来るため、文書(自由文)の作成作業が正確かつ確実になる。
【0026】
本発明の第1の実施の形態による情報処理技術の別の例について、図5を参照して説明する。図5に示す例は、第1の実施の形態による情報処理技術と同様に作業記録の作成に関するものである。適宜、図1及び図2をも参照して説明する。
【0027】
ステップS1において、作業が開始され、ステップS2において、携帯電話11のユーザは、例えば、自動付与される記録番号「XX」と、携帯電話11を特定するための識別ID「○○○」とを文字入力する。次に、ユーザは、携帯電話11を用いて、例えば事務所のサーバと連絡し、サーバから定型文に相当する作業内容に関する情報を受ける。この作業内容は、表示部14に表示される。具体的には、例えば、2002年6月12日に作業するとして、その日に作業予定表をダウンロードすると、作業日時2002年6月12日と、対象圃場である「A果樹園(梨園)」と、作業内容である「梨の袋かけ」と、が文字データとして表示される。これらの入力は、農業関係者にとってみれば定型的な文書入力といえる。
【0028】
次に、音声入力領域にメモなどを音声入力する。まず、ステップS3において、音声入力の開始に応じて、文字入力によって入力された定型文(文字入力領域)の文字データの解析を行う。或いは、情報のダウンロード作業と並行して文字データの解析を開始しておいても良い。図5に示す例では、作業内容は、A果樹園における梨の袋かけ作業であることが推定される。この推定に基づいて、図1に示す辞書切り替え部5は、梨の袋かけ作業に関連性の高い辞書を辞書5−1から5−nのうちから選択する。或いは、ある辞書において、梨の袋かけ作業に関連した用語に関する変換候補の優先順位を上げる。
【0029】
ステップS5において、ステップS3で音声入力された音声と、ステップS4で選択又は変換候補の優先順位を変更した辞書と、に基づいて音声認識処理を行う。ステップS6において、音声認識処理を行った結果得られた文字データへの変換候補中から実際にユーザが入力したい文字データを選択し、入力データの確認作業を行う。以上の工程により、音声入力による自由入力文書の作成を終了することができる(ステップS7)。図5に示す例では、「メーカー」と音声入力すると、梨用の袋製造のメーカー名が変換候補順位の高い用語として(図では1から5まで)表示され、ユーザはこれらの中から適切なメーカーを選択し、メーカー名の入力を確定することができる。上記作業において用いられた文字データと音声データとに関しても、関連付けされてデータベース7内に蓄積され、次回の変換作業の際に役立てられる。以上のように、定型文の対象としては、ユーザが文字入力した文だけでなく、ユーザがダウンロードした情報も対象となる。従って、音声認識作業における自由度が増す。
【0030】
次に、本発明の第3の実施の形態による情報処理技術について図面を参照して説明する。図6は、文書作成の別の例を簡単化して示す図である。図6(A)に示すように、「○○まんしょん」と音声入力を行う。これを確実に文字変換し、定型文領域(図の上の領域)に「○○マンション」という文を文字データとして確定し表示させる。
【0031】
次に、音声入力により「シコウ」と入力すると、「○○マンション」との関連付けに基づき辞書変換部5において、建築に関連する事項が自由入力(音声入力)領域に入力される確率が高いと判断されるため、変換候補としては、1.施工、2.施行、3.試行、4.指向というように、建築に関連する用語が変換候補の上位に並ぶ辞書が選択される。
【0032】
一方、図6(B)に示すように、文字入力領域に、「作業内容:歯医者に行く」と文字入力する。次いで、音声入力領域に入力する際に、「シコウ」という音を発するとする。この場合、辞書変換部5において、歯医者に関連する事項が自由入力(音声入力)領域に入力される確率が高いと判断されるため、変換候補としては、1.歯垢、2.嗜好、3.志向、4.思考というように、歯医者に関連する用語が変換候補の上位に並ぶ辞書が選択される。
【0033】
本実施の形態による情報処理システムは、定型文も音声入力を行う点に特徴がある。その他、定型文領域における参照データ(関連データ)の対象としては、画像データを用いることもできる。また、画像と文字の両方のデータでも良い。要するに、定型文領域に入力されるデータは、自由文領域に入力するデータとの関連性を想起させる内容であれば、データの形式に関しては限定されるものではない。
【0034】
上記各実施の形態において説明した作業例は単なる一例である。例えば、文字入力領域に記載された文書は、音声入力に先だって文字入力された文書でなく、予め情報携帯端末に蓄積されていた文書でも良い。
【0035】
また、図1には、文字データ受信部2や音声データ受信部3、辞書切り替え部5、音声認識部6などは、端末1とは別体に設けられている例を示したが、端末1内にこれらの機能の一部又は全部が内蔵されていても良い。
【0036】
以上、発明の実施の形態に沿って本発明を説明したが、本発明はこれらに制限されるものではない。その他、種々の変更、改良、組み合わせが可能なことは当業者に自明であろう。
【0037】
【発明の効果】
本発明によれば、あるデータに基づいて、関連する領域に入力するための音声データを文字データに変換するため音声認識の精度が向上し、正確な文書を迅速に作成することができる。
【図面の簡単な説明】
【図1】図1(A)は、本発明の第1の実施の形態による情報処理システムの概略構成を示す図であり、図1(B)は端末の概略図である。
【図2】本発明の第1の実施の形態による情報処理システムにおける音声認識処理の流れを示すフローチャート図である。
【図3】本発明の第1の実施の形態による情報処理システムにおける音声データ−文字データ変換メカニズムを説明するための図である。
【図4】本発明の第1の実施の形態による情報処理システムにより作成された文書の構成例である。
【図5】本発明の第2の実施の形態による情報処理システムにより作成された文書の構成例である。
【図6】本発明の第3の実施の形態による情報処理システムにより作成された文書の構成例である。
【符号の説明】
1…端末、2…文字データ受信部、3…音声データ受信部、5…辞書切り替え部、6…音声認識部、7…データベース、11…携帯電話、12…アンテナ(通信部)、14…表示部、17…文字データ入力部(入力用ボタン)、21…音声入力部(マイクロフォン)。

Claims (6)

  1. 入力される音声データを文字データに変換するためのデータ変換部であって、前記音声データと関連する関連データを参照することにより前記変換の基準を推測することを特徴とするデータ変換部
    を有する情報処理装置。
  2. 入力される音声データを文字データに変換するための変換辞書を有するデータ変換部であって、前記変換辞書における変換候補順位又は変換辞書の種類を、前記音声データと関連する関連データを参照することにより選択することを特徴とするデータ変換部
    を有するデータ変換装置。
  3. 入力される音声のデータを文字データに変換して文書内の第1の領域に表示させるための変換辞書を有するデータ変換部であって、前記変換辞書における変換候補順位又は変換辞書の種類を、前記文書内の第2の領域に入力された関連データを参照することにより選択することを特徴とするデータ変換部
    を有するデータ変換装置。
  4. 第1種の情報データを受信する第1種データ受信部と、
    音声データを受信する音声データ受信部と、
    前記音声データ受信部から受信された音声データを文字データに変換するための変換辞書を有するデータ変換部であって、前記変換辞書における変換候補順位又は変換辞書の種類を、前記音声データと関連し前記第1種データ受信部から受信された関連データを参照することにより選択するデータ変換部と
    を有するデータ変換システム。
  5. さらに、前記音声データと前記関連データとを関連付けして記憶するデータベースを有する請求項4に記載のデータ変換システム。
  6. 第1種の情報データを入力する手順と、
    音声データを入力する手順と、
    前記音声データを文字データに変換するためのステップであって、変換候補順位又は変換辞書を、前記音声データと関連し前記第1種データを参照することにより選択する手順と
    をコンピュータに実行させるためのプログラム。
JP2002184569A 2002-06-25 2002-06-25 情報処理装置及び情報処理システム Pending JP2004029317A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002184569A JP2004029317A (ja) 2002-06-25 2002-06-25 情報処理装置及び情報処理システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002184569A JP2004029317A (ja) 2002-06-25 2002-06-25 情報処理装置及び情報処理システム

Publications (1)

Publication Number Publication Date
JP2004029317A true JP2004029317A (ja) 2004-01-29

Family

ID=31180455

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002184569A Pending JP2004029317A (ja) 2002-06-25 2002-06-25 情報処理装置及び情報処理システム

Country Status (1)

Country Link
JP (1) JP2004029317A (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH113093A (ja) * 1997-06-11 1999-01-06 Hitachi Ltd 音声データの認識方法及びその装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH113093A (ja) * 1997-06-11 1999-01-06 Hitachi Ltd 音声データの認識方法及びその装置

Similar Documents

Publication Publication Date Title
US7162412B2 (en) Multilingual conversation assist system
EP1603291B1 (en) Information transmission system and information transmission method
TWI502380B (zh) 配合預測式本文輸入使用之方法、裝置、伺服器、系統及電腦程式產品
JP4059502B2 (ja) 予測エディタアプリケーションを有する通信端末装置
EP2724558B1 (en) Systems and methods to present voice message information to a user of a computing device
US7885814B2 (en) Text information display apparatus equipped with speech synthesis function, speech synthesis method of same
US20080244446A1 (en) Disambiguation of icons and other media in text-based applications
US20080126077A1 (en) Dynamic modification of a messaging language
US20080077406A1 (en) Mobile Dictation Correction User Interface
US20050131686A1 (en) Information processing apparatus and data input method
US20080182599A1 (en) Method and apparatus for user input
US20100280821A1 (en) Text editing
US8515760B2 (en) Mobile terminal and text-to-speech method of same
EP1343096A2 (en) System and method for message language translation
JP2011254553A (ja) 小型キーパッド用日本語入力メカニズム
US8594297B2 (en) System and method for enhanced call routing
US20140250354A1 (en) Terminal, function starting-up method and program for terminal
US20200026742A1 (en) Integrating communications into a social graph
CA2488961C (en) Systems and methods for semantic stenography
JP2007304793A (ja) 文書検索装置
KR20240046508A (ko) 통화에 대한 음성 메뉴의 결정 및 시각적 디스플레이
JP2004029317A (ja) 情報処理装置及び情報処理システム
JP5402700B2 (ja) 返信メール作成装置および返信メール作成方法
JP2004240859A (ja) 言い換えシステム
US20060192765A1 (en) Chinese character auxiliary input method and device

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040914

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040928

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20041126

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20050510