JP4791984B2 - 入力された音声を処理する装置、方法およびプログラム - Google Patents
入力された音声を処理する装置、方法およびプログラム Download PDFInfo
- Publication number
- JP4791984B2 JP4791984B2 JP2007046925A JP2007046925A JP4791984B2 JP 4791984 B2 JP4791984 B2 JP 4791984B2 JP 2007046925 A JP2007046925 A JP 2007046925A JP 2007046925 A JP2007046925 A JP 2007046925A JP 4791984 B2 JP4791984 B2 JP 4791984B2
- Authority
- JP
- Japan
- Prior art keywords
- unit
- speech
- character string
- text
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1822—Parsing for meaning understanding
Description
第1の実施の形態にかかる音声処理装置は、音声認識結果から一部の文字列を除外した部分文字列(以下、部分表現という。)を複数生成し、生成した部分表現を利用者に提示して、提示した部分表現から利用者が選択した音声処理対象とする部分表現を受付けて処
理を行うものである。
うにし、解析部104による新たな形態素解析処理を行わずに、音声認識結果をそのまま形態素解析結果として利用するように構成してもよい。
C1:形態素列に現れる各品詞を、下記のグループG1〜G4に分類する。
(G1)単独で意味的なまとまりを形成する内容語をこのグループに分類する。日本語では、動詞などがこのグループに分類される。
(G2)単独あるいは連続的に出現して意味的なまとまりを形成する内容語をこのグループに分類する。日本語では、名詞、形容詞、数字などがこのグループに分類される。
(G3)他の内容語の前方に接続する機能語をこのグループに分類する。日本語では、接頭辞などがこのグループに分類される。
(G4)他の内容語の後方に接続する機能語をこのグループに分類する。日本語では、助
詞、接尾辞などがこのグループに分類される。
C2:文末でないG3の品詞を持つ形態素は、次に現れる形態素に連結させる。
C3:文頭でないG4の品詞を持つ形態素は、先行する形態素に連結させる。
C4:G2の品詞を持つ形態素が隣接している場合は、両者を連結させる。
認識結果Jに対する形態素解析処理が実行される(ステップS401)。
っても、利用者は提示される候補の中から自分の希望と合う候補を選択するだけで、音声処理を継続可能となる。したがって、複雑な修正操作が不要となり、ハンズフリー性という音声入力の利点を最大限に活用することが可能となる。
第1の実施の形態では、音声認識結果に対して部分表現を生成していた。これに対し、第2の実施の形態にかかる音声処理装置は、認識結果を翻訳した翻訳結果に対して部分表現を生成し、利用者に提示するものである。
ある。同図に示すように、音声翻訳装置1200は、音声受付部101と、認識部102と、判断部103と、解析部104と、生成部105と、候補出力部106と、選択受付部1207と、翻訳部1208と、言語出力部1209と、選択記憶部121と、を備えている。
、図6に示すような認識結果Jが得られたことを前提とする。
Read Only Memory)、フレキシブルディスク(FD)、CD−R(Compact Disk Recordable)、DVD(Digital Versatile Disk)等のコンピュータで読み取り可能な記録媒体に記録して提供するように構成してもよい。
52 ROM
53 RAM
54 通信I/F
61 バス
100 音声翻訳装置
101 音声受付部
102 認識部
103 判断部
104 解析部
105 生成部
106 候補出力部
107 選択受付部
108 翻訳部
109 言語出力部
121 選択記憶部
501 音声
601 認識結果
701、702 名詞
1200 音声処理装置
1207 選択受付部
1208 翻訳部
1209 言語出力部
Claims (15)
- 入力音声を受付ける音声受付部と、
前記入力音声からテキスト文字列を求める音声処理部と、
前記テキスト文字列を形態素解析する解析部と、
1つまたは複数の前記形態素からなる予め定められた分割単位で前記テキスト文字列を構成要素に分割し、前記構成要素のうち、相互に異なる一部の前記構成要素を前記テキスト文字列から除外した複数の部分文字列を生成する生成部と、
複数の前記部分文字列を表示部に選択可能に出力する第1出力部と、
出力された複数の前記部分文字列から、処理対象とする前記部分文字列の選択を受付ける選択受付部と、
を備えたことを特徴とする音声処理装置。 - 前記音声処理部は、前記入力音声を音声認識処理して認識結果を前記テキスト文字列として求めること、
を特徴とする請求項1に記載の音声処理装置。 - 前記音声受付部は、第1言語による前記入力音声を受付け、
選択を受付けた前記部分文字列を第2言語に翻訳して翻訳結果を求める翻訳部と、
前記翻訳結果を出力する第2出力部と、をさらに備えたこと、
を特徴とする請求項2に記載の音声処理装置。 - 受付けた前記入力音声を音声認識処理して認識結果を求める認識部をさらに備え、
前記音声受付部は、前記第1言語による前記入力音声を受付け、
前記音声処理部は、前記認識結果を第2言語に翻訳すること、
を特徴とする請求項1に記載の音声処理装置。 - 前記生成部は、単語、文節、および句を含む文の統語的な構成単位を前記分割単位として前記テキスト文字列を前記構成要素に分割し、前記構成要素のうち、一部の前記構成要素を含む前記部分文字列を生成すること、
を特徴とする請求項1に記載の音声処理装置。 - 前記生成部は、数量、時間、程度、挨拶、定型句の少なくとも1つを含む語句の意味単位を前記分割単位として前記テキスト文字列を前記構成要素に分割し、前記構成要素のうち、一部の前記構成要素を含む前記部分文字列を生成すること、
を特徴とする請求項1に記載の音声処理装置。 - 選択が受付けられた前記部分文字列と、前記部分文字列の生成元である前記テキスト文字列とを対応づけて記憶可能な記憶部をさらに備え、
前記選択受付部は、さらに、選択を受付けた前記部分文字列と、前記部分文字列の生成元である前記テキスト文字列とを対応づけて前記記憶部に記憶すること、
を特徴とする請求項1に記載の音声処理装置。 - 前記テキスト文字列に対応する前記部分文字列が前記記憶部に記憶されているか否かを判断する判断部をさらに備え、
前記生成部は、前記テキスト文字列に対応する前記部分文字列が前記記憶部に記憶されている場合に、前記テキスト文字列に対応する前記部分文字列を前記記憶部から取得することにより前記部分文字列を生成すること、
を特徴とする請求項7に記載の音声処理装置。 - 前記テキスト文字列に対応する前記部分文字列が前記記憶部に記憶されているか否かを
判断する判断部をさらに備え、
前記第1出力部は、前記記憶部に記憶されている前記部分文字列を、前記記憶部に記憶されていない前記部分文字列より優先して出力すること、
を特徴とする請求項7に記載の音声処理装置。 - 前記音声処理部は、さらに受付けた前記入力音声の前記テキスト文字列の確からしさを表す尤度を算出し、
前記尤度が予め定められた閾値より小さいか否かを判断する判断部をさらに備え、
前記生成部は、前記尤度が前記閾値より小さいと判断された場合に、前記部分文字列を生成すること、
を特徴とする請求項2に記載の音声処理装置。 - 前記第1出力部は、前記尤度が前記閾値より大きいと判断された場合に、前記テキスト文字列を出力すること、
を特徴とする請求項10に記載の音声処理装置。 - 前記第1出力部は、前記部分文字列から予め定められた個数の前記部分文字列を抽出し、抽出した前記部分文字列を出力すること、
を特徴とする請求項1に記載の音声処理装置。 - 前記音声処理部は、さらに受付けた前記入力音声の前記テキスト文字列の確からしさを表す尤度を算出し、
前記第1出力部は、前記部分文字列のうち、前記テキスト文字列の前記尤度に応じて予め定められた個数の前記部分文字列を出力すること、
を特徴とする請求項1に記載の音声処理装置。 - 音声受付部が、入力音声を受付ける音声受付ステップと、
音声処理部が、前記入力音声からテキスト文字列を求める音声処理ステップと、
解析部が、前記テキスト文字列を形態素解析する解析ステップと、
生成部が、1つまたは複数の前記形態素からなる予め定められた分割単位で前記テキスト文字列を構成要素に分割し、前記構成要素のうち、相互に異なる一部の前記構成要素を前記テキスト文字列から除外した複数の部分文字列を生成する生成ステップと、
第1出力部が、複数の前記部分文字列を表示部に選択可能に出力する第1出力ステップと、
選択受付部が、出力された複数の前記部分文字列から、処理対象とする前記部分文字列の選択を受付ける選択受付ステップと、
を含むことを特徴とする音声処理方法。 - 入力音声を受付ける音声受付手順と、
前記入力音声からテキスト文字列を求める音声処理手順と、
前記テキスト文字列を形態素解析する解析手順と、
1つまたは複数の前記形態素からなる予め定められた分割単位で前記テキスト文字列を構成要素に分割し、前記構成要素のうち、相互に異なる一部の前記構成要素を前記テキスト文字列から除外した複数の部分文字列を生成する生成手順と、
複数の前記部分文字列を表示部に選択可能に出力する第1出力手順と、
出力された複数の前記部分文字列から、処理対象とする前記部分文字列の選択を受付ける選択受付手順と、
をコンピュータに実行させるための音声処理プログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007046925A JP4791984B2 (ja) | 2007-02-27 | 2007-02-27 | 入力された音声を処理する装置、方法およびプログラム |
US12/037,724 US8954333B2 (en) | 2007-02-27 | 2008-02-26 | Apparatus, method, and computer program product for processing input speech |
CN200810074190.6A CN101256559A (zh) | 2007-02-27 | 2008-02-27 | 用于处理输入语音的装置和方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007046925A JP4791984B2 (ja) | 2007-02-27 | 2007-02-27 | 入力された音声を処理する装置、方法およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008209717A JP2008209717A (ja) | 2008-09-11 |
JP4791984B2 true JP4791984B2 (ja) | 2011-10-12 |
Family
ID=39716930
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007046925A Active JP4791984B2 (ja) | 2007-02-27 | 2007-02-27 | 入力された音声を処理する装置、方法およびプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US8954333B2 (ja) |
JP (1) | JP4791984B2 (ja) |
CN (1) | CN101256559A (ja) |
Families Citing this family (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5112116B2 (ja) * | 2008-03-07 | 2013-01-09 | 株式会社東芝 | 機械翻訳する装置、方法およびプログラム |
EP2394225B1 (en) | 2009-02-05 | 2019-01-09 | Wwpass Corporation | Centralized authentication system with safe private data storage and method |
WO2010098209A1 (ja) * | 2009-02-26 | 2010-09-02 | 国立大学法人豊橋技術科学大学 | 音声検索装置および音声検索方法 |
JP2011043716A (ja) * | 2009-08-21 | 2011-03-03 | Sharp Corp | 情報処理装置、会議システム、情報処理方法及びコンピュータプログラム |
US20130030789A1 (en) * | 2011-07-29 | 2013-01-31 | Reginald Dalce | Universal Language Translator |
KR101870729B1 (ko) * | 2011-09-01 | 2018-07-20 | 삼성전자주식회사 | 휴대용 단말기의 번역 트리구조를 이용한 번역장치 및 방법 |
JP5906869B2 (ja) * | 2012-03-23 | 2016-04-20 | 富士通株式会社 | アクセント付与装置、アクセント付与方法、及びプログラム |
CN102708866A (zh) * | 2012-06-01 | 2012-10-03 | 武汉大学 | 基于语义计算的听力或语言障碍人士交流系统及其方法 |
JP2014026514A (ja) * | 2012-07-27 | 2014-02-06 | Fujitsu Ltd | 文字入力支援プログラム、文字入力支援方法および文字入力支援装置 |
CN103714048B (zh) * | 2012-09-29 | 2017-07-21 | 国际商业机器公司 | 用于校正文本的方法和系统 |
CN103871401B (zh) * | 2012-12-10 | 2016-12-28 | 联想(北京)有限公司 | 一种语音识别的方法及电子设备 |
CN103929302A (zh) * | 2013-01-12 | 2014-07-16 | 鹤山世达光电科技有限公司 | 加密信息处理方法及处理系统 |
CN103353824B (zh) * | 2013-06-17 | 2016-08-17 | 百度在线网络技术(北京)有限公司 | 语音输入字符串的方法、装置和终端设备 |
KR102191425B1 (ko) * | 2013-07-29 | 2020-12-15 | 한국전자통신연구원 | 인터랙티브 캐릭터 기반 외국어 학습 장치 및 방법 |
KR101551037B1 (ko) * | 2013-12-31 | 2015-09-07 | 현대자동차주식회사 | 차량에서의 정보 제공을 위한 시스템 |
US10037758B2 (en) * | 2014-03-31 | 2018-07-31 | Mitsubishi Electric Corporation | Device and method for understanding user intent |
JP6334354B2 (ja) * | 2014-09-30 | 2018-05-30 | 株式会社東芝 | 機械翻訳装置、方法およびプログラム |
CN105302795B (zh) * | 2015-11-11 | 2018-03-20 | 河海大学 | 基于汉语模糊发音和语音识别的中文文本校验系统及方法 |
US11275897B2 (en) * | 2016-07-20 | 2022-03-15 | Sony Corporation | Information processing apparatus, information processing method, and program for modifying a cluster segment relating to a character string group |
US10950240B2 (en) * | 2016-08-26 | 2021-03-16 | Sony Corporation | Information processing device and information processing method |
US9747282B1 (en) | 2016-09-27 | 2017-08-29 | Doppler Labs, Inc. | Translation with conversational overlap |
CN108205524B (zh) * | 2016-12-20 | 2022-01-07 | 北京京东尚科信息技术有限公司 | 文本数据处理方法和装置 |
CN106649295A (zh) * | 2017-01-04 | 2017-05-10 | 携程旅游网络技术(上海)有限公司 | 用于移动终端的文字转译方法 |
KR102509822B1 (ko) * | 2017-09-25 | 2023-03-14 | 삼성전자주식회사 | 문장 생성 방법 및 장치 |
KR102449875B1 (ko) * | 2017-10-18 | 2022-09-30 | 삼성전자주식회사 | 음성 신호 번역 방법 및 그에 따른 전자 장치 |
CN109166594A (zh) * | 2018-07-24 | 2019-01-08 | 北京搜狗科技发展有限公司 | 一种数据处理方法、装置和用于数据处理的装置 |
US20210097647A1 (en) * | 2018-09-13 | 2021-04-01 | Shanghai Cambrico Information Technology Co., Ltd. | Information processing method and terminal device |
CN109192212B (zh) * | 2018-11-13 | 2019-12-10 | 苏州思必驰信息科技有限公司 | 语音控制方法及装置 |
CN112231472B (zh) * | 2020-09-18 | 2022-07-29 | 昆明理工大学 | 融入领域术语词典的司法舆情敏感信息识别方法 |
Family Cites Families (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5855000A (en) * | 1995-09-08 | 1998-12-29 | Carnegie Mellon University | Method and apparatus for correcting and repairing machine-transcribed input using independent or cross-modal secondary input |
JPH1040267A (ja) * | 1996-07-26 | 1998-02-13 | Nec Corp | 文書要約ビューア |
JP3794597B2 (ja) * | 1997-06-18 | 2006-07-05 | 日本電信電話株式会社 | 話題抽出方法及び話題抽出プログラム記録媒体 |
JP3822990B2 (ja) * | 1999-01-07 | 2006-09-20 | 株式会社日立製作所 | 翻訳装置、記録媒体 |
US6278968B1 (en) * | 1999-01-29 | 2001-08-21 | Sony Corporation | Method and apparatus for adaptive speech recognition hypothesis construction and selection in a spoken language translation system |
JP2000242645A (ja) | 1999-02-24 | 2000-09-08 | Sony Corp | 音声翻訳装置、音声翻訳方法及び音声翻訳制御プログラムを記録した記録媒体 |
JP2001013992A (ja) * | 1999-07-02 | 2001-01-19 | Nec Corp | 音声理解装置 |
JP2001101187A (ja) * | 1999-09-30 | 2001-04-13 | Sony Corp | 翻訳装置および翻訳方法、並びに記録媒体 |
JP3444831B2 (ja) * | 1999-11-29 | 2003-09-08 | 株式会社ジャストシステム | 編集処理装置、及び編集処理プログラムが記憶された記憶媒体 |
CN1369834B (zh) * | 2001-01-24 | 2010-04-28 | 松下电器产业株式会社 | 语音转换设备 |
WO2002061728A1 (fr) * | 2001-02-01 | 2002-08-08 | Matsushita Electric Industrial Co., Ltd. | Dispositif de reconnaissance de phrases, procede de reconnaissance de phrases, programme et support |
JP4092933B2 (ja) * | 2002-03-20 | 2008-05-28 | 富士ゼロックス株式会社 | 文書情報検索装置及び文書情報検索プログラム |
JP3762327B2 (ja) * | 2002-04-24 | 2006-04-05 | 株式会社東芝 | 音声認識方法および音声認識装置および音声認識プログラム |
JP3920812B2 (ja) * | 2003-05-27 | 2007-05-30 | 株式会社東芝 | コミュニケーション支援装置、支援方法、及び支援プログラム |
JP2005173731A (ja) * | 2003-12-08 | 2005-06-30 | Ricoh Co Ltd | コンテンツ縮約装置、コンテンツ縮約方法およびコンテンツ縮約プログラム |
JP3962763B2 (ja) * | 2004-04-12 | 2007-08-22 | 松下電器産業株式会社 | 対話支援装置 |
JP4263181B2 (ja) * | 2005-03-28 | 2009-05-13 | 株式会社東芝 | コミュニケーション支援装置、コミュニケーション支援方法およびコミュニケーション支援プログラム |
JP4439431B2 (ja) * | 2005-05-25 | 2010-03-24 | 株式会社東芝 | コミュニケーション支援装置、コミュニケーション支援方法およびコミュニケーション支援プログラム |
JP4064413B2 (ja) * | 2005-06-27 | 2008-03-19 | 株式会社東芝 | コミュニケーション支援装置、コミュニケーション支援方法およびコミュニケーション支援プログラム |
US20060293889A1 (en) * | 2005-06-27 | 2006-12-28 | Nokia Corporation | Error correction for speech recognition systems |
US7552053B2 (en) * | 2005-08-22 | 2009-06-23 | International Business Machines Corporation | Techniques for aiding speech-to-speech translation |
JP4542974B2 (ja) * | 2005-09-27 | 2010-09-15 | 株式会社東芝 | 音声認識装置、音声認識方法および音声認識プログラム |
JP4058071B2 (ja) * | 2005-11-22 | 2008-03-05 | 株式会社東芝 | 用例翻訳装置、用例翻訳方法および用例翻訳プログラム |
JP5011751B2 (ja) * | 2006-02-27 | 2012-08-29 | 富士通株式会社 | 訳語情報出力処理プログラム,処理方法および処理装置 |
US20080133245A1 (en) * | 2006-12-04 | 2008-06-05 | Sehda, Inc. | Methods for speech-to-speech translation |
-
2007
- 2007-02-27 JP JP2007046925A patent/JP4791984B2/ja active Active
-
2008
- 2008-02-26 US US12/037,724 patent/US8954333B2/en active Active
- 2008-02-27 CN CN200810074190.6A patent/CN101256559A/zh active Pending
Also Published As
Publication number | Publication date |
---|---|
US8954333B2 (en) | 2015-02-10 |
JP2008209717A (ja) | 2008-09-11 |
CN101256559A (zh) | 2008-09-03 |
US20080208597A1 (en) | 2008-08-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4791984B2 (ja) | 入力された音声を処理する装置、方法およびプログラム | |
US7974844B2 (en) | Apparatus, method and computer program product for recognizing speech | |
US7937262B2 (en) | Method, apparatus, and computer program product for machine translation | |
US6910012B2 (en) | Method and system for speech recognition using phonetically similar word alternatives | |
US5787230A (en) | System and method of intelligent Mandarin speech input for Chinese computers | |
JP5207642B2 (ja) | 語句として新たに認識するべき文字列を取得するためのシステム、方法及びコンピュータプログラム | |
JP4542974B2 (ja) | 音声認識装置、音声認識方法および音声認識プログラム | |
Le et al. | Automatic speech recognition for under-resourced languages: application to Vietnamese language | |
EP1346343B1 (en) | Speech recognition using word-in-phrase command | |
US6067520A (en) | System and method of recognizing continuous mandarin speech utilizing chinese hidden markou models | |
US20090138266A1 (en) | Apparatus, method, and computer program product for recognizing speech | |
US20090204401A1 (en) | Speech processing system, speech processing method, and speech processing program | |
JPWO2007097176A1 (ja) | 音声認識辞書作成支援システム、音声認識辞書作成支援方法及び音声認識辞書作成支援用プログラム | |
JPH03224055A (ja) | 同時通訳向き音声認識システムおよびその音声認識方法 | |
JP5703491B2 (ja) | 言語モデル・音声認識辞書作成装置及びそれらにより作成された言語モデル・音声認識辞書を用いた情報処理装置 | |
CN110675866B (zh) | 用于改进至少一个语义单元集合的方法、设备及计算机可读记录介质 | |
JP2008243080A (ja) | 音声を翻訳する装置、方法およびプログラム | |
JP5073024B2 (ja) | 音声対話装置 | |
JP4811557B2 (ja) | 音声再生装置及び発話支援装置 | |
Alsharhan et al. | Evaluating the effect of using different transcription schemes in building a speech recognition system for Arabic | |
JP5208795B2 (ja) | 通訳装置、方法、及びプログラム | |
Pellegrini et al. | Automatic word decompounding for asr in a morphologically rich language: Application to amharic | |
JP6849977B2 (ja) | テキスト表示用同期情報生成装置および方法並びに音声認識装置および方法 | |
Sung et al. | Deploying google search by voice in cantonese | |
JP2003162524A (ja) | 言語処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090326 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110207 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110301 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110426 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110628 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110722 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140729 Year of fee payment: 3 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 4791984 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313114 Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |