JP2018097123A - Information processing unit - Google Patents

Information processing unit Download PDF

Info

Publication number
JP2018097123A
JP2018097123A JP2016240669A JP2016240669A JP2018097123A JP 2018097123 A JP2018097123 A JP 2018097123A JP 2016240669 A JP2016240669 A JP 2016240669A JP 2016240669 A JP2016240669 A JP 2016240669A JP 2018097123 A JP2018097123 A JP 2018097123A
Authority
JP
Japan
Prior art keywords
character string
display
voice
unit
string candidates
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016240669A
Other languages
Japanese (ja)
Other versions
JP6724759B2 (en
Inventor
恭平 増井
Kyohei Masui
恭平 増井
亮磨 垣見
Ryoma Kakimi
亮磨 垣見
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toyota Motor Corp
Original Assignee
Toyota Motor Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toyota Motor Corp filed Critical Toyota Motor Corp
Priority to JP2016240669A priority Critical patent/JP6724759B2/en
Publication of JP2018097123A publication Critical patent/JP2018097123A/en
Application granted granted Critical
Publication of JP6724759B2 publication Critical patent/JP6724759B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • User Interface Of Digital Computer (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a technique for allowing a user to quickly select a correct character string candidate from among a plurality of displayed character string candidates.SOLUTION: In an information processing unit 1, a voice recognition section 12 voice-recognizes voice of a user and acquires a plurality of character string candidates corresponding to the voice-recognized voice from a database. A display section 16 displays the plurality of character string candidates acquired by the voice recognition section 12. An extraction section 18 extracts a different part between the character string candidates acquired by the voice recognition section 12. A display control section 20 allows the display section 16 to highlight the different part extracted by the extraction section 18. An acceptance section 22 accepts a selection instruction of the user with respect to the plurality of character string candidates displayed on the display section 16.SELECTED DRAWING: Figure 1

Description

本発明は、音声認識結果に基づいて複数の文字列候補を表示する情報処理装置に関する。   The present invention relates to an information processing apparatus that displays a plurality of character string candidates based on a speech recognition result.

ユーザの音声を音声認識し、音声認識結果に基づいて複数の文字列候補をリストとして表示し、リストの中からユーザが選択した文字列候補を正しい音声認識結果として処理する音声認識装置が知られている(例えば、特許文献1参照)。   A voice recognition device that recognizes a user's voice, displays a plurality of character string candidates as a list based on the voice recognition result, and processes the character string candidate selected by the user from the list as a correct voice recognition result is known. (For example, refer to Patent Document 1).

特表2005−530253号公報JP 2005-530253 A

上記技術では、複数の文字列候補が表示されるだけであるため、文字列候補の中からユーザが正しい文字列候補を速やかに選択することは容易ではない。   In the above technique, since only a plurality of character string candidates are displayed, it is not easy for the user to quickly select a correct character string candidate from among the character string candidates.

本発明はこうした状況に鑑みてなされたものであり、その目的は、表示された複数の文字列候補の中から正しい文字列候補をユーザに速やかに選択させることができる技術を提供することにある。   The present invention has been made in view of such circumstances, and an object thereof is to provide a technique that allows a user to quickly select a correct character string candidate from among a plurality of displayed character string candidates. .

上記課題を解決するために、本発明のある態様の情報処理装置は、ユーザの音声を音声認識して、音声認識された前記音声に対応する複数の文字列候補をデータベースから取得する音声認識部と、前記音声認識部で取得された前記複数の文字列候補を表示する表示部と、前記音声認識部で取得された前記文字列候補の間の相違部分を抽出する抽出部と、前記抽出部で抽出された前記相違部分を前記表示部に強調表示させる表示制御部と、前記表示部に表示された前記複数の文字列候補に対するユーザの選択指示を受け付ける受付部と、を備える。   In order to solve the above problems, an information processing apparatus according to an aspect of the present invention recognizes a user's voice and acquires a plurality of character string candidates corresponding to the voice that has been voice-recognized from a database. A display unit that displays the plurality of character string candidates acquired by the voice recognition unit, an extraction unit that extracts a difference between the character string candidates acquired by the voice recognition unit, and the extraction unit A display control unit that highlights the difference portion extracted in step (b) on the display unit, and a reception unit that receives a user selection instruction for the plurality of character string candidates displayed on the display unit.

この態様によると、文字列候補の間の相違部分を表示部に強調表示させるようにしているので、ユーザは相違部分を容易に認識できる。従って、正しい文字列候補をユーザに速やかに選択させることができる。   According to this aspect, since the different portions between the character string candidates are highlighted on the display unit, the user can easily recognize the different portions. Accordingly, the user can promptly select a correct character string candidate.

本発明によれば、表示された複数の文字列候補の中から正しい文字列候補をユーザに速やかに選択させることができる。   According to the present invention, the user can promptly select a correct character string candidate from among a plurality of displayed character string candidates.

一実施形態に係る情報処理装置のブロック図である。It is a block diagram of the information processor concerning one embodiment. (a)〜(d)は、一実施形態に係る文字列候補のデータベースの構成例を示す図である。(A)-(d) is a figure which shows the structural example of the database of the character string candidate which concerns on one Embodiment. 図1の表示部に表示された認識結果の候補リストを示す図である。It is a figure which shows the candidate list of the recognition result displayed on the display part of FIG. 図1の情報処理装置における表示処理を示すフローチャートである。3 is a flowchart showing display processing in the information processing apparatus of FIG. 1. 図1の表示部に表示された電話番号認識結果の候補リストを示す図である。It is a figure which shows the candidate list of the telephone number recognition result displayed on the display part of FIG. 変形例に係る一致部分が表示されていない文字列候補の表示例である。It is a display example of the character string candidate in which the matching part which concerns on a modification is not displayed. 変形例に係る相違部分の表示形態が変更された文字列候補の表示例である。It is a display example of the character string candidate by which the display form of the different part which concerns on a modification was changed.

図1は、一実施形態に係る情報処理装置1のブロック図である。以下では、情報処理装置1がカーナビゲーションシステムにおける音声認識に用いられる一例について説明するが、これに限らない。図1に示すように、情報処理装置1は、マイク10と、音声認識部12と、記憶部14と、表示部16と、抽出部18と、表示制御部20と、受付部22と、を備える。   FIG. 1 is a block diagram of an information processing apparatus 1 according to an embodiment. Hereinafter, an example in which the information processing apparatus 1 is used for voice recognition in a car navigation system will be described, but the present invention is not limited thereto. As illustrated in FIG. 1, the information processing apparatus 1 includes a microphone 10, a voice recognition unit 12, a storage unit 14, a display unit 16, an extraction unit 18, a display control unit 20, and a reception unit 22. Prepare.

マイク10は、ユーザの音声を音声信号に変換し、この音声信号を音声認識部12に送信する。ユーザは、例えば、カーナビゲーションシステムに入力したい情報を発話する。このような情報として、例えば、住所、電話番号、連絡先などの目的地情報が挙げられる。   The microphone 10 converts the user's voice into a voice signal and transmits the voice signal to the voice recognition unit 12. For example, the user speaks information desired to be input to the car navigation system. Examples of such information include destination information such as an address, a telephone number, and a contact address.

音声認識部12は、マイク10から送信された音声信号に基づいてユーザの音声を音声認識して、音声認識された音声に対応する複数の文字列候補をデータベースから取得する。取得された複数の文字列候補の中のある文字列候補と他の文字列候補との間では、一部分が一致しており、他の部分が相違している。このような複数の文字列候補を取得することにより、マイク10に車両の走行音などの雑音が混入して音声認識の不確実性が生じた場合であっても、取得された複数の文字列候補は正しい文字列候補を含み得る。音声に対応する複数の文字列候補を選択する方法としては、周知の技術を用いることができる。   The voice recognition unit 12 recognizes the user's voice based on the voice signal transmitted from the microphone 10 and acquires a plurality of character string candidates corresponding to the voice that has been voice-recognized from the database. A certain character string candidate and a different character string candidate among a plurality of acquired character string candidates are partially matched, and other parts are different. By acquiring such a plurality of character string candidates, even if noise such as a running sound of a vehicle is mixed in the microphone 10 and the uncertainty of voice recognition occurs, the acquired plurality of character strings Candidates may include correct character string candidates. A well-known technique can be used as a method of selecting a plurality of character string candidates corresponding to speech.

文字列候補のデータベースは、記憶部14に予め格納されている。記憶部14は、不揮発性メモリなどにより構成されている。   A database of character string candidates is stored in the storage unit 14 in advance. The storage unit 14 is configured by a nonvolatile memory or the like.

表示部16は、カーナビゲーション用の地図などの各種情報を表示する液晶ディスプレイなどであり、音声認識部12で取得された複数の文字列候補を表示する。   The display unit 16 is a liquid crystal display or the like that displays various information such as a map for car navigation, and displays a plurality of character string candidates acquired by the voice recognition unit 12.

抽出部18は、音声認識部12で取得された文字列候補の間の相違部分を抽出する。相違部分を抽出する具体的な方法は後述する。   The extraction unit 18 extracts a difference between character string candidates acquired by the speech recognition unit 12. A specific method for extracting the difference will be described later.

表示制御部20は、表示部16の表示を制御する。表示制御部20は、抽出部18で抽出された相違部分を表示部16に強調表示させる。具体的には表示制御部20は、文字列候補のうち相違部分の表示色を黒などの標準の表示色で表示部16に表示させ、一致部分の表示色を標準の表示色より目立たないグレーなどの色で表示部16に表示させ、これにより相違部分を相対的に強調表示させる。   The display control unit 20 controls display on the display unit 16. The display control unit 20 highlights the difference part extracted by the extraction unit 18 on the display unit 16. Specifically, the display control unit 20 causes the display unit 16 to display the display color of the different part of the character string candidates in a standard display color such as black, and the display color of the matching part is a gray that is less noticeable than the standard display color. Are displayed on the display unit 16 in such a manner that different portions are relatively highlighted.

受付部22は、表示部16に表示された複数の文字列候補に対するユーザの選択指示を受け付ける。受付部22は、ユーザによる表示部16へのタッチを検出するタッチパネルセンサ、スイッチ、または、リモコンなどである。   The accepting unit 22 accepts user selection instructions for a plurality of character string candidates displayed on the display unit 16. The receiving unit 22 is a touch panel sensor, a switch, or a remote controller that detects a touch on the display unit 16 by the user.

音声認識部12、抽出部18および表示制御部20は、ハードウェア資源とソフトウェア資源の協働、またはハードウェア資源のみにより実現できる。ハードウェア資源としてアナログ素子、マイクロコンピュータ、DSP、ROM、RAM、FPGA、その他のLSIを利用できる。ソフトウェア資源としてファームウェア等のプログラムを利用できる。   The voice recognition unit 12, the extraction unit 18, and the display control unit 20 can be realized by cooperation of hardware resources and software resources, or only by hardware resources. As hardware resources, analog elements, microcomputers, DSPs, ROMs, RAMs, FPGAs, and other LSIs can be used. Firmware and other programs can be used as software resources.

図2(a)〜(d)は、一実施形態に係る文字列候補のデータベースの構成例を示す図である。図2(a)に示すように、1つの文字列候補100は、Aパート、Bパート、Cパート、Dパート等の複数の単語単位に分割されて、データベースに格納されている。単語単位の数は、文字列候補100に応じて異なる。例えば、図2(b)に示すように、住所に関する文字列候補100aの場合、Aパートは「愛知県」であり、Bパートは「豊田市」であり、Cパートは「トヨタ町」であり、Dパートは「1番」である。   FIGS. 2A to 2D are diagrams illustrating a configuration example of a database of character string candidates according to an embodiment. As shown in FIG. 2A, one character string candidate 100 is divided into a plurality of word units such as an A part, a B part, a C part, and a D part and stored in a database. The number of word units varies depending on the character string candidate 100. For example, as shown in FIG. 2B, in the case of the character string candidate 100a regarding the address, the A part is “Aichi Prefecture”, the B part is “Toyota City”, and the C part is “Toyota Town”. The D part is “No. 1”.

また、図2(c)に示すように、電話番号に関する文字列候補100bの場合、例えば、Aパートは「+81」であり、Bパートは「01」であり、Cパートは「012」であり、Dパートは「0123」である。   As shown in FIG. 2C, in the case of the character string candidate 100b related to the telephone number, for example, the A part is “+81”, the B part is “01”, and the C part is “012”. , D part is “0123”.

また、図2(d)に示すように、連絡先に関する文字列候補100cの場合、例えば、Aパートは「豊田」であり、Bパートは「太郎」であり、Cパートは「職場」である。   Further, as shown in FIG. 2D, in the case of the character string candidate 100c related to the contact address, for example, the A part is “Toyota”, the B part is “Taro”, and the C part is “workplace”. .

図3は、図1の表示部16に表示された認識結果の候補リストを示す図である。図3に示すように、音声認識の結果、複数の文字列候補が候補リストとして表示される。N−1(Nは2以上の整数)番目の文字列候補100−(N−1)は、AN−1パート、BN−1パート、CN−1パート、DN−1パート等を含み、N番目の文字列候補100−Nは、Aパート、Bパート、Cパート、Dパート等を含む。N番目の文字列候補100−Nは、N−1番目の文字列候補100−(N−1)の下段に表示される。 FIG. 3 is a diagram showing a recognition result candidate list displayed on the display unit 16 of FIG. As shown in FIG. 3, as a result of speech recognition, a plurality of character string candidates are displayed as a candidate list. The N-1 (N is an integer greater than or equal to 2) th character string candidate 100- (N-1) includes an A N-1 part, a B N-1 part, a C N-1 part, a D N-1 part, and the like. The Nth character string candidate 100-N includes an AN part, a BN part, a CN part, a DN part, and the like. The Nth character string candidate 100-N is displayed in the lower part of the (N-1) th character string candidate 100- (N-1).

ここで、表示制御部20は、複数の文字列候補をソートして表示部16に表示させる。ソートの方法は特に限定されないが、例えば、表示制御部20は、Aパート側から共通するパートの数が多い順番に複数の文字列候補をソートしてもよい。   Here, the display control unit 20 sorts the plurality of character string candidates and causes the display unit 16 to display them. Although the sorting method is not particularly limited, for example, the display control unit 20 may sort a plurality of character string candidates in order of increasing number of common parts from the A part side.

このように構成される文字列候補を用いて、抽出部18は、相違部分を抽出する対象の文字列候補100−Nと、当該文字列候補100−Nの上段に隣接して表示される文字列候補100−(N−1)との間において、左側のパートから順に、対応するパート同士が一致するか相違するか判定する。抽出部18は、相違するパートを、文字列候補100−(N−1)と文字列候補100−Nとの間の相違部分として抽出する。表示制御部20は、文字列候補100−Nにおいて、抽出された相違部分と、相違部分より右側のパートとを表示部16に強調表示させる。抽出部18と表示制御部20は、この処理を繰り返す。   Using the character string candidates configured as described above, the extraction unit 18 uses a character string candidate 100-N to be extracted as a difference portion and a character displayed adjacent to the upper stage of the character string candidate 100-N. It is determined whether the corresponding parts match or differ from the column candidate 100- (N-1) in order from the left part. The extraction unit 18 extracts different parts as different parts between the character string candidate 100- (N-1) and the character string candidate 100-N. In the character string candidate 100-N, the display control unit 20 highlights the extracted different part and the part on the right side of the different part on the display unit 16. The extraction unit 18 and the display control unit 20 repeat this process.

図4は、図1の情報処理装置1における表示処理を示すフローチャートである。ここでは、説明を明確化するため、1つの文字列候補が4つのAパート、Bパート、CパートおよびDパートから構成されている場合の処理を示す。この処理は、音声認識が行われる毎に行われる。   FIG. 4 is a flowchart showing display processing in the information processing apparatus 1 of FIG. Here, in order to clarify the explanation, a process when one character string candidate is composed of four A parts, B parts, C parts, and D parts is shown. This process is performed every time voice recognition is performed.

まず、表示制御部20は、N=0に設定し(S10)、N=N+1に設定し(S12)、N=1であるか判定する(S14)。N=1である場合(S14のY)、表示制御部20は、1番目の文字列候補100−1の全体を強調表示させ(S16)、Nが文字列候補の総数と等しいか判定する(S18)。等しい場合(S18のY)、処理を終了し、等しくない場合(S18のN)、S12に戻る。   First, the display control unit 20 sets N = 0 (S10), sets N = N + 1 (S12), and determines whether N = 1 (S14). When N = 1 (Y in S14), the display control unit 20 highlights the entire first character string candidate 100-1 (S16), and determines whether N is equal to the total number of character string candidates (S16). S18). If they are equal (Y in S18), the process is terminated. If they are not equal (N in S18), the process returns to S12.

S14においてN=1でない場合(S14のN)、抽出部18は、AN−1パートがAパートと一致するか判定し(S20)、相違する場合(S20のN)、表示制御部20は、N番目の文字列候補100−NのAパートからDパートを強調表示させ(S16)、S18に移行する。 When N = 1 is not 1 in S14 (N in S14), the extraction unit 18 determines whether the A N-1 part matches the A N part (S20), and when they are different (N in S20), the display control unit 20 from N-th a N part of a character string candidates 100-N to highlight D N Part (S16), the process proceeds to S18.

N−1パートがAパートと一致する場合(S20のY)、表示制御部20は、Aパートを目立たなくして(S22)、抽出部18は、BN−1パートがBパートと一致するか判定する(S24)。相違する場合(S24のN)、表示制御部20は、N番目の文字列候補100−NのBパートからDパートを強調表示させ(S16)、S18に移行する。 When the A N-1 part matches the A N part (Y in S20), the display control unit 20 makes the A N part inconspicuous (S22), and the extraction unit 18 determines that the B N-1 part is the B N part. (S24). If different (S24 of N), the display control unit 20, from the N-th character string candidates 100-N B N Part highlight the D N Part (S16), the process proceeds to S18.

N−1パートがBパートと一致する場合(S24のY)、表示制御部20は、Bパートを目立たなくして(S26)、抽出部18は、CN−1パートがCパートと一致するか判定する(S28)。相違する場合(S28のN)、表示制御部20は、N番目の文字列候補100−NのCパートとDパートを強調表示させ(S16)、S18に移行する。 If B N-1 part coincides with B N Part (S24 of Y), the display control unit 20, and obscure the B N Part (S26), the extraction unit 18, C N-1 parts are C N Part (S28). If different (S28 of N), the display control unit 20, the N-th C N part and D N Part string candidate 100-N to highlight (S16), the process proceeds to S18.

N−1パートがCパートと一致する場合(S28のY)、表示制御部20は、N番目の文字列候補100−NのCパートを目立たなくして(S30)、Dパートを強調表示させ(S32)、S18に移行する。 If C N-1 part coincides with C N Part (S28 of Y), the display control unit 20, and obscuring C N part of the N-th candidate character string 100-N (S30), the D N Part Emphasis is displayed (S32), and the process proceeds to S18.

1つの文字列候補が3つ以下のパートまたは5つ以上のパートから構成される場合も、同様に処理を行うことができる。   The same processing can be performed when one character string candidate is composed of three or less parts or five or more parts.

次に、ユーザが電話番号を発話する一例について、情報処理装置1の全体的な動作を説明する。まず、ユーザは、カーナビゲーションシステムに目的地を設定するために、目的地の電話番号を発話する。これにより、図5に示すように、音声認識された音声に対応する複数の文字列候補100−1〜100−6が表示部16に表示される。   Next, the overall operation of the information processing apparatus 1 will be described for an example in which the user utters a telephone number. First, the user utters the destination telephone number in order to set the destination in the car navigation system. Thereby, as shown in FIG. 5, a plurality of character string candidates 100-1 to 100-6 corresponding to the speech that has been speech-recognized are displayed on the display unit 16.

図5は、図1の表示部16に表示された電話番号認識結果の候補リストを示す図である。文字列候補100−1〜100−6は、Aパート側から共通するパートの数が多い順番にソートされている。1番目の文字列候補100−1では、AパートからDパートまでの「+81−01−012−0123」が標準の表示色で表示されている。 FIG. 5 is a diagram showing a candidate list of telephone number recognition results displayed on the display unit 16 of FIG. The character string candidates 100-1 to 100-6 are sorted in descending order of the number of common parts from the A part side. In the first character string candidate 100-1, "+ 81-01-012-0123" from A 1 Part to D 1 part is displayed in the standard display color.

2番目の文字列候補100−2では、1つ上段の文字列候補100−1の対応するパートと一致するAパートからCパートまでの「+81−01−012」がグレーで表示されている。つまり、一致部分はグレーアウトして表示されている。文字列候補100−1の対応するパートと相違するDパートの「−0122」が標準の表示色で表示されている。結果として、「+81−01−012」は目立たなく表示され、「−0122」は強調表示されている。 In the second character string candidate 100-2, one upper character string candidate 100-1 from the corresponding A 2-part matching the part to a C 2 part is "+ 81-01-012" are displayed in gray Yes. That is, the matching part is displayed in gray. Of D 2 parts that differ from the corresponding part of the character string candidates 100-1 "-0122" is displayed in the standard display color. As a result, “+ 81-01-012” is displayed inconspicuously and “−0122” is highlighted.

3番目の文字列候補100−3では、1つ上段の文字列候補100−2の対応するパートと一致するAパートからCパートまでの「+81−01−012」がグレーで表示されている。文字列候補100−2の対応するパートと相違するDパートの「−0213」が標準の表示色で表示されている。 In the third character string candidate 100-3, one upper character string candidate 100-2 from the corresponding A 3-part matching the part to C 3 part is "+ 81-01-012" are displayed in gray Yes. Of D 3 parts that differ from the corresponding part of the character string candidates 100-2 "-0213" is displayed in the standard display color.

4番目の文字列候補100−4では、1つ上段の文字列候補100−3の対応するパートと一致するAパートとBパートの「+81−01」がグレーで表示されている。文字列候補100−3の対応するパートと相違するCパートおよびそれ以降のDパートの「−112−0123」が標準の表示色で表示されている。 In the fourth string candidate 100-4, "+ 81-01" of A 4 parts and B 4 parts that match one upper corresponding part of the character string candidates 100-3 are displayed in gray. The C 4 parts and later D 4 parts differs from the corresponding part of the character string candidates 100-3 "-112-0123" is displayed in the standard display color.

5番目の文字列候補100−5では、1つ上段の文字列候補100−4の対応するパートと一致するAパートの「+81」がグレーで表示されている。文字列候補100−4の対応するパートと相違するBパートおよびそれ以降のDパートまでの「−00−012−0123」が標準の表示色で表示されている。 In the fifth character string candidate 100-5, "+81" in the A 5 part that matches one upper corresponding part of the character string candidates 100-4 are displayed in gray. String candidates 100-4 to the corresponding B 5 parts different from the parts and later D 5 Part "-00-012-0123" is displayed in the standard display color.

6番目の文字列候補100−6では、1つ上段の文字列候補100−5の対応するパートと一致するAパートとBパートの「+81−00」がグレーで表示されている。文字列候補100−4の対応するパートと相違するCパートおよびそれ以降のDパートの「−011−0123」が標準の表示色で表示されている。 In the sixth character string candidate 100-6, "+ 81-00" of A 6-part and B 6 parts that match one upper corresponding part of the character string candidates 100-5 are displayed in gray. The corresponding C 6 Parts and later D 6 parts different from the part of the character string candidates 100-4 "-011-0123" is displayed in the standard display color.

ユーザは、受付部22に選択指示を行うことで、表示された文字列候補100−1〜100−6の中から自分の音声に一致した正しい文字列候補を選択する。これにより、ユーザが発話した電話番号をカーナビゲーションシステムに入力することができる。   The user instructs the reception unit 22 to select a correct character string candidate that matches his / her voice from the displayed character string candidates 100-1 to 100-6. As a result, the telephone number spoken by the user can be input to the car navigation system.

本実施形態によれば、文字列候補の間の相違部分を表示部16に強調表示させるようにしているので、ユーザは、ある文字列候補において、その1つ上段の文字列候補と異なる相違部分を容易に認識できる。従って、表示された複数の文字列候補の中から正しい文字列候補をユーザに速やかに選択させることができる。   According to this embodiment, since the different part between the character string candidates is highlighted on the display unit 16, the user is different from the one upper character string candidate in a certain character string candidate. Can be easily recognized. Therefore, it is possible to prompt the user to select a correct character string candidate from among the plurality of displayed character string candidates.

また、ユーザが表示部16を直視する時間を短くすることができる。また、カーナビゲーションシステムにおける音声認識を用いた各種検索機能を使いやすくできる。   Moreover, the time for the user to directly view the display unit 16 can be shortened. In addition, various search functions using voice recognition in a car navigation system can be easily used.

以上、実施形態をもとに本発明を説明した。実施形態はあくまでも例示であり、各構成要素や各処理プロセスの組合せにいろいろな変形例が可能なこと、またそうした変形例も本発明の範囲にあることは当業者に理解されるところである。   The present invention has been described above based on the embodiments. The embodiments are merely examples, and it will be understood by those skilled in the art that various modifications can be made to the combination of each component and each processing process, and such modifications are within the scope of the present invention.

例えば、以上の実施形態では、相違部分の表示色より目立たない色で一致部分を表示させることによって相違部分を強調表示させているが、表示制御部20は、図6に示すように、一致部分を表示部16に表示させず、相違部分を標準の表示色で表示部16に表示させてもよい。   For example, in the above embodiment, the difference portion is highlighted by displaying the matching portion in a color that is less conspicuous than the display color of the difference portion. However, as shown in FIG. May be displayed on the display unit 16 in a standard display color instead of being displayed on the display unit 16.

図6は、変形例に係る一致部分が表示されていない文字列候補の表示例である。1番目の文字列候補100−1は、標準の表示色で全体が表示されている。2番目の文字列候補100−2は、相違部分である「−0122」のみが標準の表示色で表示されている。このような表示によっても、相違部分を目立たせることができる。   FIG. 6 is a display example of a character string candidate that does not display a matching part according to the modification. The entire first character string candidate 100-1 is displayed in a standard display color. In the second character string candidate 100-2, only “−0122” which is a different part is displayed in the standard display color. Such a display can also make a different part conspicuous.

また、表示制御部20は、図7に示すように、一致部分を目立たなくさせることに加え、相違部分の表示形態を変更して、相違部分を強調表示させてもよい。   Further, as shown in FIG. 7, the display control unit 20 may change the display form of the different part and highlight the different part in addition to making the matching part inconspicuous.

図7は、変形例に係る相違部分の表示形態が変更された文字列候補の表示例である。相違部分200は、上述した実施形態と同様の標準字体で表示されている。表示制御部20は、相違部分200aの字体を、相違部分200の標準字体よりも太字で表示部16に表示させてもよい。また、表示制御部20は、相違部分200bに下線を付して表示部16に表示させてもよく、相違部分200cを斜体で表示部16に表示させてもよい。また、表示制御部20は、相違部分200dを拡大して表示部16に表示させてもよく、相違部分200eの背景に着色して表示部16に表示させてもよい。   FIG. 7 is a display example of character string candidates in which the display form of the different part according to the modification is changed. The different part 200 is displayed in the same standard font as in the above-described embodiment. The display control unit 20 may display the font of the different portion 200 a on the display unit 16 in bolder than the standard font of the different portion 200. Further, the display control unit 20 may display the different part 200b on the display unit 16 with an underline, or may display the different part 200c on the display unit 16 in italics. The display control unit 20 may enlarge the different part 200d and display it on the display unit 16, or may color the background of the different part 200e and display it on the display unit 16.

この変形例では、相違部分をさらに強調することができる。よって、ユーザは相違部分をより容易に認識できる。   In this modification, the different part can be further emphasized. Therefore, the user can more easily recognize the difference.

1…情報処理装置、10…マイク、12…音声認識部、14…記憶部、16…表示部、18…抽出部、20…表示制御部、22…受付部。 DESCRIPTION OF SYMBOLS 1 ... Information processing apparatus, 10 ... Microphone, 12 ... Voice recognition part, 14 ... Memory | storage part, 16 ... Display part, 18 ... Extraction part, 20 ... Display control part, 22 ... Reception part.

Claims (1)

ユーザの音声を音声認識して、音声認識された前記音声に対応する複数の文字列候補をデータベースから取得する音声認識部と、
前記音声認識部で取得された前記複数の文字列候補を表示する表示部と、
前記音声認識部で取得された前記文字列候補の間の相違部分を抽出する抽出部と、
前記抽出部で抽出された前記相違部分を前記表示部に強調表示させる表示制御部と、
前記表示部に表示された前記複数の文字列候補に対するユーザの選択指示を受け付ける受付部と、
を備えることを特徴とする情報処理装置。
A voice recognition unit that recognizes a user's voice and acquires a plurality of character string candidates corresponding to the voice that has been voice-recognized from a database;
A display unit for displaying the plurality of character string candidates acquired by the voice recognition unit;
An extraction unit that extracts a difference between the character string candidates acquired by the voice recognition unit;
A display control unit that causes the display unit to highlight the difference portion extracted by the extraction unit;
A receiving unit that receives a user's selection instruction for the plurality of character string candidates displayed on the display unit;
An information processing apparatus comprising:
JP2016240669A 2016-12-12 2016-12-12 Information processing equipment Expired - Fee Related JP6724759B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016240669A JP6724759B2 (en) 2016-12-12 2016-12-12 Information processing equipment

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016240669A JP6724759B2 (en) 2016-12-12 2016-12-12 Information processing equipment

Publications (2)

Publication Number Publication Date
JP2018097123A true JP2018097123A (en) 2018-06-21
JP6724759B2 JP6724759B2 (en) 2020-07-15

Family

ID=62632817

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016240669A Expired - Fee Related JP6724759B2 (en) 2016-12-12 2016-12-12 Information processing equipment

Country Status (1)

Country Link
JP (1) JP6724759B2 (en)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04232997A (en) * 1990-12-28 1992-08-21 Sharp Corp System for displaying result of recognition in speech recognition device
JP2010139826A (en) * 2008-12-12 2010-06-24 Toyota Motor Corp Voice recognition system

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04232997A (en) * 1990-12-28 1992-08-21 Sharp Corp System for displaying result of recognition in speech recognition device
JP2010139826A (en) * 2008-12-12 2010-06-24 Toyota Motor Corp Voice recognition system

Also Published As

Publication number Publication date
JP6724759B2 (en) 2020-07-15

Similar Documents

Publication Publication Date Title
US8255216B2 (en) Speech recognition of character sequences
US8706505B1 (en) Voice application finding and user invoking applications related to a single entity
CN109754793B (en) Device and method for recommending functions of vehicle
US10176806B2 (en) Motor vehicle operating device with a correction strategy for voice recognition
CN105222797B (en) Utilize the system and method for oral instruction and the navigation system of partial match search
JP5637131B2 (en) Voice recognition device
US9202459B2 (en) Methods and systems for managing dialog of speech systems
US10741178B2 (en) Method for providing vehicle AI service and device using the same
US20070005358A1 (en) Method for determining a list of hypotheses from a vocabulary of a voice recognition system
JP2014106523A (en) Voice input corresponding device and voice input corresponding program
JP2010139826A (en) Voice recognition system
JP2019128374A (en) Information processing device and information processing method
US9613625B2 (en) Data input device, data input method, storage medium, and in-vehicle apparatus
JP6522009B2 (en) Speech recognition system
JP5902359B2 (en) Method, electronic device and program
JP2007193166A (en) Dialog device, dialog method, and program
JP6100101B2 (en) Candidate selection apparatus and candidate selection method using speech recognition
JP2003509705A (en) Voice recognition method and voice recognition device
JP2018097123A (en) Information processing unit
KR101945190B1 (en) Voice recognition operating system and method
KR100998567B1 (en) Method for speech recognition and apparatus thereof
CN112820294A (en) Voice recognition method, voice recognition device, storage medium and electronic equipment
JP2005114964A (en) Method and processor for speech recognition
KR20080052306A (en) The method and apparatus for recognizing speech for navigation system
JP6351440B2 (en) Speech recognition apparatus and computer program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190118

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20191107

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20191119

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191218

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200526

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200608

R151 Written notification of patent or utility model registration

Ref document number: 6724759

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

LAPS Cancellation because of no payment of annual fees