WO2015059976A1 - 情報処理装置、情報処理方法、及びプログラム - Google Patents
情報処理装置、情報処理方法、及びプログラム Download PDFInfo
- Publication number
- WO2015059976A1 WO2015059976A1 PCT/JP2014/070510 JP2014070510W WO2015059976A1 WO 2015059976 A1 WO2015059976 A1 WO 2015059976A1 JP 2014070510 W JP2014070510 W JP 2014070510W WO 2015059976 A1 WO2015059976 A1 WO 2015059976A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- text
- user
- input
- information processing
- unit
- Prior art date
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 119
- 238000003672 processing method Methods 0.000 title claims abstract description 7
- 238000012217 deletion Methods 0.000 claims description 16
- 230000037430 deletion Effects 0.000 claims description 15
- 238000006243 chemical reaction Methods 0.000 claims description 10
- 230000011218 segmentation Effects 0.000 claims description 8
- 238000004891 communication Methods 0.000 description 43
- 230000006870 function Effects 0.000 description 38
- 238000010586 diagram Methods 0.000 description 24
- 230000000007 visual effect Effects 0.000 description 19
- 238000000034 method Methods 0.000 description 18
- 238000012545 processing Methods 0.000 description 16
- 238000004364 calculation method Methods 0.000 description 14
- 238000012937 correction Methods 0.000 description 11
- 230000008569 process Effects 0.000 description 11
- 238000005516 engineering process Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 230000004397 blinking Effects 0.000 description 3
- 239000004973 liquid crystal related substance Substances 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000004590 computer program Methods 0.000 description 2
- 239000000470 constituent Substances 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000001815 facial effect Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 229910044991 metal oxide Inorganic materials 0.000 description 1
- 150000004706 metal oxides Chemical class 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 238000010079 rubber tapping Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/126—Character encoding
- G06F40/129—Handling non-Latin characters, e.g. kana-to-kanji conversion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/232—Orthographic correction, e.g. spell checking or vowelisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/225—Feedback of the input speech
Definitions
- the present disclosure relates to an information processing apparatus, an information processing method, and a program.
- Patent Document 1 when a corrected character string is input by the user, a corresponding character string that is a character string corresponding to the corrected character string is searched from the input character strings, and the user input
- a technique for replacing a corresponding character string with a modified character string is disclosed.
- the user has to edit the text string.
- the user in order to specify the position of the text to be corrected from the text string, the user needs to move the cursor by one character unit and specify the first character of the text to be corrected. There is a lot of trouble for users.
- the present disclosure proposes a new and improved information processing apparatus, information processing method, and program that allow a user to easily edit an input text string.
- a text division unit that divides an input text string into a plurality of first texts, and an indication position on a display screen on which the text string is displayed
- a text specifying unit for specifying the first text to be selected by the user among the plurality of divided first texts based on an input operation in the moving direction by the user for moving
- an information processing apparatus including a text editing unit that edits the first text that has been input based on input information input by the user.
- an input text string is divided into a plurality of first texts, and instructions on a display screen on which the text string is displayed Specifying a first text to be selected by the user among the plurality of divided first texts based on an input operation in a moving direction by a user for moving the position; A first text is edited by a processor based on input information input by the user.
- An information processing method is provided.
- a computer includes a text segmentation unit that segments an input text string into a plurality of first texts, and the text string is displayed.
- the first text to be selected by the user is specified from among the plurality of divided first texts based on the input operation in the moving direction by the user for moving the indicated position on the displayed screen.
- a program for causing a text specifying unit and a text editing unit to edit the specified first text based on input information input by the user.
- the user can easily edit the input text string.
- the effects described here are not necessarily limited, and may be any of the effects described in the present disclosure.
- 7 is a flowchart showing an operation of “selection / correction processing” in the first operation example.
- 7 is a flowchart showing an operation of “deletion / deformation processing” in the first operation example.
- 7 is a flowchart showing a part of a second operation example according to the embodiment.
- 7 is a flowchart showing a part of a second operation example according to the embodiment.
- 12 is a flowchart showing an operation of “deformation / addition processing” in the second operation example.
- 10 is a flowchart showing an operation of “correction / addition processing” in the second operation example. It is explanatory drawing which showed the basic composition of the information processing system by the 2nd Embodiment of this indication.
- 3 is a functional block diagram showing a configuration of a television receiver 60 according to the same embodiment. It is explanatory drawing which showed an example of the identification method of the gaze direction by the embodiment. 3 is a flowchart showing a part of an operation example according to the embodiment. 3 is a flowchart showing a part of an operation example according to the embodiment.
- a plurality of constituent elements having substantially the same functional configuration may be distinguished by adding different alphabets after the same reference numeral.
- a plurality of configurations having substantially the same functional configuration are distinguished as necessary, such as the display screen 40a and the display screen 40b.
- only the same reference numerals are given.
- the display screen 40 when there is no need to distinguish between the display screen 40a and the display screen 40b, they are simply referred to as the display screen 40.
- FIG. 1 shows an example (text string 50a) in which the text string 50 input by the user is displayed on the display screen 40.
- This text string 50a is an example in which the text string 50a is input exactly as intended by the user.
- FIG. 2 the user tried to input the text string 50a shown in FIG. 1 by voice.
- a text string 50b different from the user's intention is actually input due to a recognition error of voice recognition or the like. This is an example displayed on the display screen 40.
- “drive” is erroneously input as “drove”
- “15” is erroneously input as “50”
- an unnecessary word “umm” is erroneously input. ing.
- the information processing apparatus according to the present disclosure has been created with the above circumstances in mind.
- the information processing apparatus according to the present disclosure allows a user to easily edit an input text string.
- each embodiment of the present disclosure will be described in detail.
- the information processing system according to the first embodiment includes an information processing device 10, a controller 20, and a display device 30.
- the information processing apparatus 10 is an example of an information processing apparatus according to the present disclosure.
- the information processing apparatus 10 can be implemented with software for editing text when using an application such as a memo, e-mail, blog, or a web service.
- the information processing apparatus 10 can have a function of recognizing sound collected by a microphone 202 or the like provided in the controller 20 described later, for example. Furthermore, the information processing apparatus 10 can convert the recognized speech into a text string and then display it on the display screen 40.
- the information processing apparatus 10 may be, for example, a mobile phone such as a smartphone, a PC, a server device, a tablet terminal, a PDA (Personal Digital Assistant), a television receiver, a digital camera, or the like.
- a mobile phone such as a smartphone, a PC, a server device, a tablet terminal, a PDA (Personal Digital Assistant), a television receiver, a digital camera, or the like.
- a mobile phone such as a smartphone, a PC, a server device, a tablet terminal, a PDA (Personal Digital Assistant), a television receiver, a digital camera, or the like.
- the information processing apparatus 10 has a hardware configuration as shown in FIG. 4, for example.
- the information processing apparatus 10 includes a CPU (Central Processing Unit) 150, a ROM (Read Only Memory) 152, a RAM (Random Access Memory) 154, an internal bus 156, an interface 158, an input device 160, and an output.
- the CPU 150 includes, for example, various processing circuits and functions as the control unit 100 that controls the entire information processing apparatus 10.
- the CPU 150 realizes functions of, for example, a voice recognition unit 102, a text classification unit 104, a text specifying unit 106, a text editing unit 108, a display control unit 110, and a text adding unit 112, which will be described later. .
- the ROM 152 stores programs used by the CPU 150, control data such as calculation parameters, and the like.
- the RAM 154 temporarily stores a program executed by the CPU 150, for example.
- the interface 158 connects the input device 160, the output device 162, the storage device 164, and the communication device 166 to the internal bus 156.
- the input device 160 exchanges data with the CPU 150 and the like via the interface 158 and the internal bus 156.
- the input device 160 includes input means for a user to input information such as a touch panel, a button, a microphone, and a switch, and an input control circuit that generates an input signal based on an input by the user and outputs the input signal to the CPU 150. ing.
- the output device 162 is, for example, a liquid crystal display (LCD: Liquid Crystal). Display, OLED (Organic Light Emitting) Diode) devices and display devices such as lamps. This display device displays captured images, generated images, and the like.
- LCD Liquid Crystal
- OLED Organic Light Emitting
- This display device displays captured images, generated images, and the like.
- the output device 162 includes an audio output device such as a speaker. This audio output device converts audio data or the like into audio and outputs it.
- the storage device 164 is a data storage device that stores programs executed by the CPU 150 and various data, for example.
- the storage device 164 includes, for example, a storage medium, a recording device that records data on the storage medium, a reading device that reads data from the storage medium, or a deletion device that deletes data recorded on the storage medium.
- the communication device 166 is a communication interface including a communication device for connecting to a communication network such as a public network or the Internet.
- Communication device 166 may be a wireless LAN compatible communication device, an LTE (Long Term Evolution) compatible communication device, or a wire communication device that performs wired communication.
- the communication device 166 functions as the communication unit 120 described later.
- the hardware configuration of the information processing apparatus 10 is not limited to the configuration described above.
- the information processing apparatus 10 may not include any one or more of the input device 160, the output device 162, and the storage device 164.
- the controller 20 is a device used by the user to edit the text string 50 displayed on the display screen 40.
- FIG. 5 is an explanatory diagram showing an example of the appearance of the controller 20 (controller 20a).
- the controller 20 a includes, for example, a microphone 202, a direction key 212, a determination key 214, a voice input key 216, and a Back key 218.
- the microphone 202 is a device for collecting sound.
- the direction key 212 is a key for the user to move the indicated position displayed on the display screen 40.
- the designated position is a display for indicating a position or range designated by the user, such as a cursor displayed on the display screen 40, for example. In the present specification, the following description will be focused on an example in which the designated position is the position of the cursor displayed on the display screen 40.
- the determination key 214 is a key for the user to determine selection, for example.
- the voice input key 216 is a key for the user to input voice to the microphone 202.
- the Back key 218 is a key for the user to switch the operation screen, the operation mode, and the like, such as returning from the text editing screen displayed on the display screen 40 to the menu screen.
- FIG. 5 shows an example in which the direction key 212 is a key for designating the left / right direction
- the present invention is not limited to this example.
- the direction key 212 may further include a key for designating the up / down direction, or may be a circular key.
- FIG. 6 is an explanatory view showing another example of the appearance of the controller 20 (controller 20b).
- the controller 20 b newly includes a rotation key 220 instead of including the direction key 212 and the determination key 214 as compared with the controller 20 a illustrated in FIG. 5.
- the rotation key 220 is a key having the functions of both the direction key 212 and the enter key 214.
- the rotation key 220 generates a signal indicating that a determination operation has been performed by the user by being pushed in the direction inside the controller 20 b by the user.
- the rotation key 220 generates a signal indicating that an operation for moving the position of the cursor displayed on the display screen 40 has been performed by being rotated, for example, in the vertical direction by the user.
- FIG. 7 is a functional block diagram showing the internal configuration of the controller 20. As illustrated in FIG. 7, the controller 20 includes a communication unit 200, a voice input unit 202, and an operation unit 210.
- the communication unit 200 transmits / receives information to / from a device located in a range in which communication with the controller 20 is possible by wireless communication according to a standard such as bluetooth, for example, by a communication device (not shown) provided in the controller 20.
- the communication unit 200 transmits to the information processing apparatus 10 the designation of the movement direction of the cursor, the voice data received by the voice input unit 202, and the like received by the operation unit 210 described later.
- the voice input unit 202 includes a microphone 202 and the like. For example, when the voice input key 216 is pressed by the user, the voice input unit 202 collects external voice. The user can input the user's voice to the controller 20 through the voice input unit 202.
- the operation unit 210 includes, for example, a direction key 212, a determination key 214, a voice input key 216, a Back key 218, or a rotation key 220.
- the operation unit 210 accepts a user's designation of the direction of movement of the cursor on the display screen 40, input for determining the content displayed on the display screen 40, and the like.
- the display device 30 is a device for displaying the display screen 40.
- the display device 30 includes, for example, a liquid crystal display or an OLED display.
- FIG. 3 shows an example in which the display device 30 is a device having a glasses-type display, but the present invention is not limited to such an example.
- the display device 30 may be an HMD (Head Mounted Display), a television receiver, a wristwatch computer, or a game machine.
- HMD Head Mounted Display
- the information processing system according to the first embodiment is not limited to the configuration described above.
- the output device 162 has the function of the display device 30, the information processing device 10 and the display device 30 may be integrally configured.
- FIG. 8 is a functional block diagram showing the configuration of the information processing apparatus 10. As illustrated in FIG. 8, the information processing apparatus 10 includes a control unit 100 and a communication unit 120.
- the control unit 100 generally controls the operation of the information processing apparatus 10 using hardware such as a CPU 150 and a RAM 154 built in the information processing apparatus 10. As shown in FIG. 8, the control unit 100 includes a voice recognition unit 102, a text classification unit 104, a text identification unit 106, a text editing unit 108, a display control unit 110, and a text addition unit 112.
- the voice recognition unit 102 recognizes voice data received from the controller 20 by the communication unit 120 described later using a voice recognition technique such as a hidden Markov model.
- the voice recognition unit 102 converts the recognized voice into text data.
- the text classifying unit 104 classifies the text string input by the user into a plurality of selection candidate texts.
- the text string is, for example, text data recognized by the voice recognition unit 102.
- the text string may be a character string typed at once by a user, for example, with a keyboard, or a character string recognized by handwritten character recognition.
- the selection candidate text is an example of the first text in the present disclosure.
- the language of the text string is a separately written language such as English, French, or German
- the selection candidate text may be a single word unit or a combination of a plurality of words.
- the language of the text string is a non-separated language such as Japanese, Chinese, or Korean
- it may be a morpheme unit obtained by performing morphological analysis on the text string, It may be a combination (sentence) unit of an adjunct word.
- the selection candidate text may be a character string unit divided by a predetermined number of characters or a sentence unit input by voice.
- FIG. 9 is an explanatory diagram showing an example in which the text string 50 shown in FIG. 2 is divided into a plurality of selection candidate texts by the text sorting unit 104.
- the text classification unit 104 is included in the text string 50 such that the first selection candidate text 52 a is “I” and the second selection candidate text 52 b is “drove”. It is possible to divide the text string 50 into a plurality of selection candidate texts with a blank as a separator.
- the text segmentation unit 104 can also segment the text string into a plurality of selection candidate texts based on the context of the input text string.
- the text classifying unit 104 refers to pre-registered dictionary data and calculates the ease of connection with the previous or subsequent word for each word included in the text string, thereby making one unit in terms of meaning.
- a combination of one or more words to be determined is classified as a selection candidate text.
- the text segmentation unit 104 does not distinguish “your” and “car” in the first sentence into separate selection candidate texts, but one selection candidate “your car”. It can be text.
- the text specifying unit 106 selects a user based on an input operation in the moving direction by the user to move the cursor position on the display screen 40 among the plurality of selection candidate texts classified by the text classifying unit 104.
- the target text (hereinafter also referred to as selected text) is specified.
- the input operation in the moving direction is, for example, a user pressing down the direction key 212 or operating the rotation key 220 on the controller 20.
- FIG. 10 or FIG. 10 or 11 is an explanatory diagram showing an example in which the position of the cursor 42 is moved on the display screen 40 based on a user input operation.
- a user input operation For example, when the user performs a rightward movement operation once, for example, when the user presses the right key 212a shown in FIG. 5, as shown in the middle diagram of FIG.
- the unit 110 moves the position of the cursor 42 from the cursor 42a to the cursor 42b rightward by one selection candidate text.
- the text specifying unit 106 specifies the selection candidate text corresponding to the position of the cursor 42b after movement, that is, “I” as the selected text.
- the display control unit 110 moves the cursor 42b from the cursor 42b as shown in the lower diagram of FIG.
- the position of the cursor 42 is moved to the cursor 42c to the right by one selected text.
- the text specifying unit 106 specifies the selection candidate text corresponding to the position of the cursor 42c after the movement, that is, “drove” as the selected text.
- FIG. 11 is an explanatory diagram showing an example in which the position of the cursor 42 on the display screen 40 is moved leftward by the user.
- the text specifying unit 106 selects the selection candidate text corresponding to the position of the cursor 42b after the movement, In other words, “jam” is specified as the selected text.
- the text specifying unit 106 selects the selection candidate corresponding to the position of the cursor 42c after the movement.
- the text that is, “traffic” is specified as the selected text.
- the user can designate the selection candidate text desired to be corrected by moving the cursor in units of the selection candidate text by designating the moving direction of the cursor by operating the controller 20. it can. Therefore, the user can specify the character string desired to be corrected with little effort.
- the text editing unit 108 edits the selected text specified by the text specifying unit 106 based on input information input by the user.
- the text editing unit 108 can replace the selected text specified by the text specifying unit 106 with the corrected text in the text string.
- the corrected text is an example of the second text in the present disclosure.
- the corrected text may be, for example, text data in which the voice input by the user to the voice input unit 202 of the controller 20 is recognized by the voice recognition unit 102.
- the corrected text may be a character string input by the user via a keyboard, a software keyboard, or the like.
- FIG. 12 is an explanatory diagram showing an example in which the selected text included in the text string displayed on the display screen 40 is replaced with the corrected text based on the user's input operation.
- the text editing unit 108 selects the selected text corresponding to the position of the cursor 42, That is, “50” is replaced with “15”.
- the user designates the selection candidate text desired to be corrected, and then inputs the user's voice to the voice input unit 202, for example. Since it can be corrected to (corrected text), the text string can be easily corrected.
- the text editing unit 108 deletes the selected text specified by the text specifying unit 106 from the text string when deletion instruction information for deleting the text is input by the user. Is possible.
- FIG. 13 is an explanatory diagram illustrating an example in which the selected text included in the text string displayed on the display screen 40 is deleted based on a user input operation.
- the display control unit 110 displays the function selection image 44 on the display screen 40.
- This function selection image 44 is an image for the user to select the edited content of the selected text.
- the text editing unit 108 selects the selected text corresponding to the position of the cursor 42b, that is, “ Delete “umm” from the text string.
- the display control unit 110 It is possible to display on the display screen 40 a display that highlights the selected text, such as a horizontal line, on the selected text (“umm”) corresponding to the position of the cursor 42b. According to this display example, the user can surely recognize that the selected text is deleted if the determination operation is performed before the “delete” function is confirmed. For this reason, it is possible to greatly reduce human errors such that the user accidentally deletes the selected text.
- the text editing unit 108 is a text specifying unit. It is possible to replace the selected text identified by 106 with text that is simplified from the selected text.
- simplification of the selected text means, for example, that the selected text is converted from the past tense or the past participle form to the present tense when the selected text is a verb. Further, when the selected text is a noun, the selected text is converted from the plural form to the singular form.
- FIG. 14 is an explanatory diagram showing an example in which the selected text included in the text string displayed on the display screen 40 is converted into the original form of the selected text based on the user's input operation.
- the “deformation” function is selected by the user in the function selection image 44 displayed on the display screen 40, as shown in the lower diagram of FIG.
- the unit 108 replaces the selection candidate text corresponding to the position of the cursor 42, that is, “drove” with “drive” that is the original form of “drove”.
- the text editing unit 108 includes the text specifying unit 106. It is possible to replace the selected text specified by the text with the text converted from the selected text into hiragana.
- the display control unit 110 displays various display images, a text string input by the user, and the like on the display screen 40. For example, as illustrated in FIG. 15, when the cursor is positioned at the end of the text string and a predetermined operation such as a determination operation is performed, the display control unit 110 displays the symbol selection image on the display screen 40. To display.
- the symbol selection image is an example of a selection image in the present disclosure, and is an image for the user to select one or more symbols.
- the text adding unit 112 adds the second text string to the end of the text string based on the user's input operation.
- the second text string is, for example, a symbol selected by the user in the symbol selection image displayed on the display screen 40.
- the second text string may be text data recognized by the voice recognition unit 102 or a character string input via a keyboard, software keyboard, or the like.
- FIG. 15 is an explanatory diagram illustrating an example in which a symbol is added to the end of the text string displayed on the display screen 40 based on a user input operation.
- the display control unit 110 displays the symbol The selected image is displayed on the display screen 40.
- the text adding unit 112 adds the selected symbol to the end of the text string.
- “!” Is selected by the user and added to the end of the text string.
- the user selects a desired character from the symbol selection image even if the character (or character string) is difficult to recognize by voice recognition, such as “!” Or “?”.
- the selected character can be easily added to the text string.
- the user adds a “?” To the end of the sentence to make it a question sentence. This is a great advantage because the reader can be surely understood this.
- FIG. 16 is an explanatory diagram showing an example in which text data is added to the end of the text string displayed on the display screen 40 based on the user's voice input.
- the voice recognition unit 102 first recognizes the newly input voice. To do.
- the text adding unit 112 adds the text string recognized by the voice recognition unit 102 to the end of the text string displayed on the display screen 40.
- “I'll text you as soon as In this example, the text string “I get there” is input by voice by the user and added to the end of the text string displayed on the display screen 40.
- the communication unit 120 transmits and receives information to and from various devices that can communicate with the information processing device 10 by, for example, wireless communication.
- the communication unit 120 receives, from the controller 20, information indicating designation of the movement direction of the cursor input by the user, audio data input to the audio input unit 202, and the like.
- the configuration of the information processing apparatus 10 according to the first embodiment is not limited to the configuration described above.
- the communication unit 120 may not be included in the information processing apparatus 10 but may be provided in another apparatus.
- FIG. 17 is a flowchart showing an overall operation according to the operation example 1. As shown in FIG. 17, first, the user presses the voice input key 216 of the controller 20 (S101).
- the user inputs voice to the voice input unit 202.
- the communication part 200 transmits the input audio
- the voice recognition unit 102 of the information processing apparatus 10 recognizes the voice data received from the controller 20 by voice recognition technology. Then, the text classification unit 104 classifies the text string recognized by the voice recognition unit 102 into a plurality of selection candidate texts (S103).
- the display control unit 110 causes the communication unit 120 to transmit control information for displaying the text string recognized by the voice recognition unit 102 on the display screen 40 to the display device 30. Then, the display device 30 displays a text string on the display screen 40 based on the control information received from the information processing device 10 (S104).
- control unit 100 monitors the reception status by the communication unit 120, and determines whether or not the voice input key 216 is newly pressed by the user (S105). If it is determined that the voice input key 216 has been pressed (S105: Yes), the information processing apparatus 10 performs the operation of S102 again.
- the control unit 100 determines whether or not the user has performed a moving operation in the left-right direction such as pressing the direction key 212, for example. Is determined (S106). If it is determined that the movement operation in the left-right direction has been performed (S106: Yes), the information processing apparatus 10 performs a “selection / correction process” described later (S107). Then, the information processing apparatus 10 performs the operation of S106 again.
- the control unit 100 determines whether or not the determination key 214 has been pressed by the user (S108). If it is determined that the enter key 214 has been pressed (S108: Yes), the text editing unit 108 determines the text string input by the user (S109). Then, the information processing apparatus 10 ends the process.
- the display control unit 110 of the information processing apparatus 10 moves the cursor by one selection candidate text based on the designation of the movement direction of the cursor input by the user (S111). ).
- control unit 100 monitors the reception status by the communication unit 120, and determines whether or not the movement operation in the left-right direction has been performed again by the user (S112). If it is determined that the left / right movement operation has been performed again (S112: Yes), the information processing apparatus 10 performs the operation of S111 again.
- control unit 100 determines whether or not the voice input key 216 has been newly pressed by the user (S113). .
- the display control unit 110 displays a message for allowing the user to input voice on the display screen 40. Then, the user inputs a voice to the voice input unit 202 (S114).
- the voice recognition unit 102 recognizes the voice data received from the controller 20 by voice recognition technology (S115).
- the control unit 100 determines whether or not the cursor is positioned at the end of the text string (S116).
- the text adding unit 112 adds the text data recognized by the voice recognition unit 102 as the second text string to the end of the text string. (S117).
- the text editing unit 108 uses the text data recognized by the voice recognition unit 102 as the corrected text, and the cursor The selection candidate text corresponding to the position is replaced with the corrected text in the text string (S118).
- the control unit 100 determines whether or not the determination key 214 has been newly pressed by the user (S119). . When it is determined that the enter key 214 has not been pressed (S119: No), the control unit 100 performs the operation of S112 again.
- the control unit 100 determines whether or not the cursor is positioned at the end of the text string (S120).
- the display control unit 110 displays the symbol selection image on the display screen 40 (S121). Subsequently, the user selects a symbol desired to be added at the cursor position, that is, at the end of the text string, from the symbol selection image (S122). Then, the text adding unit 112 adds the symbol selected in S122 to the end of the text string (S123).
- the information processing apparatus 10 performs a “deletion / deformation process” described later (S124).
- the display control unit 110 of the information processing apparatus 10 displays a function selection image on the display screen 40 (S131).
- the text editing unit 108 deletes the selection candidate text corresponding to the cursor position from the text string (S133).
- the text editing unit 108 selects the selection candidate text corresponding to the cursor position, for example, the selection
- the candidate text is simplified by replacing it with text converted to the original form (S135).
- the information processing apparatus 10 ends the “deletion / deformation process” operation.
- the operation example 1 has been described above. According to this operation example 1, since the function selection image is displayed in the “deletion / deformation process”, the user explicitly selects the editing content of the text string such as deletion or simplification in the function selection image. It is possible to prevent mistakes in editing contents.
- FIG. 20 is a flowchart showing a part of the entire operation according to the operation example 2. Note that the operations of S201 to S204 shown in FIG. 20 are the same as the operations of S101 to S104 in Operation Example 1. Therefore, the description is omitted here.
- the control unit 100 of the information processing apparatus 10 monitors the reception status of the communication unit 120, and determines whether or not the user has performed a moving operation in the left-right direction (S205). ). If it is determined that the left / right movement operation has been performed (S205: Yes), the display control unit 110 moves the cursor by one selection candidate text based on the designation of the movement direction input by the user. (S206). Then, the information processing apparatus 10 performs the operation of S205 again.
- the control unit 100 determines whether or not the user has long-tapped the enter key 214 (S207). If it is determined that the decision key 214 has been long tapped (S207: Yes), the information processing apparatus 10 performs an operation of “deformation / addition processing” described later (S208). Then, the information processing apparatus 10 performs the operation of S205 again.
- control unit 100 determines whether or not the cursor is positioned at the end of the text string. (S210).
- the text editing unit 108 determines the text string input by the user (S211). Then, the information processing apparatus 10 ends the process.
- the text editing unit 108 deletes the selection candidate text corresponding to the cursor position from the text string (S212). . Then, the information processing apparatus 10 performs the operation of S205 again.
- the control unit 100 determines whether or not the voice input key 216 is pressed by the user (S213). If it is determined that the voice input key 216 has been pressed (S213: Yes), the information processing apparatus 10 performs an operation of “correction / addition processing” to be described later (S214). On the other hand, when it is determined that the voice input key 216 has not been pressed (S213: No), the information processing apparatus 10 performs the operation of S205 again.
- the control unit 100 of the information processing apparatus 10 determines whether or not the cursor is positioned at the end of the text string (S221). If the cursor is positioned at the end of the text string (S221: Yes), the information processing apparatus 10 performs the operations of S222 to S224. Note that the operations in S222 to S224 are the same as the operations in S121 to S123 in Operation Example 1.
- the text editing unit 108 selects the selection candidate text corresponding to the cursor position, as in S135 in the operation example 1.
- the operation example 2 has been described above.
- the user can select the edit contents of the text string depending on whether the user long taps or taps the enter key 214. For this reason, the user can edit the text string by a more intuitive operation (compared to the operation example 1).
- the process is switched to “transformation / addition processing” for overwriting correction or simplification of the text string, triggered by the user tapping the enter key 214 for a long time. For this reason, there is an advantage that the user can more easily understand which processing state is in the middle of editing.
- the information processing apparatus 10 As described above, for example, as described with reference to FIGS. 8 and 17 to 23, the information processing apparatus 10 according to the first embodiment first divides the input text string into a plurality of selection candidate texts. Then, the information processing apparatus 10 selects a selection candidate text that is a user's selection target from among the plurality of classified selection candidate texts based on an input operation in the moving direction by the user for moving the cursor on the display screen. Is identified. Then, the information processing apparatus 10 edits the identified selection candidate text based on input information input by the user. Therefore, the user can easily edit the input text string.
- the user can move the cursor in units of a selection candidate text, that is, in a grammatically or semantically grouped character string by designating the moving direction of the cursor by operating the controller 20. Can specify the position of the text to be corrected with little effort. Further, after the user selects the text to be corrected, for example, the user presses the voice input key 216 of the controller 20 and inputs the user's voice to the voice input unit 202, thereby selecting the selection candidate text. Can be overwritten and corrected to a desired character string. In this way, the user can edit the text to be corrected by a simple operation.
- the controller 20 can be realized by a simple device including only the direction key 212, the determination key 214, and the voice input key 216 as operation keys. Therefore, the user can easily perform a desired operation without wondering which operation key to press, for example. Further, the controller 20 can be configured in a small size and at a low cost.
- the first embodiment has been described above.
- the user can input, for example, designation of the movement direction of the cursor and determination of various editing contents by operating the controller 20.
- the user can perform these inputs in a hands-free manner without using the controller 20.
- the information processing system according to the second embodiment includes a television receiver 60 and a camera 70.
- the television receiver 60 is an example of an information processing apparatus according to the present disclosure.
- the television receiver 60 is a device that can display the display screen 40.
- the television receiver 60 can be implemented with software for editing text, as with the information processing apparatus 10 according to the first embodiment.
- the television receiver 60 can have a function of collecting sound by the input device 160 provided in the television receiver 60 and recognizing the collected sound.
- the television receiver 60 has a hardware configuration substantially similar to that of the information processing apparatus 10 according to the first embodiment shown in FIG. However, the configuration is not limited thereto, and for example, the television receiver 60 may not include the storage device 164.
- the camera 70 converts external images through a lens, for example, a CCD (Charge Coupled Device) or a CMOS (Complementary Metal Oxide). (Semiconductor) and the like to form a still image or a moving image.
- a lens for example, a CCD (Charge Coupled Device) or a CMOS (Complementary Metal Oxide). (Semiconductor) and the like to form a still image or a moving image.
- the camera 70 captures an image of a user or object located in front of the lens.
- the camera 70 can transmit the captured image to the television receiver 60 by wired communication or wireless communication.
- the information processing system according to the second embodiment is not limited to the configuration described above.
- the television receiver 60 and the camera 70 may be integrally configured such that the television receiver 60 includes the camera 70 therein.
- FIG. 25 is a functional block diagram showing the configuration of the television receiver 60.
- the television receiver 60 includes a control unit 100, a communication unit 120, an audio input / output unit 122, and a display unit 124.
- the functions of the speech recognition unit 102, the text classification unit 104, the text editing unit 108, the display control unit 110, and the text addition unit 112 are substantially the same as those in the first embodiment.
- control unit 100 The control unit 100 according to the second embodiment newly includes a line-of-sight direction specifying unit 114 and a visual position calculation unit 116, as compared with the first embodiment.
- the other functions of the control unit 100 are substantially the same as those in the first embodiment.
- the text specifying unit 106 selects a selected text from a plurality of selection candidate texts classified by the text classifying unit 104 based on the movement of the user's gaze direction specified by the gaze direction specifying unit 114 described later. Is identified. For example, the text specifying unit 106 specifies the selection candidate text that is calculated by the visual position calculation unit 116 described later and is located at the visual position of the user on the display screen 40 as the selected text.
- the line-of-sight direction specifying unit 114 can specify the position of the user's eyes based on the image taken by the camera 70. For example, the line-of-sight direction specifying unit 114 first detects a user's face by extracting feature points such as eyes, nose, or facial contours from an image captured by the camera 70. The line-of-sight direction specifying unit 114 then determines the relative position from the camera 70 to the user's eyes based on, for example, the detected distance between the user's eyes or the size of the user's face. Is calculated.
- the line-of-sight direction specifying unit 114 can specify the line-of-sight direction of the user based on the image captured by the camera 70.
- the line-of-sight direction specifying unit 114 specifies the line-of-sight direction of the user by performing pattern matching on the image of the user's eyes detected from the image captured by the camera 70.
- dictionary learning for pattern matching is created by performing machine learning using a captured image of the entire eyes of a plurality of people associated with the line-of-sight direction by an image processing apparatus. Then, the line-of-sight direction specifying unit 114 compares the feature amount related to the user's eyes detected from the image captured by the camera 70 with the above dictionary data to determine which direction the user's line-of-sight direction is. Is identified.
- the above-described image processing apparatus may be the television receiver 60 or a different apparatus.
- the visual position calculation unit 116 calculates the visual position of the user on the display screen 40 based on the position of the user's eyes specified by the visual line direction specifying unit 114 and the visual direction of the user.
- the viewing position is, for example, the position that the user is viewing on the display screen 40, such as the position of the point of coordinates (a, b) shown in FIG. 26, or an area near the viewing position. .
- the visual position calculation unit 116 includes a half line extending from the user's eye position (x, y, z) to the user's line-of-sight direction V (vx, vy, vz). The position of the intersection with the display screen 40 is calculated as the visual position.
- the communication unit 120 transmits and receives information to and from various devices that can communicate with the television receiver 60.
- the communication unit 120 receives an image captured by the camera 70 from the camera 70.
- the voice input / output unit 122 includes a voice input device such as a microphone and a voice output device such as a speaker.
- the audio input / output unit 122 collects external audio or converts audio data generated by the television receiver 60 into audio and outputs the audio.
- the display unit 124 displays, for example, a text string input by the user on the display screen 40 based on control by the display control unit 110.
- the configuration of the television receiver 60 according to the second embodiment is not limited to the configuration described above.
- the communication unit 120 is not included in the television receiver 60 and may be provided in another device. Further, when the television receiver 60 and the camera 70 are integrally configured, the television receiver 60 may not include the communication unit 120.
- FIG. 27 is a flowchart showing a part of the overall operation according to the second embodiment.
- the line-of-sight direction specifying unit 114 of the television receiver 60 specifies the position of the user's eyes and the line-of-sight direction of the user based on the image captured by the camera 70.
- the visual position calculation unit 116 calculates the visual position of the user on the display screen 40 based on the position of the user's eyes specified by the visual line direction specifying unit 114 and the visual line direction of the user.
- the control unit 100 monitors whether or not the operation of the user looking at the microphone icon displayed on the display screen 40 has continued for a predetermined time or more (S301).
- the display control unit 110 displays a message for allowing the user to input voice on the display screen 40. Then, the user inputs voice to the voice input / output unit 122 (S302).
- the voice recognition unit 102 recognizes the voice data received by the voice input / output unit 122 by voice recognition technology. Then, the text classifying unit 104 classifies the text string recognized by the voice recognition unit 102 into a plurality of selection candidate texts (S303).
- the display control unit 110 displays the text string recognized by the voice recognition unit 102 on the display screen 40 (S304).
- the line-of-sight direction specifying unit 114 determines whether or not the user is performing a blinking operation based on the image taken by the camera 70. Then, based on the determination result by the line-of-sight direction specifying unit 114, the control unit 100 monitors whether the user's blinking operation has continued for a predetermined time or more (S305).
- the control unit 100 determines whether any of the plurality of selection candidate texts is in a selected state (S306). In the initial state, it is assumed that no selection candidate text has been selected.
- the control unit 100 determines whether or not the operation of looking at a specific position on the display screen 40 has continued for a predetermined time or more based on the calculation result by the visual position calculation unit 116. Is monitored (S307). When the operation of looking at a specific position continues for a predetermined time or longer (S307: Yes), the text specifying unit 106 selects a selection candidate text corresponding to the position where the user is looking. When the user is looking at the end of the text string, the end of the text string is selected.
- the display control unit 110 causes the display screen 40 to display a cursor at a selection candidate text or sentence end position (hereinafter also referred to as a selection position) in a selected state (S308). Thereafter, the television receiver 60 performs the operation of S306 again.
- control unit 100 visually checks the user based on the calculation result by the visual position calculation unit 116. Changes in position are monitored (S309, S311, and S315).
- the control unit 100 determines whether the selected position is the end of the sentence (S312).
- the text editing unit 108 determines the text string input by the user (S313). Then, the information processing apparatus 10 ends the process.
- the text editing unit 108 deletes the selected candidate text being selected from the text string (S314). Then, the information processing apparatus 10 performs the operation of S306 again.
- the television receiver 60 includes a plurality of selection candidate texts divided from the input text string.
- the selection candidate text that is the user's selection target is specified based on the movement of the user's line of sight.
- the television receiver 60 edits the identified selection candidate text based on the movement of the line of sight of the user or the voice of the user. For this reason, the user can perform all selection and editing of the text without using the controller 20 in a hands-free manner. Further, for example, since it is not necessary to continue to hold the controller 20, the user's workload during text editing is smaller.
- the television receiver 60 deletes the selected text when the user looks at the microphone icon for a predetermined time or more, for example, or when the user looks at the selected position for a predetermined time or longer. To do. As described above, since the process is switched on the condition of the position in the display screen 40 and the passage of time, the user can operate as intended only by moving the line of sight.
- each key included in the controller 20 can be configured as software that realizes the function of each key instead of hardware.
- the information processing apparatus 10 according to the first embodiment is an apparatus having a touch panel such as a smartphone, for example, the information processing apparatus 10 and the controller 20 are integrated by further mounting the above software. Can be configured.
- a computer program for causing hardware such as the CPU 150, the ROM 152, and the RAM 154 to perform the same functions as the components of the information processing apparatus 10 or the television receiver 60 described above. can also be provided.
- a recording medium on which the computer program is recorded is also provided.
- a text segmentation unit for segmenting the input text string into a plurality of first texts; Based on the input operation in the moving direction by the user for moving the indicated position on the display screen on which the text string is displayed, the selection target of the user among the plurality of first texts divided.
- a text specifying part for specifying the first text;
- a text editing unit for editing the identified first text based on input information input by the user;
- An information processing apparatus comprising: (2) The input information input by the user includes a second text input by the user, When the second text is input by the user, the text editing unit replaces the first text specified by the text specifying unit with the second text in the text string.
- the information processing apparatus wherein the second text includes text specified by voice recognition of a voice uttered by the user.
- the input information input by the user includes deletion instruction information for deleting text, The text editing unit deletes the first text specified by the text specifying unit from the text string when the deletion instruction information is input by the user, (1) to (3) The information processing apparatus according to any one of the above.
- the input information input by the user includes conversion instruction information for converting a word into an original form, When the conversion instruction information is input by the user, the text editing unit replaces the first text specified by the text specifying unit with a text obtained by converting the first text into an original form.
- the information processing apparatus according to any one of (1) to (4), wherein: (6)
- the input information input by the user includes conversion instruction information for converting kanji into hiragana
- the text editing unit replaces the first text specified by the text specifying unit with text obtained by converting the first text into hiragana.
- the information processing apparatus according to any one of (1) to (4), wherein: (7)
- the information processing apparatus according to any one of (1) to (6), wherein the input text string includes a text string specified by voice recognition of a voice uttered by the user. .
- the information processing apparatus further includes a text adding unit that adds a second text string to the end of the text string when the designated position is located at the end of the text string and a predetermined operation is performed.
- the information processing apparatus according to any one of (1) to (6).
- the information processing apparatus further includes a display control unit configured to display a selection image for the user to select one or more symbols on the display screen when the predetermined operation is performed,
- the information processing apparatus according to (8), wherein the text adding unit adds one or more symbols selected by the user in the selected image as the second text string to the end of the text string.
- the text adding unit adds, as the second text string, a text string specified by voice recognition of a voice uttered by the user as the second text string, according to (8).
- the information processing apparatus (11) The information processing apparatus according to any one of (1) to (10), wherein the text classification unit divides the text string into a plurality of first texts based on a context of the text string. (12) The information processing apparatus according to any one of (1) to (11), wherein the first text includes one or more words. (13) The input operation of the moving direction by the user includes the selection operation of the direction key for moving the designated position on the display screen by the user, according to any one of (1) to (12). The information processing apparatus described. (14) The information processing apparatus further includes a gaze direction identifying unit that identifies the gaze direction of the user, The information processing apparatus according to any one of (1) to (13), wherein the input operation in the movement direction by the user includes a movement in the viewing direction by the user.
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- User Interface Of Digital Computer (AREA)
- Document Processing Apparatus (AREA)
Abstract
Description
1.背景
2.実施形態の詳細な説明
2-1.第1の実施形態
2-2.第2の実施形態
3.変形例
本開示は、一例として「2.実施形態の詳細な説明」において詳細に説明するように、多様な形態で実施され得る。最初に、本開示の特徴を明確に示すために、本開示による情報処理装置を創作するに至った背景について説明する。
<2-1.第1の実施形態>
(2-1-1.基本構成)
次に、第1の実施形態について説明する。まず、第1の実施形態による情報処理システムの基本構成について図3を参照して説明する。図3に示したように、第1の実施形態による情報処理システムは、情報処理装置10、コントローラー20、および表示装置30を含む。
情報処理装置10は、本開示による情報処理装置の一例である。情報処理装置10は、例えばメモ、電子メール、ブログなどのアプリケーションまたはWebサービスの利用時において、テキストを編集するためのソフトウェアを実装することが可能である。
CPU150は、例えば各種処理回路などで構成され、情報処理装置10全体を制御する制御部100として機能する。また、CPU150は、情報処理装置10において、例えば、後述する音声認識部102、テキスト区分部104、テキスト特定部106、テキスト編集部108、表示制御部110、およびテキスト追加部112の機能を実現する。
ROM152は、CPU150が使用するプログラムや演算パラメータなどの制御用データなどを記憶する。
RAM154は、例えば、CPU150により実行されるプログラムなどを一時的に記憶する。
インターフェース158は、入力装置160、出力装置162、ストレージ装置164、および通信装置166を、内部バス156と接続する。例えば入力装置160は、このインターフェース158および内部バス156を介して、CPU150などとの間でデータをやり取りする。
入力装置160は、例えばタッチパネル、ボタン、マイクロフォン、およびスイッチなどユーザが情報を入力するための入力手段と、ユーザによる入力に基づいて入力信号を生成し、CPU150に出力する入力制御回路などから構成されている。
出力装置162は、例えば、液晶ディスプレイ(LCD:Liquid Crystal
Display)装置、OLED(Organic Light Emitting
Diode)装置およびランプなどの表示装置を含む。この表示装置は、撮像された画像や生成された画像などを表示する。
ストレージ装置164は、例えばCPU150が実行するプログラムや各種データを格納する、データ格納用の装置である。ストレージ装置164は、例えば、記憶媒体、記憶媒体にデータを記録する記録装置、記憶媒体からデータを読み出す読出し装置、または記憶媒体に記録されたデータを削除する削除装置などを含む。
通信装置166は、例えば公衆網やインターネットなどの通信網に接続するための通信デバイス等で構成された通信インターフェースである。また、通信装置166は、無線LAN対応通信装置、LTE(Long Term Evolution)対応通信装置、または有線による通信を行うワイヤー通信装置であってもよい。通信装置166は、例えば、後述する通信部120として機能する。
‐基本構成‐
コントローラー20は、表示画面40に表示されたテキスト列50を利用者が編集するために利用する装置である。図5は、コントローラー20の外観の一例(コントローラー20a)を示した説明図である。図5に示したように、コントローラー20aは、例えば、マイクロフォン202、方向キー212、決定キー214、音声入力キー216、および、Backキー218を含む。ここで、マイクロフォン202は、音声を集音するための機器である。また、方向キー212は、表示画面40に表示される指示位置を利用者が移動させるためのキーである。なお、指示位置とは、例えば、表示画面40に表示されるカーソルなど、利用者により指定されている位置または範囲を示すための表示である。本明細書では、以後、指示位置が、表示画面40に表示されるカーソルの位置である例を中心として説明を行う。
また、図7は、コントローラー20の内部構成を示した機能ブロック図である。図7に示したように、コントローラー20は、通信部200、音声入力部202、および操作部210を有する。
表示装置30は、表示画面40を表示するための装置である。表示装置30は、例えば、液晶ディスプレイ、またはOLEDディスプレイを有する。なお、図3では、表示装置30がメガネ型のディスプレイを有する装置である例を示しているが、かかる例に限定されない。例えば、表示装置30は、HMD(Head Mounted Display)、テレビジョン受像機、腕時計型コンピュータ、またはゲーム機などであってもよい。
以上、第1の実施形態による情報処理システムの基本構成について説明した。続いて、第1の実施形態による情報処理装置10の構成について詳細に説明する。図8は、情報処理装置10の構成を示した機能ブロック図である。図8に示したように、情報処理装置10は、制御部100、および通信部120を有する。
制御部100は、情報処理装置10に内蔵されるCPU150、RAM154などのハードウェアを用いて、情報処理装置10の動作を全般的に制御する。また、図8に示したように、制御部100は、音声認識部102、テキスト区分部104、テキスト特定部106、テキスト編集部108、表示制御部110、およびテキスト追加部112を有する。
音声認識部102は、後述する通信部120によりコントローラー20から受信された音声データを、例えば隠れマルコフモデルなどの音声認識技術を用いて認識する。また、音声認識部102は、認識した音声をテキストデータに変換する。
テキスト区分部104は、利用者により入力されたテキスト列を複数の選択候補テキストに区分する。ここで、テキスト列は、例えば、音声認識部102により認識されたテキストデータである。あるいは、テキスト列は、利用者により例えばキーボードにより一気にタイピングされた文字列であったり、手書き文字認識により認識された文字列などであってもよい。
テキスト特定部106は、テキスト区分部104により区分された複数の選択候補テキストのうち、表示画面40におけるカーソルの位置を移動させるための利用者による移動方向の入力操作に基づいて、利用者の選択対象であるテキスト(以下、選択テキストとも称する)を特定する。ここで、移動方向の入力操作は、例えば、利用者による、コントローラー20における方向キー212の押下や、回転キー220の操作などである。
テキスト編集部108は、テキスト特定部106により特定された選択テキストを、利用者により入力される入力情報に基づいて編集する。
例えば、テキスト編集部108は、利用者により修正テキストが入力された場合には、テキスト特定部106により特定された選択テキストを、テキスト列において修正テキストに置換することが可能である。ここで、修正テキストは、本開示における第2のテキストの一例である。なお、修正テキストは、例えば、コントローラー20の音声入力部202に対して利用者により入力された音声が、音声認識部102により認識されたテキストデータであってもよい。あるいは、修正テキストは、キーボードやソフトウェアキーボードなどを介して、利用者により入力された文字列であってもよい。
また、編集例2として、テキスト編集部108は、テキストを削除するための削除指示情報が利用者により入力された場合には、テキスト特定部106により特定された選択テキストをテキスト列から削除することが可能である。
また、編集例3として、例えばテキスト列の言語が英語であり、かつ、単語を原形に変換するための変換指示情報が利用者により入力された場合には、テキスト編集部108は、テキスト特定部106により特定された選択テキストを、当該選択テキストが単純化されたテキストに置換することが可能である。ここで、選択テキストの単純化とは、例えば、選択テキストが動詞である場合には、選択テキストを例えば過去形や過去分詞形から、現在形に変換することである。また、選択テキストが名詞である場合には、選択テキストを複数形から単数形に変換することである。
表示制御部110は、各種表示画像や、利用者により入力されたテキスト列などを表示画面40に表示させる。例えば、図15に示したように、カーソルがテキスト列の末尾に位置し、かつ、例えば決定操作などの所定の操作がなされた場合には、表示制御部110は、記号選択画像を表示画面40に表示させる。なお、記号選択画像は、本開示における選択画像の一例であり、1以上の記号を利用者が選ぶための画像である。
テキスト追加部112は、利用者の入力操作に基づいて、テキスト列の末尾に第2のテキスト列を追加する。ここで、第2のテキスト列は、例えば、表示画面40に表示された記号選択画像において利用者により選択された記号である。または、第2のテキスト列は、音声認識部102により認識されたテキストデータであったり、キーボードやソフトウェアキーボードなどを介して入力された文字列であってもよい。
I get there」というテキスト列が利用者により音声入力され、そして、表示画面40に表示されたテキスト列の末尾に追加される例を示している。
通信部120は、例えば無線通信により、情報処理装置10と通信可能な各種装置との間で情報を送受信する。例えば、通信部120は、利用者により入力されたカーソルの移動方向の指定を示す情報や、音声入力部202に対して入力された音声データなどをコントローラー20から受信する。
以上、第1の実施形態による構成について説明した。続いて、第1の実施形態による動作について説明する。ここでは、「動作例1」および「動作例2」の2つの動作例について説明する。なお、「動作例1」、「動作例2」ともに、利用者が音声認識によりテキストを入力し、そして、認識されたテキストを修正する場面における動作の例である。
‐全体的な動作‐
最初に、動作例1について説明する。図17は、動作例1による全体的な動作を示したフローチャートである。図17に示したように、まず、利用者は、コントローラー20の音声入力キー216を押下する(S101)。
次に、図18を参照して、S107における「選択・修正処理」の動作について詳細に説明する。図18に示したように、まず、情報処理装置10の表示制御部110は、利用者により入力されたカーソルの移動方向の指定に基づいて、選択候補テキスト1個分だけカーソルを移動させる(S111)。
次に、図19を参照して、S124における「削除・変形処理」の動作について詳細に説明する。図19に示したように、まず、情報処理装置10の表示制御部110は、機能選択画像を表示画面40に表示させる(S131)。
‐全体的な動作‐
次に、動作例2について説明する。図20は、動作例2による全体的な動作の一部を示したフローチャートである。なお、図20に示したS201~S204の動作は、動作例1におけるS101~S104の動作と同様である。従って、ここでは説明を省略する。
次に、図22を参照して、S208における「変形・追加処理」の動作について詳細に説明する。図22に示したように、まず、情報処理装置10の制御部100は、カーソルがテキスト列の文末に位置しているか否かを判断する(S221)。カーソルがテキスト列の文末に位置している場合には(S221:Yes)、情報処理装置10は、S222~S224の動作を行う。なお、S222~S224の動作は、動作例1におけるS121~S123の動作と同様である。
次に、図23を参照して、S214における「修正・追加処理」の動作について詳細に説明する。なお、図23に示したS231~S235の動作は、動作例1におけるS114~S118の動作と同様である。従って、ここでは説明を省略する。
以上、例えば図8、図17~図23等を参照して説明したように、第1の実施形態による情報処理装置10は、まず、入力されたテキスト列を複数の選択候補テキストに区分する。そして、情報処理装置10は、表示画面におけるカーソルを移動させるための利用者による移動方向の入力操作に基づいて、区分された複数の選択候補テキストのうち、利用者の選択対象である選択候補テキストを特定する。そして、情報処理装置10は、特定された選択候補テキストを、利用者により入力される入力情報に基づいて編集する。このため、入力されたテキスト列を利用者が容易に編集することができる。
以上、第1の実施形態について説明した。上述したように、第1の実施形態では、利用者は、コントローラー20の操作により、例えばカーソルの移動方向の指定や、各種編集内容の決定などの入力を行うことができる。後述するように、第2の実施形態によれば、利用者は、コントローラー20を用いることなく、これらの入力をハンドフリーで行うことができる。
まず、第2の実施形態による情報処理システムの基本構成について図24を参照して説明する。図24に示したように、第2の実施形態による情報処理システムは、テレビジョン受像機60、およびカメラ70を含む。
テレビジョン受像機60は、本開示における情報処理装置の一例である。テレビジョン受像機60は、表示画面40を表示することが可能な装置である。また、テレビジョン受像機60は、第1の実施形態による情報処理装置10と同様に、テキストを編集するためのソフトウェアを実装することが可能である。また、テレビジョン受像機60は、テレビジョン受像機60に備えられた入力装置160により音声を集音し、そして、集音された音声を認識する機能を有することが可能である。
カメラ70は、外部の映像を、レンズを通して例えばCCD(Charge Coupled Device)やCMOS(Complementary Metal Oxide
Semiconductor)などの撮像素子に結像させ、静止画像又は動画像を撮影する機能を有する。例えば、カメラ70は、レンズの前方に位置する利用者や物体の画像を撮影する。
以上、第2の実施形態による情報処理システムの基本構成について説明した。続いて、第2の実施形態によるテレビジョン受像機60の構成について詳細に説明する。図25は、テレビジョン受像機60の構成を示した機能ブロック図である。図25に示したように、テレビジョン受像機60は、制御部100、通信部120、音声入出力部122、および表示部124を有する。なお、音声認識部102、テキスト区分部104、テキスト編集部108、表示制御部110、およびテキスト追加部112の機能は、それぞれ第1の実施形態と概略同様である。
第2の実施形態による制御部100は、第1の実施形態と比較して、新たに視線方向特定部114、および目視位置算出部116を有する。なお、制御部100のその他の機能については、第1の実施形態と概略同様である。
第2の実施形態によるテキスト特定部106は、後述する視線方向特定部114により特定される利用者の視線方向の移動に基づいて、テキスト区分部104により区分された複数の選択候補テキストから選択テキストを特定する。例えば、テキスト特定部106は、後述する目視位置算出部116により算出される、表示画面40における利用者の目視位置に位置する選択候補テキストを選択テキストとして特定する。
‐A.利用者の目の位置の特定‐
視線方向特定部114は、カメラ70による撮影画像に基づいて、利用者の目の位置を特定することが可能である。例えば、視線方向特定部114は、まず、カメラ70による撮影画像から、例えば目、鼻、または顔の輪郭などの特徴点を抽出することにより、利用者の顔を検出する。そして、視線方向特定部114は、例えば検出された利用者の目と目の間の距離、または利用者の顔の大きさなどに基づいて、カメラ70から利用者の目までの相対的な位置を算出する。
さらに、視線方向特定部114は、カメラ70による撮影画像に基づいて、利用者の視線方向を特定することが可能である。例えば、視線方向特定部114は、カメラ70による撮影画像から検出された利用者の目の画像に対してパターンマッチングを行うことにより、利用者の視線方向を特定する。
目視位置算出部116は、視線方向特定部114により特定された利用者の目の位置、および利用者の視線方向に基づいて、表示画面40における利用者の目視位置を算出する。ここで、目視位置は、例えば図26に示した座標(a,b)の点の位置のように、利用者が表示画面40において見ている位置、または見ている位置の近傍の領域である。
第2の実施形態による通信部120は、テレビジョン受像機60と通信可能な各種装置との間で情報を送受信する。例えば、通信部120は、カメラ70により撮像された画像をカメラ70から受信する。
音声入出力部122は、マイクロフォンなどの音声入力装置、およびスピーカーなどの音声出力装置から構成される。音声入出力部122は、例えば、外部の音声を集音したり、または、テレビジョン受像機60により生成される音声データを音声に変換して出力する。
表示部124は、表示制御部110による制御に基づいて、例えば利用者により入力されたテキスト列を表示画面40に表示する。
以上、第2の実施形態による構成について説明した。続いて、第2の実施形態による動作について説明する。なお、ここでは一例として、第1の実施形態による「動作例2」に対応する動作例について説明する。また、以下の説明では、マイクロフォンの形が描かれたアイコンである「マイクアイコン」が、表示画面40における例えば左下部などの所定の位置に表示されている例を想定する。
利用者の目視位置が所定の距離以上、上に移動された場合には(S309:Yes)、テレビジョン受像機60は、第1の実施形態におけるS208と概略同様な、「変形・追加処理」の動作を行う(S310)。そして、テレビジョン受像機60は、再びS306の動作を行う。
一方、利用者による選択位置を見つめる動作が所定時間以上続いた場合には(S311:Yes)、制御部100は、選択位置が文末であるか否かを判断する(S312)。選択位置が文末である場合には(S312:Yes)、テキスト編集部108は、利用者により入力されたテキスト列を確定する(S313)。そして、情報処理装置10は、処理を終了する。
一方、表示画面40に表示されたマイクアイコンを見つめる動作が所定時間以上続いた場合には(S315:Yes)、テレビジョン受像機60は、第1の実施形態におけるS214と概略同様な、「修正・追加処理」の動作を行う(S316)。そして、テレビジョン受像機60は、再びS306の動作を行う。
以上、例えば図25、図27、図28等を参照して説明したように、第2の実施形態によるテレビジョン受像機60は、入力されたテキスト列から区分された複数の選択候補テキストのうち、利用者の視線方向の移動に基づいて、利用者の選択対象である選択候補テキストを特定する。そして、テレビジョン受像機60は、特定された選択候補テキストを、利用者の視線の移動または利用者の音声に基づいて編集する。このため、利用者は、コントローラー20を用いることなく、テキストの選択および編集を全てハンドフリーで行うことができる。また、例えばコントローラー20を持ち続ける必要がないので、テキスト編集時における利用者の作業負荷がより小さい。
なお、添付図面を参照しながら本開示の好適な実施形態について詳細に説明したが、本開示はかかる例に限定されない。本開示の属する技術の分野における通常の知識を有する者であれば、請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本開示の技術的範囲に属するものと了解される。
(1)
入力されたテキスト列を複数の第1のテキストに区分するテキスト区分部と、
前記テキスト列が表示されている表示画面における指示位置を移動させるための利用者による移動方向の入力操作に基づいて、区分された前記複数の第1のテキストのうち前記利用者の選択対象である第1のテキストを特定するテキスト特定部と、
特定された第1のテキストを、前記利用者により入力される入力情報に基づいて編集するテキスト編集部と、
を備える、情報処理装置。
(2)
前記利用者により入力される入力情報は、前記利用者により入力される第2のテキストを含み、
前記テキスト編集部は、前記利用者により前記第2のテキストが入力された場合には、前記テキスト特定部により特定された第1のテキストを、前記テキスト列において前記第2のテキストに置換する、前記(1)に記載の情報処理装置。
(3)
前記第2のテキストは、前記利用者により発せられた音声が音声認識されることにより特定されるテキストを含む、前記(2)に記載の情報処理装置。
(4)
前記利用者により入力される入力情報は、テキストを削除するための削除指示情報を含み、
前記テキスト編集部は、前記利用者により前記削除指示情報が入力された場合には、前記テキスト特定部により特定された第1のテキストを前記テキスト列から削除する、前記(1)~(3)のいずれか一項に記載の情報処理装置。
(5)
前記利用者により入力される入力情報は、単語を原形に変換するための変換指示情報を含み、
前記テキスト編集部は、前記利用者により前記変換指示情報が入力された場合には、前記テキスト特定部により特定された第1のテキストを、前記第1のテキストが原形に変換されたテキストに置換する、前記(1)~(4)のいずれか一項に記載の情報処理装置。
(6)
前記利用者により入力される入力情報は、漢字をひらがなに変換するための変換指示情報を含み、
前記テキスト編集部は、前記利用者により前記変換指示情報が入力された場合には、前記テキスト特定部により特定された第1のテキストを、前記第1のテキストがひらがなに変換されたテキストに置換する、前記(1)~(4)のいずれか一項に記載の情報処理装置。
(7)
前記入力されたテキスト列は、前記利用者により発せられた音声が音声認識されることにより特定されたテキスト列を含む、前記(1)~(6)のいずれか一項に記載の情報処理装置。
(8)
前記情報処理装置は、前記指示位置が前記テキスト列の末尾に位置し、かつ、所定の操作がなされた場合に、前記テキスト列の末尾に第2のテキスト列を追加するテキスト追加部をさらに備える、前記(1)~(6)のいずれか一項に記載の情報処理装置。
(9)
前記情報処理装置は、前記所定の操作がなされた場合に、前記利用者が1以上の記号を選ぶための選択画像を前記表示画面に表示させる表示制御部をさらに備え、
前記テキスト追加部は、前記選択画像において前記利用者により選択された1以上の記号を前記第2のテキスト列として、前記テキスト列の末尾に追加する、前記(8)に記載の情報処理装置。
(10)
前記テキスト追加部は、前記利用者により発せられた音声が音声認識されることにより特定されたテキスト列を前記第2のテキスト列として、前記テキスト列の末尾に追加する、前記(8)に記載の情報処理装置。
(11)
前記テキスト区分部は、前記テキスト列の文脈に基づいて前記テキスト列を複数の第1のテキストに区分する、前記(1)~(10)のいずれか一項に記載の情報処理装置。
(12)
前記第1のテキストは、1以上の単語を含む、前記(1)~(11)のいずれか一項に記載の情報処理装置。
(13)
前記利用者による移動方向の入力操作は、前記利用者による、前記表示画面において前記指示位置を移動させるための方向キーの選択操作を含む、前記(1)~(12)のいずれか一項に記載の情報処理装置。
(14)
前記情報処理装置は、前記利用者の視線方向を特定する視線方向特定部をさらに備え、
前記利用者による移動方向の入力操作は、前記利用者による視線方向の移動を含む、前記(1)~(13)のいずれか一項に記載の情報処理装置。
(15)
入力されたテキスト列を複数の第1のテキストに区分することと、
前記テキスト列が表示されている表示画面における指示位置を移動させるための利用者による移動方向の入力操作に基づいて、区分された前記複数の第1のテキストのうち前記利用者の選択対象である第1のテキストを特定することと、
特定された第1のテキストを、前記利用者により入力される入力情報に基づいてプロセッサにより編集することと、
を備える、情報処理方法。
(16)
コンピュータを、
入力されたテキスト列を複数の第1のテキストに区分するテキスト区分部と、
前記テキスト列が表示されている表示画面における指示位置を移動させるための利用者による移動方向の入力操作に基づいて、区分された前記複数の第1のテキストのうち前記利用者の選択対象である第1のテキストを特定するテキスト特定部と、
特定された第1のテキストを、前記利用者により入力される入力情報に基づいて編集するテキスト編集部、
として機能させるための、プログラム。
20 コントローラー
30 表示装置
60 テレビジョン受像機
70 カメラ
100 制御部
102 音声認識部
104 テキスト区分部
106 テキスト特定部
108 テキスト編集部
110 表示制御部
112 テキスト追加部
114 視線方向特定部
116 目視位置算出部
120 通信部
122 音声入出力部
124 表示部
150 CPU
152 ROM
154 RAM
156 内部バス
158 インターフェース
160 入力装置
162 出力装置
164 ストレージ装置
166 通信装置
200 通信部
202 マイクロフォン
202 音声入力部
210 操作部
212 方向キー
214 決定キー
216 音声入力キー
220 回転キー
Claims (16)
- 入力されたテキスト列を複数の第1のテキストに区分するテキスト区分部と、
前記テキスト列が表示されている表示画面における指示位置を移動させるための利用者による移動方向の入力操作に基づいて、区分された前記複数の第1のテキストのうち前記利用者の選択対象である第1のテキストを特定するテキスト特定部と、
特定された第1のテキストを、前記利用者により入力される入力情報に基づいて編集するテキスト編集部と、
を備える、情報処理装置。 - 前記利用者により入力される入力情報は、前記利用者により入力される第2のテキストを含み、
前記テキスト編集部は、前記利用者により前記第2のテキストが入力された場合には、前記テキスト特定部により特定された第1のテキストを、前記テキスト列において前記第2のテキストに置換する、請求項1に記載の情報処理装置。 - 前記第2のテキストは、前記利用者により発せられた音声が音声認識されることにより特定されるテキストを含む、請求項2に記載の情報処理装置。
- 前記利用者により入力される入力情報は、テキストを削除するための削除指示情報を含み、
前記テキスト編集部は、前記利用者により前記削除指示情報が入力された場合には、前記テキスト特定部により特定された第1のテキストを前記テキスト列から削除する、請求項1に記載の情報処理装置。 - 前記利用者により入力される入力情報は、単語を原形に変換するための変換指示情報を含み、
前記テキスト編集部は、前記利用者により前記変換指示情報が入力された場合には、前記テキスト特定部により特定された第1のテキストを、前記第1のテキストが原形に変換されたテキストに置換する、請求項1に記載の情報処理装置。 - 前記利用者により入力される入力情報は、漢字をひらがなに変換するための変換指示情報を含み、
前記テキスト編集部は、前記利用者により前記変換指示情報が入力された場合には、前記テキスト特定部により特定された第1のテキストを、前記第1のテキストがひらがなに変換されたテキストに置換する、請求項1に記載の情報処理装置。 - 前記入力されたテキスト列は、前記利用者により発せられた音声が音声認識されることにより特定されたテキスト列を含む、請求項1に記載の情報処理装置。
- 前記情報処理装置は、前記指示位置が前記テキスト列の末尾に位置し、かつ、所定の操作がなされた場合に、前記テキスト列の末尾に第2のテキスト列を追加するテキスト追加部をさらに備える、請求項1に記載の情報処理装置。
- 前記情報処理装置は、前記所定の操作がなされた場合に、前記利用者が1以上の記号を選ぶための選択画像を前記表示画面に表示させる表示制御部をさらに備え、
前記テキスト追加部は、前記選択画像において前記利用者により選択された1以上の記号を前記第2のテキスト列として、前記テキスト列の末尾に追加する、請求項8に記載の情報処理装置。 - 前記テキスト追加部は、前記利用者により発せられた音声が音声認識されることにより特定されたテキスト列を前記第2のテキスト列として、前記テキスト列の末尾に追加する、請求項8に記載の情報処理装置。
- 前記テキスト区分部は、前記テキスト列の文脈に基づいて前記テキスト列を複数の第1のテキストに区分する、請求項1に記載の情報処理装置。
- 前記第1のテキストは、1以上の単語を含む、請求項1に記載の情報処理装置。
- 前記利用者による移動方向の入力操作は、前記利用者による、前記表示画面において前記指示位置を移動させるための方向キーの選択操作を含む、請求項1に記載の情報処理装置。
- 前記情報処理装置は、前記利用者の視線方向を特定する視線方向特定部をさらに備え、
前記利用者による移動方向の入力操作は、前記利用者による視線方向の移動を含む、請求項1に記載の情報処理装置。 - 入力されたテキスト列を複数の第1のテキストに区分することと、
前記テキスト列が表示されている表示画面における指示位置を移動させるための利用者による移動方向の入力操作に基づいて、区分された前記複数の第1のテキストのうち前記利用者の選択対象である第1のテキストを特定することと、
特定された第1のテキストを、前記利用者により入力される入力情報に基づいてプロセッサにより編集することと、
を備える、情報処理方法。 - コンピュータを、
入力されたテキスト列を複数の第1のテキストに区分するテキスト区分部と、
前記テキスト列が表示されている表示画面における指示位置を移動させるための利用者による移動方向の入力操作に基づいて、区分された前記複数の第1のテキストのうち前記利用者の選択対象である第1のテキストを特定するテキスト特定部と、
特定された第1のテキストを、前記利用者により入力される入力情報に基づいて編集するテキスト編集部、
として機能させるための、プログラム。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201480046509.8A CN105518657B (zh) | 2013-10-24 | 2014-08-04 | 信息处理设备、信息处理方法及计算机可读记录介质 |
EP14856022.0A EP3062237A4 (en) | 2013-10-24 | 2014-08-04 | Information processing device, information processing method, and program |
JP2015543736A JPWO2015059976A1 (ja) | 2013-10-24 | 2014-08-04 | 情報処理装置、情報処理方法、及びプログラム |
US14/913,655 US20160210276A1 (en) | 2013-10-24 | 2014-08-04 | Information processing device, information processing method, and program |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013-221125 | 2013-10-24 | ||
JP2013221125 | 2013-10-24 |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2015059976A1 true WO2015059976A1 (ja) | 2015-04-30 |
Family
ID=52992587
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/JP2014/070510 WO2015059976A1 (ja) | 2013-10-24 | 2014-08-04 | 情報処理装置、情報処理方法、及びプログラム |
Country Status (5)
Country | Link |
---|---|
US (1) | US20160210276A1 (ja) |
EP (1) | EP3062237A4 (ja) |
JP (1) | JPWO2015059976A1 (ja) |
CN (1) | CN105518657B (ja) |
WO (1) | WO2015059976A1 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018018464A (ja) * | 2016-07-29 | 2018-02-01 | セイコーエプソン株式会社 | 情報処理装置、情報処理装置の制御方法、及び、制御プログラム |
WO2018043139A1 (ja) * | 2016-08-31 | 2018-03-08 | ソニー株式会社 | 情報処理装置および情報処理方法、並びにプログラム |
WO2018116556A1 (ja) | 2016-12-22 | 2018-06-28 | ソニー株式会社 | 情報処理装置、および情報処理方法 |
JP2020519986A (ja) * | 2017-04-19 | 2020-07-02 | マジック リープ, インコーポレイテッドMagic Leap,Inc. | ウェアラブルシステムのためのマルチモード実行およびテキスト編集 |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6374854B2 (ja) * | 2015-11-10 | 2018-08-15 | 株式会社オプティム | 画面共有システム及び画面共有方法 |
CN106933561A (zh) * | 2015-12-31 | 2017-07-07 | 北京搜狗科技发展有限公司 | 语音输入方法和终端设备 |
EP3436863A4 (en) | 2016-03-31 | 2019-11-27 | Magic Leap, Inc. | INTERACTIONS WITH 3D VIRTUAL OBJECTS USING POSES AND MULTI-DOF CONTROLLERS |
JP6942995B2 (ja) | 2017-03-31 | 2021-09-29 | ブラザー工業株式会社 | 情報処理プログラム、情報処理装置、および情報処理装置の制御方法 |
CN107203505A (zh) * | 2017-05-26 | 2017-09-26 | 北京小米移动软件有限公司 | 文本信息编辑方法及装置 |
JP7023743B2 (ja) * | 2018-02-28 | 2022-02-22 | シャープ株式会社 | 情報処理装置、情報処理方法、及びプログラム |
WO2020105349A1 (ja) | 2018-11-20 | 2020-05-28 | ソニー株式会社 | 情報処理装置および情報処理方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS58115526A (ja) * | 1981-12-29 | 1983-07-09 | Sharp Corp | 仮名漢字変換装置 |
JPH07160719A (ja) * | 1993-12-13 | 1995-06-23 | Matsushita Electric Ind Co Ltd | 電子辞書引き装置 |
JPH07191796A (ja) * | 1993-12-27 | 1995-07-28 | Canon Inc | 視線入力システム |
JPH0844737A (ja) * | 1994-08-01 | 1996-02-16 | Nec Corp | 文書編集装置 |
JP2010002830A (ja) * | 2008-06-23 | 2010-01-07 | Sharp Corp | 音声認識装置 |
JP2011138343A (ja) * | 2009-12-28 | 2011-07-14 | Denso Corp | 電子機器及びプログラム |
Family Cites Families (37)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4914704A (en) * | 1984-10-30 | 1990-04-03 | International Business Machines Corporation | Text editor for speech input |
JPH0447358A (ja) * | 1990-06-01 | 1992-02-17 | Nippon Telegr & Teleph Corp <Ntt> | 文章等の編集方法 |
JPH05298315A (ja) * | 1992-04-24 | 1993-11-12 | Toshiba Corp | 情報処理装置 |
US5666139A (en) * | 1992-10-15 | 1997-09-09 | Advanced Pen Technologies, Inc. | Pen-based computer copy editing apparatus and method for manuscripts |
US5778404A (en) * | 1995-08-07 | 1998-07-07 | Apple Computer, Inc. | String inserter for pen-based computer systems and method for providing same |
US5682439A (en) * | 1995-08-07 | 1997-10-28 | Apple Computer, Inc. | Boxed input correction system and method for pen based computer systems |
US6356886B1 (en) * | 1995-11-30 | 2002-03-12 | Electronic Data Systems Corporation | Apparatus and method for communicating with a knowledge base |
JPH09305343A (ja) * | 1996-05-13 | 1997-11-28 | Hitachi Ltd | 対象範囲指定方法 |
US5829000A (en) * | 1996-10-31 | 1998-10-27 | Microsoft Corporation | Method and system for correcting misrecognized spoken words or phrases |
US6396482B1 (en) * | 1998-06-26 | 2002-05-28 | Research In Motion Limited | Hand-held electronic device with a keyboard optimized for use with the thumbs |
US6356866B1 (en) * | 1998-10-07 | 2002-03-12 | Microsoft Corporation | Method for converting a phonetic character string into the text of an Asian language |
US6986106B2 (en) * | 2002-05-13 | 2006-01-10 | Microsoft Corporation | Correction widget |
EP1422692A3 (en) * | 2002-11-22 | 2004-07-14 | ScanSoft, Inc. | Automatic insertion of non-verbalized punctuation in speech recognition |
JP4032181B2 (ja) * | 2003-11-14 | 2008-01-16 | 敏志 網野 | 文字入力方法 |
US7921374B2 (en) * | 2004-07-08 | 2011-04-05 | Research In Motion Limited | Adding interrogative punctuation to an electronic message |
US20060064652A1 (en) * | 2004-09-20 | 2006-03-23 | Nokia Corporation | Input of punctuation marks |
US8117540B2 (en) * | 2005-05-18 | 2012-02-14 | Neuer Wall Treuhand Gmbh | Method and device incorporating improved text input mechanism |
US7429108B2 (en) * | 2005-11-05 | 2008-09-30 | Outland Research, Llc | Gaze-responsive interface to enhance on-screen user reading tasks |
US20080270895A1 (en) * | 2007-04-26 | 2008-10-30 | Nokia Corporation | Method, computer program, user interface, and apparatus for predictive text input |
JP4503069B2 (ja) * | 2007-12-27 | 2010-07-14 | シャープ株式会社 | 文字入力装置、システム、及び文字入力制御方法 |
WO2010068445A2 (en) * | 2008-11-25 | 2010-06-17 | Spetalnick Jeffrey R | Methods and systems for improved data input, compression, recognition, correction, and translation through frequency-based language analysis |
US9223590B2 (en) * | 2010-01-06 | 2015-12-29 | Apple Inc. | System and method for issuing commands to applications based on contextual information |
US20120146955A1 (en) * | 2010-12-10 | 2012-06-14 | Research In Motion Limited | Systems and methods for input into a portable electronic device |
US9538219B2 (en) * | 2011-02-04 | 2017-01-03 | Panasonic Intellectual Property Corporation Of America | Degree of interest estimating device and degree of interest estimating method |
US9575946B2 (en) * | 2011-05-23 | 2017-02-21 | Nuance Communications, Inc. | Text browsing, editing and correction methods for automotive applications |
US8954329B2 (en) * | 2011-05-23 | 2015-02-10 | Nuance Communications, Inc. | Methods and apparatus for acoustic disambiguation by insertion of disambiguating textual information |
US8640026B2 (en) * | 2011-07-11 | 2014-01-28 | International Business Machines Corporation | Word correction in a multi-touch environment |
US20130212515A1 (en) * | 2012-02-13 | 2013-08-15 | Syntellia, Inc. | User interface for text input |
WO2013033842A1 (en) * | 2011-09-07 | 2013-03-14 | Tandemlaunch Technologies Inc. | System and method for using eye gaze information to enhance interactions |
US8290772B1 (en) * | 2011-10-03 | 2012-10-16 | Google Inc. | Interactive text editing |
US20130159919A1 (en) * | 2011-12-19 | 2013-06-20 | Gabriel Leydon | Systems and Methods for Identifying and Suggesting Emoticons |
CN106774982B (zh) * | 2012-06-04 | 2020-06-09 | 华为终端有限公司 | 一种提示字符输入的方法和电子设备 |
CN103885743A (zh) * | 2012-12-24 | 2014-06-25 | 大陆汽车投资(上海)有限公司 | 结合注视跟踪技术的语音文本输入方法和系统 |
JP6155821B2 (ja) * | 2013-05-08 | 2017-07-05 | ソニー株式会社 | 情報処理装置、情報処理方法、及びプログラム |
US8943405B1 (en) * | 2013-11-27 | 2015-01-27 | Google Inc. | Assisted punctuation of character strings |
EP3193261B1 (en) * | 2014-03-18 | 2020-11-04 | smartwork solutions GmbH | Method and system for editing virtual documents |
US20180342248A1 (en) * | 2017-05-23 | 2018-11-29 | Ronen Rabinovici | Integrated speech recognition text input with manual punctuation |
-
2014
- 2014-08-04 WO PCT/JP2014/070510 patent/WO2015059976A1/ja active Application Filing
- 2014-08-04 US US14/913,655 patent/US20160210276A1/en not_active Abandoned
- 2014-08-04 CN CN201480046509.8A patent/CN105518657B/zh not_active Expired - Fee Related
- 2014-08-04 EP EP14856022.0A patent/EP3062237A4/en not_active Ceased
- 2014-08-04 JP JP2015543736A patent/JPWO2015059976A1/ja active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS58115526A (ja) * | 1981-12-29 | 1983-07-09 | Sharp Corp | 仮名漢字変換装置 |
JPH07160719A (ja) * | 1993-12-13 | 1995-06-23 | Matsushita Electric Ind Co Ltd | 電子辞書引き装置 |
JPH07191796A (ja) * | 1993-12-27 | 1995-07-28 | Canon Inc | 視線入力システム |
JPH0844737A (ja) * | 1994-08-01 | 1996-02-16 | Nec Corp | 文書編集装置 |
JP2010002830A (ja) * | 2008-06-23 | 2010-01-07 | Sharp Corp | 音声認識装置 |
JP2011138343A (ja) * | 2009-12-28 | 2011-07-14 | Denso Corp | 電子機器及びプログラム |
Non-Patent Citations (1)
Title |
---|
See also references of EP3062237A4 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018018464A (ja) * | 2016-07-29 | 2018-02-01 | セイコーエプソン株式会社 | 情報処理装置、情報処理装置の制御方法、及び、制御プログラム |
WO2018043139A1 (ja) * | 2016-08-31 | 2018-03-08 | ソニー株式会社 | 情報処理装置および情報処理方法、並びにプログラム |
WO2018116556A1 (ja) | 2016-12-22 | 2018-06-28 | ソニー株式会社 | 情報処理装置、および情報処理方法 |
JP2020519986A (ja) * | 2017-04-19 | 2020-07-02 | マジック リープ, インコーポレイテッドMagic Leap,Inc. | ウェアラブルシステムのためのマルチモード実行およびテキスト編集 |
JP7149289B2 (ja) | 2017-04-19 | 2022-10-06 | マジック リープ, インコーポレイテッド | ウェアラブルシステムのためのマルチモード実行およびテキスト編集 |
Also Published As
Publication number | Publication date |
---|---|
EP3062237A1 (en) | 2016-08-31 |
US20160210276A1 (en) | 2016-07-21 |
CN105518657A (zh) | 2016-04-20 |
EP3062237A4 (en) | 2017-06-28 |
CN105518657B (zh) | 2019-09-24 |
JPWO2015059976A1 (ja) | 2017-03-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2015059976A1 (ja) | 情報処理装置、情報処理方法、及びプログラム | |
JP7078808B2 (ja) | リアルタイム手書き認識の管理 | |
US11182069B2 (en) | Managing real-time handwriting recognition | |
TWI570632B (zh) | 使用一通用辨識器之多筆跡手寫辨識 | |
CN104090652A (zh) | 一种语音输入方法和装置 | |
TW201516887A (zh) | 針對自動手寫辨識將筆劃分佈資訊整合到空間特徵擷取 | |
CN109002183B (zh) | 一种信息输入的方法及装置 | |
US11900931B2 (en) | Information processing apparatus and information processing method | |
WO2014181508A1 (en) | Information processing apparatus, information processing method, and program | |
CN112329563A (zh) | 一种基于树莓派的智能阅读辅助方法及系统 | |
CN110858291A (zh) | 字符切分方法及装置 | |
CN112261321B (zh) | 字幕处理方法、装置及电子设备 | |
JP7468360B2 (ja) | 情報処理装置および情報処理方法 | |
KR102472614B1 (ko) | 도킹 장치와 상호 작용하는 모바일 장치 및 그 제어 방법 | |
CN118072397A (zh) | 一种移动设备上的实时手语翻译系统 | |
CN114124864A (zh) | 消息处理方法、装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
REEP | Request for entry into the european phase |
Ref document number: 2014856022 Country of ref document: EP |
|
WWE | Wipo information: entry into national phase |
Ref document number: 14913655 Country of ref document: US Ref document number: 2014856022 Country of ref document: EP |
|
ENP | Entry into the national phase |
Ref document number: 2015543736 Country of ref document: JP Kind code of ref document: A |
|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 14856022 Country of ref document: EP Kind code of ref document: A1 |
|
NENP | Non-entry into the national phase |
Ref country code: DE |