WO2018016140A1 - 情報処理装置、情報処理方法、およびプログラム - Google Patents

情報処理装置、情報処理方法、およびプログラム Download PDF

Info

Publication number
WO2018016140A1
WO2018016140A1 PCT/JP2017/014928 JP2017014928W WO2018016140A1 WO 2018016140 A1 WO2018016140 A1 WO 2018016140A1 JP 2017014928 W JP2017014928 W JP 2017014928W WO 2018016140 A1 WO2018016140 A1 WO 2018016140A1
Authority
WO
WIPO (PCT)
Prior art keywords
character string
unit
string group
group
information processing
Prior art date
Application number
PCT/JP2017/014928
Other languages
English (en)
French (fr)
Inventor
真一 河野
祐平 滝
Original Assignee
ソニー株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ソニー株式会社 filed Critical ソニー株式会社
Priority to EP17830660.1A priority Critical patent/EP3489840A4/en
Priority to JP2018528405A priority patent/JP7020410B2/ja
Priority to US16/096,370 priority patent/US11275897B2/en
Priority to CN201780042974.8A priority patent/CN109478201A/zh
Publication of WO2018016140A1 publication Critical patent/WO2018016140A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Definitions

  • the present disclosure relates to an information processing apparatus, an information processing method, and a program.
  • Patent Document 1 discloses a technique for creating a sentence based on a phrase selected by a user among a plurality of phrases.
  • the input character string group is grouped into a plurality of groups.
  • the character string group is collected in a fixed unit regardless of the acquired character string group.
  • the present disclosure proposes a new and improved information processing apparatus, information processing method, and program capable of adaptively changing a unit of a group related to a character string group to be acquired. To do.
  • an acquisition unit that acquires a first character string group, and a change unit that changes a unit of the group related to the first character string group based on the first character string group and a predetermined condition.
  • An information processing apparatus is provided.
  • the processor acquires a first character string group, and the processor changes a unit of the group related to the first character string group based on the first character string group and a predetermined condition. And an information processing method is provided.
  • the computer is configured to obtain a unit of the first character string group based on the acquisition unit that acquires the first character string group, the first character string group, and the predetermined condition.
  • a program is provided for functioning as a changing unit for changing the parameters.
  • FIG. 3 is a diagram illustrating a display example of a unit of unit determined for the character string group illustrated in FIG. 2 according to a comparative example of the present disclosure. It is the functional block diagram which showed the structural example of the server 10 by the embodiment. It is explanatory drawing which showed the structural example of the setting reference
  • a plurality of constituent elements having substantially the same functional configuration may be distinguished by adding different alphabets after the same reference numeral.
  • a plurality of configurations having substantially the same functional configuration are distinguished as the server 10a and the server 10b as necessary.
  • the same reference numerals are given.
  • the server 10a and the server 10b they are simply referred to as the server 10.
  • the information processing system includes a server 10, a terminal 20, and a communication network 22.
  • the terminal 20 is an information processing terminal used by the user.
  • the terminal 20 can collect voice when the user speaks or can accept input of a character string.
  • the terminal 20 includes, for example, a sound collection unit 200 and an operation display unit 202.
  • the sound collection unit 200 is, for example, a microphone.
  • the sound collection unit 200 detects an external sound (air vibration) and converts it into an electrical signal.
  • the operation display unit 202 includes a display unit that displays a display screen and an operation unit that detects a touch operation by the user.
  • the display unit includes, for example, an LCD (Liquid Crystal Display) device or an OLED (Organic Light Emitting Diode) device.
  • the said operation part is comprised by the touchscreen, for example.
  • the operation display unit 202 accepts input of a character string group by the user.
  • the operation display unit 202 displays a software keyboard and accepts input of a character string group by a touch operation on the software keyboard.
  • the character string group is one or more character strings.
  • the terminal 20 can communicate with other devices via the communication network 22.
  • the terminal 20 transmits voice data collected by the sound collection unit 200, a character string group input to the operation display unit 202, and the like to the server 10 via the communication network 22.
  • the terminal 20 can be connected to an input device (for example, a keyboard or a remote controller) (not shown) by wire or wireless.
  • the terminal 20 can also transmit a character string group manually input (for example, key input) by the user to the server 10 using the input device.
  • FIG. 1 shows an example in which the terminal 20 is a smartphone
  • the present invention is not limited to such an example.
  • the terminal 20 is a general-purpose PC (Personal Computer), a tablet-type terminal, a game machine, a phone other than a smartphone, a portable music player, a television receiver, a robot, or an HMD (Head Mounted Display), a headset, Alternatively, it may be a wearable device such as a smart watch.
  • PC Personal Computer
  • HMD Head Mounted Display
  • the server 10 is an example of an information processing device according to the present disclosure.
  • the server 10 has a natural language processing function.
  • the server 10 can perform voice recognition (cloud voice recognition) on voice data received from the terminal 20 via the communication network 22 described later. Further, the server 10 can perform various language processing on a character string group received from the terminal 20 via the communication network 22 and a character string group obtained from the voice recognition result.
  • the server 10 can determine one or more units (hereinafter referred to as “units”) for the character string group based on the result of language processing on the character string group.
  • the unit is composed of one or more characters.
  • a group unit can be composed of one or more words. More specifically, when the language is English or German, the unit is composed of one or more words, and when the language is Japanese, the unit is composed of one or more clauses. Can be configured.
  • the server 10 can perform various controls such as display control on the terminal 20.
  • the server 10 distinguishes the display for each unit determined for the character string group, and causes the terminal 20 to display the character string group.
  • the communication network 22 is a wired or wireless transmission path for information transmitted from a device connected to the communication network 22.
  • the communication network 22 may include a public line network such as a telephone line network, the Internet, and a satellite communication network, various LANs including the Ethernet (registered trademark), a wide area network (WAN), and the like.
  • the communication network 22 may include a dedicated network such as an IP-VPN (Internet Protocol-Virtual Private Network).
  • the character string group 30 as shown in FIG. 2 is input by the user by voice input or manual input.
  • the character string group 30 (English) shown in FIG. 2 is a part of a transcript of “Dr. Barack Obama's speech on November 4, 2008” (“Transscript: 'This is our Victory', says” Obama "CNN.com.2008. ⁇ Http://edition.cnn.com/2008/POLITICS/11/04/obama.transscript/>).
  • a plurality of unit units 400 are determined and displayed on the display screen 40 as shown in FIG.
  • the character string group 30 is a long sentence
  • the unit 400 is fixedly set, a large number of units 400 are displayed on the display screen 40.
  • it can be perceived by the user so that the individual unit is relatively small, so that it is difficult for the user to visually recognize the entire character string group.
  • the server 10 according to the present embodiment dynamically changes a unit of the acquired character string group based on a predetermined condition. For example, the server 10 can sequentially optimize the group unit according to the total amount of the character string group (for example, the number of characters and the estimated number of the unit).
  • FIG. 4 is a functional block diagram showing a configuration example of the server 10 according to the present embodiment.
  • the server 10 includes a control unit 100, a communication unit 120, and a storage unit 122.
  • Control unit 100 The control unit 100 controls the operation of the server 10 by using hardware such as a CPU (Central Processing Unit) 150 described later and a RAM (Random Access Memory) 154 described later. Control. As illustrated in FIG. 4, the control unit 100 includes a voice recognition unit 102, a language processing unit 104, a changing unit 106, a summarizing unit 108, and a display control unit 110.
  • a CPU Central Processing Unit
  • RAM Random Access Memory
  • Speech recognition unit 102 performs voice recognition on voice data received from the terminal 20, for example, and converts it into a character string group. Further, the voice recognition unit 102 transmits the converted character string group to the language processing unit 104.
  • the language processing unit 104 is an example of an acquisition unit in the present disclosure.
  • the language processing unit 104 acquires a character string group transmitted from the voice recognition unit 102 and a character string group received from the terminal 20.
  • the language processing unit 104 performs various kinds of language processing (for example, morphological analysis, syntax analysis, and semantic analysis) on the acquired character string group.
  • the language processing unit 104 first performs morphological analysis on the acquired character string group.
  • the language processing unit 104 performs syntax analysis of the character string group based on the result of morphological analysis.
  • the language processing unit 104 analyzes the dependency between words (in the case of English or the like) and phrases (in the case of Japanese or the like) included in the character string group.
  • the language processing unit 104 performs the semantic analysis of the character string group based on the result of the syntax analysis.
  • the language processing unit 104 performs analysis of modalities included in the character string group.
  • the language processing unit 104 transmits the acquired character string group and the result of the language processing to the changing unit 106, the summarizing unit 108, and the storage unit 122.
  • the changing unit 106 is an example of a changing unit in the present disclosure.
  • the changing unit 106 determines a group unit for the acquired character string group based on a predetermined condition.
  • the predetermined condition may include a plurality of different conditions (a plurality of conditions that do not overlap with each other). A specific example of the predetermined condition will be described later.
  • the changing unit 106 determines which of the plurality of conditions the previously acquired character string group (hereinafter referred to as “character string group before change”) meets. Based on this, it is determined whether or not to change the unit of the character string group before the change.
  • the changing unit 106 is a character string group in which the newly acquired character string group is added to the character string group before the change (hereinafter referred to as “character string group after change”). Determines whether to change the group unit of the character string group before the change based on which of the plurality of conditions is satisfied.
  • the character string group before the change is an example of a first character string group in the present disclosure.
  • the newly acquired character string group is an example of a second character string group in the present disclosure.
  • the changed character string group is an example of a third character string group in the present disclosure.
  • the changing unit 106 compares the condition satisfied by the character string group before the change among the plurality of conditions with the condition satisfied by the character string group after the change (among the plurality of conditions), thereby It is determined whether or not to change the unit of character string group. More specifically, when the condition satisfied by the character string group before the change is different from the condition satisfied by the character string group after the change, the changing unit 106 changes the unit of the character string group before the change. Decide that. If the condition satisfied by the character string group before the change and the condition satisfied by the character string group after the change are the same, the changing unit 106 does not change the unit of the character string group before the change. decide.
  • the changing unit 106 satisfies a condition that is satisfied by a character string group that has been acquired in the past (that is, the character string group before the change) since the acquisition of the character string group. It is sequentially compared whether or not the condition that the character string group after the addition of the newly acquired character string group (that is, the character string group after the change) satisfies is the same, and the character string before the change Decide whether to change the group unit of the group.
  • the changing unit 106 determines whether the character string group before the change satisfies the condition and the editing information. Whether or not to change the group unit of the character string group before the change by comparing with the condition that the character string group before the change is changed (that is, the character string group after the change) It is also possible to decide.
  • the editing information is information such as insertion of a predetermined symbol (for example, “,”, “.”, “?”, Etc.) to the corresponding character string group, or deletion of a part of the corresponding character string group. obtain.
  • the predetermined condition may include a plurality of conditions regarding the range of the number of characters included in the character string group.
  • the plurality of conditions include a condition A1, a condition A2, a condition A3, etc., and the condition A1 is “the number of characters (included in the character string group) is 0 or more and less than 100”, and the condition A2 is “The number of characters is 100 or more and less than 200” and the condition A3 can be defined as “the number of characters is 200 or more and less than 300”.
  • the condition that the character string group before the change satisfies is different from the condition that the character string group after the change satisfies, and the character string group after the change is more than the number of characters included in the character string group before the change.
  • the changing unit 106 determines to increase (change) the unit of the character string group before the change.
  • each of the plurality of conditions and a threshold value may be associated and registered in the table.
  • the changing unit 106 compares the number of characters included in the character string group before the change (or after the change) with the threshold value associated with each condition, thereby changing the value before the change (or after the change).
  • the threshold value of condition A1 is “0”
  • the threshold value of condition A2 is “100”
  • the threshold value of condition A3 is “200”
  • the number of characters included in the character string group before the change is It is assumed that it is “80”.
  • the changing unit 106 specifies the condition that the character string group satisfies as the condition A1. May be.
  • the predetermined condition may include a plurality of conditions related to the number of collective units of the character string group.
  • the plurality of conditions include a condition B1 and a condition B2, and the condition B1 is “the number (or the estimated number) of unity units of the character string group is less than 10”, and the condition B2 is “ The number of grouped units (or the estimated number) of the character string group must be 10 or more.
  • the condition that the character string group before the change satisfies is different from the condition that the character string group after the change satisfies, and the group of the character string group after the change is larger than the number of unit of the character string group before the change.
  • the changing unit 106 determines to increase (change) the group unit of the character string group before the change.
  • the number of units of the character string group after the change can be calculated as follows. For example, regarding a case where a character string group is newly acquired, the estimated number of units when the newly acquired character string group is collected using the current setting criteria, and the character string group before the change As the sum of the number of group units, the number of group units of the character string group after the change is calculated. Further, in the case where the character string group is deleted, the number of unit groups of the character string group after the change is the number of unit units remaining after the deletion.
  • the above setting criteria may be, for example, a restriction condition regarding the number of group units related to the character string group (for example, the number of group units is 10 or less), or may be related to the number of characters included in one group unit. It may be a constraint condition (for example, 20 characters or less).
  • the predetermined condition may include a plurality of conditions related to the language processing result related to the character string group.
  • the language processing result is analyzed from the corresponding character string group, for example, the number of specific “phrases” (for example, noun phrases), the number of specific “parts of speech” (for example, nouns), or independent words. The number of cases (in Japanese).
  • the plurality of conditions include a condition C1, a condition C2, a condition C3, etc.
  • the condition C1 is “the number of nouns (included in the character string group) is 0 or more and less than 10”
  • the condition C2 is “The number of nouns is 10 or more and less than 20”
  • the condition C3 can be defined as “the number of nouns is 20 or more and less than 30”.
  • the condition that the character string group before the change satisfies is different from the condition that the character string group after the change satisfies, and the number of nouns included in the character string group before the change
  • the changing unit 106 determines to increase (change) the unit of the character string group before the change.
  • the larger the amount of information in the character string group the larger the unit can be made. Therefore, it is possible to collect character strings by reflecting the information amount of character strings.
  • the predetermined condition may include a plurality of conditions related to a range of the number of phonemes corresponding to the character string group.
  • the plurality of conditions include a condition D1, a condition D2, a condition D3, etc., and the condition D1 is “the number of phonemes (corresponding to the character string group) is 0 or more and less than 80”, and the condition D2 is “The number of phonemes is 80 or more and less than 160” and the condition D3 can be defined as “the number of phonemes is 160 or more and less than 240”.
  • the condition that the character string group before the change satisfies is different from the condition that the character string group after the change satisfies, and it corresponds to the character string group after the change rather than the number of phonemes corresponding to the character string group before the change.
  • the changing unit 106 determines to increase (change) the unit of the character string group before the change.
  • the number of phonemes may be specified from a speech recognition result corresponding to the corresponding character string group, or may be specified from a language processing result for the corresponding character string group.
  • the predetermined condition may include a plurality of conditions related to the modality analyzed from the character string group.
  • the plurality of conditions are a plurality of conditions related to the range of the number of modalities analyzed from the character string group.
  • the plurality of conditions include a condition E1, a condition E2, a condition E3, etc., and the condition E1 is “the number of modalities (analyzed from the character string group) is 0”, and the condition E2 is “ The number of modalities is 1 ”, and the condition E3 may be defined as“ the number of modalities is 2 ”.
  • the condition that the character string group before the change satisfies is different from the condition that the character string group after the change satisfies, and the character string group after the change is more than the number of modalities analyzed from the character string group before the change.
  • the changing unit 106 determines to increase (change) the unit of the character string group before the change.
  • the type of the target modality may be any type or a specific type.
  • the predetermined condition may include a condition regarding the presence / absence of user edit information.
  • the predetermined condition may be “the user's editing information has been acquired and the corresponding character string group has been changed based on the editing information”.
  • the changing unit 106 determines to change the unit of the character string group before the change according to the editing information.
  • the content of the editing information can be the same as described above.
  • the predetermined condition may include a plurality of types of conditions described above.
  • the changing unit 106 determines whether the character before the change It may be decided to change the group unit of the column group.
  • the changing unit 106 collects the character string group before the change. It may be decided not to change the unit.
  • the plurality of conditions include a plurality of conditions related to the range of the number of characters included in the character string group and a plurality of conditions related to the number of collective units related to the character string group.
  • the number of characters in the character string group before the change is “80”
  • the number of group units in the character string group before the change is “9”
  • the number of characters in the character string group after the change is “95”
  • the number of group units of the character string group after the change is “11”.
  • the combination of conditions satisfied by the character string group before the change is (condition A1, condition B1)
  • the combination of conditions satisfied by the character string group after the change is (condition A1, condition B2). They are different.
  • the changing unit 106 determines to change (enlarge) the unit of the character string group before the change.
  • the changing unit 106 changes the current setting criterion regarding the unit, which is stored in the storage unit 122, for example, according to the change contents of the unit.
  • the setting standard table 124 in which the plurality of conditions described above and the setting standards related to the unit of units are associated may be prepared.
  • the changing unit 106 sets the current setting standard to the setting standard associated with the condition satisfied by the changed character string group in the setting standard table 124. ) May be changed and the contents of the storage unit 122 may be updated.
  • FIG. 5 is an explanatory diagram showing a configuration example of the setting reference table 124.
  • the setting reference table 124 for example, a summary level 1240, a condition 1242, and a setting reference 1244 are associated with each other.
  • FIG. 5 shows an example in which the condition 1242 is a plurality of conditions related to the range of the number of characters included in the character string group.
  • the setting criterion 1244 is a setting criterion (constraint condition) related to the number of grouping units when the grouping unit is changed.
  • the setting criterion 1244 is a setting criterion (constraint condition) related to the number of grouping units when the grouping unit is changed.
  • the changing unit 106 is changed to a setting standard with a summary level of “2” (that is, a setting standard in which the number of collective units when the collective units are changed is set to “7”).
  • the summarizing unit 108 is an example of a changing unit in the present disclosure.
  • the summarizing unit 108 summarizes the character string group based on the determination result regarding the change of the group unit (by the changing unit 106) and the setting criteria stored in the storage unit 122 regarding the group unit. For example, when it is determined by the changing unit 106 to change the unit of the character string group before the change, the summarizing unit 108 sets the character string group before the change so that the character string group after the change satisfies the setting criterion. Change the unit of character string group.
  • the summarizing unit 108 first selects one or more sets of a plurality of unit units to be joined based on the setting criterion. Then, for each selected group, all the unit units included in the group are joined.
  • the summarizing unit 108 joins adjacent unit units in the character string group before the change.
  • the summarizing unit 108 selects one or more combinations of a unit of a unit including a modality included in the character string group before the change and one or more units of a unit not including the modality as the objects to be joined, and for each selected group Then, all the unit units included in the set are joined.
  • the summarizing unit 108 first sets the character string group before the change. Are included in the clauses including the modality and all the clauses not including the modality located before the clause are selected as the joining targets. Then, the summarizing unit 108 joins all the clauses included in the set for each selected set.
  • the summarizing unit 108 joins the plurality of unit units based on the relationship between the unit units. For example, the summarizing unit 108 joins units of a group having a dependency relationship in the character string group before the change.
  • the summarizing unit 108 selects a predetermined number of group units from the beginning of the character string group before the change as a group to be joined, and, for each selected group, all the group units included in the group. Join.
  • the summarizing unit 108 first selects one or more unit units to be divided based on the setting criteria. Then, each selected unit is divided into two or more units.
  • the summarizing unit 108 has approximately the number of words included in each group unit divided from the group unit for each group unit selected as the division target. The unit is divided so as to be even.
  • the summarizing unit 108 has, for each group unit selected as the division target, the number of phrases included in each group unit divided from the group unit. The unit is divided so as to be even.
  • the summarizing unit 108 unites the newly acquired character string group based on the latest setting criteria stored in, for example, the storage unit 122. To decide. That is, the character string group after the addition (that is, the character string group before the change and the newly acquired character string group) are all grouped based on the same setting standard.
  • Display control unit 110 controls the terminal 20 to display the acquired character string group.
  • the display control unit 110 displays the character string group on the display screen (of the terminal 20) by distinguishing each group unit collected by the summarizing unit 108.
  • the display control unit 110 When the changing unit 106 determines to change the unit of the character string group before the change, the display control unit 110 highlights the changed (joined or divided) unit and displays it on the display screen. It can also be displayed. For example, the display control unit 110 may display the changed display color of the group unit different from the default display color (in other words, the display color of the group unit not changed). More specific contents will be described later with reference to FIG.
  • the display control unit 110 may display the unit units before joining so as to clearly indicate the positions of the unit units before joining.
  • the display control unit 110 displays a broken line at a corresponding position in the display area of the unit unit after joining, or deforms to a different shape (for example, a constricted shape) only at the corresponding position or the vicinity. May be displayed.
  • the display control unit 110 may display an animation indicating the change of the corresponding unit units. For example, when a plurality of unit units related to the character string group before the change are joined, the display control unit 110 displays an animation in which the plurality of unit units gradually approach and are joined. You may let them. In addition, when one unit is divided into two or more, the display control unit 110 gradually separates the unit before the division and forms two or more units. A simple animation may be displayed.
  • Communication unit 120 The communication unit 120 transmits and receives information to and from other devices via the communication network 22, for example.
  • the communication unit 120 receives voice data or a manually input character string group from the terminal 20.
  • the communication unit 120 transmits, to the terminal 20, control information for distinguishing and displaying the acquired character string group for each unit according to the control of the display control unit 110.
  • the storage unit 122 stores various data and various software.
  • the storage unit 122 stores (temporarily) the acquired character string group and a group unit related to the character string group in association with each other.
  • the storage unit 122 can store a setting reference table 124.
  • the setting reference table 124 may be stored in another device (not shown) with which the server 10 can communicate instead of being stored in the storage unit 122.
  • Utterance 1 ⁇ For example, as illustrated in FIG. 6, first, it is assumed that the user has made an utterance 30 a “And while she's no longer with us” to the terminal 20. In this case, the terminal 20 transmits the collected voice data to the server 10. Then, the voice recognition unit 102 of the server 10 performs voice recognition on the received voice data and converts it into a character string group.
  • the language processing unit 104 performs various language processing on the character string group.
  • the summarizing unit 108 summarizes the character string groups based on the analysis result of the character string groups by the language processing unit 104 and the setting criteria relating to the unit of units stored in advance in the storage unit 122, for example.
  • the display control unit 110 distinguishes each unit 400 collected by the summarizing unit 108 (for example, surrounds it with a frame as shown in FIG. 6), and displays the character string group on the display screen (of the terminal 20). Display.
  • the display control unit 110 may further display a caret 402 indicating the current input position after the rearmost unit 400 c.
  • the user can add an arbitrary character string (for example, “,”, “.”, Etc.) to the display position of the caret 402 by manual input to the terminal 20, for example.
  • the user can edit the group unit by moving the caret 402 to the position of the group unit desired to be corrected and selecting the group unit. For example, the user can correct the character string group corresponding to the unit by deleting the unit or by re-speaking only the unit. Therefore, the user can easily edit the corresponding character string group.
  • the changing unit 106 specifies a condition that is satisfied by the character string group acquired in the past, that is, the character string group 50a shown in FIG.
  • the change unit 106 specifies a condition that is satisfied by the character string group in which the newly acquired character string group is added to the character string group 50a, that is, the character string group 50b illustrated in FIG.
  • the changing unit 106 compares the two specified conditions. In the example shown in FIG. 7, it is assumed that the two conditions are the same. In this case, the changing unit 106 determines not to change the group unit of the character string group 50a before addition.
  • the summarizing unit 108 determines a unit of the newly acquired character string group using the same setting criteria as the example shown in FIG. Then, as shown in FIG. 7, these collective units (for example, the collective unit 400 c shown in FIG. 7) are additionally displayed on the display screen 40.
  • the changing unit 106 of the server 10 determines to increase the group unit of the character string group 50c before the addition and to change the setting standard regarding the unit. Then, the changing unit 106 updates the setting criteria regarding the unit of units stored in the storage unit 122. Subsequently, the summarizing unit 108 changes the group unit of the character string group 50c before addition based on the setting criteria after the change. Further, the summarizing unit 108 determines a group unit of the newly acquired character string group based on the setting criteria after the change.
  • FIG. 10 is an explanatory diagram showing a display change example due to the change of the unit of the character string group 50c before the addition.
  • the display control unit 110 changes the display from the display screen 40 c (shown in FIG. 8) to the display screen 40 d in which the change is reflected, based on the change of the group unit.
  • the group unit 410a is displayed instead of the group unit 400a and the group unit 400b (in the character string group 50c before addition).
  • the group unit 410a is displayed instead of the group unit 400d and the group unit 400e (in the character string group 50c before addition).
  • the user can correct the character string group corresponding to the unit of the unit. That is, since it is not necessary to input all the character string groups that have already been input from the beginning, it is particularly convenient for the user when inputting voice.
  • the changing unit 106 of the server 10 determines to increase the group unit of the character string group 50f before the addition and to change the setting standard regarding the unit. Then, the changing unit 106 updates the setting criteria regarding the unit of units stored in the storage unit 122. Subsequently, the summarizing unit 108 changes the group unit of the character string group 50f before the addition based on the setting criteria after the change. Further, the summarizing unit 108 determines a group unit of the newly acquired character string group based on the setting criteria after the change.
  • FIG. 14 is an explanatory diagram showing a display change example due to a change in the unit of the character string group 50f before the addition.
  • the display control unit 110 changes the display from the display screen 40 f (shown in FIG. 12) to the display screen 40 g in which the change is reflected, based on the change of the group unit.
  • the unit 410a is displayed.
  • the display control unit 110 changes the display from the display screen 40 f (shown in FIG. 12) to the display screen 40 g in which the change is reflected, based on the change of the group unit.
  • the unit 410a is displayed.
  • the unit 410a is displayed.
  • FIG. 15 is a flowchart showing an overall flow of the operation according to the present embodiment. As shown in FIG. 15, first, for example, based on a user's predetermined operation on the terminal 20, the terminal 20 activates a voice input application. And the sound collection part 200 starts sound collection (S101).
  • the terminal 20 transmits the audio data collected by the sound collection unit 200 to the server 10 (S109).
  • the voice recognition unit 102 of the server 10 performs voice recognition on the voice data received in S109 and converts it into a character string group (S111).
  • the language processing unit 104 performs language processing on the character string group acquired in S111 (S113).
  • the language processing unit 104 performs S111 on the acquired character string group.
  • a character string group that is, a character string group after the change
  • S115 the character string group acquired in (2) is added
  • the server 10 performs a “group unit change process” to be described later (S117).
  • the display control unit 110 displays the character string group after the change in S115 or S107 on the terminal 20 by distinguishing it for each unit determined in S117 (S119). Then, the process of S103 is performed again.
  • the changing unit 106 selects a character string group acquired before the most recent S115 or S107 among a plurality of preset conditions (that is, a character string group before the change). ) Is satisfied (S151).
  • the changing unit 106 specifies a condition that is satisfied by the character string group after the change in S115 or S107 among the plurality of conditions (S153).
  • the change part 106 determines whether the conditions specified by S151 and the conditions specified by S153 are the same (S155). When both are the same (S155: Yes), the changing unit 106 determines not to change the group unit of the character string group before the change (S157). Subsequently, the summarizing unit 108 collects the character string group acquired in the latest S111 (that is, the newly acquired character string group) based on, for example, the setting criteria regarding the unit of unit stored in the storage unit 122. A unit is determined (S159). Thereby, all the collective units are determined for the character string group after the change.
  • the changing unit 106 is stored in, for example, the storage unit 122 based on the condition specified in S153 (that is, the condition that the character string group after the change satisfies).
  • the setting criteria related to the unit is changed, and the contents of the storage unit 122 are updated (S161).
  • the summarizing unit 108 changes the group unit of the character string group before the change based on the setting criteria changed in S161 (S163).
  • the summarizing unit 108 determines a unit for the character string group acquired in the latest S111 based on the setting criteria changed in S161 (S165). Thereby, all the collective units are determined for the character string after the change.
  • FIG. 15 shows an operation example in which the user repeatedly inputs a character string group by voice input, but the present invention is not limited to this example.
  • the above-described operation example can be applied to a scene where the user repeatedly inputs a character string group by manual input such as key input.
  • the terminal 20 transmits the manually input character string group to the server 10. Further, the process of S111 is omitted.
  • the server 10 dynamically changes a group unit of character string groups acquired based on, for example, voice input or manual input based on a predetermined condition.
  • the group unit can be sequentially optimized according to the total amount of character string groups (for example, the number of characters).
  • the server 10 changes the character string before the change according to the change. Dynamically change the group unit size of the group. For this reason, even if the total amount of the character string group is increased or decreased, it can be perceived by the user so that the size of each unit displayed is hardly changed. Therefore, the visibility of the entire character string group can be maintained.
  • the user desires to correct a part of the character string group that has already been input, the user re-speaks only the group unit desired to be corrected from the group units displayed on the display screen.
  • the character string group corresponding to the unit it is possible to easily correct the character string group corresponding to the unit. In other words, it is not necessary to speak all input character groups from the beginning again or to manually input them, which is convenient for the user.
  • the server 10 includes a CPU 150, a ROM (Read Only Memory) 152, a RAM 154, a bus 156, an interface 158, a storage device 160, and a communication device 162.
  • the CPU 150 functions as an arithmetic processing unit and a control unit, and controls the overall operation in the server 10 according to various programs. Further, the CPU 150 realizes the function of the control unit 100 in the server 10.
  • the CPU 150 is configured by a processor such as a microprocessor.
  • the ROM 152 stores programs used by the CPU 150 and control data such as calculation parameters.
  • the RAM 154 temporarily stores a program executed by the CPU 150, for example.
  • the bus 156 includes a CPU bus and the like.
  • the bus 156 connects the CPU 150, the ROM 152, and the RAM 154 to each other.
  • the interface 158 connects the storage device 160 and the communication device 162 to the bus 156.
  • the storage device 160 is a data storage device that functions as the storage unit 122.
  • the storage device 160 includes, for example, a storage medium, a recording device that records data on the storage medium, a reading device that reads data from the storage medium, or a deletion device that deletes data recorded on the storage medium.
  • the communication device 162 is a communication interface composed of a communication device for connecting to the communication network 22 or the like, for example. Further, the communication device 162 may be a wireless LAN compatible communication device, an LTE (Long Term Evolution) compatible communication device, or a wire communication device that performs wired communication. This communication device 162 functions as the communication unit 120.
  • LTE Long Term Evolution
  • the server 10 when it is predicted in advance that a character string group having the same amount as the character string group to be deleted (for example, the number of characters or the estimated number of unity) will be newly input after the deletion, the server 10 Even if the character string group is deleted, the unit of the character string group (before deletion) may be maintained.
  • An example of a case in which it is predicted in advance that the same amount of character string group is input may be a case where it is estimated that the user is pleading within a predetermined time.
  • an example of the case where the user's estimation is estimated may be a case where the user has deleted or modified about several characters from the character string group before deletion within a predetermined time.
  • the server 10 Even when the user inputs designation information for maintaining a unit of unit before, for example, deleting a character string group, even if the character string group is deleted, the server 10 The unit of character string group may be maintained.
  • the designation information can be input by, for example, a predetermined input on the display screen or an input of a predetermined voice command.
  • a group unit is basically configured by using a word (for example, a word when the language is English or a phrase when the language is Japanese or the like) as a unit.
  • the group unit may be composed of sentence units.
  • the server 10 may join two adjacent sentences in the corresponding character string group.
  • the server 10 may determine a sentence to be joined based on the semantic relationship between adjacent sentences. For example, the server 10 may preferentially determine sentences having a higher degree of relatedness as meanings to be joined.
  • the server 10 may determine the sentence to be joined according to the user who uttered (input) the sentence. For example, when the users who uttered (input) continuous two sentences are the same, the server 10 sets the two sentences as a joining target. In addition, regarding the two consecutive sentences, when the uttered (input) user is different for each sentence, the server 10 does not set the two sentences as a joining target. According to this determination example, for example, when creating the minutes of a meeting, the creator can collectively delete or extract sentences spoken by the same person in the meeting, which is highly convenient. .
  • the server 10 may determine a sentence to be joined based on the relationship of a user who utters (inputs) two consecutive sentences. For example, when two users utter one sentence at a time and the two users are family members or friends, the server 10 sets the two sentences as a joining target. Further, when the two users are not acquaintances, the server 10 does not set the two sentences as a joining target. For example, each user can be identified based on the identification information of the terminal 20 used by each user, the analysis result of the collected voice, or the account of the application or service being used.
  • the group unit may be configured with a pair of a question sentence and an answer sentence as a unit.
  • a question and an answer are alternately spoken (input) such as question A, answer A (for question A), question B, and answer B (for question B).
  • the server 10 may use a set of a question and an answer to the question (for example, a set of the question A and the answer A) as a unit.
  • Each question and answer may be a single sentence or a plurality of sentences.
  • the creator can delete or extract a set of the question and the answer to the question in a batch on a question basis. Convenience is high.
  • the question sentence and the answer sentence can be specified based on the analysis result of the modality included in the sentence, the result of the syntax analysis or semantic analysis of the sentence, or the analysis result of the intonation of the collected voice.
  • the group unit may be configured with a topic as a unit.
  • a dialogue regarding three types of topics for example, project A, project B, and project C
  • the server 10 may set all sentences spoken (input) by a plurality of users regarding the topic as a unit.
  • the configuration of the information processing system according to the present embodiment is not limited to the example illustrated in FIG.
  • FIG. 1 only one server 10 is illustrated, but the present invention is not limited to this example, and the functions of the server 10 described above may be realized by a plurality of computers operating in cooperation.
  • FIG. 1 only one terminal 20 is illustrated, but the present invention is not limited to this example, and the information processing system may include a plurality of terminals 20.
  • the configuration of the server 10 according to the present embodiment is not limited to the example illustrated in FIG.
  • at least one or more of the voice recognition unit 102, the language processing unit 104, and the display control unit 110 is included in another device that can communicate with the server 10, such as the terminal 20, instead of being included in the server 10. May be.
  • the information processing apparatus may be the terminal 20.
  • the terminal 20 first transmits collected voice data or a manually input character string group to the server 10. Then, the terminal 20 receives from the server 10 a character string group obtained by voice recognition on the voice data and various language processing results for the acquired character string group.
  • the terminal 20 can execute the functions of the changing unit 106 and the summarizing unit 108 described above based on these pieces of information.
  • the terminal 20 may include all the components included in the control unit 100 described above.
  • the server 10 is not necessarily installed.
  • each step in the operation of the above-described embodiment does not necessarily have to be processed in the order described.
  • the steps may be processed by changing the order as appropriate.
  • Each step may be processed in parallel or individually instead of being processed in time series. Further, some of the described steps may be omitted, or another step may be further added.
  • An acquisition unit for acquiring a first character string group A changing unit that changes a unit of the group related to the first character string group based on the first character string group and a predetermined condition;
  • An information processing apparatus comprising: (2) The predetermined condition includes a plurality of different conditions, The change unit according to (1), wherein the change unit changes a unit of the group related to the first character string group based on which of the plurality of conditions the first character string group satisfies.
  • the predetermined condition includes a plurality of different conditions
  • the acquisition unit further acquires a second character string group
  • the changing unit is configured based on which of the plurality of conditions satisfies a third character string group that is a character string group obtained by adding the second character string group to the first character string group.
  • the information processing apparatus according to (1) or (2), wherein a unit of a group related to the first character string group is changed.
  • the changing unit is configured to compare the first character string group among the plurality of conditions with the condition satisfied by the third character string group among the plurality of conditions.
  • the information processing apparatus according to (3) wherein the unit of the group related to the character string group is changed.
  • the changing unit changes a unit of the group related to the first character string group,
  • the changing unit does not change the unit of the group related to the first character string group.
  • the changing unit includes: a condition that the first character string group before the addition satisfies among the plurality of conditions; a condition that the first character string group after the addition satisfies among the plurality of conditions; The information processing apparatus according to (4) or (5), wherein the unit of the group related to the first character string group before the addition is changed based on the comparison of the first character string group. (7) The changing unit further determines a unit of the group related to the second character string group based on a condition satisfied by the third character string group among the plurality of conditions. (3) to (6) The information processing apparatus according to any one of the above.
  • the predetermined condition includes a plurality of different conditions
  • the acquisition unit further acquires editing information for the first character string group
  • the changing unit includes: a condition that the first character string group satisfies among the plurality of conditions; and a character string group in which the first character string group is changed based on the editing information among the plurality of conditions.
  • the information according to any one of (1) to (7), wherein the unit of the group relating to the first character string group is changed based on a comparison with a condition satisfied by the fourth character string group. Processing equipment.
  • the changing unit changes a unit of the group related to the first character string group based on a setting criterion associated with a condition satisfied by the third character string group. (3) to (7)
  • the information processing apparatus according to any one of claims.
  • the predetermined condition includes a condition relating to a range of the number of characters included in the character string group.
  • the predetermined condition includes a condition related to a range of a number of collective units related to a character string group.
  • the predetermined condition includes a condition related to a range of a number of phonemes corresponding to a character string group.
  • the predetermined condition includes a condition related to a language processing result of a character string group.
  • the changing unit changes a unit of the group related to the first character string group by joining a plurality of units of the unit or dividing one or more units of the unit.
  • the information processing apparatus according to any one of (13) to (13).
  • the changing unit changes the unit of the group related to the first character string group by joining the unit of the group including a modality and one or more units of the unit not including a modality. ) Or the information processing apparatus according to (15).
  • the change unit changes the unit of the group related to the first character string group by joining the units of the unit having a dependency relationship, any one of (14) to (16) Information processing apparatus according to.
  • the information processing apparatus further includes a display control unit that displays the first character string group on a display screen, The information processing apparatus according to any one of (1) to (17), wherein the display control unit causes the display unit to display the unit separately for each unit.
  • (19) Obtaining a first string group; Based on the first character string group and a predetermined condition, the processor changes a unit of the group related to the first character string group; Including an information processing method.
  • server 20 terminal 22 communication network 100 control unit 102 speech recognition unit 104 language processing unit 106 change unit 108 summary unit 110 display control unit 120 communication unit 122 storage unit 124 setting reference table 200 sound collection unit 202 operation display unit

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • User Interface Of Digital Computer (AREA)
  • Machine Translation (AREA)

Abstract

【課題】取得される文字列群に適応的に、当該文字列群に関するまとまりの単位を変更することが可能な、情報処理装置、情報処理方法、およびプログラムを提案する。 【解決手段】第1の文字列群を取得する取得部と、前記第1の文字列群および所定の条件に基づいて、前記第1の文字列群に関するまとまりの単位を変更する変更部と、を備える、情報処理装置。

Description

情報処理装置、情報処理方法、およびプログラム
 本開示は、情報処理装置、情報処理方法、およびプログラムに関する。
 従来、自然言語処理に関する技術が各種提案されている。例えば、入力された文字列に含まれる個々の単語を解析したり、当該文字列の文法構造を解析するための技術が提案されている。
 また、下記特許文献1には、複数の語句のうちユーザに選択された語句に基いて文を作成する技術が開示されている。
特開2012-53634号公報
 ところで、例えば入力された文字列群が複数のまとまりにまとめられることも望まれる。しかしながら、従来の技術では、取得される文字列群によらずに、当該文字列群は固定の単位でまとめられてしまう。
 そこで、本開示では、取得される文字列群に適応的に、当該文字列群に関するまとまりの単位を変更することが可能な、新規かつ改良された情報処理装置、情報処理方法、およびプログラムを提案する。
 本開示によれば、第1の文字列群を取得する取得部と、前記第1の文字列群および所定の条件に基づいて、前記第1の文字列群に関するまとまりの単位を変更する変更部と、を備える、情報処理装置が提供される。
 また、本開示によれば、第1の文字列群を取得することと、前記第1の文字列群および所定の条件に基づいて、前記第1の文字列群に関するまとまりの単位をプロセッサが変更することと、を含む、情報処理方法が提供される。
 また、本開示によれば、コンピュータを、第1の文字列群を取得する取得部と、前記第1の文字列群および所定の条件に基づいて、前記第1の文字列群に関するまとまりの単位を変更する変更部、として機能させるための、プログラムが提供される。
 以上説明したように本開示によれば、取得される文字列群に適応的に、当該文字列群に関するまとまりの単位を変更することができる。なお、ここに記載された効果は必ずしも限定されるものではなく、本開示中に記載されたいずれかの効果であってもよい。
本開示の実施形態による情報処理システムの構成例を示した説明図である。 ユーザにより入力される文字列群の一例を示した図である。 本開示の比較例による、図2に示した文字列群に関して決定されたまとまり単位の表示例を示した図である。 同実施形態によるサーバ10の構成例を示した機能ブロック図である。 同実施形態による設定基準テーブル124の構成例を示した説明図である。 同実施形態の適用例の一部を示した説明図である。 同実施形態の適用例の一部を示した説明図である。 同実施形態の適用例の一部を示した説明図である。 同実施形態の適用例の一部を示した説明図である。 同実施形態の適用例の一部を示した説明図である。 同実施形態の適用例の一部を示した説明図である。 同実施形態の適用例の一部を示した説明図である。 同実施形態の適用例の一部を示した説明図である。 同実施形態の適用例の一部を示した説明図である。 同実施形態による動作の流れを示したフローチャートである。 同実施形態による「まとまり単位の変更処理」の流れを示したフローチャートである。 同実施形態によるサーバ10のハードウェア構成例を示した説明図である。
 以下に添付図面を参照しながら、本開示の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。
 また、本明細書及び図面において、実質的に同一の機能構成を有する複数の構成要素を、同一の符号の後に異なるアルファベットを付して区別する場合もある。例えば、実質的に同一の機能構成を有する複数の構成を、必要に応じてサーバ10aおよびサーバ10bのように区別する。ただし、実質的に同一の機能構成を有する複数の構成要素の各々を特に区別する必要がない場合、同一符号のみを付する。例えば、サーバ10aおよびサーバ10bを特に区別する必要が無い場合には、単にサーバ10と称する。
 また、以下に示す項目順序に従って当該「発明を実施するための形態」を説明する。
 1.情報処理システムの構成
 2.実施形態の詳細な説明
 3.ハードウェア構成
 4.変形例
<<1.情報処理システムの構成>>
 まず、本開示の実施形態による情報処理システムの構成について、図1を参照して説明する。図1に示すように、当該情報処理システムは、サーバ10、端末20、および、通信網22を含む。
 <1-1.端末20>
 端末20は、ユーザが使用する情報処理端末である。例えば、端末20は、ユーザの発話時の音声を集音したり、文字列の入力を受け付けることが可能である。図1に示すように、端末20は、例えば、集音部200、および、操作表示部202を含む。
 集音部200は、例えばマイクロフォンである。集音部200は、外部の音(空気振動)を検出し、そして、電気信号に変換する。
 操作表示部202は、表示画面を表示する表示部、および、ユーザによるタッチ操作を検出する操作部を含む。当該表示部は、例えば、LCD(Liquid Crystal Display)装置やOLED(Organic Light Emitting Diode)装置により構成される。また、当該操作部は、例えばタッチパネルにより構成される。例えば、操作表示部202は、ユーザによる文字列群の入力を受け付ける。一例として、操作表示部202は、ソフトウェアキーボードを表示し、そして、当該ソフトウェアキーボードに対するタッチ操作による文字列群の入力を受け付ける。ここで、文字列群は、一以上の文字列である。
 また、端末20は、通信網22を介して他の装置と通信することが可能である。例えば、端末20は、集音部200により集音された音声データや、操作表示部202に対して入力された文字列群などを、通信網22を介してサーバ10へ送信する。
 なお、端末20は、有線または無線により入力装置(例えばキーボードやリモートコントローラなど)(図示せず)に接続され得る。この場合、端末20は、当該入力装置を用いてユーザが手入力(例えばキー入力)した文字列群をサーバ10へ送信することも可能である。
 なお、図1では、端末20がスマートフォンである例を示しているが、かかる例に限定されない。例えば、端末20は、汎用PC(Personal Computer)、タブレット型端末、ゲーム機、スマートフォン以外の電話機、携帯型音楽プレーヤ、テレビジョン受信機、ロボット、または、例えばHMD(Head Mounted Display)、ヘッドセット、または、スマートウォッチなどのウェアラブルデバイスであってもよい。
 <1-2.サーバ10>
 サーバ10は、本開示における情報処理装置の一例である。サーバ10は、自然言語処理機能を有する。例えば、サーバ10は、後述する通信網22を介して端末20から受信される音声データに対して音声認識(クラウド音声認識)を行うことが可能である。また、サーバ10は、通信網22を介して端末20から受信される文字列群や、音声認識結果から得られる文字列群に対して各種の言語処理を行うことが可能である。
 また、サーバ10は、当該文字列群に対する言語処理の結果に基づいて、当該文字列群に関して一以上のまとまりの単位(以下、「まとまり単位」と称する)を決定することが可能である。ここで、まとまり単位は、一以上の文字から構成される。例えば、まとまり単位は、一以上の語から構成され得る。より具体的には、言語が英語やドイツ語などである場合には、まとまり単位は一以上の単語から構成され、また、言語が日本語である場合には、まとまり単位は一以上の文節から構成され得る。
 また、サーバ10は、端末20に対して例えば表示制御など各種の制御を行うことが可能である。例えば、サーバ10は、当該文字列群に関して決定したまとまり単位ごとに表示を区別して、当該文字列群を端末20に表示させる。
 <1-3.通信網22>
 通信網22は、通信網22に接続されている装置から送信される情報の有線、または無線の伝送路である。例えば、通信網22は、電話回線網、インターネット、衛星通信網などの公衆回線網や、Ethernet(登録商標)を含む各種のLAN(Local Area Network)、WAN(Wide Area Network)などを含んでもよい。また、通信網22は、IP-VPN(Internet Protocol-Virtual Private Network)などの専用回線網を含んでもよい。
 <1-4.課題の整理>
 以上、本実施形態による情報処理システムの構成について説明した。ところで、例えば、会議の議事録や小説など、文字数の多い文字列群が端末20に対して入力される場面も想定される。このような場合、仮にまとまり単位(例えば大きさなど)が固定的に設定されると、当該文字列群から得られるまとまり単位の表示時に文字列群全体の視認性が低くなるという問題がある。
 ここで、図2および図3を参照して、上記の内容についてより詳細に説明する。例えば、図2に示したような文字列群30が音声入力や手入力により、ユーザにより入力されたとする。なお、図2に示した文字列群30(英文)は、「2008年11月4日のバラク・オバマ氏の演説」の書写の一部である(“Transcript:‘This is your victory’,says Obama” CNN.com.2008.<http://edition.cnn.com/2008/POLITICS/11/04/obama.transcript/>)。
 この場合、文字列群30に対する言語処理の結果に基づいて、例えば図3に示したように、複数のまとまり単位400が決定され、表示画面40に表示される。しかしながら、文字列群30は長文であるので、まとまり単位400が固定的に設定される場合には、表示画面40上に多数のまとまり単位400が表示されてしまう。その結果、個々のまとまり単位が相対的に小さいようにユーザに知覚され得るので、文字列群の全体をユーザは視認し難くなる。
 そこで、上記事情を一着眼点にして、本実施形態によるサーバ10を創作するに至った。本実施形態によるサーバ10は、所定の条件に基づいて、取得された文字列群に関するまとまり単位を動的に変更する。例えば、サーバ10は、文字列群の全体量(例えば文字数やまとまり単位の推定数など)に応じて、まとまり単位を逐次最適化することができる。
<<2.実施形態の詳細な説明>>
 <2-1.構成>
 次に、本実施形態による構成について詳細に説明する。図4は、本実施形態によるサーバ10の構成例を示した機能ブロック図である。図4に示すように、サーバ10は、制御部100、通信部120、および、記憶部122を有する。
 {2-1-1.制御部100)
 制御部100は、サーバ10に内蔵される、例えば、後述するCPU(Central Processing Unit)150や、後述するRAM(Random Access Memory)154などのハードウェアを用いて、サーバ10の動作を統括的に制御する。また、図4に示すように、制御部100は、音声認識部102、言語処理部104、変更部106、まとめ部108、および、表示制御部110を有する。
 {2-1-2.音声認識部102}
 音声認識部102は、例えば端末20から受信される音声データに対して音声認識を行い、文字列群に変換する。また、音声認識部102は、変換後の文字列群を言語処理部104に伝達する。
 {2-1-3.言語処理部104}
 言語処理部104は、本開示における取得部の一例である。言語処理部104は、音声認識部102から伝達される文字列群や、端末20から受信される文字列群を取得する。そして、言語処理部104は、取得した文字列群に対して各種の言語処理(例えば形態素解析、構文解析、および、意味解析など)を行う。例えば、言語処理部104は、まず、取得された文字列群に対して形態素解析を行う。次に、言語処理部104は、形態素解析の結果に基づいて、当該文字列群の構文解析を行う。例えば、言語処理部104は、当該文字列群に含まれる単語(英語などの場合)や文節(日本語などの場合)同士の係り受けの解析などを行う。そして、言語処理部104は、構文解析の結果に基づいて、当該文字列群の意味解析を行う。例えば、言語処理部104は、当該文字列群に含まれるモダリティの解析などを行う。
 また、言語処理部104は、取得した文字列群、および、言語処理の結果を変更部106、まとめ部108、および、記憶部122へ伝達する。
 {2-1-4.変更部106}
 (2-1-4-1.まとまり単位の変更判定)
 変更部106は、本開示における変更部の一例である。変更部106は、所定の条件に基づいて、取得された文字列群に関するまとまり単位を決定する。ここで、所定の条件は、互いに異なる複数の条件(互いに重複しない複数の条件)を含み得る。なお、所定の条件の具体例については後述する。
 ‐判定例1
 例えば、新たに文字列群が取得された場合、変更部106は、過去に取得済みの文字列群(以下、「変更前の文字列群」と称する)が当該複数の条件のうちいずれを満たすかに基いて、当該変更前の文字列群のまとまり単位を変更するか否かを決定する。または、この場合、変更部106は、当該変更前の文字列群に対して当該新たに取得された文字列群が追加された文字列群(以下、「変更後の文字列群」と称する)が当該複数の条件のうちいずれを満たすかに基いて、当該変更前の文字列群のまとまり単位を変更するか否かを決定する。ここで、変更前の文字列群は、本開示における第1の文字列群の一例である。また、新たに取得された文字列群は、本開示における第2の文字列群の一例である。また、変更後の文字列群は、本開示における第3の文字列群の一例である。
 例えば、変更部106は、当該複数の条件のうち変更前の文字列群が満たす条件と、(当該複数の条件のうち)変更後の文字列群が満たす条件とを比較することにより、変更前の文字列群のまとまり単位を変更するか否かを決定する。より具体的には、変更前の文字列群が満たす条件と、変更後の文字列群が満たす条件とが異なる場合には、変更部106は、変更前の文字列群のまとまり単位を変更することを決定する。また、変更前の文字列群が満たす条件と、変更後の文字列群が満たす条件とが同一である場合には、変更部106は、変更前の文字列群のまとまり単位を変更しないことを決定する。
 なお、新たに文字列群が取得される度に、変更部106は、当該文字列群の取得時より過去に取得済みの文字列群(つまり、変更前の文字列群)が満たす条件と、当該新たに取得された文字列群の追加後の文字列群(つまり、変更後の文字列群)が満たす条件とが同一であるか否かを逐次比較し、そして、当該変更前の文字列群のまとまり単位を変更するか否かを決定する。
 ‐判定例2
 または、すでに取得済みの文字列群(変更前の文字列群)に対する編集情報が取得された場合には、変更部106は、当該変更前の文字列群が満たす条件と、当該編集情報に基づいて当該変更前の文字列群が変更された文字列群(つまり、変更後の文字列群)が満たす条件とを比較することにより、当該変更前の文字列群のまとまり単位を変更するか否かを決定することも可能である。ここで、編集情報は、該当の文字列群に対する所定の記号(例えば「,」、「.」、「?」など)の挿入や、該当の文字列群の一部の削除などの情報であり得る。
 ‐条件例1:文字数
 ここで、上述した所定の条件の具体例について説明する。例えば、当該所定の条件は、文字列群に含まれる文字の数の範囲に関する複数の条件を含み得る。例えば、当該複数の条件は、条件A1、条件A2、条件A3などを含み、そして、条件A1は「(文字列群に含まれる)文字の数が0以上100未満であること」、条件A2は「文字の数が100以上200未満であること」、かつ、条件A3は「文字の数が200以上300未満であること」などのように定められ得る。この場合、変更前の文字列群が満たす条件と変更後の文字列群が満たす条件とが異なり、かつ、変更前の文字列群に含まれる文字の数よりも、変更後の文字列群に含まれる文字の数の方が多い場合には、変更部106は、変更前の文字列群のまとまり単位を大きくする(変更する)ことを決定する。
 なお、当該複数の条件の各々と閾値(例えば、各条件における文字数の範囲の下限値)とが関連付けてテーブルに登録されていてもよい。この場合、変更部106は、変更前(または変更後)の文字列群に含まれる文字の数と、個々の条件に関連付けられている閾値とをそれぞれ比較することにより、変更前(または変更後)の文字列群が満たす条件を特定し得る。例えば、条件A1の閾値が「0」、条件A2の閾値が「100」、かつ、条件A3の閾値が「200」とそれぞれ登録されており、かつ、変更前の文字列群に含まれる文字数が「80」であるとする。この場合、当該文字列群に含まれる文字数は、条件A1の閾値以上であり、かつ、条件A2の閾値よりも小さいので、変更部106は、当該文字列群が満たす条件を条件A1と特定してもよい。
 ‐条件例2:まとまり単位の数
 または、当該所定の条件は、文字列群のまとまり単位の数に関する複数の条件を含み得る。例えば、当該複数の条件は、条件B1および条件B2を含み、そして、条件B1は「文字列群のまとまり単位の数(または推定数)が10未満であること」、かつ、条件B2は、「文字列群のまとまり単位の数(または推定数)が10以上であること」などのように定められ得る。この場合、変更前の文字列群が満たす条件と変更後の文字列群が満たす条件とが異なり、かつ、変更前の文字列群のまとまり単位の数よりも、変更後の文字列群のまとまり単位の数の方が多い場合には、変更部106は、変更前の文字列群のまとまり単位を大きくする(変更する)ことを決定する。
 なお、変更後の文字列群のまとまり単位の数は、以下のように算出され得る。例えば、文字列群が新たに取得される場合に関しては、当該新たに取得された文字列群を現在の設定基準を用いてまとめた場合におけるまとまり単位の推定数と、当該変更前の文字列群のまとまり単位の数との和として、当該変更後の文字列群のまとまり単位の数は算出される。また、文字列群が削除される場合に関しては、当該変更後の文字列群のまとまり単位の数は、当該削除後に残るまとまり単位の数である。なお、上記の設定基準は、例えば、文字列群に関するまとまり単位の数に関する制約条件(例えばまとまり単位の数が10以下など)であってもよいし、または、一つのまとまり単位に含まれる文字数に関する制約条件(例えば20文字以下など)などであってもよい。
 ‐条件例3:言語処理結果
 または、当該所定の条件は、文字列群に関する言語処理結果に関する複数の条件を含み得る。ここで、言語処理結果は、該当の文字列群から解析された、例えば特定の「句」(例えば名詞句など)の数、特定の「品詞」(例えば名詞など)の数、または、自立語の数(日本語などの場合)などである。例えば、当該複数の条件は、条件C1、条件C2、条件C3などを含み、そして、条件C1は「(文字列群に含まれる)名詞の数が0以上10未満であること」、条件C2は「名詞の数が10以上20未満であること」、かつ、条件C3は「名詞の数が20以上30未満であること」などのように定められ得る。この場合、変更前の文字列群が満たす条件と変更後の文字列群が満たす条件とが異なり、かつ、変更前の文字列群に含まれる名詞の数よりも、変更後の文字列群に含まれる名詞の数の方が多い場合には、変更部106は、変更前の文字列群のまとまり単位を大きくする(変更する)ことを決定する。この条件例によれば、文字列群の情報量が多いほどまとまり単位をより大きくし得る。従って、文字列群の情報量を反映させて文字列群をまとめることが可能になる。
 ‐条件例4:音素の数
 または、所定の条件は、文字列群に対応する音素の数の範囲に関する複数の条件を含み得る。例えば、当該複数の条件は、条件D1、条件D2、条件D3などを含み、そして、条件D1は「(文字列群に対応する)音素の数が0以上80未満であること」、条件D2は「音素の数が80以上160未満であること」、かつ、条件D3は「音素の数が160以上240未満であること」などのように定められ得る。この場合、変更前の文字列群が満たす条件と変更後の文字列群が満たす条件とが異なり、かつ、変更前の文字列群に対応する音素の数よりも変更後の文字列群に対応する音素の数の方が多い場合には、変更部106は、変更前の文字列群のまとまり単位を大きくする(変更する)ことを決定する。なお、音素の数は、該当の文字列群に対応する音声認識結果から特定されてもよいし、該当の文字列群に対する言語処理結果から特定されてもよい。
 ‐条件例5:モダリティ
 または、当該所定の条件は、文字列群から解析されるモダリティに関する複数の条件を含み得る。例えば、当該複数の条件は、文字列群から解析されるモダリティの数の範囲に関する複数の条件である。一例として、当該複数の条件は、条件E1、条件E2、条件E3などを含み、そして、条件E1は「(文字列群から解析される)モダリティの数が0であること」、条件E2は「モダリティの数が1であること」、かつ、条件E3は「モダリティの数が2であること」などのように定められ得る。この場合、変更前の文字列群が満たす条件と変更後の文字列群が満たす条件とが異なり、かつ、変更前の文字列群から解析されるモダリティの数よりも、変更後の文字列群から解析されるモダリティの数の方が多い場合には、変更部106は、変更前の文字列群のまとまり単位を大きくする(変更する)ことを決定する。なお、対象のモデリティの種類は、任意の種類であってもよいし、または、特定の種類であってもよい。
 ‐条件例6:ユーザの編集情報
 または、当該所定の条件は、ユーザの編集情報の有無に関する条件を含み得る。例えば、所定の条件は、「ユーザの編集情報が取得され、かつ、当該編集情報に基づいて該当の文字列群が変更されたこと」であり得る。この場合、変更後の文字列群が当該所定の条件を満たす場合には、変更部106は、当該編集情報に応じて、変更前の文字列群のまとまり単位を変更することを決定する。なお、編集情報の内容は上記の説明と同様であり得る。
 ‐条件の組み合わせ
 または、当該所定の条件は、上述した複数の種類の条件を含んでもよい。この場合、複数の種類の条件に関して、変更前の文字列群が満たす条件の組み合わせと、変更後の文字列群が満たす条件の組み合わせとが異なる場合には、変更部106は、変更前の文字列群のまとまり単位を変更することを決定し得る。また、当該変更前の文字列群が満たす条件の組み合わせと、当該変更後の文字列群が満たす条件の組み合わせとが同一である場合には、変更部106は、変更前の文字列群のまとまり単位を変更しないことを決定し得る。
 例えば、当該複数の条件が、文字列群に含まれる文字の数の範囲に関する複数の条件と、文字列群に関するまとまりの単位の数に関する複数の条件とから構成されるとする。そして、変更前の文字列群の文字数が「80」であり、変更前の文字列群のまとまり単位の数が「9」であり、変更後の文字列群の文字数が「95」であり、かつ、(仮に、新たに取得された文字列群を現在の設定基準を用いてまとめた場合における)変更後の文字列群のまとまり単位の数が「11」であるとする。この場合、変更前の文字列群が満たす条件の組み合わせは(条件A1、条件B1)であり、また、変更後の文字列群が満たす条件の組み合わせは(条件A1、条件B2)であるので、両者は異なる。このため、変更部106は、変更前の文字列群のまとまり単位を変更する(大きくする)ことを決定する。
 (2-1-4-2.まとまり単位に関する設定基準の変更)
 さらに、まとまり単位を変更することを決定した場合には、変更部106は、例えば記憶部122に記憶されている、まとまり単位に関する現在の設定基準を、まとまり単位の変更内容に応じて変更する。
 例えば、上述した複数の条件と、まとまり単位に関する設定基準とが関連付けられた設定基準テーブル124が準備され得る。この場合、まとまり単位を変更することを決定した場合には、変更部106は、設定基準テーブル124において、変更後の文字列群が満たす条件に関連付けられている設定基準に(現在の設定基準を)変更し、そして、記憶部122の内容を更新してもよい。
 図5は、設定基準テーブル124の構成例を示した説明図である。図5に示したように、設定基準テーブル124では、例えば、まとめレベル1240、条件1242、および、設定基準1244が関連付けられる。なお、図5では、条件1242が、文字列群に含まれる文字数の範囲に関する複数の条件である例を示している。また、設定基準1244が、まとまり単位の変更時におけるまとまり単位の数に関する設定基準(制約条件)である例を示している。図5に示した例では、変更後の文字列群に含まれる文字数が「100以上199以下」であり、かつ、まとまり単位を変更することを決定した場合には、変更部106は、現在の設定基準から、まとめレベルが「2」の設定基準(つまり、まとまり単位の変更時におけるまとまり単位数を「7」に定める設定基準)へ変更する。
 {2-1-5.まとめ部108}
 まとめ部108は、本開示における変更部の一例である。まとめ部108は、(変更部106による)まとまり単位の変更に関する判定結果と、記憶部122に記憶されている、まとまり単位に関する設定基準とに基いて、当該文字列群をまとめる。例えば、変更前の文字列群のまとまり単位を変更することが変更部106により決定された場合には、まとめ部108は、変更後の文字列群が当該設定基準を満たすように、変更前の文字列群のまとまり単位を変更する。
 (2-1-5-1.まとまり単位の接合)
 例えば、変更前の文字列群のまとまり単位を大きくすることが決定された場合には、まとめ部108は、まず、当該設定基準に基いて接合対象の複数のまとまり単位の組を一以上選択し、そして、選択した組ごとに、当該組に含まれる全てのまとまり単位を接合する。
 一例として、まとめ部108は、変更前の文字列群における隣接するまとまり単位同士をそれぞれ接合する。
 または、まとめ部108は、変更前の文字列群に含まれるモダリティを含むまとまり単位と、モダリティを含まない一以上のまとまり単位との組を接合対象として一以上選択し、そして、選択した組ごとに、当該組に含まれる全てのまとまり単位を接合する。例えば、当該文字列群の言語が日本語であり、かつ、変更前の文字列群に関する個々のまとまり単位が一つの文節である場合には、まとめ部108は、まず、変更前の文字列群に含まれる、モダリティを含む文節、および、当該文節よりも前に位置するモダリティを含まない文節全ての組をそれぞれ接合対象として選択する。そして、まとめ部108は、選択した組ごとに、当該組に含まれる全ての文節を接合する。
 または、まとめ部108は、複数のまとまり単位同士の関係性に基づいて、複数のまとまり単位を接合する。例えば、まとめ部108は、変更前の文字列群において係り受けの関係にあるまとまりの単位同士を接合する。
 または、まとめ部108は、変更前の文字列群に関して先頭から所定の個数のまとまり単位ずつを接合対象の組としてそれぞれ選択し、そして、選択した組ごとに、当該組に含まれる全てのまとまり単位を接合する。
 (2-1-5-2.まとまり単位の分割)
 また、変更前の文字列群のまとまり単位を小さくすることが変更部106により決定された場合には、まとめ部108は、まず、当該設定基準に基いて分割対象のまとまり単位を一以上選択し、そして、選択したまとまり単位をそれぞれ2つ以上のまとまり単位に分割する。
 例えば、当該文字列群の言語が英語などである場合には、まとめ部108は、分割対象として選択したまとまり単位ごとに、当該まとまり単位から分割される個々のまとまり単位に含まれる単語数がほぼ均等になるように当該まとまり単位を分割する。または、当該文字列群の言語が日本語である場合には、まとめ部108は、分割対象として選択したまとまり単位ごとに、当該まとまり単位から分割される個々のまとまり単位に含まれる文節数がほぼ均等になるように当該まとまり単位を分割する。
 (2-1-5-3.新たな文字列群のまとまり単位)
 また、新たに文字列群が取得された場合に関しては、まとめ部108は、例えば記憶部122に記憶されている、最新の設定基準に基いて、当該新たに取得された文字列群のまとまり単位を決定する。つまり、追加後の文字列群(すなわち、変更前の文字列群、および、新たに取得された文字列群)は全て、同一の設定基準に基いてまとめられる。
 {2-1-6.表示制御部110}
 表示制御部110は、端末20に対して、取得済みの文字列群を表示させる制御を行う。例えば、表示制御部110は、まとめ部108によりまとめられたまとまり単位ごとに区別して、当該文字列群を(端末20の)表示画面に表示させる。
 また、変更前の文字列群のまとまり単位を変更することが変更部106により決定された場合には、表示制御部110は、変更(接合や分割)されたまとまり単位を強調して表示画面に表示させることも可能である。例えば、表示制御部110は、変更されたまとまり単位の表示色を、デフォルトの表示色(換言すれば、変更されないまとまり単位の表示色)とは異ならせて表示させてもよい。なお、より具体的な内容に関しては図10を参照して後述する。
 または、例えば、複数のまとまり単位が接合される場合には、表示制御部110は、接合されたまとまり単位に関して、接合前の個々のまとまり単位の位置を明示するように表示させてもよい。一例として、表示制御部110は、接合後のまとまり単位の表示領域において該当の位置に破線を表示させたり、または、該当の位置または近傍だけ別の形状(例えば、くびれた形など)に変形して表示させてもよい。
 または、一以上のまとまり単位が変更される場合には、表示制御部110は、該当のまとまり単位の変更を示すアニメーションを表示させてもよい。例えば、変更前の文字列群に関する複数のまとまり単位が接合される場合には、表示制御部110は、当該複数のまとまり単位が徐々に接近していき、そして、接合されるようなアニメーションを表示させてもよい。また、一つのまとまり単位が2つ以上に分割される場合には、表示制御部110は、分割前のまとまり単位が徐々に分離していき、そして、2つ以上のまとまり単位が形成されるようなアニメーションを表示させてもよい。
 {2-1-7.通信部120}
 通信部120は、例えば通信網22を介して他の装置との間で情報の送受信を行う。例えば、通信部120は、音声データや、手入力された文字列群を端末20から受信する。また、通信部120は、表示制御部110の制御に従って、取得済みの文字列群をまとまり単位ごとに区別して表示させるための制御情報を端末20へ送信する。
 {2-1-8.記憶部122}
 記憶部122は、各種のデータや各種のソフトウェアを記憶する。例えば、記憶部122は、取得済みの文字列群と、当該文字列群に関するまとまり単位とを関連付けて(一時的に)記憶する。また、図4に示すように、記憶部122は、設定基準テーブル124を記憶し得る。なお、設定基準テーブル124は、記憶部122に記憶される代わりに、サーバ10が通信可能な他の装置(図示せず)に記憶されてもよい。
 <2-2.適用例>
 以上、本実施形態による構成について説明した。次に、本実施形態の適用例について、図6~図14を参照して説明する。なお、ここでは、ユーザが、図2に示した文字列群30の一部ずつを端末20に対して発話(音声入力)する例について説明する。
 {2-2-1.発話1}
 例えば、図6に示したように、まず、ユーザは、“And while she’s no longer with us,”という発話30aを端末20に対して行ったとする。この場合、端末20は、集音された音声データをサーバ10へ送信する。そして、サーバ10の音声認識部102は、受信された音声データに対して音声認識を行い、文字列群に変換する。
 続いて、言語処理部104は、当該文字列群に対して各種の言語処理を行う。そして、まとめ部108は、言語処理部104による当該文字列群の解析結果と、例えば記憶部122に予め記憶されている、まとまり単位に関する設定基準とに基いて、当該文字列群をまとめる。
 その後、表示制御部110は、まとめ部108によりまとめられたまとまり単位400ごとに区別して(例えば図6に示したように枠で囲うなど)、当該文字列群を(端末20の)表示画面に表示させる。
 また、図6に示したように、表示制御部110は、一番後ろに位置するまとまり単位400cの後に、現在の入力位置を示すキャレット402をさらに表示させてもよい。この場合、ユーザは、例えば端末20に対する手入力により、任意の文字列(例えば「,」や「.」など)をキャレット402の表示位置に追加することができる。また、ユーザは、例えば修正を希望するまとまり単位の位置までキャレット402を移動させ、そして、当該まとまり単位を選択することにより、当該まとまり単位を編集することもできる。例えば、ユーザは、当該まとまり単位を削除したり、または、当該まとまり単位のみを再度発話し直すことにより、当該まとまり単位に対応する文字列群を修正することができる。従って、ユーザは、該当の文字列群を容易に編集することができる。
 {2-2-2.発話2}
 その後、図7に示したように、ユーザは、“I know my grandmother’s watching,”という発話30bを端末20に対して行ったとする。この場合、図6に示した例と同様に、端末20は、集音された音声データをサーバ10へ送信し、そして、サーバ10の音声認識部102は、受信された音声データに対して音声認識を行い、文字列群に変換する。そして、言語処理部104は、(音声認識部102から)新たに取得される文字列群(つまり、発話30bに対応する文字列群)に対して各種の言語処理を行う。
 その後、変更部106は、複数の条件のうち、過去に取得済みの文字列群、つまり図6に示した文字列群50aが満たす条件を特定する。次に、変更部106は、文字列群50aに当該新たに取得された文字列群が追加された文字列群、つまり図7に示した文字列群50bが満たす条件を特定する。そして、変更部106は、特定した2つの条件を比較する。なお、図7に示した例では、当該2つの条件は同一であるものとする。この場合、変更部106は、追加前の文字列群50aのまとまり単位を変更しないことを決定する。
 そして、まとめ部108は、図6に示した例と同じ設定基準を用いて、当該新たに取得された文字列群のまとまり単位を決定する。そして、図7に示したように、これらのまとまり単位(例えば図7に示したまとまり単位400cなど)は、表示画面40に追加表示される。
 {2-2-3.発話3}
 その後、図8に示したように、ユーザは、“along with the family that made me who I am.”という発話30cを端末20に対して行ったとする。なお、この場合、(図7に示した)過去に取得済みの文字列群50bが満たす条件と、新たに取得された文字列群(つまり発話30cに対応する文字列群)の追加後の文字列群50cが満たす条件とは同一であるものとする。従って、当該追加前の文字列群50bのまとまり単位は変更されない。また、新たに取得された文字列群は、図6に示した例と同じ設定基準を用いてまとめられる。そして、図8に示したように、これらのまとまり単位は、表示画面40に追加表示される。
 {2-2-4.発話4}
 その後、図9に示したように、ユーザは、“I miss them tonight.”という発話30dを端末20に対して行ったとする。なお、この場合、(図8に示した)過去に取得済みの文字列群50cが満たす条件と、新たに取得された文字列群(つまり発話30dに対応する文字列群)の追加後の文字列群50dが満たす条件とは異なるものとする。つまり、追加後の文字列群50dの量(例えば文字数やまとまり単位の推定数など)が所定の量以上になったとする。
 この場合、サーバ10の変更部106は、追加前の文字列群50cのまとまり単位を大きくすること、および、まとまり単位に関する設定基準を変更することを決定する。そして、変更部106は、記憶部122に記憶されている、まとまり単位に関する設定基準を更新する。続いて、まとめ部108は、変更後の設定基準に基いて、追加前の文字列群50cのまとまり単位を変更する。さらに、まとめ部108は、当該変更後の設定基準に基いて、当該新たに取得された文字列群のまとまり単位を決定する。
 図10は、追加前の文字列群50cのまとまり単位が変更されたことによる、表示の変更例を示した説明図である。図10に示したように、表示制御部110は、まとまり単位の変更に基いて、(図8に示した)表示画面40cから、当該変更が反映された表示画面40dへと表示を変化させる。例えば、図10に示したように、(追加前の文字列群50cにおける)まとまり単位400aおよびまとまり単位400bの代わりに、まとまり単位410aが表示される。同様に、(追加前の文字列群50cにおける)まとまり単位400dおよびまとまり単位400eの代わりに、まとまり単位410bが表示される。このように、取得済みの文字列群の全体量が所定の量以上になった場合には、一部のまとまり単位が大きくなる。従って、(文字列群の増加前と比べて)表示画面40において個々のまとまり単位の大きさがほとんど変化していないようにユーザに知覚され得るので、文字列群の全体の視認性を維持することができる。
 また、例えば、修正を希望するまとまり単位のみを再度発話し直すことにより、当該まとまり単位に対応する文字列群をユーザは修正することができる。つまり、入力済みの文字列群全てを再び最初から入力する必要がないので、特に音声入力時におけるユーザの利便性が高い。
 {2-2-5.発話5}
 その後、図11に示したように、ユーザは、“I know that my debt to them is beyond measure.”という発話30eを端末20に対して行ったとする。なお、この場合、(図9に示した)過去に取得済みの文字列群50dが満たす条件と、新たに取得された文字列群(つまり発話30eに対応する文字列群)の追加後の文字列群50eが満たす条件とは同一であるものとする。従って、当該追加前の文字列群50dのまとまり単位は変更されない。また、新たに取得された文字列群は、図9に示した例と同じ設定基準を用いてまとめられる。そして、図11に示したように、これらのまとまり単位は、表示画面40に追加表示される。
 {2-2-6.発話6}
 その後、図12に示したように、ユーザは、“To my sister Maya, my sister Alma, all my other brothers and sisters,”という発話30fを端末20に対して行ったとする。なお、この場合も、(図11に示した)過去に取得済みの文字列群50eが満たす条件と、新たに取得された文字列群(つまり発話30fに対応する文字列群)の追加後の文字列群50fが満たす条件とは同一であるものとする。従って、当該追加前の文字列群50eのまとまり単位は変更されない。また、新たに取得された文字列群は、図9に示した例と同じ設定基準を用いてまとめられる。そして、図12に示したように、これらのまとまり単位は、表示画面40に追加表示される。
 {2-2-7.発話7}
 その後、図13に示したように、ユーザは、“thank you so much for all the support that you’ve given me.”という発話30gを端末20に対して行ったとする。なお、この場合、(図12に示した)過去に取得済みの文字列群50fが満たす条件と、新たに取得された文字列群(つまり発話30gに対応する文字列群)の追加後の文字列群50gが満たす条件とは異なるものとする。つまり、追加後の文字列群50gの量は、まとまり単位の大きさが直近に変更された文字列群(具体的には、図9に示した文字列群50d)からさらに所定の量以上増えたとする。
 この場合、サーバ10の変更部106は、追加前の文字列群50fのまとまり単位を大きくすること、および、まとまり単位に関する設定基準を変更することを決定する。そして、変更部106は、記憶部122に記憶されている、まとまり単位に関する設定基準を更新する。続いて、まとめ部108は、変更後の設定基準に基いて、追加前の文字列群50fのまとまり単位を変更する。さらに、まとめ部108は、当該変更後の設定基準に基いて、当該新たに取得された文字列群のまとまり単位を決定する。
 図14は、追加前の文字列群50fのまとまり単位が変更されたことによる、表示の変更例を示した説明図である。図14に示したように、表示制御部110は、まとまり単位の変更に基いて、(図12に示した)表示画面40fから、当該変更が反映された表示画面40gへと表示を変化させる。例えば、図14に示したように、(追加前の文字列群50fにおける)まとまり単位400aおよびまとまり単位400bの代わりに、まとまり単位410aが表示される。このように、取得済みの文字列群の全体量がさらに所定の量以上増えた場合には一部のまとまり単位がさらに大きくなる。従って、文字列群の全体の視認性を維持することができる。
 <2-3.動作>
 以上、本実施形態の適用例について説明した。次に、本実施形態による動作について、図15および図16を参照して説明する。なお、ここでは、ユーザが端末20に対して文字列群を音声入力する場面における動作例について説明する。なお、本動作は、例えばユーザが音声入力アプリケーションを起動する度に繰り返される。
 {2-3-1.動作の全体の流れ}
 図15は、本実施形態による動作の全体的な流れを示したフローチャートである。図15に示したように、まず、例えば、端末20に対するユーザの所定の操作に基いて、端末20は音声入力アプリケーションを起動する。そして、集音部200は、集音を開始する(S101)。
 そして、音声入力の終了の操作がなされない間は(S103:No)、以下のS105~S119の処理が繰り返される。具体的には、まず、(すでに入力済みの)文字列群に対する手入力による編集が検出された場合には(S105:Yes)、端末20は、当該編集内容を示す編集情報をサーバ10へ送信する。そして、サーバ10は、受信された編集情報に基づいて、現在までに取得済みの文字列群を編集する(S107)。その後、サーバ10は、後述するS117の処理を行う。
 一方、手入力による編集が検出されない場合には(S105:No)、端末20は、集音部200により集音された音声データをサーバ10へ送信する(S109)。
 その後、サーバ10の音声認識部102は、S109で受信された音声データに対して音声認識を行い、文字列群に変換する(S111)。
 続いて、言語処理部104は、S111で取得された文字列群に対して言語処理を行う(S113)。
 続いて、過去(つまりS101以後で、かつ、直近のS111より前)に取得済みの文字列群が存在する場合には、言語処理部104は、当該取得済みの文字列群に対して、S111で取得された文字列群を追加した文字列群(つまり、変更後の文字列群)を得る(S115)。
 その後、サーバ10は、後述する「まとまり単位の変更処理」を行う(S117)。
 その後、表示制御部110は、S115もしくはS107における変更後の文字列群を、S117で決定されたまとまり単位ごとに区別して端末20に表示させる(S119)。そして、再びS103の処理が行われる。
 なお、S103において、音声入力の終了の操作がなされた場合には(S103:Yes)、端末20は、集音部200に集音を終了させ、そして、音声入力アプリケーションを終了する(S121)。そして、本動作は終了する。
 {2-3-2.まとまり単位の変更処理}
 次に、図16を参照して、S117における「まとまり単位の変更処理」の流れについて詳細に説明する。図16に示したように、まず、変更部106は、予め設定されている複数の条件のうち、直近のS115もしくはS107よりも前に取得済みの文字列群(つまり、変更前の文字列群)が満たす条件を特定する(S151)。
 続いて、変更部106は、当該複数の条件のうち、S115もしくはS107における変更後の文字列群が満たす条件を特定する(S153)。
 そして、変更部106は、S151で特定された条件とS153で特定された条件とが同じであるか否かを判定する(S155)。両者が同じである場合には(S155:Yes)、変更部106は、当該変更前の文字列群のまとまり単位を変更しないことを決定する(S157)。続いて、まとめ部108は、例えば記憶部122に記憶されている、まとまり単位に関する設定基準に基いて、直近のS111で取得された文字列群(つまり新たに取得された文字列群)に関してまとまり単位を決定する(S159)。これにより、変更後の文字列群に関して全てのまとまり単位が確定する。
 一方、S155において両者が異なる場合には(S155:No)、変更部106は、S153で特定された条件(つまり変更後の文字列群が満たす条件)に基いて、例えば記憶部122に記憶されている、まとまり単位に関する設定基準を変更し、そして、記憶部122の内容を更新する(S161)。
 続いて、まとめ部108は、S161で変更された設定基準に基いて、変更前の文字列群のまとまり単位を変更する(S163)。
 その後、まとめ部108は、S161で変更された設定基準に基いて、直近のS111で取得された文字列群に関してまとまり単位を決定する(S165)。これにより、変更後の文字列に関して全てのまとまり単位が確定する。
 {2-3-3.変形例}
 なお、本実施形態による動作は、上述した例に限定されない。例えば、図15では、音声入力によりユーザが文字列群を繰り返し入力する動作例を示しているが、かかる例に限定されない。例えばキー入力などの手入力により、ユーザが文字列群を繰り返し入力する場面にも、上述した動作例は概略同様に適用され得る。この場合、例えばS109では、端末20は、手入力された文字列群をサーバ10へ送信する。また、S111の処理は省略される。
 <2-4.効果>
 以上説明したように、本実施形態によれば、サーバ10は、所定の条件に基づいて、例えば音声入力や手入力などに基いて取得された文字列群のまとまり単位を動的に変更する。これにより、例えば、文字列群の全体量(例えば文字数など)に応じて、まとまり単位を逐次最適化することができる。
 例えば、過去に取得済みの文字列群が変更された場合(新たに文字列群が追加されたり、削除される場合など)には、サーバ10は、当該変更に応じて、変更前の文字列群のまとまり単位の大きさを動的に変更する。このため、文字列群の全体量が増減しても、表示される個々のまとまり単位の大きさがほとんど変化しないようにユーザに知覚され得る。従って、文字列群の全体の視認性を維持することができる。
 また、すでに入力済みの文字列群の一部の修正をユーザが希望する場合には、ユーザは、表示画面に表示されているまとまり単位の中から修正を希望するまとまり単位のみを再度発話し直すことにより、当該まとまり単位に対応する文字列群を容易に修正することができる。つまり、入力済みの文字列群全てを再び最初から発話したり、手入力する必要がないので、ユーザの利便性が高い。
<<3.ハードウェア構成>>
 次に、本実施形態によるサーバ10のハードウェア構成について、図17を参照して説明する。図17に示すように、サーバ10は、CPU150、ROM(Read Only Memory)152、RAM154、バス156、インターフェース158、ストレージ装置160、および通信装置162を備える。
 CPU150は、演算処理装置および制御装置として機能し、各種プログラムに従ってサーバ10内の動作全般を制御する。また、CPU150は、サーバ10において制御部100の機能を実現する。なお、CPU150は、マイクロプロセッサなどのプロセッサにより構成される。
 ROM152は、CPU150が使用するプログラムや演算パラメータなどの制御用データなどを記憶する。
 RAM154は、例えば、CPU150により実行されるプログラムなどを一時的に記憶する。
 バス156は、CPUバスなどから構成される。このバス156は、CPU150、ROM152、およびRAM154を相互に接続する。
 インターフェース158は、ストレージ装置160および通信装置162を、バス156と接続する。
 ストレージ装置160は、記憶部122として機能する、データ格納用の装置である。ストレージ装置160は、例えば、記憶媒体、記憶媒体にデータを記録する記録装置、記憶媒体からデータを読み出す読出し装置、または記憶媒体に記録されたデータを削除する削除装置などを含む。
 通信装置162は、例えば通信網22などに接続するための通信デバイス等で構成された通信インターフェースである。また、通信装置162は、無線LAN対応通信装置、LTE(Long Term Evolution)対応通信装置、または有線による通信を行うワイヤー通信装置であってもよい。この通信装置162は、通信部120として機能する。
<<4.変形例>>
 以上、添付図面を参照しながら本開示の好適な実施形態について詳細に説明したが、本開示はかかる例に限定されない。本開示の属する技術の分野における通常の知識を有する者であれば、請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本開示の技術的範囲に属するものと了解される。
 <4-1.変形例1>
 例えば、上述した実施形態では、過去に取得済みの文字列群がユーザに削除される場合でも、サーバ10は、当該文字列群のまとまり単位を動的に変更する(分割する)例について説明したが、かかる例に限定されない。例えば、過去に取得済みの文字列群がユーザに削除される場合で、かつ、特定の条件が成立する場合には、サーバ10は、当該文字列群のまとまり単位を維持してもよい。
 一例として、削除される文字列群と同じ分量(例えば文字数やまとまり単位の推定数など)の文字列群が当該削除後に新たに入力されることが予め予測される場合には、サーバ10は、文字列群が削除されたとしても、(削除前の)文字列群のまとまり単位を維持してもよい。なお、同じ分量の文字列群が入力されることが予め予測される場合の一例は、所定の時間内においてユーザが推敲していることが推定される場合などであり得る。また、ユーザによる推敲が推定される場合の一例は、所定の時間内において削除前の文字列群に対してユーザが数文字程度削除したり、修正している場合などであり得る。
 また、例えば文字列群の削除前や削除中などに、まとまり単位を維持するための指定情報をユーザが入力した場合にも、サーバ10は、文字列群が削除されたとしても、(削除前の)文字列群のまとまり単位を維持してもよい。なお、例えば表示画面に対する所定の入力や所定の音声コマンドの入力などにより、当該指定情報は入力され得る。
 <4-2.変形例2>
 {4-2-1.文}
 また、上述した実施形態では、基本的に語(例えば言語が英語などである場合には単語、また、言語が日本語などである場合には文節)を単位として、まとまり単位が構成される例について説明したが、本開示はかかる例に限定されない。例えば、まとまり単位は、文単位で構成されてもよい。この場合、例えば、文字列群のまとまり単位を大きくすることをサーバ10が決定した場合には、サーバ10は、該当の文字列群において隣接する二文ずつを接合してもよい。
 または、サーバ10は、隣接する文同士の意味の関係性に基いて接合対象の文を決定してもよい。例えば、サーバ10は、意味の関連度がより高い文同士を優先的に接合対象として決定してもよい。
 または、ユーザが複数存在する場合には、サーバ10は、文を発話(入力)したユーザに応じて接合対象の文を決定してもよい。例えば、連続する二文を発話(入力)したユーザが同一である場合には、サーバ10は、当該二文を接合対象とする。また、連続する二文に関して、発話(入力)したユーザが文ごとに異なる場合には、サーバ10は、当該二文を接合対象としない。この決定例によれば、例えば会議の議事録の作成時などにおいて、作成者は、当該会議において同じ人物が発話した文を一括して削除したり、抽出することができるので、利便性が高い。
 または、サーバ10は、連続する二文を発話(入力)したユーザの関係性に基いて接合対象の文を決定してもよい。例えば、二人のユーザがそれぞれ一文ずつ発話し、かつ、当該二人のユーザが家族や友人である場合には、サーバ10は、当該二文を接合対象とする。また、当該二人のユーザが知人ではない場合には、サーバ10は、当該二文を接合対象としない。なお、例えば個々のユーザが使用する端末20の識別情報、集音された音声の解析結果、または、利用中のアプリケーションやサービスにおけるアカウントなどに基いて、個々のユーザは識別され得る。
 {4-2-2.対話}
 または、まとまり単位は、質問文と回答文の組を単位として構成されてもよい。例えば、質問A、(質問Aに対する)回答A、質問B、(質問Bに対する)回答B、というように、質問と回答とが交互に発話(入力)されたとする。この場合、サーバ10は、質問と当該質問に対する回答との組(例えば、質問Aおよび回答Aの組など)をまとまり単位としてもよい。なお、質問および回答はそれぞれ一文であってもよいし、複数の文であってもよい。この変形例によれば、例えば、インタビュー記事の作成時などにおいて、作成者は、質問単位で、当該質問と当該質問に対する回答との組を一括して削除したり、抽出することができるので、利便性が高い。なお、例えば、文に含まれるモダリティの解析結果、文の構文解析や意味解析の結果、または、集音された音声のイントネーションの解析結果などに基いて、質問文や回答文は特定され得る。
 {4-2-3.トピック}
 または、まとまり単位は、トピックを単位として構成されてもよい。例えば、複数のユーザの間で、3種類のトピック(例えば、プロジェクトA、プロジェクトB、および、プロジェクトCなど)に関する対話が行われたとする。この場合、サーバ10は、トピックごとに、当該トピックに関して複数のユーザが発話(入力)した文全てをまとまり単位としてもよい。
 <4-3.変形例3>
 また、本実施形態による情報処理システムの構成は、図1に示した例に限定されない。例えば、図1では、サーバ10が一台だけ図示されているが、かかる例に限定されず、複数台のコンピュータが協同して動作することにより、上述したサーバ10の機能が実現されてもよい。また、図1では、端末20が一台だけ図示されているが、かかる例に限定されず、当該情報処理システムは、端末20を複数台含み得る。
 <4-4.変形例4>
 また、本実施形態によるサーバ10の構成は、図4に示した例に限定されない。例えば、音声認識部102、言語処理部104、および、表示制御部110のうちの少なくとも一以上は、サーバ10に含まれる代わりに、例えば端末20など、サーバ10が通信可能な他の装置に含まれてもよい。
 <4-5.変形例5>
 また、上述した実施形態では、本開示における情報処理装置がサーバ10である例について説明したが、本開示はかかる例に限定されない。例えば、少なくとも変更部106およびまとめ部108の機能を端末20が有する場合には、当該情報処理装置は、端末20であってもよい。この場合、例えば、端末20は、まず、集音した音声データや手入力された文字列群をサーバ10へ送信する。そして、端末20は、当該音声データに対する音声認識により得られる文字列群や、取得された文字列群に対する各種の言語処理結果をサーバ10から受信する。そして、端末20は、これらの情報に基づいて、上述した変更部106およびまとめ部108の機能を実行可能である。
 または、上述した制御部100に含まれる全ての構成要素を端末20が含んでもよい。この場合、サーバ10は必ずしも設置されなくてもよい。
 <4-6.変形例6>
 また、上述した実施形態の動作における各ステップは、必ずしも記載された順序に沿って処理されなくてもよい。例えば、各ステップは、適宜順序が変更されて処理されてもよい。また、各ステップは、時系列的に処理される代わりに、一部並列的に又は個別的に処理されてもよい。また、記載されたステップのうちの一部が省略されたり、または、別のステップがさらに追加されてもよい。
 また、上述した実施形態によれば、例えばCPU150、ROM152、およびRAM154などのハードウェアを、上述した実施形態によるサーバ10の構成と同等の機能を発揮させるためのコンピュータプログラムも提供可能である。また、該コンピュータプログラムが記録された記録媒体も提供される。
 また、本明細書に記載された効果は、あくまで説明的または例示的なものであって限定的ではない。つまり、本開示に係る技術は、上記の効果とともに、または上記の効果に代えて、本明細書の記載から当業者には明らかな他の効果を奏しうる。
 なお、以下のような構成も本開示の技術的範囲に属する。
(1)
 第1の文字列群を取得する取得部と、
 前記第1の文字列群および所定の条件に基づいて、前記第1の文字列群に関するまとまりの単位を変更する変更部と、
を備える、情報処理装置。
(2)
 前記所定の条件は、互いに異なる複数の条件を含み、
 前記変更部は、前記第1の文字列群が前記複数の条件のうちのいずれを満たすかに基づいて、前記第1の文字列群に関するまとまりの単位を変更する、前記(1)に記載の情報処理装置。
(3)
 前記所定の条件は、互いに異なる複数の条件を含み、
 前記取得部は、第2の文字列群をさらに取得し、
 前記変更部は、前記第1の文字列群に前記第2の文字列群が追加された文字列群である第3の文字列群が前記複数の条件のうちのいずれを満たすかに基づいて、前記第1の文字列群に関するまとまりの単位を変更する、前記(1)または(2)に記載の情報処理装置。
(4)
 前記変更部は、前記複数の条件のうち前記第1の文字列群が満たす条件と、前記複数の条件のうち前記第3の文字列群が満たす条件との比較に基づいて、前記第1の文字列群に関するまとまりの単位を変更する、前記(3)に記載の情報処理装置。
(5)
 前記第1の文字列群が満たす条件と、前記第3の文字列群が満たす条件とが異なる場合には、前記変更部は、前記第1の文字列群に関するまとまりの単位を変更し、
 前記第1の文字列群が満たす条件と、前記第3の文字列群が満たす条件とが同一である場合には、前記変更部は、前記第1の文字列群に関するまとまりの単位を変更しない、前記(4)に記載の情報処理装置。
(6)
 新たに文字列群が取得される度に、前記第1の文字列群には、当該取得された文字列群が追加され、
 前記変更部は、前記複数の条件のうち、当該追加前の前記第1の文字列群が満たす条件と、前記複数の条件のうち、当該追加後の前記第1の文字列群が満たす条件との比較に基づいて、当該追加前の前記第1の文字列群に関するまとまりの単位を変更する、前記(4)または(5)に記載の情報処理装置。
(7)
 前記変更部は、さらに、前記複数の条件のうち前記第3の文字列群が満たす条件に基づいて、前記第2の文字列群に関するまとまりの単位を決定する、前記(3)~(6)のいずれか一項に記載の情報処理装置。
(8)
 前記所定の条件は、互いに異なる複数の条件を含み、
 前記取得部は、前記第1の文字列群に対する編集情報をさらに取得し、
 前記変更部は、前記複数の条件のうち前記第1の文字列群が満たす条件と、前記複数の条件のうち、前記編集情報に基づいて前記第1の文字列群が変更された文字列群である第4の文字列群が満たす条件との比較に基づいて、前記第1の文字列群に関するまとまりの単位を変更する、前記(1)~(7)のいずれか一項に記載の情報処理装置。
(9)
 前記変更部は、前記第3の文字列群が満たす条件に関連付けられている設定基準に基いて、前記第1の文字列群に関するまとまりの単位を変更する、前記(3)~(7)のいずれか一項に記載の情報処理装置。
(10)
 前記所定の条件は、文字列群に含まれる文字の数の範囲に関する条件を含む、前記(1)~(9)のいずれか一項に記載の情報処理装置。
(11)
 前記所定の条件は、文字列群に関するまとまりの単位の数の範囲に関する条件を含む、前記(1)~(10)のいずれか一項に記載の情報処理装置。
(12)
 前記所定の条件は、文字列群に対応する音素の数の範囲に関する条件を含む、前記(1)~(11)のいずれか一項に記載の情報処理装置。
(13)
 前記所定の条件は、文字列群の言語処理結果に関する条件を含む、前記(1)~(12)のいずれか一項に記載の情報処理装置。
(14)
 前記変更部は、複数の前記まとまりの単位を接合すること、または、一以上の前記まとまりの単位を分割することにより、前記第1の文字列群に関するまとまりの単位を変更する、前記(1)~(13)のいずれか一項に記載の情報処理装置。
(15)
 前記変更部は、前記第1の文字列群において隣接する前記まとまりの単位同士をそれぞれ接合することにより、前記第1の文字列群に関するまとまりの単位を変更する、前記(14)に記載の情報処理装置。
(16)
 前記変更部は、モダリティを含む前記まとまりの単位と、モダリティを含まない一以上の前記まとまりの単位とを接合することにより、前記第1の文字列群に関するまとまりの単位を変更する、前記(14)または(15)に記載の情報処理装置。
(17)
 前記変更部は、係り受けの関係にある前記まとまりの単位同士を接合することにより、前記第1の文字列群に関するまとまりの単位を変更する、前記(14)~(16)のいずれか一項に記載の情報処理装置。
(18)
 前記情報処理装置は、前記第1の文字列群を表示画面に表示させる表示制御部をさらに備え、
 前記表示制御部は、前記まとまりの単位ごとに区別して前記表示画面に表示させる、前記(1)~(17)のいずれか一項に記載の情報処理装置。
(19)
 第1の文字列群を取得することと、
 前記第1の文字列群および所定の条件に基づいて、前記第1の文字列群に関するまとまりの単位をプロセッサが変更することと、
を含む、情報処理方法。
(20)
 コンピュータを、
 第1の文字列群を取得する取得部と、
 前記第1の文字列群および所定の条件に基づいて、前記第1の文字列群に関するまとまりの単位を変更する変更部、
として機能させるための、プログラム。
10 サーバ
20 端末
22 通信網
100 制御部
102 音声認識部
104 言語処理部
106 変更部
108 まとめ部
110 表示制御部
120 通信部
122 記憶部
124 設定基準テーブル
200 集音部
202 操作表示部

Claims (20)

  1.  第1の文字列群を取得する取得部と、
     前記第1の文字列群および所定の条件に基づいて、前記第1の文字列群に関するまとまりの単位を変更する変更部と、
    を備える、情報処理装置。
  2.  前記所定の条件は、互いに異なる複数の条件を含み、
     前記変更部は、前記第1の文字列群が前記複数の条件のうちのいずれを満たすかに基づいて、前記第1の文字列群に関するまとまりの単位を変更する、請求項1に記載の情報処理装置。
  3.  前記所定の条件は、互いに異なる複数の条件を含み、
     前記取得部は、第2の文字列群をさらに取得し、
     前記変更部は、前記第1の文字列群に前記第2の文字列群が追加された文字列群である第3の文字列群が前記複数の条件のうちのいずれを満たすかに基づいて、前記第1の文字列群に関するまとまりの単位を変更する、請求項1に記載の情報処理装置。
  4.  前記変更部は、前記複数の条件のうち前記第1の文字列群が満たす条件と、前記複数の条件のうち前記第3の文字列群が満たす条件との比較に基づいて、前記第1の文字列群に関するまとまりの単位を変更する、請求項3に記載の情報処理装置。
  5.  前記第1の文字列群が満たす条件と、前記第3の文字列群が満たす条件とが異なる場合には、前記変更部は、前記第1の文字列群に関するまとまりの単位を変更し、
     前記第1の文字列群が満たす条件と、前記第3の文字列群が満たす条件とが同一である場合には、前記変更部は、前記第1の文字列群に関するまとまりの単位を変更しない、請求項4に記載の情報処理装置。
  6.  新たに文字列群が取得される度に、前記第1の文字列群には、当該取得された文字列群が追加され、
     前記変更部は、前記複数の条件のうち、当該追加前の前記第1の文字列群が満たす条件と、前記複数の条件のうち、当該追加後の前記第1の文字列群が満たす条件との比較に基づいて、当該追加前の前記第1の文字列群に関するまとまりの単位を変更する、請求項4に記載の情報処理装置。
  7.  前記変更部は、さらに、前記複数の条件のうち前記第3の文字列群が満たす条件に基づいて、前記第2の文字列群に関するまとまりの単位を決定する、請求項3に記載の情報処理装置。
  8.  前記所定の条件は、互いに異なる複数の条件を含み、
     前記取得部は、前記第1の文字列群に対する編集情報をさらに取得し、
     前記変更部は、前記複数の条件のうち前記第1の文字列群が満たす条件と、前記複数の条件のうち、前記編集情報に基づいて前記第1の文字列群が変更された文字列群である第4の文字列群が満たす条件との比較に基づいて、前記第1の文字列群に関するまとまりの単位を変更する、請求項1に記載の情報処理装置。
  9.  前記変更部は、前記第3の文字列群が満たす条件に関連付けられている設定基準に基いて、前記第1の文字列群に関するまとまりの単位を変更する、請求項3に記載の情報処理装置。
  10.  前記所定の条件は、文字列群に含まれる文字の数の範囲に関する条件を含む、請求項1に記載の情報処理装置。
  11.  前記所定の条件は、文字列群に関するまとまりの単位の数の範囲に関する条件を含む、請求項1に記載の情報処理装置。
  12.  前記所定の条件は、文字列群に対応する音素の数の範囲に関する条件を含む、請求項1に記載の情報処理装置。
  13.  前記所定の条件は、文字列群の言語処理結果に関する条件を含む、請求項1に記載の情報処理装置。
  14.  前記変更部は、複数の前記まとまりの単位を接合すること、または、一以上の前記まとまりの単位を分割することにより、前記第1の文字列群に関するまとまりの単位を変更する、請求項1に記載の情報処理装置。
  15.  前記変更部は、前記第1の文字列群において隣接する前記まとまりの単位同士をそれぞれ接合することにより、前記第1の文字列群に関するまとまりの単位を変更する、請求項14に記載の情報処理装置。
  16.  前記変更部は、モダリティを含む前記まとまりの単位と、モダリティを含まない一以上の前記まとまりの単位とを接合することにより、前記第1の文字列群に関するまとまりの単位を変更する、請求項14に記載の情報処理装置。
  17.  前記変更部は、係り受けの関係にある前記まとまりの単位同士を接合することにより、前記第1の文字列群に関するまとまりの単位を変更する、請求項14に記載の情報処理装置。
  18.  前記情報処理装置は、前記第1の文字列群を表示画面に表示させる表示制御部をさらに備え、
     前記表示制御部は、前記まとまりの単位ごとに区別して前記表示画面に表示させる、請求項1に記載の情報処理装置。
  19.  第1の文字列群を取得することと、
     前記第1の文字列群および所定の条件に基づいて、前記第1の文字列群に関するまとまりの単位をプロセッサが変更することと、
    を含む、情報処理方法。
  20.  コンピュータを、
     第1の文字列群を取得する取得部と、
     前記第1の文字列群および所定の条件に基づいて、前記第1の文字列群に関するまとまりの単位を変更する変更部、
    として機能させるための、プログラム。
PCT/JP2017/014928 2016-07-20 2017-04-12 情報処理装置、情報処理方法、およびプログラム WO2018016140A1 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
EP17830660.1A EP3489840A4 (en) 2016-07-20 2017-04-12 INFORMATION PROCESSING DEVICE, INFORMATION PROCESSING METHOD, AND PROGRAM
JP2018528405A JP7020410B2 (ja) 2016-07-20 2017-04-12 情報処理装置、情報処理方法、およびプログラム
US16/096,370 US11275897B2 (en) 2016-07-20 2017-04-12 Information processing apparatus, information processing method, and program for modifying a cluster segment relating to a character string group
CN201780042974.8A CN109478201A (zh) 2016-07-20 2017-04-12 信息处理装置、信息处理方法及程序

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2016-142296 2016-07-20
JP2016142296 2016-07-20

Publications (1)

Publication Number Publication Date
WO2018016140A1 true WO2018016140A1 (ja) 2018-01-25

Family

ID=60992026

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2017/014928 WO2018016140A1 (ja) 2016-07-20 2017-04-12 情報処理装置、情報処理方法、およびプログラム

Country Status (5)

Country Link
US (1) US11275897B2 (ja)
EP (1) EP3489840A4 (ja)
JP (1) JP7020410B2 (ja)
CN (1) CN109478201A (ja)
WO (1) WO2018016140A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110837642A (zh) * 2019-11-14 2020-02-25 腾讯科技(深圳)有限公司 恶意程序分类方法、装置、设备及存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05290030A (ja) * 1992-04-08 1993-11-05 Sharp Corp 文書処理装置
JPH06214585A (ja) * 1993-01-18 1994-08-05 Toshiba Corp 音声合成装置
JPH09240103A (ja) * 1996-01-05 1997-09-16 King Jim Co Ltd 文字情報処理装置
JP2001100784A (ja) * 1999-09-30 2001-04-13 Sony Corp 情報処理装置および情報処理方法、並びに記録媒体
JP2003150298A (ja) * 2001-11-13 2003-05-23 Sony Corp 電子ブック、書籍内容表示方法、書籍内容表示プログラム及び書籍内容表示プログラム格納媒体
JP2012053634A (ja) 2010-08-31 2012-03-15 Fujifilm Corp 文書作成支援装置、文書作成支援方法、並びに文書作成支援プログラム
JP2015184455A (ja) * 2014-03-24 2015-10-22 大日本印刷株式会社 表示端末装置、プログラム、及び、サーバ装置

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3654611A (en) * 1970-03-02 1972-04-04 Ibm Visual editing system incorporating controls for justifying and dejustifying displayed text
US3654609A (en) * 1970-03-02 1972-04-04 Ibm Proportional spacing visual editing system
JP3299433B2 (ja) * 1996-01-05 2002-07-08 株式会社キングジム 文字情報処理方法及び装置
US5802533A (en) * 1996-08-07 1998-09-01 Walker; Randall C. Text processor
US6279018B1 (en) * 1998-12-21 2001-08-21 Kudrollis Software Inventions Pvt. Ltd. Abbreviating and compacting text to cope with display space constraint in computer software
US9710819B2 (en) * 2003-05-05 2017-07-18 Interactions Llc Real-time transcription system utilizing divided audio chunks
JP3945778B2 (ja) * 2004-03-12 2007-07-18 インターナショナル・ビジネス・マシーンズ・コーポレーション 設定装置、プログラム、記録媒体、及び設定方法
JP2006202231A (ja) * 2005-01-24 2006-08-03 Global Value Kk 文字列シンボル生成装置及び文字列シンボル生成方法並びに文字列シンボル生成プログラムを格納した記憶媒体。
JP4181577B2 (ja) * 2005-12-22 2008-11-19 インターナショナル・ビジネス・マシーンズ・コーポレーション 文字列処理方法、装置、およびプログラム
US20120237906A9 (en) * 2006-03-15 2012-09-20 Glass Andrew B System and Method for Controlling the Presentation of Material and Operation of External Devices
JP4791984B2 (ja) * 2007-02-27 2011-10-12 株式会社東芝 入力された音声を処理する装置、方法およびプログラム
CN103353824B (zh) * 2013-06-17 2016-08-17 百度在线网络技术(北京)有限公司 语音输入字符串的方法、装置和终端设备
WO2015164209A1 (en) * 2014-04-25 2015-10-29 Mayo Foundation For Medical Education And Research Enhancing reading accuracy, efficiency and retention
US10950254B2 (en) * 2018-10-25 2021-03-16 International Business Machines Corporation Producing comprehensible subtitles and captions for an effective group viewing experience

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05290030A (ja) * 1992-04-08 1993-11-05 Sharp Corp 文書処理装置
JPH06214585A (ja) * 1993-01-18 1994-08-05 Toshiba Corp 音声合成装置
JPH09240103A (ja) * 1996-01-05 1997-09-16 King Jim Co Ltd 文字情報処理装置
JP2001100784A (ja) * 1999-09-30 2001-04-13 Sony Corp 情報処理装置および情報処理方法、並びに記録媒体
JP2003150298A (ja) * 2001-11-13 2003-05-23 Sony Corp 電子ブック、書籍内容表示方法、書籍内容表示プログラム及び書籍内容表示プログラム格納媒体
JP2012053634A (ja) 2010-08-31 2012-03-15 Fujifilm Corp 文書作成支援装置、文書作成支援方法、並びに文書作成支援プログラム
JP2015184455A (ja) * 2014-03-24 2015-10-22 大日本印刷株式会社 表示端末装置、プログラム、及び、サーバ装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP3489840A4

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110837642A (zh) * 2019-11-14 2020-02-25 腾讯科技(深圳)有限公司 恶意程序分类方法、装置、设备及存储介质
CN110837642B (zh) * 2019-11-14 2023-10-13 腾讯科技(深圳)有限公司 恶意程序分类方法、装置、设备及存储介质

Also Published As

Publication number Publication date
US20190138601A1 (en) 2019-05-09
EP3489840A1 (en) 2019-05-29
EP3489840A4 (en) 2019-07-24
JP7020410B2 (ja) 2022-02-16
CN109478201A (zh) 2019-03-15
US11275897B2 (en) 2022-03-15
JPWO2018016140A1 (ja) 2019-05-09

Similar Documents

Publication Publication Date Title
US20230206940A1 (en) Method of and system for real time feedback in an incremental speech input interface
EP3504704B1 (en) Facilitating creation and playback of user-recorded audio
JP4768969B2 (ja) 高度対話型インターフェースに対する理解同期意味オブジェクト
JP4768970B2 (ja) 音声アプリケーション言語タグとともに実装される理解同期意味オブジェクト
US20190156822A1 (en) Multiple turn conversational task assistance
US20150279366A1 (en) Voice driven operating system for interfacing with electronic devices: system, method, and architecture
US10290299B2 (en) Speech recognition using a foreign word grammar
JP2010048980A (ja) 自動会話システム、並びに会話シナリオ編集装置
CN107305541A (zh) 语音识别文本分段方法及装置
EP1650744A1 (en) Invalid command detection in speech recognition
US11093110B1 (en) Messaging feedback mechanism
CN104485105A (zh) 一种电子病历生成方法和电子病历系统
US10984310B2 (en) Enhanced communication assistance with deep learning
US20240087573A1 (en) Automatic extraction of conversation highlights
KR20200084260A (ko) 전자 장치 및 이의 제어 방법
JP6915637B2 (ja) 情報処理装置、情報処理方法、およびプログラム
CN112799630A (zh) 使用网络可寻址设备创建电影化的讲故事体验
CN116012481B (zh) 图像生成处理方法、装置、电子设备及存储介质
JP7355244B2 (ja) 情報処理装置、情報処理方法およびプログラム
CN111158630B (zh) 一种播放控制方法及装置
US20160005421A1 (en) Language analysis based on word-selection, and language analysis apparatus
WO2018016143A1 (ja) 情報処理装置、情報処理方法、およびプログラム
WO2018016140A1 (ja) 情報処理装置、情報処理方法、およびプログラム
US10282417B2 (en) Conversational list management
US20220100959A1 (en) Conversation support device, conversation support system, conversation support method, and storage medium

Legal Events

Date Code Title Description
ENP Entry into the national phase

Ref document number: 2018528405

Country of ref document: JP

Kind code of ref document: A

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 17830660

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

ENP Entry into the national phase

Ref document number: 2017830660

Country of ref document: EP

Effective date: 20190220