DE112016006351T5 - Informationsverarbeitungsvorrichtung, informationsverarbeitungsverfahren und programm - Google Patents

Informationsverarbeitungsvorrichtung, informationsverarbeitungsverfahren und programm Download PDF

Info

Publication number
DE112016006351T5
DE112016006351T5 DE112016006351.2T DE112016006351T DE112016006351T5 DE 112016006351 T5 DE112016006351 T5 DE 112016006351T5 DE 112016006351 T DE112016006351 T DE 112016006351T DE 112016006351 T5 DE112016006351 T5 DE 112016006351T5
Authority
DE
Germany
Prior art keywords
state
information processing
user
peripheral device
control unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
DE112016006351.2T
Other languages
English (en)
Inventor
Reiko KIRIHARA
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of DE112016006351T5 publication Critical patent/DE112016006351T5/de
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/165Management of the audio stream, e.g. setting of volume, audio stream path
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1815Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L25/84Detection of presence or absence of voice signals for discriminating voice from noise

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Telephone Function (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

[Problem] Bereitstellung einer Informationsverarbeitungsvorrichtung, eines Informationsverarbeitungsverfahrens und eines Programms.
[Lösung] Eine Informationsverarbeitungsvorrichtung ist ausgestattet mit einer Zustandsdetektionseinheit, die den Zustand einer anderen Vorrichtung, die eine Geräuschquelle sein kann, detektiert; und einer Zustandssteuereinheit, die den Zustand der anderen Vorrichtung auf der Basis des Detektionsergebnisses des Zustands der anderen Vorrichtung und auf der Basis einer Vorhersage der Sprache eines Benutzers steuert.

Description

  • Technisches Gebiet
  • Die vorliegende Offenbarung betrifft eine Informationsverarbeitungsvorrichtung, ein Informationsverarbeitungsverfahren und ein Programm.
  • Stand der Technik
  • In den letzten Jahren wurden Spracheingabesysteme verwendet, die Spracherkennungstechnologie benutzen. Wenn ein Benutzer eine Eingabe durch Sprache durchführt, kann es aufgrund von Geräuschen um den Benutzer (einen anderen Ton als die Sprache in der Eingabe durch Sprache) schwierig sein, eine Sprache zu erkennen. Falls zum Beispiel die Geräusche um den Benutzer groß sind, kann die Sprache des Benutzers nicht erkannt werden, solange der Benutzer nicht mit einer lauteren Stimme spricht. Falls eine Geräuschquelle eine Vorrichtung ist, bei der die Lautstärke durch den Benutzer eingestellt werden kann, wie etwa ein Fernseher oder ein Lautsprecher, kann die Spracherkennung hier mit einem höheren Genauigkeitsgrad durchgeführt werden, indem der Benutzer die Vorrichtung manipuliert und die Lautstärke verringert.
  • Für die Lautstärkeeinstellung gibt es eine Technik des automatischen Einstellens der Lautstärke des Tons, der von derselben Vorrichtung wie die Vorrichtung, in die Sprache des Benutzers eingegeben wird, ausgegeben wird. Zum Beispiel wird in der Patentliteratur 1 ein Fernsehempfänger offenbart, der die Sprache des Benutzers detektiert und automatische Lautstärkeeinstellung durchführt, so dass ein Gespräch reibungslos durchgeführt werden kann, selbst falls mehrere Benutzer Kopfhörer tragen.
  • Zitatliste
  • Patentliteratur
  • Patentliteratur 1: JP 2008-72558A
  • Offenbarung der Erfindung
  • Technisches Problem
  • Da die Vorrichtung, die die Spracherkennung durchführt, und die Quelle des Tons um den Benutzer nicht unbedingt dieselbe Vorrichtung sind, wird jedoch nur unwahrscheinlich ausreichende Spracherkennungsgenauigkeit erreicht, selbst wenn die oben erwähnte Technologie in Bezug auf Lautstärkeeinstellung auf die Spracherkennungstechnologie angewandt wird.
  • In dieser Hinsicht schlägt die vorliegende Offenbarung eine Informationsverarbeitungsvorrichtung, ein Informationsverarbeitungsverfahren und ein Programm vor, die neuartig und verbessert sind und die Spracherkennungsgenauigkeit verbessern können, selbst falls sich andere Tonquellen um den Benutzer befinden.
  • Problemlösung
  • Gemäß der vorliegenden Offenbarung wird eine Informationsverarbeitungsvorrichtung bereitgestellt, umfassend: eine Zustandsdetektionseinheit, ausgelegt zum Detektieren eines Zustands einer anderen Vorrichtung, die eine Geräuschquelle sein kann; und eine Zustandssteuereinheit, ausgelegt zum Steuern des Zustands der anderen Vorrichtung basierend auf einem Detektionsergebnis für den Zustand der anderen Vorrichtung und Sprachvorhersage eines Benutzers.
  • Außerdem wird gemäß der vorliegenden Offenbarung ein Informationsverarbeitungsverfahren bereitgestellt, umfassend: Detektieren eines Zustands einer anderen Vorrichtung, die eine Geräuschquelle sein kann; und Steuern des Zustands der anderen Vorrichtung durch einen Prozessor basierend auf einem Detektionsergebnis für den Zustand der anderen Vorrichtung und Sprachvorhersage eines Benutzers.
  • Außerdem wird gemäß der vorliegenden Offenbarung ein Programm bereitgestellt, das bewirkt, dass ein Computer Folgendes implementiert: eine Funktion des Detektierens eines Zustands einer anderen Vorrichtung, die eine Geräuschquelle sein kann; und eine Funktion des Steuerns des Zustands der anderen Vorrichtung basierend auf einem Detektionsergebnis für den Zustand der anderen Vorrichtung und Sprachvorhersage eines Benutzers.
  • Vorteilhafte Effekte der Erfindung
  • Wie oben beschrieben ist es gemäß der vorliegenden Offenbarung möglich, die Spracherkennungsgenauigkeit zu verbessern, selbst falls sich andere Tonquellen um den Benutzer befinden.
  • Man beachte, dass die oben beschriebenen Effekte nicht unbedingt beschränkend sind. Mit den obigen Effekten oder anstelle dieser können ein beliebiger der in der vorliegenden Patentschrift beschriebenen Effekte oder andere Effekte, die aus der vorliegenden Patentschrift ersichtlich werden, erreicht werden.
  • Figurenliste
    • [1] 1 ist eine Erläuterungsdarstellung zur Beschreibung einer Übersicht über ein Spracherkennungssystem gemäß einer ersten Ausführungsform der vorliegenden Offenbarung.
    • [2] 2 ist eine Erläuterungsdarstellung eines Konfigurationsbeispiels für ein Spracherkennungssystem gemäß der Ausführungsform.
    • [3] 3 ist eine Erläuterungsdarstellung eines Konfigurationsbeispiels für eine Informationsverarbeitungsvorrichtung 1 gemäß der Ausführungsform.
    • [4] 4 ist ein Flussdiagramm eines Betriebsbeispiels für eine Informationsverarbeitungsvorrichtung 1 gemäß der Ausführungsform.
    • [5] 5 ist ein Flussdiagramm eines Betriebsbeispiels für eine Informationsverarbeitungsvorrichtung 1 gemäß einem modifizierten Beispiel.
    • [6] 6 ist eine Erläuterungsdarstellung eines Konfigurationsbeispiels für eine Informationsverarbeitungsvorrichtung gemäß einer zweiten Ausführungsform der vorliegenden Offenbarung.
    • [7] 7 ist ein Flussdiagramm eines Betriebsbeispiels für eine Informationsverarbeitungsvorrichtung 2 gemäß der Ausführungsform.
    • [8] 8 ist eine Erläuterungsdarstellung eines Konfigurationsbeispiels für eine Informationsverarbeitungsvorrichtung gemäß einer dritten Ausführungsform der vorliegenden Offenbarung.
    • [9A] 9A ist eine Erläuterungsdarstellung eines Extraktionsbeispiels für eine Peripherievorrichtung 7 auf der Basis einer Position einer Peripherievorrichtung 7 und einer Position eines Benutzers.
    • [9B] 9B ist eine Erläuterungsdarstellung eines Extraktionsbeispiels für eine Peripherievorrichtung 7 auf der Basis einer Position einer Peripherievorrichtung 7 und einer Position eines Benutzers.
    • [10] 10 ist ein Flussdiagramm eines Betriebsbeispiels für eine Informationsverarbeitungsvorrichtung 3 gemäß der Ausführungsform.
    • [11] 11 ist eine Erläuterungsdarstellung eines Beispiels für eine Hardwarekonfiguration.
  • Art(en) der Ausführung der Erfindung
  • Im Folgenden wird eine bevorzugte Ausführungsform bzw. werden bevorzugte Ausführungsformen der vorliegenden Offenbarung ausführlich unter Bezugnahme auf die beigefügten Zeichnungen beschrieben. Man beachte, dass in der vorliegenden Patentschrift und in den angefügten Zeichnungen Strukturelemente, die im Wesentlichen dieselbe Funktion und Struktur aufweisen, mit denselben Bezugszahlen bezeichnet werden und wiederholte Erläuterung dieser Strukturelemente weggelassen wird.
  • Man beachte, dass in der vorliegenden Beschreibung und in den Zeichnungen Strukturelemente, die im Wesentlichen dieselbe Funktion und Struktur aufweisen, manchmal unter Verwendung verschiedener Buchstaben nach demselben Bezugszeichen unterschieden werden. Wenn es nicht besonders notwendig ist, Elemente zu unterscheiden, die im Wesentlichen dieselbe Funktion und Struktur aufweisen, wird jedoch dasselbe Bezugszeichen alleine angehängt.
  • Weiterhin wird die Beschreibung in der folgenden Reihenfolge voranschreiten.
    • <<1. Erste Ausführungsform>>
    • <1-1. Übersicht über erste Ausführungsform>
    • <1-2. Konfigurationsbeispiel für erste Ausführungsform>
    • <1-3. Betriebsbeispiel für erste Ausführungsform >
    • <1-4. Effekte der ersten Ausführungsform >
    • <1-5. Modifizierte Beispiele für die erste Ausführungsform>
    • «2. Zweite Ausführungsform»
    • <2-1. Konfigurationsbeispiel für zweite Ausführungsform>
    • <2-2. Betriebsbeispiel für zweite Ausführungsform>
    • <2-3. Effekte der zweiten Ausführungsform>
    • <2-4. Ergänzung der zweiten Ausführungsform>
    • «3. Dritte Ausführungsform»
    • <3-1. Konfigurationsbeispiel für dritte Ausführungsform>
    • <3-2. Betriebsbeispiel für dritte Ausführungsform>
    • <3-3. Effekte der dritten Ausführungsform>
    • <3-4. Ergänzung der dritten Ausführungsform>
    • <<4. Hardwarekonfigurationsbeispiel>>
    • «5. Schlussbemerkungen»
  • <<Erste Ausführungsform>>
  • <Übersicht über erste Ausführungsform>
  • Als Erstes wird eine Übersicht über eine erste Ausführungsform der vorliegenden Offenbarung mit Bezug auf 1 beschrieben. 1 ist eine Erläuterungsdarstellung zur Beschreibung einer Übersicht über ein Spracherkennungssystem gemäß der ersten Ausführungsform der vorliegenden Offenbarung. Die in 1 dargestellte Informationsverarbeitungsvorrichtung 1 weist eine Sprach-UI-Agent-Funktion auf, die Spracherkennung/semantische Analyse an Sprache eines Benutzers ausführen und eine Antwort mittels Sprache oder Anzeige geben kann. Ferner zeigt in 1 eine Szene T1 ein Beispiel für ein Spracherkennungssystem in einem Nicht-Sprechzustand, in dem ein Benutzer U1 nicht zu der Informationsverarbeitungsvorrichtung 1 spricht, und Szene T2 zeigt ein Beispiel für ein Spracherkennungssystem in einem Sprechzustand, in dem der Benutzer U1 zu der Informationsverarbeitungsvorrichtung 1 spricht.
  • Ein äußeres Aussehen der Informationsverarbeitungsvorrichtung 1 ist nicht konkret beschränkt und kann zum Beispiel eine Säulenform sein, wie in 1 dargestellt, und die Informationsverarbeitungsvorrichtung 1 wird zum Beispiel auf einem Boden eines Zimmers oder einem Tisch installiert. Ferner ist bei der Informationsverarbeitungsvorrichtung 1 eine lichtemittierende Einheit 18, die durch ein lichtemittierendes Element, wie etwa eine Leuchtdiode (LED) gebildet wird, in Form eines Bands installiert, um einen zentralen Bereich einer Seitenoberfläche in einer horizontalen Richtung zu umgeben. Die Informationsverarbeitungsvorrichtung 1 kann den Benutzer über einen Zustand der Informationsverarbeitungsvorrichtung 1 informieren, indem bewirkt wird, dass die lichtemittierende Einheit 18 ganz oder teilweise Licht emittiert. Wenn zum Beispiel die Informationsverarbeitungsvorrichtung 1 mit dem Benutzer interagiert, kann die Informationsverarbeitungsvorrichtung 1 bewirken, dass es so aussieht, als wäre ihre Sichtlinie dem Benutzer U1, der interagiert, zugewandt, wie in der Szene T2 von 1, indem bewirkt wird, dass ein Teil der lichtemittierenden Einheit 18 in einer Richtung des Benutzers oder einer Richtung eines Sprechers Licht emittiert. Wenn die Informationsverarbeitungsvorrichtung 1 eine Antwort erzeugt oder nach Daten sucht, kann die Informationsverarbeitungsvorrichtung 1 den Benutzer ferner informieren, dass sie sich in einem Prozess befindet, indem Steuerung dergestalt durchgeführt wird, dass Licht mittels der lichtemittierenden Einheit 18 sich über der Seitenoberfläche dreht. Ferner weist die Informationsverarbeitungsvorrichtung 1 eine Funktion des Projizierens und Anzeigen eines Bildes auf einer Wand 80 auf, wie in der Szene T2 von 1 dargestellt, und die Informationsverarbeitungsvorrichtung 1 kann zum Beispiel zusätzlich zu einer auf Sprache basierenden Antwort eine auf Anzeige basierende Antwort ausgeben.
  • Wie in der Szene T1 von 1 gezeigt, geben zum Beispiel ein Fernsehempfänger 71 und eine Audiovorrichtung 72 in der Nähe der Informationsverarbeitungsvorrichtung 1 Musik mit großer Lautstärke aus, wenn der Benutzer U1 nicht zu der Informationsverarbeitungsvorrichtung 1 spricht.
  • Wie in der Szene T1 von 1 dargestellt dient, wenn der Benutzer U1 in einem Zustand spricht, in dem der Fernsehempfänger 71 und die Audiovorrichtung 72 Musik mit großer Lautstärke ausgeben, die Musik hier als Störgeräusche bei der Spracherkennung, und die Spracherkennungsgenauigkeit der Informationsverarbeitungsvorrichtung 1 wird wahrscheinlich herabgesetzt. Ferner bedeutet in der vorliegenden Offenbarung „Geräusch“ zum Beispiel einen anderen Ton als eine Sprache bei Spracheingabe oder Spracherkennung.
  • In dieser Hinsicht ist es in dem Spracherkennungssystem gemäß der ersten Ausführungsform der vorliegenden Offenbarung möglich, die Spracherkennungsgenauigkeit zu verbessern, indem Zustände von Peripherievorrichtungen in Bezug auf eine Ausgabe von Geräuschen bei der Spracherkennung auf der Basis von Sprachvorhersage für den Benutzer gesteuert werden.
  • Wenn speziell wie in einer Szene T2 von 1 dargestellt vorhergesagt wird, dass der Benutzer U1 zu der Informationsverarbeitungsvorrichtung 1 spricht, wird die Lautstärke der von dem Fernsehempfänger 71 und der Audiovorrichtung 72 ausgegebenen Musik gesteuert, so dass sie kleiner als in dem in der Szene T1 von 1 dargestellten Beispiel ist. Mit dieser Konfiguration wird die Spracherkennung der Informationsverarbeitungsvorrichtung 1 durch das von dem Fernsehempfänger 71 und der Audiovorrichtung 72 ausgegebene Geräusch (Musik) nicht leicht beeinflusst und die Erkennungsgenauigkeit wird verbessert. Folglich kann die Informationsverarbeitungsvorrichtung 1 Sprache 62 des Benutzers U1 korrekt erkennen und eine auf Sprache basierende Antwort 64 oder eine auf Anzeige basierende Antwort 81 wie in der Szene T2 von 1 dargestellt ausgeben.
  • Wie oben beschrieben ist es in dem Spracherkennungssystem gemäß der vorliegenden Ausführungsform, zum Beispiel wenn Sprache des Benutzers vorhergesagt wird, möglich, die Spracherkennungsgenauigkeit zu verbessern, indem Steuerung dergestalt durchgeführt wird, dass die Lautstärke der Vorrichtung in Bezug auf die Ausgabe des Geräuschs verringert wird.
  • Oben wurde die Übersicht über das Spracherkennungssystem gemäß der vorliegenden Offenbarung beschrieben. Ferner ist eine Form der Informationsverarbeitungsvorrichtung 1 nicht auf eine in 1 dargestellte zylindrische Form beschränkt und kann zum Beispiel ein Würfel, eine Kugel, ein Polyeder oder dergleichen sein. Als Nächstes wird ein Konfigurationsbeispiel für das Informationsverarbeitungssystem und die Informationsverarbeitungsvorrichtung 1 gemäß der ersten Ausführungsform der vorliegenden Offenbarung sequentiell beschrieben.
  • <Konfigurationsbeispiel für erste Ausführungsform>
  • (Konfigurationsbeispiel für Spracherkennungssystem)
  • 2 ist eine Erläuterungsdarstellung eines Konfigurationsbeispiels für das Spracherkennungssystem gemäß der ersten Ausführungsform der vorliegenden Offenbarung. Wie in 2 dargestellt, umfasst das Spracherkennungssystem gemäß der vorliegenden Ausführungsform die Informationsverarbeitungsvorrichtung 1, eine Peripherievorrichtung 7 und ein Kommunikationsnetz 9.
  • Wie mit Bezug auf 1 beschrieben, weist die Informationsverarbeitungsvorrichtung 1 eine Funktion des Durchführens der Spracherkennung/semantischen Analyse an der Sprache des Benutzers und des Gebens einer Antwort mittels Sprache oder eines Bildes auf. Ferner ist wie in 2 dargestellt die Informationsverarbeitungsvorrichtung 1 über das Kommunikationsnetz 9 mit der Peripherievorrichtung 7 verbunden und steuert den Zustand der Peripherievorrichtung 7 auf der Basis der Sprachvorhersage für den Benutzer. Ferner ist in 2 das Beispiel dargestellt, in dem die Informationsverarbeitungsvorrichtung 1 über das Kommunikationsnetz 9 mit der Peripherievorrichtung 7 verbunden ist, aber die Informationsverarbeitungsvorrichtung 1 und die Peripherievorrichtung 7 können direkt miteinander verbunden sein. Ferner wird eine ausführliche Konfiguration der Informationsverarbeitungsvorrichtung 1 später mit Bezug auf 3 beschrieben.
  • Die Peripherievorrichtung 7, die über das Kommunikationsnetz 9 mit der Informationsverarbeitungsvorrichtung 1 verbunden ist, ist eine Vorrichtung, die in der Nähe der Informationsverarbeitungsvorrichtung 1 platziert ist und einen Ton ausgibt. Die Peripherievorrichtung 7 kann zum Beispiel eine Vorrichtung mit einer Funktion des Ausgebens eines Tons wie Musik oder Sprache sein, wie etwa der Fernsehempfänger 71 oder die Audiovorrichtung 72 (zum Beispiel ein Lautsprecher, ein Minikomponentensystem oder dergleichen), wie in 2 dargestellt. Ferner kann die Peripherievorrichtung 7 eine Vorrichtung umfassen, die einen Antriebston (einen Betriebston) ausgibt (erzeugt), der einem Betrieb der Vorrichtung zugeordnet ist, wie etwa einer Klimatisierungsvorrichtung 73 (zum Beispiel einem Ventilator, einer Klimaanlage, einem Luftreiniger oder dergleichen), einem Staubsauger 74 oder einem PC (Personal Computer) 75. Ferner ist die Peripherievorrichtung 7 gemäß der vorliegenden Technologie nicht auf das in 2 dargestellte Beispiel beschränkt und kann verschiedene Vorrichtungen umfassen, die in der Lage sind, Ton auszugeben. Ferner werden in der folgenden Beschreibung mindestens eine oder mehrere in der Peripherievorrichtung 7 enthaltene Vorrichtungen auch als „Peripherievorrichtung 7“ bezeichnet.
  • Die Peripherievorrichtung 7 kann über das Kommunikationsnetz 9 Fähigkeitsinformationen, die angeben, wozu die Peripherievorrichtung 7 fähig ist, und Zustandsinformationen, die den Zustand der Peripherievorrichtung 7 angeben, zu der Informationsverarbeitungsvorrichtung 1 senden. Die Fähigkeitsinformationen können zum Beispiel Informationen umfassen wie Operationen, die durch die Peripherievorrichtung 7 ausgeführt werden können (zum Beispiel eine Tonausgabe, eine Luftbewegung, Ventilation und dergleichen), Zustände, in die die Peripherievorrichtung 7 eintreten kann, oder eine Art von Zustandsinformationen, die durch die Peripherievorrichtung 7 gesendet (oder nicht gesendet) werden können. Ferner können die Zustandsinformationen Informationen wie einen Lautstärkepegel, einen Betriebsmodus (zum Beispiel einen Standby-Modus, einen stillen Modus oder einen gemeinsamen Modus) oder einen Zustand (EIN/AUS) eines Netzschalters oder einen Setzwert in Bezug auf andere Operationen, die die aktuelle Peripherievorrichtung 7 betreffen, umfassen. Ferner kann die Peripherievorrichtung 7 die angeforderten Fähigkeitsinformationen oder Zustandsinformationen bei Empfang einer Übertragungsanforderung der Fähigkeitsinformationen oder Zustandsinformationen von der Informationsverarbeitungsvorrichtung 1 senden.
  • Ferner empfängt die Peripherievorrichtung 7 ein Zustandssteuersignal von der Informationsverarbeitungsvorrichtung 1 über das Kommunikationsnetz 9, und der Zustand der Peripherievorrichtung 7 wird gesteuert. Der durch die Informationsverarbeitungsvorrichtung 1 gesteuerte Zustand der Peripherievorrichtung 7 wäre zum Beispiel der Lautstärkepegel, der Betriebsmodus, Netz-EIN/AUS oder dergleichen.
  • Ferner liegt ein Abstand zwischen der Informationsverarbeitungsvorrichtung 1 und der Peripherievorrichtung 7 zum Beispiel in einem Bereich, den der Ton erreicht, und der von der Peripherievorrichtung 7 ausgegebene Ton wird mittels eines Mikrofons der Informationsverarbeitungsvorrichtung 1 gesammelt und kann bei der Spracherkennung durch die Informationsverarbeitungsvorrichtung 1 als Geräusch dienen. In der folgenden Beschreibung wird die Tonausgabe der Peripherievorrichtung 7 auch als Geräusch bezeichnet, ohne Musik, Sprache, Fahrgeräusche und dergleichen voneinander zu unterscheiden. Ferner wird die Peripherievorrichtung 7 auch als eine andere Vorrichtung bezeichnet, die eine Geräuschquelle oder eine Vorrichtung in Bezug auf die Ausgabe des Geräuschs sein kann.
  • Das Kommunikationsnetz 9 ist ein verdrahteter oder drahtloser Übertragungspfad von Informationen, die von einer Vorrichtung oder einem System gesendet werden, die bzw. das mit dem Kommunikationsnetz 9 verbunden ist. Bei der vorliegenden Ausführungsform kann, da der Abstand zwischen der Informationsverarbeitungsvorrichtung 1 und der Peripherievorrichtung 7, die mit dem Kommunikationsnetz 9 verbunden sind, in dem Bereich liegt, den der Ton wie oben beschrieben erreicht, kann das Kommunikationsnetz 9 zum Beispiel verschiedene Arten von lokalen Netzwerken (LAN) sein, darunter Ethernet (eingetragenes Warenzeichen). Ferner ist das Kommunikationsnetz 9 nicht auf ein LAN beschränkt, und das Kommunikationsnetz 9 kann ein öffentliches Netzwerk umfassen, wie etwa das Internet, ein Telefonnetz oder ein Satellitenkommunikationsnetz, ein WAN (großflächiges Netzwerk) oder dergleichen. Ferner kann das Kommunikationsnetz 9 ein dediziertes Netzwerk umfassen, wie etwa ein virtuelles privates Netzwerk mit Internetprotokoll (IP-VPN).
  • (Konfigurationsbeispiel für Informationsverarbeitungsvorrichtung)
  • Es wurde oben die Konfiguration des Spracherkennungssystems gemäß der vorliegenden Ausführungsform beschrieben. Als Nächstes wird mit Bezug auf 3 ein Konfigurationsbeispiel für die in dem Spracherkennungssystem gemäß der vorliegenden Ausführungsform enthaltene Informationsverarbeitungsvorrichtung 1 beschrieben. 3 ist eine Erläuterungsdarstellung eines Konfigurationsbeispiels für die Informationsverarbeitungsvorrichtung 1 gemäß der vorliegenden Ausführungsform.
  • Wie in 3 dargestellt, umfasst die Informationsverarbeitungsvorrichtung 1 eine Steuereinheit 10, eine Kommunikationseinheit 11, eine Tonsammeleinheit 12, einen Lautsprecher 13, eine Kamera 14, einen Entfernungssensor 15, eine Projektionseinheit 16, eine Speicherungseinheit 17 und die lichtemittierende Einheit 18.
  • Die Steuereinheit 10 steuert die Komponenten der Informationsverarbeitungsvorrichtung 1. Ferner fungiert die Steuereinheit 10 gemäß der vorliegenden Ausführungsform wie in 3 dargestellt auch als eine Sprachvorhersageeinheit 101, eine Spracherkennungseinheit 102, eine semantische Analyseeinheit 103, eine Zustandsdetektionseinheit 104, eine Zustandssteuereinheit 105 und eine Ausgabesteuereinheit 106.
  • Die Sprachvorhersageeinheit 101 führt die Sprachvorhersage für den Benutzer durch (sagt zum Beispiel vorher, dass der Benutzer gleich sprechen wird). Falls die Sprache des Benutzers vorhergesagt wird, kann die Sprachvorhersageeinheit 101 ferner der Spracherkennungseinheit 102, der Zustandsdetektionseinheit 104 und der Zustandssteuereinheit 105 eine Benachrichtigung geben, dass die Sprache des Benutzers vorhergesagt wird. Die Sprachvorhersage für den Benutzer durch die Sprachvorhersageeinheit 101 kann in verschiedenen Verfahren durchgeführt werden.
  • Zum Beispiel kann die Sprachvorhersageeinheit 101 die Sprache des Benutzers vorhersagen, falls die später zu beschreibende Spracherkennungseinheit 102 ein vorbestimmtes Aktivierungswort (zum Beispiel „Hallo Agent“ oder dergleichen) aus der durch die später zu beschreibende Tonsammeleinheit 12 gesammelten Sprache des Benutzers detektiert. Ferner kann die Sprachvorhersageeinheit 101 die Sprache des Benutzers vorhersagen, falls detektiert wird, dass eine Spracheingabetaste (nicht dargestellt), die in der Informationsverarbeitungsvorrichtung 1 angeordnet ist, durch den Benutzer betätigt wird. Ferner kann die Sprachvorhersageeinheit 101 die Sprache des Benutzers vorhersagen, falls auf der Basis von durch die Kamera 14 und den Entfernungssensor 15, die später beschrieben werden, erhaltenen Daten detektiert wird, dass der Benutzer mit seiner Hand winkt. Ferner kann die Sprachvorhersageeinheit 101 die Sprache des Benutzers vorhersagen, falls auf der Basis von durch die Kamera 14 oder den Entfernungssensor 15, die später beschrieben werden, erhaltenen Daten oder eines durch die Tonsammeleinheit 12 gesammelten Tons detektiert wird, dass der Benutzer mit seinen Händen klatscht. Ferner ist die Sprachvorhersage für den Benutzer durch die Sprachvorhersageeinheit 101 nicht auf die obigen Beispiele beschränkt, und die Sprache des Benutzers kann in verschiedenen Verfahren vorhergesagt werden.
  • Die Spracherkennungseinheit 102 erkennt die durch die später zu beschreibende Tonsammeleinheit 12 gesammelte Sprache des Benutzers, setzt die Sprache in eine Zeichenkette um und beschafft Sprachentext. Ferner ist es auch möglich, auf der Basis eines Sprachmerkmals der Spracherkennungseinheit 102 eine Person, die spricht, zu identifizieren oder eine Quelle der Sprache, das heißt, eine Richtung des Sprechers, zu schätzen.
  • Falls ein vorbestimmtes Aktivierungswort in dem beschafften Sprachtext enthalten ist, gibt die Spracherkennungseinheit 102 der Sprachvorhersageeinheit 101 ferner eine Benachrichtigung, die angibt, dass das Aktivierungswort detektiert wurde. Ferner kann die Spracherkennungseinheit 102 das Aktivierungswort mit anderem Sprachtext vergleichen und das Aktivierungswort mit Bezug auf das Geräusch zuverlässiger detektieren.
  • Die semantische Analyseeinheit 103 führt semantische Analyse an dem durch die Spracherkennungseinheit 102 beschafften Sprachtext unter Verwendung eines Prozesses natürlicher Sprache oder dergleichen aus. Ein Ergebnis der semantischen Analyse durch die semantische Analyseeinheit 103 wird der Ausgabesteuereinheit 106 zugeführt.
  • Die Zustandsdetektionseinheit 104 detektiert den Zustand der Peripherievorrichtung 7 (andere Vorrichtungen), die die Geräuschquelle sein kann, und führt der Zustandssteuereinheit 105 ein Detektionsergbnis zu. Zum Beispiel detektiert die Zustandsdetektionseinheit 104 den Zustand der Peripherievorrichtung 7 auf der Basis von Tonsammlung. Die Detektion des Zustands der Peripherievorrichtung 7 auf der Basis der Tonsammlung kann zum Beispiel durch Spezifizieren eines Betrags (eines Schalldruckpegels) von Umgebungston (Geräusche um die Informationsverarbeitungsvorrichtung 1), der durch die Tonsammeleinheit 12 gesammelt wird, durchgeführt werden. Ferner kann die Zustandsdetektionseinheit 104 den Betrag des spezifizierten Umgebungstons als das Detektionsergebnis der Zustandssteuereinheit 105 zuführen.
  • Ferner kann die Zustandsdetektionseinheit 104 den Zustand der Peripherievorrichtung 7 auf der Basis von Kommunikation detektieren. Die Detektion des Zustands der Peripherievorrichtung 7 auf der Basis der Kommunikation kann zum Beispiel dergestalt durchgeführt werden, dass die Kommunikationseinheit 11, die später beschrieben wird, so gesteuert wird, dass eine Übertragungsanforderung der Fähigkeitsinformationen und der Zustandsinformationen zu der Peripherievorrichtung 7 gesendet wird und die Fähigkeitsinformationen und die Zustandsinformationen über die Kommunikationseinheit 11 von der Peripherievorrichtung 7 beschafft werden. Ferner kann die Zustandsdetektionseinheit 104 die Fähigkeitsinformationen und die Zustandsinformationen als das Detektionsergebnis der Zustandssteuereinheit 105 zuführen.
  • Die Zustandssteuereinheit 105 steuert den Zustand der Peripherievorrichtung 7 (anderen Vorrichtung) auf der Basis des Detektionsergebnisses durch die Zustandsdetektionseinheit 104 und der Sprachvorhersage für den Benutzer durch die Sprachvorhersageeinheit 101. Falls zum Beispiel die Sprachvorhersageeinheit 101 die Sprache des Benutzers vorhersagt und der Betrag des Umgebungstons, der als das Detektionsergebnis durch die Zustandsdetektionseinheit 104 dient, größer als ein vorbestimmter Schwellenwert ist, kann die Zustandssteuereinheit 105 den Zustand der Peripherievorrichtung 7 so steuern, dass die von der Peripherievorrichtung 7 ausgegebenen Geräusche weiter verringert werden.
  • Ferner kann die Zustandssteuerung der Peripherievorrichtung 7 durch die Zustandssteuereinheit 105 in verschiedenen Verfahren durchgeführt werden. Ferner kann ein Verfahren zum Steuern des Zustands der Peripherievorrichtung 7 durch die Zustandssteuereinheit 105 auf der Basis der Fähigkeitsinformationen der Peripherievorrichtung 7 entschieden werden, die über die Kommunikationseinrichtung 11 oder aus der Speicherungseinheit 17 beschafft werden.
  • Falls zum Beispiel auf der Basis der Fähigkeitsinformationen der Peripherievorrichtung 7 bestimmt wird, dass die Peripherievorrichtung 7 eine Vorrichtung ist, deren Lautstärkepegel über Kommunikation gesteuert werden kann, kann die Zustandssteuereinheit 105 den Zustand der Peripherievorrichtung 7 dergestalt steuern, dass der Lautstärkepegel der Peripherievorrichtung 7 verringert oder vergrößert wird. In diesem Fall kann zum Beispiel die Zustandssteuereinheit 105 ein Steuersignal erzeugen, um zu bewirken, dass der Lautstärkepegel der Peripherievorrichtung 7 verringert oder vergrößert wird, und die Kommunikationseinheit 11 dergestalt steuern, dass das Steuersignal zu der Peripherievorrichtung 7 gesendet wird.
  • Falls auf der Basis der Fähigkeitsinformationen der Peripherievorrichtung 7 ferner bestimmt wird, dass die Peripherievorrichtung 7 eine Vorrichtung ist, deren Betriebsmodus über Kommunikation gesteuert werden kann, kann die Zustandssteuereinheit 105 den Zustand der Peripherievorrichtung 7 steuern, indem bewirkt wird, dass der Betriebsmodus der Peripherievorrichtung 7 geändert wird. In diesem Fall kann die Zustandssteuereinheit 105 zum Beispiel ein Steuersignal erzeugen, um zu bewirken, dass der Betriebsmodus in einen Betriebsmodus verwandelt wird, in dem die Geräuschausgabe von der Peripherievorrichtung 7 weiter verringert wird, und die Kommunikationseinrichtung 11 dergestalt steuern, dass das Steuersignal zu der Peripherievorrichtung 7 gesendet wird. Falls ferner zum Beispiel die Peripherievorrichtung 7 in einem von drei Betriebsmodi arbeitet, das heißt, dem Standby-Modus, dem stillen Modus und dem gewöhnlichen Modus, kann die Geräuschausgabe durch die Peripherievorrichtung 7 in der Reihenfolge Standby-Modus, stiller Modus und gewöhnlicher Modus zunehmen.
  • Falls ferner auf der Basis der Fähigkeitsinformationen der Peripherievorrichtung 7 bestimmt wird, dass ein Einstellungswert in Bezug auf einen Betrieb der Peripherievorrichtung 7 über Kommunikation gesteuert wird, kann die Zustandssteuereinheit 105 den Zustand der Peripherievorrichtung 7 steuern, indem bewirkt wird, dass der Einstellungswert in Bezug auf den Betrieb der Peripherievorrichtung 7 geändert wird. Der Einstellungswert in Bezug auf den Betrieb der Peripherievorrichtung 7 wäre zum Beispiel eine Stärke eines Luftvolumens, die Anzahl der Umdrehungen, Stromverbrauch und dergleichen. In diesem Fall kann zum Beispiel die Zustandssteuereinheit 105 ein Steuersignal erzeugen, um zu bewirken, dass der Einstellungswert in Bezug auf den Betrieb der Peripherievorrichtung 7 in einen Einstellungswert verwandelt wird, bei dem die Geräuschausgabe der Peripherievorrichtung 7 weiter verringert ist, und die Kommunikationseinheit 11 so steuern, dass das Steuersignal zu der Peripherievorrichtung 7 gesendet wird.
  • Falls ferner auf der Basis der Fähigkeitsinformationen der Peripherievorrichtung 7 bestimmt wird, dass die Peripherievorrichtung 7 eine Vorrichtung ist, bei der ein EIN/AUS der Stromversorgung über Kommunikation gesteuert werden kann, kann die Zustandssteuereinheit 105 ein Steuersignal erzeugen, um zu bewirken, dass die Stromversorgung der Peripherievorrichtung 7 in EIN oder AUS verwandelt wird, und die Kommunikationseinheit 11 dergestalt steuern, dass das Steuersignal zu der Peripherievorrichtung 7 gesendet wird. Ferner kann die Zustandssteuereinheit 105 auf der Basis der Fähigkeitsinformationen der Peripherievorrichtung 7 oder dergleichen bestimmen, ob die Peripherievorrichtung 7 heruntergefahren ist. Falls zum Beispiel bestimmt wird, dass die Peripherievorrichtung 7 nicht heruntergefahren ist, kann die Zustandssteuereinheit 105 die Zustandssteuerung der Peripherievorrichtung 7 unter Verwendung eines anderen oben beschriebenen Zustandssteuerverfahrens durchführen. Ferner kann die Zustandssteuereinheit 105 die Zustandssteuerung der Peripherievorrichtung 7 unter Verwendung eines anderen oben beschriebenen Zustandssteuerverfahrens durchführen, vorzugsweise anstelle der Steuerung der Stromversorgung. Mit dieser Konfiguration ist es, da die Peripherievorrichtung 7 einfach ohne völliges Anhalten des Betriebs gesteuert wird, unwahrscheinlich, dass der Benutzer aufgrund des Stoppens der Peripherievorrichtung 7 ein unbequemes Gefühl oder Unbequemlichkeit erfährt.
  • Ferner kann die Zustandssteuereinheit 105 den Zustand der Peripherievorrichtung 7 dergestalt steuern, dass die Geräuschausgabe der Peripherievorrichtung 7 weiter verringert ist, nachdem bewirkt wird, dass die Zustandsinformationen der Peripherievorrichtung, die von der Zustandsdetektionseinheit 104 beschafft werden, in der Speicherungseinheit 17 gespeichert werden. Falls ferner die Sprache des Benutzers endet, kann die Zustandssteuereinheit 105 den Zustand der Peripherievorrichtung 7 auf der Basis der in der Speicherungseinheit 17 gespeicherten Zustandsinformationen der Peripherievorrichtung 7 dergestalt steuern, dass der Zustand der Peripherievorrichtung 7 zu dem Zustand zu einem Zeitpunkt zurückkehrt, an dem der Zustand der Peripherievorrichtung 7 in der Speicherungseinheit 17 gespeichert wird. Das Zustandssteuerbeispiel der Peripherievorrichtung wird später ausführlich mit Bezug auf 4 beschrieben.
  • Die Ausgabesteuereinheit 106 steuert eine Antwort auf die Sprache des Benutzers oder eine Ausgabe in Bezug auf eine Operation, die durch den Benutzer erfordert wird, gemäß dem von der semantischen Analyseeinheit 103 bereitgestellten semantischen Analyseergebnis. Falls zum Beispiel die Sprache des Benutzers ist, „das Wetter morgen“ zu erhalten, beschafft die Ausgabesteuereinheit 106 Informationen in Bezug auf „das Wetter morgen“ von einem Wettervorhersageserver in einem Netzwerk und steuert den Lautsprecher 13, die Projektionseinheit 16 oder die lichtemittierende Einheit 18 so, dass die beschafften Informationen ausgegeben werden.
  • Die Kommunikationseinheit 11 führt Empfangen und Senden von Daten mit einer externen Vorrichtung durch. Zum Beispiel ist die Kommunikationseinheit 11 mit dem Kommunikationsnetz 9 verbunden und führt Senden zu der Peripherievorrichtung 7 oder Empfang von der Peripherievorrichtung 7 durch. Zum Beispiel sendet die Kommunikationseinrichtung 11 die Übertragungsanforderung der Fähigkeitsinformationen und der Zustandsinformationen zu der Peripherievorrichtung 7. Ferner empfängt die Kommunikationseinheit 11 die Fähigkeitsinformationen und die Zustandsinformationen von der Peripherievorrichtung 7. Außerdem sendet die Kommunikationseinrichtung 11 das durch die Zustandssteuereinheit 105 erzeugte Steuersignal zu der Peripherievorrichtung 7. Ferner ist die Kommunikationseinrichtung 11 über das Kommunikationsnetz 9 oder ein anderes Kommunikationsnetz mit einem (nicht dargestellten) vorbestimmten Server verbunden und empfängt Informationen, die für die Ausgabesteuerung durch die Ausgabesteuereinheit 106 notwendig sind.
  • Die Tonsammeleinheit 12 hat eine Funktion des Sammelns des Umgebungstons und Ausgebens des gesammelten Tons an die Steuereinheit 10 als ein Audiosignal. Ferner kann zum Beispiel die Tonsammeleinheit 12 durch ein oder mehrere Mikrofone implementiert werden.
  • Der Lautsprecher 13 hat eine Funktion des Umwandelns des Audiosignals in eine Sprache und Ausgebens der Sprache unter der Kontrolle der Ausgabesteuereinheit 106.
  • Die Kamera 14 hat eine Funktion des Abbildens eines umgebenden Bereichs mit einer in der Informationsverarbeitungsvorrichtung 1 installierten Abbildungslinse und Ausgebens des aufgenommenen Bildes an die Steuereinheit 10. Ferner kann die Kamera 14 zum Beispiel durch eine 360-Grad-Kamera, eine Weitwinkelkamera oder dergleichen implementiert werden.
  • Der Entfernungssensor 15 hat eine Funktion des Messens eines Abstands zwischen der Informationsverarbeitungsvorrichtung 1 und dem Benutzer oder einer Person um den Benutzer. Der Entfernungssensor 15 wird zum Beispiel durch einen optischen Sensor implementiert (einen Sensor, der einen Abstand zu einem Objekt auf der Basis von Phasendifferenzinformationen mit einem Lichtemissions-/- empfangstiming misst).
  • Die Projektionseinheit 16 ist ein Beispiel für eine Anzeigevorrichtung und hat eine Funktion des Durchführens von Anzeige durch Projizieren (Vergrößern) eines Bildes auf eine Wand oder einen Schirm.
  • Die Speicherungseinheit 17 speichert ein Programm oder einen Parameter zur Bewirkung, dass jede Komponente der Informationsverarbeitungsvorrichtung 1 funktioniert. Ferner speichert die Speicherungseinheit 17 auch Informationen in Bezug auf die Peripherievorrichtung 7. Die Informationen in Bezug auf die Peripherievorrichtung 7 wären zum Beispiel Informationen zum Herstellen einer Verbindung mit der mit dem Kommunikationsnetz 9 verbundenen Peripherievorrichtung 7, die Fähigkeitsinformationen, die Zustandsinformationen und dergleichen.
  • Die lichtemittierende Einheit 18 wird durch ein lichtemittierendes Element, wie etwa eine LED, implementiert und kann volle Beleuchtung, teilweise Beleuchtung, Blinken, Beleuchtungspositionssteuerung und dergleichen durchführen. Zum Beispiel kann die lichtemittierende Einheit 18 bewirken, dass es so aussieht, als wäre die Sichtlinie der Richtung des Lautsprechers zugewandt, indem ein Teil davon in der Richtung des Lautsprechers, die durch die Spracherkennungseinheit 102 erkannt wird, gemäß der Steuerung der Steuereinheit 10 aufleuchten gelassen wird.
  • Es wurde oben speziell die Konfiguration der Informationsverarbeitungsvorrichtung 1 gemäß der vorliegenden Ausführungsform beschrieben. Ferner ist die Konfiguration der in 3 dargestellten Informationsverarbeitungsvorrichtung 1 ein Beispiel und die vorliegende Ausführungsform ist nicht darauf beschränkt. Zum Beispiel kann die Informationsverarbeitungsvorrichtung 1 ferner eine Infrarot- bzw. IR-Kamera, eine Tiefenkamera, eine Stereokamera, einen Personensensor oder dergleichen umfassen, um Informationen in Bezug auf die Umgebung zu erhalten. Ferner kann die Informationsverarbeitungsvorrichtung 1 weiterhin eine Touchpanel-Anzeige, eine physische Taste oder dergleichen als Benutzeroberfläche umfassen. Ferner sind die Installationspositionen der Tonsammeleinheit 12, des Lautsprechers 13, der Kamera 14, der lichtemittierenden Einheit 18 und dergleichen, die in der Informationsverarbeitungsvorrichtung 1 installiert sind, nicht konkret beschränkt. Ferner können die Funktionen der Steuereinheit 10 gemäß der vorliegenden Ausführungsform durch eine andere Informationsverarbeitungsvorrichtung ausgeführt werden, die über die Kommunikationseinheit 11 verbunden ist.
  • <Betriebsbeispiel für die erste Ausführungsform>
  • Als Nächstes wird ein Betriebsbeispiel für die Informationsverarbeitungsvorrichtung 1 gemäß der vorliegenden Ausführungsform mit Bezug auf 4 beschrieben.
  • 4 ist ein Flussdiagramm eines Betriebsbeispiels für die Informationsverarbeitungsvorrichtung 1 gemäß der vorliegenden Ausführungsform. Wie in 4 dargestellt, führt die Steuereinheit 10 zuerst einen Sprachvorhersageprozess aus, zum Bestimmen, ob der Benutzer gleich sprechen wird oder nicht (S110). Der Sprachvorhersageprozess des Schritts S110 wird wiederholt, bis die Sprache des Benutzers vorhergesagt wird.
  • Falls die Sprache des Benutzers vorhergesagt wird (JA in Schritt S110), misst die Informationsverarbeitungsvorrichtung 1 den Umgebungston (S120). Zum Beispiel kann die Zustandsdetektionseinheit 104 den Umgebungston durch Spezifizieren des Betrags des Umgebungstons auf der Basis des durch die Tonsammeleinheit 12 gesammelten Audiosignals messen.
  • Dann bestimmt die Zustandssteuereinheit 105, ob der in Schritt S120 gemessene Umgebungston groß ist (S130). Zum Beispiel kann die Zustandssteuereinheit 105 die Bestimmung in Schritt S130 durch Vergleichen des in Schritt S120 gemessenen Umgebungstons mit einem vorbestimmten Schwellenwert durchführen.
  • Falls bestimmt wird, dass der Umgebungston groß ist (JA in Schritt S130), bewirkt die Zustandssteuereinheit 105, dass die Zustandsinformationen der Peripherievorrichtung 7, die mittels der Zustandsdetektionseinheit 104 auf der Basis der Kommunikation von der Peripherievorrichtung 7 beschafft werden, in der Speicherungseinheit 17 gespeichert werden (Schritt S140).
  • Dann steuert die Zustandssteuereinheit 105 den Zustand der Peripherievorrichtung 7 (S150). Zum Beispiel kann die Zustandssteuereinheit 105 ein Steuersignal erzeugen, um zu bewirken, dass der Lautstärkepegel für alle Peripherievorrichtungen 7, deren Zustand gesteuert werden kann, um einen vorbestimmten Wert verringert wird, und bewirken, dass die Kommunikationseinheit 11 das Steuersignal sendet. Ferner kann die Zustandssteuereinheit 105 ein Steuersignal zum Verringern des Umgebungstons (Geräuschs) für jede der Peripherievorrichtungen 7 auf der Basis der Fähigkeitsinformationen und der Zustandsinformationen der Peripherievorrichtung 7, die in Schritt S140 beschafft wurden, erzeugen und bewirken, dass die Kommunikationseinheit 11 das Steuersignal sendet.
  • Dann empfängt die Informationsverarbeitungsvorrichtung 1 eine Spracheingabe des Benutzers und führt einen Spracherkennungsprozess aus (S160). In Schritt S170 bestimmt die Steuereinheit 10 zum Beispiel falls eine Nicht-Sprachperiode eine vorbestimmte Zeit (zum Beispiel 10 Sekunden) oder mehr andauert, dass Sprache des Benutzers endet und setzt den Spracherkennungsprozess von S160 fort, bis die Sprache endet.
  • Falls bestimmt wird, dass die Sprache des Benutzers endet (JA in S170), führt die semantische Analyseeinheit 103 auf der Basis des Erkennungsergebnisses (Sprachtexts) der Spracherkennungseinheit 102 einen semantischen Analyseprozess aus und die Ausgabesteuereinheit 106 steuert die Projektionseinheit 16 und die lichtemittierende Einheit 18 gemäß dem semantischen Analyseergebnis (S180).
  • Als Letztes führt die Zustandssteuereinheit 105 auf der Basis der in Schritt S140 in der Speicherungseinheit 17 gespeicherten Zustandsinformationen der Peripherievorrichtung 7 die Zustandssteuerung dergestalt durch, dass der Zustand der Peripherievorrichtung 7 zu einem Zustand an einem Zeitpunkt von Schritt S140 zurückkehrt (S190). Zum Beispiel kann die Zustandssteuereinheit 105 ein Steuersignal erzeugen, zum Bewirken, dass der Zustand der Peripherievorrichtung 7 in den Zustand der Peripherievorrichtung 7 zu einem Zeitpunkt von Schritt S140 für jede der Peripherievorrichtungen 7 geändert wird, und zum Bewirken, dass die Kommunikationseinheit 11 das erzeugte Steuersignal sendet.
  • Die oben beschriebene Reihe von Prozessen (S110 bis S190) kann zum Beispiel jedes Mal wiederholt werden, wenn eine Reihe von Prozessen endet.
  • <Effekte der ersten Ausführungsform>
  • Wie oben beschrieben wird gemäß der ersten Ausführungsform der vorliegenden Offenbarung, falls die Sprache des Benutzers vorhergesagt wird, der Betrag des Umgebungstons (Geräuschs) der Informationsverarbeitungsvorrichtung 1 gemessen, und falls der Umgebungston groß ist, wird der Zustand der Peripherievorrichtung 7, die die Quelle des Geräuschs sein kann, so gesteuert, dass der Umgebungston verringert wird. Mit dieser Konfiguration ist es möglich, die Spracherkennungsgenauigkeit, wenn der Benutzer spricht, zu verbessern, selbst falls es andere Tonquellen um den Benutzer gibt. Falls ferner die Informationsverarbeitungsvorrichtung 1 entsprechend der Sprache des Benutzers eine auf Sprache basierende Antwort ausgibt, wird der Umgebungston verringert, so dass der Benutzer die auf Sprache basierende Antwort, die von der Informationsverarbeitungsvorrichtung 1 ausgegeben wird, leichter hören kann.
  • <Modifizierte Beispiele für die erste Ausführungsform>
  • Es wurde oben die erste Ausführungsform der vorliegenden Offenbarung beschrieben. Nachfolgend werden mehrere modifizierte Beispiele für die erste Ausführungsform der vorliegenden Offenbarung beschrieben. Ferner kann jedes der nachfolgend zu beschreibenden modifizierten Beispiele alleine auf die erste Ausführungsform der vorliegenden Offenbarung oder in Kombination auf die erste Ausführungsform der vorliegenden Offenbarung angewandt werden. Ferner kann jedes modifizierte Beispiel anstelle der in der ersten Ausführungsform der vorliegenden Offenbarung beschriebenen Konfiguration angewandt werden oder kann zusätzlich zu der in der ersten Ausführungsform der vorliegenden Offenbarung beschriebenen Konfiguration angewandt werden.
  • (Erstes modifiziertes Beispiel)
  • In dem obigen Betriebsbeispiel wird das Beispiel, in dem der Zustandssteuerprozess der Peripherievorrichtung 7 zum Verringern des Geräuschs in Schritt S150, der in 4 dargestellt ist, nur einmal ausgeführt, aber die vorliegende Ausführungsform ist nicht auf dieses Beispiel beschränkt. Als das erste modifizierte Beispiel kann die Informationsverarbeitungsvorrichtung 1 den Zustand der Peripherievorrichtung 7 zwei oder mehr Mal steuern, um das Geräusch zu verringern.
  • 5 ist ein Flussdiagramm eines Betriebsbeispiels für die Informationsverarbeitungsvorrichtung 1 gemäß dem vorliegenden modifizierten Beispiel. Da Prozesse der jeweiligen in 5 dargestellten Schritte den Prozessen jeweiliger Schritte mit denselben Schrittzahlen, die in 4 dargestellt sind, ähnlich sind, wird eine Beschreibung davon weggelassen. In dem in 5 dargestellten Betriebsbeispiel kehrt im Gegensatz zu dem in 4 dargestellten Betriebsbeispiel, nach dem Zustandssteuerprozess der Peripherievorrichtung 7 (S150) der Prozess zu Schritt S120 zurück und die Umgebungstonmessung (S120) und die Umgebungston-Betragsbestimmung (S130) werden durchgeführt. Falls dann wieder bestimmt wird, dass der Umgebungston groß ist (JA in S130), werden die Speicherung des Zustands der Peripherievorrichtung (S140) und der Zustandssteuerprozess der Peripherievorrichtung 7 (S150) nochmals durchgeführt.
  • Mit dieser Operation ist es möglich, den Zustandssteuerprozess für die Peripherievorrichtung zu wiederholen, bis der Umgebungston ausreichend verringert ist, und somit wird die Genauigkeit des Spracherkennungsprozesses und des semantischen Analyseprozesses von Schritt S160 und nachfolgenden Schritten weiter verbessert.
  • Ferner ist ein Verfahren zum Steuern des Zustands der Peripherievorrichtung 7 zwei oder mehr Mal, um das Geräusch zu verringern, nicht auf das obige Beispiel beschränkt. Um das Geräusch zu verringern, kann die Zustandssteuereinheit 105 zum Beispiel den Zustand der Peripherievorrichtung 7 auf der Basis der Spracherkennung oder des semantischen Analyseergebnisses auf der Basis der Sprache des Benutzers zwei oder mehr Mal steuern.
  • Zum Beispiel kann in Schritt S160 die Zustandssteuerung der Peripherievorrichtung 7 nochmals durchgeführt werden, falls der Spracherkennungsprozess fehlschlägt (der Sprachtext nicht beschafft werden kann), obwohl der Benutzer spricht. Ferner kann zum Beispiel die Sprache des Benutzers auf der Basis einer Bewegung des Munds des Benutzers, der in einem durch die Kamera 14 beschafften Bild enthalten ist, detektiert werden.
  • In Schritt S180 kann ferner, falls die semantische Analyse aus Sprachtext fehlschlägt (das semantische Analyseergebnis nicht erhalten werden kann), die Zustandssteuerung der Peripherievorrichtung 7 nochmals durchgeführt werden.
  • (Zweites modifiziertes Beispiel)
  • In dem obigen Beispiel beschafft die Zustandssteuereinheit 105 die Zustandsinformationen der Peripherievorrichtung 7 und bewirkt, dass die Zustandsinformationen in der Speicherungseinheit 17 gespeichert werden, aber die vorliegende Ausführungsform ist nicht auf dieses Beispiel beschränkt. Als zweites modifiziertes Beispiel kann die Zustandssteuereinheit 105 bewirken, dass ein Parameter in dem Steuersignal in Bezug auf die Zustandssteuerung anstelle der Zustandsinformationen der Peripherievorrichtung 7 gespeichert wird.
  • Zum Beispiel kann in Schritt S150 von 4, falls die Zustandssteuereinheit 105 ein Steuersignal erzeugt, um zu bewirken, dass der Lautstärkepegel für die Peripherievorrichtung 7 um einen vorbestimmten Wert oder mehr verringert wird, der Parameter der vorbestimmte Wert sein. Ferner kann in diesem Fall in Schritt S190 von 4 die Zustandssteuereinheit 105 ein Steuersignal erzeugen, um zu bewirken, dass der Lautstärkepegel um den in der Speicherungseinheit 17 gespeicherten vorbestimmten Wert (Parameter) erhöht wird, und bewirken, dass die Kommunikationseinheit 11 das Steuersignal sendet. Mit dieser Konfiguration kann, selbst falls die Zustandsinformationen der Peripherievorrichtung 7 aufgrund der Funktionsbeschränkung der Peripherievorrichtung 7 oder dergleichen nicht über Kommunikation beschafft werden können, der Zustand der Peripherievorrichtung 7 zu dem Zustand an einem Zeitpunkt von Schritt S140 von 4 zurückgeführt werden.
  • «2. Zweite Ausführungsform»
  • Somit wurden die erste Ausführungsform der vorliegenden Offenbarung und die modifizierten Beispiele beschrieben. Es wird dann eine zweite Ausführungsform der vorliegenden Offenbarung beschrieben. Bei der oben beschriebenen ersten Ausführungsform werden alle Peripherievorrichtungen 7, die durch die Informationsverarbeitungsvorrichtung 1 gesteuert werden können, auf der Basis des Betrags des Umgebungstons als das Steuerziel gesetzt. Eine Informationsverarbeitungsvorrichtung gemäß der zweiten Ausführungsform extrahiert dagegen die als das Steuerziel dienende Peripherievorrichtung 7 auf der Basis der Zustandsinformationen jeder der Peripherievorrichtungen 7, die über Kommunikation erhalten werden, und steuert den Zustand der extrahierten Peripherievorrichtung 7.
  • <Konfigurationsbeispiel für die zweite Ausführungsform>
  • 6 ist eine Erläuterungsdarstellung eines Konfigurationsbeispiels für die Informationsverarbeitungsvorrichtung gemäß der zweiten Ausführungsform der vorliegenden Offenbarung. Wie in 6 dargestellt ist die Informationsverarbeitungsvorrichtung 2 gemäß der vorliegenden Ausführungsform von der Informationsverarbeitungsvorrichtung 1 von 3 insofern verschieden, als eine Funktionskonfiguration einer Steuereinheit 20 teilweise von der Funktionskonfiguration der Steuereinheit 10 von 3 verschieden ist. Da Komponenten, die unter den in 6 dargestellten Komponenten den in 3 dargestellten im Wesentlichen ähnlich sind, durch dieselben Bezugszahlen bezeichnet werden, wird ferner ihre Beschreibung weggelassen. Funktionen einer Zustandsdetektionseinheit 204 und einer Zustandssteuereinheit 205 der Steuereinheit 20 gemäß der vorliegenden Ausführungsform werden nachfolgend beschrieben.
  • (Zustandsdetektionseinheit 204)
  • Ähnlich wie die in der ersten Ausführungsform beschriebene Zustandsdetektionseinheit 104 detektiert die Zustandsdetektionseinheit 204 gemäß der vorliegenden Ausführungsform den Zustand der Peripherievorrichtung 7 (anderer Vorrichtungen), die die Geräuschquelle sein können. Ähnlich wie die Zustandsdetektionseinheit 104 detektiert die Zustandsdetektionseinheit 204 zum Beispiel den Zustand der Peripherievorrichtung 7 auf der Basis von Kommunikation und beschafft die Fähigkeitsinformationen und Zustandsinformationen der Peripherievorrichtung 7 mittels der Kommunikationseinheit 11. Ferner kann die Zustandsdetektionseinheit 204 die Fähigkeitsinformationen und Zustandsinformationen der Zustandssteuereinheit 205 als das Detektionsergebnis bereitstellen.
  • Ferner kann die Zustandsdetektionseinheit 204 gemäß der vorliegenden Ausführungsform die Funktion des Detektierens des Zustands der Peripherievorrichtung 7 auf der Basis der Tonsammlung wie bei der ersten Ausführungsform beschrieben aufweisen oder auch nicht.
  • (Zustandssteuereinheit 205)
  • Ähnlich wie die bei der ersten Ausführungsform beschriebene Zustandssteuereinheit 105 steuert die Zustandssteuereinheit 205 gemäß der vorliegenden Ausführungsform den Zustand der Peripherievorrichtung 7 (anderer Vorrichtungen) auf der Basis des Detektionsergebnisses durch die Zustandsdetektionseinheit 204 und der Sprachvorhersage für den Benutzer durch die Sprachvorhersageeinheit 101. Im Gegensatz zu der Zustandssteuereinheit 105 gemäß der ersten Ausführungsform hat die Zustandssteuereinheit 205 gemäß der vorliegenden Ausführungsform eine Funktion des Extrahierens der Peripherievorrichtung 7, deren Zustand gesteuert wird, aus einer Vielzahl von Peripherievorrichtungen 7 auf der Basis des Zustands der Peripherievorrichtung 7. Falls zum Beispiel die Sprachvorhersageeinheit 101 die Sprache des Benutzers vorhersagt, extrahiert die Zustandssteuereinheit 205 gemäß der vorliegenden Ausführungsform die Peripherievorrichtung 7, die eine vorbestimmte Bedingung erfüllt, auf der Basis der Zustandsinformationen der Peripherievorrichtung 7 und steuert den Zustand der extrahierten Peripherievorrichtung 7.
  • Die vorbestimmte Bedingung auf der Basis der Zustandsinformationen der Peripherievorrichtung 7 kann zum Beispiel eine Bedingung sein, dass ein aktueller Lautstärkepegel ein vorbestimmter Schwellenwert oder mehr ist. Ferner kann die vorbestimmte Bedingung auf der Basis der Zustandsinformationen der Peripherievorrichtung 7 eine Bedingung sein, dass der Betriebsmodus der Peripherievorrichtung 7 ein vorbestimmter Betriebsmodus ist. Ferner kann die vorbestimmte Bedingung auf der Basis der Zustandsinformationen der Peripherievorrichtung 7 eine Bedingung sein, dass ein Betrag eines vorbestimmten Einstellungswerts in Bezug auf den Betrieb der Peripherievorrichtung 7 ein vorbestimmter Schwellwert oder mehr ist.
  • Mit dieser Konfiguration ist es zum Beispiel möglich, den Zustand der Peripherievorrichtung 7, die ein größeres Geräusch ausgibt, vorzugsweise oder effizient zu steuern. Ferner gibt es, da nur der Zustand der Peripherievorrichtung 7, die ein größeres Geräusch ausgeben kann, geändert wird und der Zustand der Peripherievorrichtung 7, die ein kleineres Geräusch ausgeben kann, nicht geändert wird, einen Effekt dahingehend, dass der Benutzer unwahrscheinlich ein unbequemes Gefühl hat.
  • Ferner kann die Zustandssteuereinheit 205 gemäß der vorliegenden Ausführungsform bewirken, dass die Zustandsinformationen der Peripherievorrichtung 7 wie oben beschrieben extrahiert werden, um in der Speicherungseinheit 17 gespeichert zu werden.
  • Da ferner die anderen Funktionen der Zustandssteuereinheit 205 gemäß der vorliegenden Ausführungsform (des Zustandssteuerverfahrens und der Entscheidung des Zustandssteuerverfahrens der Peripherievorrichtung 7) denen der bei der ersten Ausführungsform beschriebenen Zustandssteuereinheit 105 ähnlich sind, wird Beschreibung dieser weggelassen.
  • <Betriebsbeispiel für zweite Ausführungsform>
  • Oben wurde das Konfigurationsbeispiel für die Informationsverarbeitungsvorrichtung 2 gemäß der zweiten Ausführungsform der vorliegenden Offenbarung beschrieben. Als Nächstes wird mit Bezug auf 7 ein Betriebsbeispiel für die Informationsverarbeitungsvorrichtung 2 gemäß der vorliegenden Ausführungsform beschrieben.
  • 7 ist ein Flussdiagramm eines Betriebsbeispiels für die Informationsverarbeitungsvorrichtung 2 gemäß der vorliegenden Ausführungsform. Als Erstes wiederholt ähnlich wie bei dem oben mit Bezug auf 4 beschriebenen Schritt S110 die Steuereinheit 20 den Sprachvorhersageprozess, bis die Sprache des Benutzers vorhergesagt wird (S210).
  • Falls die Sprache des Benutzers vorhergesagt wird (JA in Schritt S210), sendet die Zustandsdetektionseinheit 204 die Übertragungsanforderung der Fähigkeitsinformationen und der Zustandsinformationen zu den Peripherievorrichtungen 7 und empfängt die Fähigkeitsinformationen und die Zustandsinformationen von den Peripherievorrichtungen 7 (S220).
  • Dann extrahiert die Zustandssteuereinheit 204 die Peripherievorrichtung 7, die die Bedingung erfüllt, auf der Basis der Zustandsinformationen unter den Peripherievorrichtungen 7 (S230). Die Bedingung auf der Basis der Zustandsinformationen kann zum Beispiel eine beliebige der oben beschriebenen Bedingungen sein. Ferner bewirkt die Zustandssteuereinheit 205, dass die Zustandsinformationen der extrahierten Peripherievorrichtung 7 in der Speicherungseinheit 17 gespeichert werden (S240).
  • Dann steuert die Zustandssteuereinheit 205 die Zustände der extrahierten Peripherievorrichtungen 7 (S250). Zum Beispiel kann die Zustandssteuereinheit 205 ein Steuersignal erzeugen, um den Umgebungston (Geräusch) für jede der extrahierten Peripherievorrichtungen 7 auf der Basis der Fähigkeitsinformationen und der Zustandsinformationen der Peripherievorrichtungen 7, die in Schritt S220 empfangen werden, zu verringern, und bewirken, dass die Kommunikationseinrichtung 11 das Steuersignal sendet.
  • Ein nachfolgender Prozess der Schritte S260 bis 290, die in 7 dargestellt sind, ist dem Prozess der oben mit Bezug auf 4 beschriebenen Schritte S160 bis 190 ähnlich und seine Beschreibung wird somit weggelassen.
  • <Effekte der zweiten Ausführungsform>
  • Wie oben beschrieben werden gemäß der zweiten Ausführungsform der vorliegenden Offenbarung, wenn die Sprache des Benutzers vorhergesagt wird, die Zustandsinformationen der Peripherievorrichtung 7 um die Informationsverarbeitungsvorrichtung 2 beschafft, und die Zustandssteuerung wird so durchgeführt, dass die Geräuschausgabe von der Peripherievorrichtung 7, die auf der Basis der Zustandsinformationen extrahiert wird, verringert wird. Mit dieser Konfiguration ist es möglich, die Spracherkennungsgenauigkeit, wenn der Benutzer spricht, zu verbessern, selbst falls es andere Tonquellen um den Benutzer gibt. Gemäß der zweiten Ausführungsform der vorliegenden Offenbarung wird ferner die Peripherievorrichtung 7, deren Zustand geändert wird, extrahiert, und die Zustandssteuerung wird durchgeführt, und somit besteht ein Effekt dahingehend, dass der Benutzer unwahrscheinlich ein unbequemes Gefühl hat.
  • <Ergänzung der zweiten Ausführungsform>
  • Ferner wurde in dem obigen Beispiel das Beispiel beschrieben, in dem die Zustandsdetektionseinheit 204 die Funktion des Detektierens des Zustands der Peripherievorrichtung 7 auf der Basis von Tonsammlung wie bei der ersten Ausführungsform beschrieben nicht aufweisen kann, aber die vorliegende Ausführungsform ist nicht auf dieses Beispiel beschränkt. Zum Beispiel kann die Zustandsdetektionseinheit 204 den Umgebungston mit der Zustandsdetektionsfunktion auf der Basis der Tonsammlung messen, und falls bestimmt wird, dass der Umgebungston groß ist, kann die Zustandssteuereinheit 205 die Peripherievorrichtung 7, deren Zustand geändert wird, extrahieren und die Zustandssteuerung durchführen.
  • Ferner ist es auch möglich, jedes der bei der ersten Ausführungsform beschriebenen modifizierten Beispiele auf die zweite Ausführungsform anzuwenden.
  • «3. Dritte Ausführungsform»
  • Oben wurden die erste Ausführungsform und die zweite Ausführungsform der vorliegenden Offenbarung beschrieben. Als Nächstes wird eine dritte Ausführungsform der vorliegenden Offenbarung beschrieben. Die Informationsverarbeitungsvorrichtung gemäß der dritten Ausführungsform steuert ferner den Zustand der Peripherievorrichtung 7 auf der Basis einer Position der Peripherievorrichtung 7.
  • <Konfigurationsbeispiel für die dritte Ausführungsform>
  • 8 ist eine Erläuterungsdarstellung eines Konfigurationsbeispiels für eine Informationsverarbeitungsvorrichtung gemäß der dritten Ausführungsform der vorliegenden Offenbarung. Da Komponenten, die im Wesentlichen den in 4 und 6 dargestellten unter den in 8 dargestellten Komponenten ähnlich sind, durch dieselben Bezugszahlen bezeichnet werden, wird ihre Beschreibung weggelassen. Nachfolgend werden eine Steuereinheit 30 und eine Speicherungseinheit 37, die in der Informationsverarbeitungsvorrichtung 2 gemäß der vorliegenden Ausführungsform enthalten sind, beschrieben.
  • (Steuereinheit 30)
  • Die Steuereinheit 30 gemäß der vorliegenden Ausführungsform steuert jeweilige Komponenten der Informationsverarbeitungsvorrichtung 3. Ferner fungiert die Steuereinheit 30 gemäß der vorliegenden Ausführungsform als eine Sprachvorhersageeinheit 301, eine Spracherkennungseinheit 302, eine semantische Analyseeinheit 103, eine Zustandsdetektionseinheit 204, eine Zustandssteuereinheit 305 und eine Ausgabesteuereinheit 106 wie in 8 dargestellt. Die Funktionen der semantischen Analyseeinheit 103 und der Ausgabesteuereinheit 106 unter diesen Funktionen sind den Funktionen der semantischen Analyseeinheit 103 und der Ausgabesteuereinheit 106 gemäß der ersten Ausführungsform ähnlich, und die Funktion der Zustandsdetektionseinheit 204 ist der Funktion der Zustandsdetektionseinheit 204 gemäß der zweiten Ausführungsform ähnlich, und somit wird Beschreibung davon weggelassen.
  • Ähnlich wie die Sprachvorhersageeinheit 101, die bei der ersten Ausführungsform beschrieben wurde, führt die Sprachvorhersageeinheit 301 gemäß der vorliegenden Ausführungsform die Sprachvorhersage für den Benutzer durch. Zusätzlich zu der Funktion der Sprachvorhersageeinheit 101 hat die Sprachvorhersageeinheit 301 gemäß der vorliegenden Ausführungsform eine Funktion, eine Benachrichtigung, die angibt, dass die Sprache des Benutzers vorhergesagt wird, einer Benutzerpositionsbeschaffungseinheit 308 zu geben, falls die Sprache des Benutzers vorhergesagt wird.
  • Ähnlich wie die Spracherkennungseinheit 102, die bei der ersten Ausführungsform beschrieben wurde, erkennt die Spracherkennungseinheit 302 gemäß der vorliegenden Ausführungsform die Sprache des Benutzers, setzt die Sprache des Benutzers in eine Zeichenkette um und beschafft einen Sprachentext. Die Spracherkennungseinheit 302 gemäß der vorliegenden Ausführungsform ist insofern von der bei der ersten Ausführungsform beschriebenen Spracherkennungseinheit 102 verschieden, als die Spracherkennungseinheit 302 die Sprache des Benutzers, die durch die nachfolgend beschriebene Tonquellen-Trenneinheit 309 getrennt und beschafft wird, aus der durch die Tonsammeleinheit 12 beschafften Sprache empfängt und erkennt. Mit dieser Konfiguration ist es möglich, die Spracherkennungsgenauigkeit weiter zu verbessern.
  • Ähnlich wie die bei der ersten Ausführungsform beschriebene Zustandssteuereinheit 105 steuert die Zustandssteuereinheit 305 den Zustand der Peripherievorrichtung 7 (anderer Vorrichtungen) auf der Basis des Detektionsergebnisses durch die Zustandsdetektionseinheit 204 und der Sprachvorhersage für den Benutzer durch die Sprachvorhersageeinheit 301. Die Zustandssteuereinheit 305 gemäß der vorliegenden Ausführungsform hat eine Funktion des Steuerns des Zustands der Peripherievorrichtung 7 auf der Basis der Position der Peripherievorrichtung 7, zusätzlich zu der Funktion der Zustandssteuereinheit 105 gemäß der ersten Ausführungsform. Zum Beispiel können Informationen über die Position in Bezug auf die Peripherievorrichtung 7 in einer später zu beschreibenden Speicherungseinheit 37 gespeichert werden.
  • Falls zum Beispiel die Sprachvorhersageeinheit 101 die Sprache des Benutzers vorhersagt, extrahiert die Zustandssteuereinheit 305 gemäß der vorliegenden Ausführungsform die Peripherievorrichtungen 7, die eine vorbestimmte Bedingung erfüllen, auf der Basis der Position der Peripherievorrichtung 7 und steuert die Zustände der extrahierten Peripherievorrichtungen 7. Nachfolgend werden mehrere Beispiele als Beispiele beschrieben, in denen die Zustandssteuereinheit 305 die Peripherievorrichtung 7 auf der Basis der Position der Peripherievorrichtung 7 extrahiert und den Zustand der extrahierten Peripherievorrichtung 7 steuert.
  • Zum Beispiel kann die Zustandssteuereinheit 305 die Peripherievorrichtung 7 extrahieren, die sich in einer Region auftretenden Geräuschs befindet, die auf der Basis der Tonsammlung spezifiziert wird, und den extrahierten Zustand steuern. Die Information der Region auftretenden Geräuschs kann von einer später zu beschreibenden Schallfeld-Analyseeinheit 307 bereitgestellt werden, und die Zustandssteuereinheit 305 kann die Informationen der Region auftretenden Geräuschs mit den Informationen über die Position der Peripherievorrichtung 7 assoziieren und die Peripherievorrichtung 7, die sich in der Region auftretenden Geräuschs befindet, extrahieren.
  • Mit dieser Konfiguration ist es zum Beispiel möglich, den Zustand der Peripherievorrichtung 7, die ein größeres Geräusch ausgibt, vorzugsweise oder effizient zu steuern. Da nur der Zustand der Peripherievorrichtung 7 geändert wird, die ein größeres Geräusch ausgibt, und der Zustand der Peripherievorrichtung 7, die ein kleineres Geräusch ausgibt, nicht geändert wird, besteht ferner ein Effekt dahingehend, dass der Benutzer unwahrscheinlich ein unbequemes Gefühl hat.
  • Ferner kann die Zustandssteuereinheit 305 den Zustand der Peripherievorrichtung 7 auf der Basis der Position der Peripherievorrichtung 7 und der Position des Benutzers steuern. Die Position des Benutzers kann von der später zu beschreibenden Benutzerpositions-Beschaffungseinheit 308 der Zustandssteuereinheit 305 bereitgestellt werden. 9A und 9B sind Erläuterungsansichten eines Beispiels für das Extrahieren der Peripherievorrichtung 7 auf der Basis der Position der Peripherievorrichtung 7 und der Position des Benutzers. Wie in 9A und 9B dargestellt gibt es Peripherievorrichtungen 7A bis 7F und einen Benutzer U3 um die Informationsverarbeitungsvorrichtung 3.
  • Zum Beispiel kann wie in 9A dargestellt die Zustandssteuereinheit 305 die Peripherievorrichtung 7 extrahieren, die sich im Wesentlichen in derselben Richtung wie die Position des Benutzers mit Bezug auf die Position der Tonsammeleinheit 12 befindet, und den Zustand der extrahierten Peripherievorrichtung 7 steuern. Die Zustandssteuereinheit 305 kann einen Winkelbereich D1, der die Position des Benutzers U3, zentriert an der Position der Tonsammeleinheit 12 (nicht dargestellt), die in der Informationsverarbeitungsvorrichtung 3 installiert ist, als im Wesentlichen dieselbe Richtung wie die Position des Benutzers mit Bezug auf die Position der Tonsammeleinheit 12 betrachten. Ferner kann die Zustandssteuereinheit 305 die sich in dem Winkelbereich D1 befindende Peripherievorrichtung 7B als die Peripherievorrichtung 7 extrahieren, die sich im Wesentlichen in derselben Richtung wie die Position des Benutzers mit Bezug auf die Position der Tonsammeleinheit 12 und die Position des Benutzers befindet. Die Größe des Winkelbereichs D1 kann zum Beispiel ferner eine voreingestellte vorbestimmte Größe sein oder kann dynamisch so gesetzt werden, dass das Gesicht, der ganze Körper oder dergleichen des Benutzers U3 eingeschlossen ist.
  • Mit dieser Konfiguration ist es möglich, den Zustand der Peripherievorrichtung 7 effizient so zu steuern, dass das Geräusch, das durch die Peripherievorrichtung 7 ausgegeben wird, die sich im Wesentlichen in derselben Richtung wie die Position des Benutzers mit Bezug auf die Position der Tonsammeleinheit 12 befindet, verringert wird. Verglichen mit dem zu der Tonsammeleinheit 12 gehenden Ton ist es in anderen Richtungen schwierig, den in Richtung der Tonsammeleinheit 12 gehenden Ton in im Wesentlichen derselben Richtung wie die Position des Benutzers von der Sprache des Benutzers mittels der später zu beschreibenden Tonquellen-Trenneinheit 309 zu trennen. Mit dieser Konfiguration wird deshalb die Tonquellen-Trennungsgenauigkeit verbessert, und die Spracherkennungsgenauigkeit wird folglich auch verbessert.
  • Wie in 9B dargestellt kann ferner die Zustandssteuereinheit 305 die Peripherievorrichtung 7 extrahieren, die sich in der Nähe der Position des Benutzers befindet, und den Zustand der extrahierten Peripherievorrichtung 7 steuern. Zum Beispiel kann die Zustandssteuereinheit 305 die Peripherievorrichtung 7C, die sich in einem Bereich eines vorbestimmten Abstands von dem Benutzer U3, der in 9B dargestellt ist, als die Peripherievorrichtung 7 extrahieren, die sich in der Nähe der Position des Benutzers U3 befindet. Ferner kann die Zustandssteuereinheit 305 die Peripherievorrichtung 7C, die sich am nächsten bei dem Benutzer U3, der in 9B dargestellt ist, befindet, als die Peripherievorrichtung 7 extrahieren, die sich in der Nähe der Position des Benutzers U3 befindet.
  • Mit dieser Konfiguration ist es möglich, die Geräuschausgabe von der Peripherievorrichtung 7 in der Nähe des Benutzers effizient zu verringern, und der Benutzer spricht wahrscheinlich leicht.
  • Ferner ist das Verfahren zum Extrahieren der Peripherievorrichtung 7 auf der Basis der Position der Peripherievorrichtung 7 durch die Zustandssteuereinheit 305 nicht auf das obige Beispiel beschränkt. Zum Beispiel kann die Zustandssteuereinheit 305 die Peripherievorrichtung 7 extrahieren, die sich in der Nähe der Tonsammeleinheit 12 befindet, und den Zustand der extrahierten Peripherievorrichtung 7 steuern. Ferner kann die Zustandssteuereinheit 305 die Peripherievorrichtung 7 unter Verwendung einer Kombination der oben beschriebenen Extraktionsverfahren extrahieren.
  • Die Schallfeld-Analyseeinheit 307 analysiert das Schallfeld (einen Raum oder eine Region, worin Schallwellen existieren) um die Informationsverarbeitungsvorrichtung 3 auf der Basis der durch die Tonsammeleinheit 12 gesammelten Sprache. Zum Beispiel analysiert die Schallfeld-Analyseeinheit 307 das Schallfeld auf der Basis der Sprache, die von jedem einer Vielzahl von Mikrofonen beschafft wird, die in der Tonsammeleinheit 12 installiert sind. Das Analyseergebnis für das Schallfeld kann der Schallquellen-Trenneinheit 309 bereitgestellt werden. Ferner spezifiziert die Schallfeld-Analyseeinheit 307 eine Richtung mit einem hohen Schalldruckpegel mit Bezug auf die Tonsammeleinheit 12 und stellt der Zustandssteuereinheit 305 eine Region, die in einem vorbestimmten Winkelbereich, zentriert auf der Richtung, als die Region auftretenden Geräuschs bereit.
  • Die Benutzerpositions-Beschaffungseinheit 308 beschafft die Position des Benutzers auf der Basis der von der Kamera 14 und dem Entfernungssensor 15 beschafften Daten. Zum Beispiel kann die Benutzerpositions-Beschaffungseinheit 308 den Benutzer aus einem durch die Kamera 14 beschafften Bild unter Verwendung einer Gesichtsdetektionstechnik, einer Gesichtserkennungstechnik oder dergleichen detektieren, den detektierten Benutzer mit den von dem Entfernungssensor 15 beschafften Daten assoziieren und die Position des Benutzers beschaffen. Die Benutzerpositions-Beschaffungseinheit stellt die beschaffte Benutzerposition der Zustandssteuereinheit 305 und der Tonquellen-Trenneinheit 309 bereit.
  • Die Tonquellen-Trenneinheit 309 erhält die Sprache des Benutzers durch Trennen der Sprache des Benutzers auf der Basis des Schallfeldanalyseergebnisses durch die Schallfeld-Analyseeinheit 307 und der Position des Benutzers. Zum Beispiel kann die Tonquellen-Trenneinheit 309 die Sprache des Benutzers auf der Basis eines Strahlformungsverfahrens von dem Geräusch trennen. Die durch die Tonquellen-Trenneinheit 309 getrennte Sprache des Benutzers wird der Spracherkennungseinheit 302 bereitgestellt.
  • (Speicherungseinheit 37)
  • Ähnlich wie die bei der ersten Ausführungsform beschriebene Speicherungseinheit 17 speichert die Speicherungseinheit 37 ein Programm oder einen Parameter, wodurch bewirkt wird, dass die jeweiligen Komponenten der Informationsverarbeitungsvorrichtung 3 funktionieren. Zusätzlich zu den in der Speicherungseinheit 17 gespeicherten Informationen speichert die Speicherungseinheit 37 Karteninformationen eines Bereichs um die Informationsverarbeitungsvorrichtung 3. Zusätzlich zu den in der Speicherungseinheit 17 gespeicherten Informationen speichert die Speicherungseinheit 37 ferner Informationen über die Position der Peripherievorrichtung 7 als die Informationen in Bezug auf die Peripherievorrichtung 7. Ferner können die Informationen über die Position der Peripherievorrichtung 7, die in der Speicherungseinheit 17 gespeichert werden, zum Beispiel Informationen in Bezug auf eine relative Position mit Bezug auf die Informationsverarbeitungsvorrichtung oder Informationen über die Position der Peripherievorrichtung 7 in den Karteninformationen des Bereichs um die Informationsverarbeitungsvorrichtung 3 sein.
  • Ferner können die Karteninformationen in Bezug auf den Bereich um die Informationsverarbeitungsvorrichtung 3 durch den Benutzer in die Informationsverarbeitungsvorrichtung 3 eingegeben oder durch die Informationsverarbeitungsvorrichtung 3 auf der Basis von Informationen der Kamera 14, des Entfernungssensors 15 oder dergleichen beschafft werden. Ferner können die Informationen über die Position der Peripherievorrichtung 7 durch den Benutzer in die Informationsverarbeitungsvorrichtung 3 eingegeben oder von der Peripherievorrichtung 7 beschafft werden.
  • <Betriebsbeispiel für die dritte Ausführungsform>
  • Es wurde oben das Konfigurationsbeispiel für die Informationsverarbeitungsvorrichtung 3 gemäß der dritten Ausführungsform der vorliegenden Offenbarung beschrieben. Als Nächstes wird ein Betriebsbeispiel für die Informationsverarbeitungsvorrichtung 3 gemäß der vorliegenden Ausführungsform mit Bezug auf 10 beschrieben.
  • 10 ist ein Flussdiagramm eines Betriebsbeispiels für die Informationsverarbeitungsvorrichtung 3 gemäß der vorliegenden Ausführungsform. Als Erstes wiederholt die Steuereinheit 30 den Sprachvorhersageprozess, bis die Sprache des Benutzers vorhergesagt wird (S310), ähnlich Schritt S110, der mit Bezug auf 4 beschrieben wurde.
  • Falls die Sprache des Benutzers vorhergesagt wird (JA in Schritt S310), beschafft die Benutzerpositions-Beschaffungseinheit 308 die Position des Benutzers (S315). Dann sendet die Zustandsdetektionseinheit 204 die Übertragungsanforderung der Fähigkeitsinformationen und der Zustandsinformationen zu der Peripherievorrichtung 7 und empfängt die Fähigkeitsinformationen und die Zustandsinformationen von der Peripherievorrichtung 7 (S320). Ferner beschafft die Zustandssteuereinheit 305 die Position der Peripherievorrichtung 7 von der Speicherungseinheit 37 (S325).
  • Dann extrahiert die Zustandssteuereinheit 305 die Peripherievorrichtung 7, die eine Bedingung auf der Basis der beschafften Position der Peripherievorrichtung 7 erfüllt (S330). Die Zustandssteuereinheit 305 kann die Peripherievorrichtung 7 auf der Basis der Position der Peripherievorrichtung 7 oder der Position der Peripherievorrichtung 7 und der Position des Benutzers durch beliebige der oben beschriebenen Verfahren extrahieren.
  • Dann bewirkt die Zustandssteuereinheit 305, dass die Zustandsinformationen der extrahierten Peripherievorrichtung 7 in der Speicherungseinheit 37 gespeichert werden (S340). Ferner steuert die Zustandssteuereinheit 305 den Zustand der extrahierten Peripherievorrichtung 7 (S350). Zum Beispiel erzeugt die Zustandssteuereinheit 305 ein Steuersignal zum Verringern des Umgebungstons (Geräuschs) für jede der extrahierten Peripherievorrichtungen 7 auf der Basis der Fähigkeitsinformationen und der Zustandsinformationen der Peripherievorrichtung 7, die im Schritt S320 empfangen werden, und bewirkt, dass die Kommunikationseinheit 11 das Steuersignal sendet.
  • Da ein nachfolgender Prozess der in 10 dargestellten Schritte S360 bis 390 dem Prozess der mit Bezug auf 4 beschriebenen Schritte S160 bis 190 ähnlich ist, wird eine Beschreibung davon weggelassen.
  • <Effekte der dritten Ausführungsform>
  • Wie oben beschrieben werden gemäß der dritten Ausführungsform der vorliegenden Offenbarung, wenn die Sprache des Benutzers vorhergesagt wird, die Zustandsinformationen mit der Position der Peripherievorrichtung 7 um die Informationsverarbeitungsvorrichtung 3 beschafft, und die Zustandssteuerung wird durchgeführt, so dass die Geräuschausgabe von der auf der Basis der Zustandsinformationen extrahierten Peripherievorrichtung 7 verringert wird. Mit dieser Konfiguration ist es möglich, die Spracherkennungsgenauigkeit, wenn der Benutzer spricht, zu verbessern, selbst falls es andere Tonquellen um den Benutzer gibt. Ferner wird gemäß der dritten Ausführungsform der vorliegenden Offenbarung die Peripherievorrichtung 7, deren Zustand geändert wird, auf der Basis der Position der Peripherievorrichtung extrahiert, und die Zustandssteuerung wird durchgeführt, und somit kann die Zustandssteuerung der Peripherievorrichtung 7 effizienter durchgeführt werden.
  • <Ergänzung der dritten Ausführungsform>
  • Ferner wurde in dem obigen Beispiel das Beispiel des Extrahierens des Steuerziels auf der Basis der Position der Peripherievorrichtung 7 beschrieben, aber die Extraktion des Steuerziels kann in Kombination mit der Extraktion des Steuerziels auf der Basis des Zustands der Peripherievorrichtung 7, die bei der zweiten Ausführungsform beschrieben wurde, durchgeführt werden.
  • Ferner kann auf der Basis der Position der Peripherievorrichtung 7 ein Steuerbetrag (zum Beispiel die Größe des Bewirkens, dass der Lautstärkepegel verringert wird) dynamisch gesetzt werden. Zum Beispiel kann der Steuerbetrag so gesetzt werden, dass der Lautstärkepegel der Peripherievorrichtung 7, die dem Benutzer näher ist, verringert wird. Das Setzen des Steuerbetrags auf der Basis der Position der Peripherievorrichtung 7 wie oben beschrieben kann in Kombination mit der Extraktion des Steuerziels auf der Basis der Position der Peripherievorrichtung 7 durchgeführt werden.
  • Ferner ist es auch möglich, jedes der bei der ersten Ausführungsform beschriebenen modifizierten Beispiele auf die dritte Ausführungsform anzuwenden.
  • <<Hardware-Konfigurationsbeispiel>>
  • Es wurden oben die Ausführungsformen der vorliegenden Offenbarung beschrieben. Die Informationsverarbeitung, wie etwa der Sprachvorhersageprozess, der Zustandsdetektionsprozess, der Zustandssteuerprozess, der Spracherkennungsprozess, der semantische Analyseprozess und dergleichen, wird in Zusammenwirkung mit Software und den Informationsverarbeitungsvorrichtungen 1 bis 3 implementiert. Ein Hardware-Konfigurationsbeispiel für eine Informationsverarbeitungsvorrichtung 1000 wird als ein Beispiel für eine Hardwarekonfiguration der Informationsverarbeitungsvorrichtungen 1 bis 3 beschrieben, die Informationsverarbeitungsvorrichtungen gemäß der vorliegenden Ausführungsform sind.
  • 11 ist eine Erläuterungsdarstellung eines Beispiels für eine Hardwarekonfiguration der Informationsverarbeitungsvorrichtung 1000. Wie in 11 dargestellt, umfasst die Informationsverarbeitungsvorrichtung 1000 eine Zentralverarbeitungseinheit (CPU) 1001, einen Festwertspeicher (ROM) 1002, einen Direktzugriffsspeicher (RAM) 1003, eine Eingabevorrichtung 1004, eine Ausgabevorrichtung 1005, eine Speicherungsvorrichtung 1006, eine Bildgebungsvorrichtung 1007 und eine Kommunikationsvorrichtung 1008.
  • Die CPU 1001 fungiert als eine Operationsverarbeitungsvorrichtung und eine Steuervorrichtung und steuert einen Gesamtbetrieb der Informationsverarbeitungsvorrichtung 1000 gemäß verschiedenen Arten von Programmen. Ferner kann die CPU 1001 ein Mikroprozessor sein. Der ROM 1002 speichert ein Programm, einen Betriebsparameter und dergleichen, die durch die CPU 1001 verwendet werden. Der RAM 1003 speichert vorübergehend ein bei der Ausführung der CPU 1001 zu verwendendes Programm, einen Parameter, der sich bei der Ausführung davon geeignet ändert, oder dergleichen. Diese Komponenten sind über einen Hostbus, der einen CPU-Bus oder dergleichen umfasst, miteinander verbunden. Die Funktionen der Steuereinheit 10, der Steuereinheit 20 und der Steuereinheit 30 werden hauptsächlich durch Zusammenwirkung der CPU 1001, des ROM 1002 und des RAM 1003 und der Software implementiert.
  • Die Eingabevorrichtung 1004 umfasst eine Eingabevorrichtung zum Eingeben von Informationen, wie etwa eine Maus, eine Tastatur, ein Touchpanel, eine Taste, ein Mikrofon, einen Schalter, einen Hebel oder dergleichen, eine Eingabesteuerschaltung zum Erzeugen eines Eingangssignals auf der Basis einer Eingabe durch den Benutzer und Ausgeben des Eingangssignals an die CPU 1001. Durch Betätigen der Eingabevorrichtung 1004 kann der Benutzer der Informationsverarbeitungsvorrichtung 1000 verschiedene Arten von Daten in die Informationsverarbeitungsvorrichtung 1000 eingeben oder eine Anweisung zum Ausführen einer Verarbeitungsoperation geben.
  • Die Ausgabevorrichtung 1005 umfasst eine Anzeigevorrichtung, wie zum Beispiel eine Flüssigkristallanzeige- bzw. LCD-Vorrichtung, eine OLED-Vorrichtung, eine durchsichtige Anzeige oder eine Lampe. Ferner umfasst die Ausgabevorrichtung 1005 eine Audioausgabevorrichtung, wie etwa einen Lautsprecher und einen Kopfhörer. Die Anzeigevorrichtung zeigt zum Beispiel ein aufgenommenes Bild, ein erzeugtes Bild oder dergleichen an. Die Audioausgabevorrichtung wandelt dagegen Sprachdaten oder dergleichen in eine Sprache um und gibt die Sprache aus. Zum Beispiel entspricht die Ausgabevorrichtung 1005 dem Lautsprecher 13, der Projektionseinheit 16 und der lichtemittierenden Einheit 18, die oben mit Bezug auf 3 beschrieben wurden.
  • Die Speicherungsvorrichtung 1006 ist eine Vorrichtung zum Speichern von Daten. Die Speicherungsvorrichtung 1006 kann ein Speicherungsmedium, eine Aufzeichnungsvorrichtung zum Aufzeichnen von Daten in einem Speicherungsmedium, eine Lesevorrichtung zum Lesen von Daten aus einem Speicherungsmedium, eine Löschvorrichtung zum Löschen von in einem Speicherungsmedium aufgezeichneten Daten und dergleichen sein. Die Speicherungsvorrichtung 1006 speichert ein durch die CPU 1001 ausgeführtes Programm und verschiedene Arten von Daten. Die Speicherungsvorrichtung 1006 entspricht der oben mit Bezug auf 3 beschriebenen Speicherungseinheit 17.
  • Die Bildgebungsvorrichtung 1007 umfasst ein optisches Bildgebungssystem, wie etwa eine fotografische Linse zum Sammeln von Licht und eine Zoom-Linse und ein Signalumwandlungselement, wie etwa ein CCD (Charge Coupled Device) oder ein CMOS (Complementary Metal Oxide Semiconductor). Das optische Bildgebungssystem sammelt von einem Subjekt emittiertes Licht und bildet ein Subjektbild in einer Signalumwandlungseinheit, und das Signalumwandlungselement wandelt das gebildete Subjektbild in ein elektrisches Bildsignal um. Die Bildgebungsvorrichtung 1007 entspricht der oben mit Bezug auf 3 beschriebenen Kamera 14.
  • Die Kommunikationsvorrichtung 1008 ist zum Beispiel eine durch eine Kommunikationsvorrichtung oder dergleichen gebildete Kommunikationsschnittstelle zum Herstellen einer Verbindung mit einem Kommunikationsnetz. Ferner kann die Kommunikationsvorrichtung 1008 eine mit einem drahtlosen lokalen Netzwerk (LAN) kompatible Kommunikationsvorrichtung, eine mit Long Term Evolution (LTE) kompatible Kommunikationsvorrichtung, eine verdrahtete Kommunikation durchführende Drahtkommunikationsvorrichtung oder eine Kommunikationsvorrichtung mit Bluetooth (eingetragenes Warenzeichen) umfassen. Die Kommunikationsvorrichtung 1008 entspricht der oben zum Beispiel mit Bezug auf 3 beschriebenen Kommunikationseinheit 11.
  • «5. Schlussbemerkungen»
  • Wie oben beschrieben ist es gemäß der Ausführungsform der vorliegenden Offenbarung möglich, die Spracherkennungsgenauigkeit selbst in einem Fall zu verbessern, in dem es andere Tonquellen um den Benutzer gibt.
  • Die bevorzugte Ausführungsform bzw. die bevorzugten Ausführungsformen der vorliegenden Offenbarung wurde/wurden oben mit Bezug auf die beigefügten Zeichnungen beschrieben, obwohl die vorliegende Offenbarung nicht auf die obigen Beispiele beschränkt ist. Fachleute können verschiedene Abänderungen und Modifikationen innerhalb des Schutzumfangs der angefügten Ansprüche finden, und es versteht sich, dass sie alle unter den technischen Schutzumfang der vorliegenden Offenbarung fallen.
  • Zum Beispiel müssen jeweilige Schritte in den obigen Ausführungsformen nicht unbedingt chronologisch gemäß der als das Flussdiagramm beschriebenen Reihenfolge verarbeitet werden. Zum Beispiel können jeweilige Schritte in den Prozessen der obigen Ausführungsformen in einer von der als das Flussdiagramm beschriebenen Reihenfolge verschiedenen Reihenfolge verarbeitet oder können parallel verarbeitet werden. Zum Beispiel werden bei der driten Ausführungsform beispielsweise die Peripherievorrichtungen, die eine vorbestimmte Bedingung erfüllen, nach dem Detektieren (Beschaffen) des Zustands der Peripherievorrichtung extrahiert, aber die Peripherievorrichtungen, die eine vorbestimmte Bedingung erfüllen, können vor dem Detektieren des Zustands der Peripherievorrichtung extrahiert werden.
  • Ferner ist es gemäß den obigen Ausführungsformen auch möglich, ein Computerprogramm bereitzustellen, das bewirkt, dass Hardware, wie etwa die CPU 1001, der ROM 1002 und der RAM 1003, die Funktionen ausführen, die denen der Informationsverarbeitungsvorrichtungen 1 bis 3 ähnlich sind, die oben beschrieben werden. Ferner wird außerdem ein Aufzeichnungsmedium bereitgestellt, auf dem das Computerprogramm aufgezeichnet ist.
  • Ferner sind die in der vorliegenden Beschreibung beschriebenen Effekte lediglich veranschaulichende oder exemplifizierte Effekte und sind nicht beschränkend. Das heißt, mit den obigen Effekten oder anstelle dieser kann die Technologie gemäß der vorliegenden Offenbarung andere Effekte erzielen, die Fachleuten aus der Beschreibung der vorliegenden Patentschrift ersichtlich werden.
  • Außerdem kann die vorliegende Technologie auch folgendermaßen konfiguriert werden.
  • (1) Informationsverarbeitungsvorrichtung, umfassend:
    • eine Zustandsdetektionseinheit, ausgelegt zum Detektieren eines Zustands einer anderen Vorrichtung, die eine Geräuschquelle sein kann; und
    • eine Zustandssteuereinheit, ausgelegt zum Steuern des Zustands der anderen Vorrichtung auf einer Basis eines Detektionsergebnisses für den Zustand der anderen Vorrichtung und von Sprachvorhersage eines Benutzers.
  • (2) Informationsverarbeitungsvorrichtung nach (1), wobei die Zustandsdetektionseinheit den Zustand der anderen Vorrichtung auf einer Basis von Tonsammlung detektiert.
  • (3) Informationsverarbeitungsvorrichtung nach (1) bis (2), wobei die Zustandsdetektionseinheit den Zustand der anderen Vorrichtung auf einer Basis von Kommunikation detektiert.
  • (4) Informationsverarbeitungsvorrichtung nach (1) bis (3), wobei die Zustandssteuereinheit eine Verringerung eines Lautstärkepegels der anderen Vorrichtung bewirkt.
  • (5) Informationsverarbeitungsvorrichtung nach (1) bis (4), wobei die Zustandssteuereinheit eine Änderung eines Betriebsmodus der anderen Vorrichtung bewirkt.
  • (6) Informationsverarbeitungsvorrichtung nach (1) bis (5), wobei die Zustandssteuereinheit den Zustand der anderen Vorrichtung, die aus einer Vielzahl der anderen Vorrichtungen extrahiert wird, auf einer Basis des Zustands der anderen Vorrichtung steuert.
  • (7) Informationsverarbeitungsvorrichtung nach (1) bis (6), wobei die Zustandssteuereinheit den Zustand der anderen Vorrichtung ferner auf einer Basis einer Position der anderen Vorrichtung steuert.
  • (8) Informationsverarbeitungsvorrichtung nach (7), wobei die Zustandssteuereinheit einen Zustand einer anderen Vorrichtung steuert, die sich in einer Region auftretenden Geräuschs befindet, die auf einer Basis von Tonsammlung spezifiziert wird.
  • (9) Informationsverarbeitungsvorrichtung nach (7) oder (8), wobei die Zustandssteuereinheit den Zustand der anderen Vorrichtung ferner auf einer Basis einer Position des Benutzers steuert.
  • (10) Informationsverarbeitungsvorrichtung nach (9), wobei die Zustandssteuereinheit einen Zustand einer anderen Vorrichtung steuert, die sich in im Wesentlichen einer selben Richtung wie die Position des Benutzers mit Bezug auf eine Position der Tonsammeleinheit befindet.
  • (11) Informationsverarbeitungsvorrichtung nach (10), ferner umfassend:
    • eine Tonquellen-Trenneinheit, ausgelegt zum Beschaffen einer Sprache des Benutzers durch Trennen der Sprache des Benutzers von der durch die Tonsammeleinheit beschafften Sprache.
  • (12) Informationsverarbeitungsvorrichtung nach (9) bis (11), wobei die Zustandssteuereinheit einen Zustand der anderen Vorrichtung steuert, die sich in der Nähe der Position des Benutzers befindet.
  • (13) Informationsverarbeitungsvorrichtung nach (1) bis (12), wobei die Zustandssteuereinheit den Zustand der anderen Vorrichtung ferner auf einer Basis eines Spracherkennungsergebnisses auf der Basis von Sprache des Benutzers steuert.
  • (14) Informationsverarbeitungsvorrichtung nach (1) bis (13), wobei die Zustandssteuereinheit den Zustand der anderen Vorrichtung ferner auf einer Basis eines semantischen Analyseergebnisses auf der Basis von Sprache des Benutzers steuert.
  • (15) Informationsverarbeitungsverfahren, umfassend:
    • Detektieren eines Zustands einer anderen Vorrichtung, die eine Geräuschquelle sein kann; und
    • Steuern des Zustands der anderen Vorrichtung durch einen Prozessor auf einer Basis eines Detektionsergebnisses für den Zustand der anderen Vorrichtung und von Sprachvorhersage eines Benutzers.
  • (16) Programm, das bewirkt, dass ein Computer Folgendes implementiert:
    • eine Funktion des Detektierens eines Zustands einer anderen Vorrichtung, die eine Geräuschquelle sein kann; und
    • eine Funktion des Steuerns des Zustands der anderen Vorrichtung auf einer Basis eines Detektionsergebnisses für den Zustand der anderen Vorrichtung und von Sprachvorhersage eines Benutzers.
  • Bezugszeichenliste
  • 1
    Informationsverarbeitungsvorrichtung
    7
    Peripherievorrichtung
    9
    Kommunikationsnetz
    10
    Steuereinheit
    11
    Kommunikationseinheit
    12
    Tonsammeleinheit
    13
    Lautsprecher
    14
    Kamera
    15
    Entfernungssensor
    16
    Projektionseinheit
    17
    Speicherungseinheit
    18
    lichtemittierende Einheit
    101
    Sprachvorhersageeinheit
    102
    Spracherkennungseinheit
    103
    semantische Analyseeinheit
    104
    Zustandsdetektionseinheit
    105
    Zustandssteuereinheit
    106
    Ausgabesteuereinheit
    307
    Schallfeld-Analyseeinheit
    308
    Benutzerpositions-Beschaffungseinheit
    309
    Tonquellen-Trenneinheit
  • ZITATE ENTHALTEN IN DER BESCHREIBUNG
  • Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
  • Zitierte Patentliteratur
    • JP 2008072558 A [0004]

Claims (16)

  1. Informationsverarbeitungsvorrichtung, umfassend: eine Zustandsdetektionseinheit, ausgelegt zum Detektieren eines Zustands einer anderen Vorrichtung, die eine Geräuschquelle sein kann; und eine Zustandssteuereinheit, ausgelegt zum Steuern des Zustands der anderen Vorrichtung auf einer Basis eines Detektionsergebnisses für den Zustand der anderen Vorrichtung und von Sprachvorhersage eines Benutzers.
  2. Informationsverarbeitungsvorrichtung nach Anspruch 1, wobei die Zustandsdetektionseinheit den Zustand der anderen Vorrichtung auf einer Basis von Tonsammlung detektiert.
  3. Informationsverarbeitungsvorrichtung nach Anspruch 1, wobei die Zustandsdetektionseinheit den Zustand der anderen Vorrichtung auf einer Basis von Kommunikation detektiert.
  4. Informationsverarbeitungsvorrichtung nach Anspruch 1, wobei die Zustandssteuereinheit eine Verringerung eines Lautstärkepegels der anderen Vorrichtung bewirkt.
  5. Informationsverarbeitungsvorrichtung nach Anspruch 1, wobei die Zustandssteuereinheit eine Änderung eines Betriebsmodus der anderen Vorrichtung bewirkt.
  6. Informationsverarbeitungsvorrichtung nach Anspruch 1, wobei die Zustandssteuereinheit den Zustand der anderen Vorrichtung, die aus einer Vielzahl der anderen Vorrichtungen extrahiert wird, auf einer Basis des Zustands der anderen Vorrichtung steuert.
  7. Informationsverarbeitungsvorrichtung nach Anspruch 1, wobei die Zustandssteuereinheit den Zustand der anderen Vorrichtung ferner auf einer Basis einer Position der anderen Vorrichtung steuert.
  8. Informationsverarbeitungsvorrichtung nach Anspruch 7, wobei die Zustandssteuereinheit einen Zustand einer anderen Vorrichtung steuert, die sich in einer Region auftretenden Geräuschs befindet, die auf einer Basis von Tonsammlung spezifiziert wird.
  9. Informationsverarbeitungsvorrichtung nach Anspruch 7, wobei die Zustandssteuereinheit den Zustand der anderen Vorrichtung ferner auf einer Basis einer Position des Benutzers steuert.
  10. Informationsverarbeitungsvorrichtung nach Anspruch 9, wobei die Zustandssteuereinheit einen Zustand einer anderen Vorrichtung steuert, die sich in im Wesentlichen einer selben Richtung wie die Position des Benutzers mit Bezug auf eine Position der Tonsammeleinheit befindet.
  11. Informationsverarbeitungsvorrichtung nach Anspruch 10, ferner umfassend: eine Tonquellen-Trenneinheit, ausgelegt zum Beschaffen einer Sprache des Benutzers durch Trennen der Sprache des Benutzers von der durch die Tonsammeleinheit beschafften Sprache.
  12. Informationsverarbeitungsvorrichtung nach Anspruch 9, wobei die Zustandssteuereinheit einen Zustand der anderen Vorrichtung steuert, die sich in der Nähe der Position des Benutzers befindet.
  13. Informationsverarbeitungsvorrichtung nach Anspruch 1, wobei die Zustandssteuereinheit den Zustand der anderen Vorrichtung ferner auf einer Basis eines Spracherkennungsergebnisses auf der Basis von Sprache des Benutzers steuert.
  14. Informationsverarbeitungsvorrichtung nach Anspruch 1, wobei die Zustandssteuereinheit den Zustand der anderen Vorrichtung ferner auf einer Basis eines semantischen Analyseergebnisses auf der Basis von Sprache des Benutzers steuert.
  15. Informationsverarbeitungsverfahren, umfassend: Detektieren eines Zustands einer anderen Vorrichtung, die eine Geräuschquelle sein kann; und Steuern des Zustands der anderen Vorrichtung durch einen Prozessor auf einer Basis eines Detektionsergebnisses für den Zustand der anderen Vorrichtung und von Sprachvorhersage eines Benutzers.
  16. Programm, das bewirkt, dass ein Computer Folgendes implementiert: eine Funktion des Detektierens eines Zustands einer anderen Vorrichtung, die eine Geräuschquelle sein kann; und eine Funktion des Steuerns des Zustands der anderen Vorrichtung auf einer Basis eines Detektionsergebnisses für den Zustand der anderen Vorrichtung und von Sprachvorhersage eines Benutzers.
DE112016006351.2T 2016-02-03 2016-12-14 Informationsverarbeitungsvorrichtung, informationsverarbeitungsverfahren und programm Pending DE112016006351T5 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2016019193A JP2017138476A (ja) 2016-02-03 2016-02-03 情報処理装置、情報処理方法、及びプログラム
JP2016-019193 2016-02-03
PCT/JP2016/087190 WO2017134935A1 (ja) 2016-02-03 2016-12-14 情報処理装置、情報処理方法、及びプログラム

Publications (1)

Publication Number Publication Date
DE112016006351T5 true DE112016006351T5 (de) 2018-10-18

Family

ID=59499551

Family Applications (1)

Application Number Title Priority Date Filing Date
DE112016006351.2T Pending DE112016006351T5 (de) 2016-02-03 2016-12-14 Informationsverarbeitungsvorrichtung, informationsverarbeitungsverfahren und programm

Country Status (6)

Country Link
US (1) US20190019513A1 (de)
EP (1) EP3413303B1 (de)
JP (1) JP2017138476A (de)
CN (1) CN108604447B (de)
DE (1) DE112016006351T5 (de)
WO (1) WO2017134935A1 (de)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11237794B2 (en) 2016-02-18 2022-02-01 Sony Corporation Information processing device and information processing method

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10930276B2 (en) 2017-07-12 2021-02-23 Universal Electronics Inc. Apparatus, system and method for directing voice input in a controlling device
SG11201901441QA (en) 2017-08-02 2019-03-28 Panasonic Ip Man Co Ltd Information processing apparatus, speech recognition system, and information processing method
WO2019136065A1 (en) * 2018-01-03 2019-07-11 Universal Electronics Inc. Apparatus, system and method for directing voice input in a controlling device
JP6788620B2 (ja) * 2018-01-22 2020-11-25 ヤフー株式会社 情報処理システム、情報処理方法、およびプログラム
KR102115222B1 (ko) * 2018-01-24 2020-05-27 삼성전자주식회사 사운드를 제어하는 전자 장치 및 그 동작 방법
JP6964275B2 (ja) * 2018-02-23 2021-11-10 パナソニックIpマネジメント株式会社 移動ロボット、およびロボットシステム
CN108489001A (zh) * 2018-04-26 2018-09-04 英飞凌(深圳)智慧科技有限公司 提高语音识别率的净化器控制方法及装置
WO2019212569A1 (en) 2018-05-04 2019-11-07 Google Llc Adapting automated assistant based on detected mouth movement and/or gaze
JP7263505B2 (ja) 2018-05-04 2023-04-24 グーグル エルエルシー ホットワードを用いない自動アシスタント機能の適応
KR102661487B1 (ko) 2018-05-04 2024-04-26 구글 엘엘씨 검출된 제스처 및 시선에 기초하여 자동화된 어시스턴트 기능 호출
EP3901947A4 (de) 2018-12-19 2022-02-23 Sony Group Corporation Informationsverarbeitungsvorrichtung, informationsverarbeitungsverfahren und programm
WO2020203067A1 (ja) 2019-03-29 2020-10-08 ソニー株式会社 情報処理装置、情報処理方法、およびプログラム
CN111933130A (zh) * 2019-04-24 2020-11-13 阿里巴巴集团控股有限公司 语音识别方法、装置及系统
KR20210011637A (ko) 2019-07-23 2021-02-02 삼성전자주식회사 컨텐츠를 재생하는 전자 장치 및 그 제어 방법
CN110556101A (zh) * 2019-07-30 2019-12-10 珠海格力电器股份有限公司 语音控制方法、装置、计算机设备和存储介质
JP2021107699A (ja) * 2019-12-27 2021-07-29 アイリスオーヤマ株式会社 送風機
JP2021117296A (ja) * 2020-01-23 2021-08-10 トヨタ自動車株式会社 エージェントシステム、端末装置およびエージェントプログラム
KR102168812B1 (ko) * 2020-05-20 2020-10-22 삼성전자주식회사 사운드를 제어하는 전자 장치 및 그 동작 방법
WO2021234839A1 (ja) * 2020-05-20 2021-11-25 三菱電機株式会社 対話予兆検知装置、および、対話予兆検知方法
CN112233673A (zh) * 2020-10-10 2021-01-15 广东美的厨房电器制造有限公司 厨房系统的控制方法、厨房系统和计算机可读存储介质
CN113380247A (zh) * 2021-06-08 2021-09-10 阿波罗智联(北京)科技有限公司 多音区语音唤醒、识别方法和装置、设备、存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008072558A (ja) 2006-09-15 2008-03-27 Sharp Corp テレビ受像機

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6850252B1 (en) * 1999-10-05 2005-02-01 Steven M. Hoffberg Intelligent electronic appliance system and method
JP2000181500A (ja) * 1998-12-15 2000-06-30 Equos Research Co Ltd 音声認識装置及びエ―ジェント装置
US6606280B1 (en) * 1999-02-22 2003-08-12 Hewlett-Packard Development Company Voice-operated remote control
DE10002321C2 (de) * 2000-01-20 2002-11-14 Micronas Munich Gmbh Sprachgesteuerte Vorrichtung und System mit einer derartigen sprachgesteuerten Vorrichtung
US6728679B1 (en) * 2000-10-30 2004-04-27 Koninklijke Philips Electronics N.V. Self-updating user interface/entertainment device that simulates personal interaction
JP4100309B2 (ja) * 2003-09-17 2008-06-11 株式会社ノーリツ 温水システム
US6926199B2 (en) * 2003-11-25 2005-08-09 Segwave, Inc. Method and apparatus for storing personalized computing device setting information and user session information to enable a user to transport such settings between computing devices
US7826945B2 (en) * 2005-07-01 2010-11-02 You Zhang Automobile speech-recognition interface
US8983640B2 (en) * 2009-06-26 2015-03-17 Intel Corporation Controlling audio players using environmental audio analysis
JP2012025270A (ja) * 2010-07-23 2012-02-09 Denso Corp 車両用の音量制御装置および音量制御装置用のプログラム
KR101590332B1 (ko) * 2012-01-09 2016-02-18 삼성전자주식회사 영상장치 및 그 제어방법
US8655307B1 (en) * 2012-10-26 2014-02-18 Lookout, Inc. System and method for developing, updating, and using user device behavioral context models to modify user, device, and application state, settings and behavior for enhanced user security
US8977555B2 (en) * 2012-12-20 2015-03-10 Amazon Technologies, Inc. Identification of utterance subjects
US9813808B1 (en) * 2013-03-14 2017-11-07 Amazon Technologies, Inc. Adaptive directional audio enhancement and selection
WO2015029362A1 (ja) * 2013-08-29 2015-03-05 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 機器制御方法及び機器制御システム
JP6375521B2 (ja) * 2014-03-28 2018-08-22 パナソニックIpマネジメント株式会社 音声検索装置、音声検索方法、および表示装置
US9257120B1 (en) * 2014-07-18 2016-02-09 Google Inc. Speaker verification using co-location information
US9318107B1 (en) * 2014-10-09 2016-04-19 Google Inc. Hotword detection on multiple devices
KR102047500B1 (ko) * 2014-11-27 2019-11-21 삼성전자주식회사 사용자의 할일 목록을 제공하는 시스템 및 방법
US9729118B2 (en) * 2015-07-24 2017-08-08 Sonos, Inc. Loudness matching
US9484030B1 (en) * 2015-12-02 2016-11-01 Amazon Technologies, Inc. Audio triggered commands
US9858927B2 (en) * 2016-02-12 2018-01-02 Amazon Technologies, Inc Processing spoken commands to control distributed audio outputs

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008072558A (ja) 2006-09-15 2008-03-27 Sharp Corp テレビ受像機

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11237794B2 (en) 2016-02-18 2022-02-01 Sony Corporation Information processing device and information processing method

Also Published As

Publication number Publication date
JP2017138476A (ja) 2017-08-10
US20190019513A1 (en) 2019-01-17
WO2017134935A1 (ja) 2017-08-10
EP3413303B1 (de) 2020-07-08
CN108604447A (zh) 2018-09-28
EP3413303A4 (de) 2018-12-12
EP3413303A1 (de) 2018-12-12
CN108604447B (zh) 2019-09-24

Similar Documents

Publication Publication Date Title
DE112016006351T5 (de) Informationsverarbeitungsvorrichtung, informationsverarbeitungsverfahren und programm
DE112010004551B4 (de) Benutzeradaptive Anzeigevorrichtung und Anzeigeverfahren
CN108492379B (zh) Vr看房方法、装置、计算机设备和存储介质
DE102018126133A1 (de) Generieren von Dialog auf Basis von Verifikationswerten
CN106463114B (zh) 信息处理设备、控制方法及程序存储单元
DE112015003945T5 (de) Mehrquellen-Rauschunterdrückung
DE102018130115B4 (de) Vorrichtung und Verfahren zur kontextbasierten Unterdrückung und Verstärkung von Akustiksignalen in akustischen Umgebungen
CN104102181B (zh) 智能家居控制方法、装置及系统
KR102122771B1 (ko) 인공지능 오디오 장치 및 그 동작 방법
DE102018103572A1 (de) Informationsverarbeitungseinrichtung, informationsverarbeitungsverfahren und aufzeichnungsmedium
DE112015002463T5 (de) Systeme und Verfahren zum gestischen Interagieren in einer im Umfeld vorhandenen Computerumgebung
DE102018103468A1 (de) Informationsverarbeitungssystem, informationsverarbeitungsverfahren und programm
WO2017141530A1 (ja) 情報処理装置、情報処理方法、及びプログラム
CN106659435A (zh) 用于限定和执行听力测试的系统
WO2021205742A1 (ja) 情報処理装置及び情報処理方法、並びにコンピュータプログラム
CN111583937A (zh) 一种语音控制唤醒方法及存储介质、处理器、语音设备、智能家电
DE102018105289A1 (de) Informationsverarbeitungsvorrichtung, informationsverarbeitungsverfahren und programm
WO2018087971A1 (ja) 移動体制御装置および移動体制御プログラム
DE112017008097T5 (de) Überwachungsbild-übertragungsvorrichtung für aufzüge
CN111402096A (zh) 一种在线授课质量管理方法、系统、设备和介质
CN114137846A (zh) 设备控制方法、装置、存储介质及设备
JP6711799B2 (ja) 機器制御装置、機器制御方法及び機器制御システム
DE112019003773T5 (de) Informationsverarbeitungsvorrichtung, informationsverarbeitungssystem, informationsverarbeitungsverfahren und informationsverarbeitungsprogramm
WO2023193803A1 (zh) 音量控制方法、装置、存储介质和电子设备
CN115547352A (zh) 电子设备及其噪音的处理方法、装置及介质

Legal Events

Date Code Title Description
R012 Request for examination validly filed