JP2009163358A - Information processor, information processing method, program, and voice chat system - Google Patents

Information processor, information processing method, program, and voice chat system Download PDF

Info

Publication number
JP2009163358A
JP2009163358A JP2007340397A JP2007340397A JP2009163358A JP 2009163358 A JP2009163358 A JP 2009163358A JP 2007340397 A JP2007340397 A JP 2007340397A JP 2007340397 A JP2007340397 A JP 2007340397A JP 2009163358 A JP2009163358 A JP 2009163358A
Authority
JP
Japan
Prior art keywords
keyword
voice
information processing
unit
processing apparatus
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2007340397A
Other languages
Japanese (ja)
Inventor
Tomohiro Tsuyuhara
智博 露原
Soichiro Atsumi
聡一郎 渥美
Tomomi Tsuchiya
智美 土屋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2007340397A priority Critical patent/JP2009163358A/en
Publication of JP2009163358A publication Critical patent/JP2009163358A/en
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide an information processor, an information processing method, a program and a voice chat system, allowing easy retrieval of contents gaining topicality in a chat after a chat end. <P>SOLUTION: This information processor has: a voice recognition part having a keyword list recording prescribed keywords, acquiring input voice as voice data, and voice-recognizing the acquired voice data; a keyword detection part detecting the keyword from a voice recognition result of the voice data based on the keyword list; a log information storage part recording a log wherein the detected keyword and a date when the keyword is detected are associated as log information; and a display control part making the detected keyword be displayed on a prescribed display part. <P>COPYRIGHT: (C)2009,JPO&INPIT

Description

本発明は、情報処理装置、情報処理方法、プログラムおよび音声チャットシステムに関する。   The present invention relates to an information processing apparatus, an information processing method, a program, and a voice chat system.

インターネット関連技術の発達により、パーソナルコンピュータ(Personal Computer:PC)間で、通常のテキストベースによるチャットのみならず、音声によるチャット(以下、「音声チャット」とも称する。)を実現することが可能となった。   With the development of Internet-related technology, not only ordinary text-based chat but also voice chat (hereinafter also referred to as “voice chat”) can be realized between personal computers (PCs). It was.

また、チャットのログデータとログデータとは異なる情報とを複数のユーザ間で共有することで、ユーザ間で円滑にコミュニケーションを図ることが可能となるシステムも提案されている(例えば、特許文献1参照。)。   In addition, a system that enables smooth communication between users by sharing chat log data and information different from the log data among a plurality of users has been proposed (for example, Patent Document 1). reference.).

特開2003−178016号公報JP 2003-178016 A

しかしながら、上述のようなシステムでは、チャットの終了後にチャット中に話題となった内容について検索を行う場合には、チャットの会話文が記載されたログデータを改めて読み返す必要があり、チャットで話題となった内容の検索が困難であるという問題があった。   However, in the system as described above, when searching for the content that became a topic during the chat after the chat ends, it is necessary to read back the log data in which the chat conversation sentence is written. There was a problem that it was difficult to search for the contents.

そこで、本発明は、このような問題に鑑みてなされたもので、その目的は、チャットで話題となった内容をチャット終了後に容易に検索することが可能な、新規かつ改良された情報処理装置、情報処理方法、プログラムおよび音声チャットシステムを提供することにある。   Therefore, the present invention has been made in view of such problems, and a purpose thereof is a new and improved information processing apparatus capable of easily searching for content that has become a hot topic in chat after the chat ends. An information processing method, a program, and a voice chat system are provided.

上記課題を解決するために、本発明のある観点によれば、所定のキーワードが記録されているキーワードリストを有する情報処理装置であって、入力された音声を音声データとして取得し、取得した前記音声データを音声認識する音声認識部と、前記キーワードリストに基づいて、前記音声データの音声認識結果の中からキーワードを検出するキーワード検出部と、検出された前記キーワードと前記キーワードが検出された日時とが関連付けられたログがログ情報として記録されるログ情報記憶部と、前記検出されたキーワードを所定の表示部に表示させる表示制御部と、を備える情報処理装置が提供される。   In order to solve the above-described problem, according to an aspect of the present invention, there is provided an information processing apparatus having a keyword list in which a predetermined keyword is recorded. A speech recognition unit that recognizes speech data; a keyword detection unit that detects a keyword from speech recognition results of the speech data based on the keyword list; and the detected keyword and the date and time when the keyword was detected An information processing apparatus is provided that includes a log information storage unit in which a log associated with is recorded as log information, and a display control unit that displays the detected keyword on a predetermined display unit.

前記キーワードリストには、当該キーワードリストに記録されたキーワードごとに、一のキーワードに関連する関連キーワードが当該一のキーワードに関連付けられて記録されており、前記ログ情報記憶部には、前記関連キーワードのログ情報が更に記録され、前記表示制御部は、前記キーワードリストに基づいて、前記検出されたキーワードに関連する前記関連キーワードを更に表示させてもよい。   In the keyword list, for each keyword recorded in the keyword list, a related keyword related to one keyword is recorded in association with the one keyword, and the related keyword is recorded in the log information storage unit. Log information may be further recorded, and the display control unit may further display the related keyword related to the detected keyword based on the keyword list.

前記情報処理装置は、前記表示制御部により前記表示部に表示されたキーワードが選択されたかを判断するキーワード選択部と、選択された前記キーワードの詳細情報を所定の方法で検索する詳細情報検索部と、を更に備え、前記表示制御部は、前記キーワード選択部によりキーワードが選択されると、前記詳細情報検索部により検索された前記キーワードの詳細情報を更に表示させ、前記ログ情報記憶部には、前記詳細情報検索部が前記詳細情報を検索した前記キーワードのログ情報として更に記録されてもよい。   The information processing apparatus includes a keyword selection unit that determines whether a keyword displayed on the display unit is selected by the display control unit, and a detailed information search unit that searches for detailed information on the selected keyword by a predetermined method When the keyword is selected by the keyword selection unit, the display control unit further displays detailed information of the keyword searched by the detailed information search unit, and the log information storage unit The detailed information search unit may further record the log information of the keyword searched for the detailed information.

前記情報処理装置は、前記ログ情報記憶部に記録された前記ログ情報に基づいて、前記キーワード検出部により検出された前記キーワードごとに所定のポイントを加算するとともに、前記キーワード選択部により選択された前記キーワードごとに所定のポイントを加算するポイント算出部を更に備え、前記ログ情報記憶部には、前記ポイント算出部により算出されたポイントがキーワードごとに関連づけられて記録されてもよい。   The information processing device adds a predetermined point for each of the keywords detected by the keyword detection unit based on the log information recorded in the log information storage unit and is selected by the keyword selection unit A point calculation unit that adds a predetermined point for each keyword may be further included, and the points calculated by the point calculation unit may be recorded in the log information storage unit in association with each keyword.

上記課題を解決するために、本発明の別の観点によれば、所定のキーワードが記録されているキーワードリストを有する情報処理装置における情報処理方法であって、入力された音声を音声データとして取得し、取得した前記音声データを音声認識する音声認識ステップと、前記キーワードリストに基づいて、前記音声データの音声認識結果の中からキーワードを検出するキーワード検出ステップと、検出された前記キーワードと前記キーワードが検出された日時とが関連付けられたログをログ情報として記録するログ情報記録ステップと、を含む情報処理方法が提供される。   In order to solve the above-described problem, according to another aspect of the present invention, there is provided an information processing method in an information processing apparatus having a keyword list in which a predetermined keyword is recorded, wherein input speech is acquired as speech data. A speech recognition step for recognizing the acquired speech data; a keyword detection step for detecting a keyword from a speech recognition result of the speech data based on the keyword list; and the detected keyword and the keyword A log information recording step of recording, as log information, a log associated with the date and time when the error is detected.

上記課題を解決するために、本発明の更に別の観点によれば、コンピュータを、所定のキーワードが記録されているキーワードリストを有する情報処理装置として機能させるためのプログラムであって、入力された音声を音声データとして取得し、取得した前記音声データを音声認識する音声認識機能と、前記キーワードリストに基づいて、前記音声データの音声認識結果の中からキーワードを検出するキーワード検出機能と、検出された前記キーワードと前記キーワードが検出された日時とが関連付けられたログをログ情報として記録するログ情報記憶機能と、前記検出されたキーワードを所定の表示部に表示させる表示制御機能と、をコンピュータに実現させるためのプログラムが提供される。   In order to solve the above problem, according to still another aspect of the present invention, there is provided a program for causing a computer to function as an information processing apparatus having a keyword list in which a predetermined keyword is recorded. A voice recognition function that acquires voice as voice data, recognizes the acquired voice data as voice, and a keyword detection function that detects a keyword from voice recognition results of the voice data based on the keyword list; A log information storage function for recording, as log information, a log in which the keyword is associated with the date and time when the keyword was detected, and a display control function for displaying the detected keyword on a predetermined display unit. A program for realizing this is provided.

かかる構成によれば、コンピュータプログラムは、コンピュータが備える記憶部に格納され、コンピュータが備えるCPUに読み込まれて実行されることにより、そのコンピュータを上記の情報処理装置として機能させる。また、コンピュータプログラムが記録された、コンピュータで読み取り可能な記録媒体も提供することができる。記録媒体は、例えば、磁気ディスク、光ディスク、光磁気ディスク、フラッシュメモリなどである。また、上記のコンピュータプログラムは、記録媒体を用いずに、例えばネットワークを介して配信してもよい。   According to this configuration, the computer program is stored in the storage unit included in the computer, and is read and executed by the CPU included in the computer, thereby causing the computer to function as the information processing apparatus. A computer-readable recording medium in which a computer program is recorded can also be provided. The recording medium is, for example, a magnetic disk, an optical disk, a magneto-optical disk, a flash memory, or the like. Further, the above computer program may be distributed via a network, for example, without using a recording medium.

上記課題を解決するために、本発明の更に別の観点によれば、音声チャットを実行可能な複数の情報処理装置を備える音声チャットシステムであって、少なくとも1つの前記情報処理装置は、所定のキーワードが記録されているキーワードリストを有し、入力された音声を音声データとして取得し、取得した前記音声データを音声認識する音声認識部と、前記キーワードリストに基づいて、前記音声データの音声認識結果の中からキーワードを検出するキーワード検出部と、検出された前記キーワードと前記キーワードが検出された日時とが関連付けられたログがログ情報として記録されるログ情報記憶部と、前記検出されたキーワードを所定の表示部に表示させる表示制御部と、を備える音声チャットシステムが提供される。   In order to solve the above-described problem, according to still another aspect of the present invention, there is provided a voice chat system including a plurality of information processing apparatuses capable of performing voice chat, wherein at least one of the information processing apparatuses is a predetermined one. A keyword list in which keywords are recorded; an input voice is acquired as voice data; a voice recognition unit that recognizes the acquired voice data; and voice recognition of the voice data based on the keyword list A keyword detection unit for detecting a keyword from the results; a log information storage unit in which a log in which the detected keyword is associated with the date and time when the keyword was detected; and the detected keyword There is provided a voice chat system including a display control unit that displays a message on a predetermined display unit.

前記ログ情報記憶部は、前記検出されたキーワードを、音声チャットを行った相手および日時に関連付けて集計してもよい。   The log information storage unit may aggregate the detected keywords in association with the partner and the date and time when the voice chat was performed.

前記情報処理装置は、前記音声チャットの相手である他の情報処理装置に入力された音声に対応する音声データを取得し、前記音声認識部は、前記他の情報処理装置から取得した前記音声データを音声認識してもよい。   The information processing apparatus acquires voice data corresponding to voice input to another information processing apparatus that is a partner of the voice chat, and the voice recognition unit acquires the voice data acquired from the other information processing apparatus. May be recognized by voice.

前記キーワード検出部は、前記他の情報処理装置から取得した前記音声データの音声認識結果の中からキーワードを検出し、前記ログ情報記憶部には、前記他の情報処理装置から取得した音声データの音声認識結果の中から検出したキーワードの前記ログ情報が記録されてもよい。   The keyword detection unit detects a keyword from a voice recognition result of the voice data acquired from the other information processing apparatus, and the log information storage unit stores the voice data acquired from the other information processing apparatus. The log information of the keyword detected from the voice recognition result may be recorded.

前記音声チャットシステムは、前記音声チャットを実行した前記情報処理装置が検出した前記キーワードを管理するキーワード管理サーバを更に備え、前記キーワード管理サーバは、前記情報処理装置から前記ログ情報を受信して、受信した前記ログ情報に基づいて前記キーワードの集計を行うキーワード集計部を更に備えてもよい。   The voice chat system further includes a keyword management server that manages the keywords detected by the information processing apparatus that has executed the voice chat, and the keyword management server receives the log information from the information processing apparatus, You may further provide the keyword total part which totals the said keyword based on the received said log information.

前記キーワード管理サーバは、当該キーワード管理サーバが管理している前期キーワードと対応付けられた製品が記録されている製品リストを有しており、前記情報処理装置から受信した前記ログ情報に記載されている前記キーワードと、前記製品リストとを照合して、前記情報処理装置に対して前記製品リストに記録されている前記製品のレコメンドを行う製品レコメンド部を備えてもよい。   The keyword management server has a product list in which products associated with the previous keyword managed by the keyword management server are recorded, and is described in the log information received from the information processing apparatus. The information processing apparatus may further include a product recommendation unit that collates the keyword with the product list and recommends the product recorded in the product list to the information processing apparatus.

前記キーワード管理サーバは、受信した前記キーワードの集計結果を参照して、前記音声チャットを行っている前記情報処理装置のそれぞれから取得した前記ログ情報の中から前記音声チャット中で集計ポイントが高いキーワードを抽出し、抽出した前記キーワードを関連キーワードとして登録する関連キーワード登録部を備えてもよい。   The keyword management server refers to the keyword aggregation result received, and the keyword having a high aggregation point in the voice chat from the log information acquired from each of the information processing devices performing the voice chat. And a related keyword registration unit for registering the extracted keyword as a related keyword.

前記音声チャットシステムは、前記情報処理装置が前記キーワードおよび前記キーワードに関連する記事を検索可能な検索サーバを更に備え、前記検索サーバは、当該検索サーバにおいて検索が行われた検索キーワードを前記情報処理装置に送信し、前記情報処理装置は、受信した前記検索キーワードに基づいて、前記キーワードリストを生成してもよい。   The voice chat system further includes a search server that allows the information processing apparatus to search for the keyword and an article related to the keyword, and the search server receives a search keyword searched in the search server for the information processing. The information processing apparatus may generate the keyword list based on the received search keyword.

上記課題を解決するために、本発明の更に別の観点によれば、音声チャットを実行可能な複数の情報処理装置と、前記複数の情報処理装置間で実行される前記音声チャットの制御を行うとともに、所定のキーワードリストを有するキーワード管理サーバと、を含み、前記情報処理装置は、入力された音声を音声データとし、前記キーワード管理サーバを介して前記音声データを前記音声チャットの相手である他の情報処理装置へと送信するとともに、前記キーワード管理サーバを介して前記他の情報処理装置から送信された音声データを取得する音声会話制御部を備え、前記キーワード管理サーバは、前記複数の情報処理装置から送信される音声データの送受信を仲介する音声データ仲介部と、前記音声データを音声認識する音声認識部と、前記キーワードリストに基づいて、前記音声データの音声認識結果の中からキーワードを検出するキーワード検出部と、検出された前記キーワードと前記キーワードが検出された日時とが関連付けられたログがログ情報として記録されるログ情報記憶部と、を備える音声チャットシステムが提供される。   In order to solve the above problems, according to still another aspect of the present invention, a plurality of information processing devices capable of performing voice chat and control of the voice chat executed between the plurality of information processing devices are performed. And a keyword management server having a predetermined keyword list, wherein the information processing apparatus uses the input voice as voice data, and the voice data is the partner of the voice chat via the keyword management server. A voice conversation control unit that acquires voice data transmitted from the other information processing apparatus via the keyword management server, and the keyword management server includes the plurality of information processing apparatuses. A voice data mediating unit that mediates transmission / reception of voice data transmitted from the device; a voice recognition unit that recognizes the voice data; Based on the keyword list, a keyword detection unit that detects a keyword from the speech recognition result of the speech data, and a log in which the detected keyword is associated with the date and time when the keyword was detected is recorded as log information. A voice chat system including a log information storage unit.

本発明によれば、チャットの会話中に存在したキーワードに関する情報が、当該キーワードが検出された日時に関連づけられて記録されているため、チャットで話題となった内容をチャット終了後に容易に検索することが可能である。   According to the present invention, information related to a keyword that existed in a chat conversation is recorded in association with the date and time when the keyword was detected. It is possible.

以下に添付図面を参照しながら、本発明の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。   Exemplary embodiments of the present invention will be described below in detail with reference to the accompanying drawings. In addition, in this specification and drawing, about the component which has the substantially same function structure, duplication description is abbreviate | omitted by attaching | subjecting the same code | symbol.

(第1の実施形態)
<音声チャットシステム10について>
まず、図1を参照しながら、本発明の第1の実施形態に係る音声チャットシステムについて、詳細に説明する。図1は、本実施形態に係る音声チャットシステム10を説明するための説明図である。
(First embodiment)
<About voice chat system 10>
First, the voice chat system according to the first embodiment of the present invention will be described in detail with reference to FIG. FIG. 1 is an explanatory diagram for explaining a voice chat system 10 according to the present embodiment.

本実施形態に係る音声チャットシステム10は、例えば図1に示したように、通信網12と、情報処理装置20A、20Bと、キーワード管理サーバ30と、検索サーバ40と、を主に備える。   The voice chat system 10 according to the present embodiment mainly includes a communication network 12, information processing devices 20A and 20B, a keyword management server 30, and a search server 40, as shown in FIG.

通信網12は、情報処理装置20、キーワード管理サーバ30および検索サーバ40を双方向通信または一方向通信可能に接続する通信回線網である。この通信網12は、例えば、インターネット、電話回線網、衛星通信網、同報通信路等の公衆回線網や、WAN(Wide Area Network)、LAN(Local Area Network)、IP−VPN(Internet Protocol−Virtual Private Network)、Ethernet(登録商標)、ワイヤレスLAN等の専用回線網等で構成されており、有線/無線を問わない。   The communication network 12 is a communication line network that connects the information processing apparatus 20, the keyword management server 30, and the search server 40 so that bidirectional communication or one-way communication is possible. The communication network 12 includes, for example, the public network such as the Internet, a telephone line network, a satellite communication network, a broadcast communication path, a WAN (Wide Area Network), a LAN (Local Area Network), an IP-VPN (Internet Protocol-). Virtual Private Network), Ethernet (registered trademark), a dedicated line network such as a wireless LAN, and the like, regardless of wired / wireless.

情報処理装置20は、通信網12を介して接続された他の情報処理装置20と、音声によるチャット(音声チャット)を行う。また、情報処理装置20は、通信網12に接続されているキーワード管理サーバ30および検索サーバ40に対して、通信網12を介してキーワード管理サーバ30が備える各種データベースの参照を要求したり、情報の検索を要求したりすることができる。また、音声チャットを行う他の情報処理装置20は、図示のように通信網12を介して接続されていてもよく、また、通信網12を介さずに、例えば、USB(Universal Serial Bus)ポートや、i.Link等のIEEE1394ポート、SCSI(Small Computer System Interface)ポート、RS−232Cポート等により直接接続されていてもよい。   The information processing apparatus 20 performs voice chat (voice chat) with another information processing apparatus 20 connected via the communication network 12. Further, the information processing apparatus 20 requests the keyword management server 30 and the search server 40 connected to the communication network 12 to refer to various databases included in the keyword management server 30 via the communication network 12, Or request a search. Further, the other information processing apparatus 20 that performs voice chat may be connected via the communication network 12 as shown in the figure. For example, a USB (Universal Serial Bus) port may be used without using the communication network 12. Or i. It may be directly connected by an IEEE 1394 port such as Link, a SCSI (Small Computer System Interface) port, an RS-232C port, or the like.

なお、図示の例では、情報処理装置20として、デスクトップ型のPCを示しているが、本実施形態に係る情報処理装置20は、デスクトップ型PC、ノート型PCを問わない。また、本実施形態に係る情報処理装置20は、かかる例に限定されず、ネットワークを介した通信機能を有する機器であれば、例えば、テレビジョン受像器や家庭用ゲーム機等の情報家電、携帯電話、PDA(Personal Digital Assistant)等で構成することもできる。また、情報処理装置20は、契約者が持ち運びできるポータブルデバイス(Portabale Device)、例えば、携帯型ゲーム機、PHS、携帯型映像/音声プレーヤなどであってもよい。   In the illustrated example, a desktop PC is shown as the information processing apparatus 20, but the information processing apparatus 20 according to the present embodiment may be a desktop PC or a notebook PC. In addition, the information processing apparatus 20 according to the present embodiment is not limited to such an example, and may be an information home appliance such as a television receiver or a home game machine, a mobile phone, or the like as long as it has a communication function via a network. A telephone, a PDA (Personal Digital Assistant), or the like can also be used. Further, the information processing apparatus 20 may be a portable device (Portable Device) that can be carried by a contractor, for example, a portable game machine, a PHS, a portable video / audio player, or the like.

さらに、図1では、通信網12に接続されている情報処理装置20は、2つのみであるが、本実施形態は、上記の場合に限定されるわけではなく、情報処理装置20は、通信網12上に複数接続されていてもよい。   Further, in FIG. 1, only two information processing apparatuses 20 are connected to the communication network 12, but the present embodiment is not limited to the above case, and the information processing apparatus 20 is configured to communicate with the communication network 12. A plurality of connections may be made on the network 12.

キーワード管理サーバ30は、情報処理装置20が音声チャットの会話内容から所定のキーワードを抽出する際に参照するキーワードリストの原本をデータベースとして管理しているサーバである。このキーワード管理サーバ30が管理しているキーワードリストの原本には、キーワードとなる単語についての発音、音韻、音節の連鎖関係を記述したモデルおよびキーワードのカテゴリ等の各種情報が記載されている。キーワード管理サーバ30が管理しているキーワードリストには、例えば、検索サーバの上位検索キーワードや、ブログの話題となっている頻度の高い用語等がキーワードとして記載されている。また、このキーワード管理サーバ30は、検索エンジン(検索サーバ)の上位検索キーワードやブログの話題となっている頻度の高い用語等の変化に応じて記載が随時更新される動的なデータベースであってもよく、静的なデータベースであってもよい。さらに、キーワード管理サーバ30に記載されているキーワードは、例えばPLSA(Probabilistic Latent Semantic Analysis)モデル等で処理され、適切な話題ベクトルの形に変換されていてもよい。ここで、話題ベクトルとは、任意の話題をベクトル空間に表現して、話題の共通性等について判断するために利用されるものである。また、キーワード管理サーバ30に記載されているキーワードには、後述する認識重み情報が付加されていてもよい。キーワード管理サーバ30については、以下で改めて詳細に説明する。   The keyword management server 30 is a server that manages, as a database, an original keyword list that is referred to when the information processing apparatus 20 extracts a predetermined keyword from the conversation content of voice chat. In the original keyword list managed by the keyword management server 30, various types of information such as a model describing the pronunciation, phoneme, and syllable chain relationship for the word as a keyword and a keyword category are described. In the keyword list managed by the keyword management server 30, for example, high-order search keywords of the search server, terms that are frequently used as blog topics, and the like are described as keywords. The keyword management server 30 is a dynamic database whose description is updated at any time in accordance with changes in high-order search keywords of search engines (search servers) and frequently used terms in blogs. It may be a static database. Furthermore, the keywords described in the keyword management server 30 may be processed by, for example, a PLSA (Probabilistic Lent Semantic Analysis) model or the like and converted into an appropriate topic vector form. Here, the topic vector is used to express an arbitrary topic in a vector space and determine the commonality of topics. In addition, recognition weight information described later may be added to the keywords described in the keyword management server 30. The keyword management server 30 will be described again in detail below.

ここで、上記のキーワードとなる単語についての発音、音韻、音節の連鎖関係とは、キーワードとしてキーワード管理サーバ30に記載されている各単語が、発音、音韻、音節といった観点において、互いにどのように連鎖するか(接続するか)を表す関係であり、このような連鎖関係を記述する方法としては、例えば、統計的な単語連鎖確率(n−gramやclass n−gram)、生成文法、有限状態オートマトン等がある。   Here, the chain relationship between pronunciation, phonology, and syllable for the above word as a keyword refers to how each word described in the keyword management server 30 as a keyword is mutually related in terms of pronunciation, phonology, and syllable. This is a relationship indicating whether or not they are linked (connected). For example, a statistical word chain probability (n-gram or class n-gram), a generation grammar, a finite state can be used for describing such a chain relationship. There is an automaton.

検索サーバ40は、インターネット等で公開されている情報や非公開となっている情報等についてキーワード等を使って検索できるWebサイト等のデータベースである。本実施形態に係る検索サーバ40は、キーワードによって蓄えられている情報の全文検索を行う全文検索型であってもよく、カテゴリ別に分類されている情報を検索するディレクトリ型であってもよい。   The search server 40 is a database such as a Web site that can search information disclosed on the Internet or the like or information that is not disclosed using keywords or the like. The search server 40 according to the present embodiment may be a full text search type that performs a full text search of information stored by a keyword, or may be a directory type that searches for information classified by category.

<情報処理装置20の構成について>
続いて、図2を参照しながら、本実施形態に係る情報処理装置20の構成について詳細に説明を行うが、以下の説明においては、音声チャットを行う2つの情報処理装置20について、便宜的に第1情報処理装置20Aおよび第2情報処理装置20Bと称することとする。また、第1情報処理装置20Aおよび第2情報処理装置20Bは、各情報処理装置のユーザの声を音声データ化し、音声チャットの会話相手である他の情報処理装置に対して、音声データを送信するものとする。図2は、本実施形態に係る情報処理装置20Aの構成を説明するためのブロック図である。
<Configuration of Information Processing Device 20>
Subsequently, the configuration of the information processing apparatus 20 according to the present embodiment will be described in detail with reference to FIG. 2. In the following description, the two information processing apparatuses 20 that perform voice chat will be described for convenience. The first information processing device 20A and the second information processing device 20B will be referred to. Further, the first information processing device 20A and the second information processing device 20B convert the voice of the user of each information processing device into sound data, and transmit the sound data to another information processing device that is a conversation partner of the voice chat. It shall be. FIG. 2 is a block diagram for explaining the configuration of the information processing apparatus 20A according to the present embodiment.

本実施形態に係る情報処理装置20Aは、例えば図2に示したように、音声入力部201と、音声認識部203と、音声会話制御部205と、音声出力部207と、キーワード検出部209と、表示制御部211と、表示部213と、キーワード選択部215と、詳細情報検索部217と、ポイント算出部219と、通信部221と、記憶部223と、を主に備える。   As shown in FIG. 2, for example, the information processing apparatus 20A according to the present embodiment includes a voice input unit 201, a voice recognition unit 203, a voice conversation control unit 205, a voice output unit 207, and a keyword detection unit 209. The display control unit 211, the display unit 213, the keyword selection unit 215, the detailed information search unit 217, the point calculation unit 219, the communication unit 221, and the storage unit 223 are mainly provided.

音声入力部201は、第1情報処理装置20Aのユーザが発した音声である音声チャットでの会話を、第1情報処理装置20Aへと取り込むインターフェースであって、例えば、第1情報処理装置20Aに接続された入力装置であるマイクロフォンやヘッドセット等から構成される。マイクロフォンやヘッドセットに向かって発せられたユーザの会話は、自動的かつリアルタイムに第1情報処理装置20Aへと取り込まれて電気信号としての音声信号に変換され、音声入力部201を介して音声認識部203へと伝送される。   The voice input unit 201 is an interface for capturing a conversation in a voice chat, which is a voice uttered by a user of the first information processing apparatus 20A, into the first information processing apparatus 20A. It is composed of a microphone and a headset that are connected input devices. The user's conversation uttered toward the microphone or the headset is automatically and in real time taken into the first information processing apparatus 20A and converted into an audio signal as an electric signal, and voice recognition is performed via the voice input unit 201. Is transmitted to the unit 203.

音声認識部203は、音声入力部201により自主的に取り込まれリアルタイムに伝送されてくるユーザの会話から音声データを生成して、後述する音声会話制御部205に音声データを伝送するとともに、生成した音声データに基づいて音声認識を行う。音声認識部203は、音声認識の結果として、生成した音声データに対応する単語列を生成して、後述するキーワード検出部209に対して、生成した単語列を伝送する。また、音声認識部203は、生成した単語列を後述する表示制御部211に伝送してもよい。なお、音声認識部203については、以下で詳細に説明する。   The voice recognition unit 203 generates voice data from the user's conversation that is voluntarily captured by the voice input unit 201 and transmitted in real time, and transmits the voice data to the voice conversation control unit 205 to be described later. Speech recognition is performed based on the speech data. The voice recognition unit 203 generates a word string corresponding to the generated voice data as a result of the voice recognition, and transmits the generated word string to the keyword detection unit 209 described later. Further, the voice recognition unit 203 may transmit the generated word string to the display control unit 211 described later. The voice recognition unit 203 will be described in detail below.

音声会話制御部205は、通信網12を介して接続されている第2情報処理装置20Bとの間で行われる音声チャットを制御する。音声会話制御部205は、音声認識部203で生成された音声データの伝送を受け、通信部221を介して音声データを第2情報処理装置20Bへと送信するとともに、第2情報処理装置20Bから送信される音声データを、通信部221を介して受信し、音声出力部207へと伝送する。また、音声会話制御部205は、音声チャットが行われる毎に、音声チャットの行われた日時、音声チャット自体を識別する識別子および音声チャットの相手を表す識別子を関連付けて、音声チャットの利用履歴情報として記憶部223に記憶してもよい。   The voice conversation control unit 205 controls voice chat performed with the second information processing apparatus 20 </ b> B connected via the communication network 12. The voice conversation control unit 205 receives the transmission of the voice data generated by the voice recognition unit 203, transmits the voice data to the second information processing device 20B via the communication unit 221, and from the second information processing device 20B. Audio data to be transmitted is received via the communication unit 221 and transmitted to the audio output unit 207. In addition, each time a voice chat is performed, the voice conversation control unit 205 associates the date and time when the voice chat was performed, an identifier that identifies the voice chat itself, and an identifier that represents the voice chat partner, and uses voice chat usage history information. May be stored in the storage unit 223.

なお、音声会話制御部205は、音声会話制御に特化したハードウェアにより構成されていてもよく、音声チャットプログラム等のアプリケーションプログラムとして提供されてもよい。   Note that the voice conversation control unit 205 may be configured by hardware specialized for voice conversation control, or may be provided as an application program such as a voice chat program.

音声出力部207は、第2情報処理装置20Bのユーザが発した音声の音声データを受信し、第1情報処理装置20Aへと取り込むインターフェースであって、例えば、第1情報処理装置20Aに接続された出力装置であるスピーカやイヤフォン等から構成される。後述する通信部221を介して受信された第2情報処理装置20Bからの音声データは、音声出力部207を介して、第1情報処理装置20Aのユーザへと出力される。   The audio output unit 207 is an interface that receives audio data of audio uttered by the user of the second information processing device 20B and takes it into the first information processing device 20A. For example, the audio output unit 207 is connected to the first information processing device 20A. Output devices such as speakers and earphones. Audio data from the second information processing device 20B received via the communication unit 221 to be described later is output to the user of the first information processing device 20A via the audio output unit 207.

キーワード検出部209は、音声認識部203から伝送された単語列の中に、後述するキーワードリスト記憶部227が記憶しているキーワードが存在するか否かを判断し、キーワードが存在している場合には、そのキーワードに該当する単語をキーワードとして出力する。キーワード検出部209は、一つの単語列の中に複数のキーワードが存在した場合には、該当する全てのキーワードを同時に検出してもよい。また、キーワード検出部209は、単語列の中から検出したキーワードを、後述する表示制御部211に伝送する。更に、キーワード検出部209は、単語列の中から検出したキーワードを、後述するポイント算出部219に伝送する。   The keyword detection unit 209 determines whether or not the keyword stored in the keyword list storage unit 227 described later exists in the word string transmitted from the speech recognition unit 203, and the keyword exists. , The word corresponding to the keyword is output as a keyword. The keyword detection unit 209 may detect all corresponding keywords simultaneously when a plurality of keywords exist in one word string. Further, the keyword detection unit 209 transmits the keyword detected from the word string to the display control unit 211 described later. Further, the keyword detection unit 209 transmits the keyword detected from the word string to the point calculation unit 219 described later.

更に、キーワード検出部209は、検出したキーワードに関連づけられたキーワードが、キーワードリスト記憶部227に記録されているキーワードリストに存在する場合には、検出したキーワードに加えて、当該キーワードに関連づけられている関連キーワードを、後述する表示制御部111に伝送する。   Further, when the keyword associated with the detected keyword exists in the keyword list recorded in the keyword list storage unit 227, the keyword detection unit 209 associates the keyword with the keyword in addition to the detected keyword. The related keyword is transmitted to the display control unit 111 described later.

表示制御部211は、キーワード検出部209により検出された音声チャットの会話中に含まれるキーワードおよび検出されたキーワードに関連づけられた関連キーワードや、後述する詳細情報検出部217により検索されたキーワードの検索結果およびキーワードに関連する記事を、表示部213へ表示するための表示制御を行う。また、キーワード管理サーバ30から、キーワード検出部209により検出されたキーワードに関連する製品に関する情報が提供されると、提供された製品に関する情報を表示部213に表示するための表示制御を行う。   The display control unit 211 searches for a keyword included in the voice chat conversation detected by the keyword detection unit 209 and a related keyword associated with the detected keyword, or a keyword searched by the detailed information detection unit 217 described later. Display control for displaying an article related to the result and the keyword on the display unit 213 is performed. Further, when information related to a product related to the keyword detected by the keyword detection unit 209 is provided from the keyword management server 30, display control for displaying information related to the provided product on the display unit 213 is performed.

表示部213は、情報処理装置20に備えられたディスプレイ等の出力装置であり、表示制御部211によって制御される。表示部213には、表示制御部211によって表示制御された情報が表示される。ここで、表示制御部211によって制御された情報としては、例えば、キーワード、キーワードの検索結果、キーワードに関連する記事および検出されたキーワードに関連する製品に関する情報等を挙げることができる。   The display unit 213 is an output device such as a display provided in the information processing apparatus 20 and is controlled by the display control unit 211. Information that is display-controlled by the display control unit 211 is displayed on the display unit 213. Here, examples of the information controlled by the display control unit 211 include a keyword, a keyword search result, an article related to the keyword, and information related to a product related to the detected keyword.

キーワード選択部215は、表示部213に表示されているキーワード、キーワードの検索結果、キーワードに関連する記事および検出されたキーワードに関連する製品に関する情報等が選択されたかを判断する。具体的には、キーワード選択部215は、情報処理装置20Aの入力装置に備えられたカーソルキーやマウスポインタ等の位置特定オブジェクトの動作を検出して、上記キーワード等の選択がなされたかを判断する。表示部213に表示された上記キーワード等が選択されたと判断されると、キーワード選択部215は、選択されたキーワード等を、記憶部223のログ情報記憶部255に選択された日時に関連づけて記録する。また、キーワード選択部215は、選択されたキーワード等を、後述する詳細情報検索部217に伝送し、選択されたキーワード等に関する詳細情報を取得するように要請する。更に、キーワード選択部215は、選択されたキーワード等を、後述するポイント算出部219に伝送する。   The keyword selection unit 215 determines whether the keyword displayed on the display unit 213, the keyword search result, the article related to the keyword, the information related to the product related to the detected keyword, and the like have been selected. Specifically, the keyword selection unit 215 detects the operation of a position specifying object such as a cursor key or a mouse pointer provided in the input device of the information processing apparatus 20A, and determines whether the keyword or the like has been selected. . If it is determined that the keyword or the like displayed on the display unit 213 is selected, the keyword selection unit 215 records the selected keyword or the like in association with the date and time selected in the log information storage unit 255 of the storage unit 223. To do. Further, the keyword selection unit 215 transmits the selected keyword or the like to the detailed information search unit 217 to be described later, and requests to acquire detailed information regarding the selected keyword or the like. Further, the keyword selection unit 215 transmits the selected keyword or the like to the point calculation unit 219 described later.

詳細情報検索部217は、キーワード検出部209から伝送されたキーワードおよび関連キーワードと、当該キーワードがキーワード検出部237から伝送された時刻とを関連付けて、後述する記憶部251に格納する。また、詳細情報検索部217は、通信部221を介して検索サーバ40にアクセスし、キーワード抽出部237から伝送されたキーワードについて情報検索を行い、キーワードの検索結果およびキーワードに関連する記事を取得する。詳細情報検索部217は、得られた検索結果を記憶部225のログ情報記憶部225に格納するとともに、表示制御部211へと伝送する。ここで、詳細情報検索部217が検索サーバ40により取得する検索結果は、検索キーワードに関する検索サーバ40中の情報の表題やURLや情報のジャンルといった、情報に関するメタデータ等である。   The detailed information search unit 217 associates the keyword and the related keyword transmitted from the keyword detection unit 209 with the time when the keyword is transmitted from the keyword detection unit 237, and stores the associated information in the storage unit 251 described later. Further, the detailed information search unit 217 accesses the search server 40 via the communication unit 221 and performs an information search for the keyword transmitted from the keyword extraction unit 237, and acquires a keyword search result and an article related to the keyword. . The detailed information search unit 217 stores the obtained search result in the log information storage unit 225 of the storage unit 225 and transmits it to the display control unit 211. Here, the search result acquired by the detailed information search unit 217 by the search server 40 is metadata related to information such as the title, URL, and genre of information in the search server 40 related to the search keyword.

また、キーワード選択部215から、ある特定のキーワードやキーワードに関する記事について更に詳細な情報が選択された旨が通知されると、詳細情報検索部217は、通信部221を介して検索サーバ40にアクセスし更に詳細な情報を取得するとともに、キーワード選択部215から通知された特定のキーワードを、記憶部223のログ情報記憶部225に記憶する。   Further, when the keyword selection unit 215 notifies that a more detailed information is selected for a specific keyword or an article related to the keyword, the detailed information search unit 217 accesses the search server 40 via the communication unit 221. Further, detailed information is acquired, and the specific keyword notified from the keyword selection unit 215 is stored in the log information storage unit 225 of the storage unit 223.

ポイント算出部219は、音声チャットの会話内容からキーワードが検出されるごとに、検出されたキーワードに所定の点数(ポイント)を付与する。また、検出されたキーワードが選択されたことがキーワード選択部215から伝送されると、ポイント算出部219は、選択されたキーワードに対して更に所定の点数を加算する。さらに、ポイント算出部219は、検出されたキーワードに関連づけられた関連キーワードが選択されると、選択された関連キーワードに対して所定の点数を付与する。   Each time the keyword is detected from the conversation content of the voice chat, the point calculation unit 219 gives a predetermined score (point) to the detected keyword. In addition, when the keyword selection unit 215 transmits that the detected keyword has been selected, the point calculation unit 219 further adds a predetermined score to the selected keyword. Furthermore, when a related keyword associated with the detected keyword is selected, the point calculation unit 219 gives a predetermined score to the selected related keyword.

例えば、ポイント算出部219は、音声会話の中から所定のキーワードが検出されると、検出されたキーワードに対して例えば5点をポイントとして加算し、このキーワードが選択されると、更に10点をポイントとして加算する。また、検出されたキーワードに関連づけられた関連キーワードが選択されると、関連キーワードに対して10点のポイントが加算される。   For example, when a predetermined keyword is detected in the voice conversation, the point calculation unit 219 adds, for example, 5 points to the detected keyword as a point, and when this keyword is selected, further 10 points are added. Add as points. In addition, when a related keyword associated with the detected keyword is selected, 10 points are added to the related keyword.

なお、キーワードに対して加算されるポイント数は、上述の例のように一定の値であってもよく、キーワードに対して付与された重み付け係数に基づいて加算するポイント数を変更してもよい。   The number of points added to the keyword may be a fixed value as in the above example, or the number of points to be added may be changed based on the weighting coefficient assigned to the keyword. .

ポイント算出部219は、算出したポイントを対応するキーワードに関連づけて後述するログ情報記憶部225に記録する。   The point calculation unit 219 records the calculated points in the log information storage unit 225 described later in association with the corresponding keyword.

また、ポイント算出部219は、ログ情報記憶部225に記録されている各種ログ情報を、所定の間隔でキーワード管理サーバ30に対して送信する。また、ポイント算出部219は、キーワード管理サーバ30からの要請に応じて、ログ情報記憶部225を参照してログ情報をキーワード管理サーバ30に送信してもよい。   In addition, the point calculation unit 219 transmits various log information recorded in the log information storage unit 225 to the keyword management server 30 at predetermined intervals. Further, the point calculation unit 219 may transmit log information to the keyword management server 30 with reference to the log information storage unit 225 in response to a request from the keyword management server 30.

ここで、キーワードに付加されるポイントについては、音声チャットの最中にポイントが変更になる毎に表示部213に表示されてもよく、音声チャットが終了した後に表示部213に表示されてもよい。また、キーワードに付加されるポイントは、情報処理装置20のユーザ操作により、任意のタイミングで表示されることが可能である。   Here, the point added to the keyword may be displayed on the display unit 213 every time the point is changed during the voice chat, or may be displayed on the display unit 213 after the voice chat ends. . In addition, the point added to the keyword can be displayed at an arbitrary timing by a user operation of the information processing apparatus 20.

通信部221は、例えば第1情報処理装置20Aに設けられた通信装置であって、第1情報処理装置20Aの各処理部が、通信網12を介して第1情報処理装置20Aの外部の装置等であるキーワード管理サーバ30、検索サーバ40、第2情報処理装置20B等と行う情報の送受信を、仲介する。なお、通信部221は、通信網12を介さずに、第1情報処理装置20Aに直接接続されているその他の情報処理装置等に対して、情報の送受信を行うことも可能である。   The communication unit 221 is a communication device provided in the first information processing apparatus 20A, for example, and each processing unit of the first information processing apparatus 20A is a device external to the first information processing apparatus 20A via the communication network 12. And the like, such as the keyword management server 30, the search server 40, the second information processing apparatus 20B, and the like. Note that the communication unit 221 can also transmit and receive information to and from other information processing apparatuses directly connected to the first information processing apparatus 20A without using the communication network 12.

記憶部223は、例えば第1情報処理装置20Aに設けられたストレージ装置であって、キーワード検出部209が検出したキーワード等のデータを記憶する。また、これらのデータ以外にも、音声認識部203が生成した音声データや単語列等の認識結果や、各種のデータベース等を記憶することも可能である。更に、これらのデータ以外にも、第1情報処理装置20Aが、何らかの処理を行う際に保存する必要が生じた様々なパラメータや処理の途中経過等を、適宜記憶することが可能である。この記憶部223は、音声認識部203や、音声会話制御部205や、キーワード検出部209や、キーワード選択部215や、詳細情報検索部217や、ポイント算出部219等が、自由に読み書きを行うことが可能である。この記憶部223は、ログ情報記憶部225と、キーワードリスト記憶部227と、を更に備える。   The storage unit 223 is a storage device provided in the first information processing apparatus 20A, for example, and stores data such as keywords detected by the keyword detection unit 209. In addition to these data, it is also possible to store recognition results such as voice data and word strings generated by the voice recognition unit 203, various databases, and the like. Furthermore, in addition to these data, the first information processing apparatus 20A can appropriately store various parameters, the progress of processing, and the like that need to be saved when performing some processing. The storage unit 223 is freely read and written by the voice recognition unit 203, the voice conversation control unit 205, the keyword detection unit 209, the keyword selection unit 215, the detailed information search unit 217, the point calculation unit 219, and the like. It is possible. The storage unit 223 further includes a log information storage unit 225 and a keyword list storage unit 227.

ログ情報記憶部225は、キーワード検出部209が音声認識結果の中から検出したキーワードのログがログ情報として記録される記憶部である。ここで、キーワードのログは、あるキーワードと、このキーワードが検出された日時とが関連づけられた情報である。ログ情報記憶部225には、検出されたキーワードに関するログ情報以外にも、検出された後に更にユーザにより選択されたキーワードに関するキーワード選択ログ情報や、検出されたキーワードに関連づけられた関連キーワードに関するログ情報や、検出されたキーワードに関連づけられた製品のレコメンドを受けた際に記録される製品レコメンドログ情報等が記録される。ログ情報記憶部225については、以下で改めて詳細に説明する。   The log information storage unit 225 is a storage unit in which a keyword log detected from the speech recognition result by the keyword detection unit 209 is recorded as log information. Here, the keyword log is information in which a certain keyword is associated with the date and time when this keyword was detected. In the log information storage unit 225, in addition to the log information related to the detected keyword, keyword selection log information related to the keyword further selected by the user after detection, and log information related to the related keyword related to the detected keyword In addition, product recommendation log information recorded when receiving a recommendation of a product associated with the detected keyword is recorded. The log information storage unit 225 will be described in detail later.

このログ情報記憶部225に記録されている各種ログ情報は、キーワード管理サーバ30に定期的に送信され、キーワード管理サーバ30が実行する処理に利用される。また、ログ情報記憶部225に記録されているログ情報は、情報処理装置20のユーザにより任意のタイミングでキーワード管理サーバ30に送信されてもよい。さらに、ログ情報記憶部225に記録されているログ情報は、情報処理装置20のユーザが自由に参照することができる。   Various log information recorded in the log information storage unit 225 is periodically transmitted to the keyword management server 30 and used for processing executed by the keyword management server 30. The log information recorded in the log information storage unit 225 may be transmitted to the keyword management server 30 by the user of the information processing apparatus 20 at an arbitrary timing. Furthermore, the log information recorded in the log information storage unit 225 can be freely referred to by the user of the information processing apparatus 20.

キーワードリスト記憶部227は、キーワード検出部209が音声認識結果の中からキーワードを検出する際に参照するキーワードリストが記録されている記憶部である。キーワードリスト記憶部227に記録されているキーワードリストは、情報処理装置20がキーワード管理サーバ30から取得したものである。キーワードリスト記憶部227に記録されているキーワードリストは、情報処理装置20がキーワード管理サーバ30を参照して、定期的に更新される。また、音声認識部203は、キーワードリスト記憶部227を参照して、音声認識に利用される認識用データベース257の内容を更新してもよい。さらに、情報処理装置20は、検索サーバ40から、当該検索サーバ40において検索が行われた検索キーワードを取得して、取得した検索キーワードに基づいてキーワードリストを生成・更新してもよい。この場合に、情報処理装置20は、検索サーバ40から、例えば、検索サーバにおいて検索が行われた頻度の多さに応じてランキングがなされた上位検索キーワードリスト等を用いて、キーワードリストの生成・更新を行うことが好ましい。かかる方法を用いてキーワードリストを生成・更新することで、ユーザが音声チャットで話題にしやすい最近のトピックに関連した語彙を優先的に検出することが可能となる。   The keyword list storage unit 227 is a storage unit in which a keyword list to be referred to when the keyword detection unit 209 detects a keyword from the speech recognition result is recorded. The keyword list recorded in the keyword list storage unit 227 is acquired by the information processing apparatus 20 from the keyword management server 30. The keyword list recorded in the keyword list storage unit 227 is periodically updated by the information processing apparatus 20 with reference to the keyword management server 30. Further, the speech recognition unit 203 may update the content of the recognition database 257 used for speech recognition with reference to the keyword list storage unit 227. Further, the information processing apparatus 20 may acquire a search keyword searched by the search server 40 from the search server 40, and generate / update a keyword list based on the acquired search keyword. In this case, the information processing apparatus 20 generates a keyword list from the search server 40 using, for example, a high-order search keyword list ranked according to the frequency of the search performed in the search server. It is preferable to perform the update. By generating / updating a keyword list using such a method, it becomes possible to preferentially detect vocabularies related to recent topics that are easy for users to talk about in voice chat.

また、キーワードリスト記憶部227に記録されているキーワードリストには、一のキーワードに関連するキーワードである関連キーワードが、この一のキーワードに関連付けられて記録されており、関連キーワードが関連付けられているキーワードが検出されると、検出されたキーワードに加えて、検出されたキーワードに関連付けられた関連キーワードも選択されることとなる。   In the keyword list recorded in the keyword list storage unit 227, a related keyword that is a keyword related to one keyword is recorded in association with the one keyword, and the related keyword is associated. When a keyword is detected, in addition to the detected keyword, a related keyword associated with the detected keyword is also selected.

[音声認識部203について]
続いて、図3を参照しながら、本実施形態に係る音声認識部203について、詳細に説明する。図3は、本実施形態に係る音声認識部203を説明するためのブロック図である。
[About the voice recognition unit 203]
Next, the speech recognition unit 203 according to the present embodiment will be described in detail with reference to FIG. FIG. 3 is a block diagram for explaining the speech recognition unit 203 according to the present embodiment.

図3に示したように、本実施形態に係る音声認識部203は、例えば、AD変換部251と、特徴パラメータ抽出部253と、マッチング部255と、認識用データベース257と、を備える。   As illustrated in FIG. 3, the speech recognition unit 203 according to the present embodiment includes, for example, an AD conversion unit 251, a feature parameter extraction unit 253, a matching unit 255, and a recognition database 257.

AD変換部251は、音声入力部201から伝送されたアナログ信号である音声信号をサンプリングして量子化し、ディジタル信号である音声データへと変換する。音声データへの変換が終了すると、AD変換部251は、生成した音声データを、音声会話制御部205および特徴パラメータ抽出部253へと伝送する。また、AD変換部251は、生成した音声データを、記憶部223に記憶してもよい。   The AD conversion unit 251 samples and quantizes an audio signal that is an analog signal transmitted from the audio input unit 201, and converts the sampled audio signal into audio data that is a digital signal. When the conversion to the voice data is completed, the AD conversion unit 251 transmits the generated voice data to the voice conversation control unit 205 and the feature parameter extraction unit 253. Further, the AD conversion unit 251 may store the generated audio data in the storage unit 223.

特徴パラメータ抽出部253は、AD変換部251にて生成された音声データについて、適当なフレームごとに、例えば、メル周波数ケプストラム係数(Mel Frequency Cepstrum Coefficients:MFCC)とその時間差分パラメータ、スペクトル、パワー線形予測係数、ケプストラム係数、線スペクトル対などの特徴パラメータを抽出する。特徴パラメータの抽出が終了すると、特徴パラメータ抽出部253は、抽出した特徴パラメータを、後述するマッチング部255へと伝送する。なお、特徴パラメータ抽出部253は、音声データから抽出した各種の特徴パラメータを、記憶部223に記憶してもよい。   The feature parameter extraction unit 253 performs, for example, a mel frequency cepstrum coefficient (MFCC) and its time difference parameter, spectrum, power linearity for each appropriate frame of the audio data generated by the AD conversion unit 251. Feature parameters such as prediction coefficients, cepstrum coefficients, and line spectrum pairs are extracted. When the feature parameter extraction ends, the feature parameter extraction unit 253 transmits the extracted feature parameter to the matching unit 255 described later. Note that the feature parameter extraction unit 253 may store various feature parameters extracted from the audio data in the storage unit 223.

マッチング部255は、特徴パラメータ抽出部253から伝送された各種の特徴パラメータに基づき、後述する認識用データベース257等を適宜参照しながら、音声入力部201に入力された音声(すなわち、音声チャットにおける会話内容)に最も近い単語列を、音声認識結果として生成する。単語列の生成方法については、以下で改めて説明する。単語列の生成が終了すると、マッチング部255は、生成した単語列を、キーワード検出部209へと伝送する。また、マッチング部255は、生成した単語列を、記憶部223に記憶してもよい。   Based on the various feature parameters transmitted from the feature parameter extraction unit 253, the matching unit 255 refers to the recognition database 257, which will be described later, as appropriate, and the voice input to the voice input unit 201 (that is, conversation in voice chat). A word string closest to (content) is generated as a speech recognition result. A method for generating a word string will be described later. When the generation of the word string is completed, the matching unit 255 transmits the generated word string to the keyword detection unit 209. The matching unit 255 may store the generated word string in the storage unit 223.

なお、上記のマッチング部255は、例えば、ビームサーチに基づくビタビ(Viterbi)デコーダや、A探索に基づくスタックデコーダなどの手法を用いてマッチングを行なうことも可能であり、例えば、いわゆるキーワードスポッティング等の手法を用いてマッチングを行なうことも可能である。また、マッチング部255が参照する各種の単語辞書に、後述する「認識重み」情報が付加されている場合には、後述する言語スコアに重みをつけた上で認識結果の順位付けを行なうことも可能である。ここで、上記認識重み情報とは、言語スコアの算出の際に利用される補正係数(重み付け係数)である認識重みが記載されている情報であって、認識重みが大きい値であるほど言語スコアの補正値は大きな値となり、認識結果として採用されやすくなる。例えば、認識重みが10であるキーワードは、認識重みが1であるキーワード(すなわち、重み付けがなされていないキーワード)よりも10倍高い確率で音声認識される。 Note that the matching unit 255 can perform matching using a technique such as a Viterbi decoder based on a beam search or a stack decoder based on an A * search, for example, so-called keyword spotting. It is also possible to perform matching using the above method. In addition, when “recognition weight” information described later is added to various word dictionaries referred to by the matching unit 255, the recognition results may be ranked after weighting a language score described later. Is possible. Here, the recognition weight information is information in which a recognition weight, which is a correction coefficient (weighting coefficient) used when calculating the language score, is described, and the larger the recognition weight, the more the language score The correction value becomes a large value and is easily adopted as a recognition result. For example, a keyword having a recognition weight of 10 is recognized as a voice with a 10 times higher probability than a keyword having a recognition weight of 1 (that is, an unweighted keyword).

なお、認識重みの決定においては、例えば、検索サーバ40から取得したキーワードリストでの順位情報や、音声認識結果の出力中に現れるキーワードの頻度等を利用することが可能である。キーワードリストには、検索サーバ40における上位いくつかの検索キーワードが含まれるため、例えば、一番検索されているキーワードから順に順位付けを行い、順位付けの上位のものから順に、所定の認識重みを付加することが可能である。具体的には、一番検索されているキーワードから順に所定の係数を付加し、付加した係数に正規化したキーワードの頻度を乗じることで、認識重みとすることが可能である。また、検索サーバ40の代わりに、通信網12を介して接続されている任意のサーバ等に記憶されているシソーラス、オントロジーデータベース、百科事典、国語辞書および形態素解析ツール等を利用してもよい。また、検索サーバ40と、上記のシソーラス、オントロジーデータベース、百科事典、国語辞書、形態素解析ツール等とを併用してもよい。   In determining the recognition weight, for example, ranking information in the keyword list acquired from the search server 40, the frequency of keywords appearing during the output of the speech recognition result, and the like can be used. Since the keyword list includes some top search keywords in the search server 40, for example, ranking is performed in order from the most searched keyword, and predetermined recognition weights are set in order from the top ranking. It is possible to add. Specifically, it is possible to obtain a recognition weight by adding a predetermined coefficient in order from the most searched keyword and multiplying the added coefficient by the normalized keyword frequency. Further, instead of the search server 40, a thesaurus, an ontology database, an encyclopedia, a national language dictionary, a morphological analysis tool, or the like stored in an arbitrary server connected via the communication network 12 may be used. The search server 40 may be used in combination with the thesaurus, ontology database, encyclopedia, Japanese dictionary, morphological analysis tool, and the like.

また、認識重みの決定において、音声認識結果のキーワードに関して第1情報処理装置20Aのユーザが検索サーバ40を用いて検索を行ったかどうかという情報や、第1情報処理装置20Aのユーザの嗜好等も利用することが可能である。   In determining the recognition weight, information on whether or not the user of the first information processing apparatus 20A has performed a search using the search server 40 regarding the keyword of the speech recognition result, the user's preference of the first information processing apparatus 20A, and the like. It is possible to use.

認識用データベース257は、マッチング部255が単語列の生成に用いる各種のモデルや規則等を記憶しているデータベースである。この認識用データベース257は、例えば、認識単語辞書記憶部と、音響モデル記憶部と、言語モデル記憶部と、音韻リストと、カナ音韻変換規則と、を含む。マッチング部255は、この認識用データベース309に記載されている各種のデータベースを利用することで、音声認識を行う。   The recognition database 257 is a database that stores various models, rules, and the like used by the matching unit 255 to generate word strings. The recognition database 257 includes, for example, a recognized word dictionary storage unit, an acoustic model storage unit, a language model storage unit, a phoneme list, and a kana phoneme conversion rule. The matching unit 255 performs voice recognition by using various databases described in the recognition database 309.

ここで、認識単語辞書記憶部には、例えば、名詞や動詞といった単語の品詞やジャンル等を記述した属性情報や、言語スコアの算出の際に用いられる単語の重み付け情報や、言語モデル記憶部に記録されている言語モデルに含まれるカテゴリと、そのカテゴリに含まれる単語の情報とが、対応づけて記述されている。   Here, in the recognized word dictionary storage unit, for example, attribute information describing a part of speech or genre of a word such as a noun or a verb, word weighting information used when calculating a language score, a language model storage unit A category included in the recorded language model and information on a word included in the category are described in association with each other.

また、音響モデル記憶部には、音声認識する音声の個々の音韻の音響的な特徴を表す音響モデルが記録されている。ここで、上記の音響モデルとは、母音や子音などの発音記号ごとに、音声の音響的な特徴を表現したモデルであり、入力音声の音声データと認識候補の単語とを、音としての類似性に着目して照合する際に用いられる。音響モデルとしては、例えば、隠れマルコフモデル(Hidden Markov Model:HMM)を用いることが可能であるが、本実施形態に係る音響モデルは、上記のHMMに規定されない。   The acoustic model storage unit stores an acoustic model that represents the acoustic features of individual phonemes of the speech that is recognized. Here, the above acoustic model is a model that expresses the acoustic features of speech for each phonetic symbol such as a vowel or consonant. The speech data of the input speech and the recognition candidate word are similar as sounds. It is used when collating with a focus on sex. As the acoustic model, for example, a Hidden Markov Model (HMM) can be used, but the acoustic model according to the present embodiment is not defined in the above HMM.

言語モデル記憶部は、認識単語辞書記憶部中の各単語辞書に登録されている各単語が、それぞれどのように連鎖するか(接続するか)を示す情報(連鎖情報)を記述している言語モデルを記憶する。記述方法としては、例えば、統計的な単語連鎖確率(n−gramやclass n−gram)、生成文法、有限状態オートマトン(Finite State Automaton:FSA)等がある。   The language model storage unit is a language that describes information (chain information) indicating how each word registered in each word dictionary in the recognized word dictionary storage unit is linked (connected). Remember the model. Examples of the description method include statistical word chain probabilities (n-gram and class n-gram), generation grammar, finite state automaton (FSA), and the like.

音韻リストは、認識用データベース257で使用する音韻記号の一覧である。音韻リストは、1つの音韻(に相当するもの)を1つの記号で表したものである。   The phoneme list is a list of phoneme symbols used in the recognition database 257. The phoneme list represents one phoneme (corresponding to) one symbol.

カナ音韻変換規則とは、カナ文字列を音韻系列に変換するための規則である。カナ音韻変換規則を記憶することによって、認識単語辞書記憶部は、発音情報として、音韻系列とは独立であるカナ文字列を保持することができる。   The kana phoneme conversion rule is a rule for converting a kana character string into a phoneme sequence. By storing the kana phoneme conversion rules, the recognition word dictionary storage unit can hold a kana character string that is independent of the phoneme sequence as pronunciation information.

[ログ情報記憶部225について]
続いて、図4および図5を参照しながら、本実施形態に係るログ情報記憶部225について詳細に説明する。図4は、本実施形態に係るログ情報記憶部225を説明するための説明図であり、図5は、本実施形態に係るログ情報記憶部255に記録されるログ情報の一例を説明するための説明図である。
[About log information storage unit 225]
Next, the log information storage unit 225 according to the present embodiment will be described in detail with reference to FIGS. 4 and 5. FIG. 4 is an explanatory diagram for explaining the log information storage unit 225 according to the present embodiment, and FIG. 5 is for explaining an example of log information recorded in the log information storage unit 255 according to the present embodiment. It is explanatory drawing of.

例えば図4に示したように、本実施形態に係るログ情報記憶部225には、音声認識ログ情報や、キーワード選択ログ情報や、関連キーワード選択ログ情報や、製品レコメンドログ情報等が記録される。   For example, as shown in FIG. 4, the log information storage unit 225 according to the present embodiment records voice recognition log information, keyword selection log information, related keyword selection log information, product recommendation log information, and the like. .

音声認識ログ情報は、キーワード検出部209が音声認識結果の中から検出したキーワードに関するログ情報である。また、音声認識ログ情報には、キーワード検出部209が検出したキーワードに関連づけられていた関連キーワードに関するログ情報が併せて記録されていてもよい。キーワード選択ログ情報は、表示部213に表示されたキーワード等の中から選択されたものに関するログ情報である。関連キーワード選択ログ情報は、キーワード検出部209が検出したキーワードに関連づけられていた関連キーワードの選択に関するログ情報である。製品レコメンドログ情報は、キーワード管理サーバ30から送信された製品のレコメンド情報に関するログ情報である。   The voice recognition log information is log information related to the keyword detected by the keyword detection unit 209 from the voice recognition result. In addition, log information related to related keywords associated with the keywords detected by the keyword detection unit 209 may be recorded in the voice recognition log information. The keyword selection log information is log information related to what is selected from the keywords and the like displayed on the display unit 213. The related keyword selection log information is log information related to selection of a related keyword associated with the keyword detected by the keyword detection unit 209. The product recommendation log information is log information related to product recommendation information transmitted from the keyword management server 30.

これらのログ情報は、各ログ情報に関するキーワード等と、そのキーワードが検出されたり、選択されたりした日時とが、関連づけられて記録されている。また、これらの情報以外にも、様々な情報がキーワードに関連づけられて記録されてもよい。   In these log information, a keyword or the like related to each log information and the date and time when the keyword is detected or selected are associated and recorded. In addition to these pieces of information, various pieces of information may be recorded in association with keywords.

例えば図5に示したように、音声認識ログ情報には、検出されたキーワードと、このキーワードが検出された日時と、このキーワードが検出された音声チャットの会話相手(コミュニティ)に関する情報と、このキーワードに付加されたポイント等とが、互いに関連づけられて記録されている。ここで、音声チャットの会話相手に関する情報は、会話相手のユーザID等の識別データであってもよく、会話相手のユーザ名やニックネーム等であってもよい。また、会話相手の情報処理装置に付与されたIPアドレス等の情報であってもよい。また、音声認識ログ情報には、図5に示した情報だけでなく、キーワードが検出された音声チャットに関する識別情報等が更に付加されていてもよい。   For example, as shown in FIG. 5, the speech recognition log information includes the detected keyword, the date and time when the keyword was detected, information about the conversation partner (community) of the voice chat from which the keyword was detected, Points added to the keywords are recorded in association with each other. Here, the information related to the conversation partner of the voice chat may be identification data such as the user ID of the conversation partner, or the user name or nickname of the conversation partner. Further, it may be information such as an IP address assigned to the information processing apparatus of the conversation partner. Further, not only the information shown in FIG. 5 but also identification information related to the voice chat in which the keyword is detected may be further added to the voice recognition log information.

キーワード選択ログ情報や、関連キーワード選択ログ情報や、製品レコメンドログ情報等は、例えば、図5に示した音声認識ログ情報と同様のデータ構造を有していてもよく、各ログ情報に特有のデータ構造を有していてもよい。   The keyword selection log information, the related keyword selection log information, the product recommendation log information, etc., for example, may have the same data structure as the voice recognition log information shown in FIG. 5, and are specific to each log information. It may have a data structure.

なお、第2情報処理装置20Bの構成は、第1情報処理装置20Aの構成と実質的に同一であるので、説明を省略する。   Note that the configuration of the second information processing apparatus 20B is substantially the same as the configuration of the first information processing apparatus 20A, and thus the description thereof is omitted.

以上、本実施形態に係る情報処理装置20の機能の一例を示した。上記の各構成要素は、汎用的な部材や回路を用いて構成されていてもよいし、各構成要素の機能に特化したハードウェアにより構成されていてもよい。また、各構成要素の機能を、CPU等が全て行ってもよい。従って、本実施形態を実施する時々の技術レベルに応じて、適宜、利用する構成を変更することが可能である。   Heretofore, an example of the function of the information processing apparatus 20 according to the present embodiment has been shown. Each component described above may be configured using a general-purpose member or circuit, or may be configured by hardware specialized for the function of each component. In addition, the CPU or the like may perform all functions of each component. Therefore, it is possible to appropriately change the configuration to be used according to the technical level at the time of carrying out the present embodiment.

なお、上記の表示制御部211、詳細情報検索部217、ポイント算出部219等は、それぞれの機能に特化したハードウェアにより構成されていてもよく、音声認識プログラム等のアプリケーションプログラムとして提供されてもよい。   The display control unit 211, the detailed information search unit 217, the point calculation unit 219 and the like may be configured by hardware specialized for each function, and are provided as application programs such as a voice recognition program. Also good.

また、音声認識部203は、音声チャットの会話相手である第2情報処理装置20から音声データを取得して、音声チャットの会話相手がしゃべった会話内容の音声認識をしてもよい。さらに、キーワード検出部209は、会話相手がしゃべった内容の音声認識結果からキーワードを検出し、検出結果について、ログ情報記憶部225に記録してもよい。また、ポイント算出部219は、音声チャットの会話相手がしゃべった会話内容から検出されたキーワード等に対して、ポイント算出処理を行ってもよい。   In addition, the voice recognition unit 203 may acquire voice data from the second information processing apparatus 20 that is a voice chat conversation partner, and may perform voice recognition of the conversation contents spoken by the voice chat conversation partner. Further, the keyword detection unit 209 may detect a keyword from the speech recognition result of the content spoken by the conversation partner, and record the detection result in the log information storage unit 225. Further, the point calculation unit 219 may perform a point calculation process on a keyword or the like detected from the conversation contents spoken by the voice chat conversation partner.

<音声認識部203における音声認識処理について>
続いて、図5を参照しながら、本実施形態に係る音声認識部203における音声認識処理について、詳細に説明する。図5は、本実施形態に係る音声認識処理の一例を説明するための流れ図である。
<About the voice recognition processing in the voice recognition unit 203>
Next, the speech recognition process in the speech recognition unit 203 according to the present embodiment will be described in detail with reference to FIG. FIG. 5 is a flowchart for explaining an example of the voice recognition processing according to the present embodiment.

以下で説明する音声認識処理は、第1情報処理装置20Aのユーザからマイクロフォン等の音声入力部201に音声が入力されたとき、開始される。   The voice recognition process described below is started when voice is input to the voice input unit 201 such as a microphone from the user of the first information processing apparatus 20A.

音声入力部201で生成された音声信号は、まず、AD変換部251により、ディジタル信号である音声データに変換され、特徴パラメータ抽出部253に伝送される(ステップS101)。この際、AD変換部251は、生成した音声データを、記憶部223に記憶してもよい。次に、音声データが伝送された特徴パラメータ抽出部253は、伝送された音声データからメルケプストラム等の特徴量を抽出する(ステップS103)。特徴パラメータの抽出には、例えば、ケプストラム分析や、線形予測分析や、MFCC係数等を用いた聴覚フィルタに基づく分析等、各種の分析方法を用いることが可能である。また、特徴パラメータ抽出部253は、音声データから抽出した各種の特徴パラメータを、記憶部223に記憶してもよい。   The voice signal generated by the voice input unit 201 is first converted into voice data that is a digital signal by the AD conversion unit 251 and transmitted to the feature parameter extraction unit 253 (step S101). At this time, the AD conversion unit 251 may store the generated audio data in the storage unit 223. Next, the feature parameter extraction unit 253 to which the voice data is transmitted extracts a feature quantity such as a mel cepstrum from the transmitted voice data (step S103). For the feature parameter extraction, various analysis methods such as cepstrum analysis, linear prediction analysis, and analysis based on an auditory filter using MFCC coefficients can be used. The feature parameter extraction unit 253 may store various feature parameters extracted from the audio data in the storage unit 223.

特徴パラメータ抽出部253において特徴量が抽出されると、マッチング部255は、認識用データベース257の認識単語辞書記憶部に記憶されている認識単語辞書を参照し、この辞書においてシンボルで表される単語のいくつかを連結し、単語列を生成する(ステップS105)。その後、マッチング部255は、生成した単語列について、認識用データベース257中の音響モデル記憶部に記憶されている音響モデルに基づいて、音響スコアを計算する(ステップS105)。ここで、音響スコアとは、音声認識結果の候補である単語列と入力音声とが、音として(音響的に)どれだけ近いかを表すスコアであり、音響スコアが高いほど、生成した単語列が、入力音声に音響的に近いことを意味する。   When the feature amount is extracted by the feature parameter extraction unit 253, the matching unit 255 refers to the recognition word dictionary stored in the recognition word dictionary storage unit of the recognition database 257, and the word represented by the symbol in this dictionary Are connected to generate a word string (step S105). Thereafter, the matching unit 255 calculates an acoustic score for the generated word string based on the acoustic model stored in the acoustic model storage unit in the recognition database 257 (step S105). Here, the acoustic score is a score that represents how close (acoustically) a word string that is a candidate of the speech recognition result and the input voice are (acoustically) as sound, and the higher the acoustic score, the generated word string Means acoustically close to the input voice.

特徴パラメータに基づいて音響スコアが計算されると、マッチング部255は、得られた音響スコアに基づいて、音響スコアの高い単語列を所定の個数選択する(ステップS107)。なお、マッチング部255は、算出した音響スコアや、選択した単語列等を、記憶部223に記憶してもよい。   When the acoustic score is calculated based on the feature parameter, the matching unit 255 selects a predetermined number of word strings having a high acoustic score based on the obtained acoustic score (step S107). Note that the matching unit 255 may store the calculated acoustic score, the selected word string, and the like in the storage unit 223.

音響スコアの算出が終了すると、マッチング部255は、ステップS107で選択した各単語列の言語スコアを、認識用データベース257中の言語モデル記憶部に記憶されている言語モデルを用いて計算する(ステップS109)。例えば、言語モデル記憶部に記憶されている各種の言語モデルの中から、文法や有限状態オートマンを使用している場合には、単語列がその言語モデルで受理することができるとき、言語スコアは「1」であり、受理することができないとき、言語スコアは「0」である。   When the calculation of the acoustic score is completed, the matching unit 255 calculates the language score of each word string selected in Step S107 using the language model stored in the language model storage unit in the recognition database 257 (Step S107). S109). For example, when using grammar or finite state automan from various language models stored in the language model storage unit, the language score can be obtained when the word string can be accepted by the language model. Is “1” and when it cannot be accepted, the language score is “0”.

なお、マッチング部255は、生成された単語列を言語モデルが受理することができるとき、ステップS107で選択した単語列を残してもよく、生成された単語列を言語も出るが受理することができないとき、ステップS107で選択した単語列を削除してもよい。   Note that when the language model can accept the generated word string, the matching unit 255 may leave the word string selected in step S107 and accept the generated word string although the language is also available. If not, the word string selected in step S107 may be deleted.

また、言語モデルとして、n−gramやclass n−gramのような統計言語モデルを使用している場合、その単語列の生成確率を言語スコアとする。なお、マッチング部255は、算出した言語スコア等を、記憶部223に記憶してもよい。   When a statistical language model such as n-gram or class n-gram is used as the language model, the generation probability of the word string is used as the language score. Note that the matching unit 255 may store the calculated language score or the like in the storage unit 223.

なお、本実施形態に係る言語モデルは、認識用データベース309内の認識単語辞書記憶部401に記憶されている固定単語辞書や可変単語辞書を用いて言語スコアの算出を行うが、可変単語辞書には、時代とともに変化する固有名詞などが随時更新されながら記述されているために、音声チャット等で話題になることが多い単語についても、言語スコアの算出対象とすることが可能となる。   The language model according to the present embodiment calculates a language score using a fixed word dictionary and a variable word dictionary stored in the recognition word dictionary storage unit 401 in the recognition database 309. Since the proper nouns that change with the times are described as they are updated, words that are frequently talked about in voice chat or the like can also be used as the language score calculation target.

音響スコアと言語スコアの双方の算出が終了すると、マッチング部255は、ステップS105で計算された音響スコアと、ステップS109で計算された言語スコアを統合して各単語列をソートし、例えば、統合したスコアの一番大きい単語列を認識結果として決定する(ステップS111)。すなわち、マッチング部255は、例えば、音響モデルから得られた音響スコアと言語モデルから得られた言語スコアとの積や、音響スコアの対数と言語スコアの対数との和等を最大とするような単語列を、認識結果として決定する。また、言語モデルで用いた各種の単語辞書に、単語の認識重み情報が付加されている場合には、認識重み情報を加味した言語スコアを利用してもよい。   When the calculation of both the acoustic score and the language score is completed, the matching unit 255 sorts each word string by integrating the acoustic score calculated in step S105 and the language score calculated in step S109. The word string with the largest score is determined as a recognition result (step S111). That is, for example, the matching unit 255 maximizes the product of the acoustic score obtained from the acoustic model and the language score obtained from the language model, the sum of the logarithm of the acoustic score and the logarithm of the language score, or the like. A word string is determined as a recognition result. In addition, when word recognition weight information is added to various word dictionaries used in the language model, a language score in consideration of the recognition weight information may be used.

これにより、音響的にも言語的にも最もふさわしい単語列が認識結果として決定される。最もふさわしい単語列が認識結果として決定されると、マッチング部255は、決定した認識結果を、キーワード検出部209へと伝達する(ステップS113)。また、マッチング部255は、決定した認識結果である単語列を、記憶部223に記憶してもよい。   As a result, the most appropriate word string acoustically and linguistically is determined as the recognition result. When the most appropriate word string is determined as the recognition result, the matching unit 255 transmits the determined recognition result to the keyword detection unit 209 (step S113). Further, the matching unit 255 may store the word string that is the determined recognition result in the storage unit 223.

<表示部213に表示される内容について>
続いて、図7Aおよび図7Bを参照しながら、本実施形態に係る情報処理装置20の表示部213に表示される内容について、詳細に説明する。図7Aおよび図7Bは、本実施形態に係る表示部213に表示される内容について説明するための説明図である。
<About contents displayed on display unit 213>
Next, the contents displayed on the display unit 213 of the information processing apparatus 20 according to the present embodiment will be described in detail with reference to FIGS. 7A and 7B. 7A and 7B are explanatory diagrams for explaining the contents displayed on the display unit 213 according to the present embodiment.

例えば図7Aに示したように、音声認識部203により音声認識され、キーワード検出部209により検出されたキーワードは、表示部213の表示画面261内に、キーワード表示ウィンドウ263として表示される。このキーワード表示ウィンドウ263は、音声認識結果の中にキーワードが検出される毎に、新たなウィンドウが生成されていく。また、検出されたキーワードと、このキーワードが検出された日時とが関連付けられ、ログ情報として、ログ情報記憶部225に記録される。   For example, as shown in FIG. 7A, the keywords recognized by the voice recognition unit 203 and detected by the keyword detection unit 209 are displayed as a keyword display window 263 in the display screen 261 of the display unit 213. This keyword display window 263 is generated a new window every time a keyword is detected in the speech recognition result. Further, the detected keyword is associated with the date and time when the keyword is detected, and is recorded in the log information storage unit 225 as log information.

各ウィンドウ263に表示される内容は、例えば図7Bに示したように、検出されたキーワードが表示される検出キーワード表示領域265と、検出されたキーワードに関連づけられた関連キーワードが表示される関連キーワード表示領域267と、検出されたキーワードを検索サーバ40によって検索することで得られる関連記事が表示される関連記事表示領域269と、キーワード管理サーバ30から送信されるキーワードに関連する製品の情報が表示される製品情報表示領域271と、を含む。   As shown in FIG. 7B, for example, the contents displayed in each window 263 include a detected keyword display area 265 in which the detected keyword is displayed, and a related keyword in which a related keyword associated with the detected keyword is displayed. A display area 267, a related article display area 269 in which a related article obtained by searching the detected keyword by the search server 40 is displayed, and product information related to the keyword transmitted from the keyword management server 30 are displayed. Product information display area 271 to be displayed.

各表示領域に表示されている内容には、当該内容に関する詳細情報が記載されているURL等のメタデータがリンクされており、情報処理装置20のユーザは、カーソルキーやマウスポインタ等の位置特定オブジェクトを操作し、これらの表示領域をクリック等することで、各表示領域に表示されている内容を選択することが可能である。   The contents displayed in each display area are linked with metadata such as a URL in which detailed information related to the contents is described, and the user of the information processing device 20 can specify the position of a cursor key, a mouse pointer, or the like. By operating the object and clicking these display areas, it is possible to select the contents displayed in each display area.

また、各ウィンドウ263の表示形式は上述の場合に限られるわけではなく、例えば、各ウィンドウ263には検出されたキーワード265と検出されたキーワードに関連付けられた関連キーワード267のみが表示され、キーワード265がクリック等により選択された場合に、選択されたキーワードに関連する関連記事269や製品情報271が新たに表示されるようにしてもよい。   The display format of each window 263 is not limited to the above case. For example, only the detected keyword 265 and the related keyword 267 associated with the detected keyword are displayed in each window 263, and the keyword 265 is displayed. When is selected by clicking or the like, related articles 269 and product information 271 related to the selected keyword may be newly displayed.

<キーワード管理サーバ30の構成について>
続いて、図8を参照しながら、本実施形態に係るキーワード管理サーバ30の構成について、詳細に説明する。図8は、本実施形態に係るキーワード管理サーバ30の構成について説明するためのブロック図である。
<Configuration of Keyword Management Server 30>
Next, the configuration of the keyword management server 30 according to the present embodiment will be described in detail with reference to FIG. FIG. 8 is a block diagram for explaining the configuration of the keyword management server 30 according to the present embodiment.

本実施形態に係るキーワード管理サーバ30は、例えば図8に示したように、キーワード集計部301と、関連キーワード登録部303と、製品レコメンド部305と、通信部307と、記憶部309と、を主に備える。   For example, as shown in FIG. 8, the keyword management server 30 according to the present embodiment includes a keyword totaling unit 301, a related keyword registration unit 303, a product recommendation unit 305, a communication unit 307, and a storage unit 309. Prepare mainly.

キーワード集計部301は、通信網12を介してキーワード管理サーバ30に接続されている情報処理装置20に記憶されているログ情報を取得して、ログ情報に記載されているキーワードの集計を行う。ここで、キーワードの集計とは、各情報処理装置20から取得したログ情報に記載されているキーワードを収集するとともに、各キーワードに関連づけられているポイントを収集することを意味する。キーワード集計部301は、異なる情報処理装置20から取得したログ情報の中に同一のキーワードが存在する場合には、各情報処理装置20から取得したポイントをそれぞれ加算して、集計後の当該キーワードに関連づけられたポイントとする。   The keyword totaling unit 301 acquires log information stored in the information processing apparatus 20 connected to the keyword management server 30 via the communication network 12 and totals the keywords described in the log information. Here, the totaling of keywords means that the keywords described in the log information acquired from each information processing apparatus 20 are collected and the points associated with each keyword are collected. When the same keyword exists in log information acquired from different information processing apparatuses 20, the keyword totaling unit 301 adds points acquired from the respective information processing apparatuses 20, and adds the acquired points to the calculated keywords. Let the associated point.

キーワード集計部301によるキーワードの集計結果は、後述する記憶部309に記録される。また、キーワードの集計結果は、後述する関連キーワード登録部303および製品レコメンド部305に伝送され、各処理部で実行される処理に用いられる。また、キーワード集計部301は、各情報処理装置20から取得した集計前のログ情報を、関連キーワード登録部303および製品レコメンド部305に伝送してもよい。なお、キーワード集計部301が実行するキーワード集計処理については、以下で改めて詳細に説明する。   The keyword totaling result by the keyword totaling unit 301 is recorded in the storage unit 309 described later. Further, the result of the keyword aggregation is transmitted to a related keyword registration unit 303 and a product recommendation unit 305, which will be described later, and is used for processing executed by each processing unit. In addition, the keyword totaling unit 301 may transmit the log information before aggregation acquired from each information processing apparatus 20 to the related keyword registration unit 303 and the product recommendation unit 305. The keyword totaling process executed by the keyword totaling unit 301 will be described in detail later.

関連キーワード登録部303は、キーワード集計部301から伝送されたキーワードの集計結果に基づいて、後述する記憶部309に記録されているキーワードリストに関連キーワードを追加登録する。また、キーワードリストが更新されると、関連キーワード登録部303は、更新後のキーワードリストを各情報処理装置20に送信してもよい。また、関連キーワード登録部303は、情報処理装置20から送信されたキーワードリストの取得要求に応じて、記憶部309に記録されているキーワードリストを、情報処理装置20に送信してもよい。なお、関連キーワード登録部303が実行する関連キーワードの登録処理については、以下で改めて詳細に説明する。   The related keyword registration unit 303 additionally registers a related keyword in a keyword list recorded in the storage unit 309 described later, based on the keyword aggregation result transmitted from the keyword aggregation unit 301. Further, when the keyword list is updated, the related keyword registration unit 303 may transmit the updated keyword list to each information processing apparatus 20. Further, the related keyword registration unit 303 may transmit the keyword list recorded in the storage unit 309 to the information processing device 20 in response to the keyword list acquisition request transmitted from the information processing device 20. The related keyword registration process executed by the related keyword registration unit 303 will be described in detail later.

製品レコメンド部305は、後述する記憶部309に記録されている製品リストを参照し、キーワード集計部301から伝送された各情報処理装置20から取得したログ情報や、キーワードの集計結果に記載されているキーワードが製品リストに記載されているかどうかを検索する。製品リストには、一のキーワードに対して、このキーワードと関連のある製品に関する情報が複数関連づけられている。ここで、製品に関する情報としては、例えば、製品名や製品の型番や製品を紹介しているホームページのURL等を挙げることができる。   The product recommendation unit 305 refers to a product list recorded in the storage unit 309, which will be described later, and is described in the log information acquired from each information processing device 20 transmitted from the keyword totaling unit 301 or the keyword totaling result. To find out if the keyword is listed in the product list. In the product list, a plurality of pieces of information related to products related to the keyword are associated with one keyword. Here, examples of the information on the product include a product name, a product model number, and a URL of a home page introducing the product.

製品レコメンド部305は、製品リストと、ログ情報やログ情報の集計結果とを比較した結果、製品リストに登録されているキーワードがログ情報等の中に存在していた場合には、キーワードに関連づけられている製品に関する情報を、当該キーワードを検出した情報処理装置20に対して通知する。   The product recommendation unit 305 compares the product list with the log information and the total result of the log information. If the keyword registered in the product list exists in the log information or the like, the product recommendation unit 305 associates the keyword with the keyword. Information about the product being used is notified to the information processing apparatus 20 that has detected the keyword.

また、製品レコメンド部305は、製品リストに登録されている製品に関する情報(例えば、製品名や製品の略称や愛称や製品の型番等)を関連キーワードとして情報処理装置20に通知し、情報処理装置20のウィンドウに表示させてもよい。   Further, the product recommendation unit 305 notifies the information processing apparatus 20 of information related to the products registered in the product list (for example, product names, product abbreviations, nicknames, product model numbers, etc.) as related keywords, and the information processing apparatus You may display on 20 windows.

通信部307は、キーワード管理サーバ30に設けられた通信装置であって、キーワード管理サーバ30の各処理部が、通信網12を介して各情報処理装置20と行う情報の送受信を、仲介する。なお、通信部307は、通信網12を介さずに、キーワード管理サーバ30に直接接続されている各情報処理装置等に対して、情報の送受信を行うことも可能である。   The communication unit 307 is a communication device provided in the keyword management server 30 and mediates transmission / reception of information performed by each processing unit of the keyword management server 30 with each information processing device 20 via the communication network 12. Note that the communication unit 307 can transmit / receive information to / from each information processing apparatus or the like directly connected to the keyword management server 30 without using the communication network 12.

記憶部309は、例えばキーワード管理サーバ30に設けられたストレージ装置であって、キーワードリストや、キーワード集計部301が集計したログ情報に関する集計結果や、キーワードと製品に関する情報とが関連づけられた製品リスト等を記憶する。また、これらのデータベース以外にも、キーワード管理サーバ30が利用可能な各種のデータベース等を記憶することも可能である。更に、これらのデータ以外にも、キーワード管理サーバ30が、何らかの処理を行う際に保存する必要が生じた様々なパラメータや処理の途中経過等を、適宜記憶することが可能である。この記憶部309は、キーワード集計部301、関連キーワード登録部303、製品レコメンド部305等が、自由に読み書きを行うことが可能である。   The storage unit 309 is, for example, a storage device provided in the keyword management server 30, and includes a keyword list, an aggregation result regarding log information aggregated by the keyword aggregation unit 301, and a product list in which keywords and information regarding products are associated with each other. Memorize etc. In addition to these databases, various databases that can be used by the keyword management server 30 can also be stored. Furthermore, in addition to these data, the keyword management server 30 can appropriately store various parameters that need to be saved when performing some processing, the progress of processing, and the like. The storage unit 309 can be freely read and written by the keyword totaling unit 301, the related keyword registration unit 303, the product recommendation unit 305, and the like.

なお、記憶部309に記録されているキーワードリストや製品リストは、キーワード管理サーバ30が検索サーバ40等を参照して所定の間隔で更新してもよい。また、キーワードリストや製品リストは、キーワード管理サーバ30の管理者により更新されてもよい。   The keyword list and product list recorded in the storage unit 309 may be updated by the keyword management server 30 at predetermined intervals with reference to the search server 40 or the like. The keyword list and product list may be updated by the administrator of the keyword management server 30.

<キーワードの集計処理について>
続いて、図9A〜図9Dを参照しながら、本実施形態に係るキーワード管理サーバ30によるキーワードの集計処理について、詳細に説明する。図9Aは、本実施形態に係るキーワード管理サーバ30が行うログ情報取得処理について説明するための説明図である。図9Bは、本実施形態に係るキーワード管理サーバ30が行ったキーワードの集計結果を取得する画面の一例について説明するための説明図である。図9Cおよび図9Dは、キーワードの集計結果の表示例を説明するための説明図である。
<Keyword aggregation process>
Next, the keyword aggregation processing by the keyword management server 30 according to the present embodiment will be described in detail with reference to FIGS. 9A to 9D. FIG. 9A is an explanatory diagram for describing log information acquisition processing performed by the keyword management server 30 according to the present embodiment. FIG. 9B is an explanatory diagram for describing an example of a screen for acquiring a keyword aggregation result performed by the keyword management server 30 according to the present embodiment. FIG. 9C and FIG. 9D are explanatory diagrams for explaining a display example of a keyword totaling result.

例えば図9Aに示したように、キーワード管理サーバ30のキーワード集計部301は、各情報処理装置20に記録されているログ情報を取得して、取得したログ情報に記録されている音声認識ログ情報、キーワード選択ログ情報、関連キーワード選択ログ情報および製品レコメンドログ情報を記憶部309に記録する。   For example, as illustrated in FIG. 9A, the keyword totaling unit 301 of the keyword management server 30 acquires log information recorded in each information processing apparatus 20, and voice recognition log information recorded in the acquired log information The keyword selection log information, the related keyword selection log information, and the product recommendation log information are recorded in the storage unit 309.

その後、キーワード集計部301は、それぞれのログ情報に記録されているキーワードや製品に関する情報を、ログ情報の種類毎に集計していき、集計結果として記憶部309に記録する。   Thereafter, the keyword totaling unit 301 totals the information on the keywords and products recorded in the respective log information for each type of log information, and records the totaled result in the storage unit 309.

また、音声認識ログ情報、キーワード選択ログ情報および関連キーワード選択ログ情報に記載されているキーワードや、これらのキーワードに関連づけられたポイント等の、ログ情報に記載されている全ての情報は、キーワード管理サーバ30が管理しているキーワードリストや製品リストの更新等に利用されてもよい。また、製品レコメンドログ情報に記録されている情報も、製品に関する情報を更新するために利用されてもよい。   In addition, all the information described in the log information, such as the keywords described in the speech recognition log information, the keyword selection log information and the related keyword selection log information, and the points associated with these keywords, It may be used for updating a keyword list or a product list managed by the server 30. Information recorded in the product recommendation log information may also be used to update information about the product.

また、キーワード管理サーバ30上で集計されたキーワード等に関する情報は、情報処理装置20が自由に取得することができる。例えば図9Bに示したように、情報処理装置20の表示部213に表示される検索ウィンドウ275の条件記入欄277に、キーワードの集計結果を検索するための条件を入力して、「表示開始」オブジェクト279を選択することで、情報処理装置20はキーワード管理サーバ30から集計結果を取得することができる。ここで、条件記入欄277に入力される条件の一例として、例えば、「条件なし(すなわち、全て表示)」、「日付」に基づいた検索、「音声チャットの相手」に基づいた検索、「地域情報」に基づいた検索等を挙げることができる。これらの検索条件以外にも、情報処理装置20のユーザが任意の検索条件を記入することが可能である。   In addition, information regarding keywords and the like collected on the keyword management server 30 can be freely acquired by the information processing apparatus 20. For example, as shown in FIG. 9B, a condition for searching for the keyword aggregation result is input to the condition entry field 277 of the search window 275 displayed on the display unit 213 of the information processing apparatus 20. By selecting the object 279, the information processing apparatus 20 can acquire the aggregation result from the keyword management server 30. Here, as an example of the condition input in the condition entry field 277, for example, “no condition (that is, display all)”, search based on “date”, search based on “voice chat partner”, “region” A search based on “information” can be cited. In addition to these search conditions, the user of the information processing apparatus 20 can enter an arbitrary search condition.

例えば日付を検索条件とした場合には、図9Cに示したように、検索条件を満たすキーワードが、そのキーワードに関連づけられたポイントの大きさに応じてランキング形式で表示される。また、例えば音声チャットの相手を検索条件とした場合には、図9Dに示したように、検索条件を満たすキーワードが、そのキーワードに関連づけられたポイントの大きさに応じてランキング形式で表示される。   For example, when the date is used as a search condition, as shown in FIG. 9C, keywords that satisfy the search condition are displayed in a ranking format according to the size of points associated with the keyword. For example, when a voice chat partner is used as a search condition, as shown in FIG. 9D, keywords that satisfy the search condition are displayed in a ranking format according to the size of points associated with the keyword. .

このように、本実施形態に係る音声チャットシステムでは、特定の条件を満たすキーワードを容易に検索することが可能であるため、情報処理装置20のユーザは、どのような内容を、どのような相手とどれくらいの頻度で音声チャットを行ったのかを、容易に知ることができる。すなわち、かかる検索処理を行うことで、情報処理装置20のユーザは、音声チャットのログに占める特定のトピックの割合を容易に知ることができる。   As described above, in the voice chat system according to the present embodiment, it is possible to easily search for a keyword that satisfies a specific condition. You can easily know how often you used voice chat. That is, by performing such search processing, the user of the information processing apparatus 20 can easily know the proportion of a specific topic in the voice chat log.

<関連キーワードの登録処理について>
続いて、図10Aおよび図10Bを参照しながら、本実施形態に係るキーワード管理サーバ30で実行される関連キーワードの登録処理について、詳細に説明する。図10Aは、本実施形態に係るキーワード管理サーバ30が実行する関連キーワードの登録処理について説明するための説明図であり、図10Bは、本実施形態に係るキーワード管理サーバ30が実行する関連キーワードの登録処理について説明するための流れ図である。
<Registering related keywords>
Next, the related keyword registration process executed by the keyword management server 30 according to the present embodiment will be described in detail with reference to FIGS. 10A and 10B. FIG. 10A is an explanatory diagram for describing a related keyword registration process executed by the keyword management server 30 according to the present embodiment, and FIG. 10B shows related keyword execution executed by the keyword management server 30 according to the present embodiment. It is a flowchart for demonstrating a registration process.

まず、キーワード管理サーバ30のキーワード集計部301は、図9Aに示したように各情報処理装置20からログ情報を取得する(ステップS201)。続いて、関連キーワード登録部303は、取得したログ情報に基づいて、キーワードのジャンル毎に関連語群リスト351を生成する(ステップS203)。例えば、図10Aに示したように、「野球」というジャンルに関連づけられたキーワードA〜キーワードFがまとめられ、野球というジャンルの関連語群リスト351が生成される。同様にして、「サッカー」というジャンルに関連づけられたキーワードa〜キーワードfがまとめられ、サッカーというジャンルの関連語群リスト351が生成される。   First, the keyword totaling unit 301 of the keyword management server 30 acquires log information from each information processing apparatus 20 as shown in FIG. 9A (step S201). Subsequently, the related keyword registration unit 303 generates a related word group list 351 for each keyword genre based on the acquired log information (step S203). For example, as shown in FIG. 10A, the keywords A to F associated with the genre “baseball” are collected, and a related word group list 351 of the genre “baseball” is generated. Similarly, the keywords a to f associated with the genre “soccer” are collected, and a related word group list 351 of the genre “soccer” is generated.

次に、キーワード管理サーバ30の関連キーワード登録部303は、記憶部309に記録されている集計結果や検索サーバ40を参照して、キーワード検索ランキングに記載されている上位キーワードを検索する(ステップS205)。関連キーワード登録部303は、検索した上記キーワードの中に生成した関連語群リスト351に記載されたキーワードがあるか否かを判断する(ステップS207)。関連語群リスト351中に上位選択キーワードがあった場合には、上位選択キーワードに存在した関連語群リスト351中の単語を、他の関連語群の関連キーワードに登録して(ステップS209)、キーワードリストを更新する。また、関連語群リスト351中に上位選択キーワードがなかった場合には、関連キーワード登録部303は、登録処理を終了する。   Next, the related keyword registration unit 303 of the keyword management server 30 searches the high-order keywords described in the keyword search ranking with reference to the tabulation results recorded in the storage unit 309 and the search server 40 (step S205). ). The related keyword registration unit 303 determines whether there is a keyword described in the generated related word group list 351 among the searched keywords (step S207). If there is an upper selection keyword in the related word group list 351, the word in the related word group list 351 that exists in the upper selection keyword is registered in the related keyword of another related word group (step S209). Update the keyword list. If there is no higher selection keyword in the related word group list 351, the related keyword registration unit 303 ends the registration process.

例えば、図10Aに示した野球に関する関連語群リスト351のうち、キーワードAおよびキーワードBが上位選択キーワードであった場合には、キーワードC〜キーワードFの関連キーワードとしてキーワードAとキーワードBとを関連づけ、キーワードリストを更新する。また、図10Aに示したサッカーに関する関連語群リスト351のうち、キーワードcおよびキーワードeが上位選択キーワードであった場合には、キーワードa、キーワードb、キーワードdおよびキーワードfの関連キーワードとしてキーワードcとキーワードeとを関連づけ、キーワードリストを更新する。   For example, in the related word group list 351 related to baseball shown in FIG. 10A, when the keyword A and the keyword B are higher selection keywords, the keyword A and the keyword B are associated as related keywords of the keywords C to F. , Update the keyword list. In addition, in the related word group list 351 related to soccer shown in FIG. 10A, when the keyword c and the keyword e are the top selection keywords, the keyword c is used as the related keyword of the keyword a, the keyword b, the keyword d, and the keyword f. And the keyword e are associated, and the keyword list is updated.

上述のような処理で生成された新たなキーワードリストは、情報処理装置20へと送信され、情報処理装置20のキーワードリスト記憶部227に記憶される。   The new keyword list generated by the processing as described above is transmitted to the information processing apparatus 20 and stored in the keyword list storage unit 227 of the information processing apparatus 20.

このような処理を行うことで、例えば野球に関するキーワードCがキーワード検出部209により検出された際には、キーワードAおよびキーワードBが関連キーワードとして併せて表示されることとなる。   By performing such processing, for example, when the keyword C relating to baseball is detected by the keyword detection unit 209, the keyword A and the keyword B are displayed together as related keywords.

また、キーワード管理サーバ30の関連キーワード登録部303は、同一のチャット内で共にポイントが高いキーワードを、関連キーワードとして登録してもよい。例えば、キーワード管理サーバ30のキーワード集計部301がチャットごとにキーワードのポイントを集計した結果、「車」というジャンルに属するキーワードと共に「環境」というジャンルに属するキーワードに高いポイントがついているチャットが所定数存在する場合には、関連キーワード登録部303は、「車」と「環境」というキーワードは関連性が高い(すなわち、「車」の話題は「環境」の話題と供に話されることが多い)と判断し、互いのジャンルに属するキーワードを関連キーワードとして登録してもよい。   Further, the related keyword registration unit 303 of the keyword management server 30 may register keywords having high points in the same chat as related keywords. For example, as a result of the keyword totaling unit 301 of the keyword management server 30 totaling keyword points for each chat, a predetermined number of chats with high keywords for keywords belonging to the genre “environment” together with keywords belonging to the genre “car” If there is, the related keyword registration unit 303 is highly related to the keywords “car” and “environment” (that is, the topic of “car” is often spoken with the topic of “environment”. And keywords belonging to each other's genres may be registered as related keywords.

<情報処理装置20の変形例>
続いて、図11A〜図11Dを参照しながら、本実施形態に係る情報処理装置20の変形例について、簡単に説明する。図11Aは、本実施形態に係る情報処理装置の音声認識方法を説明するための簡略化されたブロック図である。図11B〜図11Dは、本実施形態に係る情報処理装置の音声認識方法の各変形例を説明するための簡略化されたブロック図である。なお、図11A〜図11Dにおいては、本実施形態における情報処理装置20の一部の処理部のみを記載しているが、図11A〜図11Dに記載されている各情報処理装置では、図示されている処理部以外にも、例えば図2に示した処理部が設けられていることは言うまでもない。
<Modification of Information Processing Device 20>
Subsequently, a modification of the information processing apparatus 20 according to the present embodiment will be briefly described with reference to FIGS. 11A to 11D. FIG. 11A is a simplified block diagram for explaining the speech recognition method of the information processing apparatus according to the present embodiment. FIG. 11B to FIG. 11D are simplified block diagrams for explaining modifications of the speech recognition method of the information processing apparatus according to the present embodiment. 11A to 11D illustrate only a part of the processing units of the information processing apparatus 20 in the present embodiment, but are illustrated in the information processing apparatuses illustrated in FIGS. 11A to 11D. It goes without saying that, for example, the processing unit shown in FIG. 2 is provided in addition to the processing unit.

前述の本実施形態に係る情報処理装置20の説明では、図11Aに示したように、音声チャットを行っている第1情報処理装置20Aおよび第2情報処理装置20Bのそれぞれが、ユーザの発した声を取り込んで音声認識部203において音声認識し、キーワード検出部209により検出されたキーワードがログ情報記憶部225に記録される場合について説明したが、本実施形態に係る情報処理装置20では、以下のような変形例も実施可能である。   In the description of the information processing apparatus 20 according to the above-described embodiment, as illustrated in FIG. 11A, each of the first information processing apparatus 20A and the second information processing apparatus 20B that performs voice chat is issued by the user. The case where the voice is captured and recognized by the speech recognition unit 203 and the keyword detected by the keyword detection unit 209 is recorded in the log information storage unit 225 has been described. In the information processing apparatus 20 according to the present embodiment, Such a modification can also be implemented.

[第1変形例]
図11Bに示した第1変形例では、音声チャットを行っている情報処理装置20A,20Bは、それぞれ情報処理装置のユーザが発した声はそのまま相手の情報処理装置へと伝送し、相手の情報処理装置のユーザが発した声を音声認識して出力する場合を示している。すなわち、例えば第1情報処理装置20Aのユーザが発した声は、そのまま音声会話制御部205および通信部221を介して第2情報処理装置20Bに伝送され、第2情報処理装置20Bにより音声認識されて出力される。同様に、第2情報処理装置20Bのユーザが発した声は、そのまま音声会話制御部205および通信部221を介して第1情報処理装置20Aに伝送され、第1情報処理装置20Aにより音声認識されて出力される。本変形例においては、第1情報処理装置20Aおよび第2情報処理装置20Bのそれぞれにおいて、音声認識およびキーワード検出がなされ、キーワードに関する情報がログ情報記憶部225に記録される。
[First Modification]
In the first modification shown in FIG. 11B, each of the information processing apparatuses 20A and 20B that conducts a voice chat transmits the voice uttered by the user of the information processing apparatus to the other information processing apparatus as it is, and information on the other party The case where the voice which the user of the processing apparatus uttered is recognized and output is shown. That is, for example, a voice uttered by the user of the first information processing apparatus 20A is transmitted as it is to the second information processing apparatus 20B via the voice conversation control unit 205 and the communication unit 221 and is recognized by the second information processing apparatus 20B. Is output. Similarly, the voice uttered by the user of the second information processing device 20B is directly transmitted to the first information processing device 20A via the voice conversation control unit 205 and the communication unit 221 and is recognized by the first information processing device 20A. Is output. In the present modification, voice recognition and keyword detection are performed in each of the first information processing device 20A and the second information processing device 20B, and information about the keywords is recorded in the log information storage unit 225.

[第2変形例]
図11Cに示した第2変形例は、いずれか一方の情報処理装置が全ての音声認識を行い、他方の情報処理装置では、キーワードの検出等は行わない場合について示している。この場合、例えば第1情報処理装置20Aが全ての音声認識を行い、第2情報処理装置20Bは、音声チャットの制御のみを行う。第1情報処理装置20Aのユーザが発した声は、音声認識部203による音声認識およびキーワード検出部209によるキーワード検出が行われて、第2情報処理装置20Bに伝送される。また、第2情報処理装置20Bのユーザが発した声は、そのまま第1情報処理装置20Aに伝送され、第1情報処理装置20Aの音声認識部203で音声認識され、キーワード検出部209によりキーワードの検出が行われる。
[Second Modification]
The second modification shown in FIG. 11C shows a case where any one of the information processing apparatuses performs all speech recognition, and the other information processing apparatus does not perform keyword detection or the like. In this case, for example, the first information processing apparatus 20A performs all voice recognition, and the second information processing apparatus 20B performs only voice chat control. The voice uttered by the user of the first information processing apparatus 20A undergoes voice recognition by the voice recognition unit 203 and keyword detection by the keyword detection unit 209, and is transmitted to the second information processing apparatus 20B. Further, the voice uttered by the user of the second information processing device 20B is transmitted to the first information processing device 20A as it is, and is recognized by the voice recognition unit 203 of the first information processing device 20A. Detection is performed.

なお、図11Cにおいては、第1情報処理装置20Aが全ての音声認識を行う場合について図示したが、第2情報処理装置20Bが全ての音声認識を行っても良い。また、図11Cでは、第1情報処理装置20Aに2つの独立した音声認識部が設けられる場合を示しているが、1つの音声認識部が上記の処理を行っても良い。以上説明したような本変形例は、例えば一方の情報処理装置の処理能力が他方の情報処理装置の処理能力に対して格段に優れている場合、または、格段に劣っている場合に利用することが可能である。   Although FIG. 11C illustrates the case where the first information processing apparatus 20A performs all speech recognition, the second information processing apparatus 20B may perform all speech recognition. FIG. 11C shows a case where two independent speech recognition units are provided in the first information processing apparatus 20A, but one speech recognition unit may perform the above processing. This modification as described above is used when, for example, the processing capability of one information processing device is significantly superior to the processing capability of the other information processing device, or when it is significantly inferior. Is possible.

[第3変形例]
図11Dに示した第3変形例は、双方の情報処理装置は音声認識およびキーワードの検出処理を全く行わず、それぞれの情報処理装置の接続を仲立ちしているキーワード管理サーバ30が音声認識およびキーワードの検出処理を行う場合について示している。この場合、第1情報処理装置20Aのユーザが発した声は、そのままキーワード管理サーバ30へと伝送され、サーバ30の音声認識部323において音声認識され、第2情報処理装置20Bへと伝送される。また、第2情報処理装置20Bのユーザが発した声は、そのままサーバ30へと伝送され、サーバ30の音声認識部323において音声認識され、第1情報処理装置20Aへと伝送される。また、キーワード管理サーバ30のキーワード検出部325は、キーワードリストを参照しながら、音声認識結果の中から所定のキーワードを検出する。また、キーワードの検出結果は、第1情報処理装置20Aおよび第2情報処理装置20Bの双方に伝送される。また、検出されたキーワードは、ログ情報記憶部327に記録される。
[Third Modification]
In the third modification shown in FIG. 11D, both information processing apparatuses do not perform voice recognition and keyword detection processing at all, and the keyword management server 30 that mediates connection between the respective information processing apparatuses performs voice recognition and keyword detection. This shows a case where the detection process is performed. In this case, the voice uttered by the user of the first information processing apparatus 20A is transmitted to the keyword management server 30 as it is, is recognized by the voice recognition unit 323 of the server 30, and is transmitted to the second information processing apparatus 20B. . Further, the voice uttered by the user of the second information processing device 20B is transmitted to the server 30 as it is, is recognized by the voice recognition unit 323 of the server 30, and is transmitted to the first information processing device 20A. The keyword detection unit 325 of the keyword management server 30 detects a predetermined keyword from the speech recognition result while referring to the keyword list. The keyword detection result is transmitted to both the first information processing apparatus 20A and the second information processing apparatus 20B. Further, the detected keyword is recorded in the log information storage unit 327.

以上説明したような本変形例は、例えば双方の情報処理装置の処理能力が劣っている場合等に利用することが可能である。   This modification as described above can be used, for example, when the processing capabilities of both information processing apparatuses are inferior.

<情報処理装置20のハードウェア構成について>
次に、図12を参照しながら、本実施形態に係る情報処理装置20のハードウェア構成について、詳細に説明する。図12は、本実施形態に係る情報処理装置20のハードウェア構成を説明するためのブロック図である。
<Hardware Configuration of Information Processing Apparatus 20>
Next, the hardware configuration of the information processing apparatus 20 according to the present embodiment will be described in detail with reference to FIG. FIG. 12 is a block diagram for explaining a hardware configuration of the information processing apparatus 20 according to the present embodiment.

情報処理装置20は、主に、CPU(Central Processing Unit)901と、ROM(Read Only Memory)903と、RAM(Random Access Memory)905と、ホストバス907と、ブリッジ909と、外部バス911と、インターフェース913と、入力装置915と、出力装置917と、ストレージ装置919と、ドライブ921と、接続ポート923と、通信装置925とを備える。   The information processing apparatus 20 mainly includes a CPU (Central Processing Unit) 901, a ROM (Read Only Memory) 903, a RAM (Random Access Memory) 905, a host bus 907, a bridge 909, an external bus 911, An interface 913, an input device 915, an output device 917, a storage device 919, a drive 921, a connection port 923, and a communication device 925 are provided.

CPU901は、演算処理装置および制御装置として機能し、ROM903、RAM905、ストレージ装置919、またはリムーバブル記録媒体927に記録された各種プログラムに従って、情報処理装置20内の動作全般またはその一部を制御する。ROM903は、CPU901が使用するプログラムや演算パラメータ等を記憶する。RAM905は、CPU901の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を一次記憶する。これらはCPUバス等の内部バスにより構成されるホストバス907により相互に接続されている。   The CPU 901 functions as an arithmetic processing unit and a control unit, and controls all or a part of the operation in the information processing apparatus 20 according to various programs recorded in the ROM 903, the RAM 905, the storage device 919, or the removable recording medium 927. The ROM 903 stores programs used by the CPU 901, calculation parameters, and the like. The RAM 905 primarily stores programs used in the execution of the CPU 901, parameters that change as appropriate during the execution, and the like. These are connected to each other by a host bus 907 constituted by an internal bus such as a CPU bus.

ホストバス907は、ブリッジ909を介して、PCI(Peripheral Component Interconnect/Interface)バスなどの外部バス911に接続されている。   The host bus 907 is connected to an external bus 911 such as a PCI (Peripheral Component Interconnect / Interface) bus via a bridge 909.

入力装置915は、例えば、マウス、キーボード、タッチパネル、ボタン、スイッチおよびレバーなどユーザが操作する操作手段である。また、入力装置915は、例えば、赤外線やその他の電波を利用したリモートコントロール手段(いわゆる、リモコン)であってもよいし、情報処理装置20の操作に対応した携帯電話やPDA等の外部接続機器929であってもよい。さらに、入力装置915は、例えば、上記の操作手段を用いてユーザにより入力された情報に基づいて入力信号を生成し、CPU901に出力する入力制御回路などから構成されている。情報処理装置20のユーザは、この入力装置915を操作することにより、情報処理装置20に対して各種のデータを入力したり処理動作を指示したりすることができる。   The input device 915 is an operation unit operated by the user, such as a mouse, a keyboard, a touch panel, a button, a switch, and a lever. Further, the input device 915 may be, for example, remote control means (so-called remote control) using infrared rays or other radio waves, or an external connection device such as a mobile phone or a PDA corresponding to the operation of the information processing device 20. 929 may be used. Furthermore, the input device 915 includes an input control circuit that generates an input signal based on information input by a user using the above-described operation means and outputs the input signal to the CPU 901, for example. A user of the information processing apparatus 20 can input various data and instruct a processing operation to the information processing apparatus 20 by operating the input device 915.

出力装置917は、例えば、CRTディスプレイ装置、液晶ディスプレイ装置、プラズマディスプレイ装置、ELディスプレイ装置およびランプなどの表示装置や、スピーカおよびヘッドホンなどの音声出力装置や、プリンタ装置、携帯電話、ファクシミリなど、取得した情報をユーザに対して視覚的または聴覚的に通知することが可能な装置で構成される。出力装置917は、例えば、情報処理装置20が行った各種処理により得られた結果を出力する。具体的には、表示装置は、情報処理装置20が行った各種処理により得られた結果を、テキストまたはイメージで表示する。他方、音声出力装置は、再生された音声データや音響データ等からなるオーディオ信号をアナログ信号に変換して出力する。   The output device 917 is, for example, a display device such as a CRT display device, a liquid crystal display device, a plasma display device, an EL display device and a lamp, a sound output device such as a speaker and headphones, a printer device, a mobile phone, a facsimile, etc. It is comprised with the apparatus which can notify the information which carried out visually or audibly to a user. The output device 917 outputs, for example, results obtained by various processes performed by the information processing device 20. Specifically, the display device displays the results obtained by various processes performed by the information processing device 20 as text or images. On the other hand, the audio output device converts an audio signal composed of reproduced audio data, acoustic data, and the like into an analog signal and outputs the analog signal.

ストレージ装置919は、情報処理装置20の記憶部の一例として構成されたデータ格納用の装置であり、例えば、HDD(Hard Disk Drive)等の磁気記憶部デバイス、半導体記憶デバイス、光記憶デバイス、または光磁気記憶デバイス等により構成される。このストレージ装置919は、CPU901が実行するプログラムや各種データ、および外部から取得した音響信号データや画像信号データなどを格納する。   The storage device 919 is a data storage device configured as an example of a storage unit of the information processing device 20, and includes, for example, a magnetic storage device such as an HDD (Hard Disk Drive), a semiconductor storage device, an optical storage device, or It is composed of a magneto-optical storage device or the like. The storage device 919 stores programs executed by the CPU 901 and various data, and acoustic signal data and image signal data acquired from the outside.

ドライブ921は、記録媒体用リーダライタであり、情報処理装置20に内蔵、あるいは外付けされる。ドライブ921は、装着されている磁気ディスク、光ディスク、光磁気ディスク、または半導体メモリ等のリムーバブル記録媒体927に記録されている情報を読み出して、RAM905に出力する。また、ドライブ921は、装着されている磁気ディスク、光ディスク、光磁気ディスク、または半導体メモリ等のリムーバブル記録媒体927に記録を書き込むことも可能である。リムーバブル記録媒体927は、例えば、DVDメディア、HD−DVDメディア、Blu−rayメディア、コンパクトフラッシュ(登録商標)(CompactFlash:CF)、メモリースティック、または、SDメモリカード(Secure Digital memory card)等である。また、リムーバブル記録媒体927は、例えば、非接触型ICチップを搭載したICカード(Integrated Circuit card)または電子機器等であってもよい。   The drive 921 is a recording medium reader / writer, and is built in or externally attached to the information processing apparatus 20. The drive 921 reads information recorded on a removable recording medium 927 such as a mounted magnetic disk, optical disk, magneto-optical disk, or semiconductor memory, and outputs the information to the RAM 905. In addition, the drive 921 can write a record on a removable recording medium 927 such as a magnetic disk, an optical disk, a magneto-optical disk, or a semiconductor memory. The removable recording medium 927 is, for example, a DVD medium, an HD-DVD medium, a Blu-ray medium, a compact flash (registered trademark) (CompactFlash: CF), a memory stick, or an SD memory card (Secure Digital memory card). Further, the removable recording medium 927 may be, for example, an IC card (Integrated Circuit card) on which a non-contact IC chip is mounted, an electronic device, or the like.

接続ポート923は、例えば、USB(Universal Serial Bus)ポート、i.Link等のIEEE1394ポート、SCSI(Small Computer System Interface)ポート、RS−232Cポート、光オーディオ端子、HDMI(High−Definition Multimedia Interface)ポート等の、機器を情報処理装置20に直接接続するためのポートである。この接続ポート923に外部接続機器929を接続することで、情報処理装置20は、外部接続機器929から直接音響信号データや画像信号データを取得したり、外部接続機器929に音響信号データや画像信号データを提供したりする。   The connection port 923 includes, for example, a USB (Universal Serial Bus) port, i. A port for directly connecting devices such as an IEEE 1394 port such as Link, a SCSI (Small Computer System Interface) port, an RS-232C port, an optical audio terminal, an HDMI (High-Definition Multimedia Interface) port, etc. is there. By connecting the external connection device 929 to the connection port 923, the information processing apparatus 20 acquires the acoustic signal data and the image signal data directly from the external connection device 929, or the acoustic signal data and the image signal to the external connection device 929. Or provide data.

通信装置925は、例えば、通信網12に接続するための通信デバイス等で構成された通信インターフェースである。通信装置925は、例えば、有線または無線LAN(Local Area Network)、Bluetooth、またはWUSB(Wireless USB)用の通信カード、光通信用のルータ、ADSL(Asymmetric Digital Subscriber Line)用のルータ、または、各種通信用のモデム等である。この通信装置925は、例えば、インターネットや他の通信機器との間で音響信号等を送受信することができる。また、通信装置925に接続される通信網12は、有線または無線によって接続されたネットワーク等により構成され、例えば、インターネット、家庭内LAN、赤外線通信、ラジオ波通信または衛星通信等であってもよい。   The communication device 925 is a communication interface configured with, for example, a communication device for connecting to the communication network 12. The communication device 925 is, for example, a wired or wireless LAN (Local Area Network), Bluetooth, or WUSB (Wireless USB) communication card, an optical communication router, an ADSL (Asymmetric Digital Subscriber Line) router, or various types. It is a modem for communication. The communication device 925 can transmit and receive an acoustic signal and the like with the Internet and other communication devices, for example. The communication network 12 connected to the communication device 925 is configured by a wired or wireless network, and may be, for example, the Internet, a home LAN, infrared communication, radio wave communication, satellite communication, or the like. .

以上、本発明の各実施形態に係る情報処理装置20の機能を実現可能なハードウェア構成の一例を示した。上記の各構成要素は、汎用的な部材を用いて構成されていてもよいし、各構成要素の機能に特化したハードウェアにより構成されていてもよい。従って、本実施形態を実施する時々の技術レベルに応じて、適宜、利用するハードウェア構成を変更することが可能である。   Heretofore, an example of the hardware configuration capable of realizing the function of the information processing apparatus 20 according to each embodiment of the present invention has been shown. Each component described above may be configured using a general-purpose member, or may be configured by hardware specialized for the function of each component. Therefore, it is possible to change the hardware configuration to be used as appropriate according to the technical level at the time of carrying out this embodiment.

なお、本実施形態に係るキーワード管理サーバ30のハードウェア構成は、本実施形態に係る情報処理装置20が有するハードウェア構成と実質的に同一であるため、詳細な説明は省略する。   Note that the hardware configuration of the keyword management server 30 according to the present embodiment is substantially the same as the hardware configuration of the information processing apparatus 20 according to the present embodiment, and thus detailed description thereof is omitted.

以上、添付図面を参照しながら本発明の好適な実施形態について説明したが、本発明はかかる例に限定されないことは言うまでもない。当業者であれば、特許請求の範囲に記載された範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、それらについても当然に本発明の技術的範囲に属するものと了解される。   As mentioned above, although preferred embodiment of this invention was described referring an accompanying drawing, it cannot be overemphasized that this invention is not limited to this example. It will be apparent to those skilled in the art that various changes and modifications can be made within the scope of the claims, and these are naturally within the technical scope of the present invention. Understood.

例えば、上述の実施形態では、関連キーワードの登録処理は、キーワード管理サーバ30で実施される場合について説明したが、関連キーワードの登録処理は、情報処理装置20で実施されてもよい。   For example, in the above-described embodiment, the case where the related keyword registration process is performed by the keyword management server 30 has been described. However, the related keyword registration process may be performed by the information processing apparatus 20.

本発明の第1の実施形態に係る音声チャットシステムを説明するための説明図である。It is explanatory drawing for demonstrating the voice chat system which concerns on the 1st Embodiment of this invention. 同実施形態に係る情報処理装置の構成について説明するためのブロック図である。It is a block diagram for demonstrating the structure of the information processing apparatus which concerns on the embodiment. 同実施形態に係る音声認識部を説明するためのブロック図である。It is a block diagram for demonstrating the speech recognition part which concerns on the same embodiment. 同実施形態に係るログ情報記憶部を説明するための説明図である。It is explanatory drawing for demonstrating the log information storage part which concerns on the same embodiment. 同実施形態に係るログ情報の一例を説明するための説明図である。It is explanatory drawing for demonstrating an example of the log information which concerns on the embodiment. 同実施形態に係る音声認識処理の一例を説明するための流れ図である。It is a flowchart for demonstrating an example of the speech recognition process which concerns on the embodiment. 同実施形態に係る表示部に表示される内容について説明するための説明図である。It is explanatory drawing for demonstrating the content displayed on the display part which concerns on the same embodiment. 同実施形態に係る表示部に表示される内容について説明するための説明図である。It is explanatory drawing for demonstrating the content displayed on the display part which concerns on the same embodiment. 同実施形態に係るキーワード管理サーバの構成について説明するためのブロック図である。It is a block diagram for demonstrating the structure of the keyword management server which concerns on the same embodiment. 同実施形態に係るキーワード管理サーバが行うログ情報取得処理について説明するための説明図である。It is explanatory drawing for demonstrating the log information acquisition process which the keyword management server which concerns on the embodiment performs. 同実施形態に係るキーワード管理サーバ30が行ったキーワードの集計結果を取得する画面の一例について説明するための説明図である。It is explanatory drawing for demonstrating an example of the screen which acquires the totalization result of the keyword which the keyword management server 30 concerning the embodiment performed. キーワードの集計結果の表示例を説明するための説明図である。It is explanatory drawing for demonstrating the example of a display of the total result of a keyword. キーワードの集計結果の表示例を説明するための説明図である。It is explanatory drawing for demonstrating the example of a display of the total result of a keyword. 同実施形態に係る関連キーワードの登録処理について説明するための説明図である。It is explanatory drawing for demonstrating the registration process of the related keyword which concerns on the same embodiment. 同実施形態に係る関連キーワードの登録処理について説明するための流れ図である。It is a flowchart for demonstrating the registration process of the related keyword which concerns on the embodiment. 同実施形態に係る情報処理装置の音声認識方法を説明するための簡略化されたブロック図である。It is the simplified block diagram for demonstrating the speech recognition method of the information processing apparatus which concerns on the embodiment. 同実施形態に係る情報処理装置の音声認識方法の第1変形例を説明するための簡略化されたブロック図である。It is the simplified block diagram for demonstrating the 1st modification of the speech recognition method of the information processing apparatus which concerns on the embodiment. 同実施形態に係る情報処理装置の音声認識方法の第2変形例を説明するための簡略化されたブロック図である。It is the simplified block diagram for demonstrating the 2nd modification of the speech recognition method of the information processing apparatus which concerns on the embodiment. 同実施形態に係る情報処理装置の音声認識方法の第3変形例を説明するための簡略化されたブロック図である。It is the simplified block diagram for demonstrating the 3rd modification of the speech recognition method of the information processing apparatus which concerns on the embodiment. 同実施形態に係る情報処理装置のハードウェア構成を説明するためのブロック図である。It is a block diagram for demonstrating the hardware constitutions of the information processing apparatus which concerns on the embodiment.

符号の説明Explanation of symbols

10 音声チャットシステム
12 通信網
20 情報処理装置
30 キーワード管理サーバ
40 検索サーバ
201 音声入力部
203 音声認識部
205 音声会話制御部
207 音声出力部
209 キーワード検出部
211 表示制御部
213 表示部
215 キーワード選択部
217 詳細情報検索部
219 ポイント算出部
221 通信部
223 記憶部
225 ログ情報記憶部
227 キーワードリスト記憶部
251 AD変換部
253 特徴パラメータ抽出部
255 マッチング部
257 認識用データベース
261 表示画面
263 キーワード表示ウィンドウ
265 検出キーワード表示領域
267 関連キーワード表示領域
269 関連記事表示領域
271 製品情報表示領域
275 検索ウィンドウ
277 条件記入欄
279 表示開始オブジェクト
301 キーワード集計部
303 関連キーワード登録部
305 製品レコメンド部
307 通信部
309 記憶部
321 音声データ仲介部
323 音声認識部
325 キーワード検出部
327 ログ情報記憶部
351 関連語群リスト
DESCRIPTION OF SYMBOLS 10 Voice chat system 12 Communication network 20 Information processing apparatus 30 Keyword management server 40 Search server 201 Voice input part 203 Voice recognition part 205 Voice conversation control part 207 Voice output part 209 Keyword detection part 211 Display control part 213 Display part 215 Keyword selection part 217 Detailed information search unit 219 Point calculation unit 221 Communication unit 223 Storage unit 225 Log information storage unit 227 Keyword list storage unit 251 AD conversion unit 253 Feature parameter extraction unit 255 Matching unit 257 Recognition database 261 Display screen 263 Keyword display window 265 Detection Keyword display area 267 Related keyword display area 269 Related article display area 271 Product information display area 275 Search window 277 Condition entry field 279 Display start object Transfected 301 keyword totaling unit 303 related keyword registration unit 305 product recommendation unit 307 communication unit 309 storage unit 321 voice data mediation section 323 speech recognition unit 325 keyword detection unit 327 the log information storage unit 351 associated word group list

Claims (15)

所定のキーワードが記録されているキーワードリストを有する情報処理装置であって、
入力された音声を音声データとして取得し、取得した前記音声データを音声認識する音声認識部と、
前記キーワードリストに基づいて、前記音声データの音声認識結果の中からキーワードを検出するキーワード検出部と、
検出された前記キーワードと前記キーワードが検出された日時とが関連付けられたログがログ情報として記録されたログ情報記憶部と、
前記検出されたキーワードを所定の表示部に表示させる表示制御部と、
を備えることを特徴とする、情報処理装置。
An information processing apparatus having a keyword list in which predetermined keywords are recorded,
A voice recognition unit that acquires input voice as voice data and recognizes the acquired voice data;
A keyword detection unit that detects a keyword from the speech recognition result of the speech data based on the keyword list;
A log information storage unit in which a log associated with the detected keyword and the date and time when the keyword was detected is recorded as log information;
A display control unit for displaying the detected keyword on a predetermined display unit;
An information processing apparatus comprising:
前記キーワードリストには、当該キーワードリストに記録されたキーワードごとに、一のキーワードに関連する関連キーワードが当該一のキーワードに関連付けられて記録されており、
前記ログ情報記憶部には、前記関連キーワードのログ情報が更に記録され、
前記表示制御部は、前記キーワードリストに基づいて、前記検出されたキーワードに関連する前記関連キーワードを更に表示させる
ことを特徴とする、請求項1記載の情報処理装置。
In the keyword list, for each keyword recorded in the keyword list, a related keyword related to one keyword is recorded in association with the one keyword,
In the log information storage unit, log information of the related keyword is further recorded,
The information processing apparatus according to claim 1, wherein the display control unit further displays the related keyword related to the detected keyword based on the keyword list.
前記情報処理装置は、
前記表示制御部により前記表示部に表示されたキーワードが選択されたかを判断するキーワード選択部と、
選択された前記キーワードの詳細情報を所定の方法で検索する詳細情報検索部と、
を更に備え、
前記表示制御部は、前記キーワード選択部によりキーワードが選択されると、前記詳細情報検索部により検索された前記キーワードの詳細情報を更に表示させ、
前記ログ情報記憶部には、前記詳細情報検索部が前記詳細情報を検索した前記キーワードのログ情報として更に記録される
ことを特徴とする、請求項1記載の情報処理装置。
The information processing apparatus includes:
A keyword selection unit that determines whether the keyword displayed on the display unit is selected by the display control unit;
A detailed information search unit for searching the detailed information of the selected keyword by a predetermined method;
Further comprising
When the keyword is selected by the keyword selection unit, the display control unit further displays the detailed information of the keyword searched by the detailed information search unit,
The information processing apparatus according to claim 1, wherein the log information storage unit further records the log information of the keyword for which the detailed information search unit has searched the detailed information.
前記情報処理装置は、
前記ログ情報記憶部に記録された前記ログ情報に基づいて、前記キーワード検出部により検出された前記キーワードごとに所定のポイントを加算するとともに、前記キーワード選択部により選択された前記キーワードごとに所定のポイントを加算するポイント算出部を更に備え、
前記ログ情報記憶部には、前記ポイント算出部により算出されたポイントがキーワードごとに関連づけられて記録される
ことを特徴とする、請求項3記載の情報処理装置。
The information processing apparatus includes:
Based on the log information recorded in the log information storage unit, a predetermined point is added for each keyword detected by the keyword detection unit, and a predetermined point is determined for each keyword selected by the keyword selection unit. A point calculation unit for adding points;
The information processing apparatus according to claim 3, wherein the log information storage unit records the points calculated by the point calculation unit in association with each keyword.
所定のキーワードが記録されているキーワードリストを有する情報処理装置における情報処理方法であって、
入力された音声を音声データとして取得し、取得した前記音声データを音声認識する音声認識ステップと、
前記キーワードリストに基づいて、前記音声データの音声認識結果の中からキーワードを検出するキーワード検出ステップと、
検出された前記キーワードと前記キーワードが検出された日時とが関連付けられたログをログ情報として記録するログ情報記録ステップと、
を含むことを特徴とする、情報処理方法。
An information processing method in an information processing apparatus having a keyword list in which predetermined keywords are recorded,
A voice recognition step of acquiring the input voice as voice data, and voice recognition of the acquired voice data;
A keyword detection step of detecting a keyword from the voice recognition result of the voice data based on the keyword list;
A log information recording step for recording, as log information, a log in which the detected keyword is associated with the date and time when the keyword was detected;
An information processing method comprising:
コンピュータを、所定のキーワードが記録されているキーワードリストを有する情報処理装置として機能させるためのプログラムであって、
入力された音声を音声データとして取得し、取得した前記音声データを音声認識する音声認識機能と、
前記キーワードリストに基づいて、前記音声データの音声認識結果の中からキーワードを検出するキーワード検出機能と、
検出された前記キーワードと前記キーワードが検出された日時とが関連付けられたログをログ情報として記録するログ情報記憶機能と、
前記検出されたキーワードを所定の表示部に表示させる表示制御機能と、
をコンピュータに実現させるためのプログラム。
A program for causing a computer to function as an information processing apparatus having a keyword list in which predetermined keywords are recorded,
A voice recognition function for acquiring input voice as voice data, and voice recognition of the acquired voice data;
A keyword detection function for detecting a keyword from the voice recognition result of the voice data based on the keyword list;
A log information storage function for recording, as log information, a log associated with the detected keyword and the date and time when the keyword was detected;
A display control function for displaying the detected keyword on a predetermined display unit;
A program to make a computer realize.
音声チャットを実行可能な複数の情報処理装置を備える音声チャットシステムであって、
少なくとも1つの前記情報処理装置は、
所定のキーワードが記録されているキーワードリストを有し、
入力された音声を音声データとして取得し、取得した前記音声データを音声認識する音声認識部と、
前記キーワードリストに基づいて、前記音声データの音声認識結果の中からキーワードを検出するキーワード検出部と、
検出された前記キーワードと前記キーワードが検出された日時とが関連付けられたログがログ情報として記録されるログ情報記憶部と、
前記検出されたキーワードを所定の表示部に表示させる表示制御部と、
を備えることを特徴とする、音声チャットシステム。
A voice chat system comprising a plurality of information processing devices capable of performing voice chat,
At least one of the information processing devices includes:
It has a keyword list in which predetermined keywords are recorded,
A voice recognition unit that acquires input voice as voice data and recognizes the acquired voice data;
A keyword detection unit that detects a keyword from the speech recognition result of the speech data based on the keyword list;
A log information storage unit in which a log associated with the detected keyword and the date and time when the keyword was detected is recorded as log information;
A display control unit for displaying the detected keyword on a predetermined display unit;
A voice chat system comprising:
前記ログ情報記憶部は、前記検出されたキーワードを、音声チャットを行った相手および日時に関連付けて集計する
ことを特徴とする、請求項7に記載の音声チャットシステム。
The voice chat system according to claim 7, wherein the log information storage unit aggregates the detected keywords in association with a partner and a date and time when voice chat was performed.
前記情報処理装置は、
前記音声チャットの相手である他の情報処理装置に入力された音声に対応する音声データを取得し、
前記音声認識部は、前記他の情報処理装置から取得した前記音声データを音声認識する
ことを特徴とする、請求項7に記載の音声チャットシステム。
The information processing apparatus includes:
Obtaining voice data corresponding to the voice input to the other information processing apparatus as the voice chat partner;
The voice chat system according to claim 7, wherein the voice recognition unit recognizes the voice data acquired from the other information processing apparatus.
前記キーワード検出部は、前記他の情報処理装置から取得した前記音声データの音声認識結果の中からキーワードを検出し、
前記ログ情報記憶部には、前記他の情報処理装置から取得した音声データの音声認識結果の中から検出したキーワードの前記ログ情報が記録される
ことを特徴とする、請求項9に記載の音声チャットシステム。
The keyword detection unit detects a keyword from a voice recognition result of the voice data acquired from the other information processing apparatus;
10. The voice according to claim 9, wherein the log information of a keyword detected from a voice recognition result of voice data acquired from the other information processing apparatus is recorded in the log information storage unit. Chat system.
前記音声チャットシステムは、前記音声チャットを実行した前記情報処理装置が検出した前記キーワードを管理するキーワード管理サーバを更に有し、
前記キーワード管理サーバは、前記情報処理装置から前記ログ情報を受信して、受信した前記ログ情報に基づいて前記キーワードの集計を行うキーワード集計部を備える
ことを特徴とする、請求項7に記載の音声チャットシステム。
The voice chat system further includes a keyword management server that manages the keywords detected by the information processing apparatus that has executed the voice chat,
The said keyword management server is provided with the keyword total part which receives the said log information from the said information processing apparatus, and totals the said keyword based on the received said log information, The characterized by the above-mentioned. Voice chat system.
前記キーワード管理サーバは、
当該キーワード管理サーバが管理している前期キーワードと対応付けられた製品が記録されている製品リストを有しており、
前記情報処理装置から受信した前記ログ情報に記載されている前記キーワードと、前記製品リストとを照合して、前記情報処理装置に対して前記製品リストに記録されている前記製品のレコメンドを行う製品レコメンド部を更に備える
ことを特徴とする、請求項7に記載の音声チャットシステム。
The keyword management server
A product list in which products associated with the previous term keyword managed by the keyword management server are recorded;
A product for recommending the product recorded in the product list to the information processing device by collating the keyword described in the log information received from the information processing device with the product list The voice chat system according to claim 7, further comprising a recommendation unit.
前記キーワード管理サーバは、
受信した前記キーワードの集計結果を参照して、前記音声チャットを行っている前記情報処理装置のそれぞれから取得した前記ログ情報の中から前記音声チャット中で集計ポイントが高いキーワードを抽出し、抽出した前記キーワードを関連キーワードとして登録する関連キーワード登録部を更に備える
ことを特徴とする、請求項11に記載の音声チャットシステム。
The keyword management server
Referring to the received aggregation results of the keywords, a keyword having a high aggregation point in the voice chat is extracted from the log information acquired from each of the information processing devices performing the voice chat, and extracted. The voice chat system according to claim 11, further comprising a related keyword registration unit that registers the keyword as a related keyword.
前記音声チャットシステムは、前記情報処理装置が前記キーワードおよび前記キーワードに関連する記事を検索可能な検索サーバを更に備え、
前記検索サーバは、当該検索サーバにおいて検索が行われた検索キーワードを前記情報処理装置に送信し、
前記情報処理装置は、受信した前記検索キーワードに基づいて、前記キーワードリストを生成する
ことを特徴とする、請求項7に記載の音声チャットシステム。
The voice chat system further includes a search server that allows the information processing apparatus to search for the keyword and an article related to the keyword,
The search server transmits a search keyword searched in the search server to the information processing apparatus,
The voice chat system according to claim 7, wherein the information processing apparatus generates the keyword list based on the received search keyword.
音声チャットを実行可能な複数の情報処理装置と、
前記複数の情報処理装置間で実行される前記音声チャットの制御を行うとともに、所定のキーワードリストを有するキーワード管理サーバと、
を含み、
前記情報処理装置は、
入力された音声を音声データとし、前記キーワード管理サーバを介して前記音声データを前記音声チャットの相手である他の情報処理装置へと送信するとともに、前記キーワード管理サーバを介して前記他の情報処理装置から送信された音声データを取得する音声会話制御部を備え、
前記キーワード管理サーバは、
前記複数の情報処理装置から送信される音声データの送受信を仲介する音声データ仲介部と、
前記音声データを音声認識する音声認識部と、
前記キーワードリストに基づいて、前記音声データの音声認識結果の中からキーワードを検出するキーワード検出部と、
検出された前記キーワードと前記キーワードが検出された日時とが関連付けられたログがログ情報として記録されるログ情報記憶部と、
を備える
ことを特徴とする、音声チャットシステム。
A plurality of information processing devices capable of performing voice chat;
While performing control of the voice chat executed between the plurality of information processing devices, a keyword management server having a predetermined keyword list;
Including
The information processing apparatus includes:
The input voice is set as voice data, and the voice data is transmitted to the other information processing apparatus that is the voice chat partner via the keyword management server, and the other information processing is performed via the keyword management server. A voice conversation control unit for acquiring voice data transmitted from the device;
The keyword management server
An audio data mediation unit that mediates transmission / reception of audio data transmitted from the plurality of information processing devices;
A voice recognition unit for voice recognition of the voice data;
A keyword detection unit that detects a keyword from the speech recognition result of the speech data based on the keyword list;
A log information storage unit in which a log associated with the detected keyword and the date and time when the keyword was detected is recorded as log information;
A voice chat system comprising:
JP2007340397A 2007-12-28 2007-12-28 Information processor, information processing method, program, and voice chat system Withdrawn JP2009163358A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007340397A JP2009163358A (en) 2007-12-28 2007-12-28 Information processor, information processing method, program, and voice chat system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007340397A JP2009163358A (en) 2007-12-28 2007-12-28 Information processor, information processing method, program, and voice chat system

Publications (1)

Publication Number Publication Date
JP2009163358A true JP2009163358A (en) 2009-07-23

Family

ID=40965932

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007340397A Withdrawn JP2009163358A (en) 2007-12-28 2007-12-28 Information processor, information processing method, program, and voice chat system

Country Status (1)

Country Link
JP (1) JP2009163358A (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011086021A (en) * 2009-10-14 2011-04-28 Nec Corp Mobile terminal apparatus and information recording method
JP2014164717A (en) * 2013-02-27 2014-09-08 Sharp Corp Information providing device, information providing method of the information providing device, information providing program, and recording medium
JP2014174938A (en) * 2013-03-12 2014-09-22 Hitachi Systems Ltd Help desk support system
CN110543449A (en) * 2019-09-03 2019-12-06 上海擎测机电工程技术有限公司 chat record searching method based on AR equipment
US11580305B2 (en) 2017-06-28 2023-02-14 Microsoft Technology Licensing, Llc Automatically assisting conversations using graph database

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011086021A (en) * 2009-10-14 2011-04-28 Nec Corp Mobile terminal apparatus and information recording method
JP2014164717A (en) * 2013-02-27 2014-09-08 Sharp Corp Information providing device, information providing method of the information providing device, information providing program, and recording medium
JP2014174938A (en) * 2013-03-12 2014-09-22 Hitachi Systems Ltd Help desk support system
US11580305B2 (en) 2017-06-28 2023-02-14 Microsoft Technology Licensing, Llc Automatically assisting conversations using graph database
CN110543449A (en) * 2019-09-03 2019-12-06 上海擎测机电工程技术有限公司 chat record searching method based on AR equipment

Similar Documents

Publication Publication Date Title
JP5042799B2 (en) Voice chat system, information processing apparatus and program
US8620658B2 (en) Voice chat system, information processing apparatus, speech recognition method, keyword data electrode detection method, and program for speech recognition
US11557280B2 (en) Background audio identification for speech disambiguation
JP4987682B2 (en) Voice chat system, information processing apparatus, voice recognition method and program
US9330661B2 (en) Accuracy improvement of spoken queries transcription using co-occurrence information
US8666963B2 (en) Method and apparatus for processing spoken search queries
US8990182B2 (en) Methods and apparatus for searching the Internet
US8090738B2 (en) Multi-modal search wildcards
US20160055245A1 (en) Systems and methods for providing information discovery and retrieval
KR101878488B1 (en) Method and Appartus for Providing Contents about Conversation
US20120290561A1 (en) Information processing apparatus, information processing method, program, and information processing system
US20120059658A1 (en) Methods and apparatus for performing an internet search
US11501764B2 (en) Apparatus for media entity pronunciation using deep learning
US20120136870A1 (en) Systems and methods for two stream indexing of audio content
CN110147494A (en) Information search method, device, storage medium and electronic equipment
JP2009163358A (en) Information processor, information processing method, program, and voice chat system
JP2002197118A (en) Information access method, information access system and storage medium
JP2010146532A (en) Voice retrieval device, voice retrieval method, and voice retrieval program
JP2007199315A (en) Content providing apparatus
JP2005084829A (en) Information retrieving method, device, and program, and program recording medium
JP7230085B2 (en) Method and device, electronic device, storage medium and computer program for processing sound
JP2009204732A (en) Voice recognition device, and voice recognition dictionary creation method and program
TW202006563A (en) Dialogic type search display method performing an interactive search and obtain a corresponding search result by means of natural speech or natural sentence expression
JP2011053851A (en) Classification processor
JP2002334081A (en) Information retrieving device, its method and program and recording medium recording the program

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20110301