JP7345288B2 - 情報処理装置、情報処理方法、及びプログラム - Google Patents
情報処理装置、情報処理方法、及びプログラム Download PDFInfo
- Publication number
- JP7345288B2 JP7345288B2 JP2019111200A JP2019111200A JP7345288B2 JP 7345288 B2 JP7345288 B2 JP 7345288B2 JP 2019111200 A JP2019111200 A JP 2019111200A JP 2019111200 A JP2019111200 A JP 2019111200A JP 7345288 B2 JP7345288 B2 JP 7345288B2
- Authority
- JP
- Japan
- Prior art keywords
- section
- audio
- audio data
- uttered
- information processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- User Interface Of Digital Computer (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
図1は、実施形態に係る情報処理装置10のハードウェア構成例を示す図である。図1に示す情報処理装置10は、それぞれバスBで相互に接続されているドライブ装置100、補助記憶装置102、メモリ装置103、CPU104、インタフェース装置105、表示装置106、及び入力装置107等を有する。
次に、図2を参照し、情報処理装置10の機能構成について説明する。図2は、実施形態に係る情報処理装置10の機能ブロック図である。
生成部16は、決定した変換度に応じて、第1音声データに含まれる第2区間の音声を、第2区間の音声に基づいて変換し、第2音声データを生成する。再生部17は、第2音声データを、ゲーム等のコンテンツにおいて第1キャラクタに発話された音声としてスピーカに出力させる。
次に、図3から図4Bを参照して、情報処理装置10の処理について説明する。図3は、実施形態に係る情報処理装置10の処理の一例を示すフローチャートである。図4Aは、実施形態に係る第1音声データの波形の一例について説明する図である。図4Bは、実施形態に係る第2音声データの波形の一例について説明する図である。
以下では、第2区間の音声を変換する方法の例について説明する。
生成部16は、変換対象の第2区間の少なくとも一部(全部または一部)の音声信号を時間方向に反転(時間反転、逆再生、時間が進む方向を逆にして再生)させた第2音声データを生成してもよい。この場合、生成部16は、変換対象の第2区間のうち、音声の振幅が所定の閾値以上の区間の音声信号を時間方向に反転させた第2音声データを生成してもよい。
生成部16は、変換対象の第2区間の少なくとも一部の音声信号をフーリエ変換等により周波数解析し、所定の各周波数に対する振幅を位相方向に反転させた第2音声データを生成してもよい。この場合、生成部16は、変換対象の第2区間のうち、音声の振幅が所定の閾値以上の区間の音声信号を時間方向に反転させた第2音声データを生成してもよい。
情報処理装置10の各機能部は、例えば1以上のコンピュータにより構成されるクラウドコンピューティングにより実現されていてもよい。また、第2音データと、再生部17の機能を実現するプログラムを記録媒体に記録し、ゲーム装置等において、再生部17の処理を実行させてもよい。
11 記憶部
12 取得部
13 受付部
14 決定部
15 判定部
16 生成部
17 再生部
Claims (7)
- 所定の台詞が発話されて録音された第1音声データにおける子音が発話された第1区間と、母音が発話された第2区間とを判定する判定部と、
前記第1音声データに含まれる前記第2区間の音声を、前記第2区間の音声に基づいて変換した第2音声データであって、コンテンツにおいてキャラクタに発話させる前記第2音声データを生成する生成部と、
を有し、
前記生成部は、
前記第2区間の少なくとも一部の音声信号を時間方向に反転させた前記第2音声データであって、前記第2区間のうち、音声の振幅が所定の閾値以上の区間の音声信号を時間方向に反転させた前記第2音声データを生成する、情報処理装置。 - 所定の台詞が発話されて録音された第1音声データにおける子音が発話された第1区間と、母音が発話された第2区間とを判定する判定部と、
前記第1音声データに含まれる前記第2区間の音声を、前記第2区間の音声に基づいて変換した第2音声データであって、コンテンツにおいてキャラクタに発話させる前記第2音声データを生成する生成部と、
を有し、
前記生成部は、
ゲームの状況に基づいて、前記第2区間の音声の変換度を決定し、
前記第2区間で発話された母音が前記ゲームの状況に応じた所定の母音である場合、前記第2区間の音声を変換し、
前記第2区間で発話された母音が前記所定の母音でない場合、前記第2区間の音声を変換しない、情報処理装置。 - 所定の台詞が発話されて録音された第1音声データにおける子音が発話された第1区間と、母音が発話された第2区間とを判定する判定部と、
前記第1音声データに含まれる前記第2区間の音声を、前記第2区間の音声に基づいて変換した第2音声データであって、コンテンツにおいてキャラクタに発話させる前記第2音声データを生成する生成部と、
を有し、
前記生成部は、
ゲームの状況に基づいて、前記第2区間の音声の変換度を決定し、
前記第2区間の直前の前記第1区間で発話された子音が前記ゲームの状況に応じた所定の子音である場合、前記第2区間の音声を変換し、
前記第2区間の直前の前記第1区間で発話された子音が前記所定の子音でない場合、前記第2区間の音声を変換しない、情報処理装置。 - 所定の台詞が発話されて録音された第1音声データにおける子音が発話された第1区間と、母音が発話された第2区間とを判定する判定部と、
前記第1音声データに含まれる前記第2区間の音声を、前記第2区間の音声に基づいて変換した第2音声データであって、コンテンツにおいてキャラクタに発話させる前記第2音声データを生成する生成部と、
を有し、
前記生成部は、
ゲームの状況に基づいて、前記第2区間の音声の変換度を決定し、
前記ゲームの状況に応じて、前記第2区間の音声を変換する頻度を決定する、情報処理装置。 - 前記生成部は、
ゲームの状況に基づいて、前記第2区間の音声の変換度を決定する、
請求項1に記載の情報処理装置。 - 情報処理装置が、
所定の台詞が発話されて録音された第1音声データにおける子音が発話された第1区間と、母音が発話された第2区間とを判定する処理と、
前記第1音声データに含まれる前記第2区間の音声を、前記第2区間の音声に基づいて変換した第2音声データであって、コンテンツにおいてキャラクタに発話させる前記第2音声データを生成する処理と、
を実行し、
前記第2音声データを生成する処理は、
前記第2区間の少なくとも一部の音声信号を時間方向に反転させた前記第2音声データであって、前記第2区間のうち、音声の振幅が所定の閾値以上の区間の音声信号を時間方向に反転させた前記第2音声データを生成する、情報処理方法。 - 情報処理装置に、
所定の台詞が発話されて録音された第1音声データにおける子音が発話された第1区間と、母音が発話された第2区間とを判定する処理と、
前記第1音声データに含まれる前記第2区間の音声を、前記第2区間の音声に基づいて変換した第2音声データであって、コンテンツにおいてキャラクタに発話させる前記第2音声データを生成する処理と、
を実行させ、
前記第2音声データを生成する処理は、
前記第2区間の少なくとも一部の音声信号を時間方向に反転させた前記第2音声データであって、前記第2区間のうち、音声の振幅が所定の閾値以上の区間の音声信号を時間方向に反転させた前記第2音声データを生成する、プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019111200A JP7345288B2 (ja) | 2019-06-14 | 2019-06-14 | 情報処理装置、情報処理方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019111200A JP7345288B2 (ja) | 2019-06-14 | 2019-06-14 | 情報処理装置、情報処理方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020204661A JP2020204661A (ja) | 2020-12-24 |
JP7345288B2 true JP7345288B2 (ja) | 2023-09-15 |
Family
ID=73838593
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019111200A Active JP7345288B2 (ja) | 2019-06-14 | 2019-06-14 | 情報処理装置、情報処理方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7345288B2 (ja) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011206220A (ja) | 2010-03-29 | 2011-10-20 | Konami Digital Entertainment Co Ltd | ゲームシステム、ゲームシステムの制御方法、及びプログラム |
JP2014232245A (ja) | 2013-05-30 | 2014-12-11 | 日本電信電話株式会社 | 音声明瞭化装置、方法及びプログラム |
JP2017131409A (ja) | 2016-01-28 | 2017-08-03 | 株式会社カプコン | ゲームプログラムおよびゲームシステム |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2838977B2 (ja) * | 1995-01-17 | 1998-12-16 | ヤマハ株式会社 | カラオケ装置 |
JP3597803B2 (ja) * | 2001-07-16 | 2004-12-08 | 株式会社コナミコンピュータエンタテインメントスタジオ | 音量制御プログラム、音量制御方法及びビデオゲーム装置 |
JP2013033103A (ja) * | 2011-08-01 | 2013-02-14 | Panasonic Corp | 声質変換装置および声質変換方法 |
-
2019
- 2019-06-14 JP JP2019111200A patent/JP7345288B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011206220A (ja) | 2010-03-29 | 2011-10-20 | Konami Digital Entertainment Co Ltd | ゲームシステム、ゲームシステムの制御方法、及びプログラム |
JP2014232245A (ja) | 2013-05-30 | 2014-12-11 | 日本電信電話株式会社 | 音声明瞭化装置、方法及びプログラム |
JP2017131409A (ja) | 2016-01-28 | 2017-08-03 | 株式会社カプコン | ゲームプログラムおよびゲームシステム |
Non-Patent Citations (1)
Title |
---|
山口優他,ロボット・ボイス研究所,サウンド&レコーディング・マガジン,株式会社リットーミュージック,1999年12月,第18巻,第12号,pp.110-121 |
Also Published As
Publication number | Publication date |
---|---|
JP2020204661A (ja) | 2020-12-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7280386B2 (ja) | 多言語音声合成およびクロスランゲージボイスクローニング | |
US10789290B2 (en) | Audio data processing method and apparatus, and computer storage medium | |
CN106688034B (zh) | 具有情感内容的文字至语音转换 | |
US9196247B2 (en) | Voice recognition method and voice recognition apparatus | |
KR102101044B1 (ko) | 텍스트 투 스피치 및 시맨틱스에 기초한 오디오 인적 상호 증명 기법 | |
US8554553B2 (en) | Non-negative hidden Markov modeling of signals | |
CN116034424A (zh) | 两级语音韵律迁移 | |
JP6127422B2 (ja) | 音声認識装置及び方法、並びに、半導体集積回路装置 | |
KR20210059586A (ko) | 텍스트 음성 변환과 함께 멀티태스크 학습을 사용한 감정적 음성 변환 방법 및 장치 | |
Potamianos et al. | A review of the acoustic and linguistic properties of children's speech | |
JP5807921B2 (ja) | 定量的f0パターン生成装置及び方法、f0パターン生成のためのモデル学習装置、並びにコンピュータプログラム | |
Ogayo et al. | Building African Voices | |
JP7345288B2 (ja) | 情報処理装置、情報処理方法、及びプログラム | |
CN112908308A (zh) | 一种音频处理方法、装置、设备及介质 | |
WO2010084830A1 (ja) | 音声処理装置、チャットシステム、音声処理方法、情報記憶媒体、ならびに、プログラム | |
US20110010179A1 (en) | Voice synthesis and processing | |
Shahnawazuddin et al. | Improving children’s mismatched ASR using structured low-rank feature projection | |
KR20220016650A (ko) | 텍스트 전처리 장치 및 방법 | |
KR100353858B1 (ko) | 음성인식을 위한 문맥 종속 유사 음소의 생성 방법 | |
US11250837B2 (en) | Speech synthesis system, method and non-transitory computer readable medium with language option selection and acoustic models | |
JP7458720B2 (ja) | 情報処理装置、情報処理方法、及びプログラム | |
JP6003127B2 (ja) | 言語モデル作成プログラム及び言語モデル作成装置 | |
JP2010176067A (ja) | 音声認識装置及び音声認識方法 | |
Willis | A Manner of Spea King | |
JP2015194781A (ja) | 定量的f0パターン生成装置、f0パターン生成のためのモデル学習装置、並びにコンピュータプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220405 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230214 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230307 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230427 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230815 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230905 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7345288 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |