JP3482398B2 - 音声入力式楽曲検索システム - Google Patents
音声入力式楽曲検索システムInfo
- Publication number
- JP3482398B2 JP3482398B2 JP2000385775A JP2000385775A JP3482398B2 JP 3482398 B2 JP3482398 B2 JP 3482398B2 JP 2000385775 A JP2000385775 A JP 2000385775A JP 2000385775 A JP2000385775 A JP 2000385775A JP 3482398 B2 JP3482398 B2 JP 3482398B2
- Authority
- JP
- Japan
- Prior art keywords
- music
- name
- song
- phrase
- attribute data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Reverberation, Karaoke And Other Acoustics (AREA)
Description
ケ装置に連携し、歌いたい曲の歌手名や曲名などを音声
で発声することで、その曲を検索して演奏予約するよう
な用途に使用される音声入力式楽曲検索システムの改良
に関する。
は、典型的なユーザインタフェースとして、「まず歌手
名を発声してください」というガイドに促されて歌手名
を音声入力し、「つぎに曲名を発声してください」とい
うガイドに促されて曲名を音声入力する対話形式の入力
手順が採用されていた。べつの例では、歌手名の音声入
力と曲名の音声入力の間に一定時間以上の無音期間を挟
むことを義務づけた入力処理方法を採用している。
た歌手名と曲名を区別して認識し、歌手名に相当する認
識文字列と曲名に相当する認識文字列とを生成する。そ
の認識文字列に従って楽曲索引データベースを検索し、
該当する楽曲に関する情報を引き出して利用者に提供す
る。その提示情報の中にはカラオケ装置が受け付けるリ
クエスト番号(楽曲ID)が含まれ、利用者の希望に応
じてその楽曲IDをカラオケ装置に引き渡す。
期間で区切る方式では、利用者の無音期間が短すぎる場
合が生じやすい。無音期間でカラオケ演奏音をマイクロ
ホンが拾ってしまう場合があり、歌手名と曲名とが区別
して正しく認識できないことが多かった。
名と曲名とを順番に音声入力する方式では、両者を区別
して正しく認識することができるが、利用者は煩わしい
とか面倒くさいと感じやすく、自然なユーザインタフェ
ースとはいえなかった。
で、その目的は、歌手名と曲名とをごく自然につなげて
発声しても、それらを区別して正しく認識できるように
した音声入力式楽曲検索システムを提供することにあ
る。
の音声入力式楽曲検索システムは、曲名と歌手名と楽曲
IDとを対応づけして集約した楽曲索引データベースに
アクセスする手段と、対話型インタフェースによって利
用者に検索語を音声入力させるとともに入力された音声
を認識して文字列を生成する制御手段と、この手段によ
り生成した認識文字列に特定文字「の」が含まれている
か否かを検出し、含まれていない場合は前記対話型イン
タフェースにより利用者に向けて再入力を促す制御手段
と、前記認識文字列に特定文字「の」が含まれている場
合、その認識文字列における特定文字「の」の直前まで
を第1句、直後から末尾までを第2句に区切って認識す
る制御手段と、前記楽曲索引データベースを検索し、前
記第1句が歌手名に符合し、かつ前記第2句が曲名に符
合するレコード(ヒットレコードとする)を見いだした
ならば、その歌手名と曲名とを前記対話型インタフェー
スにより利用者に向けて提示する制御手段と、前記楽曲
索引データベースを検索した結果、前記ヒットレコード
が見いだせなかった場合で、前記認識文字列の別の位置
に特定文字「の」が存在する場合は、その第2の特定文
字「の」を区切りとして新たな第1句と第2句とを認識
し、それに基づいて前記と同じデータベース検索を行う
制御手段と、を備えたことを特徴とする。
特定文字「の」を特定文字「バイ」に置換するととも
に、前記第1句を曲名検索に供し、前記第2句を歌手名
検索に供してもよい。ここまで音声入力する検索語を歌
手名と曲名として説明してきたが、「歌手名」について
は「作詞者名」「作曲者名」「楽曲ジャンル」「使われ
ているリズム様式」「使われているCM」「使われてい
るドラマ」のいずれかに置換してもよいことは言うまで
もない。
テムの技術的思想は、普遍化して表現すると、つぎの事
項(1)〜(10)により特定されるものである。 (1)アクセス手段と、制御手段を備える音声入力式楽
曲検索システムである。 (2)アクセス手段は、曲名と楽曲属性データと楽曲I
Dが記述されるレコードを集約した楽曲索引データベー
スにアクセスする。 (3)制御手段は、第1処理〜第7処理を行う。 (4)第1処理は、対話型インタフェースによって利用
者に検索語を音声入力させるとともに、入力された音声
を認識して認識文字列を生成する。 (5)第2処理は、生成した認識文字列に区切用文字が
含まれているか否かを検出し、含まれていない場合は第
3処理を行い、含まれている場合は第4処理を行う。 (6)第3処理は、対話型インタフェースにより利用者
に向けて再入力を促して第1処理に戻る。 (7)第4処理は、認識文字列における区切用文字の直
前までを第1句、直後から末尾までを第2句として認識
する。 (8)第5処理は、第1句の検索項目として曲名か楽曲
属性データの所定の一方を適用して、第2句の検索項目
として曲名か楽曲属性データの所定の他方を適用して、
アクセス手段に楽曲索引データベースを検索させ、符合
するレコードを見出した場合は第6処理を行い、見出せ
ない場合は第7処理を行う。 (9)第6処理は、見出した歌手名と曲名を対話型イン
タフェースにより利用者に提示する。 (10)第7処理は、認識文字列の別の位置に区切用文
字が存在する場合は、その区切用文字を新たな区切用文
字として第4処理に戻る。
の各レコードには複数項目の楽曲属性データが記述され
ており、それら各属性項目ごとに異なる前記区切用文字
が定義されており、前記認識文字列から検出された区切
用文字に該当する属性項目が検索対象となる。
は、前記楽曲索引データベースにおける曲名や歌手名な
どの楽曲属性データとしてシソーラスも登録されてい
て、それらシソーラスも前記検索の対象とすることが望
ましい。また、この音声入力式楽曲検索システムは、カ
ラオケ装置と通信する通信インタフェースと、前記対話
型インタフェースにより検索結果として利用者に提示し
た曲名について演奏予約コマンドの入力があった場合、
その曲名に対応づけされている前記楽曲IDを前記カラ
オケ装置に予約曲として通知する制御手段とを備えると
カラオケ楽曲の検索および予約システムとして機能す
る。
検索システムをカラオケシステムの選曲予約機能に適用
した形態について説明する。図1に示すようにカラオケ
システム1は、主要部をなすカラオケ装置10と、この
カラオケ装置10にLAN6によって接続された対話型
インタフェース12とで基本的な構成をなしている。こ
こで、カラオケ装置10と対話型インタフェース12と
は、LAN6に限らずRS232CやIrDAなどの適
宜な規格のインタフェースによって接続されていればよ
い。
希望するカラオケ楽曲の曲名と歌手名・作曲者名等の楽
曲属性とをこの楽曲属性に対応づけして設定された区切
用文字で繋いだ文字列を、前記対話型インタフェース1
2から音声で入力することによって、その曲名と楽曲属
性とを検索語としてこれに基づいてカラオケ装置10の
楽曲索引データベースを検索し、リクエストされたカラ
オケ楽曲を検出するものである。本実施形態では、楽曲
属性を「歌手名」とし、この歌手名に対応づけされた区
切用文字を「の」とし、『(歌手名)の(曲名)』とい
う形式に従って入力する形態について説明する。
力用のマイクロホン22と画像情報を表示するディスプ
レイ20とこのディスプレイ20の画面上に配設された
タッチパネル23とを備えたコンピュータでなり、マイ
クロホン22からの入力に対するカラオケ装置10のレ
スポンスやタッチパネル23からの入力に応答してディ
スプレイ20の表示画面を適宜切り替えるGUI環境も
備えている。
前記タッチパネル23に割り付けられたキーから入力す
ると、前記ディスプレイ20には、音声入力を促す画像
が表示される(図2−a)。
ンタフェース12のマイクロホン22からリクエスト曲
を前記形式に従い、例えば『Mr.childrenの
Tomorrow Never』のように音声入力す
る。
送出され、その認識文字列生成手段によって周知の音声
認識処理が施されて音声信号から発声された文字列が認
識され、認識された認識文字列『みすたーちるどれんの
とぅもろうねう゛ぁー』が生成される。この認識文字列
は、区切用文字検出手段によって認識文字列の最先側に
ある「の」を検出するとともに、「の」の直前までの文
字列『みすたーちるどれん』を歌手名検索語とし、以降
の文字列『とぅもろうねう゛ぁー』を曲名検索語として
認識する。このとき、「の」を検出できない場合や、入
力された音声信号のレベルが小さすぎて文字列が認識で
きなかった場合には、区切用文字検出手段から対話型イ
ンタフェース12に再入力を促すレスポンスが返送され
る(図2−c、図2−d)。
と、それら検索語についてそれぞれ前記楽曲索引データ
ベースを検索し、歌手名に符合する楽曲IDと楽曲名に
符合する楽曲IDとをそれぞれ抽出し、両者を対比して
一致するものをヒットレコードとしてその表示データを
対話型インタフェース12に送出する。
20には、前記ヒットレコードの歌手名および曲名とと
もに、予約またはキャンセルの入力キーと入力を促す画
像が表示される(図2−e)。
てもヒットレコードが見いだせず、かつ、前記最先側の
「の」以外の第2の「の」が検出された場合には、この
第2の「の」を区切として、新たな歌手名検索語と曲名
検索語とを認識し、これらに基づいて前記楽曲索引デー
タベースを検索する。
ドを確認し、予約またはキャンセルの意思をタッチパネ
ル23から入力する。これにより対話型インタフェース
12から予約を示すリクエストが送出されるとカラオケ
装置10から予約が終了した旨の画像データがレスポン
スとして返送され、ディスプレイ20にその旨を示す画
像が表示される(図2−f)。
繋いで一挙に音声入力するだけで、所望の楽曲を検索す
ることができる。特に、歌手名と曲名とを「の」で繋い
だ文字列は、楽曲を指定する場合に日常よく使用される
フレーズなので、初めての利用者であっても戸惑うこと
はなく、また歌手名と曲名とを「の」で区切るといった
意識をすることもなく滑らかに発声されるため、音声認
識の精度の向上に伴って検索のヒット率も向上する。
名)の(曲名)』としたが、曲名と歌手名との順番を入
れ替える場合には、区切用文字として『バイ』を用い
『(曲名)バイ(歌手名)』とするのが望ましい。
る区切用文字の組み合わせとしては、『(作曲者名)が
作曲した(曲名)』、『(作詞者名)が作詞した(曲
名)』、『(使われているCM)で使われている(曲
名)』、『(使われているドラマ)主題歌(曲名)』な
ど、楽曲属性と区切用文字とが1対1で対応づけられて
いれば構わず、この場合には、歌手名を知らない場合や
TV等知り得たお気に入りの曲等であっても、その僅か
な属性情報から容易に所望の楽曲を検索することができ
る。
名および歌手名などの楽曲属性データとして、歌手やグ
ループの愛称や楽曲の略称などシソーラスもあわせて登
録しておくと、音声入力時につい言い慣れた愛称や略称
を使ってしまったとしても、検索できずに再入力を求め
られることはなく、さらにユーザフレンドリーな楽曲検
索を実現することができる。
10と対話型インタフェース12とで構成しているが、
もちろん図3に示すような一般のカラオケ店舗に設置さ
れた通信カラオケシステム2のように、複数のカラオケ
装置10をLAN6で店舗サーバ3と接続し、この店舗
サーバ3が外部通信ネットワーク7と接続されている形
態でも構わず、さらに、検索する楽曲はカラオケ楽曲に
限るものではない。
式楽曲検索システムによれば、話すという極めて日常的
な手段によって、容易にかつ短時間で所望の楽曲を検索
することができる。特に、複数の検索語を用いて検索の
ヒット率を向上させることは勿論、利用者は各検索語を
意識することなく一挙に入力することができるため、利
用者に対する操作性をも向上させることができる。さら
に、カラオケ装置と対話型インタフェースとの制御が煩
雑にならず、システムとしての信頼性をも向上させるこ
とができる。
の一実施形態を示す概念図である。
図である。
変形例を示す概念図である。
Claims (7)
- 【請求項1】 アクセス手段と、制御手段を備える音声
入力式楽曲検索システムであって、 アクセス手段は、曲名と楽曲属性データと楽曲IDが記
述されるレコードを集約した楽曲索引データベースにア
クセスし、 制御手段は、第1処理〜第7処理を行い、 第1処理は、対話型インタフェースによって利用者に検
索語を音声入力させるとともに、入力された音声を認識
して認識文字列を生成し、 第2処理は、生成した認識文字列に区切用文字が含まれ
ているか否かを検出し、含まれていない場合は第3処理
を行い、含まれている場合は第4処理を行い、 第3処理は、対話型インタフェースにより利用者に向け
て再入力を促して第1処理に戻り、 第4処理は、認識文字列における区切用文字の直前まで
を第1句、直後から末尾までを第2句として認識し、 第5処理は、第1句の検索項目として曲名か楽曲属性デ
ータの所定の一方を適用して、第2句の検索項目として
曲名か楽曲属性データの所定の他方を適用して、アクセ
ス手段に楽曲索引データベースを検索させ、符合するレ
コードを見出した場合は第6処理を行い、見出せない場
合は第7処理を行い、 第6処理は、見出した歌手名と曲名を対話型インタフェ
ースにより利用者に提示し、 第7処理は、認識文字列の別の位置に区切用文字が存在
する場合は、その区切用文字を新たな区切用文字として
第4処理に戻る音声入力式楽曲検索システム。 - 【請求項2】 区切用文字は「の」であり、楽曲属性デ
ータは歌手名であり、第1句の検索項目は歌手名であ
り、第2句の検索項目は曲名である請求項1に記載の音
声入力式楽曲検索システム。 - 【請求項3】 区切用文字は「バイ」であり、楽曲属性
データは歌手名であり、第1句の検索項目は曲名であ
り、第2句の検索項目は歌手名である請求項1に記載の
音声入力式楽曲検索システム。 - 【請求項4】 楽曲属性データは、作詞者名、作曲者
名、楽曲ジャンル、使われているリズム様式、使われて
いるCM、使われているドラマのいずれかである請求項
1に記載の音声入力式楽曲検索システム。 - 【請求項5】 楽曲索引データベースの各レコードには
複数の楽曲属性データが記述され、 複数の区切用文字が定義されるとともに、区切用文字に
対応する楽曲属性データ、および、それを第1句、第2
句のどちらの検索項目とするかが定義され、 第5処理は、第2処理で検出した区切用文字に対応する
楽曲属性データ、および、その楽曲属性データを第1
句、第2句のどちらの検索項目とするかの定義に基づい
て検索を行う請求項1に記載の音声入力式楽曲検索シス
テム。 - 【請求項6】 楽曲索引データベースには、曲名、また
は、楽曲属性データのシソーラスもあわせて登録され、 第5処理は、シソーラスも検索対象とする請求項1〜5
のいずれかに記載の音声入力式楽曲検索システム。 - 【請求項7】 カラオケ装置と通信する通信インタフェ
ースを備え、 制御手段は、第6処理にて提示した曲名について演奏予
約コマンドの入力があった場合、その曲名に対応付けさ
れている楽曲IDを通信インタフェースを介して予約曲
としてカラオケ装置に通知する請求項1〜6のいずれか
に記載の音声入力式楽曲検索システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000385775A JP3482398B2 (ja) | 2000-12-19 | 2000-12-19 | 音声入力式楽曲検索システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000385775A JP3482398B2 (ja) | 2000-12-19 | 2000-12-19 | 音声入力式楽曲検索システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2002189483A JP2002189483A (ja) | 2002-07-05 |
JP3482398B2 true JP3482398B2 (ja) | 2003-12-22 |
Family
ID=18852983
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000385775A Expired - Fee Related JP3482398B2 (ja) | 2000-12-19 | 2000-12-19 | 音声入力式楽曲検索システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3482398B2 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3542578B2 (ja) * | 2001-11-22 | 2004-07-14 | キヤノン株式会社 | 音声認識装置及びその方法、プログラム |
JP2004309795A (ja) | 2003-04-07 | 2004-11-04 | Mitsubishi Electric Corp | 音楽提供システム |
JP4498221B2 (ja) * | 2005-06-06 | 2010-07-07 | 株式会社Bmb | カラオケ装置、およびプログラム |
US7599861B2 (en) | 2006-03-02 | 2009-10-06 | Convergys Customer Management Group, Inc. | System and method for closed loop decisionmaking in an automated care system |
US8379830B1 (en) | 2006-05-22 | 2013-02-19 | Convergys Customer Management Delaware Llc | System and method for automated customer service with contingent live interaction |
US7809663B1 (en) | 2006-05-22 | 2010-10-05 | Convergys Cmg Utah, Inc. | System and method for supporting the utilization of machine language |
JP4916005B2 (ja) * | 2007-02-28 | 2012-04-11 | 株式会社第一興商 | カラオケシステム |
US8260619B1 (en) | 2008-08-22 | 2012-09-04 | Convergys Cmg Utah, Inc. | Method and system for creating natural language understanding grammars |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06266779A (ja) * | 1993-03-15 | 1994-09-22 | Hitachi Ltd | 制御装置 |
JPH09297593A (ja) * | 1996-05-02 | 1997-11-18 | Victor Co Of Japan Ltd | カラオケ装置及びこの選曲方法 |
JPH1091176A (ja) * | 1996-09-13 | 1998-04-10 | Brother Ind Ltd | 楽曲検索装置および楽曲再生装置 |
JPH1124685A (ja) * | 1997-07-02 | 1999-01-29 | Ricoh Co Ltd | カラオケ装置 |
-
2000
- 2000-12-19 JP JP2000385775A patent/JP3482398B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2002189483A (ja) | 2002-07-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20040054541A1 (en) | System and method of media file access and retrieval using speech recognition | |
US6321196B1 (en) | Phonetic spelling for speech recognition | |
US7308404B2 (en) | Method and apparatus for speech recognition using a dynamic vocabulary | |
JP3711089B2 (ja) | 音声認識及び自然言語を用いる家庭活動の自動制御 | |
US7870142B2 (en) | Text to grammar enhancements for media files | |
US7840405B1 (en) | Generation of speech recognition grammars for conducting searches | |
CN100511422C (zh) | 内容检索方法和装置、通信系统和通信方法 | |
US20040128141A1 (en) | System and program for reproducing information | |
US20060143007A1 (en) | User interaction with voice information services | |
US20090076821A1 (en) | Method and apparatus to control operation of a playback device | |
US20090254554A1 (en) | Music searching system and method | |
EP1333426B1 (en) | Voice command interpreter with dialog focus tracking function and voice command interpreting method | |
US20100017381A1 (en) | Triggering of database search in direct and relational modes | |
JP2000099048A (ja) | カラオケ演奏装置に接続して用いる選曲予約装置 | |
US20080059150A1 (en) | Information retrieval using a hybrid spoken and graphic user interface | |
JP3482398B2 (ja) | 音声入力式楽曲検索システム | |
JP3437617B2 (ja) | 時系列データ記録再生装置 | |
WO2001084539A1 (en) | Voice commands depend on semantics of content information | |
JP2003084783A (ja) | 音楽データ再生装置、音楽データ再生方法、音楽データ再生プログラム、並びに音楽データ再生プログラムを記録した記録媒体 | |
US20080005673A1 (en) | Rapid file selection interface | |
US20070260590A1 (en) | Method to Query Large Compressed Audio Databases | |
Divi et al. | A speech-in list-out approach to spoken user interfaces | |
JP3482368B2 (ja) | 声紋に基づいて選曲候補を提示するカラオケ装置 | |
JP3602059B2 (ja) | 旋律検索式カラオケ演奏予約システム、旋律検索サーバー、カラオケ付属コンピュータ | |
JP2002157255A (ja) | 楽曲検索装置及び方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
R150 | Certificate of patent or registration of utility model |
Ref document number: 3482398 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081010 Year of fee payment: 5 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081010 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091010 Year of fee payment: 6 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091010 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101010 Year of fee payment: 7 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101010 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111010 Year of fee payment: 8 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111010 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121010 Year of fee payment: 9 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121010 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131010 Year of fee payment: 10 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |