JP2005502974A - ダイナミック変化系の第1の状態の第1の時系列から現在の第1の状態を求める方法および装置 - Google Patents
ダイナミック変化系の第1の状態の第1の時系列から現在の第1の状態を求める方法および装置 Download PDFInfo
- Publication number
- JP2005502974A JP2005502974A JP2003529402A JP2003529402A JP2005502974A JP 2005502974 A JP2005502974 A JP 2005502974A JP 2003529402 A JP2003529402 A JP 2003529402A JP 2003529402 A JP2003529402 A JP 2003529402A JP 2005502974 A JP2005502974 A JP 2005502974A
- Authority
- JP
- Japan
- Prior art keywords
- state
- time series
- current
- time
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000000034 method Methods 0.000 title claims abstract description 48
- 230000008859 change Effects 0.000 title claims abstract description 17
- 210000002569 neuron Anatomy 0.000 claims description 47
- 239000000126 substance Substances 0.000 claims description 29
- 230000008878 coupling Effects 0.000 claims description 26
- 238000010168 coupling process Methods 0.000 claims description 26
- 238000005859 coupling reaction Methods 0.000 claims description 26
- 230000009466 transformation Effects 0.000 claims description 21
- 239000013598 vector Substances 0.000 claims description 14
- 238000012545 processing Methods 0.000 claims description 12
- 238000006243 chemical reaction Methods 0.000 claims description 7
- 230000001131 transforming effect Effects 0.000 claims 4
- 238000012549 training Methods 0.000 description 24
- 239000011159 matrix material Substances 0.000 description 21
- 238000013528 artificial neural network Methods 0.000 description 20
- 230000008569 process Effects 0.000 description 16
- 238000013507 mapping Methods 0.000 description 15
- 238000010586 diagram Methods 0.000 description 8
- 230000007704 transition Effects 0.000 description 8
- 238000004364 calculation method Methods 0.000 description 6
- 238000004590 computer program Methods 0.000 description 3
- 238000012937 correction Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 2
- 239000004020 conductor Substances 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- BULVZWIRKLYCBC-UHFFFAOYSA-N phorate Chemical compound CCOP(=S)(OCC)SCSCC BULVZWIRKLYCBC-UHFFFAOYSA-N 0.000 description 2
- 238000003756 stirring Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 238000013019 agitation Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 210000002364 input neuron Anatomy 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 208000010125 myocardial infarction Diseases 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 239000013077 target material Substances 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Molecular Biology (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Complex Calculations (AREA)
- Feedback Control In General (AREA)
- Multi Processors (AREA)
Abstract
本発明は計算機支援のもとにダイナミック変化系の第1の状態の第1の時系列から現在の第1の状態を求める方法および装置に関する。本発明では系の現在の第1の状態が過去の系の情報を有する系内の第1の情報流と未来の系の情報を有する系内の第2の情報流とを組み合わせることにより求められる。
Description
【技術分野】
【0001】
本発明は、ダイナミック変化系の第1の状態の第1の時系列から現在の第1の状態を求める方法および装置に関する。
【0002】
引用文献[1]から、ダイナミックな系を記述するために時間的に変化する状態記述をマッピングする装置を使用することが知られている。この装置は相互に結合された計算素子によって実現されており、この計算素子を用いてマッピングが行われる。
【0003】
一般にダイナミックな系またはプロセスは通常は観察者にとって不可視の状態遷移と技術的にダイナミックな過程で観察される量を表す出力方程式とによって記述される。
【0004】
こうしたダイナミック系の構造は図2のAに示されている。
【0005】
ダイナミック系200は設定可能な次元の入力量uの外部入力を基礎としている。このとき時点tでの入力量utは
【0006】
【数1】
で表される。ここでlは自然数である。
【0007】
時点tでの入力量utはこの系200で進行するダイナミックプロセスの変化の原因である。
【0008】
時点tでの設定可能な次元mの内部状態st、すなわち
【0009】
【数2】
はダイナミック系200の観察者には不可視である。
【0010】
内部状態stおよび入力量utに依存して、ダイナミックプロセスの内部状態stの状態遷移が生じ、このプロセスの状態は時点t+1での結果の状態st+1へ移行する。ここでは
st+1=f(st,ut) (1)
が成り立つ。f(・)は一般的なマッピング規則である。
【0011】
ダイナミック系200の観察者が時点tで観察する出力量ytは入力量utおよび内部状態stに依存する。出力量yt、すなわち
【0012】
【数3】
は設定可能な次元nを有する。
【0013】
出力量ytと入力量utおよびダイナミックプロセスの内部状態stとの依存関係は一般的な規則
yt=g(st,ut) (2)
によって与えられる。ここでg(・)は一般的なマッピング規則である。
【0014】
ダイナミック系200を記述するために、引用文献[1]では複数の計算素子を相互に結合した装置を相互結合されたニューロンを有するニューラルネットのかたちに構成して使用している。ニューラルネットのニューロン間の結合は重みづけされている。ニューラルネットでの重みはパラメータベクトルvとしてまとめられている。
【0015】
このようにダイナミックプロセスに基づくダイナミック系の内部状態は、規則
st+1=NN(v,st,ut) (3)
にしたがって入力量ut、先行する時点での内部状態st、およびパラメータベクトルvに依存する。ここでNN(・)はニューラルネットによって設定されるマッピング規則である。
【0016】
引用文献[1]から公知のTDRNN(Time Delay Recurrent Neural Network)と称される装置はトレーニングフェーズで1つの入力量utにつきそれぞれ1つずつ目標量yd tを求めて訓練を行う。テューペル、つまり入力量や求められた目標量はトレーニングデータと称される。複数のトレーニングデータからトレーニングデータセットが形成される。
【0017】
その場合トレーニングデータセットの時点t−4,t−3,t−2,...での時間的に連続するテューペル(ut−4,yd t−4),(ut−3,yd t−3),(ut−2,yd t−2)はそれぞれ設定された時間ステップを有する。
【0018】
トレーニングデータセットによりTDRNNは訓練される。種々のトレーニングプロセスについては引用文献[1]に記載されている。
【0019】
ここでダイナミック系200では時点tでの出力量ytしか識別できないことを強調しておきたい。系内の状態stは不可視である。
【0020】
トレーニングフェーズでは通常は費用関数Eが最小化される。すなわち
【0021】
【数4】
となる。ここでTは考慮される時点の数である。
【0022】
引用文献[2]にはさらにニューラルネットの基礎理論の概観とこれを経済学の分野に応用したアプリケーションとが記載されている。
【0023】
これらの公知の方法および装置は、特にダイナミックな系またはプロセスの記述が不正確になってしまう欠点を有している。これはこれらの方法および装置で使用されるマッピングがダイナミックプロセスの状態遷移に充分に正確に追従していないためである。
【0024】
したがって本発明の課題は、時間的に変化する状態記述を計算機支援のもとにマッピングする方法および装置を提供し、前述の公知の装置の欠点なく、ダイナミック系の状態遷移を正確に記述できるようにすることである。
【0025】
この課題は本発明の独立請求項に記載の特徴を有する方法および装置によって解決される。
【0026】
第1の状態空間でダイナミック変化系の状態の第1の時系列から現在の第1の状態を求める本発明の方法では次のようなステップが行われる。すなわち、まず第2の状態空間で少なくとも1つの現在の第2の状態とこれよりも時間的に前方の過去の第2の状態とを有する系の第2の状態の第2の時系列が求められ、ついで第2の状態空間で少なくとも1つの未来の第3の状態とこれよりも時間的にさらに後方の第3の状態とを有する系の第3の状態の第3の時系列が求められ、さらに第2の状態空間の現在の第2の状態を第1の状態空間へ第1の変換で変換しかつ第2の状態空間の未来の第3の状態を第1の状態空間へ第2の変換で変換することにより、現在の第1の状態が求められる。
【0027】
第1の状態空間でダイナミック変化系の状態の第1の時系列から現在の第1の状態を求める装置では、系のそれぞれの状態を表す計算素子が相互に結合されており、この結合によって系の2つの状態のあいだの変換が表される。ここで第1の計算素子は、第2の状態空間で少なくとも1つの現在の第2の状態とこれよりも時間的に前方の過去の第2の状態とを有する系の第2の状態の第2の時系列を求めるように構成されている。また第2の計算素子は、第2の状態空間で少なくとも1つの未来の第3の状態とこれよりも時間的にさらに後方の第3の状態とを有する系の第3の状態の第3の時系列を求めるように構成されている。また第3の計算素子は、第1の変換で第2の状態空間の現在の第2の状態を第1の状態空間へ変換しかつ第2の変換で第2の状態空間の未来の第3の状態を第1の状態空間へ変換することにより、現在の第1の状態を求めるように構成されている。
【0028】
本発明の装置は特に本発明の方法または以下に説明する実施形態を実行するのに適している。
【0029】
具体的に言えば、系の現在の第1の状態は過去の系の情報を有する系内の第1の情報流と未来の系の情報を有する系内の第2の情報流とを組み合わせることによって求められる。ここから現在の第1の状態が得られる。
【0030】
本発明の有利な実施形態は従属請求項から得られる。以下に説明する実施形態は本発明の方法にも装置にも関連している。
【0031】
本発明および以下に説明するその実施形態はソフトウェアとしてもハードウェア(例えば専用の電気回路)としても実現することができる。また本発明およびその実施形態をコンピュータプログラムを記憶した読み出し可能な記憶媒体によって実現してもよい。さらに本発明および以下に説明するその実施形態をコンピュータプログラムを記憶したコンピュータプログラム製品によって実現してもよい。
【0032】
本発明の1つの実施形態では、第2の時系列のうち時間的に連続する2つの第2の状態が第3の変換により相互に結合される。
【0033】
第3の変換による結合は、時間的に後方の第2の状態を時間的に前方の第2の状態から求めることによって行われる。
【0034】
また本発明の別の実施形態では、第3の時系列のうち時間的に連続する2つの第3の状態が第4の変換により相互に結合される。
【0035】
第4の変換による結合は、時間的に前方の第3の状態を時間的に後方の第3の状態から求めることによって行われる。
【0036】
また本発明の別の実施形態では、現在の第2の状態を第3の変換で変換しかつ第1の状態空間の現在の状態を第5の変換で第2の状態空間へ変換することにより、第2の時系列のうち現在の第2の状態よりも時間的に後方の未来の第2の状態が求められる。
【0037】
ここでさらに、未来の第3の状態を第4の変換で変換しかつ第1の状態空間の現在の状態を第6の変換で第2の状態空間へ変換することにより、第3の時系列のうち未来の第3の状態よりも時間的に前方の現在の第3の状態が求められる。
【0038】
ダイナミック系の状態遷移を記述する際の正確性を向上させるために、求められた現在の第1の状態と設定された現在の第1の状態とのあいだの誤差が求められる。こうした誤差の算出による補正は“誤り補正”と称される。
【0039】
またダイナミック系の状態遷移を記述する際の正確性を向上させるために、第2の時系列の各第2の状態および/または第3の時系列の各第3の状態にそれぞれ1つずつ系外の状態情報を付与してもよい。
【0040】
なお、系の状態はベクトルを設定可能な次元によって記述される。
【0041】
本発明の別の実施形態はダイナミック変化系のダイナミクスを求めるために用いられる。第1の状態の第1の時系列がこのダイナミクスを記述する。
【0042】
本発明で求めるべきダイナミクスは心電図ECGのダイナミクスであり、このとき第1の状態の第1の時系列は心電図信号である。
【0043】
また本発明で求めるべきダイナミクスは経済学システムのダイナミクスであってもよく、このとき第1の状態の第1の時系列は相応の経済学的パラメータによって記述されるマクロ経済学的状況またはミクロ経済学的状況である。
【0044】
また本発明で求めるべきダイナミクスは化学的反応器のダイナミクスであってもよく、このとき第1の状態の第1の時系列は化学的反応器の化学的パラメータである。
【0045】
本発明の別の実施形態として、ダイナミック変化系の状態予測において求められた現在の第1の状態を予測される状態として用いることもできる。
【0046】
本発明の別の実施形態では、第1の計算素子および/または第2の計算素子に結合された第4の計算素子が設けられており、この第4の計算素子には系外の状態情報を含む第4の時系列の第4の状態が供給される。
【0047】
本発明のさらに別の実施形態では、計算素子の少なくとも一部は人工ニューロンで構成されており、および/または少なくとも一部は計算素子間の結合によって可変に構成されている。
【0048】
またダイナミック変化系の状態を記述する物理的信号を検出する測定装置が設けられている。
【0049】
本発明は音声処理に適用することができる。このとき、系外の状態情報とは発音すべき語および/または音節および/または音素の第1の音声情報であり、現在の第1の状態とは発音すべき語および/または音節および/または音素の第2の音声情報を含む。
【0050】
またこの実施形態において、第1の音声情報は発音すべき語および/または音節および/または音素のクラス、および/またはこれらの休止情報を含み、第2の音声情報は発音すべき語および/または音節および/または音素のアクセント情報、および/または発音すべき語および/または音節および/または音素の音の長さ情報を含むものであってもよい。
【0051】
またこの実施形態において、第1の音声情報が発音すべき語および/または音節および/または音素の音声学的情報および/または構造情報を含み、および/または第2の音声情報は発音すべき語および/または音節および/または音素の周波数情報、および/または発音すべき語および/または音節および/または音素の音の持続時間の情報を含むものであってもよい。
【0052】
本発明の実施例を図示し、以下に説明する。
【0053】
図1には第1の実施例の装置KRKNNが示されている。図2のA,Bには一般的なダイナミック系と“因果律‐逆行因果律”関係に基づくダイナミック系とが示されている。図3には第2の実施例の装置KRKFKNNが示されている。図4には第1の実施例の装置を用いてパラメータを測定し処理する化学的反応器が示されている。図5には有限の多数の状態が所定の時間にわたって延在している装置TDRNNが示されている。図6には第2の実施例の装置でモデリングされる交通案内系が示されている。図7には第1の実施例の装置の代替手段(一部の結合を解除したKRKNN)が示されている。図8には第2の実施例の装置の代替手段(一部の結合を解除したKRKNN)が示されている。図9には第1の実施例の装置のさらに別の代替手段(KRKNN)が示されている。図10には第1の実施例の装置KRKNNを用いた音声処理の様子が示されている。図11には第2の実施例の装置KRKFKNNを用いた音声処理の様子が示されている。
【0054】
第1の実施例:化学的反応器
図4は化学的反応器400を示す。この反応器には化学物質401が充填されている。化学的反応器400は撹拌機402を有し、この撹拌機により化学物質401が撹拌される。この化学的反応器400には別の化学物質403が流入し、所定の時間のあいだ化学的反応器400内でこの化学的反応器400にすでに含まれている化学物質401と反応する。反応器400から流出する物質404は化学的反応器400から出口を介して導かれる。
【0055】
撹拌機402は線路を介して制御ユニット405と接続されており、この制御ユニットにより制御信号406を介して撹拌機402の撹拌周波数が調整される。
【0056】
さらに測定装置407が設けられており、この測定装置により化学物質401に含まれる化学的材料の濃度が測定される。
【0057】
測定信号408は計算機またはコンピュータ409に供給され、この計算機409で入出力インタフェース410およびA/D変換器411を介してデジタル化され、メモリ412に記憶される。プロセッサ413もメモリ412と同様にバス414を介してA/D変換器411と接続されている。計算機409はさらに入出力インタフェース410を介して撹拌機402の制御ユニット405と接続されており、これにより計算機409は撹拌機402の撹拌周波数を制御する。
【0058】
計算機409はさらに入出力インタフェース410を介してキーボード415,計算機マウス416および画面417と接続されている。
【0059】
化学的反応器400は技術的ダイナミック系としてダイナミックプロセスを受ける。
【0060】
化学的反応器400は状態記述によって記述される。この状態記述の入力量utはこの場合、化学的反応器400内の温度、圧力、および時点tで調整された撹拌周波数から合成される。したがって入力量utは3次元のベクトルである。
【0061】
化学的反応器400の以下に説明するモデリングの目的は材料濃度のダイナミックな展開の検出であり、これにより流出物質404として生成すべき所定の目標材料の効率的な形成を可能にするものである。
【0062】
このことは後に説明する図1の装置を使用して行われる。
【0063】
化学的反応器400の基礎となり、いわゆる“因果律‐逆行因果律”関係を有するダイナミックプロセスは状態移行記述と出力方程式により記述される。この状態移行記述は観察者には不可視であり、出力方程式は技術的ダイナミックプロセスの観察量を記述する。
【0064】
“因果律‐逆行因果律”関係を備えるこのようなダイナミック系の構造が図2のBに示されている。
【0065】
ダイナミック系250は所定の次元の外部入力量uの影響を受ける。ここで時点tにおける入力量utは
【0066】
【数5】
である。ここで1は自然数を表す。
【0067】
時点tでの入力量utによりダイナミック系250で経過するダイナミックプロセスの変化が引き起こされる。
【0068】
系250の観察者にとっては不可視の時点tにおける系250の内部状態は、この場合、第1の内部部分状態stと第2の内部部分状態rtから合成される。
【0069】
相対的に早期の時点t−1における第1内部部分状態st−1と入力量utとに依存して、ダイナミックプロセスの第1内部部分状態st−1が後続の状態stへ移行する。ここでは、
st=f1(st−1,ut) (5)
が成立する。ここでf1(・)は一般的マッピング規則を表す。
【0070】
具体的に言えば、第1内部部分状態stは相対的に早期の第1内部部分状態st−1と
入力量utとの影響を受ける。このような関係を通常は“因果律”と称する。
【0071】
後続の時点t+1における第2内部部分状態rt+1と入力量utとに依存して、ダイナミックプロセスの第2内部部分状態rt+1が後続の状態rtへ移行する。ここでは、
rt=f2(rt+1,ut) (6)
が成立する。ここでf2(・)は一般的マッピング規則を表す。
【0072】
具体的に言えばこの場合、第2内部部分状態rtは相対的に後期の第2の部分状態rt+1と入力量utとから影響を受ける。第2の部分状態は一般的にはダイナミック系250の相対的に後期の状態についての予測である。このような関係を“逆行因果律”と称する。
【0073】
したがって時点tにおけるダイナミック系250の観察者に可視の出力量ytは、入力量ut、第1内部部分状態stおよび第2内部部分状態rt+1に依存する。
【0074】
出力量
【0075】
【数6】
は設定可能な次元nを有する。
【0076】
出力量yt、入力量ut、第1内部部分状態stおよび第2内部部分状態rt+1の依存関係は次の一般的規則により与えられる。
yt=g(st,rt+1) (7)
ここでg(・)は一般的マッピング規則を表す。
【0077】
ダイナミック系250およびその状態を記述するために、ニューロンの相互に結合されたニューラルネットワークの形態で相互に結合された計算素子の装置が使用される。この装置が図1に示されており、“因果律‐逆行因果律”ニューラルネットワークKRKNNと称される。
【0078】
ニューラルネットワークのニューロン間の結合は重み付けされている。ニューラルネットワークの重み付けはパラメータベクトルvにまとめられている。
【0079】
ニューラルネットワークでは第1内部部分状態stおよび第2内部部分状態rtは次の規則にしたがって、入力量ut、第1内部部分状態st−1,第2内部部分状態rt+1およびパラメータベクトルvs、vt、vyに依存する。すなわち
st=NN(vs,st−1,ut) (8)
rt=NN(vr,rt+1,ut) (9)
yt=NN(vy,st,rt) (10)
ここでNN(・)はニューラルネットワークによって設定されるマッピング規則である。
【0080】
図1のKRKNN100は4つの時点t−1,t,t+1,t+2にわたって展開されたニューラルネットワークである。
【0081】
有限の数の時点にわたって展開されたニューラルネットワークの基礎理論は引用文献[1]に記載されている。
【0082】
KRKNNの基礎となる原理を理解しやすくするために、図5には公知のTDRNNが有限の数の時点にわたって展開されたニューラルネットワーク500として示されている。
【0083】
図5に示されたニューラルネットワーク500は3つの部分入力層502,503,504を備えた入力層501を有しており、これらの部分入力層はそれぞれ所定数の入力計算素子を含んでいる。この入力計算素子には、後述する時系列値内の所定の時点tで入力量utを印加することができる。
【0084】
入力計算素子、すなわち入力ニューロンは可変の結合を介して所定数の隠れ層505のニューロンと結合している。
【0085】
第1の隠れ層506のニューロンは第1の部分入力層502と結合されている。さらに第2の隠れ層507のニューロンは第2の部分入力層503のニューロンと結合されている。第3の隠れ層508のニューロンは第3の部分入力層504のニューロンと結合されている。
【0086】
第1の部分入力層502と第1の隠れ層506との結合、第2の部分入力層503と第2の隠れ層507との結合、および第3の部分入力層504と第3の隠れ層508との結合はそれぞれ同じである。全ての結合の重み付けはそれぞれ第1の結合マトリクスBに含まれている。
【0087】
第4の隠れ層509のニューロンの入力側は第2の結合マトリクスA2により与えられる構造にしたがって第1の隠れ層506のニューロンの出力側と結合されている。さらに第4の隠れ層509のニューロンの出力側は第3の結合マトリクスA1により与えられる構造にしたがって第2の隠れ層507のニューロンの入力側と結合されている。
【0088】
また第5の隠れ層510のニューロンの入力側は第2の結合マトリクスA2により与えられる構造にしたがって第2の隠れ層507のニューロンの出力側と結合されている。さらに第5の隠れ層510のニューロンの出力側は第3の結合マトリクスA1により与えられる構造にしたがって第3の隠れ層508のニューロンの入力側と結合されている。
【0089】
同じことが第6の隠れ層511に対する結合構造に対しても当てはまり、これは第2の結合マトリクスA2により与えられる構造にしたがって第3の隠れ層508のニューロンの出力側と結合されており、さらに第3の結合マトリクスA1により与えられる構造にしたがって第7の隠れ層512のニューロンと結合されている。
【0090】
第8の隠れ層513のニューロンも、第2の結合マトリクスA2により与えられる構造にしたがって第7の隠れ層512のニューロンと結合されており、さらに第3の結合マトリクスA1による結合を介して第9の隠れ層514のニューロンと結合されている。それぞれの層における指数はそれぞれの時点t−2,t−1,t,t+1,t+2を表し、これらの時点にそれぞれの層の出力側で取り出される信号や、入力側に供給される信号(ut,ut−1,ut−2)が関連する。
【0091】
出力層520は3つの部分出力層、すなわち第1部分出力層521,第2部分出力層522および第3部分出力層523を有する。第1部分出力層521のニューロンは出力結合マトリクスCにより与えられる構造にしたがって第3の隠れ層508のニューロンと結合されている。第2部分出力層のニューロンも同様に、出力結合マトリクスCにより与えられる構造にしたがって第8の隠れ層512のニューロンと結合されている。第3部分出力層523のニューロンは出力結合マトリクスCにしたがって第9の隠れ層514のニューロンと結合されている。部分出力層521,522および523のニューロンにおいて、それぞれ時点t,t+1,t+2に対する出力量(yt,yt+1,yt+2)が取り出される。
【0092】
いわゆる分割された重み(Shared Weights)の原理、すなわちニューラルネットワークでは等価の結合テンプレートがそれぞれの時点で同じ値を有するという原理に基づいて、さらに図1に示された装置を説明する。
【0093】
以下の説明では各層ないし各部分層が所定数のニューロンすなわち計算素子を有するものであると理解されたい。
【0094】
1つの層の部分層はそれぞれ、装置により記述されるダイナミック系の系状態を表す。隠れ層の部分層は相応にそれぞれ“系内部”の状態を表す。
【0095】
それぞれの結合テンプレートは任意の次元であり、それぞれの層のニューロン間の相応する結合に対して重み付け値を含んでいる。
【0096】
結合は方向付けられており、図1ではその方向が矢印によって示されている。矢印方向は“計算方向”、とりわけマッピング方向または変換方向を表す。
【0097】
図1に示された装置は、4つの部分入力層101,102,103,104を備える入力層100を有し、各部分入力層101,102,103,104にはそれぞれ時点t−1,t、t+1,t+2でそれぞれ時系列値ut−1,ut,ut+1,ut+2を供給することができる。
【0098】
入力層100の部分入力層101,102,103,104はそれぞれ第1の結合マトリクスAによる結合を介して第1の隠れ層110のニューロンと結合されている。第1の隠れ層110はそれぞれ4つの部分層111,112,113,114を備えている。
【0099】
入力層100の部分入力層101,102,103,104は付加的にそれぞれ第2の結合マトリクスBによる結合を介して第2の隠れ層120のニューロンと結合されている。第2の隠れ層120はそれぞれ4つの部分層121,122,123,124を備えている。
【0100】
第1の隠れ層110のニューロンはそれぞれ、第3の結合マトリクスCにより与えられる構造にしたがって出力層140のニューロンと結合されており、この出力層140も4つの部分出力層141,142,143,144を有する。
【0101】
出力層140のニューロンはそれぞれ第4の結合マトリクスDにより与えられる構造にしたがって第2の隠れ層120のニューロンに結合されている。また出力層140のニューロンはそれぞれ第8の結合マトリクスGにより与えられる構造にしたがって第1の隠れ層110のニューロンに結合されている。また第2の隠れ層120のニューロンはそれぞれ第7の結合マトリクスHにより与えられる構造にしたがって出力層140のニューロンに結合されている。
【0102】
さらに第1の隠れ層110の部分層111は第5の結合マトリクスEにより与えられる構造にしたがって第1の隠れ層110の部分層112のニューロンと結合されている。
【0103】
相応の結合を第1の隠れ層110の残りの部分層112,113,114も有している。具体的に言えば、第1の隠れ層110の全ての部分層111,112,113,114は時系列t−1,t,t+1,t+2に相応して相互に結合されている。
【0104】
第2の隠れ層120の部分層121,122,123,124は相互にちょうど反対向きに結合されている。この場合、第2の隠れ層120の部分層124は第6の結合マトリクスFにしたがった結合を介して、第2の隠れ層120の部分層123のニューロンと結合されている。相応の結合を第2の隠れ層120の他の全ての部分層123,122,121も有している。
【0105】
具体的に言えばこの場合、第2の隠れ層120の全ての部分層121,122,123,124はその時系列と反対に、すなわちt+2,t+1,t,t−1で相互に結合されている。
【0106】
前記の結合に相応して、第1の隠れ層の部分層112,113,114の“系内”の状態st,st+1,st+2が、それぞれ対応する入力状態ut,ut+1,ut+2および時間的に前方の出力状態yt−1,yt,yt+1または時間的に前方の系内の状態st−1,st,st+1から形成される。
【0107】
さらに前記の結合に相応して、第2の隠れ層120の部分層121,122,123の“系内”の状態rt−1,rt,rt+1が、それぞれ対応する入力量ut−1,ut,ut+1および時間的に後方の出力状態yt−1,yt,yt+1または時間的に後方の“系内”の状態rt,rt+1,rt+2から形成される。
【0108】
出力層140の部分出力層141,142,143,144ではそれぞれ第1の隠れ層110の部分層111,112,113,114の対応する“系内”の状態st−1,st,st+1,st+2および第2の隠れ層120の部分層121,122,123,124の対応する“系内”の状態rt−1,rt,rt+1,rt+2から形成される。
【0109】
出力層140の第1の部分出力層141の出力側では、“系内”の状態(st,rt)に依存する信号を取り出すことができる。
【0110】
相応のことは部分出力層142,143および144に対しても当てはまる。
【0111】
KRKNNのトレーニングフェーズでは、次の費用関数Eが最小化される。すなわち
【0112】
【数7】
となる。ここでTは考慮された時点の数を表す。
【0113】
トレーニング方法として逆伝播プロセスが使用される。トレーニングデータセットは次のようにして化学的反応器400から得られる。
【0114】
測定装置407により設定すべき入力量すなわち濃度が測定され、計算機409に供給されそこでデジタル化される。この値は時系列値xtとして、測定されたパラメータに対応する相応の入力量とともにメモリ内でグループ化される。
【0115】
トレーニング時には、それぞれの結合テンプレートの重みが適合化される。この適合化は、KRKNNが追従したダイナミック系(この場合は化学的反応器)をできるだけ正確に記述するように行われる。
【0116】
図1の装置はトレーニングデータセットおよび費用関数Eを使用してトレーニングされる。
【0117】
上記のトレーニング方法にしたがってトレーニングされた図1の装置は化学的反応器400の制御および監視のために使用される。そのために、入力量ut−1,utから予測される出力量yt+1が検出される。この量は引き続き制御量として、または場合により処理後に、撹拌機402制御のための制御手段405および供給制御のための制御装置430へ供給される(図4を参照)。
【0118】
2.第2の実施例:賃貸料の予測
図3には、前述の実施例に則して説明した図1のKRKNNの発展形態が示されている。
【0119】
図3に示された発展形態はいわゆる“因果律‐逆行因果律‐誤り補正ニューラルネットワーク”KRKFKNNであり、賃貸料予測に対して使用される。
【0120】
入力量utはこの場合、賃貸料、住居提供量、物価上昇率および失業率についての情報から合成される。これらの情報は調査すべき住居地区についてそれぞれ年末に(12月値として)検出される。したがって入力量は4次元ベクトルである。時間的に順次連続する複数のベクトルからなる入力量の時間順序はそれぞれ1年の時間ステップを有する。
【0121】
後述する賃貸料マッピングのモデルの目的は将来の賃貸料の予測である。
【0122】
賃貸料マッピングのダイナミックプロセスの記述は後述する図3の装置を使用して行われる。
【0123】
図1と同じ構成を有する素子には同じ参照符号を付してある。
【0124】
付加的にKRKFKNNは4つの部分入力層151,152,153,154を備える第2の入力層150を有する。ここで各部分入力層151,152,153,154にはそれぞれの時点t−1,t,t+1,t+2での時系列値yd t−1,yd t,yd t+1,yd t+2を供給することができる。ここで時系列値yd t−1,yd t,yd t+1,yd t+2はダイナミック系で測定された出力値である。
【0125】
入力層150の部分入力層151,152,153,154はそれぞれ負のアイデンティティマトリクスである第9の結合マトリクスによる結合を介して出力層140のニューロンへ結合されている。
【0126】
したがって出力層の部分出力層141,142,143,144ではそれぞれ差状態(yt−1−yd t−1)、(yt−yd t)(yt+1−yd t+1)、(yt+2−yd t+2)が形成される。
【0127】
上記の装置をトレーニングするための手段は第1の実施例の装置をトレーニングする場合と同じである。
【0128】
3.第3の実施例:交通状況モデリングおよび渋滞警報予測
以下に説明する第3の実施例は交通状況モデルを記述するものであり、渋滞予測に使用される。この第3の実施例では第1の実施例による装置が使用される(図1を参照)。
【0129】
ただし第3の実施例は、時間変数として使用された変数tが場所の変数tとして使用される点で第1の実施例および第2の実施例と異なる。したがって時点tでの状態記述は、この第3の実施例では第1の場所tでの状態記述となる。相応のことがそれぞれ時点t−1.t+1,t+2における状態記述にも当てはまる。
【0130】
さらに時間変数を場所の変数とすることにより、場所t−1,t、t+1,t+2は所定の走行方向での走行区間に沿って順次連続して配置される。
【0131】
図6は、自動車601,602,603,604,605,606が走行する道路600を示す。
【0132】
道路600に組み込まれた導体路ループ610,611は電気信号を公知のように記録し、電気信号615,616をコンピュータ620に入出力インタフェース621を介して供給する。入出力インタフェース621と接続されたA/D変換器622では電気信号が時系列においてデジタル化され、メモリ623に記憶される。このメモリはバス624を介してA/D変換器622およびプロセッサ625と接続されている。入出力インタフェース621を介して交通案内系650には制御信号651が供給される。この制御信号から交通案内系650では所定の速度652が設定されるかまたは交通放棄に基づいた別の指示が行われ、これらは交通案内系650を介して車両601,602,603,604,605,606の運転者に表示される。
【0133】
交通状況のモデリングのためにこの場合、
・交通量速度v
・車両密度ρ(ρ=1km当たりの車両数Fz/km)
・交通量q(q=1時間当たりの車両数Fz/h)(q=v*ρ)
・各時点で交通案内系650により表示される速度制限値652
の状態量が使用される。
【0134】
局所的状態量は上に述べたように導体路ループ610,611を使用して測定される。
【0135】
したがってこれらの量(v(t)、ρ(t)、q(t))は所定の時点tでの技術的系“交通状況”を表す。これらの量から、それぞれ瞬時の状態の評価値r(t)が例えば交通量および均一性について得られる。この評価は定量的および定性的に行われる。
【0136】
この実施例において、交通ダイナミクスは2つのフェーズでモデリングされる。すなわち、適用フェーズで検出された予測量から制御信号651が形成され、この制御信号によりどの速度制限値を将来の時間t+1に対して選択すべきかが指示される。
【0137】
4.その他の実施例
さらに上記の実施例について幾つかの選択手段を挙げる。
【0138】
選択可能な適用分野
第1の実施例で説明した装置は、心電図ECGのダイナミクスを検出するためにも使用できる。これにより早期に心筋梗塞の危険性の高まりを指示する徴候を検出することができる。入力量として患者から測定されたECG値の時系列が使用される。
【0139】
第1の実施例に対する別の例では、第1の実施例による装置を第3の実施例による交通状況のモデリングのために使用することもできる。この場合、元の第1の実施例では時間変数として使用されていた変数tが第3の実施例に則して説明したように場所の変数tとして使用される。このために第3の実施例での構成が相応に適用される。
【0140】
第1の実施例に対する第3の例として、第1の実施例の装置が音声処理に使用される(図10を参照)。このような音声処理の基礎は引用文献[3]から公知である。
【0141】
この場合、装置KRKNN1000はアクセントを付与すべき文章1010中のアクセントを定めるために使用される。
【0142】
このためにアクセントすべき文章1010は語1011に分解され、語がそれぞれクラス1012へ分類される(Part-of-speech-tagging)。クラス1012にはそれぞれコード1013が付される。各コード1013は休止情報(フレーズ中断情報)1014について拡張される。この休止情報は、アクセントすべき文章1010の発音の際にそれぞれの語の後に休止が生じるか否かを指示する。
【0143】
アクセントすべき文章のこのようなコード化は引用文献[3]および[4]から公知である。
【0144】
文章の拡張コード1015から時系列1016がマッピングされる。すなわち、状態の時間的順序がアクセントすべき文章1010中の語順の時系列に相応するようにマッピングが行われる。この時系列1016が装置1000に印加される。
【0145】
この装置は次に各語1011に対してアクセント情報1020を検出する。これらのアクセント情報は、それぞれの語がアクセントして発音されるか否かを指示する(HA:メインアクセントまたは強アクセント、NA:サブアクセントまたは弱アクセント、KA:アクセントなし)。
【0146】
このための構成は第1の実施例において適用されるものに相応する。
【0147】
また第2の実施例に則して説明した装置は、マクロ経済学的ダイナミクス、例えば為替相場のダイナミクス、または他の経済学的係数の予測、例えば取引相場の予測にも使用できる。この種の予測の場合、関連するマクロ経済学的係数ないしミクロ経済学的係数の時系列からの入力量、例えば金利、為替相場またはインフレ率などがマッピングされる。
【0148】
第2の実施例に対する別の例では、第2の実施例による装置が音声処理に使用される(図11を参照)。このような音声処理の基礎は引用文献[5][6][7][8]から公知である。
【0149】
音節に基づく音声処理において、装置KRKFKNN1100が文章中の語の音節の周波数特性をモデリングするために使用される。このようなモデリングも引用文献[5][6][7][8]から公知である。
【0150】
このためにモデリングすべき文章1110を音節1111に分解する。各音節に対して、これを音声学的および構造的に記述する状態ベクトル1112を検出する。
【0151】
このような状態ベクトル1112はタイミング情報1113,音声学情報1114,シンタクス情報1115およびアクセント情報1116を含む。
【0152】
このような状態ベクトル1112は引用文献[4]に記載されている。
【0153】
モデリングすべき文章1110の音節1111の状態ベクトル1112から時系列1117が形成される。すなわち状態の時間的順序がモデリングすべき文章1110中の音節1111の順序の時系列1117に相応するよう形成される。この時系列1117は装置1100に印加される。
【0154】
装置1100は次に各音節1111に対して、パラメータ1120を有するパラメータベクトル1122を検出する。このパラメータはfomaxpos,fomaxalpha,lp,rpであり、これらはそれぞれの音節1111の周波数特性1121を記述する。
【0155】
このようなパラメータ1120およびパラメータによる周波数特性1121の記述は引用文献[5][6][7][8]から公知である。
【0156】
このための構成は第2の実施例で適用されるものに相応する。
【0157】
別の構造の例
図7には、図1の第1の実施例の装置に対する構造の別の例が示されている。図1と同じ構成を有する素子には図7においても同じ参照符号を付してある。
【0158】
図1に示された装置と異なる点は、図7の装置では結合701〜711が解除ないし中断されていることである。この装置すなわち結合の解除されたKRKNNはトレーニングフェーズでも適用フェーズでも使用することができる。この装置のトレーニングおよび適用は第1の実施例について説明したのと同様に実行される。
【0159】
図8には、図3の第2の実施例による装置に対する構造の別の例が示されている。
【0160】
図3と同じ構成を有する素子には図8でも同じ参照符号が付してある。図3に示した装置と異なる点は、図8の装置では結合801〜813が解除ないし中断されていることである。この装置すなわち結合の解除されたKRKFKNNはトレーニングフェーズでも適用フェーズでも使用することができる。この装置のトレーニングおよび適用も第1の実施例について説明したのと同様に実行される。
【0161】
結合の解除されたKRKNNをトレーニングフェーズのみに用い、第1の実施例の(結合が解除されていない)KRKNNを適用フェーズに用いることも可能である。
【0162】
結合の解除されたKRKNNを適用フェーズのみに用い、第1の実施例の(結合が解除されていない)KRKNNをトレーニングフェーズに用いることも可能である。
【0163】
相応のことが結合の解除されたKRKFKNNおよびKRKFKNNに対しても当てはまる。
【0164】
第1の実施例の装置に対する別の構造の例が図9に示されている。
【0165】
図9の装置は、固定点回帰を有するKRKNNである。
【0166】
図1と同じ構成を有する素子には図9でも同じ参照符号を付してある。図1に示した装置に対して異なる点は、図9の装置では付加的結合901,902,903,904が設けられていることである。
【0167】
付加的結合901,902,903,904はそれぞれ重み付けされた結合マトリクスGTを有する。
【0168】
この装置はトレーニングフェーズでも適用フェーズでも使用することができる。
【0169】
この装置のトレーニングおよび適用は第1の実施例について説明したのと同様に実施される。
【0170】
本明細書では以下の刊行物を引用している。
[1]S.Hayken, Neural Networks: A Comprehensive Foundation, McMillan College Publishing Company, Second Edition, ISBN0-13-273350-1, 1999 732頁〜789頁
[2]H.Rehkugler & H.G.Zimmermann, Neuronale Netze in der Oekonomie, Grundlagen und finanzwirtschaftliche Anwendungen, Verlag Franz Vahlen Muenchen, ISBN3-8006-1871-0, 1994 3頁〜90頁
[3]J.Hirschberg, Pitch accent in context: predicting intonational prominence from text, Artificial Intelligence63, Elsevier, 1993 305頁〜340頁
[4]K.Ross et al., Prediction of abstract prosodic labels for speech synthesis, Computer Speech and Language, 10, 1996 155頁〜185頁
[5]R.Haury et al., Optimisation of a Neural Network for Pitch Contour Generation, ICASSP, Seattle, 1998
[6]C.Traber, F0 generation with a database of natural F0 patterns and with a neural network, G.Bailly and C.Benoit eds., Talking Machines: Theories, Models and Applications, Elsevier, 1992
[7]E.Heuft et al., Parametric Description of F0-Contours in a Prosodic Database, Proc.ICPHS, Vol.2, 1995 378頁〜381頁
[8]C.Erdem, Topologieoptimierung eines Neuronalen Netzes zur Generierung von F0-Verlaeufen durch Integration unterschiedlicher Codierungen, Tagungsband ESSV, Cottbus, 2000
【図面の簡単な説明】
【0171】
【図1】第1の実施例の装置を示す図である。
【0172】
【図2】一般的なダイナミック系と“因果律‐逆行因果律”関係に基づくダイナミック系とを示す図である。
【0173】
【図3】第2の実施例の装置を示す図である。
【0174】
【図4】第1の実施例の装置を用いてパラメータを処理する化学的反応器を示す図である。
【0175】
【図5】有限の多数の状態が所定の時間にわたって延在している装置を示す図である。
【0176】
【図6】第2の実施例の装置でモデリングされる交通案内系を示す図である。
【0177】
【図7】第1の実施例の装置の代替手段を示す図である。
【0178】
【図8】第2の実施例の装置の代替手段を示す図である。
【0179】
【図9】第1の実施例の装置のさらに別の代替手段を示す図である。
【0180】
【図10】第1の実施例の装置(KRKNN)を用いた音声処理の様子を示す図である。
【0181】
【図11】第2の実施例の装置(KRKFKNN)を用いた音声処理の様子を示す図である。
【0001】
本発明は、ダイナミック変化系の第1の状態の第1の時系列から現在の第1の状態を求める方法および装置に関する。
【0002】
引用文献[1]から、ダイナミックな系を記述するために時間的に変化する状態記述をマッピングする装置を使用することが知られている。この装置は相互に結合された計算素子によって実現されており、この計算素子を用いてマッピングが行われる。
【0003】
一般にダイナミックな系またはプロセスは通常は観察者にとって不可視の状態遷移と技術的にダイナミックな過程で観察される量を表す出力方程式とによって記述される。
【0004】
こうしたダイナミック系の構造は図2のAに示されている。
【0005】
ダイナミック系200は設定可能な次元の入力量uの外部入力を基礎としている。このとき時点tでの入力量utは
【0006】
【数1】
で表される。ここでlは自然数である。
【0007】
時点tでの入力量utはこの系200で進行するダイナミックプロセスの変化の原因である。
【0008】
時点tでの設定可能な次元mの内部状態st、すなわち
【0009】
【数2】
はダイナミック系200の観察者には不可視である。
【0010】
内部状態stおよび入力量utに依存して、ダイナミックプロセスの内部状態stの状態遷移が生じ、このプロセスの状態は時点t+1での結果の状態st+1へ移行する。ここでは
st+1=f(st,ut) (1)
が成り立つ。f(・)は一般的なマッピング規則である。
【0011】
ダイナミック系200の観察者が時点tで観察する出力量ytは入力量utおよび内部状態stに依存する。出力量yt、すなわち
【0012】
【数3】
は設定可能な次元nを有する。
【0013】
出力量ytと入力量utおよびダイナミックプロセスの内部状態stとの依存関係は一般的な規則
yt=g(st,ut) (2)
によって与えられる。ここでg(・)は一般的なマッピング規則である。
【0014】
ダイナミック系200を記述するために、引用文献[1]では複数の計算素子を相互に結合した装置を相互結合されたニューロンを有するニューラルネットのかたちに構成して使用している。ニューラルネットのニューロン間の結合は重みづけされている。ニューラルネットでの重みはパラメータベクトルvとしてまとめられている。
【0015】
このようにダイナミックプロセスに基づくダイナミック系の内部状態は、規則
st+1=NN(v,st,ut) (3)
にしたがって入力量ut、先行する時点での内部状態st、およびパラメータベクトルvに依存する。ここでNN(・)はニューラルネットによって設定されるマッピング規則である。
【0016】
引用文献[1]から公知のTDRNN(Time Delay Recurrent Neural Network)と称される装置はトレーニングフェーズで1つの入力量utにつきそれぞれ1つずつ目標量yd tを求めて訓練を行う。テューペル、つまり入力量や求められた目標量はトレーニングデータと称される。複数のトレーニングデータからトレーニングデータセットが形成される。
【0017】
その場合トレーニングデータセットの時点t−4,t−3,t−2,...での時間的に連続するテューペル(ut−4,yd t−4),(ut−3,yd t−3),(ut−2,yd t−2)はそれぞれ設定された時間ステップを有する。
【0018】
トレーニングデータセットによりTDRNNは訓練される。種々のトレーニングプロセスについては引用文献[1]に記載されている。
【0019】
ここでダイナミック系200では時点tでの出力量ytしか識別できないことを強調しておきたい。系内の状態stは不可視である。
【0020】
トレーニングフェーズでは通常は費用関数Eが最小化される。すなわち
【0021】
【数4】
となる。ここでTは考慮される時点の数である。
【0022】
引用文献[2]にはさらにニューラルネットの基礎理論の概観とこれを経済学の分野に応用したアプリケーションとが記載されている。
【0023】
これらの公知の方法および装置は、特にダイナミックな系またはプロセスの記述が不正確になってしまう欠点を有している。これはこれらの方法および装置で使用されるマッピングがダイナミックプロセスの状態遷移に充分に正確に追従していないためである。
【0024】
したがって本発明の課題は、時間的に変化する状態記述を計算機支援のもとにマッピングする方法および装置を提供し、前述の公知の装置の欠点なく、ダイナミック系の状態遷移を正確に記述できるようにすることである。
【0025】
この課題は本発明の独立請求項に記載の特徴を有する方法および装置によって解決される。
【0026】
第1の状態空間でダイナミック変化系の状態の第1の時系列から現在の第1の状態を求める本発明の方法では次のようなステップが行われる。すなわち、まず第2の状態空間で少なくとも1つの現在の第2の状態とこれよりも時間的に前方の過去の第2の状態とを有する系の第2の状態の第2の時系列が求められ、ついで第2の状態空間で少なくとも1つの未来の第3の状態とこれよりも時間的にさらに後方の第3の状態とを有する系の第3の状態の第3の時系列が求められ、さらに第2の状態空間の現在の第2の状態を第1の状態空間へ第1の変換で変換しかつ第2の状態空間の未来の第3の状態を第1の状態空間へ第2の変換で変換することにより、現在の第1の状態が求められる。
【0027】
第1の状態空間でダイナミック変化系の状態の第1の時系列から現在の第1の状態を求める装置では、系のそれぞれの状態を表す計算素子が相互に結合されており、この結合によって系の2つの状態のあいだの変換が表される。ここで第1の計算素子は、第2の状態空間で少なくとも1つの現在の第2の状態とこれよりも時間的に前方の過去の第2の状態とを有する系の第2の状態の第2の時系列を求めるように構成されている。また第2の計算素子は、第2の状態空間で少なくとも1つの未来の第3の状態とこれよりも時間的にさらに後方の第3の状態とを有する系の第3の状態の第3の時系列を求めるように構成されている。また第3の計算素子は、第1の変換で第2の状態空間の現在の第2の状態を第1の状態空間へ変換しかつ第2の変換で第2の状態空間の未来の第3の状態を第1の状態空間へ変換することにより、現在の第1の状態を求めるように構成されている。
【0028】
本発明の装置は特に本発明の方法または以下に説明する実施形態を実行するのに適している。
【0029】
具体的に言えば、系の現在の第1の状態は過去の系の情報を有する系内の第1の情報流と未来の系の情報を有する系内の第2の情報流とを組み合わせることによって求められる。ここから現在の第1の状態が得られる。
【0030】
本発明の有利な実施形態は従属請求項から得られる。以下に説明する実施形態は本発明の方法にも装置にも関連している。
【0031】
本発明および以下に説明するその実施形態はソフトウェアとしてもハードウェア(例えば専用の電気回路)としても実現することができる。また本発明およびその実施形態をコンピュータプログラムを記憶した読み出し可能な記憶媒体によって実現してもよい。さらに本発明および以下に説明するその実施形態をコンピュータプログラムを記憶したコンピュータプログラム製品によって実現してもよい。
【0032】
本発明の1つの実施形態では、第2の時系列のうち時間的に連続する2つの第2の状態が第3の変換により相互に結合される。
【0033】
第3の変換による結合は、時間的に後方の第2の状態を時間的に前方の第2の状態から求めることによって行われる。
【0034】
また本発明の別の実施形態では、第3の時系列のうち時間的に連続する2つの第3の状態が第4の変換により相互に結合される。
【0035】
第4の変換による結合は、時間的に前方の第3の状態を時間的に後方の第3の状態から求めることによって行われる。
【0036】
また本発明の別の実施形態では、現在の第2の状態を第3の変換で変換しかつ第1の状態空間の現在の状態を第5の変換で第2の状態空間へ変換することにより、第2の時系列のうち現在の第2の状態よりも時間的に後方の未来の第2の状態が求められる。
【0037】
ここでさらに、未来の第3の状態を第4の変換で変換しかつ第1の状態空間の現在の状態を第6の変換で第2の状態空間へ変換することにより、第3の時系列のうち未来の第3の状態よりも時間的に前方の現在の第3の状態が求められる。
【0038】
ダイナミック系の状態遷移を記述する際の正確性を向上させるために、求められた現在の第1の状態と設定された現在の第1の状態とのあいだの誤差が求められる。こうした誤差の算出による補正は“誤り補正”と称される。
【0039】
またダイナミック系の状態遷移を記述する際の正確性を向上させるために、第2の時系列の各第2の状態および/または第3の時系列の各第3の状態にそれぞれ1つずつ系外の状態情報を付与してもよい。
【0040】
なお、系の状態はベクトルを設定可能な次元によって記述される。
【0041】
本発明の別の実施形態はダイナミック変化系のダイナミクスを求めるために用いられる。第1の状態の第1の時系列がこのダイナミクスを記述する。
【0042】
本発明で求めるべきダイナミクスは心電図ECGのダイナミクスであり、このとき第1の状態の第1の時系列は心電図信号である。
【0043】
また本発明で求めるべきダイナミクスは経済学システムのダイナミクスであってもよく、このとき第1の状態の第1の時系列は相応の経済学的パラメータによって記述されるマクロ経済学的状況またはミクロ経済学的状況である。
【0044】
また本発明で求めるべきダイナミクスは化学的反応器のダイナミクスであってもよく、このとき第1の状態の第1の時系列は化学的反応器の化学的パラメータである。
【0045】
本発明の別の実施形態として、ダイナミック変化系の状態予測において求められた現在の第1の状態を予測される状態として用いることもできる。
【0046】
本発明の別の実施形態では、第1の計算素子および/または第2の計算素子に結合された第4の計算素子が設けられており、この第4の計算素子には系外の状態情報を含む第4の時系列の第4の状態が供給される。
【0047】
本発明のさらに別の実施形態では、計算素子の少なくとも一部は人工ニューロンで構成されており、および/または少なくとも一部は計算素子間の結合によって可変に構成されている。
【0048】
またダイナミック変化系の状態を記述する物理的信号を検出する測定装置が設けられている。
【0049】
本発明は音声処理に適用することができる。このとき、系外の状態情報とは発音すべき語および/または音節および/または音素の第1の音声情報であり、現在の第1の状態とは発音すべき語および/または音節および/または音素の第2の音声情報を含む。
【0050】
またこの実施形態において、第1の音声情報は発音すべき語および/または音節および/または音素のクラス、および/またはこれらの休止情報を含み、第2の音声情報は発音すべき語および/または音節および/または音素のアクセント情報、および/または発音すべき語および/または音節および/または音素の音の長さ情報を含むものであってもよい。
【0051】
またこの実施形態において、第1の音声情報が発音すべき語および/または音節および/または音素の音声学的情報および/または構造情報を含み、および/または第2の音声情報は発音すべき語および/または音節および/または音素の周波数情報、および/または発音すべき語および/または音節および/または音素の音の持続時間の情報を含むものであってもよい。
【0052】
本発明の実施例を図示し、以下に説明する。
【0053】
図1には第1の実施例の装置KRKNNが示されている。図2のA,Bには一般的なダイナミック系と“因果律‐逆行因果律”関係に基づくダイナミック系とが示されている。図3には第2の実施例の装置KRKFKNNが示されている。図4には第1の実施例の装置を用いてパラメータを測定し処理する化学的反応器が示されている。図5には有限の多数の状態が所定の時間にわたって延在している装置TDRNNが示されている。図6には第2の実施例の装置でモデリングされる交通案内系が示されている。図7には第1の実施例の装置の代替手段(一部の結合を解除したKRKNN)が示されている。図8には第2の実施例の装置の代替手段(一部の結合を解除したKRKNN)が示されている。図9には第1の実施例の装置のさらに別の代替手段(KRKNN)が示されている。図10には第1の実施例の装置KRKNNを用いた音声処理の様子が示されている。図11には第2の実施例の装置KRKFKNNを用いた音声処理の様子が示されている。
【0054】
第1の実施例:化学的反応器
図4は化学的反応器400を示す。この反応器には化学物質401が充填されている。化学的反応器400は撹拌機402を有し、この撹拌機により化学物質401が撹拌される。この化学的反応器400には別の化学物質403が流入し、所定の時間のあいだ化学的反応器400内でこの化学的反応器400にすでに含まれている化学物質401と反応する。反応器400から流出する物質404は化学的反応器400から出口を介して導かれる。
【0055】
撹拌機402は線路を介して制御ユニット405と接続されており、この制御ユニットにより制御信号406を介して撹拌機402の撹拌周波数が調整される。
【0056】
さらに測定装置407が設けられており、この測定装置により化学物質401に含まれる化学的材料の濃度が測定される。
【0057】
測定信号408は計算機またはコンピュータ409に供給され、この計算機409で入出力インタフェース410およびA/D変換器411を介してデジタル化され、メモリ412に記憶される。プロセッサ413もメモリ412と同様にバス414を介してA/D変換器411と接続されている。計算機409はさらに入出力インタフェース410を介して撹拌機402の制御ユニット405と接続されており、これにより計算機409は撹拌機402の撹拌周波数を制御する。
【0058】
計算機409はさらに入出力インタフェース410を介してキーボード415,計算機マウス416および画面417と接続されている。
【0059】
化学的反応器400は技術的ダイナミック系としてダイナミックプロセスを受ける。
【0060】
化学的反応器400は状態記述によって記述される。この状態記述の入力量utはこの場合、化学的反応器400内の温度、圧力、および時点tで調整された撹拌周波数から合成される。したがって入力量utは3次元のベクトルである。
【0061】
化学的反応器400の以下に説明するモデリングの目的は材料濃度のダイナミックな展開の検出であり、これにより流出物質404として生成すべき所定の目標材料の効率的な形成を可能にするものである。
【0062】
このことは後に説明する図1の装置を使用して行われる。
【0063】
化学的反応器400の基礎となり、いわゆる“因果律‐逆行因果律”関係を有するダイナミックプロセスは状態移行記述と出力方程式により記述される。この状態移行記述は観察者には不可視であり、出力方程式は技術的ダイナミックプロセスの観察量を記述する。
【0064】
“因果律‐逆行因果律”関係を備えるこのようなダイナミック系の構造が図2のBに示されている。
【0065】
ダイナミック系250は所定の次元の外部入力量uの影響を受ける。ここで時点tにおける入力量utは
【0066】
【数5】
である。ここで1は自然数を表す。
【0067】
時点tでの入力量utによりダイナミック系250で経過するダイナミックプロセスの変化が引き起こされる。
【0068】
系250の観察者にとっては不可視の時点tにおける系250の内部状態は、この場合、第1の内部部分状態stと第2の内部部分状態rtから合成される。
【0069】
相対的に早期の時点t−1における第1内部部分状態st−1と入力量utとに依存して、ダイナミックプロセスの第1内部部分状態st−1が後続の状態stへ移行する。ここでは、
st=f1(st−1,ut) (5)
が成立する。ここでf1(・)は一般的マッピング規則を表す。
【0070】
具体的に言えば、第1内部部分状態stは相対的に早期の第1内部部分状態st−1と
入力量utとの影響を受ける。このような関係を通常は“因果律”と称する。
【0071】
後続の時点t+1における第2内部部分状態rt+1と入力量utとに依存して、ダイナミックプロセスの第2内部部分状態rt+1が後続の状態rtへ移行する。ここでは、
rt=f2(rt+1,ut) (6)
が成立する。ここでf2(・)は一般的マッピング規則を表す。
【0072】
具体的に言えばこの場合、第2内部部分状態rtは相対的に後期の第2の部分状態rt+1と入力量utとから影響を受ける。第2の部分状態は一般的にはダイナミック系250の相対的に後期の状態についての予測である。このような関係を“逆行因果律”と称する。
【0073】
したがって時点tにおけるダイナミック系250の観察者に可視の出力量ytは、入力量ut、第1内部部分状態stおよび第2内部部分状態rt+1に依存する。
【0074】
出力量
【0075】
【数6】
は設定可能な次元nを有する。
【0076】
出力量yt、入力量ut、第1内部部分状態stおよび第2内部部分状態rt+1の依存関係は次の一般的規則により与えられる。
yt=g(st,rt+1) (7)
ここでg(・)は一般的マッピング規則を表す。
【0077】
ダイナミック系250およびその状態を記述するために、ニューロンの相互に結合されたニューラルネットワークの形態で相互に結合された計算素子の装置が使用される。この装置が図1に示されており、“因果律‐逆行因果律”ニューラルネットワークKRKNNと称される。
【0078】
ニューラルネットワークのニューロン間の結合は重み付けされている。ニューラルネットワークの重み付けはパラメータベクトルvにまとめられている。
【0079】
ニューラルネットワークでは第1内部部分状態stおよび第2内部部分状態rtは次の規則にしたがって、入力量ut、第1内部部分状態st−1,第2内部部分状態rt+1およびパラメータベクトルvs、vt、vyに依存する。すなわち
st=NN(vs,st−1,ut) (8)
rt=NN(vr,rt+1,ut) (9)
yt=NN(vy,st,rt) (10)
ここでNN(・)はニューラルネットワークによって設定されるマッピング規則である。
【0080】
図1のKRKNN100は4つの時点t−1,t,t+1,t+2にわたって展開されたニューラルネットワークである。
【0081】
有限の数の時点にわたって展開されたニューラルネットワークの基礎理論は引用文献[1]に記載されている。
【0082】
KRKNNの基礎となる原理を理解しやすくするために、図5には公知のTDRNNが有限の数の時点にわたって展開されたニューラルネットワーク500として示されている。
【0083】
図5に示されたニューラルネットワーク500は3つの部分入力層502,503,504を備えた入力層501を有しており、これらの部分入力層はそれぞれ所定数の入力計算素子を含んでいる。この入力計算素子には、後述する時系列値内の所定の時点tで入力量utを印加することができる。
【0084】
入力計算素子、すなわち入力ニューロンは可変の結合を介して所定数の隠れ層505のニューロンと結合している。
【0085】
第1の隠れ層506のニューロンは第1の部分入力層502と結合されている。さらに第2の隠れ層507のニューロンは第2の部分入力層503のニューロンと結合されている。第3の隠れ層508のニューロンは第3の部分入力層504のニューロンと結合されている。
【0086】
第1の部分入力層502と第1の隠れ層506との結合、第2の部分入力層503と第2の隠れ層507との結合、および第3の部分入力層504と第3の隠れ層508との結合はそれぞれ同じである。全ての結合の重み付けはそれぞれ第1の結合マトリクスBに含まれている。
【0087】
第4の隠れ層509のニューロンの入力側は第2の結合マトリクスA2により与えられる構造にしたがって第1の隠れ層506のニューロンの出力側と結合されている。さらに第4の隠れ層509のニューロンの出力側は第3の結合マトリクスA1により与えられる構造にしたがって第2の隠れ層507のニューロンの入力側と結合されている。
【0088】
また第5の隠れ層510のニューロンの入力側は第2の結合マトリクスA2により与えられる構造にしたがって第2の隠れ層507のニューロンの出力側と結合されている。さらに第5の隠れ層510のニューロンの出力側は第3の結合マトリクスA1により与えられる構造にしたがって第3の隠れ層508のニューロンの入力側と結合されている。
【0089】
同じことが第6の隠れ層511に対する結合構造に対しても当てはまり、これは第2の結合マトリクスA2により与えられる構造にしたがって第3の隠れ層508のニューロンの出力側と結合されており、さらに第3の結合マトリクスA1により与えられる構造にしたがって第7の隠れ層512のニューロンと結合されている。
【0090】
第8の隠れ層513のニューロンも、第2の結合マトリクスA2により与えられる構造にしたがって第7の隠れ層512のニューロンと結合されており、さらに第3の結合マトリクスA1による結合を介して第9の隠れ層514のニューロンと結合されている。それぞれの層における指数はそれぞれの時点t−2,t−1,t,t+1,t+2を表し、これらの時点にそれぞれの層の出力側で取り出される信号や、入力側に供給される信号(ut,ut−1,ut−2)が関連する。
【0091】
出力層520は3つの部分出力層、すなわち第1部分出力層521,第2部分出力層522および第3部分出力層523を有する。第1部分出力層521のニューロンは出力結合マトリクスCにより与えられる構造にしたがって第3の隠れ層508のニューロンと結合されている。第2部分出力層のニューロンも同様に、出力結合マトリクスCにより与えられる構造にしたがって第8の隠れ層512のニューロンと結合されている。第3部分出力層523のニューロンは出力結合マトリクスCにしたがって第9の隠れ層514のニューロンと結合されている。部分出力層521,522および523のニューロンにおいて、それぞれ時点t,t+1,t+2に対する出力量(yt,yt+1,yt+2)が取り出される。
【0092】
いわゆる分割された重み(Shared Weights)の原理、すなわちニューラルネットワークでは等価の結合テンプレートがそれぞれの時点で同じ値を有するという原理に基づいて、さらに図1に示された装置を説明する。
【0093】
以下の説明では各層ないし各部分層が所定数のニューロンすなわち計算素子を有するものであると理解されたい。
【0094】
1つの層の部分層はそれぞれ、装置により記述されるダイナミック系の系状態を表す。隠れ層の部分層は相応にそれぞれ“系内部”の状態を表す。
【0095】
それぞれの結合テンプレートは任意の次元であり、それぞれの層のニューロン間の相応する結合に対して重み付け値を含んでいる。
【0096】
結合は方向付けられており、図1ではその方向が矢印によって示されている。矢印方向は“計算方向”、とりわけマッピング方向または変換方向を表す。
【0097】
図1に示された装置は、4つの部分入力層101,102,103,104を備える入力層100を有し、各部分入力層101,102,103,104にはそれぞれ時点t−1,t、t+1,t+2でそれぞれ時系列値ut−1,ut,ut+1,ut+2を供給することができる。
【0098】
入力層100の部分入力層101,102,103,104はそれぞれ第1の結合マトリクスAによる結合を介して第1の隠れ層110のニューロンと結合されている。第1の隠れ層110はそれぞれ4つの部分層111,112,113,114を備えている。
【0099】
入力層100の部分入力層101,102,103,104は付加的にそれぞれ第2の結合マトリクスBによる結合を介して第2の隠れ層120のニューロンと結合されている。第2の隠れ層120はそれぞれ4つの部分層121,122,123,124を備えている。
【0100】
第1の隠れ層110のニューロンはそれぞれ、第3の結合マトリクスCにより与えられる構造にしたがって出力層140のニューロンと結合されており、この出力層140も4つの部分出力層141,142,143,144を有する。
【0101】
出力層140のニューロンはそれぞれ第4の結合マトリクスDにより与えられる構造にしたがって第2の隠れ層120のニューロンに結合されている。また出力層140のニューロンはそれぞれ第8の結合マトリクスGにより与えられる構造にしたがって第1の隠れ層110のニューロンに結合されている。また第2の隠れ層120のニューロンはそれぞれ第7の結合マトリクスHにより与えられる構造にしたがって出力層140のニューロンに結合されている。
【0102】
さらに第1の隠れ層110の部分層111は第5の結合マトリクスEにより与えられる構造にしたがって第1の隠れ層110の部分層112のニューロンと結合されている。
【0103】
相応の結合を第1の隠れ層110の残りの部分層112,113,114も有している。具体的に言えば、第1の隠れ層110の全ての部分層111,112,113,114は時系列t−1,t,t+1,t+2に相応して相互に結合されている。
【0104】
第2の隠れ層120の部分層121,122,123,124は相互にちょうど反対向きに結合されている。この場合、第2の隠れ層120の部分層124は第6の結合マトリクスFにしたがった結合を介して、第2の隠れ層120の部分層123のニューロンと結合されている。相応の結合を第2の隠れ層120の他の全ての部分層123,122,121も有している。
【0105】
具体的に言えばこの場合、第2の隠れ層120の全ての部分層121,122,123,124はその時系列と反対に、すなわちt+2,t+1,t,t−1で相互に結合されている。
【0106】
前記の結合に相応して、第1の隠れ層の部分層112,113,114の“系内”の状態st,st+1,st+2が、それぞれ対応する入力状態ut,ut+1,ut+2および時間的に前方の出力状態yt−1,yt,yt+1または時間的に前方の系内の状態st−1,st,st+1から形成される。
【0107】
さらに前記の結合に相応して、第2の隠れ層120の部分層121,122,123の“系内”の状態rt−1,rt,rt+1が、それぞれ対応する入力量ut−1,ut,ut+1および時間的に後方の出力状態yt−1,yt,yt+1または時間的に後方の“系内”の状態rt,rt+1,rt+2から形成される。
【0108】
出力層140の部分出力層141,142,143,144ではそれぞれ第1の隠れ層110の部分層111,112,113,114の対応する“系内”の状態st−1,st,st+1,st+2および第2の隠れ層120の部分層121,122,123,124の対応する“系内”の状態rt−1,rt,rt+1,rt+2から形成される。
【0109】
出力層140の第1の部分出力層141の出力側では、“系内”の状態(st,rt)に依存する信号を取り出すことができる。
【0110】
相応のことは部分出力層142,143および144に対しても当てはまる。
【0111】
KRKNNのトレーニングフェーズでは、次の費用関数Eが最小化される。すなわち
【0112】
【数7】
となる。ここでTは考慮された時点の数を表す。
【0113】
トレーニング方法として逆伝播プロセスが使用される。トレーニングデータセットは次のようにして化学的反応器400から得られる。
【0114】
測定装置407により設定すべき入力量すなわち濃度が測定され、計算機409に供給されそこでデジタル化される。この値は時系列値xtとして、測定されたパラメータに対応する相応の入力量とともにメモリ内でグループ化される。
【0115】
トレーニング時には、それぞれの結合テンプレートの重みが適合化される。この適合化は、KRKNNが追従したダイナミック系(この場合は化学的反応器)をできるだけ正確に記述するように行われる。
【0116】
図1の装置はトレーニングデータセットおよび費用関数Eを使用してトレーニングされる。
【0117】
上記のトレーニング方法にしたがってトレーニングされた図1の装置は化学的反応器400の制御および監視のために使用される。そのために、入力量ut−1,utから予測される出力量yt+1が検出される。この量は引き続き制御量として、または場合により処理後に、撹拌機402制御のための制御手段405および供給制御のための制御装置430へ供給される(図4を参照)。
【0118】
2.第2の実施例:賃貸料の予測
図3には、前述の実施例に則して説明した図1のKRKNNの発展形態が示されている。
【0119】
図3に示された発展形態はいわゆる“因果律‐逆行因果律‐誤り補正ニューラルネットワーク”KRKFKNNであり、賃貸料予測に対して使用される。
【0120】
入力量utはこの場合、賃貸料、住居提供量、物価上昇率および失業率についての情報から合成される。これらの情報は調査すべき住居地区についてそれぞれ年末に(12月値として)検出される。したがって入力量は4次元ベクトルである。時間的に順次連続する複数のベクトルからなる入力量の時間順序はそれぞれ1年の時間ステップを有する。
【0121】
後述する賃貸料マッピングのモデルの目的は将来の賃貸料の予測である。
【0122】
賃貸料マッピングのダイナミックプロセスの記述は後述する図3の装置を使用して行われる。
【0123】
図1と同じ構成を有する素子には同じ参照符号を付してある。
【0124】
付加的にKRKFKNNは4つの部分入力層151,152,153,154を備える第2の入力層150を有する。ここで各部分入力層151,152,153,154にはそれぞれの時点t−1,t,t+1,t+2での時系列値yd t−1,yd t,yd t+1,yd t+2を供給することができる。ここで時系列値yd t−1,yd t,yd t+1,yd t+2はダイナミック系で測定された出力値である。
【0125】
入力層150の部分入力層151,152,153,154はそれぞれ負のアイデンティティマトリクスである第9の結合マトリクスによる結合を介して出力層140のニューロンへ結合されている。
【0126】
したがって出力層の部分出力層141,142,143,144ではそれぞれ差状態(yt−1−yd t−1)、(yt−yd t)(yt+1−yd t+1)、(yt+2−yd t+2)が形成される。
【0127】
上記の装置をトレーニングするための手段は第1の実施例の装置をトレーニングする場合と同じである。
【0128】
3.第3の実施例:交通状況モデリングおよび渋滞警報予測
以下に説明する第3の実施例は交通状況モデルを記述するものであり、渋滞予測に使用される。この第3の実施例では第1の実施例による装置が使用される(図1を参照)。
【0129】
ただし第3の実施例は、時間変数として使用された変数tが場所の変数tとして使用される点で第1の実施例および第2の実施例と異なる。したがって時点tでの状態記述は、この第3の実施例では第1の場所tでの状態記述となる。相応のことがそれぞれ時点t−1.t+1,t+2における状態記述にも当てはまる。
【0130】
さらに時間変数を場所の変数とすることにより、場所t−1,t、t+1,t+2は所定の走行方向での走行区間に沿って順次連続して配置される。
【0131】
図6は、自動車601,602,603,604,605,606が走行する道路600を示す。
【0132】
道路600に組み込まれた導体路ループ610,611は電気信号を公知のように記録し、電気信号615,616をコンピュータ620に入出力インタフェース621を介して供給する。入出力インタフェース621と接続されたA/D変換器622では電気信号が時系列においてデジタル化され、メモリ623に記憶される。このメモリはバス624を介してA/D変換器622およびプロセッサ625と接続されている。入出力インタフェース621を介して交通案内系650には制御信号651が供給される。この制御信号から交通案内系650では所定の速度652が設定されるかまたは交通放棄に基づいた別の指示が行われ、これらは交通案内系650を介して車両601,602,603,604,605,606の運転者に表示される。
【0133】
交通状況のモデリングのためにこの場合、
・交通量速度v
・車両密度ρ(ρ=1km当たりの車両数Fz/km)
・交通量q(q=1時間当たりの車両数Fz/h)(q=v*ρ)
・各時点で交通案内系650により表示される速度制限値652
の状態量が使用される。
【0134】
局所的状態量は上に述べたように導体路ループ610,611を使用して測定される。
【0135】
したがってこれらの量(v(t)、ρ(t)、q(t))は所定の時点tでの技術的系“交通状況”を表す。これらの量から、それぞれ瞬時の状態の評価値r(t)が例えば交通量および均一性について得られる。この評価は定量的および定性的に行われる。
【0136】
この実施例において、交通ダイナミクスは2つのフェーズでモデリングされる。すなわち、適用フェーズで検出された予測量から制御信号651が形成され、この制御信号によりどの速度制限値を将来の時間t+1に対して選択すべきかが指示される。
【0137】
4.その他の実施例
さらに上記の実施例について幾つかの選択手段を挙げる。
【0138】
選択可能な適用分野
第1の実施例で説明した装置は、心電図ECGのダイナミクスを検出するためにも使用できる。これにより早期に心筋梗塞の危険性の高まりを指示する徴候を検出することができる。入力量として患者から測定されたECG値の時系列が使用される。
【0139】
第1の実施例に対する別の例では、第1の実施例による装置を第3の実施例による交通状況のモデリングのために使用することもできる。この場合、元の第1の実施例では時間変数として使用されていた変数tが第3の実施例に則して説明したように場所の変数tとして使用される。このために第3の実施例での構成が相応に適用される。
【0140】
第1の実施例に対する第3の例として、第1の実施例の装置が音声処理に使用される(図10を参照)。このような音声処理の基礎は引用文献[3]から公知である。
【0141】
この場合、装置KRKNN1000はアクセントを付与すべき文章1010中のアクセントを定めるために使用される。
【0142】
このためにアクセントすべき文章1010は語1011に分解され、語がそれぞれクラス1012へ分類される(Part-of-speech-tagging)。クラス1012にはそれぞれコード1013が付される。各コード1013は休止情報(フレーズ中断情報)1014について拡張される。この休止情報は、アクセントすべき文章1010の発音の際にそれぞれの語の後に休止が生じるか否かを指示する。
【0143】
アクセントすべき文章のこのようなコード化は引用文献[3]および[4]から公知である。
【0144】
文章の拡張コード1015から時系列1016がマッピングされる。すなわち、状態の時間的順序がアクセントすべき文章1010中の語順の時系列に相応するようにマッピングが行われる。この時系列1016が装置1000に印加される。
【0145】
この装置は次に各語1011に対してアクセント情報1020を検出する。これらのアクセント情報は、それぞれの語がアクセントして発音されるか否かを指示する(HA:メインアクセントまたは強アクセント、NA:サブアクセントまたは弱アクセント、KA:アクセントなし)。
【0146】
このための構成は第1の実施例において適用されるものに相応する。
【0147】
また第2の実施例に則して説明した装置は、マクロ経済学的ダイナミクス、例えば為替相場のダイナミクス、または他の経済学的係数の予測、例えば取引相場の予測にも使用できる。この種の予測の場合、関連するマクロ経済学的係数ないしミクロ経済学的係数の時系列からの入力量、例えば金利、為替相場またはインフレ率などがマッピングされる。
【0148】
第2の実施例に対する別の例では、第2の実施例による装置が音声処理に使用される(図11を参照)。このような音声処理の基礎は引用文献[5][6][7][8]から公知である。
【0149】
音節に基づく音声処理において、装置KRKFKNN1100が文章中の語の音節の周波数特性をモデリングするために使用される。このようなモデリングも引用文献[5][6][7][8]から公知である。
【0150】
このためにモデリングすべき文章1110を音節1111に分解する。各音節に対して、これを音声学的および構造的に記述する状態ベクトル1112を検出する。
【0151】
このような状態ベクトル1112はタイミング情報1113,音声学情報1114,シンタクス情報1115およびアクセント情報1116を含む。
【0152】
このような状態ベクトル1112は引用文献[4]に記載されている。
【0153】
モデリングすべき文章1110の音節1111の状態ベクトル1112から時系列1117が形成される。すなわち状態の時間的順序がモデリングすべき文章1110中の音節1111の順序の時系列1117に相応するよう形成される。この時系列1117は装置1100に印加される。
【0154】
装置1100は次に各音節1111に対して、パラメータ1120を有するパラメータベクトル1122を検出する。このパラメータはfomaxpos,fomaxalpha,lp,rpであり、これらはそれぞれの音節1111の周波数特性1121を記述する。
【0155】
このようなパラメータ1120およびパラメータによる周波数特性1121の記述は引用文献[5][6][7][8]から公知である。
【0156】
このための構成は第2の実施例で適用されるものに相応する。
【0157】
別の構造の例
図7には、図1の第1の実施例の装置に対する構造の別の例が示されている。図1と同じ構成を有する素子には図7においても同じ参照符号を付してある。
【0158】
図1に示された装置と異なる点は、図7の装置では結合701〜711が解除ないし中断されていることである。この装置すなわち結合の解除されたKRKNNはトレーニングフェーズでも適用フェーズでも使用することができる。この装置のトレーニングおよび適用は第1の実施例について説明したのと同様に実行される。
【0159】
図8には、図3の第2の実施例による装置に対する構造の別の例が示されている。
【0160】
図3と同じ構成を有する素子には図8でも同じ参照符号が付してある。図3に示した装置と異なる点は、図8の装置では結合801〜813が解除ないし中断されていることである。この装置すなわち結合の解除されたKRKFKNNはトレーニングフェーズでも適用フェーズでも使用することができる。この装置のトレーニングおよび適用も第1の実施例について説明したのと同様に実行される。
【0161】
結合の解除されたKRKNNをトレーニングフェーズのみに用い、第1の実施例の(結合が解除されていない)KRKNNを適用フェーズに用いることも可能である。
【0162】
結合の解除されたKRKNNを適用フェーズのみに用い、第1の実施例の(結合が解除されていない)KRKNNをトレーニングフェーズに用いることも可能である。
【0163】
相応のことが結合の解除されたKRKFKNNおよびKRKFKNNに対しても当てはまる。
【0164】
第1の実施例の装置に対する別の構造の例が図9に示されている。
【0165】
図9の装置は、固定点回帰を有するKRKNNである。
【0166】
図1と同じ構成を有する素子には図9でも同じ参照符号を付してある。図1に示した装置に対して異なる点は、図9の装置では付加的結合901,902,903,904が設けられていることである。
【0167】
付加的結合901,902,903,904はそれぞれ重み付けされた結合マトリクスGTを有する。
【0168】
この装置はトレーニングフェーズでも適用フェーズでも使用することができる。
【0169】
この装置のトレーニングおよび適用は第1の実施例について説明したのと同様に実施される。
【0170】
本明細書では以下の刊行物を引用している。
[1]S.Hayken, Neural Networks: A Comprehensive Foundation, McMillan College Publishing Company, Second Edition, ISBN0-13-273350-1, 1999 732頁〜789頁
[2]H.Rehkugler & H.G.Zimmermann, Neuronale Netze in der Oekonomie, Grundlagen und finanzwirtschaftliche Anwendungen, Verlag Franz Vahlen Muenchen, ISBN3-8006-1871-0, 1994 3頁〜90頁
[3]J.Hirschberg, Pitch accent in context: predicting intonational prominence from text, Artificial Intelligence63, Elsevier, 1993 305頁〜340頁
[4]K.Ross et al., Prediction of abstract prosodic labels for speech synthesis, Computer Speech and Language, 10, 1996 155頁〜185頁
[5]R.Haury et al., Optimisation of a Neural Network for Pitch Contour Generation, ICASSP, Seattle, 1998
[6]C.Traber, F0 generation with a database of natural F0 patterns and with a neural network, G.Bailly and C.Benoit eds., Talking Machines: Theories, Models and Applications, Elsevier, 1992
[7]E.Heuft et al., Parametric Description of F0-Contours in a Prosodic Database, Proc.ICPHS, Vol.2, 1995 378頁〜381頁
[8]C.Erdem, Topologieoptimierung eines Neuronalen Netzes zur Generierung von F0-Verlaeufen durch Integration unterschiedlicher Codierungen, Tagungsband ESSV, Cottbus, 2000
【図面の簡単な説明】
【0171】
【図1】第1の実施例の装置を示す図である。
【0172】
【図2】一般的なダイナミック系と“因果律‐逆行因果律”関係に基づくダイナミック系とを示す図である。
【0173】
【図3】第2の実施例の装置を示す図である。
【0174】
【図4】第1の実施例の装置を用いてパラメータを処理する化学的反応器を示す図である。
【0175】
【図5】有限の多数の状態が所定の時間にわたって延在している装置を示す図である。
【0176】
【図6】第2の実施例の装置でモデリングされる交通案内系を示す図である。
【0177】
【図7】第1の実施例の装置の代替手段を示す図である。
【0178】
【図8】第2の実施例の装置の代替手段を示す図である。
【0179】
【図9】第1の実施例の装置のさらに別の代替手段を示す図である。
【0180】
【図10】第1の実施例の装置(KRKNN)を用いた音声処理の様子を示す図である。
【0181】
【図11】第2の実施例の装置(KRKFKNN)を用いた音声処理の様子を示す図である。
Claims (22)
- 第1の状態空間でダイナミック変化系の第1の状態の第1の時系列から現在の第1の状態を求める方法において、
第2の状態空間で少なくとも1つの現在の第2の状態とこれよりも時間的に前方の過去の第2の状態とを有する系の第2の状態の第2の時系列を求め、
第2の状態空間で少なくとも1つの未来の第3の状態とこれよりも時間的にさらに後方の第3の状態とを有する系の第3の状態の第3の時系列を求め、
第2の状態空間の現在の第2の状態を第1の状態空間へ第1の変換で変換しかつ第2の状態空間の未来の第3の状態を第1の状態空間へ第2の変換で変換することにより、現在の第1の状態を求める
ことを特徴とするダイナミック変化系の第1の状態の第1の時系列から現在の第1の状態を求める方法。 - 第2の時系列のうち時間的に連続する2つの第2の状態を第3の変換により相互に結合する、請求項1記載の方法。
- 第2の時系列のうち時間的に連続する2つの第2の状態を第3の変換により、時間的に後方の第2の状態が時間的に前方の第2の状態から求められるように相互に結合する、請求項2記載の方法。
- 第3の時系列のうち時間的に連続する2つの第3の状態を第4の変換により相互に結合する、請求項1から3までのいずれか1項記載の方法。
- 第3の時系列のうち時間的に連続する2つの第3の状態を第4の変換により、時間的に前方の第3の状態が時間的に後方の第3の状態から求められるように相互に結合する、請求項4記載の方法。
- 現在の第2の状態を第3の変換で変換しかつ第1の状態空間の現在の状態を第5の変換で第2の状態空間へ変換することにより、第2の時系列のうち現在の第2の状態よりも時間的に後方の未来の第2の状態を求める、請求項3から5までのいずれか1項記載の方法。
- 未来の第3の状態を第4の変換で変換しかつ第1の状態空間の現在の状態を第6の変換で第2の状態空間へ変換することにより、第3の時系列のうち未来の第3の状態よりも時間的に前方の現在の第3の状態を求める、請求項5または6記載の方法。
- 求められた現在の第1の状態と設定された現在の第1の状態とのあいだの誤差を求める、請求項1から7までのいずれか1項記載の方法。
- 第2の時系列の各第2の状態および/または第3の時系列の各第3の状態にそれぞれ1つずつ系外の状態情報を付与する、請求項1から8までのいずれか1項記載の方法。
- 系の状態をベクトルを設定可能な次元によって記述する、請求項1から9までのいずれか1項記載の方法。
- ダイナミック変化系のダイナミクスを求めるために第1の状態の第1の時系列の記述を用いる、請求項1から10までのいずれか1項記載の方法。
- 心電図のダイナミクスを求めるために、心電図信号を第1の状態の第1の時系列として用いる、請求項11記載の方法。
- 経済学システムのダイナミクスを求めるために、経済学的パラメータによって記述される経済状況を第1の状態の第1の時系列として用いる、請求項11記載の方法。
- 化学反応のダイナミクスを求めるために、化学的反応器の化学的パラメータを第1の状態の第1の時系列として用いる、請求項11記載の方法。
- ダイナミック変化系の状態予測において、求められた現在の第1の状態を予測状態として用いる、請求項1から14までのいずれか1項記載の方法。
- 系のそれぞれの状態を表す計算素子が相互に結合されており、該結合によって系の2つの状態のあいだの変換が表される、
第1の状態空間でダイナミック変化系の第1の状態の第1の時系列から現在の第1の状態を求める装置において、
第1の計算素子は、第2の状態空間で少なくとも1つの現在の第2の状態とこれよりも時間的に前方の過去の第2の状態とを有する系の第2の状態の第2の時系列を求めるように構成されており、
第2の計算素子は、第2の状態空間で少なくとも1つの未来の第3の状態とこれよりも時間的にさらに後方の第3の状態とを有する系の第3の状態の第3の時系列を求めるように構成されており、
第3の計算素子は、第2の状態空間の現在の第2の状態を第1の状態空間へ第1の変換で変換しかつ第2の状態空間の未来の第3の状態を第1の状態空間へ第2の変換で変換することにより、現在の第1の状態を求めるように構成されている
ことを特徴とするダイナミック変化系の第1の状態の第1の時系列から現在の第1の状態を求める装置。 - 第1の計算素子および/または第2の計算素子に結合された第4の計算素子が設けられており、該第4の計算素子には系外の状態情報を含む第4の時系列の第4の状態が供給されるように構成されている、請求項16記載の装置。
- 計算素子の少なくとも一部は人工ニューロンで構成されており、および/または計算素子の少なくとも一部は計算素子間の結合によって可変に構成されている、請求項16または17記載の装置。
- ダイナミック変化系の状態を記述する物理的信号を検出する測定装置が設けられている、請求項16から18までのいずれか1項記載の装置。
- 音声処理の際、系外の状態情報とは発音すべき語および/または音節および/または音素の第1の音声情報であり、現在の第1の状態とは発音すべき語および/または音節および/または音素の第2の音声情報を含むものである、請求項17または18記載の装置。
- 第1の音声情報は発音すべき語および/または音節および/または音素および/またはこれらの休止情報のクラスを含み、および/または
第2の音声情報は発音すべき語および/または音節および/または音素のアクセント情報、および/または発音すべき語および/または音節および/または音素の音の長さ情報を含む、請求項20記載の装置。 - 第1の音声情報は発音すべき語および/または音節および/または音素の音声学的情報および/または構造情報を含み、および/または
第2の音声情報は発音すべき語および/または音節および/または音素の周波数情報、および/または発音すべき語および/または音節および/または音素の音の持続時間の情報を含む、請求項21記載の方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE10146222A DE10146222A1 (de) | 2001-09-19 | 2001-09-19 | Verfahren und Anordnung zur Ermittlung eines aktuellen ersten Zustands einer ersten zeitlichen Abfolge von jeweils ersten Zuständen eines dynamisch veränderlichen Systems |
PCT/DE2002/003494 WO2003025851A2 (de) | 2001-09-19 | 2002-09-17 | Verfahren und anordnung zur ermittlung eines aktuellen ertsten zustands einer ersten zeitlichen abfolge von jeweils ersten zuständen eines dynamisch veränderlichen systems |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005502974A true JP2005502974A (ja) | 2005-01-27 |
Family
ID=7699581
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003529402A Withdrawn JP2005502974A (ja) | 2001-09-19 | 2002-09-17 | ダイナミック変化系の第1の状態の第1の時系列から現在の第1の状態を求める方法および装置 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20040267684A1 (ja) |
EP (1) | EP1428177A2 (ja) |
JP (1) | JP2005502974A (ja) |
DE (1) | DE10146222A1 (ja) |
WO (1) | WO2003025851A2 (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE10356655B4 (de) * | 2003-12-04 | 2006-04-20 | Siemens Ag | Verfahren und Anordnung sowie Computerprogramm mit Programmcode-Mitteln und Computerprogramm-Produkt zur Ermittlung eines zukünftigen Systemzustandes eines dynamischen Systems |
WO2005081076A2 (de) * | 2004-02-24 | 2005-09-01 | Siemens Aktiengesellschaft | Verfahren, zur prognose eines brennkammerzustandes unter verwendung eines rekurrenten, neuronalen netzes |
DE102004059684B3 (de) * | 2004-12-10 | 2006-02-09 | Siemens Ag | Verfahren und Anordnung sowie Computerprogramm mit Programmmcode-Mitteln und Computerprogramm-Produkt zur Ermittlung eines zukünftigen Systemzustandes eines dynamischen Systems |
DE102008014126B4 (de) * | 2008-03-13 | 2010-08-12 | Siemens Aktiengesellschaft | Verfahren zum rechnergestützten Lernen eines rekurrenten neuronalen Netzes |
US8775341B1 (en) | 2010-10-26 | 2014-07-08 | Michael Lamport Commons | Intelligent control with hierarchical stacked neural networks |
US9015093B1 (en) | 2010-10-26 | 2015-04-21 | Michael Lamport Commons | Intelligent control with hierarchical stacked neural networks |
US11599892B1 (en) | 2011-11-14 | 2023-03-07 | Economic Alchemy Inc. | Methods and systems to extract signals from large and imperfect datasets |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1021793A2 (de) * | 1998-08-07 | 2000-07-26 | Siemens Aktiengesellschaft | Anordnung miteinander verbundener rechenelemente, verfahren zur rechnergestützten ermittlung einer dynamik, die einem dynamischen prozess zugrunde liegt und verfahren zum rechnergestützten trainieren einer anordnung miteinander verbundener rechenelemente |
EP1145192B1 (de) * | 1999-03-03 | 2003-05-14 | Siemens Aktiengesellschaft | Anordnung miteinander verbundener rechenelemente, verfahren zur rechnergestützten ermittlung einer dynamik, die einem dynamischen prozess zugrunde liegt und verfahren zum rechnergestützten trainieren einer anordnung miteinander verbundener rechenelemente |
WO2000062250A2 (de) * | 1999-04-12 | 2000-10-19 | Siemens Aktiengesellschaft | Anordnung miteinander verbundener rechenelemente, verfahren zur rechnergestützten ermittlung einer dynamik, die einem dynamischen prozess zugrunde liegt und verfahren zum rechnergestützten trainieren einer anordnung miteinander verbundener rechenelemente |
WO2001057648A2 (de) * | 2000-01-31 | 2001-08-09 | Siemens Aktiengesellschaft | Anordnung miteinander verbundener rechenelemente und verfahren zur rechnergestützten ermittlung eines zweiten zustands eines systems in einem ersten zustandsraum aus einem ersten zustand des systems in dem ersten zustandsraum |
-
2001
- 2001-09-19 DE DE10146222A patent/DE10146222A1/de not_active Withdrawn
-
2002
- 2002-09-17 WO PCT/DE2002/003494 patent/WO2003025851A2/de not_active Application Discontinuation
- 2002-09-17 JP JP2003529402A patent/JP2005502974A/ja not_active Withdrawn
- 2002-09-17 US US10/490,042 patent/US20040267684A1/en not_active Abandoned
- 2002-09-17 EP EP02776681A patent/EP1428177A2/de not_active Withdrawn
Also Published As
Publication number | Publication date |
---|---|
EP1428177A2 (de) | 2004-06-16 |
WO2003025851A2 (de) | 2003-03-27 |
DE10146222A1 (de) | 2003-04-10 |
WO2003025851A3 (de) | 2004-02-19 |
US20040267684A1 (en) | 2004-12-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Ye et al. | Short-term traffic speed forecasting based on data recorded at irregular intervals | |
Abdulhai et al. | Short-term traffic flow prediction using neuro-genetic algorithms | |
CN113874934A (zh) | 有表达力的端到端语音合成中的变分嵌入容量 | |
US20050115381A1 (en) | Creating realtime data-driven music using context sensitive grammars and fractal algorithms | |
WO2019040132A1 (en) | CREATING MUSIC USING DEEP NEURAL NETWORKS | |
Wang et al. | An RNN-based quantized F0 model with multi-tier feedback links for text-to-speech synthesis | |
Meyer et al. | A quasiarticulatory speech synthesizer for German language running in real time | |
JP6649210B2 (ja) | 音声合成学習装置、方法、及びプログラム | |
Chen et al. | Follownet: a comprehensive benchmark for car-following behavior modeling | |
Wu et al. | Quasi-periodic WaveNet: An autoregressive raw waveform generative model with pitch-dependent dilated convolution neural network | |
JP2005502974A (ja) | ダイナミック変化系の第1の状態の第1の時系列から現在の第1の状態を求める方法および装置 | |
JP2002539567A (ja) | 相互に接続されている計算エレメントの装置、ダイナミックプロセスの基礎になっているダイナミック特性を計算機支援されて求めるための方法並びに相互に接続されている計算エレメントの装置を計算機支援されて学習するための方法 | |
Teutenberg et al. | Modelling and synthesising F0 contours with the discrete cosine transform | |
JP3212241B2 (ja) | 交通流予測装置 | |
JP2002522832A (ja) | 相互に結合された演算子の装置、ダイナミックプロセスに基づくダイナミクスをコンピュータのサポートにより検出するための方法、並びに、相互に結合された演算子の装置をコンピュータのサポートにより検出するための方法 | |
Chen et al. | Limited text speech synthesis with electroglottograph based on Bi-LSTM and modified Tacotron-2 | |
US6178402B1 (en) | Method, apparatus and system for generating acoustic parameters in a text-to-speech system using a neural network | |
JP2004523813A (ja) | 時間的に変化する複数の状態記述を計算器支援してマッピングするための方法および装置、並びにそのような装置のトレーニング方法 | |
Koch et al. | Physics-informed machine learning of parameterized fundamental diagrams | |
Kim et al. | Polyhymnia: An Automatic Piano Performance System with Statistical Modeling of Polyphonic Expression and Musical Symbol Interpretation. | |
EP4020464A1 (en) | Acoustic model learning device, voice synthesis device, method, and program | |
Anders et al. | Interfacing manual and machine composition | |
CN112750422B (zh) | 一种歌声合成方法、装置及设备 | |
Tiwari et al. | Music Generation with Long Short-Term Memory Networks from MIDI Data of Classical Music | |
WO2024086012A1 (en) | End-to-end general audio synthesis with generative networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20060110 |