DSP-DFT離散コサイン変換

DCT（離散コサイン変換）は、線形変換または複素指数の組み合わせとしてのN入力シーケンスx（n）、0≤n≤N-1です。その結果、x（n）が実数であっても、一般にDFT係数は複雑です。

実際のシーケンスx（n）をコサインシーケンスの線形結合として表現したN×N構造の直交変換を見つけようとします。私たちはすでにそれを知っています-

$ X（K）= \ displaystyle \ sum \ limits _ \ {n = 0} ^ \ {N-1} x（n）cos \ frac \ {2 \ Pi kn} \ {N} 0 \ leq k \ leq N -1 $

そして、$ x（n）= \ frac \ {1} \ {N} \ sum _ \ {k = 0} ^ \ {N-1} x（k）cos \ frac \ {2 \ Pi kn} \ {N} 0 \ leq k \ leq N-1 $

これは、N点列x（n）が実数で偶数の場合に可能です。したがって、$ x（n）= x（N-n）、0 \ leq n \ leq（N-1）$です。結果のDFT自体は本物であり、均一です。これらのことから、シーケンスの「偶数拡張」の2NポイントDFTを取得することにより、任意のNポイントの実シーケンスに対して離散コサイン変換を適用できる可能性があることが明らかになります。

DCTは、基本的に画像と音声の処理に使用されます。また、画像や音声信号の圧縮にも使用されます。

$ DFT [s（n）] = S（k）= \ sum _ \ {n = 0} ^ \ {2N-1} s（n）W _ \ {2N} ^ \ {nk}、\ quad where \ quad 0 \ leq k \ leq 2N-1 $

$ S（k）= \ displaystyle \ sum \ limits _ \ {n = 0} ^ \ {N-1} x（n）W _ \ {2N} ^ \ {nk} + \ displaystyle \ sum \ limits _ \ {n = N} ^ \ {2N-1} x（2N-n-1）W _ \ {2N} ^ \ {nk}; \ quad where \ quad 0 \ leq k \ leq 2N-1 $

$ \ Rightarrow S（k）= W _ \ {2N} ^ \ {-k/2} + \ sum _ \ {n = 0} ^ \ {N-1} x（n）[W _ \ {2N} ^ \ { nk} W _ \ {2N} ^ \ {k/2} + W _ \ {2N} ^ \ {-nk} W _ \ {2N} ^ \ {-k/2}]; \ quad where \ quad 0 \ leq k \ leq 2N-1 $

$ \ Rightarrow S（k）= W _ \ {2N} ^ \ {\ frac \ {k} \ {2}} \ sum _ \ {n = 0} ^ \ {N-1} x（n）\ cos [\ frac \ {\ pi} \ {N}（n + \ frac \ {1} \ {2}）k]; \ quad where \ quad 0 \ leq k \ leq 2N-1 $

DCTは、

$ V（k）= 2 \ sum _ \ {n = 0} ^ \ {N-1} x（n）\ cos [\ frac \ {\ pi} \ {2}（n + \ frac \ {1} \ { 2}）k] \ quad where \ quad 0 \ leq k \ leq N-1 $

$ \ Rightarrow V（k）= W _ \ {2N} ^ \ {\ frac \ {k} \ {2}} S（k）\ quadまたは\ quad S（k）= W _ \ {2N} ^ \ {\ frac \ {k} \ {2}} V（k）、\ quad where \ quad 0 \ leq k \ leq N-1 $

$ \ Rightarrow V（k）= 2R [W _ \ {2N} ^ \ {\ frac \ {k} \ {2}} \ sum _ \ {n = 0} ^ \ {N-1} x（n）W_ \ {2N} ^ \ {nk}]、\ quad where \ quad 0 \ leq k \ leq N-1 $

Digital-signal-processing-dsp-discrete-cosine-transform

DSP-DFT離散コサイン変換