RCELP（relaxed code excited linear prediction、relaxation code excited linear prediction）、あるいは Relaxed CELP は CELP を改良し符号化の圧縮率を高めた音声符号化アルゴリズムである。入力信号の波形をそのまま符号化するのではなく、圧縮率が上がるように信号をわずかに修正して符号化を行うことで、音声を効率的に符号化する。

RCELP は携帯電話用の音声符号化方式である EVRC（CDMA2000用）、SMV（CDMA2000用）、VMR-WB（CDMA2000用のワイドバンド版）などで使用されている。

概要

RCELP は音声符号化アルゴリズムの CELP を改良したもので、ベル研究所のクレイジン（W.B. Kleijn）らが開発した ^[1] ^[2]。

元となる CELP は、人間の音声を声道に相当する線形予測フィルターと声帯に相当する適応型と固定型のコードブックとでモデル化する。合成による分析（analysis-by-synthesis）の手法を用い、音声波形を再合成し元の信号とを比較することで、コードブックから誤差が最小になるものを探索する。 CELP では元の信号をそのまま比較対象とするのに対し、RCELP はその制限を緩め、時間軸方向に波形を修正した信号を比較対象にする手法である。

一般に、人間の音声の大部分はほぼ同じ波形の特定周波数（ピッチ周波数）での繰り返しからなり、その周波数は細かい周期で変動している。この波形を忠実に再現しようとすると 5 ms 程度の短い周期での分析と符号化が必要になり、必要な情報量が増加してしまう。 20 ms 程度の周期で分析と符号化を行えば情報量は削減できるが、合成による分析の手法を用いた場合、ピッチ周波数の誤差のため実信号との比較がうまくできず音質が低下する。多くの符号化方式では信号を 5 ms 前後のサブフレームに分割しピッチ周波数の分析と符号化を行っている。

RCELP ではピッチ周波数の細かい変動を無視し 20 ms 程度の大まかな周期で分析と符号化を行い、その間は補間で求めたピッチ周波数の軌跡と実際のピッチ周波数との誤差分だけ元の信号を時間軸方向に伸長/圧縮することで、合成による分析の手法を用いた場合の音質低下を避ける。ピッチ周波数の細かい変動を無視しても聴感上の音質はほとんど変わらないことが分かっており ^[3]、元信号の修正のため符号化時の演算量は増加するが、音質を低下させることなく情報量を削減することができる。

詳細

RCELP は "Generalized Analysis-by-Synthesis"（合成による分析の一般化、汎用AbS）として提案された手法の応用例として最初に発表され^[1]、その後 RCELP と命名された^[2]。

合成による分析の一般化とは、合成による分析の際に入力信号にも何らかの変更を行い誤差の最小化を行う方法で、入力信号は聴感上同じに聞こえるよう変更を行う。RCELP はこの手法をピッチ周波数の時間軸方向の修正に適用したものと見なせる。

RCELP の構成は通常の CELP に以下の機能を追加したものになる。

入力信号のピッチ周波数の推定
- オープンループでのピッチ周波数推定を行う
ピッチ周波数の軌跡の計算
- ピッチ周波数の補間によりフレーム内の軌跡を計算する
- （このピッチ周波数は CELP での適応型コードブックの更新にも使用される）
ピッチ周波数の軌跡に合わせ入力信号を修正
- 入力信号の補間やシフトにより信号を時間軸方向に伸長/圧縮する

実際に使用される場合、時間軸方向に伸長/圧縮する信号は入力信号だけに限らない。例えば、携帯電話用のコーデックとして CDMA2000 ネットワークで使われている EVRC や VMR-WB では、入力信号を直接修正するのではなく、線形予測フィルターを通した後の残差信号を修正する ^[4] ^[5]。

脚注

^ ^a ^b W.B. Kleijn, R.P. Ramachandran, P. Kroon: Generalized analysis-by-synthesis coding and its application to pitch prediction, Proc. IEEE Int. Conf. Acoust. Speech Signal Process. pp.337-340(vol.1), 1992.
^ ^a ^b W.B. Kleijn, P. Kroon, L. Cellario, D. Sereno: A 5.85 kb/s CELP algorithm for cellular applications, Proc. IEEE Int. Conf. Acoust. Speech Signal Process. pp.596-599(vol.2), 1993.
^ W.B. Kleijn, R.P. Ramachandran, P. Kroon: Interpolation of the pitch-predictor parameters in analysis-by-synthesis speech coders, IEEE Trans. Speech Audio Process. 2(1), pp.42–53, 1994.
^ 3GPP2. C.S0014-0 Version 1.0 Enhanced Variable Rate Codec (EVRC). pp.4-30 - 4-31, 3GPP2, December, 1999.
^ 3GPP2. C.S0052-0 Version 1.0 Source-Controlled Variable-Rate Multimode Wideband Speech Codec (VMR-WB) Service Option 62 for Spread Spectrum Systems. pp.73-85, 3GPP2, June, 2004

参考文献

Jacob Benesty, M. M. Sondhi, Yiteng Huang (ed). Springer Handbook of Speech Processing. Springer, 2007. ISBN 978-3540491255.
W.B. Kleijn, R.P. Ramachandran, P. Kroon: Generalized analysis-by-synthesis coding and its application to pitch prediction, Proc. IEEE Int. Conf. Acoust. Speech Signal Process. pp.337-340(vol.1), 1992.
W.B. Kleijn, P. Kroon, L. Cellario, D. Sereno: A 5.85 kb/s CELP algorithm for cellular applications, Proc. IEEE Int. Conf. Acoust. Speech Signal Process. pp.596-599(vol.2), 1993.
W.B. Kleijn, D. Nahumi: RCELP coder, US Patent No.5704003, Dec. 30, 1997. (Filing Date Sep. 19, 1995.)
3GPP2. C.S0014-0 Version 1.0 Enhanced Variable Rate Codec (EVRC). 3GPP2, December, 1999.
3GPP2. C.S0030-0 Version 3.0 Selectable Mode Vocoder (SMV) Service Option for Wideband Spread Spectrum Communication Systems. 3GPP2, Jan, 2004.
3GPP2. C.S0052-A Version 1.0 Source-Controlled Variable-Rate Multimode Wideband Speech Codec (VMR-WB) Service Options 62 and 63 for Spread Spectrum Systems. 3GPP2, April, 2005.

関連項目

データ圧縮方式

可逆

エントロピー符号	一進法算術 Asymmetric numeral systems（英語版）ゴロムハフマン適応型（英語版）正準（英語版） MH レンジシャノンシャノン・ファノシャノン・ファノ・イライアス（英語版）タンストール（英語版）ユニバーサル（英語版）指数ゴロム（英語版）フィボナッチ（英語版）ガンマレーベンシュタイン（英語版）
辞書式（英語版）	BPE Deflate Lempel-Ziv LZ77 LZ78 LZFSE LZH LZJB（英語版） LZMA LZO LZRW（英語版） LZS（英語版） LZSS LZW LZWL（英語版） LZX LZ4 ROLZ（英語版）統計型（英語版） Brotli Snappy Zstandard
その他	BWT CTW（英語版） Delta DMC（英語版） MTF PAQ PPM RLE

音声

理論	ビットレート平均(ABR) 固定(CBR) 可変(VBR) コンパンディング畳み込みダイナミックレンジレイテンシ（英語版）標本化定理標本化音質音声符号化サブバンド符号化変換符号化知覚符号化
コーデック	A-law μ-law ACELP ADPCM CELP DPCM フーリエ変換 LPC LAR LSP MDCT 音響心理学 WLPC

画像

理論	クロマサブサンプリング符号化ツリーユニット（英語版）色空間圧縮アーティファクト解像度マクロブロックピクセル PSNR 量子化（英語版）標準テストイメージ（英語版）
手法	チェインコード（英語版） DCT EZW（英語版）フラクタル KLT（英語版）ピラミッド（英語版） RLE SPIHT（英語版）ウェーブレット

映像

理論	ビットレート平均(ABR) 固定(CBR) 可変(VBR) 画面解像度フレームフレームレートインターレース映像品質（英語版）
コーデック（英語版）	重複変換（英語版） DCT デブロッキングフィルタ（英語版）フレーム間予測

理論

情報量
複雑性
非可逆
量子化
レート歪み（英語版）
冗長性
情報理論の年表（英語版）