VMR-WB(variable-rate multimode wideband)はマルチレートの広帯域音声符号化方式で、CDMA2000 方式の第三世代携帯電話で利用される。また GSM や W-CDMA で利用される広帯域音声符号化方式の AMR-WB と相互運用性のあるモードを持つ。
VMR-WB は、W-CDMA などで使用される AMR-WB と同様、マルチレートをサポートする音声符号化方式で、通常の電話インタフェースの2倍の帯域幅を持つ 50 Hz-7000 Hz(サンプリング周波数 16kHz)の広帯域音声を扱うことができる。通常の狭帯域の音声(100 Hz-3700 Hz、サンプリング周波数 8kHz)も同じように扱うことができる。 VMR-WB は標準化団体の3GPP2(3rd Generation Partnership Project 2)が標準化を行った。
VMR-WB は、それ以前に開発された AMR-WB のコアとなる技術をベースとしており [1]、 その略称も AMR-WB を意識したものとなっている[1]。
ビットレートは入力となる音声信号の種類(有声音/無声音/無音状態など)により変わる。また、ネットワーク側からのモード指示により変えることもできる。 VMR-WB Revision 0 ではモード 0 からモード 3 までの4つのモードがあり、これらのモードでのビットレートは 13300 bps、6200 bps、2700 bps、1000 bpsのいずれかである。 改訂版の VMR-WB Revision A ではモード 4 が追加され、このモードでは 8550 bps、4000 bps、800 bps のいずれかになる。
モードは、携帯電話と基地局との間の無線状態など通信ネットワーク側の状態と、要求される通信品質(QoS)により決められる。音声の品質はモード 0 が高くモード 1、モード 2 と順次低くなり、また平均ビットレートも同様に低下する。モード 3 は AMR-WB と相互運用性のあるモードで、AMR-WB での 12.65、8.85、6.60 kbpsのビットレートをサポートする。 モード 0 ~ 3 は CDMA2000 ネットワークでのレートセット II(14.4 kbpsを基準とする通信レート)用である。 モード 4 はレートセット I(9.6 kbpsを基準とする通信レート)用に使われる。
VMR-WB の符号化アルゴリズムは ACELP(Algebraic Code Excited Linear Prediction)を使用する[1]。
VMR-WB の特徴は以下の通りである[1]。
VMR-WB の符号化データを RTP を用いインターネット上で送るためのデータ形式は、IETF標準の RFC 4348 と RFC 4424 で定義されている [2] [3]。
コーデックの入出力は 16ビット長、サンプリング周波数 16kHz / 8kHz の信号で、これを 12.8 kHz にリサンプリングして処理を行う。デコード時には処理結果(サンプリング周波数 12.8 kHz から決まる 6.4kHz までの信号成分)を 16kHz にアップサンプリングし、6.4 kHz ~ 7 kHzの高域成分を追加する[1]
VMR-WB では 20 msのフレームに対し以下の処理により符号化を行う[1]。
これらの処理を行った後、信号フレームの内容と選択ビットレートとから以下のいずれかの処理により符号化を行う。
符号化には基本的に ACELP のアルゴリズムが使われるが、アルゴリズムの詳細は信号フレーム内容と選択ビットレートにより異なる。
復号では、符号化データに含まれる線形予測係数の情報、適応コードブック/固定コードブック/ゲインのベクトル値などを用いて音声信号を復元する。大まかには以下の処理で復号を行う。
携帯電話での音声通信用以外に、VMR-WB は 3GPP2 で定義されたファイルフォーマット(3G2)を使い、各種マルチメディアサービスで使用することができる。