☎️ DTMFとその伝送方式(RFC2833とみなし音声)
概要: 本資料では、電話のボタン操作で使われる DTMF の仕組みと、IPネットワーク上で DTMF を伝送する代表的な方式である RFC2833 と、従来の みなし音声(In-band DTMF) の違いを整理します。
1. DTMFとは
DTMF(Dual Tone Multi-Frequency) は、電話機のプッシュボタンを押したときに鳴る「ピッ、ポッ」というトーン信号で数字や記号を伝える方式です。

- 各キーは「低い周波数」と「高い周波数」の2つのトーンの組み合わせで表現される
- 例:
1キー → 697 Hz + 1209 Hz の2つのトーン
主な利用シーン
- IVR(自動音声応答)でのメニュー選択(「1:日本語」「2:英語」 など)
- PBXの内線番号入力・各種機能操作
- コールセンターでの各種認証・ガイダンス操作
ポイント: DTMFそのものは「音」の仕組みですが、IP電話(VoIP)環境では、
その音をどうネットワーク上で伝えるか が重要になります。
2. DTMF伝送方式の2つの考え方
DTMFをネットワーク上で伝送する場合、代表的には次の2つの方式があります。
- みなし音声(In-band DTMF): DTMFを「そのまま音声」として伝送する方式
- RFC2833(Out-of-band DTMF / RTP Events): DTMFを「音声とは別のデータ」として伝送する方式
3. みなし音声(In-band DTMF)とは
みなし音声(In-band DTMF) は、DTMFトーンを通常の音声と同じように扱い、音声ストリームの中にそのまま乗せて伝送する方式です。
特徴
- アナログ電話網(PSTN)で古くから利用されている伝統的な方式
- VoIP環境でも「音声コーデックで圧縮された音」としてDTMFが流れる
- ノイズや音声圧縮(G.729など)の影響を受けるため、DTMF検出が不安定になりやすい
イメージ
【みなし音声(In-band)】
電話機で「1」キー押下
↓(697 Hz + 1209 Hzの音が鳴る)
マイクで拾われ、音声としてそのまま伝送
↓
途中の機器・コーデックで圧縮/伸張される
↓
相手側機器が「音」を聞いてDTMFと判定する
メリット:
- アナログ回線・古いPBXとの互換性が高い
- 特別なプロトコル拡張を意識しなくてもよい(「音」として扱うだけ)
デメリット:
- コーデック圧縮やネットワークの品質に依存し、DTMF誤認識・取りこぼしが起きやすい
- VoIP環境では、G.729などの低ビットレートコーデック使用時に特に不安定
4. RFC2833とは(RTP上でのDTMFイベント伝送)
RFC2833 は、IPネットワーク上で DTMF を伝送するための標準仕様で、RTPパケット内で「DTMFイベント」として音声とは別に送る方式です。
特徴
- DTMFを「音」としてではなく、「イベント情報(数字や記号のコード)」として送信
- 音声RTPとは別のRTPイベントとして扱われるため、コーデックによる劣化の影響を受けにくい
- SIP/VoIP環境で事実上の標準方式として広く利用されている
イメージ
【RFC2833(Out-of-band / RTP Events)】
電話機で「1」キー押下
↓
端末が「DTMFイベント: '1'」というデータを生成
↓
RTPイベントパケットとして送信(音声とは別枠)
↓
相手側機器は「イベント情報」を受け取り、
確実に「1」が押されたことを認識できる
メリット:
- 音声コーデック(G.711, G.729, G.722 など)に依存せず、DTMFが安定して伝送できる
- パケットロスや遅延の状況でも比較的安定して認識できるよう設計されている
- IP-PBX、IVR、SIPトランクなど、現代のVoIP環境で標準的にサポート
デメリット:
- 両端の機器(IP電話機・ゲートウェイ・PBXなど)がRFC2833に対応している必要がある
- アナログ網のみの環境ではそのまま使えない(ゲートウェイで変換が必要)
5. 「RFC2833」と「みなし音声」の違い(まとめ)
| 項目 | RFC2833 | みなし音声(In-band DTMF) |
|---|---|---|
| 伝送の考え方 | DTMFを音声とは別のデータ(RTPイベント)として送る | DTMFを普通の音声としてそのまま送る |
| 主な利用環境 | IPネットワーク(SIP / VoIP、IP-PBX、IVRなど) | アナログ回線、TDM-PBX、シンプルな音声回線 |
| コーデックの影響 | ほぼ受けない(コーデック非依存) | 大きく受ける(歪み・誤検出の原因) |
| 互換性 | VoIP機器同士で設定が一致している必要あり | 古い機器・アナログ網と相性がよい |
| 典型的な説明 | 「IPネットワーク上でDTMFを伝送する標準規格」 | 「DTMFを ‘みなし音声’ として扱う伝統的な方式(主にアナログ伝送路で使用)」 |
6. どちらを使うべきか
- IP電話(SIP)、IP-PBX、クラウドPBX、IVRなどが絡む構成:
→ 原則 RFC2833 を利用するのがベストプラクティス - 純粋なアナログ回線のみ・古いPBXのみの環境:
→ 従来どおり みなし音声(In-band DTMF) で問題ないケースが多い
まとめ:
- DTMFは「2つの周波数の組み合わせ」で数字や記号を伝える電話用の信号方式。
- みなし音声は「DTMFをそのまま音声として」伝送する方式で、アナログ回線で主流だった。
- RFC2833は「IPネットワーク上でDTMFを音声とは別のイベントとして伝送する規格」で、現代のSIP/VoIP環境で標準的に利用されている。
- VoIP環境では、コーデックの影響を避けるため、基本的に RFC2833 を優先的に使うのが推奨される。