CallBridge → Agent 음성 데이터 전송 (WebSocket)

CallBridge 통화 시스템은 WebSocket 연결을 통해 사용자의 음성 데이터를 Agent(LLM) 서버로 전달합니다.
음성 데이터는 Base64로 인코딩된 오디오 스트림 형태로 전송됩니다.

1. API 개요

사용자가 전화 통화 중 발화한 음성은 WebSocket을 통해 Agent 서버로 실시간 전달됩니다.

전달되는 데이터는 다음과 같습니다.
사용자 음성 오디오
Base64 인코딩된 PCM 데이터
사전에 협의된 오디오 포맷
오디오 포맷은 세션 생성 시 전달된 phone_output_audio_format 설정을 따라야 합니다.

2. 사전 조건 / 권한

콜브릿지(CallBridge) 계정 생성
Agent WebSocket 연결 수립
음성 세션이 이미 started 상태

3. API 정보

wss {wss 또는 ws}://{상담콜내 연동정보 입력한 주소}

4. Audio Stream Request

CallBridge는 사용자의 음성 데이터를 다음 메시지 형태로 전송합니다.

Message Format

{ "user_audio_chunk": "BASE64_AUDIO_DATA" }
JavaScript
복사

5. Request Field

이름
타입
필수
기본값
설명
user_audio_chunk
string
O
pcm_8000
Base64로 인코딩된 사용자 음성 데이터 오디오 형식은 phone_output_audio_format 내용대로여야 함.)

Audio Format

전송되는 오디오는 다음 포맷을 따릅니다.
항목
Encoding
PCM
Sample Rate
8000 Hz
Bit Depth
16 bit
Channel
Mono
해당 포맷은 세션 생성 시 전달된
phone_output_audio_format
Plain Text
복사
설정을 따릅니다.

5. Response

Response Example

{ "type": "audio", "audio_event": { "audio_base_64": "BASE64_AUDIO_DATA" } }
JavaScript
복사

Resonse Field명

이름
타입
필수
기본값
설명
type
String
O
-
이벤트 타입 (예: "audio")
audio_event
Object
O
-
음성 응답 데이터

audio_event

이름
타입
필수
기본값
설명
audio_base_64
String
O
pcm_8000
Base64 인코딩된 음성 데이터(phone_input_audio_format 내용대로여야 함.)

Response Audio Format

Agent가 반환하는 오디오는 다음 포맷을 따라야 합니다.
항목
Encoding
PCM
Sample Rate
8000 Hz
Bit Depth
16 bit
Channel
Mono
해당 포맷은 세션 생성 시 전달된
phone_input_audio_format
Plain Text
복사
설정을 따라야 합니다.