CallBridge 통화 시스템은 WebSocket 연결을 통해 사용자의 음성 데이터를 Agent(LLM) 서버로 전달합니다.
음성 데이터는 Base64로 인코딩된 오디오 스트림 형태로 전송됩니다.
1. API 개요
사용자가 전화 통화 중 발화한 음성은 WebSocket을 통해 Agent 서버로 실시간 전달됩니다.
전달되는 데이터는 다음과 같습니다.
•
사용자 음성 오디오
•
Base64 인코딩된 PCM 데이터
•
사전에 협의된 오디오 포맷
오디오 포맷은 세션 생성 시 전달된 phone_output_audio_format 설정을 따라야 합니다.
2. 사전 조건 / 권한
•
콜브릿지(CallBridge) 계정 생성
•
Agent WebSocket 연결 수립
•
음성 세션이 이미 started 상태
3. API 정보
wss {wss 또는 ws}://{상담콜내 연동정보 입력한 주소}
4. Audio Stream Request
CallBridge는 사용자의 음성 데이터를 다음 메시지 형태로 전송합니다.
Message Format
{
"user_audio_chunk": "BASE64_AUDIO_DATA"
}
JavaScript
복사
5. Request Field
이름 | 타입 | 필수 | 기본값 | 설명 |
user_audio_chunk | string | O | pcm_8000 | Base64로 인코딩된 사용자 음성 데이터
오디오 형식은 phone_output_audio_format 내용대로여야 함.) |
Audio Format
전송되는 오디오는 다음 포맷을 따릅니다.
항목 | 값 |
Encoding | PCM |
Sample Rate | 8000 Hz |
Bit Depth | 16 bit |
Channel | Mono |
해당 포맷은 세션 생성 시 전달된
phone_output_audio_format
Plain Text
복사
설정을 따릅니다.
5. Response
Response Example
{
"type": "audio",
"audio_event": {
"audio_base_64": "BASE64_AUDIO_DATA"
}
}
JavaScript
복사
Resonse Field명
이름 | 타입 | 필수 | 기본값 | 설명 |
type | String | O | - | 이벤트 타입 (예: "audio") |
audio_event | Object | O | - | 음성 응답 데이터 |
audio_event
이름 | 타입 | 필수 | 기본값 | 설명 |
audio_base_64 | String | O | pcm_8000 | Base64 인코딩된 음성 데이터(phone_input_audio_format 내용대로여야 함.) |
Response Audio Format
Agent가 반환하는 오디오는 다음 포맷을 따라야 합니다.
항목 | 값 |
Encoding | PCM |
Sample Rate | 8000 Hz |
Bit Depth | 16 bit |
Channel | Mono |
해당 포맷은 세션 생성 시 전달된
phone_input_audio_format
Plain Text
복사
설정을 따라야 합니다.
