Capacidade de o usuário interromper o agente de voz enquanto ele ainda fala, fazendo o agente parar e processar a nova entrada. Implementado via VAD contínuo no canal de entrada: quando fala humana é detectada durante reprodução do TTS, o pipeline cancela o stream de saída. Sem barge-in, o agente soa como URA tradicional — o usuário precisa aguardar o fim completo da resposta para falar.
Onde aparece
Barge-in exige VAD ativo mesmo enquanto o agente fala, e integração entre o layer de transporte (WebRTC/RTP) e o orquestrador do pipeline para cancelar o TTS em andamento.