Voice cloning

Pilar: Voice AI
Sinônimos / aliases: Clonagem de voz, síntese de voz personalizada
Ver também: Embeddings de voz, TTS, ElevenLabs

Técnica que replica a identidade vocal de um falante real a partir de amostras de áudio, gerando síntese perceptivelmente similar ao original. Modelos modernos (CosyVoice 3, XTTS, ElevenLabs PVC) extraem um embedding de falante (x-vector ou d-vector) e o usam como condicionamento no decoder de TTS. Zero-shot cloning opera com segundos de áudio; Professional Voice Cloning usa dados de treinamento mais extensos para maior fidelidade.

Onde aparece

Voice cloning é aplicado no componente TTS: em vez de voz genérica, o modelo usa o embedding do falante-alvo para gerar áudio com a identidade vocal desejada.

Fontes