AssemblyAI

Pilar: Voice AI
Sinônimos / aliases: assemblyai.com, Universal-2, Universal-3
Ver também: STT, ASR streaming, Deepgram

Empresa e API de STT com foco em accuracy e features avançadas (diarização de falantes, detecção de sentimento, resumos automáticos). Modelo atual Universal-3 Pro Streaming (mai/2026): US$ 0,15/hr. WER médio de 8,6% em benchmarks próprios da AssemblyAI; no AA-WER v2.0 da Artificial Analysis — benchmark independente que avalia modelos em cenários de voice agent — ocupa a 3ª posição. Suporta 99 idiomas. Latência de streaming ligeiramente acima do Deepgram Nova-3.

Onde aparece

AssemblyAI é usado no STT quando accuracy supera latência como critério principal — comum em transcrição médica, jurídica ou quando diarização de falantes é necessária no pipeline.

Fontes