Empresa e API de STT com foco em accuracy e features avançadas (diarização de falantes, detecção de sentimento, resumos automáticos). Modelo atual Universal-3 Pro Streaming (mai/2026): US$ 0,15/hr. WER médio de 8,6% em benchmarks próprios da AssemblyAI; no AA-WER v2.0 da Artificial Analysis — benchmark independente que avalia modelos em cenários de voice agent — ocupa a 3ª posição. Suporta 99 idiomas. Latência de streaming ligeiramente acima do Deepgram Nova-3.
Onde aparece
AssemblyAI é usado no STT quando accuracy supera latência como critério principal — comum em transcrição médica, jurídica ou quando diarização de falantes é necessária no pipeline.