Sesame vs Uberduck AI Voices

Comparing the features of Sesame to Uberduck AI Voices

Feature

Sesame

Uberduck AI Voices

Capability Features

API Access

Consistent Personality

Context Awareness

Conversational Dynamics

Conversational Speech Generation

Dataset Size

1 million hours

Emotional Intelligence

Evaluation Suite

Industry-Leading Accuracy

Make Music

Make Videos

Make Voiceovers

Model Sizes

Tiny: 1B backbone, 100M decoderSmall: 3B backbone, 250M decoderMedium: 8B backbone, 300M decoder

Multiple Speaker Handling

Objective Metrics

Word Error RateSpeaker SimilarityHomograph DisambiguationPronunciation Consistency

Partial Multilingual Support Planned

Planned for 20+ languages

Pronunciation Correction

Sequence Length

2048

Single-Stage Model

Speech to Speech

Subjective Metrics

Comparative Mean Opinion Score

Supported Language List

AfrikaansAlbanianAmharicArabicArmenianAzerbaijaniBengaliBosnianBulgarianBurmeseCatalanChineseCroatianCzechDanishDutchEnglishEstonianFilipinoFinnishFrenchGeorgianGermanGreekHebrewHindiHungarianIcelandicIndonesianIrishItalianJapaneseJavaneseKannadaKazakhKhmerKoreanLaoLatvianLithuanianMacedonianMalayMalteseMandarinMongolianNepaliNorwegianPashtoPersianPolishPortugueseRomanianRussianSerbianSinhalaSlovakSlovenianSomaliSpanishSwahiliSwedishTagalogTamilTeluguThaiTurkishUkrainianUrduUzbekVietnameseWelshZulu

Text and Audio Input

TextAudio

Text to Rapping

Text to Singing

Text to Speech

Training Epochs

Voice Cloning

Voice Conversion

Voice Options

AbbiAbeoAditiAIGenerate1AIGenerate2Aisha PatelAlfieAmberAmyAnaAndrewAndrewMultilingualNeuralAnnetteAriaArthurAshleyAsiliaAvaAvaMultilingualNeuralAyandaB La BBellaBig GBlueBrandonBrianBrianMultilingualNeuralCarlyChilembaChristopherClaraConnorCoraDanielleDarrenDavid KimDavisDuncanElena RodriguezElimuElizabethElliotElsieEmilyEmmaEmmaMultilingualNeuralen-AU-Neural2-Aen-AU-Neural2-Ben-AU-Neural2-Cen-AU-Neural2-Den-AU-News-Een-AU-News-Fen-AU-News-Gen-AU-Polyglot-1en-AU-Standard-Aen-AU-Standard-Ben-AU-Standard-Cen-AU-Standard-Den-AU-Wavenet-Aen-AU-Wavenet-Ben-AU-Wavenet-Cen-AU-Wavenet-Den-GB-Neural2-Aen-GB-Neural2-Ben-GB-Neural2-Cen-GB-Neural2-Den-GB-Neural2-Fen-GB-News-Gen-GB-News-Hen-GB-News-Ien-GB-News-Jen-GB-News-Ken-GB-News-Len-GB-News-Men-GB-Standard-Aen-GB-Standard-Ben-GB-Standard-Cen-GB-Standard-Den-GB-Standard-Fen-GB-Studio-Ben-GB-Studio-Cen-GB-Wavenet-Aen-GB-Wavenet-Ben-GB-Wavenet-Cen-GB-Wavenet-Den-GB-Wavenet-Fen-IN-Neural2-Aen-IN-Neural2-Ben-IN-Neural2-Cen-IN-Neural2-Den-IN-Standard-Aen-IN-Standard-Ben-IN-Standard-Cen-IN-Standard-Den-IN-Wavenet-Aen-IN-Wavenet-Ben-IN-Wavenet-Cen-IN-Wavenet-Den-US-Casual-Ken-US-Journey-Den-US-Journey-Fen-US-Neural2-Aen-US-Neural2-Cen-US-Neural2-Den-US-Neural2-Een-US-Neural2-Fen-US-Neural2-Gen-US-Neural2-Hen-US-Neural2-Ien-US-Neural2-Jen-US-News-Ken-US-News-Len-US-News-Nen-US-Polyglot-1en-US-Standard-Aen-US-Standard-Ben-US-Standard-Cen-US-Standard-Den-US-Standard-Een-US-Standard-Fen-US-Standard-Gen-US-Standard-Hen-US-Standard-Ien-US-Standard-Jen-US-Studio-Oen-US-Studio-Qen-US-Wavenet-Aen-US-Wavenet-Ben-US-Wavenet-Cen-US-Wavenet-Den-US-Wavenet-Een-US-Wavenet-Fen-US-Wavenet-Gen-US-Wavenet-Hen-US-Wavenet-Ien-US-Wavenet-JEricEthanEzinneFreyaGeraintGregoryGuyHollieImaniIvyJacobJamesJames WilsonJaneJasonJennyJenny MultilingualJenny Multilingual V2JoannaJoanneJoeyJSXIJustinKajalKenKendraKevinKimKimberlyLeahLiamLibbyLucas GarciaLukeLunaMaisieMarcus JohnsonMatthewMaya ThompsonMiaMichelleMitchellMollyMonicaNancyNatashaNeerjaNeilNiamhNicoleNoahOliverOliviaPrabhatQuackmasterRaveenaRelikkRogerRosaRussellRuthRyanRyan MultilingualSalliSamSaraSarah ChenSoniaSpongeBob SquarePants (Seasons 3–9A)SteffanStephenT.A.G.ThomasTimTinaTonyWayneWilliamWRLYanZWF (rapping)

Integration Features

API for Developers

GitHub Release

LLama Architecture Backbone

Mimi Split-RVQ Tokenizer

Limitation Features

Cannot Model Conversation Structure

English Language Dominance

Memory Bottleneck in Training

No Pre-trained Language Model Use

Real-Time Generation Delay

RVQ time-to-first-audio scales poorly

Text Character Limit

350

Pricing Features

Free Preview

Free Tier

Open Source

Apache 2.0

Upgrade Option