I servizi di raccolta dati vocali più affidabili per la tua intelligenza artificiale

Addestra i tuoi modelli NLP, VA, prototipi TTS e altro ancora con dati conversazionali di qualità, con i nostri servizi di raccolta dati audio e vocali

Raccolta dati audio

Scopri pipeline di dati audio senza colli di bottiglia

Clienti in primo piano

Servizi professionali di raccolta dati audio/vocali

Qualsiasi argomento. Qualsiasi scenario.

In Shaip, la nostra esperienza risiede nella creazione di set di dati vocali di alta qualità progettati per diversi requisiti AI/ML. Offriamo una vasta gamma di lingue e registriamo in contesti diversi, rendendo i nostri set di dati completi e adattabili. OIl nostro obiettivo è fornire ai modelli il volume più elevato di dati vocali personalizzati, nel minor tempo possibile. Con noi a bordo, puoi aspettarti: 

Raccolta di discorsi
  • Dati audio/vocali multilingue di alta qualità curati per migliorare la precisione
  • Livello più alto possibile di specificità del dominio per tuno scenario diversificato flessibile.
  •  Ridimensiona il tuo modello ML per adattarsi a diversi dati demografici e verticali
  • Ambienti di registrazione: Qualità dello studio, con audio cristallino con rumore di fondo minimo e Ambienti naturali, dove le registrazioni incorporano suoni ambientali per imitare situazioni del mondo reale.

100+

Paesi

55K +

Dati sulle ore di parlato

250+

Progetti

60+

Lingue (oltre 100 dialetti)

8 / 16 / 44 / 48 kHz

Frequenza di campionamento

La nostra competenza

Allinea i dati audio per modelli PNL più intelligenti

Shaip offre servizi di raccolta dati vocali/audio end-to-end in oltre 100 lingue per consentire alle tecnologie abilitate alla voce di soddisfare un pubblico diversificato in tutto il mondo. Possiamo lavorare su progetti di qualsiasi portata e dimensione; dalla licenza di set di dati audio standard esistenti, alla gestione della raccolta di dati audio personalizzati, alla trascrizione e annotazione dell'audio. Indipendentemente dalle dimensioni del tuo progetto di raccolta dei dati vocali, possiamo personalizzare i servizi di raccolta audio in base alle tue esigenze per creare set di dati NLP di alta qualità destinati a dialetti, toni e lingue. Scegli dalla nostra vasta gamma di set di dati vocali e risorse di raccolta dati audio, per configurazioni intelligenti con abilitazione vocale.

Monologue speech

Collezione di discorsi di monologo

Si concentra sull'elaborazione del parlato di un singolo parlante. Utilizza istruzioni con script da inserire in file audio a canale singolo, garantendo l'acquisizione di modelli vocali, toni e sfumature unici e specifici per quell'individuo.

Dialogue speech

Discorso di dialogo
Collezione

Interazione tra due persone, replica di conversazioni e dialoghi del mondo reale con esposizione multilingue tramite file a doppio canale e risorse trascritte.

Multi-party conversations

Gruppo/Muti-party
conversazioni

Discussioni tra più persone, catturando dinamiche di gruppo, sovrapposizioni e toni diversi in modo da addestrare accuratamente modelli vocali.

Espressione del linguaggio naturale

Raccolta di enunciati in linguaggio naturale

Addestra le IA a identificare frasi o risvegliare parole con significati simili utilizzando espressioni diverse, ricche e autentiche per l'elaborazione e la comprensione avanzate del linguaggio naturale.

Acoustic speech

Dati acustici
Collezione

Possiamo registrare professionalmente dati audio di qualità da studio che si tratti di ristoranti, uffici o case o da vari ambienti e lingue, coprendo al contempo una gamma acustica più ampia (Comprehensive Sound Datasets).

Riconoscimento vocale automatico

Riconoscimento vocale automatico (ASR)

Migliora la precisione dei tuoi sistemi di riconoscimento vocale automatico (ASR) accedendo a set di dati vocali/audio diversificati all'avanguardia, da un'ampia gamma di dati demografici.

Espressione del linguaggio naturale

Dati di formazione vocale/audio multilingue

I nostri professionisti linguistici qualificati, in tutto il mondo, offrono dati audio/parlati multilingue in varie lingue e dialetti. Questo impegno promuove la comunicazione globale e supera le barriere linguistiche, contribuendo a soluzioni di intelligenza artificiale più inclusive ed efficaci.

Digital virtual assistants

Text-to-Speech
(STT)

Costruisci un modello multilingue di sintesi vocale (TTS) con l'aiuto della nostra forza lavoro globale, che ti aiuta a raccogliere dati vocali in oltre 150 lingue e dialetti per migliorare i tuoi modelli di intelligenza artificiale, dai controlli in auto ai chatbot e alle soluzioni di apprendimento ad alta dati audio di qualità.

Call center recordings

Call Center
Registrazioni

Scambi genuini tra agenti e clienti, supportando numerose lingue come spagnolo, tedesco, inglese americano, bengalese, giapponese, cinese e hindi.

Storie di successo

Set di dati AI conversazionali con oltre 3 ore di dati in 8 lingue

Cercando di costruire una piattaforma multilingue per le lingue indiane, il cliente ha collaborato con Shaip per raccogliere, segmentare e trascrivere grandi set di dati in più lingue indiane. Ciò contribuirebbe a sviluppare modelli vocali efficaci che potrebbero alimentare la nuova piattaforma innovativa del cliente.

Problema: Oltre 3,000 ore di dati audio raccolti in 8 lingue indiane, segmentati e trascritti per sviluppare il riconoscimento vocale automatico.

Soluzione: Abbiamo fornito la raccolta, la segmentazione e la trascrizione dei dati e abbiamo fornito file JSON con metadati. Abbiamo raccolto 3000 ore di dati audio in 8 lingue indiane su larga scala per il progetto di tecnologia vocale del cliente.

Speech data collection case study

Motivi per scegliere Shaip come partner affidabile per la raccolta di dati vocali

Persone

Persone

Team dedicati e formati:

  • Oltre 30,000 collaboratori per la creazione di dati, l'etichettatura e il controllo qualità
  • Team di gestione del progetto con credenziali
  • Team di sviluppo prodotto esperto
  • Talent Pool Sourcing & Onboarding Team
Processo

Processo

La massima efficienza del processo è assicurata da:

  • Robusto processo Stage-Gate 6 Sigma
  • Un team dedicato di cinture nere 6 Sigma: titolari di processi chiave e conformità alla qualità
  • Miglioramento continuo e ciclo di feedback
Piattaforma

Piattaforma

La piattaforma brevettata offre vantaggi:

  • Piattaforma end-to-end basata sul web
  • Qualità impeccabile
  • TAT . più veloce
  • Consegna senza soluzione di continuità

Set di dati vocali/audio pronti all'uso

DettagliSet di dati della linguaFrequenza di CampionamentoTipo di set di datiOre audio totaliBreve DescrizioneDescrizione del set di datiCanale audioPiattaforma di registrazioneER (%)Formato AudioFormato di trascrizioneUsa casoNumero di altoparlantiCTA
Discorsoit_US_CC_8volgare afroamericanovolgare afroamericanoit_IT8 kHzCall center211Dati del call center in vernacolo afroamericanoConversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti,DoppioDesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFemmine: 612, maschi: 1242 e sconosciute: 12
Discorsoit_US_MA_16volgare afroamericanovolgare afroamericanoit_IT16 kHzAudio multimediale154Dati dei media vernacolari afroamericaniConcedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minutiMonoApprovvigionamento Web5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFemmine: 151, maschi: 150 e sconosciute: 10
DiscorsoAfrikaans_GC_8afrikaansafrikaansaf_ZA8 kHzConversazione generale368Dati di conversazione generale in afrikaansConversazione telefonica senza script tra due persone. ca. Durata dell'audio (intervallo) - 15-60 minuti, afrikaans parlato in AfricaDoppioDesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFemmine: 502, maschi: 390 e sconosciute: 2
DiscorsoAfrikaans_MA_16afrikaansafrikaansaf_ZA16 kHzAudio multimediale658File multimediali afrikaansConcedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minutiMonoApprovvigionamento Web5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFemmine: 750, maschi: 1278 e sconosciute: 52
DiscorsoArabo_GC_8AraboAraboar_AE8 kHzConversazione generale292Dati di conversazioni generali in araboConversazione telefonica senza script tra due persone. ca. Durata dell'audio (intervallo) - 15-60 minuti, arabo dai paesi del GolfoDoppioDesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFemmine: 171, maschi: 534 e sconosciute: 1
DiscorsoArabo_SM_48AraboAraboar-SA48 kHzMonologo sceneggiato1,947Monologo scritto in araboRegistrazioni a enunciazione singola, che tendono a rientrare nell'intervallo da 5 a 30 secondiMonomobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFemmina 838 Maschio 1209 Sconosciuto 78
DiscorsoAssamese_CC_8AssameseAssamese (in pipeline) come inCall center60Dati del Call Center Assamese (In Pipeline).Conversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti,Desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
DiscorsoAssamese_GCAssameseAssamese (in pipeline) come inConversazione generale100Assamese (In Pipeline) Dati di conversazione generaleConversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti,Desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
DiscorsoAssamese_MAAssameseAssamese (in pipeline) come inAudio multimediale40Assamese (In Pipeline) Dati audio multimedialiConcedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minutiApprovvigionamento Web5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Discorsobengalese_CC_8BengaleseBengalese (in cantiere) bn_INCall center60Dati del call center bengalese (in pipeline).Conversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti,Desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Discorsobengalese_GCBengaleseBengalese (in cantiere) bn_INConversazione generale100Dati di conversazione generale in bengalese (in pipeline).Conversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti,Desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Discorsobengalese_MABengaleseBengalese (in cantiere) bn_INAudio multimediale40Bengalese (In Pipeline) Dati audio multimedialiConcedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minutiApprovvigionamento Web5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
DiscorsoBoston_CC_8Boston ingleseBoston ingleseit_IT8 kHzCall center177Dati del call center di BostonConversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti,DoppioDesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFemmine: 605, maschi: 711 e sconosciute: 0
DiscorsoBoston_GC_8Boston ingleseBoston ingleseit_IT8 kHzConversazione generale32Dati di conversazione generale di BostonConversazione telefonica senza script tra due persone. ca. Durata dell'audio (intervallo) - 15-60 minuti, DoppioDesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFemmine: 53, maschi: 83 e sconosciute: 0
DiscorsoBoston_MA_16Boston ingleseBoston ingleseit_IT16 kHzAudio multimediale93Dati audio di Boston MediaConcedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minutiMonoApprovvigionamento Web5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFemmine: 43, maschi: 181 e sconosciute: 2
DiscorsoCanadese_SM_48Francese canadeseFrancese canadesefr-CA48 kHzMonologo sceneggiato1,222Francese canadeseRegistrazioni a enunciazione singola, che tendono a rientrare nell'intervallo da 5 a 30 secondiMonomobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFemmina 974 Maschio 631 Sconosciuto 1
DiscorsoCinese_CC_8Inglese cineseInglese cineseit_IT8 kHzCall center169Dati del call center cineseConversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti,DoppioDesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFemmina: 1790, Maschio: 523 e Sconosciuto: 13
DiscorsoCinese_MA_16Inglese cineseInglese cineseit_IT16 kHzAudio multimediale249Dati audio dei media cinesiConcedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minutiMonoApprovvigionamento Web5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFemmina: 126, Maschio: 346 e Sconosciuto: 6
DiscorsoCinese semplificato_SM_48Cinese semplificatoCinese semplificatoZH-CN48 kHzMonologo sceneggiato2,762Cinese semplificatoRegistrazioni a enunciazione singola, che tendono a rientrare nell'intervallo da 5 a 30 secondiMonomobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFemmina 1920 Maschio 1535 Sconosciuto 270
DiscorsoCinese tradizionale_SM_48Cinese tradizionaleCinese tradizionalezh-TW48 kHzMonologo sceneggiato1,028Cinese tradizionaleRegistrazioni a enunciazione singola, che tendono a rientrare nell'intervallo da 5 a 30 secondiMonomobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFemmina 1069 Maschio 262 Sconosciuto 3
DiscorsoDanese_GC_8DaneseDaneseda_DK8 kHzConversazione generale372Dati di conversazioni generali danesiConversazione telefonica senza script tra due persone. ca. Durata dell'audio (intervallo) - 15-60 minuti, DoppioDesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingDonne: 311, Uomini: 417, Sconosciuto: 0
DiscorsoDanese_MA_16DaneseDaneseda_DK16 kHzAudio multimediale664Dati audio dei media danesiConcedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minutiMonoApprovvigionamento Web5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingDonne: 369, Uomini: 864, Sconosciuto: 27
DiscorsoDanese_SM_48DaneseDaneseDA-DK48 kHzMonologo sceneggiato2,579Monologo con sceneggiatura daneseRegistrazioni a enunciato singolo, che tendono a rientrare nell'intervallo da 5 a 30 secondi, danese dalla DanimarcaMonomobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFemmina 1551 Maschio 1233 Sconosciuto 42
DiscorsoInglese profondo sud_CC_8Inglese profondo sudInglese profondo sudit_IT8 kHzCall center151Dati del call center del profondo sud ingleseConversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti,DoppioDesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFemmina 221 , Maschio 1004 , Sconosciuto 7
DiscorsoInglese profondo sud_GC_8Inglese profondo sudInglese profondo sudit_IT8 kHzConversazione generale56Dati di conversazione generale del profondo sud ingleseConversazione telefonica senza script tra due persone. ca. Durata dell'audio (intervallo) - 15-60 minuti, DoppioDesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFemmina 99, Maschio 31, Sconosciuto 0
DiscorsoInglese profondo sud_MA_16Inglese profondo sudInglese profondo sudit_IT16 kHzAudio multimediale266Dati audio di Deep South Media in ingleseConcedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minutiMonoApprovvigionamento Web5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFemmina 204, Maschio 356, Sconosciuto 21
DiscorsoTedesco_CC_8TedescoTedescode-De8 kHzCall center64Dati del call center tedesco Conversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti,MonoDesktop. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFemmina 478 Maschio 1440 Sconosciuto 0
DiscorsoTedesco_IVR_8TedescoTedescode-De8 kHz IVR200Dati IVR tedeschiDa uomo a macchina. Un flusso di tipo IVR in cui è presente un prompt TTS (ad es. "Come posso aiutarti") seguito da una risposta umana spontaneaMonoDesktop. Wav .jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling Femmina 10115 Maschio 8750 Sconosciuto 0
DiscorsoGujarati_CC_8GujaratiGujarati (in cantiere) gu_INCall center60Gujarati (In Pipeline) Dati del call centerConversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti,Desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
DiscorsoGujarati_GCGujaratiGujarati (in cantiere) gu_INConversazione generale100Dati di conversazione generale gujarati (in pipeline).Conversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti,Desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
DiscorsoGujarati_MAGujaratiGujarati (in cantiere) gu_INAudio multimediale40Gujarati (In Pipeline) Dati audio multimedialiConcedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minutiApprovvigionamento Web5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
DiscorsoEbraico_Conversazione Generale_8ebraicoebraicolui_IL8 kHzConversazione generale399Dati di conversazione generale in ebraicoConversazione telefonica senza script tra due persone. ca. Durata dell'audio (intervallo) - 15-60 minuti, ebraico in IsraeleDoppioDesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFemmina 414 , Maschio 399 , Sconosciuto 1
DiscorsoEbraico_MA_16ebraicoebraicolui_IL16 kHzAudio multimediale427Dati audio dei media ebraiciConcedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minutiMonoApprovvigionamento Web5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFemmina 361, Maschio 513, Sconosciuto 13
DiscorsoHindi_MA_16HindiHindiciao_IN16 kHzAudio multimediale219Hindi Media dati audioConcedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minutiMonoApprovvigionamento Web5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFemmina 83, Maschio 309, Sconosciuto 0
Discorsohindi_SM_48HindiHindiciao-IN48 kHzMonologo sceneggiato2,867Monologo scritto in hindiRegistrazioni a enunciazione singola, che tendono a rientrare nell'intervallo da 5 a 30 secondiMonomobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFemmina 1977 Maschio 1864 Sconosciuto 147
DiscorsoINGLESE_CC_8HinglishHinglishhg_IN8 kHzCall center208HINGLISH Dati del call centerConversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti,DoppioDesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFemmina 822, Maschio 1262 , Sconosciuto 0
DiscorsoHINGLISH_MA_16HinglishHinglishhg_IN16 kHzAudio multimediale216HINGLISH Dati audio multimedialiConcedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minutiMonoApprovvigionamento Web5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFemmina 75, Maschio 380, Sconosciuto 0
DiscorsoIspanico_CC_8inglese ispanicoinglese ispanicoit_IT8 kHzCall center212Dati del call center ispanicoConversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti,DoppioDesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFemmina 822, Maschio 1262, Sconosciuto 0
DiscorsoIspanico_MA_16inglese ispanicoinglese ispanicoit_IT16 kHzAudio multimediale155Audio multimediale per chiamate ispanicheConcedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minutiMonoApprovvigionamento Web5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFemmina 140, Maschio 219, Sconosciuto 5
DiscorsoIndonesiano_GC_8IndonesianoIndonesianoL'ho fatto8 kHzConversazione generale496Dati di conversazione generale indonesianaConversazione telefonica senza script tra due persone. ca. Durata dell'audio (intervallo) - 15-60 minuti, indonesiano bahasaDoppioDesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFemmina 524, Maschio 454, Sconosciuto 2
DiscorsoIndonesiano_MA_16IndonesianoIndonesianoL'ho fatto16 kHzAudio multimediale643Dati audio multimediali indonesianiConcedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minutiMonoApprovvigionamento Web5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFemmina 746, Maschio 1507, Sconosciuto 129
Discorsoirlandese_GC_8irlandeseirlandeseit_IT8 kHzConversazione generale192Dati sulla conversazione generale irlandeseConversazione telefonica senza script tra due persone. ca. Durata dell'audio (intervallo) - 15-60 minuti, DoppioDesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFemmina 213 , Maschio 153 , Sconosciuto 0
DiscorsoGiapponese_SM_48GiapponeseGiapponeseja-JP48 kHzMonologo sceneggiato2,335Monologo scritto in giapponeseRegistrazioni a enunciazione singola, che tendono a rientrare nell'intervallo da 5 a 30 secondiMonomobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFemmina 1460 Maschio 1221 Sconosciuto 194
DiscorsoKannada_CC_8kannadaKannada (in cantiere) kn_INCall center60Kannada (In Pipeline) Dati del call centerConversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti,Desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
DiscorsoKannada_GCkannadaKannada (in cantiere) kn_INConversazione generale100Kannada (In Pipeline) Dati di conversazione generaleConversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti,Desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
DiscorsoKannada_MAkannadaKannada (in cantiere) kn_INAudio multimediale40Kannada (In Pipeline) Dati audio multimedialiConcedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minutiApprovvigionamento Web5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
DiscorsoCoreano_CC_8CoreanoCoreanoko_KR8 kHzCall center107Dati del call center coreanoConversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti,DoppioDesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFemmina 1086, Maschio 210, Sconosciuto 4
DiscorsoCoreano_MA_16CoreanoCoreanoko_KR16 kHzAudio multimediale204Dati audio multimediali coreaniConcedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minutiMonoApprovvigionamento Web5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFemmina 70 Maschio 303, Sconosciuto 25
DiscorsoCoreano_SM_48CoreanoCoreanoko-KR48 kHzMonologo sceneggiato1,955Monologo scritto in coreanoRegistrazioni a enunciazione singola, che tendono a rientrare nell'intervallo da 5 a 30 secondiMonomobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFemmina 1195 Maschio 1134 Sconosciuto 122
Discorsomalese_GC_8MalayMalayms_MIO8 kHzConversazione generale266Dati di conversazione generale maleseConversazione telefonica senza script tra due persone. ca. Durata dell'audio (intervallo) - 15-60 minuti, malese in MalesiaDoppioDesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFemmina 316, Maschio 176 , Sconosciuto 0
DiscorsoMalese_MA_16MalayMalayms_MIO16 kHzAudio multimediale344Dati audio multimediali malesiConcedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minutiMonoApprovvigionamento Web5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFemmina 236, Maschio 626, Sconosciuto 47
DiscorsoMalayalam_CC_8MalayalamMalayalam (in cantiere) ml_INCall center60Dati del call center Malayalam (In Pipeline).Conversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti,Desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
DiscorsoMalayalam_GCMalayalamMalayalam (in cantiere) ml_INConversazione generale100Malayalam (In Pipeline) Dati di conversazione generaleConversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti,Desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
DiscorsoMalayalam_MAMalayalamMalayalam (in cantiere) ml_INAudio multimediale40Malayalam (In Pipeline) Dati audio multimedialiConcedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minutiApprovvigionamento Web5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
DiscorsoMarathi_CC_8marathiMarathi (in cantiere) signor_INCall center60Dati del call center Marathi (in pipeline).Conversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti,Desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
DiscorsoMarathi_GCmarathiMarathi (in cantiere) signor_INConversazione generale100Dati di conversazione generale Marathi (In Pipeline).Conversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti,Desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
DiscorsoMarathi_MAmarathiMarathi (in cantiere) signor_INAudio multimediale40Marathi (In Pipeline) Dati audio multimedialiConcedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minutiApprovvigionamento Web5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
DiscorsoMessicano_SM_48Spagnolo (Messico)Spagnolo (Messico)it-MX48 kHzMonologo sceneggiato1,492Monologo scritto in spagnolo messicanoRegistrazioni a enunciazione singola, che tendono a rientrare nell'intervallo da 5 a 30 secondiMonomobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFemmina 1016 Maschio 1069 Sconosciuto 95
DiscorsoPaesi Bassi_SM_48OlandeseOlandesenl-NL48 kHzMonologo sceneggiato1,205Monologo scritto in olandeseRegistrazioni a enunciazione singola, che tendono a rientrare nell'intervallo da 5 a 30 secondiMonomobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFemmina 1285 Maschio 531 Sconosciuto 3
DiscorsoNew York inglese_CC_8Inglese di New YorkInglese di New Yorkit_IT8 kHzCall center103Dati del call center inglese di New YorkConversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti,DoppioDesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFemmina 610, Maschio 532, Sconosciuto 0
DiscorsoInglese di New York_GC_8Inglese di New YorkInglese di New Yorkit_IT8 kHzConversazione generale107Dati di New York English General ConversationConversazione telefonica senza script tra due persone. ca. Durata dell'audio (intervallo) - 15-60 minuti, DoppioDesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFemmina 118, Maschio 114, Sconosciuto 0
DiscorsoInglese di New York_MA_16Inglese di New YorkInglese di New Yorkit_IT16 kHzAudio multimediale140Dati audio di New York English MediaConcedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minutiMonoApprovvigionamento Web5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFemmina 66, Maschio 230, Sconosciuto 11
DiscorsoNuova Zelanda_GC_8Nuova Zelanda inglese Nuova Zelanda inglese it_NZ8 kHzConversazione generale148Dati di conversazione generale in inglese neozelandeseConversazione telefonica senza script tra due persone. ca. Durata dell'audio (intervallo) - 15-60 minuti, DoppioDesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFemmina 167, maschio 121, sconosciuto 4
DiscorsoNuova Zelanda_MA_16Nuova Zelanda inglese Nuova Zelanda inglese it_NZ16 kHzAudio multimediale400Audio multimediale inglese neozelandeseConcedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minutiMonoApprovvigionamento Web5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFemmina 367, maschio 678, sconosciuto 26
DiscorsoOriya_CC_8OriyaOriya (in cantiere) o_INCall center60Oriya (In Pipeline) Dati del call centerConversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti,Desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
DiscorsoOriya_GCOriyaOriya (in cantiere) o_INConversazione generale100Dati di conversazione generale Oriya (In Pipeline).Conversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti,Desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
DiscorsoOriya_MAOriyaOriya (in cantiere) o_INAudio multimediale40Oriya (In Pipeline) Dati audio multimedialiConcedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minutiApprovvigionamento Web5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
DiscorsoPolacco_MA_16PolaccoPolaccopl_PL16 kHzAudio multimediale269Audio multimediale polaccoConcedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minutiMonoApprovvigionamento Web5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFemmina 173 Maschio 354 Sconosciuto 6
DiscorsoPolacco Polonia_SM_48Polacco (Polonia)Polacco (Polonia)pl-PL48 kHzMonologo sceneggiato1,482Polonia polacca - Monologo sceneggiatoRegistrazioni a enunciazione singola, che tendono a rientrare nell'intervallo da 5 a 30 secondiMonomobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFemmina 1324 Maschio 701 Sconosciuto 24
DiscorsoPunjabi_CC_8punjabiPunjabi (in cantiere) punjabiCall center60Punjabi (In Pipeline) Dati del call centerConversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti,Desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
DiscorsoPunjabi_GCpunjabiPunjabi (in cantiere) punjabiConversazione generale100Punjabi (In Pipeline) Dati di conversazione generaleConversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti,Desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
DiscorsoPunjabi_MApunjabiPunjabi (in cantiere) punjabi Audio multimediale40Punjabi (In Pipeline) Dati audio multimedialiConcedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minutiApprovvigionamento Web5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
DiscorsoRusso_SM_48RussoRussoRU-RU48 kHzMonologo sceneggiato2,398Monologo scritto in russoRegistrazioni a enunciazione singola, che tendono a rientrare nell'intervallo da 5 a 30 secondiMonomobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFemmina 1689 Maschio 1937 Sconosciuto 214
DiscorsoScozzese_GC_8scozzese (accento inglese)scozzese (accento inglese)it_AB8 kHzConversazione generale292Dati di conversazione generale scozzeseConversazione telefonica senza script tra due persone. ca. Durata dell'audio (intervallo) - 15-60 minuti, DoppioDesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFemmina 285, Maschio 260, Sconosciuto 3
DiscorsoSingapore_CC_8Inglese di SingaporeInglese di Singaporeit_SG8 kHzCall center218Dati del Call Center di SingaporeConversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti,DoppioDesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFemmina 2139, Maschio 884, Sconosciuto 21
DiscorsoSingapore_MA_16Inglese di SingaporeInglese di Singaporeit_SG16 kHzAudio multimediale247Dati audio di Singapore MediaConcedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minutiMonoApprovvigionamento Web5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFemmina 160, Maschio 455, Sconosciuto 37
DiscorsoInglese sudafricano_CC_8inglese sudafricanoinglese sudafricanoit_ZA8 kHzCall center261Dati del Call Center inglese sudafricanoConversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti,DoppioDesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFemmina 1274 , Maschio 935 , Sconosciuto 1
DiscorsoInglese sudafricano_MA_16inglese sudafricanoinglese sudafricanoit_ZA16 kHzAudio multimediale251Dati audio multimediali in inglese sudafricanoConcedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minutiMonoApprovvigionamento Web5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFemmina 235, Maschio 432, Sconosciuto 36
DiscorsoSwahili_CC_8swahiliswahilisw_KE8 kHzCall center230Dati del call center swahiliConversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti,DoppioDesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFemmina 611, Maschio 833, Sconosciuto 0
DiscorsoSwahili_MA_16swahiliswahilisw_KE16 kHzAudio multimediale265Dati audio Swahili MediaConcedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minutiMonoApprovvigionamento Web5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFemmina 118, Maschio 493, Sconosciuto 25
DiscorsoSvedese_CC_8svedesesvedesesv_SE8 kHzCall center250Dati del call center svedeseConversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti,DoppioDesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFemmina 1581, maschio 727, Sconosciuto 2
DiscorsoSvedese_MA_16svedesesvedesesv_SE16 kHzAudio multimediale278Dati audio dei media svedesiConcedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minutiMonoApprovvigionamento Web5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFemmina 195, maschio 500, Sconosciuto 21
DiscorsoTamil_CC_8tamilTamil (in cantiere) ta_INCall center60Dati del call center tamil (in pipeline).Conversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti,Desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
DiscorsoTamil_GCtamilTamil (in cantiere) ta_INConversazione generale100Tamil (In Pipeline) Dati di conversazione generaleConversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti,Desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
DiscorsoTamil_MAtamil Tamil (in cantiere) ta_INAudio multimediale40Tamil (In Pipeline) Dati audio multimedialiConcedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minutiApprovvigionamento Web5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
DiscorsoTelugu_GC_8telugutelugute_IN8 kHzConversazione generale553Dati di conversazione generale teluguConversazione telefonica senza script tra due persone. ca. Durata dell'audio (intervallo) - 15-60 minuti, DoppioDesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFemmina 574, Maschio 564, Sconosciuto 0
DiscorsoTelugu_MA_16telugutelugute_IN16 kHzAudio multimediale648Telugu Media dati audioConcedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minutiMonoApprovvigionamento Web5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFemmina 207, Maschio 963, Sconosciuto 2
DiscorsoTelugu_CC_8teluguTelugu (in cantiere) te_INCall center30Telugu (In Pipeline) Dati del call centerConversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti,Desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
DiscorsoTelugu_GCteluguTelugu (in cantiere) te_INConversazione generale50Telugu (In Pipeline) Dati di conversazione generaleConversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti,Desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
DiscorsoTelugu_MAteluguTelugu (in cantiere) te_INAudio multimediale20Telugu (In Pipeline) Dati audio multimedialiConcedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minutiApprovvigionamento Web5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
DiscorsoTailandese_GC_8tailandesetailandeseth_TH8 kHzConversazione generale183Conversazione generale tailandeseConversazione telefonica senza script tra due persone. ca. Durata dell'audio (intervallo) - 15-60 minuti, un registro informale utilizzato tra amiciDoppioDesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFemmina 338, Maschio 96, Sconosciuto 8
DiscorsoTailandese_MA_8tailandesetailandeseth_TH16 kHzAudio multimediale173Audio multimediale tailandeseConcedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minutiMonoApprovvigionamento Web5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFemmina 143, Maschio 502, Sconosciuto 26
DiscorsoTurchia turca_SM_48Turchia turcaTurchia turcatr-TR48 kHzMonologo sceneggiato2,027Turchia turcaRegistrazioni a enunciazione singola, che tendono a rientrare nell'intervallo da 5 a 30 secondiMonomobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFemmina 1561 Maschio 1241 Sconosciuto 31
DiscorsoVietnamita_GC_8vietnamitavietnamitavi_VN8 kHzConversazione generale295Dati di conversazione generale vietnamitaConversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti, settentrionale (ad es. Hanoi), centrale e meridionale (ad es. Ho Chi Minh City).DoppioDesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFemmine 400, maschi 380, Sconosciuti 2
DiscorsoVietnamita_MA_16vietnamitavietnamitavi_VN16 kHzAudio multimediale257Dati audio dei media vietnamitiConcedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minutiMonoApprovvigionamento Web5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFemmine 249, maschi 200, Sconosciuti 45
DiscorsoGallese_GC_8Gallese (accento inglese)Gallese (accento inglese)it_WL8 kHzConversazione generale278Dati di conversazione generale galleseConversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti,DoppioDesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFemmina 270, Maschio 324, Sconosciuto 0
DiscorsoInglese britannico_WW_16Inglese britannicoInglese britannicoit_uk16 kHzWake Word200 AltoparlantiSveglia parola inglese britannicofrasi chiave raccolta di dati
  • altoparlanti 200
  • 4 frasi chiave uniche per altoparlante
  • 25-30 registrazioni di frasi chiave ripetute per frase chiave univoca
  • 25-30 file audio per frase chiave univoca
  • 120 espressioni totali registrate per oratore
canale 1mobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSesso: 50% maschi, 50% femmine, +/- 10%.

Servizi offerti

La raccolta di dati audio da parte di esperti non è pratica per le configurazioni AI complete. Da Shaip, puoi anche considerare i seguenti servizi per rendere i modelli molto più diffusi del solito:

Raccolta dati di testo

Raccolta di dati di testo
Servizi

Il vero valore dei servizi di raccolta di dati cognitivi Shaip è che forniscono alle organizzazioni la chiave per sbloccare le informazioni critiche che si trovano all'interno di dati non strutturati

Raccolta dati immagine

Servizi di raccolta dati di immagini

Assicurati che il tuo modello di visione artificiale identifichi accuratamente ogni immagine, per addestrare senza problemi i modelli di intelligenza artificiale di prossima generazione del futuro

Raccolta dati video

Servizi di raccolta dati video

Ora concentrati sulla visione artificiale insieme alla PNL per addestrare i tuoi modelli a identificare oggetti, individui, deterrenti e altri elementi visivi alla perfezione

Shaip contattaci

Vuoi creare il tuo set di dati audio?

Connettiti con il nostro esperto di raccolta dati vocale interno per configurare un repository audio che si adatta meglio alle tue esigenze

  • Registrandoti, sono d'accordo con Shaip Informativa sulla Privacy ed Termini di Servizio e fornisco il mio consenso a ricevere comunicazioni di marketing B2B da Shaip.

La raccolta dei dati vocali per un modello ML si riferisce al processo di raccolta delle registrazioni audio della lingua parlata. Questa raccolta aiuta nella formazione e nel perfezionamento degli algoritmi di apprendimento automatico, in particolare quelli incentrati sulla comprensione e l'elaborazione delle voci umane.

Quando intendi raccogliere dati audio per il riconoscimento vocale automatico (ASR), dovresti iniziare definendo le esigenze specifiche del tuo progetto, inclusa la lingua, l'accento e il tipo di discorso desiderati. Dopo aver impostato questi parametri assicurati di ottenere tutte le autorizzazioni necessarie per rispettare la privacy dell'utente. Quindi, utilizzare dispositivi di registrazione o software appropriati per acquisire campioni audio chiari. Ogni registrazione dovrebbe essere meticolosamente annotata con la sua trascrizione o altri metadati pertinenti e archiviata sistematicamente per un accesso semplice.

Un set di dati vocali nell'apprendimento automatico è fondamentale per l'addestramento, il test e la convalida di modelli su misura per riconoscere, trascrivere o interpretare il linguaggio parlato. Tali set di dati aprono la strada a una miriade di applicazioni, dagli assistenti vocali e servizi di trascrizione alla biometria vocale.

Per raccogliere dati precisi da diverse lingue e accenti, è vitale la collaborazione con madrelingua del background linguistico desiderato. Puntare a un campione vario e rappresentativo per coprire un ampio spettro di sfumature demografiche. Impiegare apparecchiature di registrazione standardizzate in ambienti uniformi per garantire la coerenza audio. E, cosa più importante, annota ogni dato con trascrizioni e metadati dettagliati, che denotano la lingua e l'accento specifici.