I servizi di raccolta dati vocali più affidabili per la tua intelligenza artificiale

Addestra i tuoi modelli NLP, VA, prototipi TTS e altro ancora con dati conversazionali di qualità, con i nostri servizi di raccolta dati audio e vocali

Scopri pipeline di dati audio senza colli di bottiglia

Contatti

Clienti in primo piano

Qualsiasi argomento. Qualsiasi scenario.

In Shaip, la nostra esperienza risiede nella creazione di set di dati vocali di alta qualità progettati per diversi requisiti AI/ML. Offriamo una vasta gamma di lingue e registriamo in contesti diversi, rendendo i nostri set di dati completi e adattabili. OIl nostro obiettivo è fornire ai modelli il volume più elevato di dati vocali personalizzati, nel minor tempo possibile. Con noi a bordo, puoi aspettarti:

Dati audio/vocali multilingue di alta qualità curati per migliorare la precisione
Livello più alto possibile di specificità del dominio per tuno scenario diversificato flessibile.

Ridimensiona il tuo modello ML per adattarsi a diversi dati demografici e verticali
Ambienti di registrazione: Qualità dello studio, con audio cristallino con rumore di fondo minimo e Ambienti naturali, dove le registrazioni incorporano suoni ambientali per imitare situazioni del mondo reale.

100+

Paesi

55K +

Dati sulle ore di parlato

250+

Progetti

60+

Lingue (oltre 100 dialetti)

8 / 16 / 44 / 48 kHz

Frequenza di campionamento

La nostra competenza

Allinea i dati audio per modelli PNL più intelligenti

Shaip offre servizi di raccolta dati vocali/audio end-to-end in oltre 100 lingue per consentire alle tecnologie abilitate alla voce di soddisfare un pubblico diversificato in tutto il mondo. Possiamo lavorare su progetti di qualsiasi portata e dimensione; dalla licenza di set di dati audio standard esistenti, alla gestione della raccolta di dati audio personalizzati, alla trascrizione e annotazione dell'audio. Indipendentemente dalle dimensioni del tuo progetto di raccolta dei dati vocali, possiamo personalizzare i servizi di raccolta audio in base alle tue esigenze per creare set di dati NLP di alta qualità destinati a dialetti, toni e lingue. Scegli dalla nostra vasta gamma di set di dati vocali e risorse di raccolta dati audio, per configurazioni intelligenti con abilitazione vocale.

Storie di successo

Set di dati AI conversazionali con oltre 3 ore di dati in 8 lingue

Cercando di costruire una piattaforma multilingue per le lingue indiane, il cliente ha collaborato con Shaip per raccogliere, segmentare e trascrivere grandi set di dati in più lingue indiane. Ciò contribuirebbe a sviluppare modelli vocali efficaci che potrebbero alimentare la nuova piattaforma innovativa del cliente.

Problema: Oltre 3,000 ore di dati audio raccolti in 8 lingue indiane, segmentati e trascritti per sviluppare il riconoscimento vocale automatico.

Soluzione: Abbiamo fornito la raccolta, la segmentazione e la trascrizione dei dati e abbiamo fornito file JSON con metadati. Abbiamo raccolto 3000 ore di dati audio in 8 lingue indiane su larga scala per il progetto di tecnologia vocale del cliente.

Motivi per scegliere Shaip come partner affidabile per la raccolta di dati vocali

Persone

Team dedicati e formati:

Oltre 30,000 collaboratori per la creazione di dati, l'etichettatura e il controllo qualità
Team di gestione del progetto con credenziali
Team di sviluppo prodotto esperto
Talent Pool Sourcing & Onboarding Team

Processo

La massima efficienza del processo è assicurata da:

Robusto processo Stage-Gate 6 Sigma
Un team dedicato di cinture nere 6 Sigma: titolari di processi chiave e conformità alla qualità
Miglioramento continuo e ciclo di feedback

Piattaforma

La piattaforma brevettata offre vantaggi:

Piattaforma end-to-end basata sul web
Qualità impeccabile
TAT . più veloce
Consegna senza soluzione di continuità

Persone

Team dedicati e formati:

Oltre 30,000 collaboratori per la creazione di dati, l'etichettatura e il controllo qualità
Team di gestione del progetto con credenziali
Team di sviluppo prodotto esperto
Talent Pool Sourcing & Onboarding Team

Processo

La massima efficienza del processo è assicurata da:

Robusto processo Stage-Gate 6 Sigma
Un team dedicato di cinture nere 6 Sigma: titolari di processi chiave e conformità alla qualità
Miglioramento continuo e ciclo di feedback

Piattaforma

La piattaforma brevettata offre vantaggi:

Piattaforma end-to-end basata sul web
Qualità impeccabile
TAT . più veloce
Consegna senza soluzione di continuità

Set di dati vocali/audio pronti all'uso

ID corpo (unico)	Parola chiave	Set di dati della lingua	Codice lingua	Frequenza di Campionamento	Tipo di set di dati	Ore audio totali	Breve Descrizione	Descrizione del set di dati	Canale audio	Piattaforma di registrazione	ER (%)	Formato Audio	Formato di trascrizione	Usa caso	Numero di altoparlanti	CTA
it_US_CC_8	volgare afroamericano	volgare afroamericano	it_IT	8 kHz	Call center	211	Dati del call center in vernacolo afroamericano	Conversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti,	Doppio	Desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Femmine: 612, maschi: 1242 e sconosciute: 12	Contatti
it_US_MA_16	volgare afroamericano	volgare afroamericano	it_IT	16 kHz	Audio multimediale	154	Dati dei media vernacolari afroamericani	Concedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minuti	Mono	Approvvigionamento Web	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Femmine: 151, maschi: 150 e sconosciute: 10	Contatti
Afrikaans_GC_8	afrikaans	afrikaans	af_ZA	8 kHz	Conversazione generale	368	Dati di conversazione generale in afrikaans	Conversazione telefonica senza script tra due persone. ca. Durata dell'audio (intervallo) - 15-60 minuti, afrikaans parlato in Africa	Doppio	Desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Femmine: 502, maschi: 390 e sconosciute: 2	Contatti
Afrikaans_MA_16	afrikaans	afrikaans	af_ZA	16 kHz	Audio multimediale	658	File multimediali afrikaans	Concedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minuti	Mono	Approvvigionamento Web	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Femmine: 750, maschi: 1278 e sconosciute: 52	Contatti
Arabo_GC_8	Arabo	Arabo	ar_AE	8 kHz	Conversazione generale	292	Dati di conversazioni generali in arabo	Conversazione telefonica senza script tra due persone. ca. Durata dell'audio (intervallo) - 15-60 minuti, arabo dai paesi del Golfo	Doppio	Desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Femmine: 171, maschi: 534 e sconosciute: 1	Contatti
Arabo_SM_48	Arabo	Arabo	ar-SA	48 kHz	Monologo sceneggiato	1,947	Monologo scritto in arabo	Registrazioni a enunciazione singola, che tendono a rientrare nell'intervallo da 5 a 30 secondi	Mono	mobile App	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Femmina 838 Maschio 1209 Sconosciuto 78	Contatti
Assamese_CC_8	Assamese	Assamese (in pipeline)	come in		Call center	60	Dati del Call Center Assamese (In Pipeline).	Conversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti,		Desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling		Contatti
Assamese_GC	Assamese	Assamese (in pipeline)	come in		Conversazione generale	100	Assamese (In Pipeline) Dati di conversazione generale	Conversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti,		Desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling		Contatti
Assamese_MA	Assamese	Assamese (in pipeline)	come in		Audio multimediale	40	Assamese (In Pipeline) Dati audio multimediali	Concedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minuti		Approvvigionamento Web	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling		Contatti
bengalese_CC_8	Bengalese	Bengalese (in cantiere)	bn_IN		Call center	60	Dati del call center bengalese (in pipeline).	Conversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti,		Desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling		Contatti
bengalese_GC	Bengalese	Bengalese (in cantiere)	bn_IN		Conversazione generale	100	Dati di conversazione generale in bengalese (in pipeline).	Conversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti,		Desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling		Contatti
bengalese_MA	Bengalese	Bengalese (in cantiere)	bn_IN		Audio multimediale	40	Bengalese (In Pipeline) Dati audio multimediali	Concedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minuti		Approvvigionamento Web	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling		Contatti
Boston_CC_8	Boston inglese	Boston inglese	it_IT	8 kHz	Call center	177	Dati del call center di Boston	Conversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti,	Doppio	Desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Femmine: 605, maschi: 711 e sconosciute: 0	Contatti
Boston_GC_8	Boston inglese	Boston inglese	it_IT	8 kHz	Conversazione generale	32	Dati di conversazione generale di Boston	Conversazione telefonica senza script tra due persone. ca. Durata dell'audio (intervallo) - 15-60 minuti,	Doppio	Desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Femmine: 53, maschi: 83 e sconosciute: 0	Contatti
Boston_MA_16	Boston inglese	Boston inglese	it_IT	16 kHz	Audio multimediale	93	Dati audio di Boston Media	Concedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minuti	Mono	Approvvigionamento Web	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Femmine: 43, maschi: 181 e sconosciute: 2	Contatti
Canadese_SM_48	Francese canadese	Francese canadese	fr-CA	48 kHz	Monologo sceneggiato	1,222	Francese canadese	Registrazioni a enunciazione singola, che tendono a rientrare nell'intervallo da 5 a 30 secondi	Mono	mobile App	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Femmina 974 Maschio 631 Sconosciuto 1	Contatti
Cinese_CC_8	Inglese cinese	Inglese cinese	it_IT	8 kHz	Call center	169	Dati del call center cinese	Conversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti,	Doppio	Desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Femmina: 1790, Maschio: 523 e Sconosciuto: 13	Contatti
Cinese_MA_16	Inglese cinese	Inglese cinese	it_IT	16 kHz	Audio multimediale	249	Dati audio dei media cinesi	Concedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minuti	Mono	Approvvigionamento Web	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Femmina: 126, Maschio: 346 e Sconosciuto: 6	Contatti
Cinese semplificato_SM_48	Cinese semplificato	Cinese semplificato	ZH-CN	48 kHz	Monologo sceneggiato	2,762	Cinese semplificato	Registrazioni a enunciazione singola, che tendono a rientrare nell'intervallo da 5 a 30 secondi	Mono	mobile App	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Femmina 1920 Maschio 1535 Sconosciuto 270	Contatti
Cinese tradizionale_SM_48	Cinese tradizionale	Cinese tradizionale	zh-TW	48 kHz	Monologo sceneggiato	1,028	Cinese tradizionale	Registrazioni a enunciazione singola, che tendono a rientrare nell'intervallo da 5 a 30 secondi	Mono	mobile App	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Femmina 1069 Maschio 262 Sconosciuto 3	Contatti
Danese_GC_8	Danese	Danese	da_DK	8 kHz	Conversazione generale	372	Dati di conversazioni generali danesi	Conversazione telefonica senza script tra due persone. ca. Durata dell'audio (intervallo) - 15-60 minuti,	Doppio	Desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Donne: 311, Uomini: 417, Sconosciuto: 0	Contatti
Danese_MA_16	Danese	Danese	da_DK	16 kHz	Audio multimediale	664	Dati audio dei media danesi	Concedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minuti	Mono	Approvvigionamento Web	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Donne: 369, Uomini: 864, Sconosciuto: 27	Contatti
Danese_SM_48	Danese	Danese	DA-DK	48 kHz	Monologo sceneggiato	2,579	Monologo con sceneggiatura danese	Registrazioni a enunciato singolo, che tendono a rientrare nell'intervallo da 5 a 30 secondi, danese dalla Danimarca	Mono	mobile App	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Femmina 1551 Maschio 1233 Sconosciuto 42	Contatti
Inglese profondo sud_CC_8	Inglese profondo sud	Inglese profondo sud	it_IT	8 kHz	Call center	151	Dati del call center del profondo sud inglese	Conversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti,	Doppio	Desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Femmina 221 , Maschio 1004 , Sconosciuto 7	Contatti
Inglese profondo sud_GC_8	Inglese profondo sud	Inglese profondo sud	it_IT	8 kHz	Conversazione generale	56	Dati di conversazione generale del profondo sud inglese	Conversazione telefonica senza script tra due persone. ca. Durata dell'audio (intervallo) - 15-60 minuti,	Doppio	Desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Femmina 99, Maschio 31, Sconosciuto 0	Contatti
Inglese profondo sud_MA_16	Inglese profondo sud	Inglese profondo sud	it_IT	16 kHz	Audio multimediale	266	Dati audio di Deep South Media in inglese	Concedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minuti	Mono	Approvvigionamento Web	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Femmina 204, Maschio 356, Sconosciuto 21	Contatti
Tedesco_CC_8	Tedesco	Tedesco	de-De	8 kHz	Call center	64	Dati del call center tedesco	Conversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti,	Mono	Desktop		. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Femmina 478 Maschio 1440 Sconosciuto 0	Contatti
Tedesco_IVR_8	Tedesco	Tedesco	de-De	8 kHz	IVR	200	Dati IVR tedeschi	Da uomo a macchina. Un flusso di tipo IVR in cui è presente un prompt TTS (ad es. "Come posso aiutarti") seguito da una risposta umana spontanea	Mono	Desktop		. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Femmina 10115 Maschio 8750 Sconosciuto 0	Contatti
Gujarati_CC_8	Gujarati	Gujarati (in cantiere)	gu_IN		Call center	60	Gujarati (In Pipeline) Dati del call center	Conversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti,		Desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling		Contatti
Gujarati_GC	Gujarati	Gujarati (in cantiere)	gu_IN		Conversazione generale	100	Dati di conversazione generale gujarati (in pipeline).	Conversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti,		Desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling		Contatti
Gujarati_MA	Gujarati	Gujarati (in cantiere)	gu_IN		Audio multimediale	40	Gujarati (In Pipeline) Dati audio multimediali	Concedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minuti		Approvvigionamento Web	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling		Contatti
Ebraico_Conversazione Generale_8	ebraico	ebraico	lui_IL	8 kHz	Conversazione generale	399	Dati di conversazione generale in ebraico	Conversazione telefonica senza script tra due persone. ca. Durata dell'audio (intervallo) - 15-60 minuti, ebraico in Israele	Doppio	Desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Femmina 414 , Maschio 399 , Sconosciuto 1	Contatti
Ebraico_MA_16	ebraico	ebraico	lui_IL	16 kHz	Audio multimediale	427	Dati audio dei media ebraici	Concedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minuti	Mono	Approvvigionamento Web	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Femmina 361, Maschio 513, Sconosciuto 13	Contatti
Hindi_MA_16	Hindi	Hindi	ciao_IN	16 kHz	Audio multimediale	219	Hindi Media dati audio	Concedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minuti	Mono	Approvvigionamento Web	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Femmina 83, Maschio 309, Sconosciuto 0	Contatti
hindi_SM_48	Hindi	Hindi	ciao-IN	48 kHz	Monologo sceneggiato	2,867	Monologo scritto in hindi	Registrazioni a enunciazione singola, che tendono a rientrare nell'intervallo da 5 a 30 secondi	Mono	mobile App	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Femmina 1977 Maschio 1864 Sconosciuto 147	Contatti
INGLESE_CC_8	Hinglish	Hinglish	hg_IN	8 kHz	Call center	208	HINGLISH Dati del call center	Conversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti,	Doppio	Desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Femmina 822, Maschio 1262 , Sconosciuto 0	Contatti
HINGLISH_MA_16	Hinglish	Hinglish	hg_IN	16 kHz	Audio multimediale	216	HINGLISH Dati audio multimediali	Concedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minuti	Mono	Approvvigionamento Web	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Femmina 75, Maschio 380, Sconosciuto 0	Contatti
Ispanico_CC_8	inglese ispanico	inglese ispanico	it_IT	8 kHz	Call center	212	Dati del call center ispanico	Conversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti,	Doppio	Desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Femmina 822, Maschio 1262, Sconosciuto 0	Contatti
Ispanico_MA_16	inglese ispanico	inglese ispanico	it_IT	16 kHz	Audio multimediale	155	Audio multimediale per chiamate ispaniche	Concedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minuti	Mono	Approvvigionamento Web	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Femmina 140, Maschio 219, Sconosciuto 5	Contatti
Indonesiano_GC_8	Indonesiano	Indonesiano	L'ho fatto	8 kHz	Conversazione generale	496	Dati di conversazione generale indonesiana	Conversazione telefonica senza script tra due persone. ca. Durata dell'audio (intervallo) - 15-60 minuti, indonesiano bahasa	Doppio	Desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Femmina 524, Maschio 454, Sconosciuto 2	Contatti
Indonesiano_MA_16	Indonesiano	Indonesiano	L'ho fatto	16 kHz	Audio multimediale	643	Dati audio multimediali indonesiani	Concedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minuti	Mono	Approvvigionamento Web	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Femmina 746, Maschio 1507, Sconosciuto 129	Contatti
irlandese_GC_8	irlandese	irlandese	it_IT	8 kHz	Conversazione generale	192	Dati sulla conversazione generale irlandese	Conversazione telefonica senza script tra due persone. ca. Durata dell'audio (intervallo) - 15-60 minuti,	Doppio	Desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Femmina 213 , Maschio 153 , Sconosciuto 0	Contatti
Giapponese_SM_48	Giapponese	Giapponese	ja-JP	48 kHz	Monologo sceneggiato	2,335	Monologo scritto in giapponese	Registrazioni a enunciazione singola, che tendono a rientrare nell'intervallo da 5 a 30 secondi	Mono	mobile App	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Femmina 1460 Maschio 1221 Sconosciuto 194	Contatti
Kannada_CC_8	kannada	Kannada (in cantiere)	kn_IN		Call center	60	Kannada (In Pipeline) Dati del call center	Conversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti,		Desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling		Contatti
Kannada_GC	kannada	Kannada (in cantiere)	kn_IN		Conversazione generale	100	Kannada (In Pipeline) Dati di conversazione generale	Conversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti,		Desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling		Contatti
Kannada_MA	kannada	Kannada (in cantiere)	kn_IN		Audio multimediale	40	Kannada (In Pipeline) Dati audio multimediali	Concedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minuti		Approvvigionamento Web	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling		Contatti
Coreano_CC_8	Coreano	Coreano	ko_KR	8 kHz	Call center	107	Dati del call center coreano	Conversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti,	Doppio	Desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Femmina 1086, Maschio 210, Sconosciuto 4	Contatti
Coreano_MA_16	Coreano	Coreano	ko_KR	16 kHz	Audio multimediale	204	Dati audio multimediali coreani	Concedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minuti	Mono	Approvvigionamento Web	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Femmina 70 Maschio 303, Sconosciuto 25	Contatti
Coreano_SM_48	Coreano	Coreano	ko-KR	48 kHz	Monologo sceneggiato	1,955	Monologo scritto in coreano	Registrazioni a enunciazione singola, che tendono a rientrare nell'intervallo da 5 a 30 secondi	Mono	mobile App	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Femmina 1195 Maschio 1134 Sconosciuto 122	Contatti
malese_GC_8	Malay	Malay	ms_MIO	8 kHz	Conversazione generale	266	Dati di conversazione generale malese	Conversazione telefonica senza script tra due persone. ca. Durata dell'audio (intervallo) - 15-60 minuti, malese in Malesia	Doppio	Desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Femmina 316, Maschio 176 , Sconosciuto 0	Contatti
Malese_MA_16	Malay	Malay	ms_MIO	16 kHz	Audio multimediale	344	Dati audio multimediali malesi	Concedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minuti	Mono	Approvvigionamento Web	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Femmina 236, Maschio 626, Sconosciuto 47	Contatti
Malayalam_CC_8	Malayalam	Malayalam (in cantiere)	ml_IN		Call center	60	Dati del call center Malayalam (In Pipeline).	Conversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti,		Desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling		Contatti
Malayalam_GC	Malayalam	Malayalam (in cantiere)	ml_IN		Conversazione generale	100	Malayalam (In Pipeline) Dati di conversazione generale	Conversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti,		Desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling		Contatti
Malayalam_MA	Malayalam	Malayalam (in cantiere)	ml_IN		Audio multimediale	40	Malayalam (In Pipeline) Dati audio multimediali	Concedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minuti		Approvvigionamento Web	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling		Contatti
Marathi_CC_8	marathi	Marathi (in cantiere)	signor_IN		Call center	60	Dati del call center Marathi (in pipeline).	Conversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti,		Desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling		Contatti
Marathi_GC	marathi	Marathi (in cantiere)	signor_IN		Conversazione generale	100	Dati di conversazione generale Marathi (In Pipeline).	Conversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti,		Desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling		Contatti
Marathi_MA	marathi	Marathi (in cantiere)	signor_IN		Audio multimediale	40	Marathi (In Pipeline) Dati audio multimediali	Concedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minuti		Approvvigionamento Web	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling		Contatti
Messicano_SM_48	Spagnolo (Messico)	Spagnolo (Messico)	it-MX	48 kHz	Monologo sceneggiato	1,492	Monologo scritto in spagnolo messicano	Registrazioni a enunciazione singola, che tendono a rientrare nell'intervallo da 5 a 30 secondi	Mono	mobile App	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Femmina 1016 Maschio 1069 Sconosciuto 95	Contatti
Paesi Bassi_SM_48	Olandese	Olandese	nl-NL	48 kHz	Monologo sceneggiato	1,205	Monologo scritto in olandese	Registrazioni a enunciazione singola, che tendono a rientrare nell'intervallo da 5 a 30 secondi	Mono	mobile App	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Femmina 1285 Maschio 531 Sconosciuto 3	Contatti
New York inglese_CC_8	Inglese di New York	Inglese di New York	it_IT	8 kHz	Call center	103	Dati del call center inglese di New York	Conversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti,	Doppio	Desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Femmina 610, Maschio 532, Sconosciuto 0	Contatti
Inglese di New York_GC_8	Inglese di New York	Inglese di New York	it_IT	8 kHz	Conversazione generale	107	Dati di New York English General Conversation	Conversazione telefonica senza script tra due persone. ca. Durata dell'audio (intervallo) - 15-60 minuti,	Doppio	Desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Femmina 118, Maschio 114, Sconosciuto 0	Contatti
Inglese di New York_MA_16	Inglese di New York	Inglese di New York	it_IT	16 kHz	Audio multimediale	140	Dati audio di New York English Media	Concedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minuti	Mono	Approvvigionamento Web	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Femmina 66, Maschio 230, Sconosciuto 11	Contatti
Nuova Zelanda_GC_8	Nuova Zelanda inglese	Nuova Zelanda inglese	it_NZ	8 kHz	Conversazione generale	148	Dati di conversazione generale in inglese neozelandese	Conversazione telefonica senza script tra due persone. ca. Durata dell'audio (intervallo) - 15-60 minuti,	Doppio	Desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Femmina 167, maschio 121, sconosciuto 4	Contatti
Nuova Zelanda_MA_16	Nuova Zelanda inglese	Nuova Zelanda inglese	it_NZ	16 kHz	Audio multimediale	400	Audio multimediale inglese neozelandese	Concedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minuti	Mono	Approvvigionamento Web	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Femmina 367, maschio 678, sconosciuto 26	Contatti
Oriya_CC_8	Oriya	Oriya (in cantiere)	o_IN		Call center	60	Oriya (In Pipeline) Dati del call center	Conversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti,		Desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling		Contatti
Oriya_GC	Oriya	Oriya (in cantiere)	o_IN		Conversazione generale	100	Dati di conversazione generale Oriya (In Pipeline).	Conversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti,		Desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling		Contatti
Oriya_MA	Oriya	Oriya (in cantiere)	o_IN		Audio multimediale	40	Oriya (In Pipeline) Dati audio multimediali	Concedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minuti		Approvvigionamento Web	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling		Contatti
Polacco_MA_16	Polacco	Polacco	pl_PL	16 kHz	Audio multimediale	269	Audio multimediale polacco	Concedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minuti	Mono	Approvvigionamento Web	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Femmina 173 Maschio 354 Sconosciuto 6	Contatti
Polacco Polonia_SM_48	Polacco (Polonia)	Polacco (Polonia)	pl-PL	48 kHz	Monologo sceneggiato	1,482	Polonia polacca - Monologo sceneggiato	Registrazioni a enunciazione singola, che tendono a rientrare nell'intervallo da 5 a 30 secondi	Mono	mobile App	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Femmina 1324 Maschio 701 Sconosciuto 24	Contatti
Punjabi_CC_8	punjabi	Punjabi (in cantiere)	punjabi		Call center	60	Punjabi (In Pipeline) Dati del call center	Conversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti,		Desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling		Contatti
Punjabi_GC	punjabi	Punjabi (in cantiere)	punjabi		Conversazione generale	100	Punjabi (In Pipeline) Dati di conversazione generale	Conversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti,		Desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling		Contatti
Punjabi_MA	punjabi	Punjabi (in cantiere)	punjabi		Audio multimediale	40	Punjabi (In Pipeline) Dati audio multimediali	Concedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minuti		Approvvigionamento Web	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling		Contatti
Russo_SM_48	Russo	Russo	RU-RU	48 kHz	Monologo sceneggiato	2,398	Monologo scritto in russo	Registrazioni a enunciazione singola, che tendono a rientrare nell'intervallo da 5 a 30 secondi	Mono	mobile App	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Femmina 1689 Maschio 1937 Sconosciuto 214	Contatti
Scozzese_GC_8	scozzese (accento inglese)	scozzese (accento inglese)	it_AB	8 kHz	Conversazione generale	292	Dati di conversazione generale scozzese	Conversazione telefonica senza script tra due persone. ca. Durata dell'audio (intervallo) - 15-60 minuti,	Doppio	Desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Femmina 285, Maschio 260, Sconosciuto 3	Contatti
Singapore_CC_8	Inglese di Singapore	Inglese di Singapore	it_SG	8 kHz	Call center	218	Dati del Call Center di Singapore	Conversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti,	Doppio	Desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Femmina 2139, Maschio 884, Sconosciuto 21	Contatti
Singapore_MA_16	Inglese di Singapore	Inglese di Singapore	it_SG	16 kHz	Audio multimediale	247	Dati audio di Singapore Media	Concedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minuti	Mono	Approvvigionamento Web	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Femmina 160, Maschio 455, Sconosciuto 37	Contatti
Inglese sudafricano_CC_8	inglese sudafricano	inglese sudafricano	it_ZA	8 kHz	Call center	261	Dati del Call Center inglese sudafricano	Conversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti,	Doppio	Desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Femmina 1274 , Maschio 935 , Sconosciuto 1	Contatti
Inglese sudafricano_MA_16	inglese sudafricano	inglese sudafricano	it_ZA	16 kHz	Audio multimediale	251	Dati audio multimediali in inglese sudafricano	Concedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minuti	Mono	Approvvigionamento Web	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Femmina 235, Maschio 432, Sconosciuto 36	Contatti
Swahili_CC_8	swahili	swahili	sw_KE	8 kHz	Call center	230	Dati del call center swahili	Conversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti,	Doppio	Desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Femmina 611, Maschio 833, Sconosciuto 0	Contatti
Swahili_MA_16	swahili	swahili	sw_KE	16 kHz	Audio multimediale	265	Dati audio Swahili Media	Concedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minuti	Mono	Approvvigionamento Web	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Femmina 118, Maschio 493, Sconosciuto 25	Contatti
Svedese_CC_8	svedese	svedese	sv_SE	8 kHz	Call center	250	Dati del call center svedese	Conversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti,	Doppio	Desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Femmina 1581, maschio 727, Sconosciuto 2	Contatti
Svedese_MA_16	svedese	svedese	sv_SE	16 kHz	Audio multimediale	278	Dati audio dei media svedesi	Concedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minuti	Mono	Approvvigionamento Web	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Femmina 195, maschio 500, Sconosciuto 21	Contatti
Tamil_CC_8	tamil	Tamil (in cantiere)	ta_IN		Call center	60	Dati del call center tamil (in pipeline).	Conversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti,		Desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling		Contatti
Tamil_GC	tamil	Tamil (in cantiere)	ta_IN		Conversazione generale	100	Tamil (In Pipeline) Dati di conversazione generale	Conversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti,		Desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling		Contatti
Tamil_MA	tamil	Tamil (in cantiere)	ta_IN		Audio multimediale	40	Tamil (In Pipeline) Dati audio multimediali	Concedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minuti		Approvvigionamento Web	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling		Contatti
Telugu_GC_8	telugu	telugu	te_IN	8 kHz	Conversazione generale	553	Dati di conversazione generale telugu	Conversazione telefonica senza script tra due persone. ca. Durata dell'audio (intervallo) - 15-60 minuti,	Doppio	Desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Femmina 574, Maschio 564, Sconosciuto 0	Contatti
Telugu_MA_16	telugu	telugu	te_IN	16 kHz	Audio multimediale	648	Telugu Media dati audio	Concedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minuti	Mono	Approvvigionamento Web	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Femmina 207, Maschio 963, Sconosciuto 2	Contatti
Telugu_CC_8	telugu	Telugu (in cantiere)	te_IN		Call center	30	Telugu (In Pipeline) Dati del call center	Conversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti,		Desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling		Contatti
Telugu_GC	telugu	Telugu (in cantiere)	te_IN		Conversazione generale	50	Telugu (In Pipeline) Dati di conversazione generale	Conversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti,		Desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling		Contatti
Telugu_MA	telugu	Telugu (in cantiere)	te_IN		Audio multimediale	20	Telugu (In Pipeline) Dati audio multimediali	Concedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minuti		Approvvigionamento Web	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling		Contatti
Tailandese_GC_8	tailandese	tailandese	th_TH	8 kHz	Conversazione generale	183	Conversazione generale tailandese	Conversazione telefonica senza script tra due persone. ca. Durata dell'audio (intervallo) - 15-60 minuti, un registro informale utilizzato tra amici	Doppio	Desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Femmina 338, Maschio 96, Sconosciuto 8	Contatti
Tailandese_MA_8	tailandese	tailandese	th_TH	16 kHz	Audio multimediale	173	Audio multimediale tailandese	Concedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minuti	Mono	Approvvigionamento Web	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Femmina 143, Maschio 502, Sconosciuto 26	Contatti
Turchia turca_SM_48	Turchia turca	Turchia turca	tr-TR	48 kHz	Monologo sceneggiato	2,027	Turchia turca	Registrazioni a enunciazione singola, che tendono a rientrare nell'intervallo da 5 a 30 secondi	Mono	mobile App	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Femmina 1561 Maschio 1241 Sconosciuto 31	Contatti
Vietnamita_GC_8	vietnamita	vietnamita	vi_VN	8 kHz	Conversazione generale	295	Dati di conversazione generale vietnamita	Conversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti, settentrionale (ad es. Hanoi), centrale e meridionale (ad es. Ho Chi Minh City).	Doppio	Desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Femmine 400, maschi 380, Sconosciuti 2	Contatti
Vietnamita_MA_16	vietnamita	vietnamita	vi_VN	16 kHz	Audio multimediale	257	Dati audio dei media vietnamiti	Concedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minuti	Mono	Approvvigionamento Web	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Femmine 249, maschi 200, Sconosciuti 45	Contatti
Gallese_GC_8	Gallese (accento inglese)	Gallese (accento inglese)	it_WL	8 kHz	Conversazione generale	278	Dati di conversazione generale gallese	Conversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti,	Doppio	Desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Femmina 270, Maschio 324, Sconosciuto 0	Contatti
Inglese britannico_WW_16	Inglese britannico	Inglese britannico	it_uk	16 kHz	Wake Word	200 Altoparlanti	Sveglia parola inglese britannico	frasi chiave raccolta di dati altoparlanti 200 4 frasi chiave uniche per altoparlante 25-30 registrazioni di frasi chiave ripetute per frase chiave univoca 25-30 file audio per frase chiave univoca 120 espressioni totali registrate per oratore	canale 1	mobile App	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Sesso: 50% maschi, 50% femmine, +/- 10%.	Contatti

Servizi offerti

La raccolta di dati audio da parte di esperti non è pratica per le configurazioni AI complete. Da Shaip, puoi anche considerare i seguenti servizi per rendere i modelli molto più diffusi del solito:

Risorse consigliate

Offerta

Annotazione audio per IA intelligenti

I servizi di annotazione audio sono stati un punto di forza di Shaip sin dall'inizio. Sviluppa, addestra e migliora l'IA conversazionale, i chatbot e i motori di riconoscimento vocale con i nostri servizi di annotazione audio all'avanguardia.

Guida all'acquirente

Guida all'acquisto: Guida completa all'IA conversazionale

Il chatbot con cui hai conversato funziona su un avanzato sistema di intelligenza artificiale conversazionale che viene addestrato, testato e costruito utilizzando tonnellate di set di dati di riconoscimento vocale.

Catalogo dati

Catalogo e licenze di dati vocali pronti all'uso

Esiste un'ampia varietà di applicazioni comuni per i dati vocali nei progetti di intelligenza artificiale. Ti offriamo grandi quantità di dati di alta qualità pronti per il tuo riconoscimento vocale.

Vuoi creare il tuo set di dati audio?

Connettiti con il nostro esperto di raccolta dati vocale interno per configurare un repository audio che si adatta meglio alle tue esigenze

Nome *
Cognome*
E-mail*
Telefono *
Società*
Paese *
Paese
Commenti*
Registrandoti, sono d'accordo con Shaip Informativa sulla Privacy ed Termini di Servizio e fornisco il mio consenso a ricevere comunicazioni di marketing B2B da Shaip.
CAPTCHA

Domande frequenti (FAQ)

1. Cos'è la raccolta dei dati vocali?

La raccolta dei dati vocali per un modello ML si riferisce al processo di raccolta delle registrazioni audio della lingua parlata. Questa raccolta aiuta nella formazione e nel perfezionamento degli algoritmi di apprendimento automatico, in particolare quelli incentrati sulla comprensione e l'elaborazione delle voci umane.

2. Come raccogliere dati audio per ASR (riconoscimento vocale automatico)?

Quando intendi raccogliere dati audio per il riconoscimento vocale automatico (ASR), dovresti iniziare definendo le esigenze specifiche del tuo progetto, inclusa la lingua, l'accento e il tipo di discorso desiderati. Dopo aver impostato questi parametri assicurati di ottenere tutte le autorizzazioni necessarie per rispettare la privacy dell'utente. Quindi, utilizzare dispositivi di registrazione o software appropriati per acquisire campioni audio chiari. Ogni registrazione dovrebbe essere meticolosamente annotata con la sua trascrizione o altri metadati pertinenti e archiviata sistematicamente per un accesso semplice.

3. Utilizzo del set di dati vocali per l'apprendimento automatico

Un set di dati vocali nell'apprendimento automatico è fondamentale per l'addestramento, il test e la convalida di modelli su misura per riconoscere, trascrivere o interpretare il linguaggio parlato. Tali set di dati aprono la strada a una miriade di applicazioni, dagli assistenti vocali e servizi di trascrizione alla biometria vocale.

4. Come raccogliere dati accurati da più lingue e accenti

Per raccogliere dati precisi da diverse lingue e accenti, è vitale la collaborazione con madrelingua del background linguistico desiderato. Puntare a un campione vario e rappresentativo per coprire un ampio spettro di sfumature demografiche. Impiegare apparecchiature di registrazione standardizzate in ambienti uniformi per garantire la coerenza audio. E, cosa più importante, annota ogni dato con trascrizioni e metadati dettagliati, che denotano la lingua e l'accento specifici.

I servizi di raccolta dati vocali più affidabili per la tua intelligenza artificiale

Scopri pipeline di dati audio senza colli di bottiglia

Clienti in primo piano

Servizi professionali di raccolta dati audio/vocali

Qualsiasi argomento. Qualsiasi scenario.

100+

55K +

250+

60+

8 / 16 / 44 / 48 kHz

La nostra competenza

Allinea i dati audio per modelli PNL più intelligenti

Collezione di discorsi di monologo

Discorso di dialogo Collezione

Gruppo/Muti-party conversazioni

Raccolta di enunciati in linguaggio naturale

Dati acustici Collezione

Riconoscimento vocale automatico (ASR)

Dati di formazione vocale/audio multilingue

Text-to-Speech (STT)

Call Center Registrazioni

Storie di successo

Motivi per scegliere Shaip come partner affidabile per la raccolta di dati vocali

Persone

Processo

Piattaforma

Persone

Processo

Piattaforma

Set di dati vocali/audio pronti all'uso

Servizi offerti

Raccolta di dati di testo Servizi

Servizi di raccolta dati di immagini

Servizi di raccolta dati video

Risorse consigliate

Offerta

Annotazione audio per IA intelligenti

Guida all'acquirente

Guida all'acquisto: Guida completa all'IA conversazionale

Catalogo dati

Catalogo e licenze di dati vocali pronti all'uso

Vuoi creare il tuo set di dati audio?

Domande frequenti (FAQ)

Servizi dati AI AI

Specialità

Industria

Prodotti

Società

Risorse

Contatti

Discorso di dialogo
Collezione

Gruppo/Muti-party
conversazioni

Dati acustici
Collezione

Text-to-Speech
(STT)

Call Center
Registrazioni

Raccolta di dati di testo
Servizi